El “La navaja suiza del sonido”. Así presenta Nvidia su última innovación en inteligencia artificial. fugatoabreviatura de Foundational Generative Audio Transformer Opus 1, no solo genera música o modifica voces como sus competidores. Esta versátil IA puede crear prácticamente cualquier sonido imaginable, desde el más simple hasta el más complejo, con un simple comando de texto..
Un estudio de producción en tu bolsillo
“Esto es una locura”se entusiasma Ido Zmishlany, productor multiplatino y cofundador de One Take Audio. Para este profesional experimentado, la capacidad de crear instantáneamente nuevos sonidos en el estudio abre nuevas perspectivas creativas. Fugatto le permite crear rápidamente prototipos de ideas musicales, agregar o eliminar instrumentos de una pieza existente o incluso modificar el acento y la emoción de una voz.
Suscríbete a Exprimidor de Limón
La historia de la música está muy ligada a los avances tecnológicos. “La guitarra eléctrica dio origen al rock and roll. Cuando apareció el sampler nació el hip-hop”recuerda Zmishlany. “Con la IA, estamos escribiendo el próximo capítulo de la música. Tenemos un nuevo instrumento, una nueva herramienta para hacer música. »
Una IA que entiende el sonido como un humano
Rafael Valle, jefe de investigación de audio aplicado de Nvidia y uno de los arquitectos del proyecto, explica: “Queríamos crear un modelo que entienda y genere sonido como los humanos”. Este enfoque hizo posible desarrollar capacidades únicas. Por ejemplo, Fugatto puede hacer ladrar una trompeta o maullar un saxofón.
Aún más impresionante es que el modelo puede generar paisajes sonoros que evolucionan con el tiempo. Puede reproducir el sonido de una tormenta que pasa por un área, con truenos que se intensifican y luego se desvanecen gradualmente en la distancia. El sistema incluso te permite crear nuevas transiciones, como una tormenta que se calma para dar paso al canto de los pájaros al amanecer.
Tecnología accesible y versátil
Entrenado en millones de muestras de audio, Fugatto utiliza 2.500 millones de parámetros y requirió el uso de 32 GPU NVIDIA H100. Su desarrollo movilizó a un equipo internacional de investigadores durante más de un año, fortaleciendo sus capacidades multilingües.
Las posibles aplicaciones van mucho más allá del ámbito musical. Las herramientas de aprendizaje de idiomas podrán personalizar su contenido con cualquier voz elegida por el usuario. Los desarrolladores de videojuegos podrán generar sonidos dinámicos que se adapten a las acciones del jugador. Las aplicaciones obviamente serán infinitas.
- Nvidia lanza Fugatto, una IA capaz de crear o modificar cualquier sonido a partir de texto
- El modelo puede combinar instrucciones complejas para generar sonidos nuevos y en evolución.
- Las aplicaciones de Fugatto llevarán la música al futuro
???? Para no perderte ninguna novedad de Presse-citron, síguenos en Google News y WhatsApp.