Los equipos de Nvidia acaban de anunciar una tecnología capaz de cambiar el entorno de audio. Llamada Fugatto, esta herramienta puede crear voz, música o efectos de sonido basándose en una solicitud por escrito.
Después de las imágenes y el vídeo, llega el momento del sonido para la inteligencia artificial. Los investigadores de inteligencia artificial de Nvidia acaban de crear una “navaja suiza para el sonido” que permite a sus usuarios crear literalmente todo lo que existe y ha existido alguna vez.
La imaginación como único límite
Nvidia pega fuerte con su nueva herramienta. En las primeras imágenes proporcionadas por la empresa podemos observar una interfaz sencilla donde el usuario ingresa un comando de texto y obtiene como respuesta un sonido, música o efecto de sonido.
Si la herramienta puede parecer clásica y recuerda a otras como Sono, Fugatto encuentra su originalidad en la posibilidad de crear lo que no existe. Por ejemplo, es posible pedirle que cree un sonido de “gritos de saxofón y luego ladridos sobre música electrónica con perros ladrando”. Si el resultado de la solicitud no le agrada, tiene el mérito de abrirle un campo de posibilidades.
Además de esto, Fugatto presenta herramientas más clásicas, pero igual de efectivas. Es capaz de crear un extracto musical a partir de un comando de texto, agregar o quitar instrumentos en una pista de audio o modificar el acento o emoción de una voz.
Con tal precisión en la respuesta, es seguro que sin control, esta nueva tecnología corre el riesgo de causar nuevos disturbios entre los profesionales del sonido y la voz.
Para diseñar esta herramienta, Nvidia indica que se basó en trabajos previos de sus equipos en áreas que van desde el modelado de voz hasta la vocodificación de audio.
Ars Técnica especifica que Nvidia ha trabajado en una serie de colecciones de audio de código abierto que representan al menos 50.000 horas de audio. Acto seguido, Nvidia pudo construir un modelo con 2.500 millones de parámetros que permitieron a Fugatto elegir la mejor opción posible. Para perfeccionar aún más su modelo, Nvidia indica que se ha rodeado de un grupo de investigadores de India, Brasil, China, Jordania y Corea del Sur.
Por el momento, Nvidia no ha comunicado una fecha de lanzamiento para esta herramienta, pero es posible que los entusiastas del audio profundicen en la documentación de Fugatto disponible en su Github.
¿Quieres encontrar los mejores artículos de Frandroid en Google News? puedes seguir Frandroid en Google News en un clic.