una herramienta de Nvidia capaz de crear sonidos nunca antes escuchados

Tuesday 26th November 2024 11:58 AM

Los equipos de Nvidia acaban de anunciar una tecnología capaz de cambiar el entorno de audio. Llamada Fugatto, esta herramienta puede crear voz, música o efectos de sonido basándose en una solicitud por escrito.

Después de las imágenes y el vídeo, llega el momento del sonido para la inteligencia artificial. Los investigadores de inteligencia artificial de Nvidia acaban de crear una “navaja suiza para el sonido” que permite a sus usuarios crear literalmente todo lo que existe y ha existido alguna vez.

La imaginación como único límite

Nvidia pega fuerte con su nueva herramienta. En las primeras imágenes proporcionadas por la empresa podemos observar una interfaz sencilla donde el usuario ingresa un comando de texto y obtiene como respuesta un sonido, música o efecto de sonido.

Ejemplo de uso: Fugatto “crea un sonido en el que pasa un tren y se convierte en una exuberante orquesta de cuerdas” // Fuente: Nvidia

Si la herramienta puede parecer clásica y recuerda a otras como Sono, Fugatto encuentra su originalidad en la posibilidad de crear lo que no existe. Por ejemplo, es posible pedirle que cree un sonido de “gritos de saxofón y luego ladridos sobre música electrónica con perros ladrando”. Si el resultado de la solicitud no le agrada, tiene el mérito de abrirle un campo de posibilidades.

Además de esto, Fugatto presenta herramientas más clásicas, pero igual de efectivas. Es capaz de crear un extracto musical a partir de un comando de texto, agregar o quitar instrumentos en una pista de audio o modificar el acento o emoción de una voz.

Con tal precisión en la respuesta, es seguro que sin control, esta nueva tecnología corre el riesgo de causar nuevos disturbios entre los profesionales del sonido y la voz.

Enlace de YouTube Suscríbete a Frandroid

Este contenido está bloqueado porque no ha aceptado cookies ni otros rastreadores. Este contenido es proporcionado por YouTube.
Para poder visualizarlo deberás aceptar el uso que hace YouTube de tus datos los cuales podrán ser utilizados con las siguientes finalidades: permitirte visualizar y compartir contenidos con redes sociales, promover el desarrollo y mejora de los productos de Humanoid y sus socios, mostrarle anuncios personalizados en relación con su perfil y actividad, definir un perfil publicitario personalizado, medir el rendimiento de los anuncios y el contenido de este sitio y medir la audiencia de este sitio (obtenga más información)

Al hacer clic en “Acepto todo”, usted acepta los fines antes mencionados para todas las cookies y otros rastreadores colocados por Humanoid y sus socios.

Puede retirar su consentimiento en cualquier momento. Para más información le invitamos a leer nuestra Política de Cookies.

acepto todo

Gestionar mis elecciones

Para diseñar esta herramienta, Nvidia indica que se basó en trabajos previos de sus equipos en áreas que van desde el modelado de voz hasta la vocodificación de audio.

Ars Técnica especifica que Nvidia ha trabajado en una serie de colecciones de audio de código abierto que representan al menos 50.000 horas de audio. Acto seguido, Nvidia pudo construir un modelo con 2.500 millones de parámetros que permitieron a Fugatto elegir la mejor opción posible. Para perfeccionar aún más su modelo, Nvidia indica que se ha rodeado de un grupo de investigadores de India, Brasil, China, Jordania y Corea del Sur.

Por el momento, Nvidia no ha comunicado una fecha de lanzamiento para esta herramienta, pero es posible que los entusiastas del audio profundicen en la documentación de Fugatto disponible en su Github.

¿Quieres encontrar los mejores artículos de Frandroid en Google News? puedes seguir Frandroid en Google News en un clic.