Consejos y comentarios de expertos en el descubrimiento de audio mediante IA.
Voz sintética, chatbot conversacional…, todos ya hemos sido usuarios de soluciones tecnológicas que utilizan audio y reconocimiento de voz. Pero con el audio IA se está acelerando una nueva dimensión que afecta tanto a las grandes empresas en el modo de comunicación con sus empleados como a los medios tradicionales en la experiencia que ofrecen a sus lectores.
Con motivo de la última Winter Edition organizada por BigBoss conocimos a la empresa ETX Majelan, una empresa especializada en audio AI que combina contenidos y tecnología para apoyar a las empresas en su transformación del audio (podcasts/voces sintéticas), a través de la creación, orquestación y distribución de Contenido de audio inteligente.
Comentarios sobre lo que descubrimos en la revolución de estos usos…
Las empresas tienen un volumen muy grande de documentos escritos.
La observación es que es relativamente difícil involucrar a todos sus empleados en la consulta de una oferta de contenidos a veces abundante, especialmente cuando se trata de grandes organizaciones con empleados dispersos por todo el país o incluso internacionalmente. De hecho, el desafío es poder optimizar el compromiso de las personas ofreciéndoles contenido personalizado para consumir en movimiento según sus necesidades, su perfil y brindándoles una propuesta de valor híbrida que permita el desarrollo tanto personal como profesional.
En un período de desconexión, el audio con IA permite trabajar mejor y ganar eficiencia, al consumir contenido hablado transcrito mediante voz sintética y clonación de voz. Con un flujo interactivo, cada usuario se beneficia del uso de la navegación conversacional, lo que le permite estar informado mientras continúa haciendo otra cosa y sobre todo sin que esto se traduzca en la noción de “jefe de radio”, sino a través de opciones ultrapersonalizadas, asociadas con contenido propietario producido por ETX Majelan.
Si la experiencia tuviera que resumirse en una frase, Cécilia Gabizon, VP content and AI de ETX Majelan, no dudaría en decir: “¡Es el contenido adecuado en el momento adecuado!”.
Prueba del ejemplo con 17 minutos de contenidos de audio consultados de media por día y por persona, lo que lo sitúa como el canal de consulta líder entre todos los activados por las empresas.
El 40% de la prensa la pone audio ETX Majelan
Lo mismo ocurre con los editores de prensa y contenidos escritos que deben innovar y transformarse gracias a las tecnologías y la IA en la experiencia de consumo de sus contenidos para los lectores. Ya sea con la aplicación Majelan Pro de ETX Majelan o mediante la integración de un widget dentro del sitio de la editorial, todos los usuarios pueden consultar artículos escritos transcritos en audio con texto a voz a través de un reproductor que lee el artículo a través de una voz sintetizada.
Por lo tanto, el audio con IA es una verdadera revolución para la comunicación y el consumo de contenidos.
Clonación de voz para una experiencia aún más incorporada y personalizada
La cuestión es sobre todo ética en la construcción del modelo jurídico de la clonación de voces con un objetivo importante mencionado por Cécilia Gabizon: “¿Cómo remunerar las voces clonadas?” ya que existen derechos identitarios vinculados a la voz que deben ser valorados.
La tecnología de clonación de voz permite un resultado de alta calidad, permitiendo juegos de boca y diversidad de tonos desde un mismo hablante.
Se puede reproducir la voz del gerente de la empresa, por ejemplo, para fortalecer el vínculo y la personificación con los usuarios. Dos métodos: clonación instantánea que permite obtener extractos cortos, mientras que un campo más amplio con granularidad real requiere un viaje al estudio con un conjunto de datos de frases para recrear la identidad completa de la huella de voz.
Un clon de voz con audio AI también puede hablar en todos los idiomas, lo que fortalece la proximidad y los vínculos con individuos para organizaciones a escala internacional.
En cuanto a los medios de comunicación, existe un deseo real de clonar las voces de sus periodistas para hablar directamente a los lectores en la transcripción de audio de sus artículos de prensa.
¡Escuchar más que leer es, por tanto, el cambio de paradigma de esta revolución tecnológica!