La voz tiene cada vez menos secretos para la IA. En el lado oscuro, su destreza facilita el fraude, perturbando el trabajo de intérpretes y actores. En el lado luminoso, en cambio, hay grandes avances, que ya están cambiando vidas… y que están haciendo soñar a mucha gente.
De hecho, es como si acabáramos de descubrir un nuevo continente y lo estuviéramos explorando.
dice Yan Fossat, vicepresidente de investigación y desarrollo de Klick Labs, una joven startup con sede en Toronto.
Klick Labs ya ha demostrado que su tecnología permite realizar un diagnóstico rápido de la diabetes sin necesidad de inyección, simplemente grabando unas cuantas frases en un teléfono móvil.
Palabras analizadas inmediatamente por potentes algoritmos, entrenados para detectar señales sutiles en las voces de los diabéticos. Biomarcadores, tal como existen en la sangre.
Saber si una persona es diabética con solo escuchar su voz es increíblemente conveniente y mucho más económico que poner una inyección y extraer sangre.
Yan Fossat cree que esta tecnología puede ser muy útil en el extremo norte de Canadá o en las regiones rurales de África, rincones del mundo donde el acceso a los médicos es difícil.
Un examen positivo permite derivar a un diabético a un especialista que le brindará un diagnóstico más preciso y un tratamiento adecuado.
Abrir en modo de pantalla completa
Yan Fossat, vicepresidente de investigación y desarrollo de Klick Labs.
Foto: Cortesía: Klick Labs
Yan Fossat cree que la misma tecnología podría detectar hipertensión, conmociones cerebrales e incluso formas específicas de cáncer. Klick Labs ya está trabajando en ello.
Hay muchas cosas en el cuerpo humano que se pueden medir.
recuerda el investigador. A veces la medición es complicada, costosa, invasiva… Todas estas cosas tienen el potencial de medirse mediante voz.
la palabra potencial
es clave aquí. Aún quedan muchos estudios por realizar y autorizaciones por obtener. Y socios a los que convencer para adaptar estas innovaciones tecnológicas.
La voz que guía a los ciegos
La montrealense Pascale Dussault no tardó en dejarse seducir por las nuevas aplicaciones vocales deIowa. ¡Se ha convertido en mi nuevo amigo!
dice, señalando la mesa donde descansa su teléfono celular.
Ella misma ciega, la directora general del Regroupement des Blinds et des Amblyopes du Métropolitain Metropolitan lo demuestra en su despacho. Se levanta, apunta su teléfono a la pared y toma una foto.
Apenas tres segundos después, una voz procedente del dispositivo describe el cartel que tiene delante. Un dibujo de varias personas. En el centro, una niña pequeña, con un corazón azul pintado en la frente, se está maquillando…
La descripción es incluso más larga y detallada que la cita única que se incluye aquí. Viene de la aplicación. Sé mi IA
. Es producto de una empresa danesa que utiliza inteligencia artificial para analizar el contenido de una fotografía.
Es un poco como llamar a un amigo por videoconferencia para pedirle ayuda, pero sin molestar a nadie. Esto es lo que atrajo a Pascale Dussault. Al mínimo que haya algo que nos permita no depender de los demás, estamos súper felices.
Abrir en modo de pantalla completa
Pascale Dussault, directora general de la Agrupación de Ciegos y Ambliopes del área metropolitana de Montreal.
Foto : Radio-Canadá / Yanik Dumont Baron
La herramienta también le permite leer la temperatura en el termostato de una habitación o los ingredientes enumerados en una lata. Ya no necesito preguntarle a mi marido de qué colores son estos pantalones o este suéter.
La aplicación Sé mi IA
Da más detalles de los que proporcionaría un humano. Haz la prueba, es difícil ser tan preciso como la máquina. El robot ayuda a imaginar mejor los objetos.
Pascale Dussault también descubrió los límites de la aplicación. Es muy práctico para detallar extractos bancarios… pero la confidencialidad de la información que contiene puede
no está garantizado.
Sueña con el momento en que esta tecnología se integre en las gafas, para analizar en tiempo real lo que tiene delante. Por el momento, productos similares disponibles en el mercado no serían adecuados.
Sabiendo que la calle que tengo que cruzar tiene cuatro carriles, entonces tengo que cruzar un carril bici. Este es el tipo de información que necesitaría y que actualmente no existe.
Devolverle la palabra a quienes pierden la voz
La inteligencia artificial también está revolucionando la vida cotidiana de quienes dependen de las computadoras para expresarse. Este es el caso de los pacientes que padecen esclerosis lateral amiotrófica (ELA), enfermedad que padecía el físico teórico Stephen Hawking, que quedó casi completamente paralizado. Hace más de 30 años ya se expresaba utilizando un ordenador que dictaba sus palabras.
Lo cual sonó como si lo hubiera dicho un robot
Parece mucho más natural hoy. La calidad de las voces sintéticas ha aumentado mucho, mucho
confirma la logopeda Marie Gagnon-Brousseau.
Trabaja en la clínica de acceso a ayudas tecnológicas del Centro de Rehabilitación Lucie-Bruneau de Montreal, donde sigue la evolución de las tecnologías que pueden ayudar a los pacientes.
La entonación [des voix de synthèse d’aujourd’hui] será más natural, más fácilmente comprensible.
Abrir en modo de pantalla completa
La logopeda Marie Gagnon-Brousseau.
Foto : Radio-Canadá / Yanik Dumont Baron
La ventaja obvia es el sentimiento de inclusión y aceptabilidad social para quienes lo utilizan.
Con una voz sintética casi humana. Si hago una llamada telefónica, la persona al otro lado de la línea probablemente estará más dispuesta a escucharme.
Los servicios también permiten a los pacientes grabar su voz humana para usarla más tarde con una computadora, cuando la enfermedad les ha hecho imposible o muy difícil hablar.
Los avances también permiten interpretar muy rápidamente las palabras de una persona que tiene enormes dificultades de pronunciación.
Pero también en este caso existen límites importantes. Algunas de sus aplicaciones sólo se ofrecen en inglés por el momento. En algunos casos, informa Marie Gagnon-Brousseau, sus actuaciones no están a la altura de las promesas mostradas en un vídeo promocional.
El logopeda nos recuerda que la comunicación a través del ordenador sigue siendo lenta y un poco fría… incluso con la propia voz. Si digo: buenas noches mi pitchounette, hasta mañana No habrá esa entonación. Todo el amor detrás de esto no necesariamente estará ahí.