La revolución de la voz de ChatGPT: ten paciencia, viene… poco a poco

La revolución de la voz de ChatGPT: ten paciencia, viene… poco a poco
La revolución de la voz de ChatGPT: ten paciencia, viene… poco a poco
-

¿Creías que pronto podrías conversar con ChatGPT como un humano? Tendremos que esperar un poco más. OpenAI acaba de anunciar un aplazamiento de sus nuevas funciones de voz.

Fuente: Unsplash

En una actualización de primavera, OpenAI presentó las nuevas funciones de ChatGPT con su modelo GPT-4o. En el programa, nuevas funciones lingüísticas y un asistente de voz mejorado inicialmente reservado para los suscriptores.

Suscribir

Es en Discord donde OpenAI revela sus cambios de calendario. Actualmente nos encontramos en una fase alfa de las nuevas características lingüísticas. Deberían haber estado disponibles a finales de junio, en última instancia, habrá que esperar hasta finales de julio.

¿Por qué este aplazamiento? OpenAI presenta dos razones principales. En primer lugar, los desarrolladores todavía están trabajando para garantizar que el modelo reconozca el contenido al que no debería responder. Claramente, se trata de evitar errores y respuestas inapropiadas, una cuestión crucial para la IA conversacional.

Luego está la cuestión de la infraestructura. Pasar del texto a la voz en tiempo real para millones de usuarios no es tarea fácil. OpenAI necesita tiempo para preparar sus servidores para esta avalancha de solicitudes de voz.

OpenAI no cambia su estrategia general: un despliegue gradual. Primero, un pequeño grupo de usuarios de ChatGPT Plus a finales de junio (retrasado hasta finales de julio), luego una extensión gradual. El objetivo es que todos los suscriptores Plus puedan utilizar la función de voz antes del otoño.

Un asistente más humano

Además de estas mejoras lingüísticas, OpenAI también está trabajando en sus funciones para compartir pantalla y vídeos. El asistente puede capturar y analizar el contenido de tu pantalla o grabaciones de tu cámara.

En la práctica, Microsoft, que trabaja en colaboración con OpenAI, reveló en 2024 cómo el asistente CoPilot basado en GPT-4o era capaz de asesorar a un jugador de Minecraft para construir su build. Con estas mejoras, ChatGPT se convierte en un interlocutor cada vez más humano hasta acercarse a su tiempo de reacción, concretamente 320 milisegundos, donde se tardaban de media unos segundos en calcular una respuesta. A esta velocidad, el chatbot también podría combinar una serie de reacciones para parecer sorprendido o sarcástico durante las solicitudes.

Por el momento, estos anuncios y presentaciones, por impresionantes que sean, sólo se han hecho en el contexto de manifestaciones. Queda por ver cómo se utilizarán estas funciones en la vida diaria y en qué medida seguirán siendo relevantes ante miles de solicitudes simultáneas.


Sabías ? Google News te permite elegir tus medios. No te pierdas a Frandroid y Numerama.

-

PREV los cambios no solo serían en el interior
NEXT Una nueva cámara podrá detectar si estás borracho al volante