Google entra este miércoles en lo que llama “la era de la agencia”. El gigante digital californiano lanza la segunda generación de su IA generativa Gemini. Gemini 2.0 está diseñado para convencerle mejor de que utilice la IA, a través de agentes y asistentes que son más autónomos, más objetivos y, en resumen, más confiables que la IA generativa actual.
Publicado a las 10:30 a.m.
En concreto, Google pondrá en línea a partir de este miércoles una versión experimental de Gemini 2.0 Flash, la versión más ligera de su IA generativa. Se puede acceder inmediatamente a él a través de sus interfaces de programación y capacitación de modelos de lenguaje AI Studio y Vertex AI. Paulatinamente se irá integrando en la aplicación Gemini en versiones para móviles y ordenadores personales.
También será esta nueva versión de Gemini la que se integrará en el buscador de Google, y la que generará los resúmenes que aparecen en las cabeceras de los resultados de búsqueda.
Más factual
A pesar de todo el entusiasmo por aplicaciones como ChatGPT, de OpenAI, y Copilot, de Microsoft, el hecho es que la IA generativa es, en general, muy imperfecta. Ya sea en su forma de generar texto o imágenes, todavía le falta una buena dosis de juicio que le impediría escribir o dibujar casi cualquier cosa en ocasiones. Estas bromas, elegantemente descritas hasta ahora como “alucinaciones”, han limitado una adopción más formal y generalizada de herramientas de IA, ya sea para el trabajo o el ocio.
Con Gemini 2.0, Google promete limitar mejor los errores de su IA, lo que la convertirá en un mejor asistente, o incluso un agente para el usuario. “Será más factual, lo que lo hará más útil para la investigación en línea, y más multimodal”, resumió Tulsee Doshi, director de proyectos de Google DeepMind, a través de videollamada. “También tendrás más control sobre la forma en que se expresa”. Por ejemplo, de forma oral, Gemini 2.0 hablará en varios idiomas con ocho tonos de voz diferentes, que podrán personalizarse. Podrías pedirle que “hable como un pirata”. Gemini 2.0 también generará imágenes basadas en texto.
Esta versatilidad permite mejorar agentes como el del Proyecto Astra. Este proyecto es en realidad el prototipo de un asistente personal digital impulsado por IA. Cabe en el móvil. Le hablas, apuntas la cámara de tu teléfono a un objeto, un lugar o un documento y, naturalmente, te proporcionará mucha información relevante.
Con tecnología Gemini 2.0, Project Astra puede recordar los 10 minutos más recientes de su conversación y, para obtener más contexto, puede profundizar en sus conversaciones anteriores. Este agente tiene buena pinta en móviles, pero triunfaría en las gafas conectadas, un gadget con el que Google lleva ya varios meses haciendo malabarismos y que podría ver la luz pronto.
De la navegación web a los videojuegos
Google mostró tres ejemplos más de agentes de IA que aprovechan el rendimiento ligeramente mejorado de Gemini 2.0. El primero, llamado Project Mariner, navega por la web por usted y automatiza tareas repetitivas o tediosas. Por ejemplo, puede recopilar la mejor manera de contactar con una lista de empresas visitando sus sitios web uno por uno. Podría ir tan lejos como para comprar por usted y sólo pedirle que intervenga cuando llegue el momento de pagar.
Jules es otro agente que se presenta como asistente de programación informática. Esto no es nuevo: Microsoft tiene el mismo tipo de herramientas en su propio conjunto de herramientas de IA. Pero Jules sería mejor para detectar errores en el código y corregirlos, dejándote rienda suelta para realizar tareas más significativas.
Finalmente, Google cree que Gemini podría convertirse en un compañero de videojuegos. “Imagina una IA que te ayudaría a progresar en el juego y te daría consejos mirándote jugar”, ilustró Rushil Mistry, otro director de producto de Google DeepMind. Es menos un agente de IA que un hermano pequeño con ganas de hacer demasiado, pero la idea está ahí: esta IA podría perjudicar a todos esos sitios web especializados en guías paso a paso para videojuegos.
Y este es sólo un ejemplo entre muchos de lo que Google espera que sea el futuro inmediato de la inteligencia artificial: la era de la agencia.