Google saca sus armas contra OpenAI en la guerra generativa de la IA. DeepMind, el laboratorio de investigación de IA de la famosa firma de Mountain View, presentó el lunes Veo 2, una nueva generación de su generador de vídeo de IA. Este nuevo producto del gigante web contraataca a Sora, una herramienta similar que OpenAI puso a disposición del público en general la semana pasada, prometiendo mejores resultados que la competencia. Veo 2, sucesor de Veo anunciado en mayo, le permite crear vídeos bajo demanda a partir de una consulta de texto. Es capaz de generar contenidos que alcanzan una definición de hasta 4K (frente a los 1080p de Sora) y una duración de hasta “varios minutos”.
Al aportar “una mayor comprensión de la física del mundo real y los matices del movimiento y la expresión humanos”, Veo 2 es capaz de imitar géneros y efectos cinematográficos. Por ejemplo, puede tomar fotografías específicas, como un travelling en ángulo bajo, un primer plano, o incluso sugerir el uso de una lente de 18 mm o la adición de una profundidad de campo reducida. Los ejemplos presentados por Google muestran películas animadas y otras secuencias que muestran un realismo sorprendente.
Google destaca el hecho de que Veo 2 es menos propenso a sufrir “alucinaciones”, fenómenos que provocan la aparición de detalles no deseados, como dedos adicionales u objetos inesperados, en comparación con los modelos de IA de la competencia.
Google DeepMind también levantó el velo sobre Imagen 3, una versión avanzada de su generador de imágenes Imagen, rival, entre otros, del DALL-E de OpenAI. La firma también especifica que pone énfasis en la lucha contra la desinformación, indicando que sus generadores de imágenes y videos integran el sistema SynthID, que agrega una marca de agua invisible al contenido generado para identificarlo como creado utilizando ‘AI.
Estos dos nuevos servicios, que no son oficialmente accesibles desde Europa, están disponibles respectivamente a través de las herramientas VideoFX e ImageFX en la plataforma Google Labs.
Finalmente, Google también presentó Whisk, una nueva herramienta de inteligencia artificial que permite a los usuarios crear imágenes basadas en el tema, el estilo y el contexto de otras imágenes, en lugar de depender de descripciones textuales.