Los anuncios relacionados con la IA están aumentando. Después de OpenAI, que aprovechó su calendario de Adviento para presentar a Sora, le toca a Google lanzarse al fondo de la generación de imágenes. Google Labs, la rama dedicada a probar y experimentar con las últimas tecnologías de la compañía, se lanzó esta semana Batidor, una herramienta de nueva generacióncapaz de generar imágenes, no a partir de mensajes de texto como suele ser el caso, sino a partir de otras imágenes. En una publicación de blog oficial, la empresa explica: “En lugar de generar imágenes utilizando texto largo y detallado, Whisk le permite crear mensajes utilizando imágenes.“.
Suscríbete al Journal du Geek
Géminis se encarga del resto
El concepto de Whisk es simple: sólo tienes que arrastrar imágenes a la herramienta de generación para generar uno nuevo. Son necesarios tres visuales de referencia: uno para el tema, uno para la escena y otro para el estilo gráfico de la imagen. Una vez ingresada esta información, Gemini comienza: el bot escribirá un descripción detallada de cada modeloantes de introducir este último en Imagen 3, el modelo de última generación de imágenes de la firma de Mountain View.
¿Y los derechos de autor?
Que se tranquilicen aquellos que ya lloran por el incumplimiento de los derechos de autor y la propiedad intelectual, promete la empresa: “Este proceso captura la esencia del sujeto, no una réplica exacta. Para que puedas remezclar fácilmente tus temas, escenas y estilos de formas originales.“. Con esta postura, Google quiere evitar repetir la mala prensa de ChatGPT y el resto de generadores de texto, acusados habitualmente de copiar sin autorización textos de los que no tienen propiedad intelectual.
Más concretamente, “Whisk solo extrae algunas características clave de su imagen, puede generar imágenes que difieran de sus expectativas. Por ejemplo, el sujeto generado puede tener una altura, peso, peinado o tono de piel diferente.“, advierte Google. Sin embargo, para refinar aún más los detalles específicos de una imagen, será posible para agregar detalles textualesesta vez a través de un mensaje clásico.
Por el momento, Whisk solo está disponible en Estados Unidos, en versión preliminar restringida. Sin duda, Google esperará los primeros comentarios de los usuarios de Internet para perfeccionar su tecnología, antes de considerar un despliegue más amplio en el resto del mundo.
???? Para no perderte ninguna novedad del Journal du Geek, suscríbete a Google News. Y si nos amas, tenemos un boletín informativo todas las mañanas.