Nuevo entrante en el campo de la inteligencia artificial generativa con Whisk, un nuevo producto de Google. La compañía dice que su herramienta está destinada a una exploración visual rápida en lugar de ediciones precisas: los resultados no son perfectos, pero tienen funciones de edición para corregir imprecisiones.
¿Las IA prefieren Whisk-ASS?
Whisk es un experimento reciente de Google Labs que permite a los usuarios crear imágenes utilizando otras imágenes como punto de partida. Al combinar el modelo Imagen 3 con las capacidades de comprensión visual de Gemini, Whisk genera imágenes únicas basadas en temas, escenas y estilos proporcionados por el usuario. Esta herramienta facilita la visualización y recomposición de ideas de formas innovadoras.
Si el usuario no tiene imágenes, Whisk puede ofrecerlas generadas por IA; en conclusión, los peligros de los derechos de autor se evitan en gran medida. El usuario también agregará detalles textuales adicionales si lo desea.
¿No quieres un Whisk-Y primero?
Una vez que se proporcionan las indicaciones, Whisk genera las imágenes correspondientes y descripciones de texto para cada una, lo que permite a los usuarios guardarlas, descargarlas o refinarlas agregando más texto o editando la imagen directamente.
Obviamente, Whiksi confía en Gemini, que producirá una descripción de las imágenes, antes de enviarlas a Imagen 3, la herramienta de generación de imágenes. “ En segundo plano, el modelo Gemini genera automáticamente una descripción detallada de las imágenes proporcionadas, que luego es procesada por el modelo de generación de imágenes más nuevo de Google, Imagen 3. Este proceso captura la esencia de las imágenes proporcionadas y permite remezclarlas de forma creativa. », Indica la empresa de Mountain View.
LEER – Los lectores prefieren la poesía de la Inteligencia Artificial
Esta solución está diseñada para una exploración visual rápida, en lugar de ediciones precisas a nivel de píxeles. Su objetivo es fomentar la experimentación y la creatividad al permitir a los usuarios probar rápidamente diferentes ideas y descargar las que les gusten.
Whisk utiliza el modelo de generación de imágenes Imagen 3 de Google. Para probarla será en esta dirección, mientras esperas tu turno, ya que la herramienta sólo está disponible en Estados Unidos por el momento. Tenga en cuenta que Google pronto distinguirá las imágenes generadas o modificadas por IA en sus resultados de búsqueda, indicando claramente su origen.
LEER – El futuro de la edición: una herramienta de inteligencia artificial que evalúa la calidad de los libros
Créditos de imagen: Google, Imagen 3
Por Clément Solym
Contacto: [email protected]