Esta nueva IA de openAI genera imágenes y videos 50 veces más rápido ????

Wednesday 13th November 2024 12:52 AM

OpenAI traspasa los límites de la creación de imágenes y vídeos con IA. Ahora, la generación de medios ocurre en un instante, lo que hace que el tiempo de espera sea casi invisible.

Gracias a un nuevo modelo, la IA produce imágenes y vídeos 50 veces más rápido, sin comprometer la calidad. ¿La clave? Un sistema de dos pasos.

Los modelos de streaming tradicionales, ampliamente utilizados para generar imágenes y vídeos, funcionan con cientos de pasos progresivos de eliminación de ruido. Este proceso, aunque eficiente, requiere tiempo y altos recursos computacionales.

Para abordar esto, Cheng Lu y Yang Song de OpenAI desarrollaron un “modelo de consistencia en tiempo continuo” (sCM) para simplificar el proceso de creación. En sólo dos pasos, este modelo puede generar muestras de alta calidad, superando a los métodos de difusión convencionales.

Con más de 1.500 millones de parámetros, el sCM de OpenAI funciona en un tiempo récord: 0,11 segundos para producir una imagen en un procesador A100 (como ejemplo). En comparación, los modelos anteriores requieren varios segundos y mucho más. fuerza.

Esta velocidad podría transformar el uso de la IA en áreas que requieren generación en tiempo real. Por tanto, los sectores de la imagen, el vídeo y el audio están preparados para beneficiarse de este progreso.

Probado en conjuntos de datos densos, sCM mantiene una calidad de imagen que rivaliza con los modelos de difusión. Su puntuación FID (Fréchet Inception Distance, medida utilizada para evaluar la calidad de las imágenes creadas por un modelo generativo) es, por tanto, sólo un 10% inferior a la de los mejores modelos, lo que demuestra su eficacia.

Al limitar los recursos informáticos necesarios, sCM también se convierte en una solución más ecológica y económica que los modelos actuales, aunque a cambio esto debería contribuir a su democratización y, por tanto, al consumo general de energía… OpenAI espera optimizar aún más su velocidad para aplicaciones industriales exigentes.

En última instancia, sCM podría proporcionar una base tecnológica para una IA generativa ultrarrápida. Este salto adelante sugiere un futuro en el que la IA producirá medios con una calidad y fluidez sin precedentes y, sin duda, vídeos en tiempo real.