Con motivo de la apertura de su oficina en París, OpenAI presentó su visión de la IA en el futuro próximo. Esto es lo que puede esperar.
Nueve años después de su lanzamiento en San Francisco, OpenAI llega a Francia. La start-up se trasladó oficialmente a París este jueves 14 de noviembre para abrir su segunda oficina en Europa después del Reino Unido. En esta ocasión, varios directivos de la empresa se encontraban en misión evangelizadora entre las empresas francesas y parte de la prensa, incluida la JDN. La start-up nos presentó sus últimas innovaciones en IA generativa y trazó su hoja de ruta para los próximos meses. Nuevas capacidades para la vista previa de o1, desarrollo de agentes autónomos, investigación continua sobre AGI, reducción de costes… Esto es lo que se puede esperar del gigante estadounidense de la IA.
La continuación de la búsqueda hacia AGI, el código abierto en segundo plano
Esta ha sido la misión principal de OpenAI desde su creación: lograr una inteligencia artificial general. Esta búsqueda se articula, en la comunicación de OpenAI, en la ambición de “servir al bien común” respetando la ética y la accesibilidad de la IA para la mayor cantidad de personas posible. Para lograr este objetivo, los equipos de investigación se centran en modelos de frontera, los modelos de IA más avanzados y potentes del mercado. Modelos propietarios que se alejan de la visión original de código abierto de la empresa.
“Nuestra atención se centra esencialmente en la frontera de la innovación, en un contexto en el que ya existen excelentes modelos de código abierto en el mercado. Aunque nos gustaría invertir más en código abierto a largo plazo, esto no “no es nuestro objetivo”. prioridad actual”, explica uno de los portavoces.
La versión final de o1 “en las próximas semanas”
Para alcanzar el AGI, la empresa cuenta en particular con nuevos modelos de razonamiento y con su avance insignia o1. Este último se basa en el principio de cadena de pensamiento y cálculo del tiempo de prueba. “Anteriormente, con modelos como GPT-4, cuando enviabas un mensaje, la respuesta se construía de manera lineal y definitiva, token por token. La mejora del rendimiento se lograba principalmente aumentando el tamaño de los grupos de búsqueda y los recursos humanos. Hoy, con En la vista previa 1, hemos desbloqueado una nueva capacidad, aún en pañales, que nos permite combinar modelos más grandes con mayor potencia informática”, recuerdan nuestros interlocutores.
El modelo que hoy se encuentra en versión preliminar debería ser lanzado en su versión final y completa “en las próximas semanas”. En última instancia, el modelo debería admitir la mayoría de las herramientas que ya son compatibles con GPT-4o útiles para los desarrolladores: salida estructurada, llamada de funciones, etc. Finalmente, OpenAI planea llevar el razonamiento de o1 aún más lejos: “Hoy, o1 se toma un minuto para pensar en una tarea. , uno puede imaginar que un modelo de este tipo, cuando se enfrenta a tareas muy complejas que requieren la exploración de miles de posibilidades y un razonamiento extenso, podría tomar varios minutos para pensar en él.
Al mismo tiempo, OpenAI debería continuar su trabajo en multimodalidad en torno a GPT-4o para que su uso sea aún más natural y fluido. El objetivo es proporcionar coherencia y una mejor interoperabilidad entre los modelos de razonamiento y los multimodales.
2025: el año de los agentes
OpenAI está seguro de que 2025 será el año de los agentes de IA. Toda la estrategia agente de OpenAI se basa en o1. Los investigadores de OpenAI creen que el razonamiento presentado por o1 era el ladrillo que faltaba para permitir el desarrollo de agentes verdaderamente autónomos y confiables. “Antes, la gente hacía demostraciones interesantes de agentes, pero era difícil implementarlos en producción porque no se podía tener plena confianza en su capacidad para tomar las decisiones correctas en el momento adecuado”, explica un portavoz de la empresa.
La joya californiana de la IA imagina agentes más proactivos, capaces de actuar de forma autónoma en nombre de los usuarios. “Podríamos imaginarnos despertarnos por la mañana y descubrir que nuestros correos electrónicos ya han sido ordenados, nuestro calendario organizado, ciertas citas trasladadas, simplemente porque el agente inteligente habrá sido proactivo, conociendo nuestras preferencias y nuestros datos”, ilustra además nuestro interlocutor.
La caída de costes continuará
Finalmente OpenAI también desea continuar con su estrategia de reducción agresiva de costos para sus clientes. La empresa logró reducir el coste por token en un 99% en sólo dos años. Esta reducción se basa en dos palancas principales: la optimización de los modelos que permiten obtener más inteligencia en tamaños similares o equivalentes, y las economías de escala gracias a los 3 millones de desarrolladores y los 250 millones de usuarios activos.
Para ir más allá, la empresa seguirá implementando nuevas soluciones de optimización. La “API por lotes” ya permite un ahorro del 50 % al programar tareas durante las horas de menor actividad de la GPU. OpenAI también ofrece descuentos adaptados a los volúmenes de uso caso por caso con sus clientes directos.
En cuanto a su herramienta de generación de vídeo Sora, OpenAI se mantiene cauteloso. El modelo, aún en fase de investigación, continúa evolucionando pero no se ha comunicado ninguna fecha de lanzamiento. El equipo trabaja en estrecha colaboración con estudios y miembros del equipo rojo para garantizar que el modelo esté listo para todos los casos de uso. “Lo cierto es que la inversión en Sora continúa y el equipo sigue mejorando el modelo”.
La oficina de París, que pronto contratará personal de todas las profesiones, desde la ingeniería hasta la investigación, servirá como centro para Europa continental. Una futura oficina en Bruselas se dedicará a ejercer presión sobre las autoridades europeas.