una IA sobrehumana, pero cada respuesta cuesta 6.000 dólares

Tuesday 24th December 2024 08:13 AM

¡OpenAI presenta o3! Esta nueva IA que sucede a o1 es capaz de reproducir la forma en que razonan los humanos, para proporcionar respuestas más profundas y complejas a preguntas y otras indicaciones. ¡Descubre cómo funciona y sus impresionantes capacidades!

Este viernes 20 de diciembre por el último de 12 días de anuncios de sus “Shipmas”, OpenAI creó una sorpresa al revelar sus próximos modelos de IA capaces de razonar.

Sucesor de o1, que acaba de lanzarse en versión completa tras una vista previa a principios de 2024, estos son o3 y o3-mini.

o3, el sucesor de o1 que supera los puntos de referencia

gracias a un nuevo proceso de “ cadena privada de pensamiento » (cadena de pensamiento privada), estos patrones se interrumpen entre sí para examinar su diálogo interno y planifique antes de responder.

Este es un « razonamiento simulado »yendo más allá de las simples predicciones de palabras de modelos de lenguaje grandes (LLM) como GPT-4.

Según OpenAI, o3 batió récords en el Punto de referencia de razonamiento visual ARC-AGI. Logró una puntuación del 75,7% en escenarios de bajo consumo, y 87,5% a alta potencia. En comparación, los humanos solo alcanzan el 85%.

Además, el modelo logró un puntuación de 96,7% en el Examen de matemáticas por invitación estadounidense de 2024. ¡Solo se perdió una pregunta!

En cuanto a la Prueba de biología, física y química de GPQA Diamondo3 obtuvo una puntuación del 87,7%. También resolvió 25,2% de los problemas en el punto de referencia EpochAI Frontier Math. Ninguno otro modelo había superado el 2%…

El presidente de la Fundación Premio ARC El mismo habló durante la transmisión en vivo para aseverar que “ viendo estos resultados, Necesito cambiar mi visión del mundo. seguro ¿Qué puede hacer la IA? y de lo que ella es capaz ».

Un coste totalmente desproporcionado

Algunos expertos ya creen queo3 es tan eficiente que podemos considerarlo como el primer AGI superior a la inteligencia humana.

Sin embargo, su El gran problema actual es su coste.. ¡Cada respuesta a un mensaje cuesta entre $30 y $6,000! Para hacerlo pasar un examen de matematicas y física, OpenAI gastó 350.000 dólares…

¿Pero adónde se fue el o2?

Quizás te estés preguntando por qué OpenAI pasó directamente de o1 a o3. En realidad, la empresa simplemente quiere evitar conflictos alrededor de la marca registrada con el operador telefónico británico O2.

Además, El director ejecutivo Sam Altman bromeó durante el anuncio explicando que esta IA se llama o3” en el gran tradición de OpenAI ser verdaderamente, muy malo con los nombres ».

o3-mini: una pequeña IA capaz de adaptar su velocidad

Por su parte, o3-mini tiene una funcionalidad de pensamiento temporal adaptativo lo que le permite variar un velocidad de procesamiento baja, media o alta.

A pesar de su pequeño tamaño, esta variante en miniatura supera a su predecesor o1 en el punto de referencia de Codeforces. Los ajustes de potencia más altos producen mejores resultados.

Razonamiento, ¿el próximo gran hito en la evolución de la IA?

Este anuncio de OpenAI llega en un momento en el que otras empresas están desarrollando sus propios modelos de razonamiento. Es el caso de googleque acaba de presentar Gemini 2.0 Flash Thinking Experimental.

En noviembre de 2024, DeepSeek presentó DeepSeek-R1. Mencionemos también al gigante chino. Alibaba y su modelo QwQ abierto.

Estos nuevos modelos de IA se basan en los LLM tradicionales, pero se ajustan para seguir un proceso de cadena de pensamiento capaz de considerar los propios resultados para simular razonamiento.

Este tal vez extendido por tiempo de ejecuciónen lugar de centrarse en el mejoras durante el entrenamiento del modelo.

Este enfoque fue utilizado para LLM como GPT-4pero trae cada vez menos mejoras por algún tiempo.

Y El techo parece haber sido alcanzadoparticularmente debido a la escasez de datos generados por humanos con el que alimentar a la IA.

¿Cómo probar OpenAI o3?

Estos nuevos modelos serán puesto a disposición de los investigadores por primera vezpara que puedan probarlos. Inicialmente, OpenAI tiene la intención de lanzar o3-mini a finales de enero de 2025, luego o3 poco después.

Por tanto, tendremos que esperar para poder tener en nuestras manos estas IA y probar sus capacidades. I pensar personalmente que un modelo capaz de reflexionar es mucho más útil que un simple LLM como GPT!

Y tú, ¿qué opinas? ¿Estás usando o1? ¿Crees que la simulación del razonamiento es el camino a seguir para seguir mejorando la inteligencia artificial? ¡Comparte tu opinión en los comentarios!

Comparte el artículo:

Facebook

Nuestro blog está impulsado por lectores. Cuando compra a través de enlaces en nuestro sitio, podemos ganar una comisión de afiliado.