Equipo editorial de RHC: 26 de diciembre de 2024 08:53
El 20 de diciembre, el nuevo sistema de inteligencia artificial de OpenAI, o3, alcanzó un hito importante. La modelo obtuvo una puntuación. 85% en la prueba de pensamiento ARC-AGI, que es el mismo que el puntaje humano promedio. Además de esto, se destacó en problemas matemáticos complejos.
La prueba ARC-AGI y la lógica de muestreo.
Hasta ahora, el mejor resultado entre desarrollos similares no ha superado el 55%. Muchos investigadores creen que o3 ha dado un paso importante hacia la inteligencia artificial general (AGI), aunque los escépticos todavía dudan de la importancia de este resultado.
Aquí es importante entender las características de la prueba. ARCO-AGI. El principal indicador en él es “eficiencia de muestreo”, o el capacidad de adaptarse a nuevas condiciones, teniendo un mínimo de ejemplos. En pocas palabras, la prueba determina cuántas muestras de una nueva situación se necesitan para comprender cómo funciona.
¿Quieres convertirte en un Hacker Ético?
No te pierdas nuestros cursos y escribe ahora por WhatsApp al número
375 593 1011 para solicitar información diciendo que encontraste el número en las páginas de Red Hot Cyber
Apoye a RHC a través de:
¿Te gustan los artículos de Red Hot Cyber? No esperes más, suscríbete a la newsletter semanal para no perderte ningún artículo.
Los modelos de lenguajes modernos como ChatGPT basados en GPT-4 no pueden presumir de una alta eficiencia de muestreo. Durante el entrenamiento, examinan millones de fragmentos de texto humano y, a partir de ellos, derivan las combinaciones de palabras más probables. Este método ayuda a hacer frente a tareas típicas, pero falla en situaciones no estándar, simplemente porque no hay suficientes ejemplos similares en la base de datos.
Por ahora, la IA sólo se puede utilizar cuando las tareas se repiten o cuando los errores aleatorios no tienen consecuencias graves. El principal problema es que Los modelos no saben cómo aprender y adaptarse rápidamente a nuevas circunstancias.
Es una cuestión de “generalización”
Los científicos llaman generalización a la capacidad de encontrar soluciones correctas a problemas desconocidos basándose en un conjunto limitado de información. En la comunidad científica este rasgo se considera un signo necesario y fundamental de la inteligencia. El ARC-AGI consta de problemas de cuadrícula similares a las pruebas de coeficiente intelectual escolares. En pantalla aparecen dos imágenes: el patrón inicial y un ejemplo del estado al que debe llegar tras determinadas manipulaciones. El programa debe ccomprender el modelo de transformación del estado inicial al estado final.
Cada actividad viene con tres ejemplos de enseñanza. Después de estudiarlos, el algoritmo debe derivar las reglas y aplicarlas en la práctica. Este enfoque le permite verificar qué tan rápido se produce la adaptación.
Al investigar patrones, es importante no hacer suposiciones innecesarias ni entrar en detalles innecesarios. En teoría, si puedes encontrar las reglas más simples que sean suficientes para una solución, el programa podrá adaptarse mejor a nuevas situaciones.
El “reglas simples” Por lo general, se pueden describir en oraciones cortas. Por ejemplo, en un problema con una cuadrícula de cuadrados, la regla podría ser: “La figura con la línea que sobresale se moverá hasta el final de esta línea y cubrirá todas las figuras en su camino”.
Aún se desconoce exactamente cómo funciona el o3, pero es poco probable que le hayan enseñado específicamente a buscarlo. “reglas simples”. OpenAI tomó como base una versión genérica del modelo que puede pensar durante más tiempo en preguntas complejas y luego lo entrenó aún más para pasar la prueba ARC-AGI.
O3 funciona mediante cadenas de razonamiento
El investigador francés de IA, Francois Chollet, que creó la prueba, sugiere que o3 itera a través de diferentes “cadenas de razonamiento” o secuencias de pasos para lograr un objetivo. Luego se selecciona la mejor opción en función de ciertas sugerencias de reglas.
Sin embargo, es demasiado pronto para decir qué tan cerca nos acerca esto a la creación de AGI. Los mecanismos básicos para trabajar con el lenguaje pueden seguir siendo los mismos, solo que ahora están adaptados de manera más efectiva para resolver un tipo específico de problema.
OpenAI mantiene en secreto casi toda la información sobre su desarrollo. La empresa se limitó a algunas presentaciones en los medios y permitió que o3 fuera probado solo por algunos investigadores, laboratorios y organizaciones que trabajan en la seguridad de la IA.
El equipo editorial de Red Hot Cyber está formado por un grupo de personas y fuentes anónimas que colaboran activamente proporcionando información previa y noticias sobre ciberseguridad y TI en general.