la IA que perfecciona las respuestas de ChatGPT

la IA que perfecciona las respuestas de ChatGPT
la IA que perfecciona las respuestas de ChatGPT
-

Actualmente se acepta comúnmente que Los sistemas de IA pueden responder a enormidades a sus usuarios. Entre las pizzas adhesivas de AI Overview (Google), las respuestas vergonzosas de Prometheus (Microsoft) y las informaciones falsas que ChatGPT se permite producir en determinados momentos, están lejos de ser perfectas. Aunque estas alucinaciones son cada vez menos comunes, OpenAI decidió abordar el problema desarrollando una IA, CriticGPT, para solucionar ChatGPT. La serpiente que se muerde la cola ?

CriticGPT: un ojo atento al código

Obviamente, este nuevo sistema se basa en el mismo modelo de lenguaje que ChatGPT-4, pero está especializado en detectar imperfecciones en las respuestas del chatbot. Analiza meticulosamente las líneas de código y luego informa posibles errores.aliviando así el trabajo de los revisores de carne y hueso.

Este avance es parte de un enfoque más amplio destinado a alinear mejor los sistemas de IA con las expectativas humanas, en particular mediante el aprendizaje reforzado a partir de la retroalimentación humana. Un estudio reciente, titulado Los críticos de LLM ayudan a detectar errores de LLMrevela que CriticGPT fue entrenado en un conjunto de datos plagado de errores intencionalesrefinando así su capacidad para identificar e informar una gran variedad de errores de programación.

Los resultados hablan por sí solos: en el 63% de los casos que involucran errores naturales en los modelos de lenguaje, las críticas formuladas por CriticGPT fueron favorecidas por revisores humanos, superando a las generadas por otras IA o incluso por expertos humanos únicamente. Una colaboración hombre-máquina que parece funcionar de maravilla.

Un experto sabio, pero aún imperfecto.

CriticGPT va aún más allá. Durante experimentos detallados, el modelo se comparó con una muestra de datos de entrenamiento de ChatGPT, previamente considerados impecables por expertos humanos. Contra todo atentado, CriticGPT detectó anomalías en casi una cuarta parte de los casos, anomalías corroboradas posteriormente por los revisores. Por lo tanto, sus habilidades van más allá del campo del código y CriticGPT puede incluso identificar errores sutiles que escaparían a la vista de un experto humano.

En su búsqueda de la excelencia, los investigadores han diseñado una técnica innovadora llamada Force Sampling Beam Search (FSBS). Este ingenioso método permite ajustar con precisión el rigor de CriticGPT en su seguimiento de imperfecciones, al tiempo que controla la frecuencia de los falsos positivos. Es un algoritmo que prefiere explorar vías menos probables para generar una respuesta en lugar de optar por la opción más obvia.

A pesar de los notables avances que ofrece, CriticGPT no está exento de ciertas limitaciones inherentes a su diseño. De hecho, su aprendizaje se centró principalmente en el análisis de respuestas sucintas generadas por ChatGPT, que podrían resultar insuficientes para comprender tareas de mayor alcance y complejidad. Además, aunque CriticGPT logra mitigar significativamente los errores, todavía no ha logrado eliminarlos por completo. Por lo tanto, los expertos humanos responsables de la revisión siguen siendo susceptibles de cometer errores de evaluación al confiar en estos datos a veces erróneos. Siguiente paso: ¿crear un nuevo modelo de lenguaje para buscar errores de CriticGPT después de corregir las respuestas de ChatGPT? Quién sabe !

  • CriticGPT es un nuevo sistema de inteligencia artificial diseñado para rastrear errores de código ChatGPT.
  • Su uso permite analizar y reportar errores en las respuestas producidas por el chatbot que han escapado a la corrección humana.
  • Incluso si resulta eficaz, sigue siendo imperfecto y limitado.

Para no perderte ninguna novedad de Presse-citron, síguenos en Google News y WhatsApp.

-

PREV 2024, un año excepcional en el cielo
NEXT Apple Vision Pro: los pedidos anticipados comienzan hoy en Francia… a 4.000 €