qué sistema elegir para mejorar tu IA

Thursday 21st November 2024 05:55 AM

Después del RAG ya adoptado por muchas empresas, el RIG ofrece un enfoque innovador para generar respuestas más precisas y contextualizadas.

Un nuevo enfoque para hacer que las respuestas del LLM sean más confiables. Tras la adopción masiva de los sistemas RAG en las empresas, que permiten contextualizar un LLM a partir de una base documental, se está desarrollando un nuevo enfoque más inteligente. Habiendo pasado desapercibido para los medios, RIG, por Retrieval Interleaved Generation, permite que modelos de lenguaje grandes proporcionen respuestas detalladas y documentadas. Explicaciones técnicas, ventajas e inconvenientes… Te damos las claves de este nuevo enfoque innovador.

RAG vs RIG: funcionamiento opuesto

El RIG fue popularizado por investigadores de Google como parte del trabajo para reducir las alucinaciones en los LLM. El estudio, publicado en septiembre de 2024, presenta en particular las ventajas de RIG frente a RAG. RAG y RIG difieren fundamentalmente en la forma en que interactúan con las bases de conocimiento. En un sistema RAG tradicional, el proceso es lineal y se produce en tres pasos distintos: primero, la pregunta del usuario se convierte en un vector digital mediante un modelo de incrustación. Luego, este vector se utiliza para buscar los fragmentos de documentos más similares en una base de datos de vectores. Finalmente, estos fragmentos se proporcionan como contexto para el LLM, que genera su respuesta de una sola vez.

El RIG adopta un enfoque más interactivo e iterativo. En lugar de depender de una simple búsqueda de similitud de vectores, el LLM está capacitado para formular consultas estructuradas por sí mismo (en el lenguaje de la base de datos, por ejemplo, SQL) a lo largo de la generación de respuestas. En concreto, cuando el LLM genera un texto y necesita citar un hecho o una estadística, se interrumpe para formular una consulta precisa a la base de datos. Por ejemplo, si escribe “La tasa de desempleo en Francia en 2023 fue”, el modelo generará automáticamente una consulta estructurada para obtener esta información exacta y luego integrará la respuesta en su texto.

Muchas ventajas, implementación compleja

Gracias a su arquitectura ágil, el RIG permite al LLM generar respuestas más relevantes. El modelo aprende a identificar la información que necesita a medida que construye su respuesta. En el caso de RAG, el modelo no tiene la capacidad de interactuar directamente con la base de datos y debe conformarse con un contexto inicial. Por ejemplo, con el RIG, para una pregunta compleja sobre un tema histórico, el LLM podría buscar primero el contexto general de la época, luego eventos específicos y finalmente detalles específicos sobre los actores involucrados. Un método iterativo que ofrece respuestas mejor documentadas que el RAG.

Aunque RIG es prometedor, su implementación práctica en producción sigue siendo compleja. De hecho, el modelo debe ajustarse para que tenga la capacidad de realizar consultas estructuradas con el lenguaje de base de datos adecuado. Además, RIG implica varias consultas a la base de datos y, por tanto, puede generar un coste computacional mayor que RAG. Finalmente, consultar la base de datos directamente varias veces puede generar una latencia ligeramente mayor en respuesta al usuario final.

RAG, RIG: casos de uso definidos

Aunque RIG representa una nueva dirección prometedora, el enfoque RAG probablemente seguirá siendo la solución más simple para la mayoría de los casos de uso generales donde el usuario simplemente necesita una respuesta concisa y objetiva. RAG brilla cuando la consulta del usuario es sencilla y se puede abordar con documentación textual simple.

Por su parte, RIG sobresale en casos donde las consultas son complejas y requieren interacción iterativa con una base de datos estructurada. Por ejemplo, para consultar una base de datos SQL, RIG le permite construir una respuesta precisa navegando entre diferentes capas de información.

Para las empresas, probar y experimentar con RIG será esencial para evaluar el potencial en casos de uso específicos, como agentes especializados o sistemas que requieren respuestas basadas en datos dinámicos y complejos. Sin embargo, para la mayoría de los chatbots generales, RAG sigue siendo la solución más relevante.