Sistema RAG: un gran avance en la tecnología de inteligencia artificial

RAG: amplificando la IA generativa

La información está a nuestro alrededor, actualmente la cuestión es qué creer y qué no, la información correcta y la información engañosa existen juntas y es entonces cuando recurrimos a fuentes confiables y alguna evidencia concreta para respaldar nuestro pensamiento y creencia. La IA tiene acceso a toda la información disponible en Internet, lo que nos hace confiar en ella para obtener respuestas.

Por ejemplo, si le preguntan qué planeta tiene más lunas, podría decir Júpiter, ya que parece una respuesta obvia, pero cuando le pregunten la fuente o la evidencia que lo respalda, se dejará en blanco y luego, cuando proceda a verificar su confianza. respuesta, descubre que es Saturno según los datos más recientes, esto no solo se aplica a usted sino también a los chatbots de IA generativos en los que la gente confía para consultas comunes como esta, los LLM pueden estar desactualizados e incluso recuperar respuestas de personas no confiables. Fuentes, aquí es donde RAG AI viene a resolver los problemas. RAG Generative AI garantiza que la consulta sea respondida y respaldada por hechos y datos de una fuente confiable, lo que la hace más precisa.

RAG o Retrieval Augmented Generation es la tecnología que garantiza que los modelos LLM puedan basar sus resultados en fuentes confiables de Internet (que es de código abierto) o un conjunto de documentos o datos internos (que es de código cerrado). Esto fortalecerá la respuesta con evidencia, reduciendo las alucinaciones en la aplicación.

UNCODE.initRow(document.getElementById(«1»));

Componentes vitales de RAG

RAG tiene principalmente tres componentes que completan el modelo, todos ellos son igualmente importantes y contienen una cadena de procesos dentro de ellos.

Ingestión, primero cargamos un conjunto de documentos para cada documento, dividimos más documentos de texto en fragmentos y luego procedemos a crear incrustaciones para estos fragmentos, finalmente para estos fragmentos con incrustaciones los descargamos en un sistema de almacenamiento. Una vez que se almacenan los datos, podemos pasar a la recuperación, iniciar una consulta de usuario para el índice, recuperamos los resultados principales con fragmentos similares y tomamos estos fragmentos relevantes para combinarlos con la consulta del usuario y colocarlos en la ventana de solicitud del Modelo LLM.

UNCODE.initRow(document.getElementById(«2»));

Conociendo a la tríada RAG

tríada de trapo

UNCODE.initRow(document.getElementById(«3»));

Poniéndolo en funcionamiento

Podemos mirar a continuación para ver el proceso exacto por el que pasa el programa:

  • Un usuario solicita al sistema cuando un usuario envía un mensaje o consulta al programa de chat, se inicia el procedimiento.
  • La aplicación transmite una consulta. La aplicación de chat envía la consulta del usuario al modelo de generación aumentada de recuperación (RAG) para su procesamiento.
  • RAG obtiene y produce una respuesta. La consulta del usuario es procesada por el modelo RAG AI, que combina capacidades de recuperación y generación. Antes de emplear el LLM para producir una respuesta lógica y contextualmente apropiada basada en la información recopilada y la consulta del usuario, primero recupera información pertinente de un vasto corpus de datos.
  • LLM responde. El LLM devuelve la respuesta generada a la aplicación de chat.
  • Las respuestas se ven en la aplicación. La interfaz de usuario se completa cuando el programa de chat les muestra la respuesta creada.

UNCODE.initRow(document.getElementById(«4»));

Evaluación para el refinamiento

Los resultados se pueden evaluar para refinarlos y probarlos para ciertos puntos de referencia que luego se utilizan para mejorar el modelo.

Función de retroalimentación

Puede evaluar y determinar cómo mejorar la calidad de recuperación de su RAG utilizando las funciones de retroalimentación. Además, se pueden utilizar para optimizar la configuración de su RAG, que incluye varias métricas, parámetros y modelos.

trapo ai

trapo ai

Relevancia de la respuesta

Uno de los tipos de evaluación de la tríada RAG, la relevancia de la respuesta, se utiliza para evaluar qué tan bien está escrito el texto generado. Su objetivo principal es evaluar la relevancia de la respuesta generada para el mensaje proporcionado. Las respuestas con información redundante o incompleta reciben una puntuación más baja.

ejemplo de trapo

Relevancia del contexto

Todas las aplicaciones de RAG Generative AI comienzan con una evaluación de relevancia del contexto. Al confirmar que cada fragmento de contexto es pertinente para la consulta de entrada, se valida la calidad de la recuperación. Esto es crucial ya que el LLM utilizará el contexto para formular una respuesta y cualquier elemento irrelevante podría combinarse para crear una alucinación.

Ejemplo de IA generativa de RAG

UNCODE.initRow(document.getElementById(«5»));

Recuperando la conclusión

Como hemos visto, la generación aumentada de recuperación (RAG) permite a los LLM recuperar información de un almacén de conocimientos externo para aumentar su representación interna del mundo. RAG tiene varios usos en la respuesta a preguntas, chatbots y servicio al cliente, y es especialmente útil para superar problemas de alucinación y corte de conocimiento. Las empresas pueden mejorar la calidad y confiabilidad de las respuestas generadas por su LLM y, en consecuencia, la experiencia del usuario al adherirse a las mejores prácticas para implementar RAG.

Para progresar en el campo en constante cambio de la inteligencia artificial, conocer RAG es vital, independientemente de si es un desarrollador que espera crear sistemas de IA más inteligentes, una empresa que intenta mejorar la experiencia del cliente o simplemente un entusiasta de la IA.

Girasol Lab ha trabajado con muchas industrias y ha demostrado su experiencia en IA/ML que ampliará sus capacidades comerciales a través de soluciones digitales; comuníquese con nuestros expertos hoy.

UNCODE.initRow(document.getElementById(«6»));

La publicación RAG System: un gran avance en la tecnología de inteligencia artificial apareció por primera vez en Girasol Lab: creamos software personalizado para cualquier dispositivo y plataforma.


Source link

About David Lopez

Informático y experto en redes. Redactor en varios blogs tecnológicos desde hace 4 años y ahora en Steamachine.net

Check Also

Costo de desarrollo de aplicaciones Fintech: una guía completa

Las tecnologías emergentes como la IA generativa, las API o la cadena de bloques en …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *