Última revisión:
¿Qué es el RAG? Definición y retos para la empresa
El RAG (Retrieval-Augmented Generation) es una arquitectura de IA que acopla un motor de búsqueda en sus documentos a un modelo generativo: el modelo responde apoyándose en sus datos de negocio citables, y no únicamente en sus conocimientos de entrenamiento.
El RAG funciona en tres etapas invisibles para el usuario final. Primero, sus documentos (PDF, páginas web, base de conocimientos) se trocean y se convierten en vectores numéricos, es decir, coordenadas matemáticas que representan su sentido, y se almacenan en una base vectorial. Segundo, cuando un usuario plantea una pregunta, el sistema busca los pasajes semánticamente más próximos a la consulta. Tercero, esos pasajes se inyectan en el prompt enviado al LLM, que redacta una respuesta apoyándose explícitamente en esas fuentes. La consecuencia práctica es mayor. El modelo ya no se apoya en su memoria de entrenamiento, sino que lee en cada consulta los documentos pertinentes que usted le proporciona. Eso es lo que distingue el RAG del fine-tuning, que modifica los parámetros internos del modelo. El RAG deja el modelo intacto y juega únicamente sobre lo que tiene a la vista en el momento de responder.
Ejemplo concreto
Un estudio publicado en 2025 en el Journal of Medical Internet Research comparó, sobre preguntas oncológicas, chatbots con y sin RAG. Los chatbots convencionales, sin acceso a las fuentes oficiales, produjeron alrededor del 40 % de respuestas alucinadas. Los chatbots equipados con un RAG conectado al Cancer Information Service estadounidense hicieron caer esa tasa al 19 % con GPT-4 y al 35 % con GPT-3.5. El RAG no suprime la alucinación, pero en esta configuración la divide por dos. Cada respuesta cita la fuente utilizada, condición de auditoría a posteriori.
Ver también
Fuentes
- Reducing Hallucinations in Generative AI Chatbots for Cancer Information, JMIR / PMC, 2025. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC12425422/
- Moffatt v. Air Canada, Civil Resolution Tribunal de Columbia Británica, febrero de 2024. https://www.canlii.org/en/bc/bccrt/doc/2024/2024bccrt149/2024bccrt149.html