Dernière revue :
Qu'est-ce que le RAG ? Définition et enjeux pour l'entreprise
Le RAG (Retrieval-Augmented Generation) est une architecture d'IA qui couple un moteur de recherche dans vos documents à un modèle génératif : le modèle répond en s'appuyant sur vos données métier citables plutôt que sur ses seules connaissances d'entraînement.
Le RAG fonctionne en trois étapes invisibles pour l'utilisateur final. Premièrement, vos documents (PDF, pages web, base de connaissances) sont découpés et convertis en vecteurs numériques, c'est-à-dire des coordonnées mathématiques qui représentent leur sens, puis stockés dans une base vectorielle. Deuxièmement, lorsqu'un utilisateur pose une question, le système recherche les passages les plus sémantiquement proches de la requête. Troisièmement, ces passages sont injectés dans le prompt envoyé au LLM, qui rédige une réponse en s'appuyant explicitement sur ces sources. La conséquence pratique est majeure. Le modèle ne s'appuie plus sur sa mémoire d'entraînement, il lit à chaque requête les documents pertinents que vous lui fournissez. C'est ce qui distingue le RAG du fine-tuning, qui modifie les paramètres internes du modèle. Le RAG laisse le modèle intact et joue uniquement sur ce qu'il a sous les yeux au moment de répondre.
Exemple concret
Une étude publiée en 2025 dans le Journal of Medical Internet Research a comparé, sur des questions oncologiques, des chatbots avec et sans RAG. Les chatbots conventionnels, sans accès aux sources officielles, ont produit environ 40 % de réponses hallucinées. Les chatbots équipés d'un RAG branché sur le Cancer Information Service américain ont fait chuter ce taux à 19 % pour GPT-4 et 35 % pour GPT-3.5. Le RAG ne supprime pas l'hallucination, mais la divise par deux dans cette configuration. Chaque réponse cite la source utilisée, condition d'audit a posteriori.
À voir aussi
Sources
- Reducing Hallucinations in Generative AI Chatbots for Cancer Information, JMIR / PMC, 2025. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC12425422/
- Moffatt v. Air Canada, Civil Resolution Tribunal de Colombie-Britannique, février 2024. https://www.canlii.org/en/bc/bccrt/doc/2024/2024bccrt149/2024bccrt149.html