La « génération augmentée de récupération », vous connaissez ?
Percée de la RAG en éducation en 2024
La RAG est une méthode puissante associée à l’IA générative qui améliore les capacités des grands modèles de langage (LLM) en leur permettant d’exploiter des ressources de données supplémentaires sans réentraînement (des contenus de cours par exemple), afin de générer des réponses plus exactes et approfondies.
Avant de vous perdre complètement, voici quelques informations de base.
L’acronyme RAG, qui signifie « Retrieval-Augmented Generation », peut être traduit en français par « Génération Augmentée par méthode de Récupération ». Cette traduction capture l’essence des deux composantes principales de l’approche RAG avec les grands modèles de langage de l’IA :
- Récupération : Indique la capacité du modèle à chercher et à récupérer des informations pertinentes puis les stocker dans une base de données vectorielle.
- Génération de réponses Augmentées : Fais référence au processus de génération de texte grâce aux informations récupérées.
L’IA générative, le stagiaire et la RAG
Pour faire une métaphore bancale, utiliser une IA générative c’est un peu comme si on demandait à une toute nouvelle personne stagiaire performante et bien formée de vous aider dans vos tâches. Elle dispose d’une vaste base de connaissance, mais on doit l’accompagner en lui fournissant les informations et les procédures propres au contexte de travail à réaliser. Elle ne vous connait pas et elle ne dispose pas nécessairement de la documentation utile à jour ni des informations spécifiques à votre milieu pour accomplir précisément ses tâches. Si vous ne lui montrez pas où se trouvent ces informations, les résultats ne seront pas pertinents.
Arrêtons ici la métaphore de la personne stagiaire, pour poursuivre avec l’outil d’IA générative qui n’a rien d’humain. Quand l’IA générative répond aux requêtes (prompts), c’est un peu comme si elle jouait aux devinettes avec les mots. Elle essaie de former des phrases qui semblent cohérentes, mais parfois, elle se trompe. Elle n’est pas programmée pour dire « Je ne sais pas ». Alors elle hallucinera des réponses parce qu’elle manque de contexte, soit parce qu’ils ne peuvent pas trouver les données pertinentes, soit parce qu’ils ne savent pas à quelles données se référer.
Selon le site Oracle Canada (Zeichick, 2023), « la génération augmentée de récupération est une technique qui peut fournir des résultats plus précis aux requêtes qu’un grand modèle de langage, car la RAG […] peut intégrer des données provenant de nombreuses sources » vérifiées et fiables.
Exemples de RAG en éducation
La RAG pourrait donc enrichir les résultats d’une IA générative en utilisant une base de connaissances augmentée liée au contexte d’un cours comprenant des informations précises telles que des référentiels de documents non structurés, des flux de données, des transcriptions audio ou des journaux de transactions par exemple.
Lors de notre veille, nous sommes tombés sur deux exemples d’implantation de RAG pour deux cours universitaires au Québec. Avec la RAG, les responsables du cours n’ont qu’à mettre à jour régulièrement la base de données si les contenus changent ou s’ajoutent. Il suffit d’inclure à la base de données la documentation nécessaire (ex. : plan de cours, notes de cours, devis, documents de références, verbatim du cours…) dans laquelle l’outil d’IA va puiser pour chercher à bien répondre aux requêtes.
Exemple 1- Le modèle de l’UQAT présenté lors du Colloque ROC 2023
Titus — Tuteur intelligent en univers social : expérimentation de l’usage d’un agent conversationnel intelligent pour soutenir les étudiantes et les étudiants en formation à distance asynchrone dans un cours d’univers social
Ce qui est remarquable dans ce premier exemple, c’est l’intégration de la RAG directement dans l’environnement Moodle de l’établissement universitaire. Cette intégration permet de fournir des informations précises et pertinentes aux étudiants directement via l’interface utilisateur.
L’assistant-robot d’un cours universitaire en journalisme
Dans ce deuxième exemple, l’enseignant intègre un robot conversationnel avec sa RAG à une interface externe (assistant-robot du cours IA). Celle-ci est basée sur le contenu et les ajouts des transcriptions automatisées de tous les cours pendant l’ensemble de la session.
En résumé
La RAG :
- peut fournir des réponses plus précises et détaillées ;
- permet aux modèles de langage d’accéder à des informations sélectionnées ;
- élargit la base de connaissances du modèle d’IA générative au-delà de ce qu’il a appris pendant l’entraînement, en réduisant autant que possible les hallucinations ;
- est utile pour une large gamme de questions, allant des requêtes factuelles simples aux questions complexes nécessitant des réponses nuancées dans le contexte des deux cours mentionnés.
Pour en savoir plus
- Zeichick, Alan (2023, 19 sept.). « Qu’est-ce que la génération augmentée de récupération (RAG, retrieval-augmented generation) ? », sur le site Oracle-Canada. Consulté le 22 jan. 2024.
https://www.oracle.com/ca-fr/artificial-intelligence/generative-ai/retrieval-augmented-generation-rag/ - Benoit Raphael, Flint GPT & Thomas Mahier (2024, 21 jan.). « Comment je me suis créé un deuxième cerveau avec l’IA », sur le site Génération IA. Consulté le 22 jan. 2024.
https://generationia.flint.media/p/transformez-vos-connaissances-en-deuxieme-cerveau-rag-dust-ia - Liu, Jerry (2023, 21 nov.). « Introducing RAGs: Your Personalized ChatGPT Experience Over Your Data », sur le site Medium – LlamaIndex Blog. Consulté le 22 jan. 2024.
https://blog.llamaindex.ai/introducing-rags-your-personalized-chatgpt-experience-over-your-data-2b9d140769b1