21 mai 2025

Quand le tableau noir s’allie au pouvoir du tutorat assisté par l’IA

Évaluation des impacts d’un tuteur GPT-4 dans l’enseignement secondaire au Nigeria

Au Nigeria, une expérience pilote a été menée en 2024 pour évaluer l’impact sur les élèves de première année du secondaire d’un tuteur IA basé sur GPT-4 avec un encadrement minimal par le personnel enseignant, pour soutenir l’apprentissage de l’anglais, des notions d’intelligence artificielle et des compétences numériques.

D’après la Banque mondiale, environ 70 % des enfants de dix ans dans les pays à faible ou à revenu intermédiaire ne maîtrisent pas les compétences de base en lecture et en calcul, malgré plusieurs années d’enseignement.

Cette situation est principalement causée par des infrastructures insuffisantes, un manque de personnel enseignant qualifié et une pénurie de ressources pédagogiques. Ces éléments freinent la lutte contre les inégalités sociales et le développement économique.

L’étude présentée ici propose une solution technologique alternative : un « chatbot-tuteur » supervisé, alimenté par l’intelligence artificielle (Microsoft Copilot/GPT-4). Ce tutorat IA, encadré par un enseignant, vise à évaluer l’impact d’un accompagnement personnalisé à faible coût. L’expérience s’est déroulée à l’été 2024 à Benin City (Nigéria). Elle a dû composer avec les contraintes matérielles et humaines d’un environnement éducatif sous tension. Le dispositif est resté opérationnel et bien adapté au contexte du milieu, malgré une connexion Internet instable et des coupures d’électricité.

Au total, 1 328 élèves de première année du secondaire ont pris part à cette expérience. Ils ont été répartis aléatoirement en deux groupes : 657 élèves en binômes utilisant le chatbot et 671 élèves suivant l’enseignement traditionnel. Chaque binôme disposait d’un ordinateur et d’instructions et consignes précises pour interagir avec l’IA, sous la supervision légère d’enseignants formés trois jours auparavant. Douze séances de 90 minutes ont eu lieu après les cours.

L’enjeu du tutorat individuel efficace

Dans les années 1980, les recherches de Benjamin Bloom ont révélé que le tutorat individuel pouvait entraîner une amélioration des apprentissages équivalente à deux écarts-types, un phénomène connu sous le nom de « problème du two-sigma ».

Cependant, mettre en œuvre un tel accompagnement à grande échelle est complexe sur le plan logistique et financier, surtout dans les contextes où le personnel enseignant est déjà surchargé ou sous-qualifié.

L’équipe de recherche de cette étude a donc formulé deux hypothèses principales :

  • Efficacité pédagogique : l’accompagnement par un « tuteur IA » entraînerait une amélioration significative des compétences des élèves dans trois domaines clés, soit la langue anglaise (l’objectif principal du projet pilote), les connaissances en intelligence artificielle et les compétences numériques.
  • Rentabilité et évolutivité : le coût par élève resterait suffisamment faible pour envisager un déploiement à grande échelle de cette solution, en particulier dans des contextes où le coût d’un tutorat humain est prohibitif.

Principaux résultats

Après six semaines de cours entre juin et juillet 2024, les élèves ont passé un examen écrit pour évaluer leurs compétences dans les trois domaines clés. Les résultats ont révélé que ceux qui avaient été tirés au sort pour participer au programme se sont nettement distingués de ceux qui n’y participaient pas, avec des progrès remarquables dans l’apprentissage de l’anglais, l’objectif principal du programme.

Ces résultats démontrent que l’IA générative peut fonctionner efficacement en tant que tuteur virtuel lorsqu’elle est mise en œuvre de manière réfléchie avec l’aide d’une personne enseignante. En effet, en six semaines, les élèves ont progressé d’un écart-type de +0,31, ce qui équivaut à ce que l’on attend d’un tutorat individuel traditionnel.

Il faut également noter que les avantages du programme ont dépassé les limites du programme lui-même. En effet, les élèves ayant participé au programme ont aussi eu de meilleurs résultats aux examens de fin d’année.

Les résultats montrent un impact plus marqué sur les filles et les élèves à haut potentiel, ce qui suggère que l’outil pourrait contribuer à réduire certaines inégalités, à condition d’assurer une formation adéquate du personnel enseignant encadrant et de renforcer les infrastructures numériques.

  • Genre : les filles enregistrent un gain supplémentaire de +0,42 écart-type par rapport aux garçons, ce qui suggère que l’accompagnement par l’IA pourrait contribuer à réduire les écarts de genre souvent observés dans les disciplines scientifiques et linguistiques.
  • Niveau initial : les élèves les mieux préparés au départ ont connu une amélioration plus marquée, ce qui indique un effet de renforcement des acquis chez les élèves ayant un grand potentiel.
  • Statut socio-économique : L’effet est plus prononcé chez les élèves issu·e·s de milieux plus favorisés, sans toutefois disparaître pour les autres, ce qui témoigne d’un bénéfice universel, quoique différencié.

En termes de rapport coût-efficacité, l’intervention a coûté 31 669 $ pour 657 élèves, soit près de 48 $ par élève pour les six semaines. Ces chiffres parlent d’eux-mêmes : c’est un investissement limité qui a un impact maximal.

Cette expérience offre également plusieurs autres leçons.

Enjeux d’équité
Les résultats plus prononcés chez les filles suggèrent la mise en place de programmes ciblés pour favoriser la mixité et combattre les stéréotypes en STIM.

Complémentarité enseignant–IA
Le tuteur GPT-4 ne remplace pas l’enseignant ou l’enseignante ; il s’occupe des exercices répétitifs et fournit un retour d’information instantané, ce qui permet à l’enseignant ou à l’enseignante de se consacrer à la planification et à l’accompagnement personnalisé.

Qualité des prompts et formation du personnel enseignant
Des instructions claires, des scénarios bien conçus et une formation minimale des enseignantes et des enseignants sont essentiels pour éviter un usage passif. Le succès dépend autant de la technologie que de son encadrement humain.

Évolutivité et abordabilité
En s’appuyant sur une plateforme gratuite et des prompts ouverts, le coût additionnel reste faible. Il est alors possible d’envisager une adoption à grande échelle, sous réserve d’un accès fiable à l’électricité et à Internet.

En lisant le rapport complet, vous pourrez découvrir les détails méthodologiques, les analyses statistiques approfondies et les recommandations précises.

Bibliographie

De Simone, M., Tiberti, F., Barron Rodriguez, M., Manolio, F., Mosuro, W., & Dikoru, E. J. (2025, mai). From Chalkboards to Chatbots: Evaluating the Impact of Generative AI on Learning Outcomes in Nigeria (Policy Research Working Paper No. 11125). World Bank https://documents1.worldbank.org/curated/en/099548105192529324/pdf/IDU-c09f40d8-9ff8-42dc-b315-591157499be7.pdf

Sujets similaires