Cela fait maintenant plus d’un an que je sillonne notre beau pays au gré de séminaires et de débats pour mettre en garde contre l’Intelligence Artificielle générative (IA-gén. dans la suite de ce billet). La dernière fois, c’était au Centre Régional des Métiers de l’Éducation et de la Formation (CRMEF) d’El Jadida. Avant cette belle journée dans la capitale des Doukkala, il y avait eu Rabat, Casablanca, Fès, Meknès, Marrakech…
Cependant, au cours des discussions qui suivaient ces causeries, on m’objectait souvent ceci: je n’avais aucune preuve de ce que j’avançais. Certes, je développais un argumentaire qui semblait solide et convaincant, mais ce n’était, après tout, qu’une théorie. Où étaient les confirmations expérimentales? Propagandiste zélé de la science, de l’esprit scientifique et des preuves, j’étais cruellement déficient sur ce point. Ils avaient raison, mes contradicteurs– et je restais coi, me grattant l’occiput.
Et puis, hier, divine surprise, je suis tombé sur un article scientifique qui vient de paraître (le 10 juin dernier) et qui confirme ce que je craignais (et dénonçais) instinctivement.
L’article s’intitule Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task, soit, en bon français: Votre cerveau sur ChatGPT: accumulation de dette cognitive lors de l’utilisation d’un assistant IA pour la rédaction d’un essai. Il est signé par plusieurs chercheurs: Nataliya Kosmyna, Eugene Hauptmann, Ye Tong Yuan, Jessica Situ, Xian-Hao Liao, Ashly Vivian Beresnitzky, Iris Braunstein et Pattie Maes.
De quoi s’agit-il?
L’étude explore les conséquences neuronales et comportementales de la rédaction d’essais (de dissertations) lorsqu’un étudiant– ou n’importe qui– se fait assister par IA-gén. (LLM par la suite).
Les participants à l’expérience ont été divisés en trois groupes: LLM, Moteur de recherche du genre Google et ‘Cerveau seul’ (sans outils). Les chercheurs ont utilisé l’électroencéphalographie (EEG) pour évaluer la charge cognitive pendant la rédaction de dissertations. Et voici le résultat: L’EEG a révélé des différences significatives dans la connectivité cérébrale. Les participants du groupe ‘Cerveau seul’ présentaient les réseaux les plus forts et les plus distribués; les utilisateurs de moteur de recherche ont montré un engagement modéré; les utilisateurs de LLM ont montré la connectivité la plus faible.
«On investit des centaines de milliards dans l’IA, on la proclame ‘cause nationale’, on se bouscule pour l’intégrer dans l’enseignement– mais a-t-on bien réfléchi aux conséquences de cette précipitation?»
— Fouad Laroui
Disons-le en termes plus simples: les étudiants qui avaient écrit leur essai sans aucun outil, juste avec le joli petit cerveau que leur a donné la Nature, utilisaient ledit cerveau de façon harmonieuse et complète: tous ses composants participaient à l’effort. Ceux qui avaient utilisé un moteur de recherche étaient moins performants de ce point de vue. Quant à ceux qui s’étaient appuyés sur l’IA générative, se contentant d’envoyer des prompts et de copier les réponses de la machine, leur cerveau fonctionnait non pas comme une armée en bon ordre de marche, mais comme un conglomérat informe de francs-tireurs isolés, dont certains s’étaient endormis dans l’herbe fraîche, d’autres avaient déserté et quelques-uns étaient allés conter fleurette à la fermière, là-bas, appuyés galamment sur une clôture blanche, ayant oublié que la bataille faisait rage dans leur dos.
Et ne venez pas me dire qu’il pourrait s’agir d’un hasard: dans tous les groupes, les NER, les schémas n-grammes et l’ontologie thématique ont montré une homogénéité intra-groupe. C’est donc bien l’IA-gén. qui a fait la différence. C’est bien elle qui a entraîné une diminution de l’activité cognitive de ses utilisateurs et une fragmentation du cerveau.
Comment ne pas extrapoler ces résultats? Comment ne pas faire l’hypothèse que les zones les moins stimulées du cerveau pourraient, à terme, s’atrophier? Le cerveau diminuerait de taille progressivement…. Or, le cerveau croît en taille sans interruption depuis les premiers humains jusqu’à nous. Toumaï, le premier bipède humain, avait un endocrâne d’environ 370 cm³; les australopithèques avaient un cerveau de 550 cm³; avec l’apparition du genre Homo sapiens, il y a environ 2,5 millions d’années, on passe à 650 cm³; nous en sommes aujourd’hui à 1200/1300 cm³. Avons-nous atteint l’apogée avec l’apparition de l’IA-gén.? Allons-nous évoluer en sens inverse et revenir un jour aux 370 cm³ de Toumaï? (Joli prénom, by the way. Il reviendra peut-être à la mode dans quelques milliers d’années. Quand un robot voudra baptiser son nouvel esclave humain, il le nommera ‘Toumaï’…)
Soit dit en passant, une des conclusions de l’article m’a fait rire. «Les participants au programme LLM ont eu du mal à citer correctement leurs propres travaux.» Bien sûr! Ce ne sont pas «leurs propres travaux», stupid.
En tant que professeur, et conformément à ce que je dis depuis plus d’un an et demi maintenant, ces résultats scientifiques m’inquiètent au plus haut point. Quelles seront les implications pédagogiques à long terme de la dépendance à IA-gén. que je vois se développer dans les lycées et les universités?
On investit des centaines de milliards dans l’IA, on la proclame ‘cause nationale’, on se bouscule pour l’intégrer dans l’enseignement– mais a-t-on bien réfléchi aux conséquences de cette précipitation? En tout cas, il me semble urgent d’approfondir la recherche sur le rôle de l’IA dans l’apprentissage.
Les Assises nationales de l’Intelligence artificielle se tiendront les premier et 2 juillet prochains à l’UM6P, sur le campus de Rabat. J’espère qu’on n’oubliera pas de m’inviter pour tempérer un peu le bel enthousiasme qui semble s’être emparé de tout le monde depuis l’apparition (néfaste) de ChatGPT un certain jour de novembre 2022…