Dans la mire – ChatGPT expliqué par Stephen Wolfram
Que se cache-t-il vraiment sous le capot?
Sous des représentations anthropomorphiques, ChatGPT (Generative pre-trained transformer) est un agent conversationnel alimenté par l’IA [1]. Il génère des conversations écrites jusqu’à nourrir de longs échanges approfondis à l’image d’une personne empressée de nous plaire et de nous faciliter la vie.
Il joue le rôle d’un assistant virtuel (cousin plus évolué de Siri, Alexa et Google Assistant) en exploitant les Large Language Models (LLM). Ces modèles langagiers permettent de mieux générer des réponses, parfois très convaincantes, en utilisant un langage naturel semblable à celle de l’humain.
ChatGPT a été préentraîné sur de grandes quantités de données. Notez que l’outil effectue une analyse statistique des données créées par des humains pour l’entrainer et construire des énoncés textuels dont il ne comprend ni le sens et ni le contexte d’utilisation. À l’aide de filtres de politesse programmés, il terminera souvent vos conversations par un « De rien, je suis heureux d’avoir pu vous aider. N’hésitez pas à me poser d’autres questions si vous en avez besoin à l’avenir » créant ainsi une impression de camaraderie qu’il est parfois difficile d’ignorer et qui renforce inconsciemment l’illusion d’une personne humaine.
Toutefois au fil des interactions, tout comme le protagoniste en exile d’une aventure de science-fiction, nous venons tôt ou tard à réaliser que cette « personne artificielle » ne nous renvoie que le reflet numérique d’un échantillon circonscrit de données sans intentionnalité ou véritable compréhension du langage. Nous sommes encore loin de l’évènement de singularité.
[1] Agent conversationnel : Notez que « robot conversationnel » est aussi une désignation validée par des spécialistes canadiens de l’Université Concordia, de l’Université Dalhousie, de l’Université Laval et de Microsoft Canada. (https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=CHATBOT&codom2nd_wet=1#resultrecs)
Qui est Stephen Wolfram?
Stephen Wolfram est connu pour son travail dans la physique théorique, la science informatique, et la théorie des systèmes complexes, y compris de nombreux aspects de l’IA. En 1987, il a fondé la société Wolfram Research et a créé Mathematica, un logiciel de calcul symbolique utilisé dans les milieux universitaires et industriels pour de nombreuses tâches mathématiques et scientifiques.
Il a aussi créé Wolfram Alpha, un moteur de recherche basé sur l’IA capable de comprendre le langage naturel et de répondre à des questions complexes dans de nombreux domaines. En utilisant des techniques computationnelles décrites dans son livre “A New Kind of Science”, il a également développé une nouvelle approche pour comprendre et modéliser des systèmes complexes tels que le cerveau humain.
Que fait vraiment ChatGPT… et pourquoi ça marche?
« Le fait que ChatGPT puisse générer automatiquement quelque chose qui se lit, même superficiellement, comme un texte écrit par un humain est remarquable et inattendu.
Mais comment y parvient-il ? Et pourquoi cela fonctionne-t-il ? Mon objectif ici est de donner un aperçu de ce qui se passe à l’intérieur de ChatGPT, puis d’explorer les raisons pour lesquelles il réussit si bien à produire ce que nous pourrions considérer comme un texte significatif.
Je dois préciser d’emblée que je vais me concentrer sur la vue d’ensemble de ce qui se passe et que, même si je mentionnerai certains détails techniques, je ne m’y attarderai pas.
L’essentiel de ce que je vais dire s’applique tout aussi bien à d’autres “grands modèles de langage” [LLM] actuels qu’à ChatGPT. »
Stephen Wolfram, 14 février 2023
Ci-contre, son explication du 17 février 2023 en rediffusion sur Youtube.
Explications exhaustives à lire et consulter :
What Is ChatGPT Doing … and Why Does It Work? de Stephen Wolfram. Il y explique les dessous et le fonctionnement des plateformes de grands modèles de langage tel que ChatGPT d’Open AI.