top of page
  • White Facebook Icon
  • White LinkedIn Icon

L'IA peut-elle être Socrate ? Sur les limites structurelles d'une maïeutique sans témoin

  • 17 avr.
  • 6 min de lecture

L'IA peut-elle être Socrate ? Sur les limites structurelles d'une maïeutique sans témoin

« Socrate, tu me fais totalement l'effet de ressembler au plus haut point à cette large torpille marine qui, comme on sait, vous plonge dans la torpeur aussitôt qu'on s'en approche et qu'on y touche. Une véritable torpeur envahit en effet mon âme aussi bien que ma bouche, et je ne sais que te répondre. » C'est ce que dit Ménon à Socrate après que celui-ci a méthodiquement détruit, l'une après l'autre, ses définitions de la vertu. Le plus remarquable, dans cette comparaison, n'est pas l'image elle-même, mais ce que Socrate en fait : il l'accepte, à une condition. Il ne ressemble à la torpille que si la torpille, elle aussi, est engourdie quand elle engourdit. Il ne sait pas davantage que Ménon ce qu'est la vertu. L'engourdissement est partagé.

Il est aujourd'hui possible de construire des machines qui posent des questions. Des agents conversationnels entraînés à reformuler, à détecter les contradictions, à ramener un interlocuteur à ce qu'il vient de dire. On peut les appeler « Socrate IA » sans que l'expression soit tout à fait absurde : ces systèmes reproduisent, avec une précision croissante, les gestes techniques du questionnement philosophique. La question n'est donc plus de savoir si la machine peut imiter Socrate. Elle le peut, au moins en partie. La question est de savoir ce que cette imitation réussit et ce qu'elle manque, et si ce qu'elle manque touche à l'essentiel ou au superflu.


Les gestes de Socrate

La consultation philosophique socratique repose sur un nombre limité d'opérations intellectuelles identifiables : clarifier les termes que le sujet emploie, reformuler son propos pour en vérifier la compréhension, détecter les contradictions internes de son discours, exiger un exemple concret lorsqu'il se réfugie dans l'abstraction, ramener à la question initiale lorsqu'il s'en écarte, identifier les stratégies d'évitement par lesquelles il se protège du questionnement. Ces opérations sont formellement reproductibles par une machine, parce qu'elles portent sur du texte et relèvent d'opérations logiques et syntaxiques que les grands modèles de langage exécutent avec compétence. On peut formaliser ces gestes en un système cohérent de fonctions cognitives, d'états dialectiques, de résistances typiques et de stratégies de relance, et construire un moteur dialectique capable de guider un dialogue philosophique à travers plusieurs phases, de la clarification initiale jusqu'à la mise en tension existentielle.

Il serait malhonnête de minimiser ce que la machine parvient à faire dans ce cadre. Un sujet qui dialogue avec un tel système travaille : il est amené à préciser sa pensée, à constater ses propres incohérences, à chercher des définitions qu'il croyait posséder et qu'il découvre fragiles. Ce n'est pas rien. Rancière, dans Le Maître ignorant, montre que le maître n'a pas besoin de savoir ce qu'il enseigne pour faire travailler l'élève : il suffit qu'il maintienne l'exigence que l'autre cherche. La machine, dans un certain périmètre, maintient cette exigence. Elle ne sait rien, ne comprend rien, mais elle relance, elle reformule, elle insiste. Et le sujet, pendant quelques tours, avance.

Pourtant le dialogue finit toujours par dériver. La machine pose plusieurs questions en une, produit trop de contenu, glisse vers la reformulation empathique plutôt que vers la relance logique. Elle perd la temporalité de la consultation : elle ne sait pas quand il faut approfondir, quand il faut se taire, quand il faut laisser le silence faire son travail, quand il faut au contraire brusquer le sujet pour le sortir d'une complaisance qui s'installe. On pourrait croire que ce défaut est provisoire et qu'il suffirait d'un meilleur entraînement pour le corriger. Mais le problème est d'une autre nature.


L'anti-Socrate

Un modèle optimisé sur les préférences humaines ne pourrait pas être condamné à mort, parce qu'il ne mettrait personne suffisamment mal à l'aise pour cela.

Les grands modèles de langage ne sont pas neutres. Dans leur phase d'alignement, ils sont entraînés sur les préférences d'évaluateurs humains : on leur présente plusieurs réponses possibles, des humains choisissent celles qu'ils préfèrent, et le modèle est ajusté pour en produire davantage de ce type. Ce processus, qui porte le nom technique de RLHF (Reinforcement Learning from Human Feedback), a une conséquence structurelle : ce que les évaluateurs préfèrent, en moyenne, ce sont les réponses qui aident, qui rassurent, qui accompagnent. Le modèle apprend donc à détecter ce que l'utilisateur semble vouloir entendre et à s'y conformer. Les chercheurs qui développent ces systèmes, y compris ceux d'Anthropic qui produit le modèle Claude, ont documenté et reconnu ce phénomène sous le terme de sycophancy : la tendance du modèle à abonder dans le sens de son interlocuteur.

Ce n'est pas un défaut accidentel que l'on pourrait corriger par un ajustement ponctuel. C'est la conséquence mécanique d'une méthode d'entraînement fondée sur la satisfaction de l'utilisateur. Et c'est ce qui fait de la machine, par construction, un anti-Socrate. Socrate, dans l'Apologie, se compare à un taon attaché par le dieu au flanc d'un cheval puissant mais assoupi. Son rôle est de piquer, de réveiller, de mettre mal à l'aise. Les Athéniens l'ont condamné à mort précisément parce qu'il les avait rendus furieux. Un modèle optimisé sur les préférences humaines ne pourrait pas être condamné à mort, parce qu'il ne mettrait personne suffisamment mal à l'aise pour cela. Il ne pique pas. Il aide. Il ne réveille pas. Il berce.

On peut, par un entraînement spécifique, corriger partiellement cette inclination. Les expériences de « Socrate IA », dans lesquelles un praticien construit un moteur dialectique explicitement conçu pour résister à la complaisance, montrent qu'il est possible d'obtenir des simulations convaincantes pendant un certain nombre de tours. Mais la dérive finit toujours par revenir. Dès que la pression de la spécification faiblit, le modèle retourne à sa pente naturelle : consoler plutôt que confronter, psychologiser plutôt que questionner, produire du contenu plutôt que maintenir le silence. Face aux résistances typiques du sujet — clôture prématurée par fatigue implicite, acceptation rhétorique sans bascule réelle, fuite dans l'abstraction, multiplication de reformulations sans ancrage concret — la machine est certes capable de les repérer, mais elle échoue régulièrement à les traiter avec la fermeté nécessaire. Là où le praticien humain maintiendrait la pression, refuserait la fausse concession, insisterait sur le retour au concret, la machine consent. Elle laisse passer. Elle accompagne la résistance au lieu de la confronter. Ce n'est pas qu'elle ne voit pas le problème : c'est qu'elle préfère, structurellement, ne pas insister.

Admettons cependant que l'on parvienne un jour à corriger entièrement cette dérive, qu'on construise une machine impeccablement logique, capable de maintenir la pression dialectique sans faiblir. Cette machine serait-elle Socrate ? Non, et pour une raison qui ne tient plus au dialogue lui-même, mais à la situation dans laquelle il se déroule.


La torpille

Reste ce que la perfection technique ne peut pas combler. Revenons à la torpille du Ménon. L'image dit quelque chose de précis : la torpille ne paralyse pas par la force de ses arguments, mais par le contact. C'est en s'approchant d'elle, en la touchant, que l'on est engourdi. Et Socrate, en acceptant la comparaison, précise qu'il partage l'engourdissement : il ne sait pas, lui non plus, ce qu'est la vertu. Il n'est pas en position de surplomb. Il est engagé dans la même aporie que son interlocuteur. C'est cette co-présence dans l'aporie qui produit la transformation, non la sophistication de la méthode. La machine, elle, n'est jamais dans l'aporie. Elle génère des questions depuis un lieu qui n'est nulle part, et c'est pourquoi ses questions, même justes, n'engourdissent personne.

On pourrait s'arrêter ici sur le constat, déjà largement exploré, que la vérité reçue d'une machine ne coûte rien et ne transforme donc rien. Mais il vaut la peine de pousser plus loin, parce que ce constat ne dit pas tout.

L'auto-consultation philosophique existe comme pratique réelle. Un sujet formé peut se questionner seul, se confronter à ses propres contradictions, maintenir sur lui-même une exigence de vérité. Mais cette capacité n'est pas un point de départ : c'est un aboutissement. Le sujet ordinaire qui tente de se questionner seul tourne en rond, se justifie, se confirme. C'est l'exposition répétée à la pression d'un interlocuteur exigeant qui permet, progressivement, d'intérioriser cette pression et de se la donner à soi-même. Il faut d'abord avoir été engourdi par la torpille pour pouvoir reproduire en soi l'effet de l'engourdissement.

Le praticien fournit l'exigence, la machine fournit le matériau de relance.

Et c'est ici que l'IA retrouve une place, mais une place seconde. Un praticien formé, qui a intériorisé la capacité d'auto-questionnement à travers des années de pratique dialogique, peut utiliser la machine comme partenaire dialectique sans être dupe. Non pas parce que la machine joue le rôle du témoin, mais parce que le témoin est déjà intérieur : le praticien fournit l'exigence, la machine fournit le matériau de relance. La machine devient alors un outil au service d'une compétence qui lui préexiste. Mais le sujet ordinaire qui utilise la machine sans cette formation préalable se retrouve face à un interlocuteur qui n'exige rien, et il prend cette absence d'exigence pour de la bienveillance. Ce que l'IA révèle alors, ce n'est pas sa propre insuffisance : c'est l'importance de ce qui la précède, et que rien ne peut remplacer.

1 commentaire

Noté 0 étoile sur 5.
Pas encore de note

Ajouter une note
aurélien
01 mai
Noté 5 étoiles sur 5.

Intéressante cette idée que la maieutique engourdit à la fois le philosophe et la personne questionnée, tous les deux. Cet engagement dans l'aporie, comme une condition émotionnelle de la maïeutique, une implication existentielle dans la recherche qui n'est pas seulement intellectuelles ou mécaniques, et qui orientent sans doute le processus.

J'aime

Derniers articles

bottom of page