LLM contre dualisme

Dans cette vidéo très pédagogique, Monsieur Phi offre un argumentaire fort à l'encontre du dualisme interactionniste, qu'on pourrait reconstruire comme suit :

  1. Selon le dualisme interactionniste (DI), les manifestations externes de notre vie mentale (notre comportement etc.) sont au moins en partie les effets de quelque chose qui n'est pas materiel (une "âme").
  2. Pour prouver l'existence d'une cause supposée à un effet, il faut pouvoir exclure les autres explications causales possibles.
  3. Donc pour prouver DI, il faut exclure l'idée que les manifestations caractéristiques de notre vie mentale seraient exclusivement l'effet d'un mécanisme physique (1+2).
  4. La principale manifestation caractéristique de notre vie mentale, en tout cas la plus potentiellement inexplicable par un mécanisme physique, c'est une production linguistique cohérente et sensée (parce qu'on peut avoir l'idée que le langage reflète ou exprime assez directement la pensée consciente). C'est ce qu' affirme en particulier Descartes.
  5. Donc pour prouver DI, il faudrait pouvoir exclure en particulier la possibilité d'expliquer notre production linguistique cohérente et sensée par un mécanisme physique suffisant (3+4).
  6. Or le fait qu'on puisse imiter fidèlement nos capacités linguistiques par un mécanisme physique (les IAs de type LLMs) ayant par ailleurs des similarités structurelles avec la configuration du cerveau humain (réseau de neurones) rend possible, voire même assez plausible, l'idée que ces capacités soient en intégralité le produit d'un mécanisme physique de même type dans le cerveau, et non d'une âme.
  7. Donc on ne dispose d'aucun élément empirique pour prouver DI. Au contraire : on a une bonne explication alternative, assez plausible, tandis que DI au fond n'explique pas grand chose (5+6).
  8. Une thèse qui ne dispose d'aucun élément empirique en sa faveur devrait être rejetée en faveur de thèses alternatives qui ont des éléments empiriques en leur faveur.
  9. On peut donc rejeter DI au profit du physicalisme : nous sommes des machines ; notre comportement, y compris verbal, est le produit d'un mécanisme physique (7+8).

On pourrait ajouter à cet argument une forme de "méta-induction", qu'on voit à l'œuvre au début de la vidéo. En effet un argument très semblable à celui qu'on vient d'exposer pourrait être utilisé pour rejeter l'existence d'un "élan vital". On peut transposer directement les étapes de l'argument et remplacer l'étape 6 par des preuves directes en faveur de l'existence de mécanismes biologiques expliquant la complexité du vivant : on a en fait établit au-delà de tout doute raisonnable une explication alternative à l'élan vital dans le cas du vivant. Et si la vie (et plein d'autres choses) sont aujourd'hui explicables sans avoir recours à des "forces occultes" non physiques, pourquoi n'en irait-il pas de même à l'avenir du comportement humain ? C'est une motivation très classique pour le physicalisme, mais elle est indépendante des LLMs, qui ne font finalement qu'augmenter la plausibilité qu'une telle explication verra le jour suivant l'argument présenté plus haut.

En effet, à l'inverse du cas de la biologie, il faut noter qu'avec l'étape 6, on ne s'appuie pas sur des preuves directes que notre production linguistique est entièrement le fruit de mécanismes précis. Ici il s'agit plutôt de ce que les philosophes des sciences appellent "if possibly explanation". C'est le genre d'inférence qui est en jeu par exemple dans le modèle de Schelling, un modèle représentant une ville par un échiquier dont les pièces noires et blanches "déménagent" d'un endroit à un autre suivant certaines règles. Le but du modèle est de mettre en évidence un mécanisme plausible pour la ségrégation : même quand les pions de l'échiquier "tolérent la diversité" jusqu'à un certain niveau, on finit par voir apparaître des zones exclusivement blanches et noires après un certain nombre de mouvements. Le modèle n'a pas besoin d'être réaliste pour convaincre. Même s'il a certaines similarités structurelles avec les villes réelles (les gens déménagent d'un quartier à l'autre en fonction de préférences), ce n'est pas le modèle d'une ville réelle (aucune ville n'a la forme d'un échiquier). Le modèle ne fait qu'illustrer un mécanisme potentiel reproduisant certains effets émergents, en l'occurrence la ségrégation, mais, c'est important, du fait qu'il ne soit pas réaliste, il ne prouve aucunement que c'est la seule explication réelle ou le seul mécanisme en jeu dans la réalité : il reste possible que d'autres facteurs expliquent la ségrégation des villes réelles. En particulier, il est possible qu'une forme de discrimination plus directe de la part de certains acteurs soit un facteur important et que ce facteur soit inextricablement entremêlé avec l'explication offerte par le modèle de Schelling dans les cas réels.

On pourrait dire la même chose dans le cas des LLMs et de nos productions linguistiques. En effet, à l'instar du modèle de Schelling, les LLMs ne sont pas des modèles du cerveau humains, même s'ils sont similaires sur certains aspects. Ils illustrent un type très general de mécanisme par lequel notre cerveau pourrait en principe produire du langage cohérent et sensé. Tout comme le modèle de Schelling, ils démontrent une possibilité, mais même si ce type de mécanisme a effectivement lieu, ça ne prouve pas que c'est le seul mécanisme en jeu : il se pourrait très bien qu'un autre facteur soit impliqué dans le langage humain, peut-être de manière inextricablement entremêlée avec le type de mécanisme qu'illustre les LLMs.

En somme, l'argument contre DI n'est pas aussi fort que dans le cas des forces vitales, où des mécanismes alternatif suffisants ont été directement mis en évidence. Reste qu'avec les LLMs, faire appel à des "forces occultes" semble devenu assez inutile dans le cas du langage, et c'est bien ça que veut montrer l'argument reconstruit plus haut. Parce que dans le cas de la ségrégation, on a d'autres éléments plus directs qui pourraient nous laisser penser qu'une discrimination explicite par certains agents existe dans le monde. En effet ce type de phénomènes a d'autres effets que simplement provoquer une ségrégation géographique, on peut en observer diverses manifestations (par exemple sur l'emploi ou les violences). C'est pour ça que ça reste un facteur possible dans la ségrégation venant s'ajouter ou renforcer le mécanisme de Schelling. Mais dans le cas de l'âme et du langage, que nous reste-t-il ?

Peut-être qu'il nous reste quelquechose, et c'est là que se situe, je trouve, une faiblesse dans l'argumentation de la vidéo. La faiblesse est la suivante : la principale intuition qui motive les dualistes en général, ce n'est pas qu'il permettrait d'expliquer les comportements intelligents et le langage. La principale intuition, c'est plutôt que la physicalisme est incapable d'expliquer l'expérience consciente subjective, le "ce que cela fait" d'être conscient, de voir des couleurs, de sentir des odeurs, ou même pourquoi pas de penser et d'interagir avec avec les autres. C'est l'intuition qu'une description physique aussi complexe soit-elle ne pourra jamais rendre compte de ces aspects parce qu'il lui manque des ingrédients conceptuels : une description physique n'est que structure pour ainsi dire, tandis que l'expérience consciente est qualitative; dans une description physique, le tout n'est pas plus que les parties et toute identification d'un objet macroscopique est plus ou moins conventionnelle, tandis que l'expérience consciente est unitaire (quand bien même son contenu est composé de partie, elles se rapportent toutes à un seul sujet), etc. Ceci prend typiquement la forme d'arguments de type fossé explicatif dans la littérature philosophique.

Où cela nous mène-t-il donc ? Eh bien il semble qu'une production linguistique cohérente et sensée n'est pas la seule manifestation a expliquer. Une autre, et non des moindres, est l'expérience consciente. Et s'il s'avère que l'âme fournit une explication pour ça, elle devient ipso facto un facteur potentiel pour la production linguistique qui peut venir s'ajouter ou se combiner avec certains mécanismes physiques, puisqu'ona quand même de bonnes raisons de penser que ce qu'on dit est l'effet de notre expérience consciente. Elle "reste dans la place", pour ainsi dire, au moins tant que l'on n'a pas démontré de manière plus directe, comme dans le cas du vivant, que cette production linguistique cohérente est entièrement le fait de mécanismes physiques.

Bien sûr ce n'est qu'un pan du débat (on pourrait citer les arguments d'exclusion causal contre DI). Il existe une variété de positions philosophiques tentant de résoudre ces questions. Je ne me considère pas personnellement dualiste (je suis plus proche du monisme Russellien). Mais je pense que cette notion de fossé explicatif est essentielle si l'on veut rendre compte charitablement des intuitions que mettent en avant les "dualistes naifs" évoqués dans la vidéo (si tant est qu'ils soient réellement dualistes : un autre défaut de la vidéo est qu'il semble faire du fonctionnalisme la seule option possible pour un non-dualiste, et qu'il assimile donc le rejet de l'idée que nous sommes des machines au dualisme, sans autre possibilité). Cela rend compte notamment de ce qu'ils cherchent à dire quand ils parlent d'un "je ne sais quoi", qu'ils mentionnent Bergson (un philosophe souvent caricaturé que j'aprécie également pour ma part) ou quand ils appuient sur le fait qu'un LLM "ne fait que prédire le mot suivant" (c'est-à-dire, au fond, qu'il ne dispose apparement pas des ingrédients qui pourraient rendre compte de l'expérience consciente associée à la pensée humaine). Cela n'enlève rien à certaines critiques que leur adresse la vidéo, mais au moins on comprend mieux ce qu'ils cherchent à exprimer je pense : les dualistes naifs ne font pas que produire des arguments ad hoc pour protéger leur égo face à une réfutation empirique implacable. Leurs véritables motivations philosophiques sont ailleurs.

Pour finir, je voudrais mentionner le fait que demander à l'âme d'expliquer les capacités linguistiques est une exigence un peu étrange si l'on aborde les choses du point de vue de l'expérience subjective. Personnellement, quand j'exprime mes pensées, je n'ai pas du tout l'impression de faire une série de calculs pour juger si mes phrases sont grammaticales. Tout ça est plutôt automatique et inconscient. Sauf dans un cas: quand j'apprends une nouvelle langue que je maîtrise mal. Par ailleurs, je peux parfois parler de manière distraite, sans véritable contrôle de ce que je veux dire. C'est peut-être le cas quand je rêve que je parle. Donc en un sens il va de soi que les capacités dont font preuve les LLMs ne nécessitent pas vraiment la conscience pour être en place. S'il faut faire jouer un rôle causal à l'âme du dualiste, je trouve ça beaucoup plus intuitif de l'imaginer superviser ces processus pour les diriger vers un but (celui de choisir le prochain mot parmi les possibilités grammaticales et sensées qui s'offrent à nous, ce qui est fait aléatoirement dans le cas des LLMs). Au fond, le LLM pourrait être l'analogue non pas d'un cerveau éveillé contrôlant ce qu'il dit, mais plutôt celui d'un cerveau en train de rêver qu'il parle. Et si l'on pense ainsi, eh bien l'existence des LLMs, dont les capacités restent évidemment très impressionnantes, ne montre plus grand chose dans le débat métaphysique sur la nature de l'esprit.

Commentaires

Posts les plus consultés de ce blog

Réalisme moral

La neutralité des sciences est-elle un idéal de droite ? (Une défense de l'esprit du positivisme)