Paradoxe de Newcomb, rationalité et normes sociales

Cette note est une réflexion inspirée par l'excellente vidéo de Mr Phi qui présente le paradoxe de Newcomb, la bonne manière de le poser sans se perdre dans de faux débats et les diverses ramifications du problème vis-à-vis de la rationalité. Je lui suis largement redevable des réflexions qui suivent. Je vous laisse visionner la vidéo pour bien les comprendre.

Il me semble que le paradoxe de Newcomb peut-être présenté de la manière suivante : il s'agit d'une expérience de pensée décrivant une situation dans laquelle on récompense par un prix les personnes qu'on prédit agir de manière irrationnelle. Ce cas pose le problème suivant : puisqu'il est rationnel de maximiser nos récompenses, il semble rationnel d'être irrationnel, ce qui est contradictoire. Ceci est expliqué brillamment dans la vidéo, notamment avec le personnage surnommé Alfred qui est capable d'agir de manière irrationnelle en suivant des règles quelles que soient ses préférences en situation. Ainsi, être ce que Mr Phi appelle un buveur, c'est agir de manière irrationnelle, puisqu'il n'y a aucune raison de boire le poison si les jeux sont faits. Mais être un ouvreur de malette, c'est aussi être irrationnel, puisque les ouvreurs ne gagnent presque jamais les récompenses.

Une première étape pour dissoudre le paradoxe ainsi posé est de remarquer que dans la situation de Newcomb, il n'est pas strictement rationnel d'être irrationnel. Ce qui est rationnel, c'est de paraître irrationnel à la machine. La résolution optimale de la situation est celle dans laquelle on peut tromper la machine : se présenter comme un buveur, mais finalement agir comme un ouvreur. Alors on remporte le lot sans avoir à boire le poison. Le problème est que ceci est, par stipulation, exclu : se présenter comme buveur implique causalement de l'être réellement avec une grande probabilité (c'est une hypothèse sur la fiabilité de la machine prédictive qui est en jeu ici). Reste que ce qui est rationnel est bien de se présenter comme buveur, et non de finalement s'avérer l'être, puisque c'est bien ce qui cause le gain. Le fait de finalement boire le poison est seulement une conséquence causale (par stipulation) du fait de se présenter comme buveur devant la machine.

Il faut donc distinguer dans l'expérience deux types de décisions. Une décision du premier type consiste à choisir le type de personne que l'on est, c'est-à-dire à s'appliquer des normes de comportement (être un buveur) qui contraindront notre comportement futur. Une décision du second type consiste à appliquer au mieux ces règles dans l'action, sans les enfreindre (boire le poison), en fonction des données du contexte et de nos buts particuliers. Puisque la prédiction est faite en amont de l'action, on suppose que la machine sera capable de détecter le type de personne que l'on est, et en inférera si oui ou non on boira le poison. La question que pose le paradoxe est donc : quel type de personne doit-on être dans l'expérience de Newcomb ?

Rationalisme fort

Vu de cette manière, je pense que le paradoxe de Newcomb est un défi pour une certaine idée forte de la rationalité.

Ce que j'appelle le rationalisme fort est l'idée que le "type de personne que l'on doit être" est une personne agissant en toute circonstance suivant un calcul rationnel. Les seules normes de comportement que l'on devrait idéalement adopter en toute circonstance sont celles de la logique et des probabilités, ou du moins des règles de rationalité abstraites, indépendantes de tout contexte, y compris socio-culturel (celui-ci jouant seulement le rôle de donnée pour les calculs rationnels). Suivant le rationalisme fort, le premier type de décision décrit plus haut n'existe pas réellement ou ne devraient pas idéalement exister. Jamais on ne devrait "décider quel type de personne être", jamais on ne devrait décider d'adopter une norme de comportement qui contraindra nos décisions futurs, une norme sociale par exemple, puisque les normes à adopter sont celles de la rationalité uniquement. On ne devrait jamais conditionner son comportement futur, puisqu'on disposera de plus d'informations dans le futur. Si l'on sert la main pour dire bonjour (norme sociale, du moins hors pandémie), ce serait parce qu'il est rationnel d'agir ainsi sur le moment, compte tenu du contexte social (par exemple on le ferait pour paraître normal aux yeux des autres), et non parce qu'on a décidé d'adopter cette norme de comportement au préalable et qu'on l'applique désormais sans réfléchir.

On peut attendre d'une théorie normative de la rationalité qu'elle implique une thèse descriptive : que nous soyons au moins en approximation des êtres rationnels (même si ce lien n'est pas forcément systématique). Cependant le rationalisme fort, dans sa version descriptive, me semble très peu plausible. Il s'apparente à une forme de réductionnisme explicatif : il faudrait expliquer l'adhésion apparente à des normes de comportement en termes de calculs rationnels effectués au cas par cas avant chaque action particulière. Il s'agirait de penser que l'on dispose d'un contrôle quasi absolu sur chaque décision ou chaque action.

Je ne suis pas convaincu qu'un calcul d'intérêt soit effectué chaque fois qu'on sert la main à une personne, pas même inconsciemment. Il s'agit surtout d'une habitude acquise. Il me semble que nos actions sont dirigées en partie par des calculs d'intérêt, mais aussi en partie par des habitudes ancrées, et ces habitudes peuvent avoir été acquises par l'influence de notre environnement social, mais aussi par une forme de discipline. Adopter une discipline, c'est choisir, volontairement, d'intégrer par l'habitude des normes de comportement. Donc les décisions du premier type existent bien, et certaines de nos actions ne suivent pas directement un pur calcul de rationalité, mais sont contraintes par des décisions préalables induisant des habitudes ancrées. Ces habitudes constituent un cadre au sein duquel on peut agir suivant nos préférences. Il ne s'agit pas d'affirmer que les règles de comportement ou habitudes que l'on adopte sont infaillibles ou impossibles à réviser, mais seulement qu'elles peuvent agir sans être systématiquement évaluées en situation.

Un rationalisme descriptif modéré serait l'idée que les décisions du premier type (les décisions à être tel type de personne, à adopter des normes, à s'ancrer dans des habitudes, à développer ses vertus : notez comme le rationalisme modéré s'accorde parfaitement avec l'éthique des vertus ou avec l'utilitarisme de la règle) suivent elle-même des meta-normes de rationalité, au moins en partie, et contraignent ensuite les décisions du second type (agir au mieux dans le respect de ces normes). Je pense que c'est une position raisonnable.

Si le rationalisme fort est faux au sens descriptif, alors il n'est pas exclu que nous soyons des buveurs, ou que quelques-uns d'entre nous le soient. Il suffit que certains d'entre nous décident d'adopter la règle de comportement "boire le poison". Cependant si la question est seulement : comment les gens agiraient (ou comment TU agirais) dans cette situation, alors la situation n'a plus rien de paradoxal : c'est un simple fait que j'agirais ainsi, et la question "que ferais-tu" est purement d'ordre empirique. Les ouvreurs et les buveurs ne font que conjecturer sur les résultats d'une expérience hypothétique.

Le versant normatif du problème, qui se demande comment ce fait est lié à la rationalité, est beaucoup plus intéressant. La question est alors : est-il rationnel d'être un buveur ou un ouvreur ?

Rationalisme fort, version normative

Si le paradoxe de Newcomb constitue un défi pour une certaine vision de la rationalité, c'est bien sur le plan normatif.

Sur la plan normatif, le rationalisme fort est la thèse suivant laquelle il faudrait idéalement n'adopter que des normes de rationalité. Idéalement, on devrait toujours faire des calculs de préférence en toute circonstance. Ceci implique d'être un ouvreur : une fois en situation, il n'y aura aucune raison de boire le poison.

Exprimé ainsi, le paradoxe de Newcomb apparaît n'être rien d'autre qu'une réduction par l'absurde du rationalisme fort, car si le rationalisme fort était juste, il ne faudrait pas maximiser ses gains dans l'expérience de Newcomb. Il faudrait donc être irrationnel. Ceci mine la seule justification possible du rationalisme fort en l'amenant à une contradiction (il faudrait être irrationnel parce que c'est rationnel).

Cependant la situation n'est pas paradoxale pour un rationalisme modéré. Celui-ci pourrait s'exprimer ainsi : lors des décisions du premier type (les décisions à être tel type de personne, à adopter des normes), les normes de rationalité devraient prévaloir sur les autres normes, ou encore contraindre ces normes. Lors des décisions du second type, ce n'est pas le cas : l'action doit suivre, en général, les normes de comportement que l'on s'est fixées par avance. L'évaluation des préférences en situation doit intervenir sous la contrainte de ces normes que l'on a adoptées au préalable. Le rationalisme modéré est, disons, un rationalisme de la norme.

Cette version de rationalisme n'est pas sujette au paradoxe de Newcomb. Il faut maximiser ses gains, et donc conditionner son comportement futur. L'action de boire ne peut pas être jugée irrationnelle parce qu'elle ne résulte pas d'une véritable décision, mais suit une norme qui a été évaluée rationnellement au préalable.

Cette cohérence est un avantage pour le rationalisme modéré, et le fait qu'il n'exclue pas que nous soyons tous approximativement rationnel en est un autre, mais on pourrait vouloir justifier ce "rationalisme de la norme" de manière plus positive : pourquoi faut-il qu'il en soit ainsi ? Une réponse complète devrait nous dire pourquoi il est plus rationnel d'adopter des règles d'action plutôt que de se fier uniquement aux règles de la logique et des probabilités en toute circonstance. Une réponse pragmatique est que c'est plus efficace cognitivement parlant, puisque cela nous évite d'avoir à faire de nouveaux calculs rationnels au moment de l'action. Le "il faut" du rationaliste modéré serait un "il faut" pratique. Mais cette réponse pourra paraître insatisfaisante. En effet, le paradoxe de Newcomb n'implique aucune limitation cognitive, et pourtant, il semble avantageux d'être un rationaliste modéré pour le résoudre. Il semble donc y avoir une raison plus profonde pour adopter cette position.

Rationalisme modéré et normes sociales

Il me semble que l'on ne peut faire l'économie d'une compréhension de notre nature d'êtres sociaux pour apporter une justification plus complète au rationalisme modéré.

Ce qui caractérise l'expérience de Newcomb est le fait que les normes de comportement que l'on choisit d'adopter sont en partie visibles ou au moins prévisibles par la machine. Si ce n'était pas le cas, la machine ne pourrait rien prédire puisqu'elles ne pourrait connaître ce qui détermine nos actions.

Cette visibilité des normes que l'on adopte est cruciale. Elle implique qu'adopter une norme de comportement est un acte de positionnement social, un acte de communication indirecte sur ce que nous sommes. Les autres peuvent connaître nos normes et engagements directement quand nous les exprimons, et aussi indirectement, notamment en observant toutes les fois où l'on agit sans suivre un simple calcul rationnel, en inhibant ainsi dans l'action les normes de rationalité au profit de normes de comportement. Ce sont des indicateurs visibles des normes ancrées en nous. Le fait de ramasser les papiers qui tombent de sa poche pour les jeter à la poubelle même quand on ignore que l'on nous regarde, ou le fait de porter un masque dans la rue en période de pandémie même quand il n'y a personne autour, sont des indicateurs d'adoption de normes de comportement de notre part (ce peut aussi être un acte de communication quand on sais qu'on nous regarde, mais ceux qui ne le font que quand on les regarde peuvent être qualifiés d'hypocrites dans leurs engagements).

Il est parfaitement rationnel, en société, d'adopter des normes de comportement, puisque celles-ci sont potentiellement visibles, et donc susceptibles de modifier le comportement des autres. Pour que cette adoption de normes soit visible, il est nécessaire que certaines actions ne suivent pas un parfait calcul de rationalité. Il est donc rationnel, en société, de faire en sorte que nos actions ne suivent pas toujours le calcul rationnel, car de telles actions communiquent sur ce que nous sommes, elles permettent à long terme de propager des normes de comportement dans notre environnement social.

La principale justification du rationalisme modéré (ou rationalisme de la norme) est donc que nous sommes des êtres sociaux, et plus généralement, que les normes et habitudes de comportement que l'on adopte sont détectables par les autres membres de la société.

De même dans le cas du paradoxe de Newcomb tel que présenté par Mr Phi, il est rationnel d'adopter la norme de comportement "boire le poison" pour communiquer (à la machine) sur le fait que nous adhérons à cette norme et ainsi infléchir sa prédiction dans le bon sens. Il est donc rationnel de se conditionner à boire le poison.

Ouvreur ou buveur ?

Le rationalisme modéré semble à première vue favoriser une position de buveur. Cependant les choses sont plus compliquées, et dépendent en partie de la façon dont est posé le problème et en partie de questions empiriques, voire du contexte social.

Une première question empirique est : comment pourrait fonctionner une telle machine prédictive ? Par exemple est-il possible de détecter directement le fait que quelqu'un ait adopté intérieurement une règle de comportement, même si celle-ci n'a jamais été mise en œuvre ? C'est une question qui relève sans doute en partie de la neuropsychologie, et qui est liée à la question du réductionnisme (est-ce que nos dispositions mentales se réduisent à une configuration physique en principe détectable par une machine ?). Si c'est le cas, et à supposer que l'expérience soit réalisée de telle façon que la machine soit à même d'utiliser ce pouvoir de détection, si par exemple on dispose d'un temps pour s'auto-conditionner avant que la prédiction soit faite, alors il est rationnel d'adopter la règle de conduite "boire le poison" en se conditionnant soi-même. La machine saura qu'on a adopté cette règle, et prédira donc que l'on boira le poison, et l'on gagnera le prix.

Mais si l'adoption de règles d'action non mises en œuvre est en principe indétectable par la machine, ou non permise par le protocole ? Si par exemple la prédiction de la machine est faite avant qu'on soit informé de la situation, sur la base de notre comportement passé ? Nous n'avons jamais eu affaire à une expérience de Newcomb dans le passé, donc la prédiction de la machine doit se baser non pas sur des normes de comportement spécifiques à la situation, mais sur des dispositions plus générales ou encore, sur "quel type de personne nous sommes" indépendamment du fait que l'on soit confronté, ici et maintenant, à une situation de Newcomb.

Dans ce cadre, la question de savoir si la rationalité devrait nous mener à boire ou non le poison en situation reste ouverte. Mais il est important de noter les règles de comportement que la machine peut connaître et utiliser pour prédire notre comportement effectif ont une portée a priori générale : elles n'ont pas été adoptées pour gagner dans les situations type Newcomb, mais pour faire face à la vie. Notre décision est contrainte causalement par des ces règles de portée plus générale (par stipulation de la fiabilité de la machine). La question posée n'est donc plus "que faut-il faire dans une situation Newcomb ?" mais plutôt "quel type de personne faut-il être en général, et quelles implications cela a pour notre réaction dans une situation de type Newcomb ?" Il s'agit d'une façon différente de poser le problème.

Dans ce cadre, il n'est pas certain qu'être un buveur soit rationnel. En faveur de l'ouvreur aigri, on remarquera qu'il n'est pas rationnel, à titre général, de faite une action désagréable n'ayant aucun effet causal sur le monde. Or dans une expérience de Newcomb isolée, le fait de boire le poison n'a aucun effet causal sur le monde (notamment si personne ne saura jamais si j'ai bu le poison). La disposition à agir même quand notre action n'a aucun effet causal pourrait sembler relever de la pensée magique. Dans le cas de Newcomb, il s'agirait d'attribuer un pouvoir rétrocausal au fait de boire, ce qui est irrationnel. Un être rationnel aura donc tendance à ne pas boire.

Le paradoxe de Newcomb est résolu, puisque la rationalité dont il est question est générale, elle concerne la meilleure façon de faire face à la vie en général, et la conséquence malheureuse de perdre de l'argent si l'on se retrouvait dans une situation de Newcomb n'est pas bien grave en comparaison aux gains qu'il y a à être rationnel en général (cela tient au fait que la question ait été reformulée).

Cependant les choses seraient plus complexes si les expériences de Newcomb étaient monnaie courante dans le monde et les résultats souvent publics (une expérience de Newcomb répétée). Alors le fait de se forcer à boire a bien un effet causal sur les expériences à venir, et dans un tel contexte, il pourrait être rationnel d'être un buveur. Ou encore, le fait de se forcer à avoir un comportement sans effet causal direct dans les situations de type Newcomb serait rationnel, puisque ça aurait souvent un effet causal indirect sur les expériences du futur en influant les prédictions. Ceci pourrait justifier d'être un buveur. Disons qu'il pourrait être rationnel, pour la vie en générale, d'être le type de personne qui boit du poison dans les expériences de Newcomb.

La solution à apporter au paradoxe de Newcomb tient alors à une seconde question empirique : les situations de type Newcomb sont-elles monnaie courante ? Si elles le sont, alors il peut être rationnel d'être buveur, et sinon, il est rationnel d'être ouvreur.

Newcomb dans la vraie vie

Je pense que les situations assez proches de celle de Newcomb sont en fait assez fréquentes. Prenez le cas extrême où la malette est transparente : le sujet sait déjà s'il y a ou non de l'argent dans la malette et doit ou non boire le poison. C'est le type de situation dans lequel nos intuitions vont le plus dans le sens "ouvreur". Il semble ridicule de boire le poison juste pour donner raison à la prédiction si l'argent est déjà là. Cependant remplacez la machine par un être humain suffisamment intelligent pour évaluer quel type de personne vous êtes. Remplacez le poison par le fait d'effectuer une tâche ingrate pour cette personne, et ajoutez qu'elle vérifira ce que vous avez fait. Nous avons simplement une situation dans laquelle quelqu'un vous paie par avance pour effectuer une tâche, et vous fait confiance sur la base de son jugement de qui vous êtes pour l'effectuer. C'est une situation extrêmement courante. Il est en général rationnel d'effectuer la tâche afin de s'assurer un statut social de personne de confiance, non seulement auprès de cette personne mais aussi des autres. De ce fait, nous avons une disposition sociale naturelle (et rationnelle) à agir comme des gens dignes de confiance, et donc, peut-être, à boire le poison.

On pourra arguer que ce type de situation est trop différent de l'expérience pour tirer de telles conclusions. La solution du paradoxe de Newcomb dépend en fait de la proximité entre ces situations courantes et les données de l'expérience. Est-ce que le fait que l'action de prendre le poison n'aura aucune conséquence (personne ne le saura jamais) joue un rôle quant à la décision à prendre ? Ou le fait que ce soit une machine qui fasse la prédiction ? En somme, quelles sont les implications des "meilleures" méta-normes pour vivre en société dans le cas particulier d'une expérience de Newcomb : s'appliquent-elles ou non, et de quelle manière ?

On pourrait se demander, à ce titre, ce qu'on penserait d'une situation où quelqu'un proposerait par hasard à une autre personne de l'argent par avance pour effectuer une tâche absurde, sur la seule base de la confiance qu'elle lui accorde (il la connait et sait qu'elle le fera même si c'est absurde et qu'il n'aura aucun moyen de vérifier). Est-il irrationnel d'être ce type de personne, effectuant des tâches absurdes tant qu'on est payé pour, ou s'agit-il d'une vertu sociale ? La réponse dépendra peut-être de notre contexte social. Peut-être que ce type de docilité un peu absurde est souhaitable dans certains environnements (militaire par exemple ?). Peut-être au contraire que le fait que la personne mettant en œuvre l'expérience est elle-même irrationnelle (elle propose de l'argent sans contrepartie, sans même vérifier) condamnerait moralement les buveurs et les gens trop dociles : ils abuseraient de l'irrationalité d'autrui pour leur profit personnel. Mais peut-être pas si les personnes irrationnelles sont souvent extrêmement riches et ont acquis leur argent en abusant des autres. À moins qu'ils ne s'agisse de villains entretenant le projet maléfique de financer l'irrationalité ?

On arrive ainsi, dans cette branche du problème, à l'idée qu'il n'y a pas d'unique réponse au problème : tout dépend de la manière dont l'expérience de Newcomb s'insère dans notre monde social, et du type de comportement qui est souhaitable dans cet environnement social. Peut-être existe-t-il des environnements sociaux pro-buveurs et d'autres pro-ouvreurs.

Conclusion

On peut dire, en conclusion, que si l'on adopte un rationalisme modéré, la réponse au problème de Newcomb dépend de la façon dont il est posé. Il dépend notamment de la façon dont la machine fait ses prédictions (peut-elle détecter une adhésion interne à une norme de comportement ?), de la façon dont est mise en œuvre l'expérience (a-t-on un temps pour s'auto-conditionner avant que la machine nous évalue pour faire sa prédiction ?) et de l'insertion sociale de l'expérience elle-même (Un type de comportement est-il socialement valorisé ? Qui réalise l'expérience et pourquoi ?).

On peut résumer ma solution au problème à l'aide de l'arbre de décision suivant :

La machine peut-elle détecter directement le fait que l'on adopte une norme de comportement, et a-t-on droit à un temps d'auto-conditionnement psychologique en amont de la prédiction ?
- Si oui, il faut être buveur.
- Si non, la question concerne non pas ce qu'il faut faire dans les situations Newcomb, mais les implications, dans ces situations, de normes de comportement plus générales. Elle dépend donc a priori du contexte social.
  - les expériences de type Newcomb répétées sont-elles monnaie courante dans notre environnement social ?
    - Si non, il faut sans doute être "ouvreur aigri" (pour notre bien être général).
    - Si oui... Comment s'insèrent ces expériences publiques et répétées dans notre environnement social ? Il faut être un ouvreur ou un buveur suivant ce qui est socialement valorisé.

Rechercher dans ce blog

Un grain de sable