mardi 19 février 2019

Pourquoi je ne suis pas bayésien

Je ne suis pas Bayésien. En tout cas pas au sens où la formule de Bayes serait applicable et devrait être appliquée de manière universelle pour évaluer ses croyances. Je pense que la formule de Bayes a un domaine d'application très limité.

Mes raisons sont assez simple. La formule de Bayes est la suivante : p(H/D)=p(D/H)•p(H)/p(D).

Il est éclairant d'analyser p(D) comme la somme des p(D/Hi)•p(Hi), ou les Hi sont toutes les hypothèses possibles, et s'excluent mutuellement. De cette manière on se retrouve avec les éléments suivants dans la formule de Bayes :

  • p(H/D) ce qu'on cherche à calculer, à savoir le degré de confirmation d'une hypothèse H étant donné une donnée D
  • des données pour faire ce calcul, à savoir
    • p(Hi) des probabilités a priori pour toutes les hypothèses possibles
    • p(D/Hi) les prédictions de D par toutes les hypothèses Hi possibles.

Il s'ensuit que le domaine d'application de la formule de Bayes est l'ensemble des contextes où l'on dispose d'un ensemble d'hypothèses pondérées a priori et s'excluant mutuellement, hypothèses qui permettent de prédire la probabilité de certaines observations. Or ces contextes sont très limités. C'est pourquoi je ne suis pas bayésien.

Le cas où ça marche (et c'est utile)

Les cas où la formule de Bayes est utilisable sont ceux où l'on peut considérer des hypothèses a priori équivalentes entre elles, ou objectivement pondérables sur la base de statistiques, prédictives et exhaustives. C'est le cas si l'on veut savoir si quelqu'un est malade sur la base d'un test par exemple, connaissant la prévalence de la maladie dans la population (ce qui permet la pondération objective d'hypothèses exhaustives) et l'efficacité du test (hypothèse prédictive). Mais ça suppose en général qu'on ait déjà accepté un arrière fond théorique, ici la prévalence de la maladie et l'efficacité du test. Peut-on utiliser la formule de Bayes pour évaluer cet arrière fond lui même ? Je vais me concentrer maintenant sur des cas d'hypothèses scientifiques.

Il est utile de distinguer les théories scientifiques des modèles. Pour s'en tenir à la physique, j'entends par théorie un cadre général, quelque chose comme la physique quantique ou la théorie de la relativité : un vocabulaire (électron, spin, masse), un formalisme mathématique et certaines lois et principes d'application. Je suppose que le vocabulaire est interprété empiriquement ("spin" est associé à certaines configurations expérimentales).

J'entends par modèle quelque chose comme le modèle de l'atome d'hydrogène en physique quantique, ou un modèle relativiste de l'univers en cosmologie : une structure mathématique construite à partir de la théorie (qui utilise son langage, son formalisme et ses lois), et qui représente quelque chose de particulier : un objet ou un type d'objet.

Si l'on adopte cette façon de voir les choses, plusieurs remarques s'ensuivent :

  • une théorie fonctionne un peu comme une collection de modèles possibles. Étant donné un objet donné, on peut envisager plusieurs modèles possibles (peut-être une infinité) permis par la théorie. Par exemple : la théorie de la relativité fournit un ensemble de modèles de l'univers possibles.
  • il semble censé de partir du principe que tous ces modèles se valent. C'est ce qu'on appelle parfois un principe d'indifférence. Ce principe est applicable au moins quand les modèles se ressemblent suffisamment pour qu'on puisse les situer dans un espace des modèles (par exemple ils diffèrent par la valeur d'un ou plusieurs paramètres).
  • un modèle particulier est en général prédictif. Par exemple, un modèle de l'atome d'hydrogène prédit que certaines fréquences lumineuses seront absorbées ou émises.

Autrement dit au sein d'une théorie, on dispose potentiellement de tous les éléments pour appliquer la formule de Bayes : des hypothèses pondérées et des prédictions probabilistes. J'ai pris des exemples issus de la physique mais j'imagine que ça peut être étendu par exemple à la biologie, si l'on se place dans un cadre où, par exemple, plusieurs modèles évolutionnistes prédisent différentes fréquences pour certains gènes.

Mais ceci ne fonctionne que pour autant qu'on parte du principe que notre théorie est la bonne. Le bayesianisme n'est pas pour l'instant une formule parfaitement générale du savoir, puisqu'il ne permet pas d'évaluer les théories elles-mêmes. Or c'est bien ce qu'on voudrait pour évaluer nos croyances général : ne pas avoir à accepter un cadre théorique au préalable.

Le cas où ça ne marche plus

Que se passe-t-il si l'on monte d'un niveau pour s'intéresser non plus aux modèles mais aux théories ? Jusqu'ici personne n'a jamais calculé le degré de confirmation de la théorie de la relativité, mais serait-ce faisable en principe ? Ici on rencontre les aspects suivants, bien connus des philosophes des sciences :

  • les observations sont chargées de théories, notamment parce que les théories sont utilisées pour fabriquer des instruments de mesure et interpréter leurs résultats. Par exemple, la masse newtonienne n'est pas la masse relativiste. Dans ce cadre, rien ne garanti que comparer des "p(D/Ti)" pour différentes Ti ait beaucoup de sens si la manière d'interpréter D dépend de Ti. Ceci dit on pourrait penser qu'il existe parfois des traductions possibles, un vocabulaire neutre permettant de comparer les théories entre elles, ou au moins leurs predictions dans les cas précis qui nous intéressent... Peut-être, mais
  • les théories ne font de prédictions que accompagnées d'hypothèses auxiliaires. On doit notamment faire des suppositions à propos de l'objet qu'on souhaite représenter dans la théorie pour pouvoir limiter les modèles possibles, et donc prédire : il s'agit de choisir comment modéliser tel ou tel phénomène dans la théorie. Mais la théorie à elle seule ne peut faire aucune prédiction quantifiée. Les p(D/T) n'existent simplement pas !
  • On pourrait assimiler p(D/T) à la somme des prédictions de D par des modèles quelconques de T en adoptant un principe d'indifférence sur les modèles possibles. Mais en général ce n'est pas ce qu'on veut faire : la théorie de la relativité n'est pas bien confirmée parceque la plupart des modèles possibles pour les phénomènes font de bonnes prédictions, elle est confirmée parce qu'un modèle en particulier, qu'on pense être le bon, fait de bonnes prédictions...
  • On pourrait assimiler p(D/T) à la prédiction du meilleur modèle de T. Mais à coup d'hypothèses ad-hoc on trouvera toujours des modèles qui prédisent ce qu'on veut. Il faut spécifier "meilleur" (le modèle doit être suffisamment simple ?) et on s'éloigne de la formule de Bayes.
  • incidemment, il est reconnu que différents critères pragmatiques entrent en jeu pour sélectionner les théories : la simplicité, la portée unificatrice, la fructuosité... Les théories ne sont jamais comparées uniquement par leur adéquation aux données, comme un bayésianisme radical pourrait laisser penser.
  • et si ça ne suffisait pas : il n'existe pas vraiment d'espace des théories au sein duquel on pourrait appliquer un principe d'indifférence pour leur attribuer un poids. En général, on n'a pas accès à l'ensemble des théories possibles. Personne n'avait envisagé la relativité avant Einstein. Il n'y a donc aucun sens à attribuer des valeurs aux p(Ti).
En résumé, la formule de Bayes est applicable à l'intérieur d'un cadre théorique bien délimité qui permet de pondérer les hypothèses, mais elle est inutilisable pour évaluer les cadres eux-mêmes.

Les degrés de crédence n'ont aucun sens

Les bayésiens rejettent généralement ce dernier point en évoquant des degrés de crédence, mais je pense qu'ils ont tort. Leur idée est qu'on n'a aucun besoin d'avoir une méthode objective, comme le principe d'indifférence, pour attribuer un poids a priori aux théories : on peut leur attribuer un poids subjectivement. Ce serait peut-être une manière d'accommoder l'existence de critères pragmatiques comme la simplicité dans le choix des théories (on accorderait plus de poids a priori aux théories simples). On pourrait répondre aux autres points en défendant que ce sont des modèles "toutes théories confondues" qui sont comparés : la formule de Bayes aurait bien une portée universelle.

C'est très bizarre parce qu'on pourrait envisager qu'un modèle relativiste s'applique mieux à tel type phénomène, et un modèle newtonnien à tel autre : on perd une forme d'unité explicative qui semble vraiment être la marque de fabrique de la science. J'ignore s'il est possible de la retrouver dans un cadre bayésien.

Mais peu importe. Ils ont tort d'adopter les degrés de crédence pour les raisons suivantes :

  • la connaissance, scientifique notamment, n'est pas une affaire individuelle mais un produit collectif. Ce que croient telle ou tel scientifique n'a pas d'importance en science. Les hypothèses doivent donc être évaluées de manière objective, en utilisant par exemple un principe d'indifférence, pas des degrés de crédence. Pour les théories, la seule méthode est celle du consensus : on adopte le paradigme dominant tant qu'il continue de fonctionner.
  • même si les croyances individuelles avaient de l'importance, les degrés de crédence n'ont aucune pertinence psychologique. Ils ne sont pas invoqués par les neurosciences pour expliquer le fonctionnement du cerveau par exemple. Il n'est pas certain que l'on ait des dispositions stables à répondre par oui ou non à toutes les questions indépendamment du contexte.
  • on pourrait répondre que les degrés de crédence, même s'ils n'entrent pas en jeu dans notre fonctionnement psychologique, devraient être utilisés. Le bayésianisme serait normatif plutôt que descriptif. Mais ça suppose qu'on ait accès à de tels degrés de crédence (qui seraient une disposition à répondre "oui" à la question "X est-il vrai ?"), et je ne pense pas que ce soit le cas. Si tant est que la question ait un sens, j'ignore complètement mon degré de crédence exact de "Bruxelles est la capitale de la Belgique". Ce que je n'ignore pas forcément, c'est quel serait le prix à payer, les conditions nécessaires, pour me faire abandonner cette idée, et je sais que ce serait très coûteux. Mais rien qui s'approche d'un nombre entre zéro et un. Les degrés de crédence n'ont aucune pertinence normative parce qu'ils ne sont pas évaluables.
  • et même s'ils étaient évaluables, pourquoi auraient-ils une pertinence normative ? Ma disposition à répondre "oui" a une question existe peut-être de manière stable dans certains cas. Mais pourquoi serait-elle idéalement un bon guide pour la rationalité ? Ça semble être une erreur de partir d'un fait pour arriver à une norme.

Les degrés de crédence n'ont donc simplement aucun intérêt particulier, que ce soit pragmatiquement pour diriger nos actions, théoriquement pour décrire notre psychologie ou épistémologiquent pour fixer les connaissances scientifiques. Au mieux, le bayésianisme généralisé est une belle métaphore.

Une alternative

J'ai expliqué pourquoi je ne suis pas un bayésien radical mais je n'ai pas proposé d'alternative. Je vais maintenant le faire.

Tout d'abord je pense qu'il est une chose à retenir du bayesianisme sur le plan philosophique : en principe, presque toutes nos croyances sont révisables. On devrait être prêt à revoir nos croyances si suffisamment d'éléments s'offrent à nous. Je suis même d'accord pour dire que certaines croyances sont plus facile à réviser que d'autres. Ce que je rejette c'est uniquement l'idée que ça devrait être quantifié (et que ne pas quantifier nos croyances serait irrationnel). La manière dont j'envisage les choses est seulement qualitative au lieu d'être quantitative.

Entendons nous bien : on peut utiliser la formule de Bayes dans plein de contextes dès qu'on dispose d'un ensemble quantifiable d'hypothèses, mais c'est l'exception plutôt que la règle, et ça suppose d'accepter un cadre qui lui ne fait pas partie d'un ensemble quantifiable.

L'alternative que je propose est inspirée de la notion de schème conceptuel du philosophe Quine. Un schème conceptuel est simplement un ensemble de croyances auxquelles on adhère, sur lesquelles on est prêt à se baser pour l'action. L'alternative au bayésianisme que je propose consiste simplement, au lieu d'attribuer une probabilité à chacune de ses croyances, à se demander : que faudrait-il pour me faire abandonner cette croyance ? À quel point devrais-je réviser mon schème conceptuel ?

Le premier avantage de cette façon de voir les choses est qu'elle ménage une place à la suspension de croyance : il y a plein de choses sur lesquelles je n'ai aucune opinion précise (et me forcer à en adopter une en me mettant un pistolet sur la tempe ne révélerait rien d'intéressant). Il y a une différence entre estimer qu'une pièce a une chance sur deux de tomber sur pile et ignorer complètement la température de fusion du plomb, ne jamais s'être posé la question, ce dont le bayesianisme ne peut rendre compte. Or pour l'immense majorité des propositions, je n'ai simplement aucune croyance, ni dans un sens ni dans un autre, parce que je ne m'y suis jamais intéressé.

Mais le principal avantage est qu'on arrive à une manière beaucoup plus fine d'évaluer nos croyances. On peut comprendre pourquoi certaines croyances sont quasiment indélogeables, parce que les rejeter demanderait de rejeter du même coup un ensemble gigantesque de croyances associées. Si j'apprends que je suis un cerveau dans une cuve et que mon monde est simulé, tout ce que je croyais savoir tombe à l'eau. Ou encore, je devrais remettre en question énormément de connaissances scientifiques et d'expériences vécues avant d'accepter que la terre est plate (il faudrait m'expliquer de manière convaincante que des millions de gens sont dans l'erreur).

Un bayésien serait tenté d'affirmer que son degré de croyance en "le monde est bien réel" est très proche de 1, mais ça n'a aucun sens. On peut comprendre beaucoup mieux pourquoi cette croyance est si bien ancrée en considérant ce qu'il nous faudrait avaler pour la rejeter. Et on peut comprendre que beaucoup d'autres croyances n'ont pas le même statut : que le vélo de mon voisin soit jaune ou vert ne change pas grand chose (à moins que ça ne remette en cause l'idée que ma vision est fiable). C'est une manière de comprendre ce qu'on veut dire quand on dit "c'est fort possible" (il m'en faudrait peu pour intégrer cette croyance dans mon schème) ou "ça m'étonnerait" (il en faudrait beaucoup). Et cette façon de voir est plus subtile parce qu'elle nous autorise à qualifier ce qu'il faudrait pour accepter ou rejeter une croyance. On peut même obtenir un ordre partiel entre les croyances : certaines sont strictement plus fortes que d'autres quand elles les présupposent. Mais pour ce faire, il est inutile de leur attribuer un hypothétique nombre.

Cette façon de voir les choses ne vous empêche pas de bien agir, de tenir compte des risques d'erreur. Elle permet même d'en tenir compte de manière fine. Et dans les rares cas où les risques sont quantifiables, rien ne vous interdit de faire des calculs. Mais jamais vous n'aurez à vous appuyer sur des quantifications subjectives qui n'apportent rien.

Oubliez donc cette idée que vos croyances ont un poids entre 0 est 1 sur lequel vous devriez parier : c'est un jeu inutile. Pensez plutôt en mode tout ou rien (vous vous engagez envers ou contre certaines croyances, êtes indifférents à propos des autres) et considérez les liens conceptuels qui unissent les croyances entre elles, et les raisons qu'il y aurait de les rejeter ou de les accepter en restant cohérent. Soyez prêt à le faire. Vous aurez tous les avantages du bayésianisme (en particulier l'anti-dogmatisme) sans vous encombrer de chimères.

Aucun commentaire: