mardi 24 septembre 2019

Le constructivisme comme scientisme

Le constructivisme social est l'objet de débats parfois houleux. On associe souvent ce type de thèse au "post-modernisme", à la négation de l'objectivité de la science, à de l'anti-rationalisme. Le constructivisme affirme de certaines catégories de phénomènes qu'ils sont "socialement construits", et s'oppose en cela au naturalisme, suivant lequel il s'agit de catégories naturelles. Mais cette idée peut se comprendre de différentes manières.

Ici je souhaiterai défendre (développant une vieille idée) que c'est une version forte de constructivisme qui nourrit réellement les débats militants, les autres versions ayant des implications beaucoup moins radicales, et que cette version forte, quand elle est généralisée, s'apparente à un scientisme sociologique.

Constructivisme des représentations

Il convient d'abord de déterminer ce sur quoi portent les thèses constructivistes. À ce titre, on peut distinguer deux approches (je me base en partie sur cet article de l'Encyclopédie Stanford) : la première affirmant que nos représentations, en particulier scientifiques (les théories, hypothèses, modèles) sont des constructions sociales et la seconde affirmant que les objets représentés sont eux-mêmes des constructions sociales.

La première thèse n'a a priori rien de révolutionnaire : évidemment, la théorie de Newton n'existait pas avant Newton, et les modèles héliocentristes du système solaire se sont répandus en Europe après Copernic, sous l'influence de facteurs sociaux. De même certaines représentations courantes du monde ont pu se développer à des époques particulières. Il n'a pas fallut attendre les constructivistes du 20ème siècle pour s'en apercevoir.

Ce que les constructivistes mettent en avant n'est pas ce simple constat, mais plutôt le fait que les facteurs sociaux jouent un rôle déterminant sur la façon dont on se représente le monde. Les catégories et théories scientifiques ne se contenteraient pas de dévoiler une nature "déjà là". Le choix des bonnes théories n'aurait pas lieu suivant des critères purement rationnels, mais serait influencé par des valeurs culturelles. Théories et catégories scientifiques, tout comme nos représentations communes, seraient "chargées de valeurs". Différentes sociétés pourraient aboutir à des représentations incompatibles sans qu'il ne soit possible de dire que l'une ait raison et l'autre tort.

Ce type de thèse, quand elle porte sur les sciences, a été avancé notamment par Feyerebend et inspiré par les travaux de Kuhn. C'est une position épistémologique générale, et elle n'est pas particulièrement consensuelle en philosophie des sciences, ayant eu beaucoup plus de retentissement en sciences sociales. Mais le constat de départ qu'il puisse y avoir une influence des valeurs sur les choix théoriques et les catégories n'est pas non plus bien nouveau. C'est une simple conséquence du fait que les théories, modèles et hypothèses sont produits par des êtres humains vivant en société. Les philosophes des Lumières dénonçaient l'influence de préférences subjectives sur les représentations du monde de la scolastique. Ça n'en faisait certainement pas des constructivistes.

On peut certes opposer ceux qui considèrent que ces influences culturelles sont des biais à éviter, et maintiennent qu'il existe des critères de rationalité universels (même si la science, en l'état, est imparfaite), et il s'agit là d'une façon traditionnelle de voir la science qui est toujours défendue aujourd'hui, de ceux qui pensent que ces facteurs culturels font partie intégrante de toute démarche scientifique, si bien que les paradigmes sont en une certaine mesure incomparables entre eux, ce qui est sans doute une nouveauté de la pensée du 20ème siècle (mais pas forcément, sachant que le relativisme a des origines antiques). Cependant, dans la mesure où les deux acceptent l'influence de facteurs sociaux sur la marche de la science ou sur nos représentations en général, et qu'au fond personne ne l'a jamais vraiment nié, ce ne semble pas être une bonne manière de caractériser le constructivisme.

Constructivisme des objets

La seconde thèse, le constructivisme à propos des objets, mérite mieux le qualificatif de constructivisme, puisqu'elle permet de comprendre ce que cette position a de provocatrice. Il s'agit d'affirmer que les objets représentés en science ou ailleurs sont eux-mêmes des constructions sociales.

Une bonne illustration de cette idée est l'argent. Un billet de 20€ n'est, au fond, qu'un morceau de papier. Cependant il acquière une valeur particulière du fait de son insertion dans un ensemble de pratiques sociales. Le constructivisme des objets affirme qu'il en va de même de certaines ou de la plupart des catégories scientifiques et ordinaires.

L'idée est donc de combiner deux thèses apparemment contradictoires : celle affirmant que les catégories que nous employons pour classifier les phénomènes, ou nos représentations en général, dépendent de manière importante de facteurs sociaux, et une certaine forme de réalisme : les objets et catégories que nous nous représentons correspondent bien à quelque chose qui existe réellement dans le monde, et pas seulement à une classification arbitraire sans référents. Il n'y a pas, en fait, contradiction : ces catégories et objets sont réels, mais ils dépendent de manière importante facteurs sociaux puisqu'ils sont produits par les activités sociales impliquant leur représentation.

De nouveau nous pouvons faire une distinction entre deux versions de cette thèse. La première verrait une influence causale du monde social sur les objets construits. La société serait responsable de la production, du contrôle et du maintien de ces objets et catégories. On peut dire que les artefacts sont des constructions sociales en ce sens. Les chaises et les pantalons sont des produits de notre société.

Cette première version me semble également insuffisante pour parler de constructivisme, puisqu'il est évident que la société humaine peut agir causalement sur la nature de différentes façons. La plupart des espèces végétales et animales que nous mangeons sont le produit d'une sélection artificielle, et ceci, personne ne le nie vraiment. Mais tout le monde n'est pas constructiviste social. Ainsi même s'il est possible de contrôler en partie nos traits sexuels par l'administration d'hormones, ça ne fait pas forcément de ces traits en général des constructions sociales en un sens intéressant.

La seconde version de constructivisme des objets est plus forte. Il s'agit d'affirmer que certaines normes ou pratiques sociales constituent ces objets ou catégories, et que la nature même des objets considérés est donc intrinsèquement liée à ces aspects sociaux. L'argent est un exemple qui se plie bien à cette version de constructivisme : il s'agit d'un objet essentiellement social de par sa nature même. Il n'existe que relativement à certaines pratiques : elles définissent ce qu'est l'argent. Ou encore, le fait même de se représenter un morceau de papier comme de l'argent fait de ce morceau de papier de l'argent, du moins si un nombre suffisant de personnes l'acceptent comme tel. À l'inverse, même si le blé que nous mangeons a été sélectionné artificiellement, et est donc un produit (causal) de la société, on peut légitimement penser que sa constitution reste essentiellement biologique, et que son existence ne dépend pas de la même manière de nos représentations.

Constructivisme constitutif

Je pense qu'on peut qualifier cette forme de constructivisme d' "essentialisme social", par opposition à la fois au nominalisme (les catégories sont arbitraires, n'existent que dans le langage) et à un essentialisme naturel (elles sont fondées sur l'ordre naturel des choses). Il s'agit d'une forme d'essentialisme distincte de ce qu'on entend habituellement par ce terme, dans la mesure où les catégories dont il est question sont fondées sur des normes et non sur des faits, et où ces normes sont contextuelles et peuvent évoluer. Mais le terme me semble toutefois approprié, pour bien comprendre que l'idée est que ces catégories, bien que "construites", existent réellement dans le monde (par opposition donc au constructivisme des représentations qui n'implique rien de tel). Il permet aussi de comprendre que le constructivisme est par nature très proche du réalisme scientifique : chacun voit midi à sa porte, et le constructiviste, à l'instar du physicien réductionniste, peut se targuer d'être anti-réaliste à propos de toutes les disciplines, sauf la sienne.

Ce type de constructivisme semble parfaitement acceptable si l'on parle d'objets qu'on comprend déjà naturellement comme étant liés à des pratiques sociales, par exemple l'argent ou les soirées d'anniversaire : on ne peut vraiment expliquer ce qu'est l'argent ou ce qu'est un anniversaire sans faire référence à des institutions ou pratiques. Là où la thèse peut être plus controversée (et là où elle se prétend réellement éclairante) est quand il s'agit de termes qu'on penserait naturellement faire référence à des catégories naturelles, par exemple les catégories de races humaines ou de sexe.

Un naturaliste pourrait voir dans les races une catégorisation prétendument biologique, et si la biologie n'utilise pas ce type de catégorie, le naturaliste en conclura qu'il n'y a pas de races humaines. Mais pour un constructiviste à propos de la race, les races existent bel et bien : seulement elles sont "socialement construites". Un naturaliste pourrait de même voir dans le sexe une catégorie biologique, qui pour le coup existe bien puisqu'elle est employée efficacement en biologie (à noter que le fait que cette catégorie ait des frontières floues n'a aucune pertinence, sauf à charger métaphysiquement le terme "exister", puisque quasiment toutes les catégories scientifiques ont des frontières floues). Pour un constructiviste à propos du sexe (comme Judith Butler), le sexe existe en effet, mais sa nature est sociale, et non biologique.

Le constructivisme ainsi compris est souvent associé à un anti-réductionnisme : l'idée est que les phénomènes sociaux, en particulier ceux qui constituent les catégories dont on parle, ne peuvent être entièrement expliqués en termes naturels.

Arguments constructivistes

Ce type de thèse est d'autant plus radicale et controversée qu'on parle de catégories issues des sciences naturelles, comme la biologie et la physique, dont les objets ne sont pas particulièrement liés à la société : il s'agit alors d'affirmer que les phénomènes qu'étudient les scientifiques sont produits par la pratique scientifique elle-même, peut-être sous l'influence d'un contexte social plus large. Tous les constructivistes ne vont pas jusque là, mais cette version radicale peut être défendue sur la base de la sous détermination par l'expérience et de la charge théorique de l'observation.

La sous détermination par l'expérience est l'idée que nos observations ne sont jamais suffisantes pour adopter ou rejeter formellement une hypothèse. D'autres choses sont en jeu (la simplicité des théories par exemple). Les constructivistes se servent de cet argument pour avancer que les facteurs sociaux jouent un rôle déterminant dans les choix théoriques.

C'est suffisant pour affirmer que les facteurs sociaux sont déterminant en science, mais insuffisant pour affirmer que la science construit ses objets. Mais la sous-détermination est renforcée par la charge théorique de l'observation, à savoir l'idée que nos observations sont toujours sélectionnées et interprétées à la lumière d'une théorie. Un thermomètre n'indique la température que si l'on accepte une certaine théorie thermodynamique sous-tendant le fonctionnement du thermomètre lui-même (dont on a besoin pour vérifier la théorie).

Les constructivistes radicaux peuvent s'appuyer sur cette idée pour défendre que les mesures et objets des sciences sont en général chargés de valeurs sociales, ou relatifs à un point de vue. La température ne serait pas simplement mesurée : elle serait construite par l'ensemble des pratiques accompagnant la théorie thermodynamique. Elle ne vaudrait comme température que parce qu'on se la représente ainsi.

Tirer de telles implications de la charge théorique n'est pas non plus consensuel. En tout cas il semble y avoir une différence importante entre la température et le billet de banque : une simple stipulation, même par l'ensemble d'une communauté, ne suffit pas à faire de n'importe quel objet un indicateur de température.

On pourrait argumenter à ce sujet. Mais de manière plus modérée, on peut défendre un constructivisme qui n'est pas généralisé, mais concerne seulement certains objets, les traits humains par exemple. Les arguments en faveur de ce type de thèse sont alors moins généraux et moins philosophiques : ils s'appuient principalement sur la mise en évidence de relations entre les objets en question et des pratiques sociales. Il s'agira typiquement de relever la variation historique ou culturel de l'objet, ou des représentations que l'on s'en fait.

Constructivisme et militantisme

Nous avons donc différentes positions constructivistes distinctes : à propos des objets ou des représentations, causal ou constitutif. Mais nous avons vu que la plupart de ces thèses sont assez triviales : on a toujours su que les représentations du monde naturel étaient produites par des humains dans des contextes sociaux et qu'elles peuvent être influencées par des facteurs culturels, on a toujours su que la société humaine pouvait agir causalement sur la nature. La seule position qui mérite l'intérêt est finalement le constructivisme constitutif.

Une stratégie rhétorique malheureusement assez répandue consiste à avancer une thèse forte pour attaquer une position adverse, et à se retrancher dans une position plus faible, mais aussi plus inoffensive, quand on est soi-même attaqué. On pourrait craindre que cette stratégie soit à l'oeuvre en la matière. Le problème est que ces distinctions entre différentes compréhensions du constructivisme ne sont pas toujours faites par ses défenseurs, générant une certaine ambiguïté. On peut parfois lire un texte dans lequel l'auteur semble affirmer de manière provocante que des objets qu'on pensait naturels sont en fait des constructions de la société. Mais peut-être cet auteur parle-t-il en fait de nos représentations de ces objets, défendant ainsi une thèse plus consensuelle ? C'est une manière d'interpréter certains écrits de Latour par exemple. On peut aussi lire parfois, comme manière d'interpréter ces auteurs, que le terme de construction social est avant tout un "outil critique", ou un principe méthodologique. Mais alors rien de substantiel n'est vraiment affirmé ? Ou seulement, encore une fois, des thèses consensuelles présentées de manière provocantes ?

Il me semble que c'est la thèse la plus forte, comprise en un sens littéral (et non comme simple "outil critique", quoi que ça puisse vouloir dire) qui possède le plus d'attrait, de par son côté provocateur et un verni de "profondeur philosophique", et qui peut réellement s'avérer incisive. Personne ne s'intéresse à ce qu'on savait déjà. N'étant pas chercheur en sciences humaines, je ne me permettait pas de juger de l'influence éventuellement problématique de ces thèses dans le champ social (bien que ce soient des témoignages de cette influence qui aient alimenté de récentes polémiques; à noter également que certaines personnes l'y trouve problématique). Mais il me semble que c'est cette thèse forte qui génère des débats houleux. C'est elle qui permet d'argumenter de manière conséquente dans les débats militants sur les réseaux sociaux, puisque les versions plus consensuelles de constructivisme, comme l'idée que nos représentations du monde évoluent avec le temps ou que l'homme agit sur la nature, ont des implications beaucoup moins radicales. Or ce n'est peut-être pas cette version qui est la mieux soutenue par les arguments et les études empiriques qu'on trouve dans la littérature scientifique.

Une implication de la thèse forte (le constructivisme constitutif), si on l'interprète littéralement, est en effet que la science est d'emblée un champ politique : elle agit directement sur le monde (et non seulement sur nos idées) en créant des objets, au moins pour certains de ces objets, et peut-être participant à un contexte social plus large. Toujours est-il qu'en promouvant certaines catégories scientifiques, on peut en principe leur donner réalité et ainsi changer le monde. Et l'on peut donc débattre de la valeur éthique de telle ou telle théorie, de telle ou telle catégorisation du réel ou de tel champ disciplinaire comme on débattrait de positions politiques. On peut militer pour une révision des catégories sexuelles sans se préoccuper de biologie, puisque ces catégories sont, de toute façon, construites. Il y aurait peut-être une autre facon de faire de la biologie, ni plus ni moins valide, mais plus vertueuse sur le plan moral ou politique.

Une autre implication est en effet une forme de pluralisme assez radical : différentes disciplines ou approches envers un même objet, apparemment incompatibles, peuvent avoir chacune raison selon ses propres standards, puisqu'il ne s'agit pas de décrire une même réalité indépendante des pratiques.

Les versions plus faibles de constructivisme, même quand elles affirment que les théories sont teintées de valeurs culturelles, n'ont pas forcément ce type d'implications.

On peut donc dire que quand bien même le constructivisme constitutif ne serait pas celui qui est adopté dans la littérature universitaire (ou pas explicitement), c'est lui qui fait tout le travail "critique" et qui alimente véritablement le militantisme tel qu'il se manifeste hors de la sphère académique, pour la simple raison que les versions plus faibles n'ont pas la même force dans les arguments. C'est pourquoi il me semble légitime d'examiner son statut.

Je compte montrer que le constructivisme ainsi compris est en fait (bien que ce soit contre-intuitif a priori) une forme particulière de scientisme : un scientisme sociologique.

Le scientisme

Selon ma compréhension, le scientisme se caractérise principalement par les aspects suivants :

  • la volonté d'imposer certains principes méthodologiques, généralement issus d'une discipline scientifique particulière, à toute forme d'acquisition de connaissance, et de nier la pertinence des résultats utilisant d'autres méthodes
  • le fait d'hériger ces principes méthodologiques et les résultats obtenus en vérités métaphysiques, portant sur la nature du monde

Ce type de dérive n'a rien de propre à une discipline scientifique en particulier. On peut la retrouver dans tous les champs, et je pense que c'est en fait une tendance naturelle (contre laquelle il faut lutter) que de tout ramener à son propre sujet d'expertise : comme le dit l'adage, quand on a un marteau dans la main, on voit des clous partout.

Prenons la physique à titre d'illustration. Le réductionnisme peut se comprendre comme un principe méthodologique appliqué avec un certain succès en physique, et en biologie également. Il s'agit d'adopter l'attitude suivante : face à un phénomène complexe, on cherchera à isoler différentes parties contribuant de manière indépendantes au phénomène dans son ensemble. On cherchera à expliquer le tout par l'agencement des parties.

Le réductionnisme méthodologique (comme tout principe méthodologique) n'est jamais réellement confirmé ou infirmé par une expérience : il s'agit d'une méthode, non d'une croyance. Soit ça fonctionne, soit ce ne fonctionne pas, et si ça ne fonctionne pas, c'est peut-être parce qu'on a pas assez (ou mal) essayé. Mais face à de nombreux succès, on peut être tenté de "sauter le pas" et d'expliquer le succès de l'approche réductionniste par le fait que le monde serait vraiment réductible de bout en bout : un simple agencement de particules élémentaires. L'étape suivante est d'affirmer que puisque le monde est ainsi, toute connaissance qui ne serait pas acquise par une méthode réductionniste serait sans valeur. Elle ne pourrait aboutir à aucune vérité. La vérité ultime se trouverait donc dans la physique.

Cette attitude me semble très problématique dès la première étape, en particulier parce que l'histoire des sciences montre que ce type de présupposés méthodologiques finissent souvent par être abandonnés, même quand ils ont connus un réel et long succès (par exemple le déterminisme). Mais malheureusement ce manque d'humilité épistémologique est assez répandu. L'équivalent en biologie consisterait à passer du succès d'une méthode pour déterminer les facteurs génetiques de différents traits psychologiques à l'idée que la psychologie dans son ensemble s'expliquerait génétiquement, et c'est à juste titre que des chercheurs en sciences humaines devraient s'offusquer de ce type de passage douteux.

Le déterminisme et le réductionnisme de la physique, hérigés en normes méthodologiques universelles pour l'acquisition de connaissance, sont la marque du scientisme.

Mais ils ont leur pendant en sociologie, en l'occurrence: le déterminisme social et le constructivisme.

Le constructivisme comme scientisme

A priori tout semble opposer le scientisme et le constructivisme. Nous avons vu que ce dernier implique un pluralisme méthodologique : n'est-ce pas l'exact opposé de l'hégémonie que prône le scientiste ?

Plus encore, qualifier le constructivisme de scientisme est paradoxale dans la mesure où les arguments sur lequel il se base, à savoir la charge théorique de l'observation et la sous détermination des théories par l'expérience, peuvent être utilisés contre le scientisme. Le scientiste a tort d'hériger ses principes méthodologiques et les résultats qu'il obtient en croyances métaphysiques sur la nature du monde, dans la mesure où ces croyances sont sous-déterminées par l'expérience. Il a tort de vouloir imposer ses théories et méthodes à tout le monde, car elles affectent nos observations, induisant une vision partielle du monde.

Mais s'il y a paradoxe, je pense que c'est avant tout un problème pour les thèses constructivistes, et je pense qu'on peut retrouver une attitude scientiste à l'œuvre dans ces thèses.

En effet, on peut dire que la recherche en sociologie se caractérise par une certaine méthode qui est la suivante : cherchons à déterminer les facteurs sociaux sous-tendant tel ou tel phénomène. Il n'y a bien sûr rien de problématique avec cette méthode tant qu'elle mène à des résultats. Cependant le pas consistant à hériger cette méthode en vérité métaphysique nous fait aboutir exactement au constructivisme constitutif généralisé, à savoir l'idée que tous les phénomènes étudiés et étudiables sont essentiellement sous-tendu par des facteurs sociaux, et que les résultats obtenus à travers cette méthode valent pour des descriptions de la nature même de ces phénomènes (et non seulement pour un aspect secondaire, une interaction entre phénomènes naturels et société par exemple, qui serait mieux compris en tentant de combiner les résultats de plusieurs approches).

Le second pas, consistant à imposer cette méthode à toute démarche d'acquisition de connaissance, est également présent de manière plus insidieuse. Il consiste parfois à nier certaines approches possible du point de vue d'autres disciplines scientifiques ainsi que leurs résultats (inutile de chercher les déterminants biologiques de X, car X est socialement construit), parfois à en imposer une certaine relecture, faisant de facto de ces résultats des constructions sociales, et diminuant de fait leur pertinence : peu importe ce que la biologie ou la psychologie nous dit de telle ou telle chose, puisque ce qu'elle nous dit est déterminé par des facteurs sociaux, au moins pour certains de ses objets.

Cette attitude est renforcée par le pluralisme radical qu'implique le constructivisme : les psychologues, biologistes et sociologues peuvent vivre dans des mondes différents sans qu'il n'y ait de nécessité d'établir des ponts, puisque chacun voit les objets qu'il construit. Mais (et c'est un symptôme du scientisme) une discipline en particulier s'avère avoir le privilège d'un point de vue plus fondamental que les autres, ici, la sociologie, et parfois, cela peut amener à dénigrer (en contradiction avec le pluralisme) un champ entier de recherche s'attaquant aux mêmes objets que cette dernière, par exemple, la psychologie évolutionnaire.

Que cette attitude soit présente ou non en sciences humaines, elle découle directement de l'adoption de thèses constructivistes au sens examiné ici, et elle a toutes les caractéristiques du scientisme.

Le paradoxe levé

Le cliché scientiste est souvent associé à la physique, mais je pense qu'aucune discipline n'en est vraiment exempte. Et le constructivisme constitutif tel que défini plus haut me semble être la manifestation scientiste propre de la sociologie.

Le paradoxe est que le constructivisme s'appuie sur des arguments qui peuvent servir à attaquer le scientisme. Mais le paradoxe peut être levé si l'on voit que ces arguments fonctionnent en fait aussi contre le constructivisme.

Prenons la sous-détermination par l'expérience : la mise en évidence de facteurs sociaux, ou d'une évolution historique de nos représentations d'un phénomène donné est toujours insuffisante pour montrer qu'un phénomène est par nature social. C'est donc à tort que le constructiviste tire de telles implications métaphysiques de ses recherches, ou du succès de ses méthodes.

Prenons maintenant la charge théorique de l'observation : il s'avère que la méthode consistant à s'intéresser aux facteurs sociaux sous-tendant les phénomènes amène à catégoriser ces phénomènes à la lumière du social, quitte à redéfinir des catégories communes (typiquement, le concept de genre). On retrouve une forme de circularité partielle (ou de "prophétie auto-réalisatrice") : tel phénomène apparait effectivement être socialement construit, puisqu'il a été défini de manière à l'être. Ce n'est pas forcément problématique si ces catégories sont identifiées à une compréhension technique plutôt que commune, et si elles jouissent d'une certaine stabilité (si elles s'appliquent aussi bien dans des contextes variés). C'est sans doute le cas du concept de genre. Mais si ce qu'on observe dépend des catégories qu'on adopte, on aurait tort d'imposer un "filtre social" à toutes les disciplines, puisqu'il en résulterait une vision partielle de la réalité qui nous aménerait à ignorer les phénomènes accessibles suivant d'autres approches.

En fait la charge théorique de l'observation et la sous détermination n'impliquent aucunement que les disciplines scientifiques construisent leurs objets. Elles n'ont pas nécessairement des implications pluralistes, elles n'empêchent pas de chercher à établir des ponts entre disciplines, et sont en fait acceptées par de nombreux naturalistes. Le fait que le constructivisme s'appuie sur ces arguments n'empêche donc pas qu'ils puissent être utilisés à son encontre, et il n'y a pas réellement de paradoxe à qualifier ces thèses de scientisme sociologique.

Conclusion

On aura bien compris que rien de ce que j'affirme ici ne remet en question la qualité de la recherche en sociologie, ni la pertinence de ses méthodes, ni l'importance de cette discipline et de ses résultats, dont je suis par ailleurs persuadé. Mon objet est ici une attitude philosophique, une certaine interprétation des résultats de la sociologie et des sciences en général, attitude qu'on trouve y compris dans certains pans de la philosophie, non pas la discipline en tant que tel.

Je ne pense pas que la recherche sociologique, aussi éclairante soit-elle, puisse "montrer" à elle seule qu'un objet complexe susceptible d'être étudié par différentes disciplines, disons par exemple, la sexualité humaine, est une construction sociale au sens décrit ici, quand bien même les représentations et pratiques sexuelles auraient évolué au cours de l'histoire, pas plus que la recherche en neuroscience ne "montre" que nos comportements (également susceptibles d'être étudiés par différentes dusciplines) ne sont que le résultat d'influx nerveux. Il s'agit toujours d'une interprétation métaphysique des résultats de la discipline, et s'il est très plausible que les réflexes soient le résultats d'influx nerveux et que le mariage soit une construction sociale, il faudrait se garder d'étendre de telles considérations aux objets multi-disciplinaires.

La question du pluralisme reste par ailleurs assez mineure : de fait, la plupart des objets d'étude de la sociologie n'ont pas de rapport directs avec d'autres disciplines, et là où elles en ont, je ne prétends pas me prononcer sur l'influence de la version de constructivisme examinée ici sur la communauté scientifique, faute d'en avoir une connaissance suffisante. La pluridisciplinarité est de toute façon difficile à mettre en œuvre.

Toutes ces questions sont exacerbés par le prestige dont jouissent les sciences dites "dures" sur les sciences humaines, et par l'attitude perçue comme hégémonique de certains scientifiques issus des sciences dures. Mais là encore je ne prétend pas me prononcer sur ces aspects ni prendre parti dans ces conflits. Seulement les réactions excessives à ce type de conflits d'ego me semblent contre-productives. J'ai parfois l'impression que ces réactions sont suscités par une lecture politique (au sens courant du terme) des conflits disciplinaires (les critiques de la sociologie, ou plutôt de ce type de positionnement d'inspiration sociologique, seraient forcément "de droite"), une lecture malvenue qui me semble, justement, provenir d'un biais constructiviste ("la science est politique") qui demande à être mitigé.

Cette attitude, comme je pense toute forme de scientisme, est intrinsèquement militante, au mauvais sens du terme : cherchant à imposer ses normes et sa vision du monde sans être sensible à la contradiction, renforcant circulairement cette vision du monde, et je pense percevoir ses effets dans les discussions publiques. J'aimerais donc, au risque d'enfoncer des portes ouvertes, appeler à l'humilité épistémique de la part de tous les partis, à un pluralisme modéré et à une bonne dose de pragmatisme : les résultats de n'importe quelle discipline sont potentiellement informatif pour une autre ; ils ne demandent pas à être réinterprétés ; ils ne demandent pas non plus à être sur-interprétés métaphysiquement parlant ; les grandes thèses métaphysiques sont toujours un peu douteuses, même quand elles nous plaisent ; la réalité est parfois tristement banale plutôt que "profonde" ; les discussions métaphysiques ou scientifiques n'ont pas toujours des motivations politiques ; les chercheurs d'une discipline donnée savent discuter et éviter leurs biais potentiels et n'ont pas forcément de leçon à recevoir de personnes moins expertes ; aucune discipline scientifique n'a un accès privilégié au réel ; enfin, il est toujours possible et souvent souhaitable d'établir des ponts plutôt que de creuser des tranchées.

lundi 2 septembre 2019

Quelle place pour les valeurs en science ?

On fait parfois la différence entre valeurs épistémiques (ce qui fait qu'une théorie est bonne ou mauvaise selon des critères rationnels ou scientifiques) et valeurs contextuelles (ce qui fait qu'une chose est bonne ou mauvaise vis-à-vis de la morale, d'un contexte social ou d'intérêts particuliers).

Il peut y avoir cette idée, parfois critiquée en philosophie, que la science "pure" est "neutre", ou devrait l'être, qu'elle ne devrait être mue que par des valeurs épistémiques. Son but serait de produire de bonnes théories, de bonnes connaissances, indépendamment de considérations morales, sociales ou subjectives. L'intervention de valeurs contextuelles serait un obstacle à la recherche d'objectivité, valeur cardinale en science.

Ces questions sont liées à celles concernant la responsabilité des scientifiques. Peut-on par exemple défendre l'idée que la science, seulement mue par une recherche du vrai, n'a aucune responsabilité quant aux applications possibles issues de ces recherches ? La science n'est ni bonne ni mauvaise, seul ce qu'on en fait peut l'être ? Toute connaissance, quel que soit le sujet, est-elle bonne à prendre tant qu'elle répond à des critères de qualité épistémique ?

À ce titre on peut distinguer plusieurs phases d'une recherche : il semble que des valeurs contextuelles puissent en effet interférer négativement avec les valeurs épistémiques s'il s'agit de produire les données expérimentales "qui nous arrange" ou de sélectionner les hypothèses "qui nous arrangent", mais il est a priori acceptable voire souhaitable que le choix d'un sujet de recherche soit basé sur des valeurs contextuelles : un intérêt intellectuel pour une question ou un problème, peut-être partagé par la communauté scientifique, ou bien un besoin social (soigner le cancer), et de même pour les applications. Cela tient à ce que les valeurs épistémiques ne sont pas prescriptives sur ces aspects. Cependant les valeurs contextuelles peuvent aussi affecter les standards de précision dans la production de données, les méthodes choisies (par exemple l'expérimentation animale) et la prise en compte de certaines contraintes pratiques dans le choix des hypothèses à tester ou la gestion du risque au moment de tirer des conclusions d'une expérience et donc tout ceci est plus complexe qu'il n'y paraît. Pour cette raison, certains affirment que l'intervention de valeurs contextuelles est inévitable en science, et pas forcément une mauvaise chose, et que plutôt que d'éliminer les valeurs, il faudrait les rendre explicites pour qu'elle puissent être discutées par la communauté, au delà de la sphère scientifique. (voir l'entrée de l'Encyclopédie Stanford sur l'objectivité)

Dans tous les cas on peut déjà dire que le choix d'un sujet de recherche ou les applications ne sont pas a priori "neutres" du point de vue des valeurs sociales et qu'il n'y a aucune raison qu'ils le soient. Et cette absence de neutralité implique a priori une forme de responsabilité : l'idée que la science non appliquée, si ses résultats sont destinés à être rendus publics, serait un outil neutre est assez discutable (on peut faire un parallèle avec les arguments douteux défendant le libre accès aux armes à feux du type : ce ne sont pas les armes qui tuent mais les gens). Il ne semble pas, pour prendre un exemple extrême, que faire des recherches sur le type de virus qui pourrait décimer exclusivement une catégorie ethnique de la population, même si cette recherche est menée "par simple curiosité" (ce qui déjà peut sembler douteux), soit une très bonne idée d'un point de vue éthique. A priori, un chercheur devrait se questionner sur les applications potentielles de ses recherches.

Ceci dit, il semble bien y avoir une distinction pertinente entre science et technologie, ou entre science théorique et science appliquée, et on pourrait souhaiter que la première jouisse d'une autonomie plus importante dans ses choix de recherche. Dans cette article, je souhaite me pencher sur cette distinction, et sur celle, liée, entre valeur épistémique et contextuelle.

Science et technologie, faits et valeurs

Derrière l'idée de valeur épistémique, il semble y avoir l'idée que l'on peut être mû par un pur intérêt intellectuel : on veut juste "comprendre le monde" de manière "désintéressée", sans chercher à changer le monde en fonction de nos désirs. C'est ce qui différencierait par exemple la science "pure" de la technologie, qui viserait à agir sur le monde.

On peut faire reposer cette distinction sur d'autres : celle entre fait et valeur (ou celle entre descriptif et normatif), ou encore celle entre savoir-faire et savoir-que. L'idée principale est qu'il y aurait une "direction de l'ajustement" différente : dans un cas, on veut ajuster nos représentations (nos croyances) au monde, on veut décrire les faits. Si nos représentations ne correspondent pas au monde, c'est qu'il faut les changer (elles sont fausses). C'est la science, mue par des valeurs purement épistémiques. Dans l'autre, on veut ajuster le monde à nos représentations (à nos désirs), et s'il y a défaut de correspondance, c'est le monde qu'il faut changer (il est mauvais). C'est la technologie, mue par des valeurs contextuelles. Cette idée que la science serait du côté de la description et la technologie du côté de l'action est suffisamment commune pour être reléguée dans l'entrée de l'Encyclopédie Stanford sur la technologie, et elle a certainement le mérite d'être intuitive.

Remarquons cependant qu'il existe des technologies visant seulement à observer le monde (les microscopes et télescopes par exemple). Il me semble également que certaines disciplines théoriques ne visent pas particulièrement à décrire le monde : par exemple l'informatique théorique, très proche des mathématiques, ou encore la théorie du choix rationnel. Ces disciplines semblent concerner des actions possibles plutôt que de décrire des phénomènes naturels. Il y a aussi des cas plus ambigus, comme la thermodynamique : cette discipline apparemment descriptive a initialement été développée dans le cadre d'applications technologiques (les machines à vapeur, lire à ce sujet "Representing and intervening de Hacking), et un concept comme celui d'entropie se comprend assez naturellement en termes de quantité de travail disponible, c'est à dire en des termes centrés sur des actions possibles.

Alors les choses sont-elles si simples ? Une distinction entre science et technologie, ou entre valeurs épistémiques et contextuelles, en ces termes me semble être difficile à maintenir, et je voudrais défendre qu'il existe plutôt une gradation dans le "désintérêt" (terme mal approprié) qui caractérise la science pure, et que la bonne manière de la comprendre n'est pas en termes de direction de l'ajustement, mais plutôt en termes d'abstraction.

La distinction entre fait et valeur en question

Putnam a critiqué la distinction entre fait et valeur, arguant que des termes comme "cruel" sont "épais", c'est à dire à la fois descriptifs et normatifs, et ce de manière indissociable (j'en avait parlé ici). C'est peut-être le cas de termes scientifiques comme "biodiversité", connoté positivement, voire "mâle" et "femelle". Remarquons que c'est plus difficile à avaler à propos de termes comme "gène" ou "électron", et j'espère expliquer pourquoi c'est le cas un peu plus loin (mais peut-être sont-ils eux aussi chargés, en un sens, de "valeurs" plus abstraites, comme le réductionnisme explicatif.)

On trouve aussi en philosophie du langage une tradition pragmatiste qui s'oppose à l'analyse de la signification des énoncés en termes de pures conditions de vérité, au sens de correspondance au monde.

On peut saisir ces idées par les slogans : "la signification c'est l'usage" ou "parler c'est agir". Parmi les arguments en faveur de cette tradition, il y a le fait que certains énoncés comme "merci", "va-t-en", "je vous déclare mari et femme", "je te promet de te rendre tes 20€" ne sont pas analysables en termes de conditions de vérité : ils ne décrivent rien. À l'inverse, les énoncés descriptifs sont analysables, une fois mis en contextes, en termes d'intention de la part du locuteur : ils servent un but (par exemple "il y a du café sur la table" peut s'interpréter comme une invitation à se servir). On parle à ce sujet de performativité. L'analyse pragmatique serait donc plus générale. Mais la pragmatique radicale va plus loin, affirmant que les composantes descriptives et normatives ne peuvent pas nécessairement être distinguées strictement, notamment parce que les intentions et le contexte peuvent moduler la signification des mots : il n'y aurait pas de signification hors contexte, au mieux un "potentiel de signification".

Peut-on appliquer ces idées à la science ? Le vocabulaire théorique est-il connoté, chargé de valeurs contextuelles ? Est-ce que "parler" (décrire) en science, c'est agir, ou peut-être pousser à certaines actions ?

Si ces deux composants normatives et descriptives sont parfois mêlées, on peut penser que certains énoncés sont "plus descriptifs" et d'autres "plus normatifs" et que la science se trouve plutôt du côté descriptif : après tout, énoncer les lois de Newton ne pousse pas particulièrement à agir d'une manière précise. On peut aussi remarquer que l'activité scientifique vise souvent à s'affranchir de contextes particuliers pour acquérir une certaine stabilité, par exemple par la reproduction de résultats par des équipes indépendantes ou leur corroboration par différentes méthodes, et donc, peut-on présumer, l'activité scientifique vise en général à s'affranchir d'intentions particulières. Voilà qui pourrait appuyer l'idée que la science "pure" est orientée vers la description plutôt que vers l'action.

S'il y a une part de vérité dans ces remarques, je pense que c'est une erreur de penser en termes de dichotomie entre la description et l'action. Après tout, un pragmatiste radical pourrait aussi bien inférer de ces mêmes remarques que les théories les plus fondamentales, en ce qu'elles sont décorrélées de contextes particuliers, sont tout simplement dénuées de signification (comprises en termes de conditions de vérité), qu'elles ont au mieux un potentiel de signification... Et donc qu'elles ne sont pas particulièrement du côté de la description. Une conclusion qui, certes, ne plaira pas aux réalistes.

Sans forcément aller aussi loin, je pense qu'on peut montrer que la direction de l'ajustement n'est jamais uni-directionnel, que ce soit en science théorique ou appliquée, si bien que ce critère est inadéquat.

La direction d'ajustement est-elle pertinente pour différencier science et technologie ?

Considérons d'abord le cas d'une activité purement non appliquée : celle d'un physicien ou d'un biologiste qui travaille, depuis son bureau, à développer de nouvelles théories. Il est clair que ce scientifique voudra ajuster sa théorie au monde. Mais cet ajustement est au mieux indirect : ce dont il tiendra compte pour élaborer sa théorie, ce ne sera pas en général des expériences concrètes particulières, mais plutôt éventuellement des lois expérimentales générales dégagées de différentes expériences, et en général surtout des problèmes conceptuels à résoudre, d'autres théories et concepts bien acceptées, ou parfois des principes métaphysiques comme le réductionnisme. Il est bien connu qu'une expérience contradictoire ne suffit pas en général à réfuter une théorie (elle réfute plutôt un modèle de cette théorie), et donc l'ajustement de la théorie au monde n'est jamais direct.

On peut donc dire que la théorie s'ajuste non pas au monde directement, mais à d'autres représentations : il s'agit d'un ajustement abstrait, par la médiation de représentations plus proches de l'expérience directe.

Et partant de ce principe que l'ajustement peut opérer dans un milieu abstrait, il est clair que la direction de l'ajustement va aussi dans la direction opposée : d'autres théories, croyances, représentations, seront affectées par le fait d'accepter la théorie, parfois y compris hors de la sphère scientifique. L'influence de la théorie de l'évolution dans la sphère culturelle est, à ce titre, notoire. Il y a un sens à dire, suivant les thèmes de la pragmatique, qu'une théorie, même abstraite, est performative : elle vise à changer notre façon de penser.

Il n'est pas clair qu'en bout de chaîne, une théorie donnée portera sur ses phénomènes observables possibles plus que sur des actions possibles. Une théorie scientifique a ceci de particulier qu'elle peut servir à agir sur ou à décrire un ensemble extrêmement varié d'objets, dans de nombreux contextes, ce d'autant plus qu'elle est abstraite (mais évidemment chacun de ces contextes d'application sera enrichi de descriptions et de normes contextuelles pour pouvoir avoir une portée concrète). N'importe quelle théorie suffisamment abstraite semble à même de régimenter aussi bien des phénomènes ou observations possibles que des actions possibles.

En somme, si l'on comprend descriptif et normatif en termes concrets, une théorie abstraite ne penche pas plus du côté descriptif que normatif : elle est aussi déconnectée d'actions concrètes qu'elle l'est d'observations concrètes. Il faut toujours amener des aspects contextuels pour la connecter avec des activités concrètes. Mais si l'on accepte de prendre en compte des ajustements plus abstraits et indirects, internes à nos représentations, alors cette théorie est à la fois descriptive et normative : elle s'appuie sur d'autres représentations connectées au monde, mais elle structure également nos représentations, en fournissant ce que ses adeptes considèrent être les "bons" concepts, et donc elle influence indirectement nos actions.

Considérons maintenant un ingénieur en train d'appliquer des résultats théoriques pour développer une technologie. Il est clair que cet ingénieur va tenter d'ajuster le monde à ses représentations. Il disposera d'un modèle duquel il pourra inférer que telle action ou telle configuration donnera tel ou tel résultat. Il va essayer d'implémenter ces actions. Mais il serait illusoire de penser que son modèle est une simple application de la théorie suivant une recette algorithmique. Le modèle intégrera des aspects propre au contexte, à l'objet d'étude. Il impliquera de mesurer certains paramètres, de calibrer des instruments. Il impliquera même souvent de faire des expériences pour déterminer des lois, des relations entre différentes quantités, comme la résistance de tel ou tel matériau, que la théorie ne peut déterminer directement parce que trop de facteurs contextuels sont impliqués (lire à ce sujet "Models as mediators", de Morgan et Morrison). Autrement dit, l'ingénieur va ajuster son modèle à la cible particulière qui l'intéresse exactement comme peut le faire un scientifique : encore une fois, l'ajustement fonctionne dans les deux sens. Son modèle est à la fois descriptif et normatif.

Peut-on s'intéresser à un objet particulier sans être dans la technologie ?

La direction d'ajustement n'est donc pas pertinente pour différencier science et technologie, ou normes épistémiques et contextuelles. S'il est vrai que la technologie agit plus directement sur le monde qu'une activité théorique, ce semble être en vertu du fait qu'elle s'intéresse à des objets plus particuliers dans des contextes plus particuliers : ce qui est en cause est le niveau d'abstraction, et non le fait d'agir en soi.

On pourrait émettre des objections à cette manière de voir les choses. Est-ce que le fait de s'intéresser à un objet concret implique d'emblée une action sur le monde ? N'est-ce pas plutôt, à l'inverse, l'action sur le monde qui suppose qu'on s'intéresse à des objets particuliers ? N'y a-t-il pas deux dimensions : l'une abstrait-concret et l'autre normatif-descriptif ?

Il existe certainement des cas où l'on s'intéresse à décrire des objets très particuliers dans des circonstances très particulières sans forcément avoir pour intention principale d'agir sur ces objets ni de les utiliser, et notamment quand un objet particulier est le représentant d'une classe plus générale, et qu'on souhaite acquérir des connaissances générales sur cette classe. C'est le cas, par exemple, quand on mène une expérience particulière pour tester une hypothèse scientifique : ce n'est pas l'expérience en soi qui nous intéresse, mais ce que le résultat implique en général pour notre hypothèse. Ces activités sont bien concrètes, mais ne compte pas vraiment pour des activités technologiques. Elles semblent suivre un pur intérêt intellectuel envers l'objet.

Mais remarquons que dans ces cas il faudra en général agir : contrôler l'objet de l'expérience pour s'assurer qu'il représente bien sa classe. Et ceci se fera par la méditation de technologies. L'expérimentation scientifique est aujourd'hui pratiquement impossible sans technologie. La performativité, l'ajustement du monde pour répondre à nos désirs, est donc toujours présente. Ce qui semble caractériser ce type d'activité expérimentale, et la distinguer du développement technologique en tant que tel, c'est le fait que les intentions finales sont abstraites, et que les valeurs impliquées ne sont pas contextuelles, mais ce n'est pas une question de direction d'ajustement. Encore une fois la distinction pertinente me semble être l'axe abstrait concret : l'objet particulier nous intéresse en tant que représentant d'une classe abstraite, c'est pourquoi ce n'est pas un réel cas de technologie ou de science appliqué, même si on aura besoin de technologie pour réaliser l'expérience, comme on a besoin de descriptions particulières pour faire des inférences générales.

On peut donc qualifier la conclusion de la section précédente : ce qui caractérise la technologie n'est pas qu'elle implique des activités portant sur des objets concrets particuliers, mais que la finalité de ces activités porte sur ces objets concrets eux même, ou du moins sur une classe réduite d'objets et de contextes du même type, quand une activité théorique a pour finalité de porter sur une classe d'objets et une variété de contextes plus larges.

Si l'on s'intéresse à un objet particulier pour lui même, et non pour la classe à laquelle il appartient, je n'imagine pas d'autres raisons possibles que de vouloir agir d'une manière ou d'une autre sur cette objet ou de l'utiliser pour d'autres actions, et en général, il faudra, pour réellement connaître cet objet, apprendre à le manipuler. Dans le cas d'objets particuliers, la connaissance et l'action vont généralement de pair. Ici, les remarques issues de la philosophie du langage mentionnées plus haut deviennent pertinente : le fait de s'intéresser à cet objet et de le décrire ne peut être anodin, pas plus que de lancer "il y a du café sur la table" quand quelqu'un entre dans une pièce ne peut être anodin. Et plus l'intérêt porte sur des classes particuliers d'objets et des contextes particuliers, plus cela suppose une volonté d'action concrète. Et plus cela nous rapproche de la technologie (ou a minima de la technique). Le pur intérêt intellectuel doit avoir une portée plus générale.

À la lumière de ceci, on peut comprendre, il me semble, pourquoi certains concepts, comme celui d'électron, sont moins teintés de normativité que d'autres, comme celui de biodiversité, en ces termes, au moins en partie : ils ont un degré de généralité plus important, et donc sont moins poreux aux aspects contextuels. S'ils sont "épais", ce sont des valeurs abstraites qu'ils intégreront.

Implications éthiques

Je pense donc que la notion importante pour comprendre la distinction entre science et technologie est celle du niveau d'abstraction. Quand on parle de recherche "désintéressée", il faudrait dire que cette recherche ne s'intéresse pas à des objets très précis, mais à des généralités. Tout choix d'un sujet de recherche est intéressé (sinon on ne le choisirait pas) mais il existe des intérêts abstraits et d'autres plus concrets. Ceux-ci sont associés à des valeurs abstraites (la recherche de vérité) ou concrètes (soigner le cancer) et à des descriptions abstraites ou concrètes des phénomènes. Et ceci implique un ajustement dans les deux sens, soit depuis et vers d'autres représentations, soit depuis et vers le monde directement.

Je ne veux pas dire par là qu'il n'existe aucune distinction pertinente entre descriptif et normatif, ou entre croyance et désir : seulement que de manière générale les deux sont impliqués dans une quelconque activité, qu'elle soit abstraite ou concrète, et que de ce fait, cette distinction ne peut vraiment nous aider à faire la différence entre science et technologie. La seule différence tient au caractère abstrait de nos intentions.

On peut appliquer la même logique aux valeurs épistémiques et contextuelles. Les premières s'appliquent seulement à des objets plus abstraits que les secondes. Elles ont donc un domaine d'application plus large : elles ne supposent pas un intérêt pour un type d'objet particulier, et je dirais que ça leur permet de jouir d'une certaine autorité sur les autres valeurs, puisqu'elles s'appliquent en principe quel que soit le contexte. Un intérêt particulier ne devrait pas nous faire abandonner les principes de rationalité les plus généraux. (mais on peut envisager plusieurs niveaux d'abstraction : les principes de rationalité, les méthodes empiriques en générale (méthodes statistiques etc), les méthodes et centres d'intérêts spécifiques à une discipline, les techniques, questions et pratiques propres à un objet d'étude, ou les contraintes liées à un contexte donné).

Quelles conséquences pour le débat sur les valeurs en science ?

La conséquence directe est qu'il est en effet illusoire de s'affranchir de valeurs en science. Les valeurs sont présentes de part en part à tous les niveaux d'abstraction, toute activité est intentionnelle et vise à changer le monde, et il n'existe pas de limite tranchée entre deux types de valeurs. Ceci dit les valeurs épistémiques, plus abstraites et générales, sont déjà largement ouvertes à la discussion, quand les scientifiques discutent du bien fondé de leurs méthodes par exemple.

Les valeurs contextuelles sont liées à des intérêts envers des objets ou aspects plus particuliers du monde. Elles sont beaucoup moins explicites en science mais jouent sur les problématiques de financement : quelles recherches méritent l'intérêt, et quelles recherches n'en méritent pas ? On peut comprendre qu'elles soient moins discutées explicitement, car moins facilement partagées : à chacun ses intérêts. Mais a priori, ces jugements pourraient être soumis, dans une certaine mesure, à des discussions d'ordre éthique, éventuellement avec le reste de la société.

Ceci dit, il y a bien un sens à dire que certaines recherches théoriques "pures" ont moins d'implications éthiques parce qu'elles sont plus abstraites. Cela implique qu'elles sont compatibles avec de nombreux contextes et objets, donc avec des applications bonnes ou mauvaises, et en ce sens elles jouissent d'une certaine neutralité. Leur performativité est abstraite. On qualifie parfois ce type de recherche d'inutiles (comme on peut qualifier la philosophie d'inutile) en vertu de ce degré d'abstraction. C'est simplement qu'elles ont une utilité plus générale, donc moins tangible. Je vois beaucoup moins de raison de soumettre ce type de recherche à des discussions éthiques, étant donné que les valeurs qui les concernent sont principalement épistémiques, et donc plus générales, dans leurs objets, que les valeurs morales (la morale doit respecter les principes de rationalité, et même je dirais les principes d'une bonne enquête empirique plutôt que de les soumettre).

Il est peut-être possible d'affiner ces considérations mais je dirais, en somme, que s'appuyer sur la notion de niveau d'abstraction permet de rendre compte de manière appropriée de l'autorité de valeurs épistémiques en science, de la gradation entre science et technologie, de la façon dont la science modifie le monde, et du rôle que peuvent jouer les valeurs plus contextuelles dans les choix de domaine de recherche. Il me semble que c'est une bonne façon de comprendre le fonctionnement de la science.

samedi 10 août 2019

Lois naturelles contre régularité accidentelle : une différence de priors bayésiens ?

Imaginez que vous souhaitiez observer un certains nombres de corbeaux, disons dix, pour vérifier que votre hypothèse "tous les corbeaux sont noirs" est correcte. Si vous n'en voyez que des noirs, cela vous confortera, et vous vous attendrez à ce qu'un onzième soit noir également, sans surprise. Vous avez effectué un raisonnement amplifiatif : l'observation d'un échantillon vous amène à modifier vos croyances à propos d'autres objets, en dehors de votre échantillon.

Si maintenant vous jouez à pile ou face avec une pièce non truquée et observez dix fois "pile", vous penserez faire face à un énorme coup de hasard, mais vous ne devriez pas inférer que le onzième lancé sera "pile" : il y a toujours une chance sur deux qu'il tombe sur face, indépendamment des résultats précédents. C'est une chose qu'on enseigne dans tous les cours sur les probabilités.

Ainsi le raisonnement à adopter est différent dans les deux cas.

Le rapport entre induction et loi de nécessité naturelle

Cette observation est faite par Dretske dans "Laws of Nature" (1977). Hume observait que le raisonnement inductif présuppose l'idée que la nature est uniforme, et que cette idée ne peut elle même être justifiée par induction sous peine de circularité. Ce que met en avant Dretske, et que beaucoup d'autres avaient remarqué avant lui, c'est qu'on n'est pas prêt à attribuer une uniformité à propos de n'importe quoi. Pour utiliser le vocabulaire de Goodman, certaines propriétés sont "projectibles" et d'autres non. Par exemple, si les neufs premières pièces de ma poche sont des pièces de 5 centimes, je ne serai pas forcément prêt à en inférer que la dixième est également une pièce de 5 centimes et qu'il en sera ainsi tous les jours : la propriété "être une pièce dans ma poche" n'est pas une catégorie naturelle sur laquelle je voudrais projeter des régularités. Chaque nouvelle pièce de 5 centime découverte peut me conforter dans l'idée que toutes les pièces de ma poche sont des pièces de 5 centimes, mais seulement par élimination : les cas précédents n'augmentant pas la probabilité des suivants, il me faudra examiner toutes les pièces sans exception pour en avoir le cœur net.

C'est ce qui différencie les régularités accidentelles des lois : seul un examen exhaustif des instances peut les confirmer.

Cet aspect est, selon Dretske (et d'autres plus récemment, comme Lange), lié à la notion de nécessité naturelle : seules les régularités qu'on pense pouvoir être le produit nécessaire de lois de la nature peuvent être confirmées inductivement. On pourrait aussi dire qu'il est lié à la notion d'explication. Dans le cas des pièces de ma poche comme dans celui des lancés de pile ou face, il est peut-être des cas où l'on serait tenté de projeter nos premières observations sur les suivantes : si l'on pense qu'il existe une explication à cette apparente coïncidence. Peut-être la pièce est-elle truquée. Peut-être que les pièces de moins de 5 centimes s'échappent par un trou dans ma poche, et celles de plus de 5 centimes finissent dans mon portefeuille de toute façon. S'il y a une explication, alors le prédicat devient projectible, du moins dans le contexte où l'explication s'applique.

Il faudrait donc d'abord penser qu'une régularité est explicable, ou que si elle vaut, c'est en vertu d'être produite par une loi de nécessité naturelle, avant de raisonner inductivement.

Pour ma part, je pense que cet argument met la charue avant les bœufs en quelque sorte, et que le simple fait d'observer une régularité suffit, par induction, à nous laisser penser qu'elle vaut nécessairement, ou qu'elle peut s'expliquer. Je pense que les contre-exemples fournis par Dretske n'en sont pas vraiment. Si, enfant, l'on observait un jeu de pile ou face pour la première fois de notre vie, et que la pièce tombait dix fois sur pile, on serait je pense tenté de croire que les pièces tombent sur pile en général, et on aurait en cela parfaitement raison. Si l'on observe la situation adulte, on arrive à une conclusion différente, mais c'est simplement que plusieurs raisonnements inductifs sont en conflit : l'un, bien ancré, qui porte sur les pièces en général, et l'autre, tout neuf, qui porte sur cette pièce en particulier. Mais à parier, on sera très fortement poussé à chercher une explication si une pièce tombe 10, 20 ou 100 fois de suite sur pile. C'est donc je pense l'induction qui en premier lieu nous dit ce qui vaut pour catégorie projectible, ce qui demande éventuellement une explication, et non l'inverse.

La distinction entre loi et accident d'un point de vue bayésien

Transposons un moment ces idées dans un cadre bayésien. Dans le cas des corbeaux, je peux dire que chaque nouvelle observation conforte l'hypothèse que tous les corbeaux sont noirs, selon la loi de Bayes. Mais est-ce seulement par élimination, comme dans le cas des pièces de ma poche ? Ou est-ce que cela modifie les attentes que je projette sur la prochaine observation ?

Tout dépend en fait des "priors". Disons que j'émet des hypothèses a priori sur les résultats de mon observation, soit une séquence de dix résultats valant chacun "noir" ou "non-noir". Quelle crédence attribuer a priori à chaque séquence ?

Si je choisi de dire que toute séquence se vaut, je me trouve dans la situation suivante : l'hypothèse que tous les corbeaux sont noirs est assez peu plausible (elle est a priori de 1/1024), et si chaque nouvelle observation confirme légèrement l'hypothèse que l'issue de l'expérience sera la séquence "Noir, noir... Noir", c'est seulement par élimination : après la neuvième observation, il y a toujours une chance sur deux que le dernier corbeau soit noir, ni plus ni moins. Je suis incapable de projeter mon échantillon sur les cas non examinés.

Il existe une autre façon de distribuer les priors, qui consiste à affirmer que l'ordre importe peu. Ainsi j'attribuerai des crédences identiques non plus aux séquences ordonnées, mais à la proportion de cas positifs par rapport aux cas négatifs, et ensuite, pour chaque séquence exemplifiant cette proportion, une crédence identique. Je considère a priori qu'il y a une chance sur dix que dix corbeaux observés soient noirs, une chance sur dix qu'il y en ai neuf (bien que cette proportion soit exemplifiée par dix séquences différentes et non une seule), et ainsi de suite.

Remarquez que ceci revient, insidieusement, à donner plus de poids aux séquences régulières : ici se cache le postulat d'uniformité de la nature de Hume !

Si je procède de cette façon, alors mon predicat "être un corbeau" devient projectible : arrivé à la neuvième observation, un rapide calcul utilisant la formule de bayes montre que l'hypothèse "dix corbeaux noirs", est confirmée à un degré de dix chances sur onze, et c'est autant de chances que le dernier corbeau soit noir. Ceci tient au fait que la probabilité a priori d'avoir vu neuf corbeaux noirs si la bonne répartition était de 9/10 est très faible (il y avait a priori une seule chance sur dix que les neufs noirs tombent en premier et le non-noir en dernier), tandis qu'elle est de 1 dans l'hypothèse 10/10, ce qui rend cette dernière hypothèse plus crédible.

Nous pouvons donc imputer la différence relevée par Dretske entre les inférences sur les régularités accidentelles et celles sur les lois à une attribution différente de priors aux différentes hypothèses concernant le résultat d'une observation : dans un cas les séquences sont pondérées équitablement, et dans l'autre, ce sont les distributions.

Y a-t-il une bonne méthode d'attribution des priors ?

Plusieurs choses sont intéressantes à observer, la première étant que le postulat d'uniformité de la nature semble lui même pouvoir être dérivé de l'idée que l'ordre dans nos observations importe peu. Il semble y avoir un lien à la notion d'explication mentionnée plus haut : si l'on pense que l'ordre de nos observations n'importe pas vraiment, c'est qu'on pense que nos observations portent sur une caractéristique générale des corbeaux plutôt que sur une séquence de phénomènes indépendants les uns des autres. Autrement dit, les séquences observées s'expliquent par une caractéristique propre au corbeau.

Ceci semble appuyer l'idée que l'induction ne peut fonctionner que si l'on pense au préalable d'un type de phénomène qu'il obéit à une loi de nécessité naturelle, ou du moins qu'il est explicable, et que ce que l'on cherche à confirmer, c'est la bonne explication.

Pour être clair, je n'ai pas d'objection contre cette idée, mais il me semble que c'est ce qu'on pense a priori de tous les phénomènes. C'est le cas même des phénomènes purement aléatoires: ainsi on pense des lancés de pile ou face qu'ils ont en général une répartition de un pile pour un face (et *donc* que toutes les séquences sont équiprobables !). Le fait d'attribuer un même degré a priori à toutes les séquences de résultats dans ce cas ne peut, selon moi, que découler de l'idée préalable qu'il existe une certaine loi selon laquelle un lancé donne en moyenne autant de piles que de faces. Mais cette idée ne devrait pas être adoptée a priori. Elle ne devrait l'être que si cette loi a été préalablement confirmée par induction, au détriment des autres lois possibles. C'est en effet le cas pour les lancés de pile ou face, ça ne l'est pas pour les corbeaux : c'est ceci, et uniquement ceci, qui nous fait dire que la couleur des corbeaux est projectible quand le résultat d'un lancé de pièce ne l'est pas.

Au final, on peut voir le choix de pondérer a priori toutes les séquences de résultat possibles équitablement, ce que l'on fait dans le cas des lancés de pile ou face, comme un cas particulier de l'autre choix, celui qui consiste à pondérer les répartitions équitablement, à ceci près que certaines de ces répartitions ont été préalablement éliminées par induction. Pour cette raison, je pense que la bonne façon de raisonner est en général d'attribuer des degrés de crédence identiques aux caractéristiques des types d'objets et non aux instances, et donc de pondérer de manière équilibrée les rapports possibles dans la distribution des propriétés, les lois possibles, et non les séquences possibles. Ceci non seulement dans certains cas, mais dans tous les cas. Les distributions accidentelles se démarquerons alors naturellement comme celles qui ne sont pas uniformes.

Y a-t-il une justification à cette prescription ? La suivante : si l'on ne raisonne pas comme ça, on est incapable de procéder à la moindre induction, sauf à invoquer une mystérieuse intuition qui nous ferait croire que certaines propriétés sont projectibles et d'autres non, que certaines choses ont des explications et d'autres non, et à appliquer une règle distincte, permettant l'induction, pour les premières. Mais d'une part je ne crois pas en la magie, et d'autre part invoquer une multiplicité de méthodes de confirmation (d'attribution de priors) n'est pas très parcimonieux. Or il n'y a aucun besoin d'invoquer une telle intuition mystérieuse et une telle multiplicité de méthode, dans la mesure où, comme je l'ai montré, l'absence de projectibilité d'une propriété peut être fondée sur la découverte inductive d'une loi de répartition équitable entre elle et d'autres propriétés (je ne prétend pas ici résoudre les problèmes relevés par Goodman, comme le fait que le prédicat "noir avant l'an 2100 et blanc après" serait aussi projectible que le prédicat "noir").

Autrement dit, je pense que tout mérite a priori d'être expliqué, qu'on découvre les bonnes explications par induction, et qu'on découvre également que certaines choses ne méritent pas d'explication (comme le résultat d'un lancé de pile ou face) par induction.

À propos du bayésianisme subjectif

Je souhaite terminer par une seconde remarque qui concerne le raisonnement bayésien.

On voit, à la suite de ces exemples, que différentes règles d'attribution de priors peuvent nous faire aboutir à des conclusions radicalement différentes. Certaines nous amèneraient à être sans cesse surpris de voir un nouveau corbeau noir ("quelle séquence incroyable de résultat !") sans jamais postuler que tous les corbeaux sont noirs, ni même une proportion substantielle de ceux-ci. Notre crédence pour les nouveaux cas resterait inchangé en dépit des régularités passées. On serait, en quelque sorte, un sceptique à la Hume. D'autres règles d'attribution de priors, au contraire, nous amènent à des raisonnements ampliatifs et en particulier à accepter l'induction. Ces deux attitudes, ces deux façons de régler le choix des priors face à de nouveaux types de phénomènes, semblent sous-tendues par des choix métaphysiques différents, mais elles sont évidemment compatibles avec exactement les mêmes observations.

Je pense que c'est un gros problème pour les branches subjectivistes du bayésianisme : non seulement il faudrait croire que tout ceci n'est qu'une affaire de goût métaphysique (et non pas le fait d'avoir eu des expériences de vie différente), non seulement il n'y a jamais convergence dans les crédences des deux bayésiens (le premier bayésien attribuera une crédence nulle à toute généralisation universelle, même approximative, parce qu'il existe une infinité de séquences infinies possibles), mais surtout, certaines attributions de prior semblent foncièrement, objectivement, problématiques puisqu'elles minent tout raisonnement ampliatif. Si l'on ne procédait à aucune induction, on pourrait croire que le monde n'est qu'une mosaïque de fait sans lien les uns aux autres, et la science serait simplement impossible. Nous sommes donc en mesure d'affirmer la supériorité, d'un point de vue rationnel, de certaines règles d'attribution des priors: celles qui appliquent un principe d'indifférence aux lois générales plutôt qu'aux séquences d'observation possibles.

Pour cette raison (et pour d'autres) je pense que le seule voie viable est le bayésianisme objectif, fondé sur un principe d'indifférence s'appliquant aux hypothèses générales portant sur les types d'objets et que le bayésianisme subjectif qui refuserait d'affirmer que cette manière de procéder est la meilleure est une voie sans issue. On me rétorquera peut-être que le bayésianisme subjectif admet déjà implicitement que ce sont des lois générales, et non des séquences d'observation possibles, qui se voient attribuer des priors. Mais il s'agit déjà d'une restriction au subjectivisme, et je ne vois aucune raison de ne pas la pousser plus loin.

mardi 19 février 2019

Pourquoi je ne suis pas bayésien

Je ne suis pas Bayésien. En tout cas pas au sens où la formule de Bayes serait applicable et devrait être appliquée de manière universelle pour évaluer ses croyances. Je pense que la formule de Bayes a un domaine d'application très limité.

Mes raisons sont assez simple. La formule de Bayes est la suivante : p(H/D)=p(D/H)•p(H)/p(D).

Il est éclairant d'analyser p(D) comme la somme des p(D/Hi)•p(Hi), ou les Hi sont toutes les hypothèses possibles, et s'excluent mutuellement. De cette manière on se retrouve avec les éléments suivants dans la formule de Bayes :

  • p(H/D) ce qu'on cherche à calculer, à savoir le degré de confirmation d'une hypothèse H étant donné une donnée D
  • des données pour faire ce calcul, à savoir
    • p(Hi) des probabilités a priori pour toutes les hypothèses possibles
    • p(D/Hi) les prédictions de D par toutes les hypothèses Hi possibles.

Il s'ensuit que le domaine d'application de la formule de Bayes est l'ensemble des contextes où l'on dispose d'un ensemble d'hypothèses pondérées a priori et s'excluant mutuellement, hypothèses qui permettent de prédire la probabilité de certaines observations. Or ces contextes sont très limités. C'est pourquoi je ne suis pas bayésien.

Le cas où ça marche (et c'est utile)

Les cas où la formule de Bayes est utilisable sont ceux où l'on peut considérer des hypothèses a priori équivalentes entre elles, ou objectivement pondérables sur la base de statistiques, prédictives et exhaustives. C'est le cas si l'on veut savoir si quelqu'un est malade sur la base d'un test par exemple, connaissant la prévalence de la maladie dans la population (ce qui permet la pondération objective d'hypothèses exhaustives) et l'efficacité du test (hypothèse prédictive). Mais ça suppose en général qu'on ait déjà accepté un arrière fond théorique, ici la prévalence de la maladie et l'efficacité du test. Peut-on utiliser la formule de Bayes pour évaluer cet arrière fond lui même ? Je vais me concentrer maintenant sur des cas d'hypothèses scientifiques.

Il est utile de distinguer les théories scientifiques des modèles. Pour s'en tenir à la physique, j'entends par théorie un cadre général, quelque chose comme la physique quantique ou la théorie de la relativité : un vocabulaire (électron, spin, masse), un formalisme mathématique et certaines lois et principes d'application. Je suppose que le vocabulaire est interprété empiriquement ("spin" est associé à certaines configurations expérimentales).

J'entends par modèle quelque chose comme le modèle de l'atome d'hydrogène en physique quantique, ou un modèle relativiste de l'univers en cosmologie : une structure mathématique construite à partir de la théorie (qui utilise son langage, son formalisme et ses lois), et qui représente quelque chose de particulier : un objet ou un type d'objet.

Si l'on adopte cette façon de voir les choses, plusieurs remarques s'ensuivent :

  • une théorie fonctionne un peu comme une collection de modèles possibles. Étant donné un objet donné, on peut envisager plusieurs modèles possibles (peut-être une infinité) permis par la théorie. Par exemple : la théorie de la relativité fournit un ensemble de modèles de l'univers possibles.
  • il semble censé de partir du principe que tous ces modèles se valent. C'est ce qu'on appelle parfois un principe d'indifférence. Ce principe est applicable au moins quand les modèles se ressemblent suffisamment pour qu'on puisse les situer dans un espace des modèles (par exemple ils diffèrent par la valeur d'un ou plusieurs paramètres).
  • un modèle particulier est en général prédictif. Par exemple, un modèle de l'atome d'hydrogène prédit que certaines fréquences lumineuses seront absorbées ou émises.

Autrement dit au sein d'une théorie, on dispose potentiellement de tous les éléments pour appliquer la formule de Bayes : des hypothèses pondérées et des prédictions probabilistes. J'ai pris des exemples issus de la physique mais j'imagine que ça peut être étendu par exemple à la biologie, si l'on se place dans un cadre où, par exemple, plusieurs modèles évolutionnistes prédisent différentes fréquences pour certains gènes.

Mais ceci ne fonctionne que pour autant qu'on parte du principe que notre théorie est la bonne. Le bayesianisme n'est pas pour l'instant une formule parfaitement générale du savoir, puisqu'il ne permet pas d'évaluer les théories elles-mêmes. Or c'est bien ce qu'on voudrait pour évaluer nos croyances général : ne pas avoir à accepter un cadre théorique au préalable.

Le cas où ça ne marche plus

Que se passe-t-il si l'on monte d'un niveau pour s'intéresser non plus aux modèles mais aux théories ? Jusqu'ici personne n'a jamais calculé le degré de confirmation de la théorie de la relativité, mais serait-ce faisable en principe ? Ici on rencontre les aspects suivants, bien connus des philosophes des sciences :

  • les observations sont chargées de théories, notamment parce que les théories sont utilisées pour fabriquer des instruments de mesure et interpréter leurs résultats. Par exemple, la masse newtonienne n'est pas la masse relativiste. Dans ce cadre, rien ne garanti que comparer des "p(D/Ti)" pour différentes Ti ait beaucoup de sens si la manière d'interpréter D dépend de Ti. Ceci dit on pourrait penser qu'il existe parfois des traductions possibles, un vocabulaire neutre permettant de comparer les théories entre elles, ou au moins leurs predictions dans les cas précis qui nous intéressent... Peut-être, mais
  • les théories ne font de prédictions que accompagnées d'hypothèses auxiliaires. On doit notamment faire des suppositions à propos de l'objet qu'on souhaite représenter dans la théorie pour pouvoir limiter les modèles possibles, et donc prédire : il s'agit de choisir comment modéliser tel ou tel phénomène dans la théorie. Mais la théorie à elle seule ne peut faire aucune prédiction quantifiée. Les p(D/T) n'existent simplement pas !
  • On pourrait assimiler p(D/T) à la somme des prédictions de D par des modèles quelconques de T en adoptant un principe d'indifférence sur les modèles possibles. Mais en général ce n'est pas ce qu'on veut faire : la théorie de la relativité n'est pas bien confirmée parceque la plupart des modèles possibles pour les phénomènes font de bonnes prédictions, elle est confirmée parce qu'un modèle en particulier, qu'on pense être le bon, fait de bonnes prédictions...
  • On pourrait assimiler p(D/T) à la prédiction du meilleur modèle de T. Mais à coup d'hypothèses ad-hoc on trouvera toujours des modèles qui prédisent ce qu'on veut. Il faut spécifier "meilleur" (le modèle doit être suffisamment simple ?) et on s'éloigne de la formule de Bayes.
  • incidemment, il est reconnu que différents critères pragmatiques entrent en jeu pour sélectionner les théories : la simplicité, la portée unificatrice, la fructuosité... Les théories ne sont jamais comparées uniquement par leur adéquation aux données, comme un bayésianisme radical pourrait laisser penser.
  • et si ça ne suffisait pas : il n'existe pas vraiment d'espace des théories au sein duquel on pourrait appliquer un principe d'indifférence pour leur attribuer un poids. En général, on n'a pas accès à l'ensemble des théories possibles. Personne n'avait envisagé la relativité avant Einstein. Il n'y a donc aucun sens à attribuer des valeurs aux p(Ti).
En résumé, la formule de Bayes est applicable à l'intérieur d'un cadre théorique bien délimité qui permet de pondérer les hypothèses, mais elle est inutilisable pour évaluer les cadres eux-mêmes.

Les degrés de crédence n'ont aucun sens

Les bayésiens rejettent généralement ce dernier point en évoquant des degrés de crédence, mais je pense qu'ils ont tort. Leur idée est qu'on n'a aucun besoin d'avoir une méthode objective, comme le principe d'indifférence, pour attribuer un poids a priori aux théories : on peut leur attribuer un poids subjectivement. Ce serait peut-être une manière d'accommoder l'existence de critères pragmatiques comme la simplicité dans le choix des théories (on accorderait plus de poids a priori aux théories simples). On pourrait répondre aux autres points en défendant que ce sont des modèles "toutes théories confondues" qui sont comparés : la formule de Bayes aurait bien une portée universelle.

C'est très bizarre parce qu'on pourrait envisager qu'un modèle relativiste s'applique mieux à tel type phénomène, et un modèle newtonnien à tel autre : on perd une forme d'unité explicative qui semble vraiment être la marque de fabrique de la science. J'ignore s'il est possible de la retrouver dans un cadre bayésien.

Mais peu importe. Ils ont tort d'adopter les degrés de crédence pour les raisons suivantes :

  • la connaissance, scientifique notamment, n'est pas une affaire individuelle mais un produit collectif. Ce que croient telle ou tel scientifique n'a pas d'importance en science. Les hypothèses doivent donc être évaluées de manière objective, en utilisant par exemple un principe d'indifférence, pas des degrés de crédence. Pour les théories, la seule méthode est celle du consensus : on adopte le paradigme dominant tant qu'il continue de fonctionner.
  • même si les croyances individuelles avaient de l'importance, les degrés de crédence n'ont aucune pertinence psychologique. Ils ne sont pas invoqués par les neurosciences pour expliquer le fonctionnement du cerveau par exemple. Il n'est pas certain que l'on ait des dispositions stables à répondre par oui ou non à toutes les questions indépendamment du contexte.
  • on pourrait répondre que les degrés de crédence, même s'ils n'entrent pas en jeu dans notre fonctionnement psychologique, devraient être utilisés. Le bayésianisme serait normatif plutôt que descriptif. Mais ça suppose qu'on ait accès à de tels degrés de crédence (qui seraient une disposition à répondre "oui" à la question "X est-il vrai ?"), et je ne pense pas que ce soit le cas. Si tant est que la question ait un sens, j'ignore complètement mon degré de crédence exact de "Bruxelles est la capitale de la Belgique". Ce que je n'ignore pas forcément, c'est quel serait le prix à payer, les conditions nécessaires, pour me faire abandonner cette idée, et je sais que ce serait très coûteux. Mais rien qui s'approche d'un nombre entre zéro et un. Les degrés de crédence n'ont aucune pertinence normative parce qu'ils ne sont pas évaluables.
  • et même s'ils étaient évaluables, pourquoi auraient-ils une pertinence normative ? Ma disposition à répondre "oui" a une question existe peut-être de manière stable dans certains cas. Mais pourquoi serait-elle idéalement un bon guide pour la rationalité ? Ça semble être une erreur de partir d'un fait pour arriver à une norme.

Les degrés de crédence n'ont donc simplement aucun intérêt particulier, que ce soit pragmatiquement pour diriger nos actions, théoriquement pour décrire notre psychologie ou épistémologiquent pour fixer les connaissances scientifiques. Au mieux, le bayésianisme généralisé est une belle métaphore.

Une alternative

J'ai expliqué pourquoi je ne suis pas un bayésien radical mais je n'ai pas proposé d'alternative. Je vais maintenant le faire.

Tout d'abord je pense qu'il est une chose à retenir du bayesianisme sur le plan philosophique : en principe, presque toutes nos croyances sont révisables. On devrait être prêt à revoir nos croyances si suffisamment d'éléments s'offrent à nous. Je suis même d'accord pour dire que certaines croyances sont plus facile à réviser que d'autres. Ce que je rejette c'est uniquement l'idée que ça devrait être quantifié (et que ne pas quantifier nos croyances serait irrationnel). La manière dont j'envisage les choses est seulement qualitative au lieu d'être quantitative.

Entendons nous bien : on peut utiliser la formule de Bayes dans plein de contextes dès qu'on dispose d'un ensemble quantifiable d'hypothèses, mais c'est l'exception plutôt que la règle, et ça suppose d'accepter un cadre qui lui ne fait pas partie d'un ensemble quantifiable.

L'alternative que je propose est inspirée de la notion de schème conceptuel du philosophe Quine. Un schème conceptuel est simplement un ensemble de croyances auxquelles on adhère, sur lesquelles on est prêt à se baser pour l'action. L'alternative au bayésianisme que je propose consiste simplement, au lieu d'attribuer une probabilité à chacune de ses croyances, à se demander : que faudrait-il pour me faire abandonner cette croyance ? À quel point devrais-je réviser mon schème conceptuel ?

Le premier avantage de cette façon de voir les choses est qu'elle ménage une place à la suspension de croyance : il y a plein de choses sur lesquelles je n'ai aucune opinion précise (et me forcer à en adopter une en me mettant un pistolet sur la tempe ne révélerait rien d'intéressant). Il y a une différence entre estimer qu'une pièce a une chance sur deux de tomber sur pile et ignorer complètement la température de fusion du plomb, ne jamais s'être posé la question, ce dont le bayesianisme ne peut rendre compte. Or pour l'immense majorité des propositions, je n'ai simplement aucune croyance, ni dans un sens ni dans un autre, parce que je ne m'y suis jamais intéressé.

Mais le principal avantage est qu'on arrive à une manière beaucoup plus fine d'évaluer nos croyances. On peut comprendre pourquoi certaines croyances sont quasiment indélogeables, parce que les rejeter demanderait de rejeter du même coup un ensemble gigantesque de croyances associées. Si j'apprends que je suis un cerveau dans une cuve et que mon monde est simulé, tout ce que je croyais savoir tombe à l'eau. Ou encore, je devrais remettre en question énormément de connaissances scientifiques et d'expériences vécues avant d'accepter que la terre est plate (il faudrait m'expliquer de manière convaincante que des millions de gens sont dans l'erreur).

Un bayésien serait tenté d'affirmer que son degré de croyance en "le monde est bien réel" est très proche de 1, mais ça n'a aucun sens. On peut comprendre beaucoup mieux pourquoi cette croyance est si bien ancrée en considérant ce qu'il nous faudrait avaler pour la rejeter. Et on peut comprendre que beaucoup d'autres croyances n'ont pas le même statut : que le vélo de mon voisin soit jaune ou vert ne change pas grand chose (à moins que ça ne remette en cause l'idée que ma vision est fiable). C'est une manière de comprendre ce qu'on veut dire quand on dit "c'est fort possible" (il m'en faudrait peu pour intégrer cette croyance dans mon schème) ou "ça m'étonnerait" (il en faudrait beaucoup). Et cette façon de voir est plus subtile parce qu'elle nous autorise à qualifier ce qu'il faudrait pour accepter ou rejeter une croyance. On peut même obtenir un ordre partiel entre les croyances : certaines sont strictement plus fortes que d'autres quand elles les présupposent. Mais pour ce faire, il est inutile de leur attribuer un hypothétique nombre.

Cette façon de voir les choses ne vous empêche pas de bien agir, de tenir compte des risques d'erreur. Elle permet même d'en tenir compte de manière fine. Et dans les rares cas où les risques sont quantifiables, rien ne vous interdit de faire des calculs. Mais jamais vous n'aurez à vous appuyer sur des quantifications subjectives qui n'apportent rien.

Oubliez donc cette idée que vos croyances ont un poids entre 0 est 1 sur lequel vous devriez parier : c'est un jeu inutile. Pensez plutôt en mode tout ou rien (vous vous engagez envers ou contre certaines croyances, êtes indifférents à propos des autres) et considérez les liens conceptuels qui unissent les croyances entre elles, et les raisons qu'il y aurait de les rejeter ou de les accepter en restant cohérent. Soyez prêt à le faire. Vous aurez tous les avantages du bayésianisme (en particulier l'anti-dogmatisme) sans vous encombrer de chimères.

jeudi 22 novembre 2018

Pistolets sur la tempe et degrés de crédence

SigP220-pistol

et Monsieur Phi publient des vidéos youtube super intéressantes sur plein de sujets (l’intelligence artificielle, la morale, le réalisme sémantique) ainsi que de longues discussions (sur la chaîne Axiome). Autant je trouve leur vidéos passionnantes, autant je suis parfois en desaccord avec eux non forcément sur ce qu’ils disent, mais sur le cadre de discussion même qu’ils adoptent, et je voudrais essayer de mettre le doigt sur ce desaccord philosophiques, en espérant initier une discussion (mais comme je suis “old school”, ce sera par blog plutôt qu’en vidéo).

Ce n’est pas toujours facile d’exprimer exactement ce qui me gène, mais un bon point de départ est l’idée que l’on peut attribuer des degrés de crédence à n’importe quelle croyance (la consistance de l’arithmétique de Peano, le réalisme moral, …) (ceci dit Lê ne semble pas y adhérer totalement, puisqu’il affirme dans le dernier axiome (au cours du débat sur le réalisme moral) que ça ne peut être applicable qu’aux croyances qui prédisent des données observables).

Souvent ils utilisent dans leur discussion une petite expérience de pensée pour déterminer ces degrés de crédence : “imagine qu’on te mette un pistolet sur la tempe, que parierais-tu ?”. Une manière d'éliminer artificiellement la possibilité de suspendre son jugement.

A chaque fois qu’ils invoquent cette histoire de pistolet sur la tempe, je décroche, d’autant plus vite que le pari en question concerne une idée philosophique abstraite. Je vais essayer d’expliquer pourquoi.

Je souhaite traiter de trois problèmes à propos de cette idée :

  • L’expérience de pensée, en soi, ne montre pas qu’on a des croyances et degrés de crédences
  • L’idée suppose au départ que les questions (ou les croyances en général) ont une signification de manière absolue (réalisme sémantique) or ce n’est pas du tout évident
  • Elle suppose ensuite que l’adoption de croyances prenne la forme de degrés de crédence précis, or ça n’a rien d’évident non plus

1) Le pistolet sur la tempe ne montre rien

Remarquons d’abord que l’expérience de pensée en elle-même ne montre pas grand chose (je ne pense pas que Lê et Monsieur Phi l’utilisent comme un véritable argument donc ils peuvent être d’accord avec moi sur ce point).

Elle nous amène simplement à considérer que dans cette situation hypothétique, on répondrait forcément quelque chose, du moins si l’on ne veut pas mourir. Mais d’une part ce n’est pas certain (on pourrait être frappé de stupeur et devenir muet), en ensuite, surtout, ce n’est pas parce qu’on répondrait quelque chose que l’on répondrait ce que l’on croit, et qu’il y ait vraiment quelque chose que l’on croit de bien défini avant que la question ne soit posée.

J’ai l’impression que si on me posait une question sur la consistance de l’arithmétique de Peano, je répondrais au hasard non pas parce que j’ai une croyance de exactement 0,5, mais simplement parce que je n’ai pas de croyance, je ne suis pas même certain que la question ait un sens de manière absolue et qu’elle ait une réponse (elle est indémontrable et je suis anti-réaliste à propos des entités abstraites comme les nombres donc bon...). En fait je chercherais plutôt à satisfaire mon interlocuteur qu’à exprimer ce que je crois vraiment. Et si je "flippe", c'est parce que j'ai peur que mon interlocuteur ne soit pas satisfait par la réponse.

(Edit: si on me pose une question sur quelque chose de plus tangible, par exemple l'issue d'un match de tennis (commme le propose Monsieur Phi dans les commentaires de ce post) évidemment la situation implique que je vais essayer de répondre ce qui correspondra vraiment à l'issue du match. Pour autant est-ce que ça indique que j'avais au préalable une croyance concernant ce match, une préférence épistémique ? Je ne pense pas : ça me demande simplement de faire une estimation à la volée, en panique, et je vais faire ce que je peux mais le résultat de mon estimation n'a pas forcément de pertinence épistémologique. Il est très possible que le hasard intervienne plutôt que seulement mais croyances, que la situation affecte la manière dont je vais faire mon évaluation, etc. : en fait c'est une question de psychologie cognitive que de savoir ce qui va sortir comme réponse. Mais l'expérience en elle-même ne montre pas que ce qui va sortir est rationnellement pertinent et correspond à des degrés de crédence préalables. En tout cas c'est encore plus problématique quand il n'existe pas vraiment de moyen aussi clair de vérifier le pari).

Ce que je veux dire c’est qu’il peut y avoir plein de raisons de répondre une chose ou l’autre dans ces circonstances, et que le fait d’entretenir des croyances précises n’est pas la seule envisageable. Ce n'est pas parce qu'on est forcé à répondre qu'on a cessé de suspendre notre jugement.

On pourrait me rétorquer : tu fais des remarques purement psychologiques, ce n’est pas pertinent, imagine que tu sois motivé à répondre ce que tu crois vraiment, alors que répondrais-tu ? Mais pour moi la psychologie a toute sa pertinence puisque les croyances sont d’abord des objets de la psychologie, en particulier des objets sensés expliquer notre comportement, et la façon dont on répond aux questions.

Donc ces remarques ont toute leur pertinence : je ne suis pas du tout convaincu que la notion de croyance, qui prendrait la forme d’une proposition dotée de signification absolue associée à un degré de crédence, soit une entité psychologiquement pertinente pour expliquer nos comportement, surtout s’il s’agit d’attribuer des croyances à propos de n’importe quel sujet, comme la consistance de l’arithmétique (bien sûr je pense que la notion de croyance en général est pertinente pour expliquer nos comportements, ce dont je doute, c’est qu’elle puisse être ainsi étendue à toute question et hors de tout contexte : je reviens la dessus dans ce qui suit).

2) les questions ont-elles un sens ?

Un autre problème est que tout ceci suppose que les questions et réponses possibles qu’on poserait dans une telle situation ont une signification bien déterminée et une valeur de vérité fixe.

C’est ce qu’on appelle le réalisme sémantique. Monsieur Phi a fait une vidéo la dessus récemment. Il y a fait la part belle au réalisme, mais c’est un sujet qui fait encore débat en philosophie.

Pour ma part, j’ai de fortes inclinaisons pragmatistes plutôt que réalistes, pragmatistes au sens d’associer la vérité à une utilité idéale (ce qu’on croirait au terme d’une enquête idéalement bien menée) plutôt qu’à une correspondance à la réalité, c’est à dire d’inverser l’ordre de priorité entre vérité et croyance (définir la vérité à partir de la croyance plutôt que l’inverse). (pour ceux qui connaissent un peu l'épistémologie, une de mes raisons est que les problèmes type Gettier sont selon moi insolubles)

Je ne vais pas m’étendre la dessus, parce que la philosophie du langage peut devenir assez vite technique, mais quelques remarques : il est généralement accepté, en philosophie du langage, que le contexte affecte la signification des énoncés (“tout le monde dort” dépend du contexte : on ne veut pas dire littéralement tout le monde). On parle souvent de signification en termes de conditions de vérité. Il existe des débats pour savoir en quelle mesure le contexte agit sur la signification effective :

  • soit il existe une signification conventionnelle (des conditions de vérité par défaut associées aux phrases) qui est altérée par le contexte pour donner la signification effective
  • soit la signification conventionnelle n’est en fait qu’un potentiel de signification mais seuls les énoncés particuliers, en contexte, ont des conditions de vérité

Je penche personnellement pour la seconde option. Et je penche même pour l’idée qu’il n’existe pas vraiment de propositions, c’est à dire d'entités abstraites porteuses de signification absolue, hors contexte. Ceci a l’avantage d’éviter d’être réaliste envers ces entités abstraites que sont les propositions, au même titre que je ne pense pas que les nombres existent vraiment. Tout ce qui existe hors contexte, ce sont éventuellement des potentiels de signification associés aux usages conventionnels des mots. Mais les significations effectives devraient pouvoir s’analyser ultimement en termes de croyances particulières, et ces croyances en termes de dispositions à agir ou de guides pour l’action, et non en termes de correspondance au monde. (de même pour reprendre l'exemple de la vidéo de Monsieur Phi, je pense qu'une bonne carte doit être jugée à la manière dont elle permet de naviguer efficacement dans un certain contexte d'utilisation, non en termes de correspondance au monde, ce qui évite d'avoir à imaginer qu'il existe dans le monde de véritables propriétés naturelles comme "être une station de métro" qui ne dépendraient pas fondamentalement d'un certain usage).

S'il n'y a de signification qu'en contexte, est-ce que les conversations abstraites sont inintelligibles ? Non : simplement, quand nous entretenons des discussions abstraites, nous nous mettons d’accord sur la meilleure façon d’organiser nos concepts. Ce sont toujours des guides pour l’action, mais de manière plus générale, plus indirecte et indépendante de contextes particuliers. Discuter du réalisme moral, c’est discuter de la meilleure façon de parler du bien et du mal (la plus cohérente, efficace, tenant compte de l’usage conventionnel des mots). Et en ce moment je suis en train d'essayer de vous convaincre d'adopter ce qui est, selon moi, la meilleure façon de parler de croyances et de vérité.

C’est en gros ce en quoi consiste une approche pragmatiste, quand le réaliste affirmera que les propositions ont des conditions de vérité de manière absolue, hors contexte, qui tient à leur correspondance à la réalité.

Si vous comprenez mon approche, vous devinez que j’aurais tendance à résister à l’idée qu’on puisse attribuer une valeur de vérité ou des degrés de crédence à des choses comme la consistance de l’arithmétique de Peano ou le réalisme moral. Si l’on me met un pistolet sur la tempe et qu’on me demande ce qui est vrai, ma seule façon de comprendre cette question est : laquelle de ces croyances est la plus efficace dans le contexte présent ? Laquelle devrais-tu employer comme guide pour l’action ? Et si la question porte sur l’arithmétique de Peano, ma réponse sera : aucune croyance à ce sujet n’a de pertinence dans ce contexte ! Donc je répondrais : ni l’une ni l’autre. Et si cette réponse n’est pas acceptable, alors je répondrais au hasard, convaincu que mon interlocuteur se méprend sur la signification de sa propre question. (Edit: à la limite, je pourrais répondre que l'arithmétique est consistante parce qu'elle est utile (pour nous) et qu'on doit supposer sa consistance pour l'utiliser, et qu'il n'y a pas de valeurs objectives parce que cette idée introduit un fossé entre le bien et la motivation à faire le bien, et donc est inutile (pour nous), mais en tout cas il ne s'agit pas de correspondance absolue à la réalité).

On voit que l’expérience de pensée du pistolet sur la tempe présuppose qu’il y a une “bonne” réponse, et que les raisons de "flipper" quand on répond ont à voir avec la vérité, mais en fait, ça n’a rien d’évident, au moins quand les critères qui permettront de savoir qui a gagné le pari ne sont pas clairement spécifiés d'un commun accord.

(Pour cette raison j’étais assez en accord avec l’idée de Lê que l’attribution de probabilités n’a de sens que dans le cadre de Solmonoff, c'est-à-dire pour les croyances prédictives).

3) Les croyances ont-elles des degrés de crédence ?

Ceci dit, même pour les choses plus concrètes que je crois fermement, comme le fait que Bruxelles est la capitale de la Belgique, j’ai tendance à trouver absurde l’idée qu’on pourrait leur associer un degré de crédence, un nombre parfaitement défini entre 0 et 1. J’ai l’impression que n’importe quel nombre choisi sera plus ou moins arbitraitre (pourquoi 0,9965 plutôt que 0,9964 ?). C'est d'ailleurs une des principales raisons pour lesquelles je décroche quand Lê et Monsieur Phi évoquent l'expérience de pensée et s'amusent à estimer des degrés de crédence. Je pense qu'il n’y a pas vraiment de degré de crédence associé à cette croyance que Bruxelles est la capitale de la Belgique.

Ou plutôt si : dans la plupart des contextes, ce degré de crédence est exactement de 1. Non pas 0,9999… mais bien 1 : Bruxelles est la capitale de la Belgique, c'est indéniable. Il existe un certain nombre de contextes dans lesquels ce degrés de crédence passerait à exactement 0. Mais ces contextes sont très rares.

En fait ma façon de voir l’adoption des croyances est plutôt en mode tout ou rien : nous adoptons certaines idées comme guide pour l’action (c’est ce que nous appelons les croire) et d’autres non. Ca peut dépendre du contexte, et ça vaut y compris pour les énoncés abstraits. J’adopte l’idée que l’arithmétique de Peano est consistante quand je fais de l’arithmétique, mais pas forcément si je fais des méta-mathématiques.

Un avantage de cette façon de voir les choses est qu'elle rend la suspension de jugement parfaitement intelligible (je pense qu'il y a une différence entre suspendre son jugement et attribuer une probabilité de 0,5 à un énoncé). Si j’adopte une croyance, je n’adopte pas sa négation en même temps, mais je peux n’adopter ni l’une ni l’autre. Par exemple je ne crois pas qu’il y avait plus de 300 cheveux sur la tête de Platon à sa naissance, mais je ne crois pas l’inverse non plus, et si on me pose la question, je suis embêté pour répondre : je peux décider d’une adoption à la volée, mais ce choix sera plus ou moins aléatoire, ça ne reflète certainement pas une croyance préalable. Ou tout au plus une croyance sur le nombre de cheveux sur la tête des bébés en général.

Ce qui est vrai, cependant, c’est que certaines de mes croyances sont plus ou moins révisables. Mais encore une fois, je ne vois pas de raison de leur attribuer un “degré de révisabilitée” : il me semble plus correcte de penser qu’il existe plus ou moins d’expériences qui m’amèneraient à les réviser. Par exemple, il en faudrait beaucoup pour me convaincre que Bruxelles n’est pas la capitale de la Belgique (il faudrait d’abord me convaincre qu’on m’a trompé depuis toujours, ou qu’il vient d’y avoir un coup d’état, qu’une telle chose est possible en Belgique aujourd’hui). Il faudrait réviser beaucoup de croyances avant de pouvoir réviser celle-ci. Mais ce ne serait pas très difficile de me convaincre que Platon était plutôt chevelu.

Il y a donc un sens à dire qu’une croyance est plus ou moins ancrée, parce qu’il faut revoir une plus ou moins grosse partie de mon schème conceptuel pour la déloger. Il existe aussi des cas ou l’on est prêt à envisager que l’on se trompe : on imagine de futurs contextes qui nous ferons déloger une idée (et peut-être que notre schème conceptuel peut osciller entre plusieurs états au fil de notre imagination). Mais si certaines croyances sont plus faciles à déloger, ça ne justifie pas d’attribuer à toutes mes croyances un nombre entre 0 et 1 (pour le faire il faudrait disposer de quelque chose comme une mesure sur les contextes possibles, de manière à évaluer la probabilité qu'une croyance soit révisée, et je doute qu'on dispose de telles mesures en toute généralité).

En somme, je pense qu'il est plus pertinent de parler de coût épistémique associé à la révision d'une croyance que de degré de crédence, parce que ceux-ci ne sont en général pas évaluables. La notion de coût épistémique est qualitative, et plus fine parce qu'elle n'est pas unidimensionnelle. Certaines choses me feraient réviser certaines croyances et pas d'autres.

Mais il y a bien des probabilités ?

Certes, il y a bien des probabilités, et elles sont très utiles en science et parfois dans la vie courante. Mais à mon sens le seul cadre dans lequel il y a du sens à attribuer de manière fiable des probabilités à des énoncés, c’est quand on dispose d'un cadre précis pour évaluer les options et qu'on peut appliquer quelque chose comme un principe d’indifférence (c'est à dire, en l'occurrence, avoir une mesure sur les contextes possibles ! mais dans un cadre limité).

Par exemple, si l’on jette un dé à 6 faces, on peut dire~: il y a une chance sur 6 pour qu’il tombe sur 3. Ou encore, dans un contexte scientifique, si une théorie fait des prédictions probabilistes. Cependant ça ne fonctionne que parce que l'on refuse d'envisager un certain nombre de possibilités non quantifiable : qu'une bombe explose au moment où on allait jeter le dé ou qu'un appareil soit mal branché dans l'expérience par exemple. Ca ne fonctionne que parce qu'on tient un certain contexte pour fixe, pragmatiquement, comme pré-requis pour que l'énoncé ait un sens. C'est ce contexte qui fixe la manière dont on va évaluer les résultats d'un "pari".

Est-ce que ça veut dire que, au moins dans ce cadre fixe, j’ai un degré de crédence de 1/6 envers la proposition “le dé va tomber sur 3” ? Pas vraiment je pense (mais je serai peut-être prêt à réviser ma façon de voir les choses sur ce point) : je dirais que je n’entretiens aucune croyance envers le nombre qui va appararaître. Rien qui ne puisse servir de guide à mes actions. Ceci dit, j’entretiens bien une croyance à propos de la proposition “il y a une chance sur 6 que le dé tombe sur 3”, et cette croyance peut me servir de guide pour parier par exemple. Je peux également utiliser la formule de Bayes, tant que je suis capable d’attribuer des probabilités a priori aux hypothèses de manière objective dans un tel cadre bien défini, sur la base d’un principe d’indifférence par exemple.

Mais si j’entretiens cette croyance probabiliste, c’est uniquement parce que le cadre est correctement défini, pragmatiquement tenu pour fixe, et que je peux appliquer un principe d’indifférence pour déterminer des priors. Ce ne sont jamais des probabilités absolues : le lanceur de dé peut aussi avoir une crise cardiaque (on pourrait rétorquer que j'attribue une probabilité absolue à un conditionnel : si le contexte est le bon, alors... Mais j'aurais peine à lister les conditions).

(Edit: suite à une discussion avec Lê, j'imagine qu'on peut parfois aussi évaluer des ordres de grandeur de probabilités pour des hypothèses moins bien définies, mais qui pourraient l'être en principe, et que ça peut être utile mais les mêmes remarques s'appliquent)

Si maintenant on me demande la probabilité que l’arithmétique de Peano soit consistante ou que le réalisme moral soit vrai, il n'existe aucun cadre pour attribuer des probabilités et je peux sans peine répondre que je n’entretiens aucune croyance à ce sujet, qu'il s'agit plutôt pour moi de cadres à adopter et à évaluer en termes d'utilité pratique que de vérités ou de faussetés. Si l'on me demande si Platon avait plus ou moins de 300 cheveux sur sa tête à sa naissance, je dirais (faute de m'y connaître en cheveux de bébés) que je n'entretiens aucune des deux croyances, et si l’on me met un pistolet sur la tempe, je répondrais bien quelque chose, certes, au hasard sans doute, j'imagine que mon schème conceptuel va se mettre à osciller entre ces deux possibilités et que sous le coup d'une impulsion, l'une des deux va s'exprimer, mais au fond, ça n’a aucun rapport avec les croyances que j’entretiens. J’ai peut-être certaines dispositions préalables à répondre par “oui” ou par “non” à cette question si l’on me met un pistolet sur la tempe (les oscillations passeront plus de temps dans l'une des deux options ?). Mais le rapport entre ces dispositions et mes croyances n’est pas direct, puisqu'en l'occurrence je n'ai aucune croyance sur la chevelure de Platon, et ces dispositions n'ont pas à voir avec d'hypothétiques degrés de crédence : il s'agit simplement de la dynamique de mon schème conceptuelle en situation extrême.

Conclusion

Voilà en somme pourquoi certains passages des discussions qu’entretiennent Monsieur Phi et Lê, pour intéressantes que soient ces discussions dans leur ensemble, m’échappent quelque peu. Je comprend bien que leur approche est beaucoup plus réaliste que la mienne (en tout cas pour Monsieur Phi) et je n’ai pas de mal à suivre leur conversation, mais par moment les bases mêmes de la discussion me semblent caduques.

Je serai curieux de savoir ce qu’ils pensent de tout ça et s'ils ont de bons arguments contre ce type d'approche pragmatiste, de bonnes raisons pour moi de déloger ce cadre. Je serai prêt à parier (sans trop flipper) qu’ils ne sont pas entièrement d’accord avec cette façon de voir les choses, peut-être même pas du tout : je veux dire par là que ces croyances font partie de celles que j'entretiens en ce moment même...