jeudi 10 mars 2016

La philosophie inutile ? Dépassée par les sciences ? Sur les malentendus du positivisme naïf.

J'avoue avoir du mal à comprendre la raison pour laquelle certains scientifiques (généralement des physiciens médiatiques) s'évertuent à déclarer la mort de la philosophie (voir ici et  ). Il y a comme des relents de guerre des sciences dans tout ça. Je veux parler de l'époque (les années 70-80) où la sociologie développait son "programme fort", résolument relativiste, visant à réduire l'édifice scientifique à une construction sociale. Ce projet est bel et bien mort et pour ma part je n'aurai aucun mal à me situer du côté des sciences dites "dures" dans ce débat. En tout cas pour ce qui est de la conception qu'il faut avoir de la vérité, de l'objectivité et du but de la science : découvrir ce qui existe indépendamment de nous et de nos façons de les concevoir. Il ne s'agirait pas de nier les apports de l'époque, et notamment les critiques qu'on peut faire à un positivisme naïf qui dirait que nous ne faisons que poser des hypothèses pour les confronter à l'expérience (comme si la réalité nous répondait par "oui" ou par "non"). Nombreux sont les facteurs non empiriques qui participent à la construction des théories : la recherche de simplicité, d'unification, et même le conservatisme quand aucune alternative à nos théories se présente à l'horizon. Mais si l'on considère la communauté scientifique au sens large et sur le long terme c'est bien quelque-chose comme la vérité et l'objectivité qui est visé dans les sciences et leur succès atteste d'une certaine réussite dans cette entreprise.

Nous ne sommes plus à l'époque de la guerre des sciences. Les relativistes ont montré une certaine faiblesse, n'ayant pas d'exemples convaincants à fournir d'une véritable emprise culturelle sur les résultats empiriques, et leur conception du langage et de la signification (l'idée qu'il y aurait des schèmes conceptuels incommensurables) s'avère difficilement défendable. Beaucoup de philosophes contemporains en conviennent. Nous sommes plutôt dans une époque où la philosophie des sciences tient la science en respect et essaie de lui donner sens, par exemple en tentant d'élaborer des formes de réalisme cohérentes et qui évitent l'inflation métaphysique : un entre-deux difficile à maintenir, mais c'est notre boulot...

Pourquoi alors ces attaques ? La guerre des sciences que ces acteurs tentent de raviver est cette fois initiée non pas par les sciences humaines mais par les sciences dures. Ce sont les sciences humaines, et en particulier la philosophie, qu'on veut décrédibiliser comme une entreprise inutile qui a fait son temps. Les physiciens n'ont pas besoin de philosophie : eux seuls sont à même de dévoiler la nature du monde. La philosophie ne progresse pas. Les poncifs habituels issus d'une méconnaissance de la discipline. Ce qu'on peut pardonner à l'homme de la rue pour qui la philosophie n'est qu'un ensemble de questions insolubles du type "pourquoi y a-t-il quelque-chose plutôt que rien ?" (question qui, il est vrai, a occupé les métaphysiciens à une certaine époque), difficile de l'accepter venant de personnes du monde universitaire

Il semble y avoir un gros malentendu dans cette résurgence de positivisme. Tout d'abord il faudrait savoir de quelle philosophie on parle. Ces physiciens semblent ne rien y connaître puisqu'ils parlent souvent de "la philosophie" comme si cette discipline n'avait de multiples objets : l'éthique, l'esthétique, la philosophie politique, l'histoire de la philosophie, la philosophie du langage, de l'esprit, des mathématiques, de la connaissance, la métaphysique... Et bien sûr la philosophie des sciences. Et cette dernière se décline encore en deux branches : l'épistémologie et la métaphysique des sciences.

S'il s'agit d'éthique ou de philosophie politique on verra sans mal que les dire morte c'est, pour un physicien, s'aventurer en dehors de son domaine de compétence--sauf à nous proposer une physique du bien et du mal, ou de la décision politique, ou de la justice, ce qu'ils ne font pas. Quant à juger de leur utilité, je pense que ce n'est pas un secret que nos constitutions démocratiques sont fondées sur des principes philosophiques (et je n'ai rien contre l'idée de les critiquer mais alors on fait de la philosophie). Concentrons nous donc sur la philosophie des sciences.

Sur son versant épistémologique, c'est à dire quand il s'agit de se questionner sur le statut de la connaissance scientifique (que peut-on connaître de la réalité ? Que nous apprennent exactement les sciences ?) il me semble que ces scientifiques perçoivent une menace. Les commentateurs qui déclarent la philosophie morte sont souvent d'ardents défenseurs de la rationalité scientifique face aux pseudo-sciences mystiques et aux idéologies religieuses comme le créationnisme. Ces mouvements remettent en question l'autorité des sciences. Se questionner sur les limites éventuelles de la connaissance n'est-ce pas faire leur jeu ?

S'il suffisait de se voiler la face pour répondre aux personnes qui remettent en cause la légitimité des sciences... Il me semble que voir la philosophie comme une menace c'est se priver d'un allié précieux. Car les réponses des scientifiques laissent souvent à désirer par leur simplisme (comment ça, nous n'avons pas abandonné la théorie de Newton face à l'orbite récalcitrante de Mercure ? Quoi ? Les scientifiques ont développé pendant des décennies des hypothèses farfelues pour maintenir l'hypothèse de l'éther, malgré son incompatibilité avec l'expérience ? Les instruments de mesure qui nous servent à vérifier les théories sont calibrés sur ces mêmes théories me dites vous ? (LIGO est un exemple récent) Et Newton définit la masse à partir de la force et la force à partir de la masse ? Donc on ne mesure jamais l'un dans présupposer l'autre ?). Il y a des complications, et elles sont nombreuses, à la confrontation des théories à l'expérience. Une théorie n'est pas un ensemble d'hypothèses isolées qu'on confronte indépendamment à l'expérience : c'est un bloc unifié à partir duquel nous construisons des modèles, sur la base d'hypothèses "raisonnables" et de postulats méthodologiques qui eux mêmes ne sont pas directement testés. C'est une des leçons importantes de la philosophie des sciences. Et les théories ne sont pas "vraies jusqu'à preuve du contraire" mais jusqu'à ce qu'une autre prenne le dessus. C'en est une autre.

Il est de bon ton de rappeler que le positivisme, qui affirme qu'une théorie est strictement vérifiable et que seules les théories vérifiables constituent une connaissance légitime, est d'abord une philosophie, et une philosophie qui a fait son temps : elle a connu son heure de gloire dans la première moitié du 20ème siècle, avec l'empirisme logique (et des figures fondatrices de la philosophie des sciences contemporaine comme Carnap ou Reichenbach), mais a été abandonné sous le coup des critiques internes et externes (de Kuhn, de Quine). Voilà donc précisément un domaine où la philosophie a fait des progrès... Mais peut être pas dans le sens souhaité par ces commentateurs.

Tout ça est embêtant pour qui veut défendre la science garante de l'objectivité face aux lubies créationnistes ou mystiques. Non tout n'est pas strictement vérifiable. Non il n'y a pas vraiment de science sans quelques présupposés métaphysique (ne serait-ce que ceux-ci : la nature est simple, structurée, unifiée dans ces principes, connaissable). Et oui, le développement des théories se fait historiquement suivant des critères pragmatiques et en partie suit des contraintes sociologiques. Mais nier ces aspects n'est certainement pas une solution.

Car il ne faudrait pas se méprendre sur le rôle de l'épistémologie : à mon sens son rôle est, à son meilleur, de donner sens à la rationalité scientifique. Quand par exemple on se questionne sur le problème de l'induction (comment sait-on que le soleil se lèvera encore demain ?) il ne s'agit pas de mettre en doute nos connaissances mais de se demander ce qui les fonde. C'est un fait, un scientifique n'a pas à se poser ce genre de question pour faire de la science. Il peut se contenter de dire "bien sûr on le sait qui en doute ?". Mais aucun philosophe n'en doute non plus ! Reste que ça pose question sur ce que signifie "savoir" : est-ce une attitude essentiellement pragmatique ? Ou y a-t-il plus que ça ?

Il est clair alors que les questions du philosophe se situent sur un plan distinct de celle des scientifiques et des créationnistes. L'idée n'est pas comme le créationnisme de nier la validité de certaines théories, ni de placer le créationnisme sur le même plan que la théorie de l'évolution mais de comprendre ce qui les différencie (et même sur un plan purement pragmatique il est facile de voir que le créationnisme ne tient pas la route, aucun besoin d'être réaliste. On voit que le question est indépendante). Le philosophe ne cherche pas à remettre en cause la rationalité du scientifique mais à l'expliquer, à la resituer dans un contexte plus large : celui de l'acquisition des connaissances. Et il est deux choses à peu près certaines : tout ça est plus compliqué qu'un positiviste pourrait le croire, et la science ne répond pas elle même à ce type de questions. Toutes les réponses qu'on pourra leur apporter seront compatibles avec nos meilleurs théories. Et c'est un fait que les scientifiques ont été eux-mêmes partagés sur ces questions à une époque où ils étaient encore érudits en philosophie (Mach, Boltzman, Poincaré, Duhem, Bohr ont entretenu différentes formes d'anti-réalisme à propos des sciences, à l'inverse d'autres comme Planck).

Donc quand des physiciens médiatisés nous disent aujourd'hui que la philosophie est morte, ne nous y trompons pas : il ne faut pas y voir autre chose qu'une façon d'imposer leur propre philosophie naïvement réaliste, non questionnée, de non érudit philosophique, mêlée de confusion sur le type de questions que la philosophie se pose (voir ici un exemple de confusion sur le problème de l'induction chez un blogger vulgarisateur pourtant talentueux).

Pour répondre aux questions du philosophe un physicien non érudit devra se contenter d'agiter le mains : "mais si, ça marche ! C'est la science !" quand un philosophe trouvera naturel, par exemple, de chercher des réponses dans la philosophie du langage puisqu'elle questionne elle aussi le rapport entre représentation et réalité. Encore une fois : ramener les choses à une vision d'ensemble plus large, établir des liens, chercher à obtenir une représentation cohérente du monde. C'est un apport de la philosophie du langage (Kripke, Putnam) que d'avoir montré, par exemple, que la signification des termes se réduit difficilement à un ensemble de descriptions qu'on aurait en tête comme on peut le penser naturellement : "or" n'est pas l'équivalent de "métal jaune", ni "acide" l'équivalent de "composé qui colore la papier tournesol et a un goût acide" (ce n'est pas le cas de tous les acides). Le concept vise la cause des manifestations et non les manifestations elles mêmes, celles ci pouvant être révisés au fur et à mesure que l'enquête progresse. Un argument contre le positiviste qui voudrait que tout soit simplement vérifiable, mais aussi contre le relativiste qui voudrait que nos concepts changent chaque fois qu'on change de théorie, et un aspect du fonctionnement du langage qui éclaire le statut de la représentation scientifique. Encore un progrès dans notre compréhension des choses en somme.

Voilà donc déjà quelques réponses : oui, la philosophie progresse, non, elle ne menace pas la science puisqu'elle se place sur un plan différent, et non, ses questions ne sont pas sans intérêt puisqu'elles peuvent aider à comprendre ce que recouvre la rationalité scientifique et pourquoi "tout ne se vaut pas". Elle est mieux à même que le scientifique lui-même de répondre au créationnisme, même si sa réponse sera peut-être plus nuancée. Mais qui croit encore que les choses sont toujours simples ?

Les attaques des scientifiques contre la philosophie ne reflètent que leur confusion, leur incapacité à distinguer ce qui chez eux relève d'une position philosophique et ce qui concerne le contenu de leur discipline (il est frappant pour un philosophe de constater à quel point les scientifiques sont catégoriques et véhéments, même entre eux, quand ils défendent une position philosophique, par exemple sur la question du libre arbitre. On les verra défendre que la physique donne une réponse indiscutable à cette question (dans un sens ou dans l'autre) quand le philosophe aura tendance à y voir une position parmi d'autres dans l'espace des possibles et à considérer calmement les arguments pour et contre, bien sûr jamais décisifs). Ces sorties pleines d'arrogance contre la philosophie accompagnées d'une ignorance manifeste de ce qu'elle est, et d'une absence de recul sont assez déplorables et on devrait défendre une déontologie minimale dans les milieux académiques qui consisterait à ne pas juger à l'emporte pièce une discipline dont on ne connait rien.

Il resterait à examiner l'aspect métaphysique qui est peut être plus critiquable à première vue, puisque la métaphysique s'intéresse à la nature de la réalité. Ici les critiques sont également interne à la philosophie puisque de nombreux philosophes sont peu enclins à la métaphysique. Est-ce aux sciences de nous dire si le monde est déterministe ? Peut-on le savoir depuis son fauteuil ? Pour répondre à ceci je ferai plusieurs remarques.

Une première remarque est qu'un théoricien de la physique ne se lève pas plus de son fauteuil qu'un philosophe. Certes il s'appuie sur des résultats empiriques, mais le philosophe des sciences aussi s'il tient compte du contenu des sciences. Et il le fait bien sûr puisque c'est l'objet de la métaphysique des sciences que d'interpréter les théories.

Une seconde remarque : les questions que se posent le philosophe se situent encore une fois sur un plan légèrement distinct, même si la distinction est moins nette. Le réductionnisme ou le déterminisme, ou la question de la nature du temps, de sa directionalité, ou de ce que sont les lois de la nature, nous demande également de replacer le contenu de la physique dans un cadre plus large. On se questionnera par exemple sur le fait que le monde puisse entièrement être décrit par la physique (encore une fois la philosophie du langage peut avoir son intérêt : le langage courant se réduit-il à un langage physicaliste ?). On cherchera à unifier nos connaissances : celles des différentes disciplines comme la chimie, la biologie et les sciences cognitives, ou encore nos connaissances de sens commun, nos intuitions, qu'on peut impliquer malgré nous quand on interprète une théorie physique. Une théorie physique n'est en soi déterministe ou non que si elle est interprétée, et le métaphysicien se demandera ce que recouvre cette interprétation (quand peut-on dire qu'une théorie est déterministe ? Est-ce ça implique forcément que le monde l'est ? Quelles conséquences pour nos autres concepts ?).

Une troisième remarque : l'expérience ne répond pas à ces questions. Les théories scientifiques, si elles sont vraies, apportent des contraintes importantes sur ce qui est envisageable ou non, elles informent la métaphysique mais ne constituent jamais le dernier mot. On pouvait être facilement déterministe il y a deux siècles, on peut ne pas l'être aujourd'hui avec la mécanique quantique (mais on peut toujours l'être). Et même le sens suivant lequel elles sont "vraies" peut être discuté (ce qui nous ramène à l'épistémologie : encore une fois, le contexte large).

Enfin une quatrième remarque : même si l'on pense, comme certains philosophes, que les questions métaphysiques sont sans réponses, on peut voir une certaine utilité dans la métaphysique : celle de clarifier nos concepts, d'apprendre à "bien penser", de dissoudre les confusions linguistiques et d'assurer une cohérence conceptuelle, et ceci peut être utile à l'avancement de la science. N'oublions pas qu'Einstein était au fait des débats philosophiques sur la nature de l'espace, et Darwin de ceux sur ce qu'est une espèce animale (avec des précurseurs à la théorie de l'évolution souvent oubliés). Les fondateurs de la mécanique quantique étaient profondément influencés par les empiristes logiques. Les travaux sur la logique et les fondations des mathématiques ont permit l'émergence de l'informatique, ceux sur la théorie des jeux celle de l'économie et certaines positions en philosophie de l'esprit (notamment le béhaviorisme) on préparé l'avènement de la psychologie scientifique. Si la philosophie peut sembler inutile au scientifique qui étend une théorie bien établie à de nouveaux domaines, son utilité ne se révèle jamais tant que dans les révolutions scientifiques, ou quand il s'agit de fonder une nouvelle discipline, c'est à dire quand il s'agit de questionner nos propres concepts plutôt que d'en faire usage. Qui sait si les débats d'aujourd'hui, par exemple en philosophie de l'esprit, sur l'interprétation de la mécanique quantique ou sur le statut des lois de la nature, celui de la causalité et celui du temps, et même pourquoi pas sur la question du réalisme, ne sont pas en train de préparer la science de demain ?

Enfin quant à savoir si la métaphysique s'intéresse à des questions sans réponses, laissons les philosophes en juger (c'est un débat bien réel), mais ce n'est certainement pas en s'appuyant sur une métaphysique naïve frappée au coin du bon sens mais pleine de contradiction, et qu'on ne questionnera pas, comme si elle allait de soi, qu'on mettra un terme au débat.

Je renvoi à cet article (en anglais) qui propose un argumentaire complémentaire sur le rôle de la philosophie.

mercredi 2 mars 2016

Le problème de l'induction : le monde est-il structuré ?

Résidence étudiante Studéa Daumesnil 2012

Il y a peu, les circonstances de la vie m'ont amené à loger dans une résidence étudiante pendant une semaine. Alors que je prenais mon repas dans la cuisine commune, un jeune garçon est arrivé pour préparer le sien. Il est allé manger dans sa chambre et un peu plus tard un autre gars est venu faire un peu de vaisselle. Le lendemain j'ai discuté brièvement avec un troisième qui étudiait dans le domaine de l'ébénisterie, puis le surlendemain un quatrième, un doctorant en Histoire originaire de Côte-d'Ivoire. J'ai alors procédé à un raisonnement inductif : il y a 7 chambres en plus de la mienne, et je n'ai vu pour l'instant que des garçons. Peut-être n'y a-t-il que des garçons à l'étage... Et quand j'ai rencontré un cinquième gars (un économiste de Djibouti) je me suis dit que cette nouvelle observation confirmait mon hypothèse.

Mais attendez... Est-ce bien le cas ? En fait tout dépend de la façon dont on raisonne. Si l'on raisonne en états de faits possibles, ce n'est pas vraiment le cas, en tout cas pas comme on le voudrait.

Par état de fait possible je veux dire : un état de fait attribue à chaque chambre soit un garçon, soit une fille. Il y a donc 128 états de faits possibles. Alors certes le fait de voir un garçon m'amène à éliminer un certain cas (celui où il n'y aurait que des filles) et en ce sens l'hypothèse qu'il y a 7 garçons devient plus probable. De même si j'en vois un deuxième : j'élimine les 7 états de faits possible dans lesquels il n'y a qu'un garçon (parce-que je sais qu'il y en a au moins deux). Mais l'hypothèse qu'il n'y a que des garçons reste minoritaire parmi tous les états de faits possibles : je n'ai éliminé que 8 cas sur 128. Et elle le restera presque jusqu'au bout : quand j'aurai vu 6 garçons il y aura encore une chance sur deux que la personne que je n'ai pas encore croisé soit en fait une fille.

Mais tout ça semble paradoxal. Après avoir vu 6 garçons j'ai tendance à penser que la probabilité que le 7ème soit aussi un garçon est plus forte que la probabilité que ce soit une fille. Suis-je irrationnel ?

Si je le suis alors c'est toute induction qui est irrationnelle, et toute la science. Comment donc saura-t-on que "tous les corbeaux sont noirs" si la probabilité que le suivant soit blanc reste de 1/2 ? Comment sait-on que le soleil continuera à se lever demain s'il y a plus d'états de fait concevables où il ne se lève pas ?

Structure contre mosaïque de faits

Voyons les choses autrement. Qu'est-ce-qui me fait penser que la 7ème personne sera aussi un garçon ? "Eh bien," me dis-je, "j'ai déjà vu 6 personnes. S'il y avait vraiment 6 garçons et une fille à cet étage, j'aurais sans doute déjà croisé cette fille parmi les 6. Quel hasard que ce soit la dernière personne que je croise ! C'est donc improbable qu'il y ait une fille." Ce raisonnement est-il valide ? En effet la probabilité que je n'ai pas encore rencontré cette fille si elle existe est faible, et donc ça accrédite la thèse suivant laquelle il n'y a en fait que des garçons.

Mais halte là, subrepticement j'ai cessé de raisonner en terme d'états de faits possibles pour raisonner en terme de configurations, de "structures" possibles. Car si je raisonne en terme d'états de faits possibles, la probabilité que je n'ai croisé aucune fille alors qu'il y en a une à l'étage, après avoir pourtant déjà croisé 6 personnes, est en effet faible. Cependant le nombre d'états de faits possibles pour lesquels il y a une fille et 6 garçons à l'étage est de 7 (suivant la chambre dans laquelle loge la fille) tandis qu'il n'y a qu'un seul état de fait possible pour lequel il n'y a que des garçons. Ce qui compense : l'un dans l'autre, il y a toujours une chance sur deux que la dernière personne, celle que je n'ai pas encore croisé, soit une fille. Et mon hypothèse n'est pas plus validée que l'hypothèse inverse par les observations.

Mais si je raisonne en terme de configurations possibles, c'est à dire en terme du nombre de garçons et de filles à l'étage indépendamment de leur répartition dans les chambres, et si j'attribue la même probabilité a priori à la configuration "6 garçons et une fille" et à la configuration "7 garçons", ou à tout autre ratio, alors en effet mon raisonnement est valide : il est fort probable qu'il n'y ait que des garçons, sinon j'aurai probablement déjà croisé cette fille. Parmi tous les ratio possibles c'est maintenant le plus probable.

Autrement dit le raisonnement inductif qui est un des piliers de la science contemporaine est possible uniquement si l'on pense en terme de structure du monde (ce qui ouvre la porte à des explications : il n'y a que des garçons parce-qu'il y a beaucoup d'étudiants d'étrangers, et ceux-ci sont majoritairement des hommes ? Parce-que les filles fuient les résidences étudiantes ?) plutôt qu'en terme de mosaïque de faits (qui ne demandent aucune explication : ce qui est le cas est le cas). Carnap l'avait bien compris, lui qui proposait justement un critère de confirmation des hypothèses exactement en ces termes.

En fait il y a comme une prémisse cachée dans le raisonnement inductif qui est la suivante : le monde est structuré, explicable (ce que nous ignorons c'est quelle est la bonne structure). Le raisonnement inductif, par exemple bayésien, n'est un raisonnement probabiliste valide qu'en tant que cette prémisse est acceptée. Peut-être que mon raisonnement était fallacieux dans le cas de la résidence si en fait les étudiants y sont introduits aléatoirement avec autant de candidats filles et garçons, mais s'il y a des causes, des lois qui régissent leur répartition, si leur distribution est structurée, alors mon induction est valide. Tout repose donc sur cette prémisse.

Hume

Ce n'est en un sens qu'une nouvelle réitération des observations de Hume, qui relevait le premier (?) le problème de l'induction. Pour Hume, inférer un rapport de nécessité à partir d'un nombre fini d'observations suppose de croire que le monde est régulier. Mais cette croyance elle même ne peut être issue de l'observation (ce serait une justification circulaire de l'induction par elle même) ni connue par déduction (l'hypothèse inverse n'a rien de logiquement contradictoire). D'où son scepticisme envers l'induction et envers la causalité, ou l'idée qui y ait une nécessité, quelque chose comme des lois dans la nature.

Le problème de Hume peut donc être ramené à celui-ci : la méta-hypothèse suivant laquelle le monde est structuré, régulier, et donc suivant laquelle il faudrait juger comme a priori equiprobables les hypothèses portant sur la structure du monde plutôt que sur la répartition des faits (le ratio garçon-fille plutôt que leurs répartitions dans les chambres), cette méta-hypothèse, même si elle n'a rien d'incohérent, ne peut elle-même être justifiée de manière indépendante. Nous n'y adhérons jamais que par dogmatisme.

Il est important d'expliquer pourquoi la validité de l'induction ne peut être justifiée inductivement, car c'est une tendance assez naturelle que de le penser. On se dit que si le raisonnement inductif a si bien marché jusqu'à présent il est raisonnable de penser que c'est un raisonnement fiable qui continuera de fonctionner. On fait en quelque sorte une méta-induction sur les types de raisonnements. Mais pourquoi ce qui a marché sur les corbeaux (imaginons qu'on ait fait le tour des corbeaux) marchera aussi sur les cygnes ? En quoi le fait que l'induction ait fonctionné dans les situations a, b et c implique qu'elle fonctionnera également dans la situation d ? Ou qu'elle fonctionnera encore l'instant d'après ? Encore une fois ça suppose que le monde est structuré (à une échelle supérieure). C'est ce qu'on pensait avoir montré, mais c'est en fait une hypothèse implicite au départ : notre raisonnement reste circulaire. L'induction n'est pas en soi incohérente mais elle n'est pas fondée rationnellement, elle ne peut être que dogmatique : que l'infime partie du monde qu'il nous a été donné d'observer jusqu'à présent était en effet structurée n'implique pas que le monde dans son ensemble l'est et continuera à l'être.

Tout ceci ressemble un peu à un raisonnement par l'absurde. Mais à ceci il y a, me semble-t-il, une réponse possible qui tient au fait que la justification n'est pas entièrement circulaire : chaque fois on en appelle à un niveau de structure d'ordre supérieur, pas au même niveau. Il s'agit en fait d'une régression plutôt que d'une circularité. Alors prenons un raccourci et rendons nous directement au niveau ultime de la régression.

Où est le dogmatisme ?

A ce niveau on aura les hypothèse suivantes : h1 := le monde est fondamentalement structuré, h2:= le monde n'est pas fondamentalement structuré. Si l'on pense que ces deux hypothèses sont a priori équiprobables, alors on est capable de justifier l'induction. Nos observations, sur une infime portion de l'univers, semblent valider h1 : la probabilité d'atterrir en un endroit de l'univers si structuré alors qu'il ne l'est pas dans son ensemble est faible.

Ce que l'empiriste sceptique nous demande d'accepter, c'est que h1 et h2 ne sont pas équiprobables parce qu'il y a beaucoup plus de configurations concevables pour lesquelles le monde n'est pas structuré. Il y a beaucoup plus de façons d'être non structuré que structuré. Autrement dit il nous demande de penser comme équiprobables des répartitions possibles de faits plutôt que des hypothèses, ce qui rend la probabilité a priori de h2 beaucoup plus forte que celle de h1, et donc l'hypothèse h2 beaucoup plus difficile (en fait impossible) à défaire.

Les deux raisonnement se tiennent. Mais qui est dogmatique ? A la lumière de cette présentation il semble que l'empiriste sceptique ne l'est pas moins. Au fond le choix se situe entre une métaphysique de faits particuliers et une métaphysique de lois, toutes deux cohérentes. Nous y sommes au niveau ultime, et je ne vois pas pourquoi ces deux métaphysiques ne devraient pas elle même bénéficier d'une probabilité a priori identique, puisqu'à ma connaissance il n'existe pas un nombre plus grand de métaphysiques de faits que de métaphysique de lois. Ce n'est pas parce qu'une métaphysique de faits permet un plus grand nombre de configurations (ce qui resterait d'ailleurs à argumenter) qu'une métaphysique de lois est moins probable.

Autrement dit le sceptique, si on le pousse dans ses retranchements, est obligé d'admettre qu'il a lui aussi besoin d'une ontologie, qu'il est lui aussi en train de formuler une hypothèse d'ordre métaphysique sur le monde, et que cette hypothèse en vaut bien une autre. Il doit accepter qu'au niveau ultime nos degrés de crédence a priori sont à placer dans les hypothèses, puisqu'au niveau ultime, celui de la métaphysique, il n'y a plus que des hypothèses. Le raisonnement sceptique aurait été valide s'il était possible de se défaire de toute métaphysique, mais ce n'est pas le cas. Le sceptique, en proposant de juger équiprobables toutes les mosaïque de faits, est bien en train de défendre une métaphysique.

Et puisque notre sceptique reste empiriste il devra bien constater que sa métaphysique n'est pas particulièrement confirmée par l'expérience : la probabilité que nous nous situons dans une partie structuré du monde si celui-ci n'est que faits disparates est très faible. Mais si le monde est lois, cela n'a rien de surprenant. L'idée que le monde est régit par des loi est donc probable compte tenu de nos observations, ce qui en retour valide le raisonnement inductif : il est probable que celui-ci soit un type de raisonnement efficace.

Tout ce que ceci nous demande est d'accepter non pas l'induction, mais le raisonnement probabiliste. L'option reste ouverte de rejeter ce type de raisonnement, mais alors on n'est plus vraiment un empiriste sceptique, plutôt peut-être quelque-chose comme un quietiste ou un sceptique radical qui ne se pose même plus ce genre de questions. Le scepticisme de l'empiriste repose bien en effet sur l'assignation a priori de probabilités aux mosaïques de faits possibles plutôt qu'aux structures : c'est ce qui lui permet de rejeter l'induction.

J'ajouterai une remarque qui a plus pour but de prolonger la réflexion. Dans le cadre de la mécanique quantique on attribuera une equiprobabilité aux structures, aux configurations possibles, plutôt qu'aux états de faits possibles. C'est ce que traduisent le principe d'indiscernabilité des particules et notamment les statistiques de Bose-Einstein (la configuration "une particule dans l'état A et une dans l'état B" est indifférente au fait de savoir laquelle des deux est en A ou en B, elle a autant de poids que la configuration "les deux en A"). On croirait que quelque chose qui tenait plutôt jusqu'alors de la méta-hypothèse a été intégré au sein même de notre physique, comme si celle-ci, non contente de formuler des lois, incorporait directement une métaphysique de structures et de lois (et les "méta-lois" comme les principes de symétrie associés, ici la symétrie par permutation de particules identiques)... Est-ce un argument de plus en faveur de l'induction ? Pas si la physique repose elle-même sur l'induction, mais tout de même, il y a peut-être quelque-chose à en tirer.

Dans le prochain article je m'intéresserai à d'autres problèmes plus récents liés à l'induction : le paradoxe d'Hempel et le problème de Goodman

samedi 20 février 2016

Lordon et le rôle du concept en sciences sociales

Ma spécialité n'est pas le "champ social" mais permettez-moi tout de même un rapide commentaire critique sur cet article de Lordon paru en 2013 dans les cahiers philosophiques, qui évoque au passage les "sciences dures" et leur usage des mathématiques, des sujets qui me sont plus familiers. Si je trouve le rapprochement entre philosophie et sciences sociales que Lordon appelle de ses voeux dans cet article tout à fait louable, certains aspects me gênent néanmoins. Ils ont trait à la fois au style et au contenu de l'article.

Commençons par un bref exposé de ma compréhension du texte (je vous renvoie à l'article lui même pour une exposition plus fidèle des idées l'auteur).

dimanche 14 février 2016

Pourrait-on s'exprimer dans un langage purement physique ?

Leonard Nimoy Spock 1967

On voit parfois cette caricature dans les récits de science fiction ou dans les comédies : une personne, ou une machine, s'exprimant dans un langage purement scientifique (au lieu de dire "prend un verre d'eau" elle dira d'un ton nasillard "je te conseille d'ingérer par voie buccale une quantité d'environ dix centilitres de liquide constitué principalement de molécules H2O"). Pourrait-on vraiment s'exprimer ainsi ?

Après tout si le physicalisme est vrai, c'est à dire si tout dans le monde est physique, ce devrait être une possibilité de principe, et même, plutôt que de recourir à ce type de paraphrases que la complexité pousse à dessein au ridicule, nous pourrions peut-être,  poussant le ridicule à son terme, nous communiquer directement des modèles physiques dans un formalisme mathématique.

mardi 24 novembre 2015

Les lois de nécessité survivent-elles aux changements théoriques ?

Le réalisme structural et l'objection de Newman

Le réalisme structural prétend répondre au problème du changement théorique en faisant valoir que les relations, sinon le contenu des théories, sont conservées lors des changements théoriques. Ainsi la théorie de Newton est fausse quant à l'ontologie qu'elle postule : il n'y a pas vraiment de forces de gravitation dans la nature. Mais elle est vraie quant aux relations qu'elle décrit par ses lois.

Un problème est de savoir en quoi ceci ne revient pas simplement à affirmer que la théorie est empiriquement adéquate : si les équations de la théorie ne doivent être interprétées qu'empiriquement, en quoi fait-on plus que décrire des régularités superficielles dans les phénomènes observables ?

Ce problème peut être formalisé sous la forme de ce qu'on appelle l'objection de Newman envers le réalisme structural. A strictement parler, le réalisme structural veut affirmer plus que l'existence de relations entre nos observations. Il veut dire qu'il existe des relations "réelles" entre des objets inaccessibles de la réalité, et que ses relations se traduisent par des relations entre nos observations. Mais si l'on entend relation en terme purement logico-mathématique, dire ça, c'est ne rien dire du tout car l'existence de relations purement mathématiques sur un domaine d'objets est une affaire triviale. Il suffit de regrouper conceptuellement ces objets d'une certaine façon pour pouvoir affirmer qu'une certaine structure de relations existe.

Certes, mais l'on a bien dit qu'il s'agissait de relations "réelles", pas de n'importe quelles relations. C'est là tout le problème : que veut-on dire par là ? Il nous faut qualifier de quelles relations on parle. Et ce faisant, on risque de s'éloigner d'un pur structuralisme. En particulier, on peut se demander si ces relations, ainsi qualifiées, vont survivre aux changements théoriques. Si les forces de gravitation dénotent des relations "réelles" entre les corps massifs, en quoi survivent-elles au changement théorique, puisqu'il n'y a pas de forces de gravitation en relativité ? S'il s'agit simplement de dire que la théorie de Newton décrit correctement les relations entre la position, la vitesse et l'accélération des corps massifs, en quoi s'agit-il d'autre chose que de relations superficielles entre les phénomènes observables ? Comment qualifier ces relations pour faire du réalisme structural plus qu'un empirisme, sans en faire un réalisme complet qui serait victime des arguments basés sur le changement théorique ?

A noter que le problème se pose aussi bien aux tenants du réalisme structural ontique. Ceux-ci affirment que nos théories décrivent correctement une structure réelle, ontologiquement primitive, mais si cette structure est comprise en un sens purement logico-mathématique, ou seulement par la manière dont elle se rapporte aux phénomènes observables qui eux seuls seraient interprétés qualitativement, la position risque de se ramener soit à un platonisme mathématique, soit à un simple empirisme.

Les modalités à la rescousse

Melia et Saatsi proposent de parler de relations modales, c'est à dire de relations de nécessité dans le monde, et ça semble être également la voie choisie par les tenants du réalisme structural ontique. Affirmer qu'il s'agit de relations nécessaires permet en effet d'aller au delà de la simple description de régularités observables : on explique ces régularités, il s'agit de lois naturelles qui ne surviennent pas sur la distribution des phénomènes. Nous ne sommes plus dans l'empirisme. De plus il est légitime de penser qu'en effet les relations modales entre nos observations survivent aux changements théoriques : les lois de Newton sont bien remplacées par d'autres lois, celles de la relativité par exemple, mais si l'on considère que la relativité décrit toujours des relations modales, alors c'est toujours en vertu d'une nécessité dans le monde qu'on observe les relations décrites par la théorie de Newton.

Mais est-ce bien le cas ? Prenons un exemple plus simple que le passage de la mécanique de Newton à la relativité : celui de Galilée à Newton. La loi de gravitation à la surface de la terre nous dit que si je lâche un objet, il subira une accélération vers le bas de 9,8 m/s². Cette loi voit juste quand à des relations entre nos observations. S'agit-il de relations modales ?

Intuitivement, il semble que oui : non seulement tous les corps qui chutent subissent cette accélération, mais, pourrait-on dire, si j'avais lâché un corps quelque temps plutôt, bien que je ne l'ai pas fait, il aurait subit cette accélération. C'est donc plus que la description de régularité : c'est un rapport de nécessité.

Pourtant quelque chose peut nous troubler. Le fait que cette accélération soit de 9,8 m/s² est, à la lumière de la théorie de Newton, contingent. Cela tient au fait que nous nous trouvions à la surface de la terre et que la terre ait telle masse. Comment cette loi pourrait-elle être nécessaire si elle est contingente ? N'est-ce pas contradictoire ? La loi de Galilée serait nécessaire s'il était nécessaire que l'on se trouve sur terre, et alors les modalités de la mécanique newtonnienne (peut-être héritées d'une théorie plus fondamentale) se transmettraient de manière indolore à la loi de Galilée, mais ce n'est pas le cas : nous pourrions nous trouver sur la lune. D'où vient alors cette intuition que les corps subissent une accélération de 9,8 m/s² en vertu d'une nécessité physique ?

Une loi modale contextuelle ?

Une première idée serait de dire qu'il s'agit d'une loi "ceteris paribus" (toutes choses égales par ailleurs). Ce "ceteris paribus" contiendrait une clause du type "à la surface de la terre". La loi de Galilée nous demande d'envisager un certain nombre de situations possibles (et pas seulement actuelles, donc c'est bien une loi de nécessité) mais avec restriction. On a le droit de faire varier la vitesse initiale, la position, la masse du corps, mais pas le fait que nous sommes à la surface de la terre.

Mais ceci amène à se questionner sur le statut de cette clause : pourquoi faire varier la position, la vitesse, et pas cette clause, plutôt que l'inverse ? En quoi est-il légitime de reléguer notre position sur terre au contexte, et pas le reste ?

On peut imaginer une première raison : la position ou la vitesse des corps sont des quantités dynamiques, si bien qu'il n'y a pas de sens à les tenir pour fixe, puisque ce sont les variations de ces quantités qu'on veut expliquer. La valeur du champs gravitationnel est, quant à elle, un paramètre externe à l'explanandum. Elle fait partie du contexte. Mais après tout la valeur du champs gravitationnel dépend également de la position, et donc il n'est pas si fixe que cela.

Voyons alors comment on explique la loi de Galilée dans un cadre Newtonien. On décrira un système à deux corps : la terre et notre objet. On pourra ensuite envisager, pour retrouver la loi de Galilée, que le centre de la terre est infiniment lointain, si bien que les variations de position de notre objet par rapport à la terre (et donc les variations de la force d'attraction) sont négligeables. Il faut aussi qu'elle soit infiniment massive pour qu'il y ait toujours une attraction, de façon à ce que le rapport entre cette masse et la distance au carré converge vers une valeur fixe qui correspondra au champ gravitationnel. C'est ainsi qu'on réduit la loi de Galilée à une approximation de celle de Newton : en faisant tendre certains paramètres vers l'infini, tout en gardant un certain rapport constant. Le passage de Newton à la relativité se fait dans des termes similaires.

En résumé nous avions deux corps dans notre modèle, et nous avons décidé d'en éliminer un, la terre, parce que sa dynamique n'est pas pertinente. Bien sûr il n'y aurait aucun sens à éliminer l'autre corps, celui qui nous intéresse, mais le fait que nous nous trouvions dans une situation où un des deux corps est éliminable est contingent, et tout ceci a, pour un réaliste, un petit arrière goût de pragmatisme. Si nous ignorons la terre, et la remplaçons par un potentiel gravitationnel constant, c'est parce que nous, humain, n'avons aucune prise sur elle et qu'elle est stable. En ce sens seulement le contexte est "nécessairement contingent" et donc la loi de Galilée est une loi de nécessité. Mais dans l'absolu cela n'a rien de relations de nécessité, et on pourrait être tenté d'y voir la description de régularités qui dérivent peut-être de lois nécessaires, mais qui n'en sont pas : le fait que tous les corps au sein d'une zone arbitraire de l'espace, la surface de la terre, subissent cette accélération précise.

Un problème pour le réalisme structural

On pourrait faire le même type d'argument pour le passage de la mécanique classique à la relativité : les lois de la mécanique classique sont des lois nécessaires uniquement si l'on tient pour nécessaire que nous nous situons dans un espace relativement plat, mais ce n'est pas le cas. De même pour la transition entre la mécanique classique et la mécanique quantique : la décohérence vaut parce que nous sommes dans un univers ayant un grand nombre de degrés de liberté, et peut-être parce que nos mesures "classiques" sur les systèmes quantique dépendent de ça, si bien que nous n'avons aucune prise sur la décohérence de par notre situation épistémique (elle est nécessaire à notre acquisition de connaissance). Et de même pour la thermodynamique si on fait dépendre sa dérivation de la physique statistique d'une hypothèse du passé.

Je ne sais pas s'il est possible de se satisfaire de cette situation (et si mes quelques lecteurs ont un avis la dessus je suis preneur). Suffit-il qu'une relation dérive d'une relation modale et d'un contexte contingent pour la qualifier de modale ? Elle ne peut être absolument nécessaire, mais est-elle "semi-modale" ? On a bien l'impression que si les lois fondamentales de la nature sont nécessaires, alors les lois moins fondamentales le sont aussi en un sens, restreintes à leur domaine d'application, mais est-ce que ça vaut pour n'importe quelle restriction de domaine arbitraire ? Dans ce cas ne pourrait-on pas trouver des contre-exemples, des lois qui semblent absurdes parce que leur domaine d'application regroupe des éléments disparates ? Et dans le cas contraire, en quoi les restrictions anthropocentrées seraient-elles plus légitimes que d'autres ? Y a-t-il de "bons" domaines d'application autres que pragmatiques ?

Il me semble que ça menace en un sens l'idée que des relations modales seraient conservées lors des changements théoriques si ces relations n'apparaissent nécessaires que relativement à notre position contingente. A l'époque de Galilée, aurions nous pu savoir ce qui, dans la loi de la chute des corps, allait s'avérer nécessaire ou contingent ? Peut-être aurions-nous pu le deviner : c'est la constante de gravitation qui devait être incriminée (et nous pourrions incriminer toutes les constantes de nos théories). Mais dans le passage de Newton à Einstein les choses sont plus complexes puisque c'est la structure de l'espace lui-même qui s'avère contingente, et ici, on parle bien de relations. Donc l'idée que les relations sont conservées d'une théorie à l'autre est directement menacée. Finalement à propos de quoi doit-on être réaliste ?

Conclusion : quelques solutions

J'imagine bien quelques solutions pour résoudre se problème.

Une première solution serait d'invoquer la nécessité du passé, pour pouvoir affirmer qu'en effet le contexte dans lequel nous nous situons est nécessaire. Dans ce cas toute restriction de domaine serait légitime pour peu qu'elle s'appuie sur des faits passés. Reste à voir si ça ne trivialise pas toute forme de nécessité (si tout ce qui est présentement le cas est nécessaire, que reste-t-il de contingence, et pourquoi parler de lois modales ? Peut-être le déroulement futur d'une expérience reste contingent, dans un cadre indéterministe ?).

Une seconde solution serait de faire appel à des dispositions, c'est à dire à situer la nécessité non pas dans des lois abstraites, mais dans les phénomènes concrets qui sont instanciés. On peut dire alors que la loi de Galilée décrit correctement un ensemble de relations causales nécessaires, même si la façon dont cette loi regroupe ces relations (la restriction à un domaine particulier : les phénomènes à la surface de la terre) n'a rien de nécessaire, et alors de nouveau n'importe quelle restriction de domaine pourrait être légitime si elle correspond à la distribution des dispositions dans l'univers. Ceci impliquerait que la bonne forme de réalisme structural serait un structuralisme dispositionnaliste. Mais si la distribution des dispositions est contingente, que reste-t-il de la nécessité ? En quoi en avons-nous une connaissance ?

Enfin une troisième solution serait d'invoquer une hiérarchisation dans les rapports de nécessité comme le propose Lange : certaines lois seraient plus nécessaire que d'autres (celles des théories plus fondamentales). Il conviendrait alors d'expliquer en quoi les restrictions de domaine propre, par exemple, aux lois de Newton, sont de "bonnes" restrictions, peut-être en invoquant la notion de stabilité contrefactuelle que propose Lange. Peut-être qu'on peut combiner cette solution à la première : le passé serait nécessaire en un sens plus faible.

En tout cas le réalisme structural fait face à un problème sérieux s'il compte s'appuyer principalement sur le changement théorique dans son argumentation. Puisque nos théories actuelles ne sont pas le fin mot de l'histoire, il se peut que nos théories soient toujours "relativement nécessaires", et qu'il faille relativiser de manière implicite leur contenu modal à notre contexte particulier (ce contexte pouvant être élargit lors des changements théoriques), voire abandonner l'idée qu'il existe une nécessité absolue, hors contexte, dans le monde.

dimanche 23 août 2015

Des histoires consistantes à la physique relationnelle

Nous avons vu dans le dernier billet que dans le formalisme des histoires consistantes, adopter un cadre (un découpage discret de l'espace des états du système en propriétés disjointes) permet de restaurer l'usage de la logique classique et des raisonnements contre-factuels, et résout la plupart des paradoxes de la mécanique quantique. Le prix à payer est que tout ceci est toujours relatif à un cadre, qui n'est pas quelque chose qui existe dans la nature mais plutôt une façon conventionnelle de voir le monde parmi d'autres (dans l'absolu, tous les cadres se valent).

Il existe une analogie assez forte entre cet aspect et le choix d'un référentiel en relativité restreinte. D'abord, le cadre est lui aussi, sur le plan mathématique, un référentiel dans un espace (l'espace de Hilbert) même si ce dernier n'est pas interprété comme espace physique, mais comme espace des états possibles. Ensuite et surtout, en relativité restreinte, le choix d'un référentiel de coordonnées permet de restaurer une certaine vision classique du temps : relativement à ce référentiel, on peut définir un plan de simultanéité et une succession temporelle des événements, on peut définir des longueurs, des vitesses. Certes certains paradoxes persistent (comme le paradoxe des jumeaux) mais au moins nous restaurons une vision commune du temps comme déroulement uniforme des phénomènes.

Le problème, comme dans le cas du cadre avec les histoires consistantes, c'est que ce référentiel est arbitraire, qu'il n'existe que "dans la tête de l'agent", et donc qu'il n'existe pas de manière objective de notion de simultanéité, ou de succession entre événements distants. Ce n'est qu'une manière de voir qui en vaut une autre (tous les référentiels se valent).

Ainsi dans les deux cas le choix d'un cadre arbitraire permet de restaurer nos intuitions classiques : sur le temps dans un cas, sur les inférences logiques dans l'autre. Mais celles-ci s'avèrent ultimement relatives à un point de vue choisi arbitrairement.

Un référentiel, en relativité, permet d'assigner des coordonnées spatiales et temporelles à des événements. En mécanique quantique, un cadre permet d'assigner des propriétés déterminées, ou une répartition de probabilités sur celles-ci, à des événements. La leçon, dans les deux cas, semble être que ces propriétés (de position ou quantiques) n'ont rien d'absolues mais son relatives au choix du référentiel. La différence est que dans le cas quantique ce ne sont pas les valeurs des propriétés qu'on change quand on change de référentiel, mais ce sont les propriétés que le système possède ou non : soit on s'intéresse à la position, soit à la quantité de mouvement, mais pas les deux. En relativité, changer de référentiel, c'est adopter une autre convention pour déterminer la position des événements. Mais la quantité de mouvement n'est pas une "autre convention pour déterminer la position" : c'est une autre propriété. Cette différence rend difficile de savoir ce qu'on doit considérer comme invariant dans la théorie quantique. En relativité, un intervalle spatio-temporel est un invariant, on le calcul à partir des positions respectives de plusieurs événements, et on obtient le même résultat quelque soit le référentiel choisi. Mais comment définir un invariant à partir de propriétés hétérogènes ?

L'arbitraire du référentiel en relativité implique qu'il n'existe plus de notion de simultanéité absolue. Dans le cas de la mécanique quantique, une implication qui serait équivalente est moins lisible. Mais ce serait quelque chose comme : il n'existe pas de propriété déterminée possédée absolument par un objet donné, ou encore il n'existe pas de faits absolus. Il faut définir un cadre pour pouvoir parler de faits.

C'est ici qu'on voit que l'interprétation des approches consistantes n'est finalement pas si éloigné des interprétations relationnelles de la mécanique quantique, qui affirment que l'état d'un système physique n'est jamais que sa relation à un observateur (au sens de la physique, c'est à dire un autre système physique possédant des enregistrements passés de ce système). Selon les interprétations relationnelles, il n'existe pas de point de vue de nulle-part : pas de fait sans spécifier un observateur.

Cadre abstrait dans un cas, système physique dans un autre, mais dans les deux cas, nous avons une forme de relativité. Peut-on les faire se rejoindre ?

Dans l'interprétation des histoires consistantes, le cadre est arbitraire. Cependant on peut dire qu'un cadre est plus utile qu'un autre : si par exemple il correspond à ce qu'on a l'intention de mesurer sur le système. Mais cette utilité n'est-elle pas objective ? Pourquoi alors n'existerait-il pas un "bon" cadre (même si celui-ci ne nous est pas entièrement accessible : il peut s'agir d'un affinement de notre cadre quasi-classique) ? Un peu comme en relativité, on admet que tous les référentiels se valent, et pourtant en cosmologie, on accepte qu'il existe un "bon" référentiel (qui permet notamment de calculer l'age de l'univers).

Il existe certaines analogies en physique quantique relativiste entre un référentiel et un système physique (par exemple un oscillateur permet de définir une horloge, donc un référentiel). S'il s'avère que ce "bon" cadre se situe dans les relations entre un système physique observateur et un système physique observé, nous retomberions alors, à partir du formalisme des histoires consistantes, sur une interprétation relationnelle.

dimanche 16 août 2015

L'interprétation des histoires consistantes de la mécanique quantique

Je me suis intéressé récemment à l'interprétation des histoires consistantes de la mécanique quantique, et j'avoue avoir été assez convaincu par l'approche. Je vais me contenter, dans ce billet, de proposer une vulgarisation de cette interprétation.

L'espace des phases

Focal stability.png
Classiquement on peut se représenter l'état d'un système dans un espace des phases. Il s'agit d'un espace abstrait dont les coordonnées sont les degrés de liberté du système. Si par exemple une particule a une position et une vitesse, on prendra en abscisse sa position et en ordonnée sa vitesse. Chaque point de l'espace de configuration représente donc un état possible du système. Son état actuel est l'un de ces points, et son évolution temporelle peut être représentée par une trajectoire.

Dans un espace des phases, on peut représenter une propriété quelconque, éventuellement complexe, par une région de cet espace. Par exemple : "avoir une position supérieur à 0,7 et inférieur à 0,8" est une propriété qui correspondra à une certaine zone (une bande dans l'exemple ci-dessus). Mais on peut en fait imaginer n'importe quelle propriété. On pourrait par exemple s'intéresser à un système composé de milliers d'atomes, dont l'espace des phases aurait un nombre incalculable de dimensions (au moins 3 par atomes : leurs coordonnées de positions), chaque point de l'espace représentant une configuration possible de ces atomes, et on pourrait concevoir que la propriété "être un chat" corresponde à une certaine région de cet espace gigantesque : celle contenant tous les points dont l'arrangement correspond à un chat.

Si l'on part du principe qu'une propriété quelconque est une région de l'espace des phases, on peut introduire un formalisme logique comme suit :

  • La conjonction de deux propriétés ("A et B") correspond à l'intersection des régions de chaque propriété
  • La disjonction de deux propriétés ("A ou B") correspond à l'union des régions de chaque propriété
  • La négation d'une propriété ("non A") correspond au complément de sa région dans l'espace complet.

Venn diagram gr la ru
Ces trois opérateurs logiques sont suffisant pour définir la logique classique. Tout ceci correspond à ce qu'on appelle les diagrammes de Venn (voir l'image, pour les propriétés "être une lettre de l'alphabet romain / grec / cyrillique").

Selon ce point de vue, attribuer une propriété à un système physique revient à le situer dans une région de l'espace des phases.

Bien sûr on peut être peu satisfait de ces notions de propriété du type "tout ou rien". Mais rien ne nous empêche d'introduire des probabilités. Celles-ci peuvent servir soit à définir des propriétés "floues", soit, de manière équivalente, à indiquer notre incertitude quant à l'état réel d'un système.

Standard deviation diagram
Concrètement, ceci prendra la forme d'une répartition de probabilité sur l'espace des phases. On associe un nombre à chaque point de l'espace, représentant le degré de probabilité que le système s'y trouve. Pour connaître la probabilité que le système ait une propriété (de type tout ou rien), il suffit d'intégrer ces degrés (d'en faire la somme) sur la région correspondant à cette propriété (si par exemple l'espace des phases est un axe, la probabilité associée à une propriété donnée correspondra au calcul d'une surface : voir l'image ci-dessus).

Avec cette extension, on retrouve alors le calcul classique des probabilités : celles-ci on une valeur entre 0 et 1, la probabilité de l'espace des phases dans son ensemble est de 1 et si deux propriétés sont disjointes, alors la probabilité de leur conjonction est la somme de leurs probabilités respectives. C'est, en substance, ce qu'affirment les axiomes de Kolmogorov.

L'espace de Hilbert

Linear subspaces with shading
Bon, jusqu'ici on est dans un cadre classique. Passons maintenant à la physique quantique. On peut analyser de manière similaire l'espace de Hilbert, qui est l'espace dans lequel sont définis les fonctions d'ondes, représentant les états des systèmes physiques, ainsi que les opérateurs correspondant aux observations possibles, aux résultats de mesure, ou encore aux équations d'évolution de ces systèmes. Autant dire que l'espace de Hilbert joue un rôle central en mécanique quantique.

Il existe une manière assez naturelle de l'interpréter comme un espace des phases, et qui, poussée à son terme, aboutit à ce qu'on appelle les logiques quantiques.

Dans l'espace de Hilbert, les états possibles du système ne sont plus des points mais des axes passant par l'origine. Une propriété quelconque n'est plus représentée par une région (une somme de points) mais par un sous espace passant par l'origine (qui peut être défini par plusieurs axes orthogonaux, par exemple un plan).

Au passage il faut bien voir que nous avons grandement multiplié les dimensions de notre espace. Ainsi un axe de l'espace ne correspond plus à un seul degré de liberté du système (par exemple la position d'une particule), mais il y a un axe pour chaque valeur possible que peut prendre ce degré de liberté (un axe par position possible). Dans cette représentation, un type de propriété (comme "position") ne correspond plus à un axe précis, mais à un référentiel de l'espace de Hilbert, ou à un repère, c'est à dire un système de coordonnées à part entière dans cet espace qui consiste à sélectionner des axes perpendiculaires entre eux (orthogonaux).

On voit également que l'état possible d'un système n'a pas à correspondre à des valeurs de propriétés bien définies. Si par exemple deux positions possibles correspondent à deux axes, il existe une infinité d'états sur le plan que forment ces deux axes. On ne pourra dire d'aucun de ces états qu'il correspond à l'une ou l'autre de ces valeurs de position, sauf quand ils coïncident avec l'un des deux axes.

On peut alors définir les opérations logiques suivantes sur les propriétés :

  • La conjonction de deux propriétés ("A et B") correspond à l'intersection des sous-espaces de chaque propriété (par exemple, l'intersection de deux plans est un axe).
  • La disjonction de deux propriétés ("A ou B") correspond au produit de leurs sous-espaces. Par exemple, le produit de deux axes est un plan, et le produit d'un plan et d'un axe est un volume à trois dimensions.
  • La négation d'une propriété ("non A") correspond au complémentaire de son sous-espace. Le complémentaire d'un sous-espace A est tel que "A ou non A'" nous donne l'espace complet. Par exemple dans un espace à 3 dimensions, le complémentaire d'un plan est un axe perpendiculaire à ce plan, et inversement.

Tout comme dans le cas classique, on peut envisager une répartition de probabilité sur ces propriétés, qui consistera à pondérer chaque axe de l'espace des phases par un coefficient.

Le problème est qu'avec cette représentation on ne retrouve ni les inférences de la logique standard, ni le calcul standard des probabilités. Si l'on prend cette représentation au sérieux, nous devons adopter une logique quantique dont les règles sont différentes. Une de ses caractéristiques est notamment qu'elle n'est pas distributive ("A et (B ou C)" n'est pas équivalent à "(A et B ) ou (A et C)"), ce qui est assez contre-intuitif ("Ceci est un chat mort ou vivant" n'est pas équivalent à "ceci est soit un chat mort, soit un chat vivant").

Les cadres ("framework")

Il existe cependant un moyen de restaurer les règles classiques de la logique et des probabilités. Il s'agit de restreindre les possibilités d'expression du langage, en décrétant que certaines propositions logiques sont dénuées de signification. On décrétera notamment que la disjonction ou la conjonction de deux propriétés n'ont de sens que si les sous-espaces correspondant à ces propriétés sont orthogonaux. C'est ce que propose le formalise des histoires consistantes.

Ces contraintes reviennent à imposer à l'utilisateur de la logique de choisir un cadre (framework) dans lequel ses expressions prennent un sens. Le choix est arbitraire : rien n'empêche de choisir un autre cadre, mais il est interdit de combiner les cadres, c'est à dire de faire des inférences logiques à partir de propositions exprimées dans des cadres différents.

On peut définir un cadre comme un ensemble de propriétés telles que leurs conjonctions respectives est toujours nulle (elles sont orthogonales) et leur disjonction couvre tout l'espace des états. Autrement dit, c'est une manière de découper l'espace des états en propriétés distinctes (l'équivalent, dans un système classique, serait une partition de l'espace des phases en régions disjointes. Voir l'image.). Si par exemple notre espace a trois dimensions, les différents cadres possibles sont : soit trois axes orthogonaux, soit un plan et un axe orthogonal à ce plan, soit l'espace dans son ensemble (qui est un cadre assez peu utile).

Partizione

Il existe des relations intéressantes entre les différents cadres. Par exemple, il est possible d'affiner un cadre en décomposant l'une de ses propriétés en sous-propriétés, dont elle est la disjonction (en définissant un plan à partir de deux axes orthogonaux). Il y a toujours plusieurs façons mutuellement incompatibles d'affiner un cadre (puisqu'il existe plusieurs façons de choisir deux axes orthogonaux sur un plan). Il est aussi possible d'épaissir un cadre en fusionnant deux de ses propriétés (prendre un plan au lieu de deux axes).

Des cadres sont dis compatibles si toutes leurs propriétés caractéristiques sont orthogonales deux à deux. On peut montrer que dans ce cas les cadres ont un affinement commun, c'est à dire un cadre plus fin qui permet de définir ces deux cadres. (par exemple, si l'on prend un espace à trois dimensions, x, y et z, on aurait un cadre formé du plan (x, y) et de l'axe z, et un autre formé du plan (x, z) et de l'axe y. Ils sont compatibles, et ont un affinement commun, formé des trois axes x, y et z). La notion de compatibilité est symétrique et réflexive, mais pas transitive : si un cadre X est compatible avec Y et Y avec Z, ça ne signifie pas que X et Z soient compatibles. La notion de compatibilité est une caractéristique des espaces de Hilbert. Dans un système classique, tous les cadres sont compatibles, et ils ont un affinement commun, qui consiste à considérer leurs intersections, ou à la limite, chaque point de l'espace des phases. Mais dans un espace de Hilbert, ça ne fonctionne plus.

Quand deux cadres sont compatibles, on peut utiliser la logique et les probabilités dans ces deux cadres sans problème.

Un cadre est donc en quelque sorte un repère, un référentiel dans l'espace des phases, un découpage de celui-ci en coordonnées, mais qui peut être grossier et ne pas distinguer différentes propriétés.

Si l'on adopte un cadre, on peut voir l'état d'un système (une fonction d'onde) comme définissant une répartition de probabilités sur un ensemble de propriétés (celles du cadre), et le calcul standard des probabilités est applicable. Le cadre spécifie un ensemble de propriétés possibles que le système peut avoir, qui sont disjonctives (le système a au moins l'une d'entre elles, et une seule) et ne s'intéresse pas aux autres propriétés.

On peut prendre l'image (que j'emprunte à Griffith) de différents points de vues sur une montagne, par exemple l'un vue du nord et l'autre du sud. On pourrait dire que d'un point de vue il est possible d'avoir une vision plus ou moins fine ou grossière (si l'on fait mal la mise au point), mais ces différentes vues donneront des images compatibles. Cependant la perspective nord et sud sont incompatibles (et contrairement au cas d'une montagne, où on peut forger une représentation en 3 dimensions contenant tous les points de vues possibles, ce n'est plus vraiment possible ici, sauf à adopter une logique quantique). Peut-être même, pour pousser l'analogie, qu'un point de vue grossier serait compatible avec plusieurs points de vue plus fins légèrement distincts, incompatibles entre eux. Adopter un cadre c'est donc en quelque sorte choisir une perspective sur cette montagne, et une mise au point.

Les histoires consistantes

Il est possible d'étendre tous ces concepts à un système qui évolue au cours du temps. De la même façon que quand on joue à pile ou face, lancer trois pièces simultanément, ou la même pièce trois fois de suite nous donne le même espace de possibilités (2x2x2=8 possibilités), il suffit de considérer les états successifs du système à différents instants discrets du temps pour définir un espace de Hilbert plus large (dans le jargon, on parle du produit tensoriel d'espaces de Hilbert).

De la même façon on peut alors définir des cadres, qui correspondent à un découpage de chaque état instantané en propriétés. Cependant dans le cas dynamique certaines subtilités s'ajoutent. En particulier on considérera uniquement des instants discrets du temps, et il faut des conditions supplémentaires pour que les règles de la logique classique puissent être appliquées, qui dépendent de ce qu'on appelle l'hamiltonien du système (son opérateur d'évolution). On parle alors de cadre consistant.

Dans le cas statique, adopter un cadre consistait à adopter un ensemble de propriétés disjonctives pour décrire le système, définissant des états possibles. Dans le cas dynamique, adopter un cadre revient à adopter une famille d'histoires possibles, une histoire étant simplement une succession de propriétés définies, indexées dans le temps, comme le serait par exemple une succession de "pile" et de "face" pour une pièce qu'on lancerait plusieurs fois. Dans le cas statique, la fonction d'onde nous permet d'obtenir une répartition de probabilités sur des propriétés possibles. Ici, on obtient une répartition de probabilités sur des histoires possibles.

Du fait que le calcul des probabilités standard peut être retrouvé, la structure de ces histoire consistantes correspondra à un arbre dont les branches correspondent à des déroulements différents à partir de l'état initial du système.

L'approche des histoires consistantes consiste donc simplement à nous dire ceci : une fois qu'on a choisi un cadre, une façon de décrire le système, l'ensemble des paradoxes de la mécanique quantique disparaissent. Il n'y a plus de problème de non-localité, de superposition d'états, de rétro-causalité ou que sais-je. Nous avons simplement un système qui évolue au cours du temps de manière aléatoire, certes, mais il est possible de connaître les probabilités que le système se trouve dans tel ou tel état, de faire des inférences et d'utiliser le calcul des probabilités standard.

En outre on peut comprendre également comment passer d'une description quantique à une description classique. Il suffit d'assimiler les mesures macroscopiques effectuées sur un système microscopique à un cadre grossier. Il est possible de montrer, avec la théorie de la décohérence, que ces cadres grossiers dits "quasi-classiques" seront en général consistants, ou suffisamment proche d'un cadre consistant pour qu'on n'ait pas à s'en préoccuper.

Mais qu'est-ce qu'un cadre ?

L'interprétation des histoires consistantes promet donc de résoudre tous les paradoxes de la mécanique quantique de manière simple et parcimonieuse. Il s'agit, pour reprendre les mots de Griffith, de "détrôner" la fonction d'onde : en effet celle-ci ne joue plus de rôle central dans ce formalisme, et on peut même complètement l'éliminer.

En effet dans cette interprétation, il n'est plus nécessaire de prendre en compte l'état initial du système et de le traduire sous forme de fonction d'onde qu'on fera évoluer au cours du temps. On peut se satisfaire de l'hamiltonien du système (son opérateur d'évolution) : celui-ci nous permet déjà de calculer, pour un cadre, les probabilités de chaque histoire consistante, c'est à dire de chaque succession de propriétés. L'état initial du système sera alors simplement l'un des éléments de ces histoires, à savoir la première propriété de chaque histoire possible (ou une répartition de probabilités).

Une représentation équivalente consisterait à associer ces histoires consistantes à des probabilités conditionnelles entre propriétés à différents instants. Il suffit alors de considérer l'état initial pour connaître certaines probabilités aux instants suivants, ou encore un déroulement sous forme d'arbre. Dans tous les cas, seul l'hamiltonien du système est mis à contribution : pas besoin de fonction d'onde. Voilà qui devrait faire plaisir aux métaphysiciens qui s'échignent à essayer de comprendre ce que peut bien représenter ce mystérieux objet...

Cette simplicité, cependant, a un prix, et ce prix est la relativité de ce type de description à un cadre, dont le choix est entièrement arbitraire, et à l'impossibilité de changer de cadre lors d'un raisonnement logique ou probabiliste. Cette contrainte peut sembler un peu mystérieuse. Pourquoi donc serait-il impossible de décrire l'état d'un système de manière complète et définitive ? Pourquoi sommes nous obligés de choisir un cadre ?

En effet les cadres n'existent pas dans le monde, et il ne faut pas, selon la théorie des histoires consistantes, considérer qu'il existe un "bon cadre" (qui correspondrait à ce qu'on mesure en effet sur le système). Il ne faut pas confondre ce qu'on mesure et les propriétés microscopiques du système. Le formalisme des histoires consistantes s'intéresse aux propriétés des systèmes microscopiques, pas aux expériences qu'on réalise sur eux. En particulier, il est toujours possible d'adopter un cadre qui n'a rien à voir avec ce qui est mesuré sur le système. Ce cadre sera certainement peu utile (on n'obtiendra que des probabilités au lieu de valeurs déterminées pour les propriétés auxquelles on s'intéresse) mais qu'importe : c'est un choix possible.

On peut voir les choses un peu comme ceci : il existerait plusieurs langages pour décrire le monde, et ces langages ne peuvent être utilisés simultanément sous peine de contradiction logique. Tout ce que nous fournit la théorie quantique, ce sont des règles d'utilisation de ces différents langages et des moyens de les traduire entre eux. Mais toute affirmation sur le monde reste relative à un langage, sans qu'on ne puisse dire d'aucun qu'il est le "bon" langage.

Toutes les interprétations de la mécanique quantique ont un prix à payer, mais finalement celui-ci n'est peut être pas si grand.

jeudi 13 août 2015

Qu'est-ce qu'une théorie physique ? Qu'est-ce qu'interpréter une théorie ?

Une fois n'est pas coutume, cette entrée ne contient aucune thèse ou position philosophique (ou de manière assez minimale). Il s'agit plutôt de proposer une clarification conceptuelle : qu'est-ce qu'une théorie scientifique ? Un modèle ? Comment est-il confronté à la réalité ? Qu'est ce que l'adéquation empirique d'une théorie ? Qu'est-ce qu'interpréter une théorie ? Pour finir je propose un rapide recensement des positions contemporaines en métaphysique des sciences à l'aulne de cette analyse.

Qu'est-ce qu'une théorie ?

Je propose la caractérisation suivante de ce qu'est une théorie physique :

Un vocabulaire théorique
  • un ensemble de propriétés observables pensées comme contingentes (comme la position, la direction de spin)
  • un ensemble de propriétés fondamentales pensées comme nécessaires à leur objet (comme la masse ou la charge)
  • Des types d'objets (l'électron, ...) pouvant posséder ces propriétés.
Des structures mathématiques
  • des structures pouvant représenter les degrés de liberté d'un système particulier (un espace des phases, l'espace de configuration ou l'espace de Hilbert)
  • D'autres destinées à spécifier des opérations sur ces systèmes, ou leur évolution (un hamiltonien, un opérateur)
  • d'autres servant de cadre général ou relationnel pouvant être communs à plusieurs systèmes (un espace-temps géométrique, un espace de Minkowski).
Des axiomes théoriques
Ces axiomes permettent de faire le lien entre les éléments précédents :
  • ils indiquent comment associer vocabulaire d'observation et structures mathématiques, comment "labelliser" les degrés de liberté, les opérations ou les structures cadres avec les propriétés observables des systèmes.
  • Ils indiquent comment associer les propriétés fondamentales du système et les structures labellisées aux observations ou prédictions, ce qui peut prendre la forme de lois d'évolution (comme l'équation de Schrödinger) ou de règles permettant de déduire des prédictions (comme la règle de Born).

Qu'est-ce qu'un modèle ?

Une théorie physique est comme un langage doté d'un vocabulaire et d'une grammaire (les axiomes) permettant de forger des propositions. Ces propositions, ce sont des modèles.

Un modèle est une structure mathématique, interprétée dans le vocabulaire de la théorie, et qui vérifie ses axiomes, et qu'on peut penser comme étant destinée à représenter des types de systèmes. Construire un modèle demande d'intégrer les éléments suivants :

Une caractérisation du système concerné
Il s'agit d'une caractérisation des degrés de liberté d'un système, de ses propriétés fondamentales (sa masse, sa charge), et de la façon dont il interagit avec son environnement (un champs électromagnétique).
Des entrées physiques
Typiquement, ceci correspond à l'état initial du système, qui peut s'exprimer par une valeur pour une propriété observable, ou une répartition de probabilité sur celles-ci.
Des entrées opérationnelles
Il s'agit de spécifier les mesures que l'on va effectuer sur le système, en terme de propriétés observables indexées dans la structure cadre (l'espace et le temps).

A partir de ces éléments et des axiomes de la théorie, nous pouvons construire un modèle qui contient des prédictions. Typiquement les degrés de libertés permettent de construire un espace des phases (ou un espace de Hilbert) dont les axes sont "labellisés" avec les propriétés observables du système, et associés à une structure cadre (un référentiel correspondant par exemple à une géométrie de l'espace). La façon dont le système interagit avec son environnement, ainsi que les propriétés fondamentales du système permettent d'établir une loi d'évolution du système dans cet espace des phases (un hamiltonien). Enfin la prise en compte des opérations de mesure permet de dériver des prédictions, c'est à dire des résultats de mesures (des valeurs pour les propriétés observables) indexées dans l'espace et le temps.

Bien sûr il s'agit là du cas idéal, et en pratique, les physiciens procèdent à de multiples idéalisations, hypothèses auxiliaires simplificatrices, ou techniques d'approximation mathématiques pour construire le modèle, si bien que souvent le modèle ne vérifie pas à strictement parler les axiomes de la théorie. Simplement on pense qu'il approxime un modèle qui, lui, vérifie ces axiomes.

Comment applique-t-on un modèle ?

Les propositions d'un langage doivent encore être utilisées en contexte : elles doivent être prononcées par un locuteur pour exister. De même les modèles théoriques doivent être appliqués à la réalité, dans un contexte expérimental.

Il peut s'agir de développer une technique, de comprendre le fonctionnement d'un système physique réel, de faire des prédictions, ou encore de simplement vérifier la théorie. Dans tous ces cas, utiliser un modèle en contexte nous demande d'associer chacun de ses éléments à des objets et propriétés de la réalité courante :

  • Identifier un type de système (des degrés de liberté, des propriétés fondamentales) et la façon dont il interagit avec son environnement à un objet ou dispositif expérimental réel (un canon à électron, un aimant), ce qui demande une connaissance préalable, éventuellement certaines mesures préparatoires (la valeur du champs électromagnétique) ou certaines connaissances spécifiques à un domaine (des lois d'observation).
  • Associer les structures cadre (la géométrie) à un référentiel arbitraire (le référentiel du laboratoire).
  • Associer les entrées physiques, les opérations de mesure et les résultats à des appareils de mesure, avec éventuellement une calibration ou des règles de traduction des résultats.

Les règles qui nous permettent de faire correspondre les modèles à la réalité expérimentale ne sont pas formelles et systématiques, mais tacites, techniques, pratiques. Elles peuvent évoluer sans qu'on pense que la théorie a changé (on construit de nouveaux appareils de mesure plus performant...). En outre ces règles utilisent un contenu mixte langage naturel / théorique. Pour ces différentes raisons, on peut avancer qu'elles sont externes à la théorie elle-même.

Quand est-ce qu'une théorie est empiriquement adéquate ?

Une fois qu'on dispose de ces moyens d'appliquer un modèle à un domaine de la réalité, nous sommes à même de comparer les prédictions du modèle et les résultats de mesure concrets obtenus.

L'adéquation empirique joue un rôle central en science. On peut dire qu'un modèle est empiriquement adéquat si chaque fois qu'il s'applique (ce qui dépend des règles du troisième niveau ci-dessus) il fait de bonnes prédictions. Bien sûr, les prédictions probabilistes peuvent demander une analyse plus fine, par exemple en terme statistiques, qui demande de procéder à une induction sur plusieurs expériences.

Si une expérience échoue, il n'est jamais nécessaire de remettre en cause la théorie elle-même : on peut aussi considérer qu'en fin de compte le modèle ne s'appliquait pas réellement à la situation (parce qu'un appareil de mesure est défectueux, parce qu'il manquait une hypothèse à notre modèle, un phénomène perturbateur inconnu...). C'est à dire qu'on peut toujours en principe mettre en cause l'étape consistant à mettre en relation un modèle et une situation concrète (le troisième niveau ci-dessus) plutôt que la théorie elle-même, voire modifier le modèle de manière ad-hoc pour qu'il corresponde à ce qui est observé.

Pour cette raison, et contrairement à une idée largement répandue, ce sont rarement les échecs prédictifs qui motivent les avancées théoriques, mais plutôt des questions purement conceptuelles (comme essayer de combiner plusieurs théories contradictoires s'appliquant à des domaines différents), même si les anomalies dans les prédictions peuvent être prises en compte dans ce processus.

L'adéquation empirique joue cependant plusieurs rôles. D'une part elle permet de confirmer ou d'infirmer les hypothèses ad-hoc qui font suite à une anomalie expérimental (par un jeu d'essai et d'erreur), ce qui peut amener à éliminer certaines anomalies et conforter d'autant plus la théorie dans son succès, ou au contraire rendre une anomalie persistante. D'autre part elle permet de confronter les nouvelles théories entrant sur le marché. Typiquement, celles-ci voudront faire de nouvelles prédictions différentes de la théorie bien établie pour une situation particulière. Enfin elle permet d'éprouver un modèle donné ou une famille de modèles en vue d'applications techniques, ou pour d'autres raisons.

On peut dire qu'une théorie est empiriquement adéquate (et donc mérite d'être bien établie) si tous ses modèles le sont.

Bien sûr nous sommes incapable de tester tous les modèles de la théorie. Cependant nous pouvons procéder à des inductions par généralisations successives : nous induisons sur les entrées physiques, les entrées opératoires, en faisant varier les dispositifs. Nous testons ainsi un modèle général (ou une classe de modèles) dont on peut affirmer qu'ils sont empiriquement adéquats. Enfin on peut également procéder par abstraction sur tous les types de modèles, en testant des configurations diverses. Ces inductions sont souvent utilisées pour résoudre les anomalies expérimentales, en testant les hypothèses ad-hoc dans différents cadres. Elles sont également réalisées quand on étend la théorie à de nouveaux domaines, qu'on conçoit de nouvelles expériences ou de nouvelles techniques. Ce sont elles qui confortent réellement la théorie.

En résumé, on peut dire qu'une théorie est empiriquement adéquate si quelque soient les entrées physiques et opératoires, et quelque soient les systèmes auxquels elle s'intéresse, ses modèles font de bonnes prédictions.

Qu'est-ce qu'une interprétation d'une théorie ?

On peut maintenant se demander ce que signifie interpréter (philosophiquement) une théorie. Il me semble qu'on puisse dégager des sens différents de l'interprétation suivant le niveau auquel on s'intéresse.

On pourrait d'abord penser (si on aime les sémantiques vérificationistes) qu'interpréter une théorie scientifique nous demande de nous intéresser uniquement au troisième niveau : comment le vocabulaire théorique est mis à contribution lors de la confrontation de la théorie à la réalité ? Comment se comporte-t-il en relation avec nos actions et notre langage naturel ?

En considérant tous ces éléments, a-t-on épuisé ce qu'il y a à dire sur l'interprétation ? Il est certain que la façon dont la théorie est utilisée en pratique permet au moins de fixer son domaine d'application. Mais un problème est que ce domaine est susceptible d'évoluer au fil des techniques sans qu'on pense que la théorie elle-même ait changée.

En outre, le discours scientifique ne se limite certainement pas à la vérification expérimentale, à la prédiction ou au développement de techniques. Il joue également un rôle descriptif, explicatif, nous permet de comprendre la nature de la réalité. C'est en tout cas ce qu'on pense si on est d'inclination réaliste (et par ailleurs le vérificationnisme a fait son temps : il existe de bons arguments en philosophie du langage pour nous en convaincre).

Même en considérant que nous nous leurrons quand nous prétendons expliquer la réalité, que nos représentations ne correspondent en rien à quelque chose d'extérieur mais son seulement des outils prédictifs, il faut bien admettre que le discours scientifique sert d'autres buts que la simple vérification expérimentale : il s'agit, également, de faire des inférences, d'émettre des hypothèses, de développer les théories en les appliquant à de nouveaux domaines, de construire de nouveaux modèles. Et ce discours est lui aussi couronné de succès.

On peut donc ici définir un premier sens d'interpréter, qui consiste à se questionner sur la fonction du discours scientifique en général (à tous les niveaux, et en particulier au niveau des modèles) : s'agit-il simplement de faire des prédictions, de développer des techniques ? De décrire des régularités dans les phénomènes ? Ou prétend-on décrire la nature fondamentale de la réalité ? Sa structure ? On peut parler d'interprétation sémantique.

Une fois la fonction du langage scientifique clarifiée, on peut se demander si cette fonction est réalisée avec succès et si on pense que c'est le cas, on pourra chercher à fournir une explication philosophique à ce succès. Alors on peut envisager un second sens d'interpréter : il s'agit de clarifier ce que la science nous apprend de la réalité et d'expliquer son succès en général, que ce soit sont succès empirique ou dans les inférences. On peut parler à ce propos d'interprétation épistémologique

Ce niveau d'interprétation permet de différencier instrumentalisme et réalisme. Il pourra mettre l'accent sur la vérification empirique, qui est en un sens la mesure ultime du succès de la science. Ici l'attitude réaliste consistera à penser que la science est couronnées de succès prédictif parce qu'elle décrit correctement la réalité, sous certains aspects (l'explication de son succès est réaliste), et le rôle de la métaphysique serait de clarifier ces aspects en proposant une ontologie.

Il en découle un troisième sens d'interpréter qui est spécifique au réalisme : associer le contenu théorique (celui du premier niveau théorique) à une ontologie qui correspond au contenu des théories, c'est à dire, en gros, de clarifier ce que représentent le formalisme, les axiomes ou le vocabulaire de la théorie dans la réalité. On peut parler d'interprétation métaphysique.

Suivant ce dernier sens d'interprétation, il nous faudra considérer la vérification, qui permet en effet de fixer le domaine d'application de la théorie, et les modèles qui nous indiquent comment les concepts scientifiques sont mis en oeuvre, mais c'est surtout le contenu théorique général (le vocabulaire, les structures et les axiomes) qui nous intéressera.

Les différentes interprétations contemporaines

C'est dans ce troisième sens qu'on trouve la plupart des interprétations contemporaines en métaphysique. On peut les distinguer en reprenant les trois aspects du niveau théorique ci-dessus :

Le vocabulaire théorique
S'agit-il de propriétés fondamentales ? d'universaux ? de tropes ? de bundles de dispositions ? Ces propriétés sont-elles possédées par des objets, des événements, des processus, ou par une substance ? Ou ne sont-elles que des supports heuristiques pour nos raisonnements, les noeuds d'une structure théorique ?
Les structures formelles
Sont-elles des structures primitives de la réalité ? Des objets mathématiques existant de manière abstraite ? Ou simplement le réseau des relations entre les autres éléments ?
Les axiomes
Correspondent-ils à des lois de la nature primitives ? A la description de dispositions ou de rapports causaux instanciés dans la nature ? A des structures modales ? Des relations entre universaux ? Ou simplement à la description de régularités dans les phénomènes ? Ou encore, des possibilités d'inférence relatives à des agents possédant une connaissance incomplète du monde ?

Le fait est que les théories scientifiques elles-même ne nous indiquent pas quelle ontologie adopter, et en fin de compte, il se peut que nous devions nous reporter de nouveau à la façon dont les modèles théoriques sont utilisés et confrontés à la réalité pour obtenir une réponse. Mais l'inconvénient de l'attitude réaliste est qu'elle ne fournit pas de critères précis pour juger d'une bonne ontologie.

mercredi 22 juillet 2015

Monisme neutre et physique relationnelle

La physicalisme
est l'idée que le mental se réduit (survient, est déterminé par...) le physique (le physique est primitif).
L'idéalisme
est l'idée que le physique se réduit au mental (le mental est primitif).
Le dualisme
est l'idée que ni le mental ni le physique ne se réduisent l'un à l'autre (le mental et le physique sont tous deux primitifs).
Le monisme neutre
est l'idée que le mental et le physique se réduisent tous deux à une substance neutre (ni le mental ni le physique ne sont primitifs).

J'ai expliqué dans un article récent que pour moi la controverse sur le physicalisme est une querelle de langage. Qu'appelle-t-on physique ? Si on en a une définition assez large, le physicalisme est trivialement vrai. Si on en a une plus positive, il est faux, mais de toute façon le contenu de la physique n'est peut-être pas physique.

Par querelle de langage, j'entends une querelle qui peut être réglée par un choix conventionnel : mettons nous d'accord sur une définition de physique. Enfin, les choix sémantiques ne sont jamais de purs conventions arbitraires, et je pense qu'il existe une bonne façon de régler la querelle qui est de donner à "physique" une définition plutôt restrictive, quit à se mettre en porte-à-faux avec la physique contemporaine.

Cette définition devrait comporter des choses comme : un aspect méréologique / réductionniste (la possibilité d'agencements structuraux de parties en un tout qui n'est rien de plus que l'agencement de ces parties) et surtout un aspect objectif ou intersubjectif : les propriétés physiques sont robustes aux variations de point de vue. On pourrait vouloir y ajouter un aspect causal et une référence à l'espace-temps mais on risque de se prononcer sur des aspects métaphysiques qui ne vont pas de soi (je pencherai personnellement pour une réduction de l'espace-temps à la structure causale du physique, donc définir le physique comme quelque chose qui a un pouvoir causal, sans faire référence à l'espace-temps, mais tout le monde ne serait pas d'accord) et donc je pense qu'il faut rester neutre à ce sujet.

Le choix qui me semble judicieux est donc : adopter une définition a priori, assez stricte du physique, de laquelle on peut déduire que le physicalisme est faux par un argument à la Chalmers, mais aussi, plus directement, à partir de la physique puisque les entités de la physique ne sont (paradoxalement) pas physiques en ce sens.

Il peut paraître étrange d'opter pour une définition du physique que ne respectent même pas forcément les entités de la physique fondamentale. Pour moi ça ne pose pas de problème, parce que la physique ne respecte pas cette définition que dans la mesure où elle pose des problèmes d'interprétations. Chaque fois qu'on tente d'interpréter la physique quantique de manière réaliste, en la complétant de variables cachées ou de dynamiques de projections, on vise à restaurer plus ou moins ces aspects, en particulier l'objectivité. Ceci montre donc que ces aspects sont important, et ça justifie de les prendre en compte dans notre définition de ce qui est physique.

Une autre raison pour laquelle ce n'est pas selon moi un problème est que ce n'est pas parce que les entités de la physique fondamentale ne sont pas physiques en ce sens que rien n'est physique. On peut dire que "l'image manifeste du monde" est supportée par des choses physiques : objectives, structurées méréologiquement. C'est même ce qu'on entend par physique au sens courant. Or d'un point de vue réaliste, une théorie physique doit pouvoir faire le lien avec l'image manifeste du monde, expliquer comment celle-ci émerge de l'ontologie que cette théorie nous propose, et donc même si on considère que les entités de la physique ne sont pas physiques en ce sens, on doit accepter que quelque chose de physique en résulte (au moins approximativement).

Et c'est ici qu'apparaît le point le plus intéressant de cette option purement sémantique, qui est qu'elle ouvre la porte à ce qui serait un monisme neutre, à savoir l'idée que ce qui est physique émerge en fait d'un substrat neutre, qui est celui décrit par la physique.

Bien sûr ce choix sémantique ne force rien. Si l'on fait une petite cartographie des options, on arrive à ceci :

  • Soit on interprète la physique quantique de manière réaliste (on complète la mécanique quantique) et le physique est primitif.
    • Si on pense que le mental est aussi primitif, on est dualiste (D).
    • Sinon on est physicaliste (P).
  • Soit on interprète la physique quantique de manière non réaliste. Le physique n'est pas primitif mais émerge à la limite quantique / classique.
    • soit la physique quantique décrit un contenu mental. On est idéaliste (I).
    • soit la physique quantique décrit un contenu ni mental, ni physique, mais neutre (duquel émerge au moins le physique).
      • soit le mental se réduit au physique. On a toujours une forme de physicaliste car le physique est premier par rapport au mental (même si le physique n'est pas "vraiment" primitif, mais ça reste exotique) (P*)
      • soit le mental est primitif. On a toujours une forme de dualisme, même si le physique n'est pas "vraiment" primitif (D*).
      • soit le mental se réduit à ce substrat neutre. On adopte un monisme neutre (N).

Remarque : les options D* et P* sont un peu "batarde" dans la mesure où on a un substrat non physique, mais qui ne fait rien d'autre que fonder le physique. Disons que dans ces cas là mon choix sémantique s'avérerait peu judicieux, et qu'en fin de compte il serait peut-être préférable de qualifier de "physique" le contenu de la physique, même si celui-ci ne répond pas tout à fait à notre définition a priori.

On voit au passage que la question du réalisme scientifique (la science décrit-elle ce qui est indépendant de l'esprit ?) rejoint celle du rapport physique / mental, dont elle n'est que l'autre face en un sens. Ce qui se dégage, ce sont des "packages métaphysiques" cohérents qui combinent une interprétation du contenu de la physique contemporaine et une position en philosophie de l'esprit.

Afin de savoir où exactement situer ces packages il faut se mettre d'accord sur une définition de "mental". Je propose de parler de mental à propos de ce qui est relatif à un sujet cognitif (non robuste suivant les changements de point de vue). Les interprétations réalistes peuvent soutenir à priori (D) ou (P). Je classerai alors les interprétations type bayesianisme quantique en (I), puisque la physique porte selon eux sur des informations relatives à des agents. Je classerai les interprétations relationnelles en (N), dans la mesure où la physique décrit la relation entre un observateur et un système observé, mais sans que "observateur" face nécessairement référence à un sujet cognitif, puisque ce peut être n'importe quel système physique.

Pour ma part le "package" que je défend, c'est une physique relationnelle et un monisme neutre. Selon la physique relationnelle il n'existe aucun point de vue de nulle-part (un état physique est relatif à une perspective). Le contenu de la physique est donc bien neutre, mais des états objectifs robustes émergent notamment si on prend en compte la décohérence. De plus si les sujets cognitifs sont eux-même émergent (ce qui nécessite une mémoire, etc) on a alors également une émergence du mental, pour peu qu'un contenu macroscopique puisse être relatif à un système observateur macroscopique (ce qui est controversé).

Cette vision des choses est intéressante car elle permet de rendre compte de la causalité mental - physique et physique -mental : c'est l'intrication qui est responsable de la seconde, la décohérence de la première. On résout ainsi le dilemme de la causalité mentale.

Monisme modal et pragmatisme

Depuis Kripke on parle frequemment de modalités métaphysiques, celles-ci étant intermédiaire entre les modalités logiques (ce qui est logiquement nécessaire ou non, associé à nos définitions linguistiques) et les modalités physiques (ce qui est physiquement nécessaire ou non, associé aux lois de la nature).

Les modalités métaphysiques correspondent à ce qui est nécessaire en vertu de l'essence des choses, de leur nature métaphysique, de leur identité. Par exemple l'eau est nécessairement le composé de structure moléculaire H2O, la chaleur est nécessairement de l'agitation moléculaire, etc. Il ne s'agit pas à proprement parler d'une nécessité qui dériverait d'une loi physique, ni non plus d'une nécessité de l'ordre de la convention linguistique puisqu'on parlait d'eau et de chaleur avant la science moderne. C'est quelque chose d'intermédiaire entre les deux.

Il existe certaines tentatives pour ramener les modalités métaphysiques à des modalités purement logiques ou de l'ordre de la convention linguistique. Si c'est la définition de l'eau que d'être le composé de structure H2O, en effet c'est une nécessité mais il n'y a rien de bien métaphysique la dedans. Certes on utilisait le terme "eau" avant de connaître sa constitution moléculaire, mais la nécessité de cette constitution pourrait être déduite d'un fait (que ce qu'on appelle l'eau est de structure H2O) et d'une convention linguistique (que les constitutions chimiques sont possédées nécessairement), comme le propose Sidelle.

Une alternative serait de s'inspirer de Laporte et d'affirmer que "eau" peut changer de signification au cours de l'histoire, et en particulier voir sa signification devenir plus précise, si bien que ce qu'on appelait "eau" avant la chimie moderne n'est pas exactement ce qu'on appelle "eau" aujourd'hui. J'avoue trouver cette approche convaincante. Dans ce cas on peut défendre que le fait que l'eau est nécessairement H2O est simplement une question de définition linguistique, puisque c'est ainsi qu'on définit l'eau aujourd'hui. Ceci n'exclut pas l'approche de Sidelle, puiqu'il est possible que certaines conventions nous poussent à définir les termes en fonction de leur structure moléculaire plutôt que par leurs apparences.

Il existe par ailleurs des tentatives pour assimiler les nécessités physiques et métaphysiques. C'est ce qu'on appelle le dispositionnalisme. Il s'agit de concevoir les lois de la nature comme ne faisant rien d'autre que de décrire le profil causal de propriétés physiques, par exemple : la charge électrique n'est rien d'autre que la propension à attirer d'autres charges, il s'agit de son essence. Les axiomes de l'électromagnétismes devraient en fait s'interpréter comme des définitions implicites de ce qu'est une charge électrique, un champs électromagnétique, etc.

Si tel est le cas il n'y a pas de différence entre les nécessités physiques et métaphysiques, qui relèvent tout deux d'une question d'essence. Les lois physiques sont métaphysiquement nécessaires, en vertu de la nature du monde. La vitesse de la lumière n'aurait pas pu être différente (sinon ç'aurait été autre chose que "notre" lumière) etc.

Le dispositionnalisme est intéressant : il permet d'éviter d'introduire des propriétés catégoriques, ou des universaux un peu mystérieux. Il rend compte de la causalité et de son rapport aux lois sans peine, en plaçant la causalité au niveau fondamental de la réalité plutôt qu'en cherchant à la dériver des lois, ou d'autres choses (ce qui est un véritable casse tête). De nouveau je suis assez convaincu.

Et là peut être me voyez vous venir. Si je suis convaincu que les modalités physiques et métaphysiques sont indistinctes, et que ces dernières sont également indistinctes de modalités logiques ou linguistiques, alors je dois penser que les modalités physiques, associées aux lois de la nature, sont de pures conventions linguistiques : on a choisi d'appeler "charge" ce type de propriété qui fait qu'un objet qui la possède attire les autres qui la possèdent également, et donc la nécessité qui fait que les aimants s'attirent est purement a priori, dans le langage.

En effet c'est exactement ce que j'affirme. Mais il n'y a rien d'incompatible, je pense, à défendre cette position (qui est un monisme modal) est à affirmer qu'il existe une nécessité dans la nature.

Bien sûr que les aimants s'attire qu'on le veuille ou non, qu'on les appelle aimant ou non. Ce n'est pas notre langage qui les fait s'attirer. Tout ce que fait notre langage, c'est décrire ces rapports de nécessité. Mais si notre langage décrit correctement le monde, si en effet nos concepts s'appliquent à la réalité, alors les rapports de nécessité associés à ces concepts doivent refléter les rapports de la nécessité qui existent dans le monde. Notre langage, notre schème conceptuel, se construit en mirroir du monde.

On peut donc être à la fois moniste modal est réaliste modal si on pense que nos conventions linguistiques et conceptuelles ont pour objet de refléter la structure modale du monde. .

En un sens il s'agit de prendre au sérieux la thèse de Quine, suivant laquelle il n'existe pas de moyen de distinguer clairement les aspects linguistiques et factuels du langage, ou les énoncés analytiques et synthétiques. Si on applique la thèse de Quine à la nécessité, on aboutit à la conclusion qu'il n'existe pas de distinction entre la nécessité synthétique, factuelle, c'est à dire les rapports de nécessité dans le monde, et la nécessité linguistique, relevant de conventions. On aboutit exactement au monisme modal défendu ici.

Certes Quine était sceptique à propos de la notion de signification, et de celle de nécessité, mais nous ne sommes pas obligé de le suivre sur ce point. S'il n'y a pas de distinction analytique / synthétique, on peut aussi en déduire que nos significations elles-même, et les rapports de nécessité associés, sont l'objet de découvertes empiriques, ou d'un ajustement pragmatique lors de la confrontation avec la réalité. En un sens on fait ainsi la synthèse de Quine et de Kripke.

Quine était empiriste, d'où son scepticisme sur la nécessité. Il a intégré certains éléments de pragmatisme avec cette absence de distinction analytique / synthétique et le holisme de la confirmation. Les pragmatistes, comme Peirce, n'étaient pas sceptiques vis à vis de la nécessité naturelle. Ils affirmaient que nous devrions comprendre nos concepts par leurs effets causaux concevables (possibles), ce qui est à la fois proche du dispositionnalisme et du conventionnalisme. Le monisme modal que je propose est donc un pas vers le pragmatisme.