Comment interpréter la possibilité et la nécessité en physique : pour une sémantique des situations possibles

Les lois d'une théorie physique sont souvent interprétées en termes de possibilités naturelles ou physiques : elles nous disent non seulement ce qui est ou n'est pas le cas dans le monde, mais aussi ce qui est physiquement possible ou impossible. Cette idée s'accompagne parfois d'une sémantique des mondes possibles pour les modalités naturelles, et d'une interprétation des modèles d'une théorie comme représentant un monde possible si la théorie est vraie. Cet article (un peu technique) vise à jeter les bases d'une conception alternative.

La sémantique des mondes possibles

Commençons par rappeler ce qu'est la sémantique des mondes possibles et un modèle logique pour les lectrices et lecteurs qui l'ignorent (si ces notions vous sont familières, vous pouvez passer à la section suivante).

Un monde possible peut être identifié à un ensemble maximal de propositions cohérentes entre elles (celles qui sont "vraies dans ce monde"). Maximal veut dire que toute proposition quelle qu'elle soit est soit vraie, soit fausse dans un monde donné (le monde contient soit cette proposition, soit sa négation) : on ne laisse aucune place à l'indétermination. On suppose alors que notre monde actuel est l'un des mondes possibles.

Ce formalisme permet de définir les notions de nécessité et de possibilité : une proposition est possible si elle est vraie dans au moins un monde possible, elle est nécessaire si elle est vraie dans tous les mondes possibles.

(À noter qu'on peut affiner ceci en introduisant, suivant le modèle de Kripke, une relation d'accessibilité entre monde pour, disons, relativiser la possibilité au monde depuis lequel on parle. Il en découle plusieurs systèmes modaux suivant les contraintes sur la relation d'accessibilité qu'on accepte. Par exemple, dans un système déontique, dans lequel "possible/nécessaire/impossible" s'interprète plus naturellement comme "autorisé/obligatoire/interdit", l'accessibilité n'est pas forcément réflexive : le monde d'où on parle peut être interdit. Le système S5 accepte la réflexivité, la transitivité et la symétrie de la relation d'accessibilité, ce qui revient en gros à simplement considérer un ensemble de mondes possibles tous accessibles entre eux comme nous le faisions au départ. Nous n'aurons pas besoin de considérer d'autres systèmes ici.)

On peut aussi représenter un monde possible par un modèle logique. Un modèle logique, tel que défini par Tarski, est une structure mathématique (de théorie des ensembles) associée à un langage, ou autrement dit, un ensemble d'objets (qui peut être infini) tel que sont spécifiés, pour chaque terme d'un langage, à quels objets ces termes correspondent, c'est-à-dire une extension. Les noms propres se voient attribuer chacun un objet unique auquel le nom fait référence, les propriétés se voient attribuer l'ensemble des objets qui ont cette propriété, et ainsi de suite pour les relations (ensembles de couples, triplets, ... d'objets satisfaisant la relation).

Il est assez facile de voir qu'une telle structure est capable de rendre vraie ou fausse n'importe quelle proposition exprimée dans le langage. Par exemple, "tous les chiens sont noirs" est vrai dans un modèle si tous les objets dans l'extension de "chien" se trouvent aussi dans l'extension de "noir". Sinon elle est fausse.

Par ailleurs, il a été proposé de considérer les modèles scientifiques en général comme des modèles au sens de Tarski, soit des structures associées au langage de la théorie (on doit cette proposition à Suppe). Ainsi le modèle du système solaire dans la théorie de Newton serait un ensemble d'objets tel que l'extension de noms propres ("Jupiter"), de propriétés ("avoir une masse M") et de relations ("être à distance D") est spécifiée.

(Ceci suppose que les prédicats du langage sont en fait en nombre infinis : à chaque nombre réel M correspond un prédicat "avoir la masse M" distinct. Suivant cette approche, l'ensemble des axiomes mathématiques décrivant les caractéristiques des nombres réels, par exemple, doivent être intégrées à la théorie, et c'est beaucoup plus simple de le faire en logique du second ordre, soit en s'autorisant à quantifier sur les prédicats eux-mêmes. Mais ce sont des détails techniques.)

Modèles d'une théorie comme modèle de Tarski

Si l'on adopte une sémantique des mondes possibles, si de plus on considère qu'une théorie est un ensemble de propositions nécessaires (au sens d'une nécessité physique), les lois de la théorie, enfin si l'on considère que les modèles scientifiques d'une théorie sont les modèles qui satisfont ses lois au sens de Tarski, alors on en vient naturellement à l'idée que l'ensemble des modèles d'une théorie correspond à "l'ensemble des mondes possibles si la théorie est vraie", chaque modèle de cet ensemble décrivant un monde possible.

Le principal problème de cette façon de voir les choses, pour élégante qu'elle soit, est que cet ensemble de modèles au sens logico-mathématique ne correspond pas à l'ensemble des modèles physiques, ceux réellement considérés comme pertinents pour décrire le monde par les physiciens. Ainsi l'approche est déconnectée de la compréhension de ce qu'est un modèle en science. Il existe au moins quatre différences significatives.

1. Le problème des lois

Premièrement, identifier une théorie à un ensemble fini de lois est problématique. À titre d'illustration, le cadre abstrait de la théorie de Newton (celui décrit par les trois lois de Newton) est compatible avec un très grand nombre de lois dynamiques, dont seules certaines sont réellement applicables au monde. Les lois vraiment applicables sont typiquement en physique classique des lois centrales, associées à la résistance des ressorts, à la gravitation, à l'électricité, ainsi que des lois dissipatives associées aux frottement. Mais, comme l'observait notamment Giere, la liste n'est pas figée dans le marbre : rien n'interdit a priori de postuler de nouvelles lois pour rendre compte de nouveaux phénomènes, tout en restant dans le cadre de la théorie de Newton.

Et même si l'on voulait ajouter toutes ces lois à une hypothétique théorie finale qui en contiendrait la liste complète, il faut bien voir que la construction d'un modèle ne s'arrête pas à l'application algorithmique des lois de la physique : elle s'accompagne de postulats sur les phénomènes particuliers (par exemple, que la supraconduction implique telle ou telle configuration physique) qui ne dérivent directement ni de la théorie elle-même, ni des observations empiriques (voir l'article de Cartwright et Suàrez sur le modèle de supraconduction de London, ou le recueil d'articles "Models as Mediators" édité par Morgan et Morrison). On peut considérer ces postulats comme des lois spécifiques au domaine d'application du modèle.

Donc l'ensemble des modèles logiques satisfaisant une théorie est en un sens beaucoup trop large pour rendre compte de ce qu'on appelle un modèle acceptable en physique, et à la limite, on aimerait pouvoir rendre compte de l'existence d'une hiérarchie de lois, plus ou moins fondamentales, ce que l'approche en termes de mondes possibles ne permet pas directement.

Une solution inspirée de la métaphysique de Lewis serait de considérer une relation de proximité entre mondes possibles. On peut alors envisager que les lois fondamentales sont vraies pour un ensemble très grand de mondes, même très éloignés du nôtre, et que les hypothèses spécifiques à un type de phénomène sont vraies dans un ensemble plus restreint de mondes possibles proches du nôtre. Mais sur quoi fonder cette notion de proximité et cette hiérarchie de possibilités ? La fonder sur les lois serait circulaire. Définir une notion de proximité entre monde donne lieu à des théories souvent très complexes. Et je pense que ces théories s'avèrent inutiles si l'on prend acte des trois autres problèmes, vers lesquels nous nous tournons maintenant.

2. Le problème des mondes

Le second problème, peut-être le principal, est que les modèles de la physique se donnent très rarement pour but de représenter l'univers dans son ensemble (et quand ils le font en cosmologie, c'est à très très très gros grain : on postule typiquement que l'univers est homogène !). Le cas général, ce sont plutôt des modèles de certains objets en nombre limité, bien délimités dans l'espace, parfois même microscopiques.

Par exemple, un modèle du système solaire interprété à la manière de Tarski rend vrai la proposition "il existe une seule étoile", et on peut penser que le modèle est adéquat sans croire que cette proposition est absolument vraie. Elle est vraie dans un contexte limité. La sémantique réelle des modèles scientifiques ne correspond donc pas à une sémantique des mondes possibles, parce qu'elle est contextuelle. Et le contexte d'application d'un modèle n'est pas forcément formalisé ni formalisable dans la théorie elle-même.

On peut bien sûr imaginer qu'il existe un univers naturellement possible dans lequel il n'y a qu'une étoile et une poignée de planètes, ou qu'une ou deux particules en interactions, et que donc ces modèles sont bien des descriptions de mondes possibles pour la théorie, mais c'est un peu tiré par les cheveux (surtout quand les modèles intègrent une contrainte environnementale). Cette idée consiste à vouloir conserver une sémantique pour sa simplicité et son élégance, quitte à complexifier la manière d'interpréter le discours des scientifiques. Pour ma part, je considère qu'une bonne sémantique pour les théories scientifiques devrait d'abord viser à rendre compte du discours et de la pratique scientifique, et la métaphysique doit suivre. Or les modèles ne représentent pas des mondes.

Une meilleure solution consiste à dire que les modèles des physiciens sont toujours des descriptions de situations, qu'on peut comprendre en première approche comme des descriptions partielles et grossières de mondes possibles ne faisant pas certaines discriminations, n'en décrivant que certains détails ou certains objets et laissant le reste indéterminé. C'est une solution qui s'accorde bien avec le constat que les modèles en science sont généralement idéalisés, valables "à gros grain", à certaines échelles.

Sur le plan formel, on peut introduire la notion de situation possible, soit un ensemble de mondes possibles ayant en commun un nombre limité de propositions (par exemple : "il existe au moins une étoile, qui est le soleil"). Mais cette notion demande a être rendue plus précise (un ensemble arbitraire de mondes possibles n'est pas forcément une situation pertinente demandant à être représentée par un modèle). On peut alors se demander si la sémantique des mondes possibles est vraiment le meilleur outil. Plutôt que de voir les situations possibles comme des ensembles de mondes possibles (soit des mondes possibles grossiers), on pourrait plutôt voir les mondes possibles comme des intersections idéalement fines de situations possibles, soit un cas limite logiquement concevable, mais pas forcément très intéressant pour rendre compte du contenu des théories en général.

Sur un plan un peu moins formel, délimiter une situation pertinente, c'est adopter une certaine perspective sur le monde : s'intéresser à un certain type de phénomène possible à certaines échelles, dont on sait ou suspecte ou voudrait qu'ils existent, dont on repère des caractéristiques remarquables. En outre, cette perspective peut être performative, c'est à dire nous amener à construire en partie la situation qui nous intéresse ou les conditions de son étude, comme dans le cas de l'ingénierie (mais pas seulement : la mise en place d'un protocole expérimental pour étudier une situation jugée "pure" du point de vue de la théorie, par exemple une chute libre sans frottements, peut être tout aussi performative).

En ce sens, voir les situations comme des descriptions grossières de mondes est un peu trompeur, puisque les situations qu'on représentera directement ne sont jamais choisies en contemplant l'univers dans son entièreté pour ensuite sélectionner les parties de sa structure qui nous intéressent comme le ferait un être omniscient, mais plutôt par ostentation ou par intention, depuis notre position, et, comme dit plus haut, sans que tout ceci ne soit forcément formalisé dans la théorie. C'est une raison de plus d'inverser les choses et de comprendre une description de l'univers dans son entièreté (un monde possible) comme un affinement hypothétique commun à toutes les descriptions grossières que nous employons pour décrire des situations. En somme, il faudrait idéalement adopter une sémantique des situations possibles tranchant plus radicalement avec la sémantique des mondes possibles qui reste à élaborer (je m'y suis essayé au cours de ma thèse).

On voit en tout cas que ce problème rend futile la solution au problème précédent consistant à postuler une proximité entre mondes possibles pour rendre compte d'une hiérarchie de lois. On peut en rendre compte plus simplement. En effet, la notion de situation est associée à une notion de finesse de grain dans la description. Une situation peut être affinée ou grossie pour donner une nouvelle situation (ce qui formellement revient à intégrer ou éliminer des propositions). Une fois acquis que les modèles représentent des parties du monde ou des situations, on voit poindre une solution différente au problème des lois : les lois plus fondamentales seraient celles qui sont vraies pour des parties quelconques, non spécifiées, de notre monde (des situations grossières), et les lois moins fondamentales pour des parties plus spécifiques (des situations plus finement décrites et identifiées, éventuellement plus locales).

Cette solution permet en outre de penser que la science parle avant tout des situations de notre monde, et non pas d'autres mondes, ce qui me semble être un avantage. Intuitivement, on pense généralement que la science s'intéresse surtout à notre monde. En corrolaire, les mondes possibles à partir desquels on définit éventuellement les situations sur le plan formel n'ont pas besoin d'être un concept métaphysiquement ou nomologiquement chargé. Ce pourrait être l'ensemble des mondes concevables, ou logiquement possibles étant donné un langage, encore une fois un cas limite dont l'intérêt est avant tout formel.

3. Le problème des types

Le troisième problème pour la sémantique des mondes possibles est que même affirmer que les modèles se destinent à représenter une partie de l'univers est trompeur. Les modèles représentent plus souvent un type d'objet potentiellement instancié en de multiples endroits, ou encore, en ingénierie, une configuration physique intentionnelle, qu'on vise à construire parfois en de multiples exemplaires, toujours dans notre univers (un type de transistor par exemple), mais qui n'est peut-être pas instanciée du tout.

Pour résoudre ce problème, on pourrait introduire dans notre machinerie formelle une notion de type de situation possible comme ensembles d'ensembles de mondes possibles, mais ici encore on peut se questionner sur l'utilisation des mondes possibles comme objet primitif. Les ensembles d'ensembles de mondes possibles sont en nombre beaucoup plus grand que les mondes possibles eux-mêmes, ce sont des infinis d'ordre supérieur, et l'idée qu'on pourrait sélectionner des types de situations pertinents dans cet ensemble infini semble relever de la magie.

Je n'ai pas de solution à ce problème, qui rejoint des questions classiques en épistémologie liées à l'induction et aux classes naturelles (pourquoi "vert" et non "vleu" serait la "bonne" propriété pour faire de l'induction, pour reprendre la question de Goodman ?). Disons au moins que cela jette un doute sur l'idée que le contenu des modèles scientifiques serait "transcendant", soit complètement indépendant de notre constitution d'être humain et de notre position dans l'univers, puisqu'on peut penser que les catégories scientifiques sont ultimement fondées sur des catégories en partie innées, associées par exemple à nos organes sensoriels ou à notre structure cognitive, même quand elles s'en détachent. Il faut bien une base pour construire (Goodman parlait de prédicats "ancrés", "entrenched").

Cette notion de type de situation (ou de perspective) est en outre liée au statut des symétries en physique. On peut considérer que des modèles reliés par une symétrie (une translation ou rotation dans l'espace-temps, un changement de choix de gauge) décrivent des situations du même type. On peut penser que le "bon" découpage en type de situation est en partie découvert empiriquement au moment où on découvre des symétries, soit certaines régularités dans les phénomènes, sur la base des prédicats "ancrés".

Tout ceci pose la question : à quel type de possibilité correspond un type de situation ou un choix de modèle ? Si les lois sont vraies pour tous les types d'objets possibles (dans tous les modèles), de quelle notion de possibilité parle-t-on ? Si tous les types décrits par des modèles ou presque sont instanciés quelque part dans le monde, c'est-à-dire actuels, sélectionner un type de situation ne revient pas à sélectionner une possibilité naturelle, mais plutôt une finesse de grain dans la description et certains objets ou périodes de temps d'intérêts, soit à sélectionner une certaine perspective sur le monde, et si les lois d'une théorie sont vraies pour tous les types de situations (ou perspectives) possibles, elles sont nécessaires en un sens qu'il conviendrait d'élucider, mais qui n'est pas forcément la possibilité naturelle.

Une perspective pourrait être possible au sens de possibilité naturelle ou physique si on l'associe à un type d'operationalisation physiquement réalisable. Elle pourrait être possible au sens déontique (c'est-à-dire compatible avec les intérêts des physiciens) si l'on pense que l'ensemble des modèles d'une théorie dépend en partie de ces intérêts, ou en un sens épistémique si on pense qu'un modèle doit être applicable à une situation actuelle. Ce peut être en un sens métaphysique si elle correspond à une "bonne" manière de découper le monde en catégories, découverte plutôt que connue a priori. Ou bien peut-être en un sens purement conceptuel si toutes les perspectives se valent. Dans chaque cas, l'ensemble des modèles de la théorie sera délimité de manière distincte, et sera plus ou moins large. Savoir comment correctement délimiter cet ensemble est une question ouverte (y compris sur le plan de la méthode philosophique : qu'est-ce qu'une bonne délimitation ? Doit-on considère plus de modèles que ceux réellement construits par des physiciens ?), et cela aura un impact sur l'interprétation à faire des lois de la physique.

On pourrait par ailleurs faire la distinction entre modèle abstrait et modèle appliqué, ce dernier étant associé à une instance de situation plutôt qu'à un type. Je ne pense pas que parler de l'ensemble des modèles appliqués d'une théorie ait beaucoup de sens, ou en tout cas cet ensemble n'est pas accessible a priori. Ceci étant dit, parler de l'ensemble des applications possibles d'un modèle abstrait peut être utile si l'on veut définir ce que serait l'adéquation idéale d'un modèle, et donc ce que serait l'adéquation idéale d'une théorie. Idéalement, les lois d'une théorie devrait être vraies pour toutes les applications de tous les modèles de la théorie.

Et de nouveau on peut s'interroger sur la notion de possible impliquée quand on parle d'application possible d'un modèle donné. S'agit-il de possibilité physique ? Épistémique ? Conceptuelle ? Déontique peut-être ?

4 le problème des modalités

Enfin le quatrième problème pour la sémantique des mondes possibles tient au fait que les modèles ont souvent une structure modale interne : ils représentent eux-mêmes différentes possibilités, par exemple des possibilités d'évolution pour un système donné, des états ou histoires possibles, des rapports causaux ou dispositions pouvant ou non être réalisées ou non, etc. Cette notion de possible supporte les raisonnements contrefactuels (on peut affirmer à partir d'un modèle "il se serait passé E si les circonstances avaient été C") ce qui laisse penser qu'on ne parle pas de possibilités purement épistémiques (on sait que C est faux mais on parle quand même de cette possibilité). La modalité impliquée est plus naturellement associée à la causalité, soit aux possibilités naturelles ou physiques "locales", dont le rapport aux lois est sujet à débat.

Ainsi donc notre métaphysicien souhaitait interpréter la nécessité physique en termes de ce qui est vrai dans tous les modèles, mais si l'on s'intéresse à la pratique de modélisation réelle, on finit plutôt par retrouver cette modalité dans chaque modèle, comme ce qui est vrai dans toutes les possibilités décrites au sein d'un modèle donné : une notion de nécessité physique locale ou contextuelle qu'il conviendrait de relier à celle du métaphysicien, ce que l'approche Tarskienne ne fait pas.

En general, les possibilités dont il est question correspondront à une partition logique des possibles pour la situation décrite. Ce que cela signifie est qu'on part d'une situation grossière (une particule dans un champ électromagnétique) et qu'on envisage un ensemble de possibilités pour affiner notre description (les trajectoires possibles de la particule) telles qu'exactement une de ces possibilités est forcément réalisée. Autrement dit, ces possibilités sont mutuellement exclusives, et elles couvrent l'espace des possibles pour la situation grossière. Ces possibilités sont souvent pondérées par des poids de probabilité.

Une question qui se pose est si cette modalité est attachée aux types ou aux instances. On pourrait faire jouer le fait que les modèles représentent des types contre l'idée qu'ils représentent des possibilités naturelles. Chaque possibilité représentée par un modèle correspondrait à une instance possible du type, en un sens peut-être épistémique de possible, plutôt qu'à une possibilité naturelle pour chaque instance donnée, et les probabilités correspondraient à des répartitions statistiques sur ces instances. Laissons ouverte cette proposition, bien qu'elle s'accorde mal avec le fait que les modèles supportent les raisonnements contrefactuels, et qu'une interprétation purement fréquentiste des probabilités pose problème.

Dans tous les cas, il me semble que la modalité naturelle devrait être attachée à des situations plutôt qu'à des mondes, c'est-à-dire qu'elle devrait être représentée par une relation d'accessibilité entre situations. (Un argument en faveur de cette idée est issu de la mécanique quantique : si l'on prend au sérieux le principe d'incertitude, il existe des situations impossibles, par exemple telles que la vitesse et la position d'une particules sont toutes deux très précisément définies, bien que tous les mondes possibles compatibles avec cette situation soient compatibles avec d'autres situations possibles, à savoir celles où soit la position, soit la vitesse sont précisément définies : l'impossibilité des situations ne "survient" pas sur une impossibilité de mondes).

Conclusion

Voici donc en résumé les quatre raisons d'être suspect envers l'interprétation des lois de la physique comme "vraies dans tous les modèles/mondes possibles" :

Les modèles de la physique sont en un sens moins nombreux que les modèles au sens logique.
Ils ne représentent pas en général l'univers dans son ensemble.
Ils représentent des types plutôt que des instances.
Ils ont souvent une structure modale interne contrairement aux modèles au sens logique.

J'ai proposé au cours de mes commentaires différentes pistes pour obtenir une conception plus proche des pratiques de modélisation réelle des physiciens. On peut la résumer ainsi :

À une théorie (un ensemble de lois) correspond un ensemble de modèles, qui représentent chacun un type de situation, qu'on peut comprendre comme une perspective possible sur le monde (centrée sur un type de phénomène à une certaine échelle).
À un modèle donné on peut en principe faire correspondre un ensemble d'applications possibles, chaque application étant une situation instanciée du bon type (et on peut dire qu'un modèle idéalement adéquat serait une description correcte dans toutes ces applications possibles, ou peut-être une bonne synthèse de toutes ces applications possibles).
Un modèle donné décrit un ensemble d'états ou d'histoires possibles pour les situations de ce type, soit une partition d'affinements possibles pour une situation grossière, pondérées par des probabilités.
Chaque situation fine possible (ou histoire) ainsi décrite est toujours une description grossière et partielle de l'univers, formalisable comme un ensemble de mondes possibles.

Cette manière de voir, soit une sémantique des situations possibles pour les théories scientifiques, offre une richesse interprétative beaucoup plus importante que la sémantique des mondes possibles. En particulier, il existe au moins quatre notions de possible, associées à chacun des quatre points ci-dessus, dont l'interprétation reste ouverte. Tout ceci reste donc largement en chantier, mais je pense que c'est un cadre prometteur pour l'analyse du contenu des théories physiques.

Rechercher dans ce blog

Un grain de sable