dimanche 23 août 2015

Des histoires consistantes à la physique relationnelle

Nous avons vu dans le dernier billet que dans le formalisme des histoires consistantes, adopter un cadre (un découpage discret de l'espace des états du système en propriétés disjointes) permet de restaurer l'usage de la logique classique et des raisonnements contre-factuels, et résout la plupart des paradoxes de la mécanique quantique. Le prix à payer est que tout ceci est toujours relatif à un cadre, qui n'est pas quelque chose qui existe dans la nature mais plutôt une façon conventionnelle de voir le monde parmi d'autres (dans l'absolu, tous les cadres se valent).

Il existe une analogie assez forte entre cet aspect et le choix d'un référentiel en relativité restreinte. D'abord, le cadre est lui aussi, sur le plan mathématique, un référentiel dans un espace (l'espace de Hilbert) même si ce dernier n'est pas interprété comme espace physique, mais comme espace des états possibles. Ensuite et surtout, en relativité restreinte, le choix d'un référentiel de coordonnées permet de restaurer une certaine vision classique du temps : relativement à ce référentiel, on peut définir un plan de simultanéité et une succession temporelle des événements, on peut définir des longueurs, des vitesses. Certes certains paradoxes persistent (comme le paradoxe des jumeaux) mais au moins nous restaurons une vision commune du temps comme déroulement uniforme des phénomènes.

Le problème, comme dans le cas du cadre avec les histoires consistantes, c'est que ce référentiel est arbitraire, qu'il n'existe que "dans la tête de l'agent", et donc qu'il n'existe pas de manière objective de notion de simultanéité, ou de succession entre événements distants. Ce n'est qu'une manière de voir qui en vaut une autre (tous les référentiels se valent).

Ainsi dans les deux cas le choix d'un cadre arbitraire permet de restaurer nos intuitions classiques : sur le temps dans un cas, sur les inférences logiques dans l'autre. Mais celles-ci s'avèrent ultimement relatives à un point de vue choisi arbitrairement.

Un référentiel, en relativité, permet d'assigner des coordonnées spatiales et temporelles à des événements. En mécanique quantique, un cadre permet d'assigner des propriétés déterminées, ou une répartition de probabilités sur celles-ci, à des événements. La leçon, dans les deux cas, semble être que ces propriétés (de position ou quantiques) n'ont rien d'absolues mais son relatives au choix du référentiel. La différence est que dans le cas quantique ce ne sont pas les valeurs des propriétés qu'on change quand on change de référentiel, mais ce sont les propriétés que le système possède ou non : soit on s'intéresse à la position, soit à la quantité de mouvement, mais pas les deux. En relativité, changer de référentiel, c'est adopter une autre convention pour déterminer la position des événements. Mais la quantité de mouvement n'est pas une "autre convention pour déterminer la position" : c'est une autre propriété. Cette différence rend difficile de savoir ce qu'on doit considérer comme invariant dans la théorie quantique. En relativité, un intervalle spatio-temporel est un invariant, on le calcul à partir des positions respectives de plusieurs événements, et on obtient le même résultat quelque soit le référentiel choisi. Mais comment définir un invariant à partir de propriétés hétérogènes ?

L'arbitraire du référentiel en relativité implique qu'il n'existe plus de notion de simultanéité absolue. Dans le cas de la mécanique quantique, une implication qui serait équivalente est moins lisible. Mais ce serait quelque chose comme : il n'existe pas de propriété déterminée possédée absolument par un objet donné, ou encore il n'existe pas de faits absolus. Il faut définir un cadre pour pouvoir parler de faits.

C'est ici qu'on voit que l'interprétation des approches consistantes n'est finalement pas si éloigné des interprétations relationnelles de la mécanique quantique, qui affirment que l'état d'un système physique n'est jamais que sa relation à un observateur (au sens de la physique, c'est à dire un autre système physique possédant des enregistrements passés de ce système). Selon les interprétations relationnelles, il n'existe pas de point de vue de nulle-part : pas de fait sans spécifier un observateur.

Cadre abstrait dans un cas, système physique dans un autre, mais dans les deux cas, nous avons une forme de relativité. Peut-on les faire se rejoindre ?

Dans l'interprétation des histoires consistantes, le cadre est arbitraire. Cependant on peut dire qu'un cadre est plus utile qu'un autre : si par exemple il correspond à ce qu'on a l'intention de mesurer sur le système. Mais cette utilité n'est-elle pas objective ? Pourquoi alors n'existerait-il pas un "bon" cadre (même si celui-ci ne nous est pas entièrement accessible : il peut s'agir d'un affinement de notre cadre quasi-classique) ? Un peu comme en relativité, on admet que tous les référentiels se valent, et pourtant en cosmologie, on accepte qu'il existe un "bon" référentiel (qui permet notamment de calculer l'age de l'univers).

Il existe certaines analogies en physique quantique relativiste entre un référentiel et un système physique (par exemple un oscillateur permet de définir une horloge, donc un référentiel). S'il s'avère que ce "bon" cadre se situe dans les relations entre un système physique observateur et un système physique observé, nous retomberions alors, à partir du formalisme des histoires consistantes, sur une interprétation relationnelle.

dimanche 16 août 2015

L'interprétation des histoires consistantes de la mécanique quantique

Je me suis intéressé récemment à l'interprétation des histoires consistantes de la mécanique quantique, et j'avoue avoir été assez convaincu par l'approche. Je vais me contenter, dans ce billet, de proposer une vulgarisation de cette interprétation.

L'espace des phases

Focal stability.png
Classiquement on peut se représenter l'état d'un système dans un espace des phases. Il s'agit d'un espace abstrait dont les coordonnées sont les degrés de liberté du système. Si par exemple une particule a une position et une vitesse, on prendra en abscisse sa position et en ordonnée sa vitesse. Chaque point de l'espace de configuration représente donc un état possible du système. Son état actuel est l'un de ces points, et son évolution temporelle peut être représentée par une trajectoire.

Dans un espace des phases, on peut représenter une propriété quelconque, éventuellement complexe, par une région de cet espace. Par exemple : "avoir une position supérieur à 0,7 et inférieur à 0,8" est une propriété qui correspondra à une certaine zone (une bande dans l'exemple ci-dessus). Mais on peut en fait imaginer n'importe quelle propriété. On pourrait par exemple s'intéresser à un système composé de milliers d'atomes, dont l'espace des phases aurait un nombre incalculable de dimensions (au moins 3 par atomes : leurs coordonnées de positions), chaque point de l'espace représentant une configuration possible de ces atomes, et on pourrait concevoir que la propriété "être un chat" corresponde à une certaine région de cet espace gigantesque : celle contenant tous les points dont l'arrangement correspond à un chat.

Si l'on part du principe qu'une propriété quelconque est une région de l'espace des phases, on peut introduire un formalisme logique comme suit :

  • La conjonction de deux propriétés ("A et B") correspond à l'intersection des régions de chaque propriété
  • La disjonction de deux propriétés ("A ou B") correspond à l'union des régions de chaque propriété
  • La négation d'une propriété ("non A") correspond au complément de sa région dans l'espace complet.

Venn diagram gr la ru
Ces trois opérateurs logiques sont suffisant pour définir la logique classique. Tout ceci correspond à ce qu'on appelle les diagrammes de Venn (voir l'image, pour les propriétés "être une lettre de l'alphabet romain / grec / cyrillique").

Selon ce point de vue, attribuer une propriété à un système physique revient à le situer dans une région de l'espace des phases.

Bien sûr on peut être peu satisfait de ces notions de propriété du type "tout ou rien". Mais rien ne nous empêche d'introduire des probabilités. Celles-ci peuvent servir soit à définir des propriétés "floues", soit, de manière équivalente, à indiquer notre incertitude quant à l'état réel d'un système.

Standard deviation diagram
Concrètement, ceci prendra la forme d'une répartition de probabilité sur l'espace des phases. On associe un nombre à chaque point de l'espace, représentant le degré de probabilité que le système s'y trouve. Pour connaître la probabilité que le système ait une propriété (de type tout ou rien), il suffit d'intégrer ces degrés (d'en faire la somme) sur la région correspondant à cette propriété (si par exemple l'espace des phases est un axe, la probabilité associée à une propriété donnée correspondra au calcul d'une surface : voir l'image ci-dessus).

Avec cette extension, on retrouve alors le calcul classique des probabilités : celles-ci on une valeur entre 0 et 1, la probabilité de l'espace des phases dans son ensemble est de 1 et si deux propriétés sont disjointes, alors la probabilité de leur conjonction est la somme de leurs probabilités respectives. C'est, en substance, ce qu'affirment les axiomes de Kolmogorov.

L'espace de Hilbert

Linear subspaces with shading
Bon, jusqu'ici on est dans un cadre classique. Passons maintenant à la physique quantique. On peut analyser de manière similaire l'espace de Hilbert, qui est l'espace dans lequel sont définis les fonctions d'ondes, représentant les états des systèmes physiques, ainsi que les opérateurs correspondant aux observations possibles, aux résultats de mesure, ou encore aux équations d'évolution de ces systèmes. Autant dire que l'espace de Hilbert joue un rôle central en mécanique quantique.

Il existe une manière assez naturelle de l'interpréter comme un espace des phases, et qui, poussée à son terme, aboutit à ce qu'on appelle les logiques quantiques.

Dans l'espace de Hilbert, les états possibles du système ne sont plus des points mais des axes passant par l'origine. Une propriété quelconque n'est plus représentée par une région (une somme de points) mais par un sous espace passant par l'origine (qui peut être défini par plusieurs axes orthogonaux, par exemple un plan).

Au passage il faut bien voir que nous avons grandement multiplié les dimensions de notre espace. Ainsi un axe de l'espace ne correspond plus à un seul degré de liberté du système (par exemple la position d'une particule), mais il y a un axe pour chaque valeur possible que peut prendre ce degré de liberté (un axe par position possible). Dans cette représentation, un type de propriété (comme "position") ne correspond plus à un axe précis, mais à un référentiel de l'espace de Hilbert, ou à un repère, c'est à dire un système de coordonnées à part entière dans cet espace qui consiste à sélectionner des axes perpendiculaires entre eux (orthogonaux).

On voit également que l'état possible d'un système n'a pas à correspondre à des valeurs de propriétés bien définies. Si par exemple deux positions possibles correspondent à deux axes, il existe une infinité d'états sur le plan que forment ces deux axes. On ne pourra dire d'aucun de ces états qu'il correspond à l'une ou l'autre de ces valeurs de position, sauf quand ils coïncident avec l'un des deux axes.

On peut alors définir les opérations logiques suivantes sur les propriétés :

  • La conjonction de deux propriétés ("A et B") correspond à l'intersection des sous-espaces de chaque propriété (par exemple, l'intersection de deux plans est un axe).
  • La disjonction de deux propriétés ("A ou B") correspond au produit de leurs sous-espaces. Par exemple, le produit de deux axes est un plan, et le produit d'un plan et d'un axe est un volume à trois dimensions.
  • La négation d'une propriété ("non A") correspond au complémentaire de son sous-espace. Le complémentaire d'un sous-espace A est tel que "A ou non A'" nous donne l'espace complet. Par exemple dans un espace à 3 dimensions, le complémentaire d'un plan est un axe perpendiculaire à ce plan, et inversement.

Tout comme dans le cas classique, on peut envisager une répartition de probabilité sur ces propriétés, qui consistera à pondérer chaque axe de l'espace des phases par un coefficient.

Le problème est qu'avec cette représentation on ne retrouve ni les inférences de la logique standard, ni le calcul standard des probabilités. Si l'on prend cette représentation au sérieux, nous devons adopter une logique quantique dont les règles sont différentes. Une de ses caractéristiques est notamment qu'elle n'est pas distributive ("A et (B ou C)" n'est pas équivalent à "(A et B ) ou (A et C)"), ce qui est assez contre-intuitif ("Ceci est un chat mort ou vivant" n'est pas équivalent à "ceci est soit un chat mort, soit un chat vivant").

Les cadres ("framework")

Il existe cependant un moyen de restaurer les règles classiques de la logique et des probabilités. Il s'agit de restreindre les possibilités d'expression du langage, en décrétant que certaines propositions logiques sont dénuées de signification. On décrétera notamment que la disjonction ou la conjonction de deux propriétés n'ont de sens que si les sous-espaces correspondant à ces propriétés sont orthogonaux. C'est ce que propose le formalise des histoires consistantes.

Ces contraintes reviennent à imposer à l'utilisateur de la logique de choisir un cadre (framework) dans lequel ses expressions prennent un sens. Le choix est arbitraire : rien n'empêche de choisir un autre cadre, mais il est interdit de combiner les cadres, c'est à dire de faire des inférences logiques à partir de propositions exprimées dans des cadres différents.

On peut définir un cadre comme un ensemble de propriétés telles que leurs conjonctions respectives est toujours nulle (elles sont orthogonales) et leur disjonction couvre tout l'espace des états. Autrement dit, c'est une manière de découper l'espace des états en propriétés distinctes (l'équivalent, dans un système classique, serait une partition de l'espace des phases en régions disjointes. Voir l'image.). Si par exemple notre espace a trois dimensions, les différents cadres possibles sont : soit trois axes orthogonaux, soit un plan et un axe orthogonal à ce plan, soit l'espace dans son ensemble (qui est un cadre assez peu utile).

Partizione

Il existe des relations intéressantes entre les différents cadres. Par exemple, il est possible d'affiner un cadre en décomposant l'une de ses propriétés en sous-propriétés, dont elle est la disjonction (en définissant un plan à partir de deux axes orthogonaux). Il y a toujours plusieurs façons mutuellement incompatibles d'affiner un cadre (puisqu'il existe plusieurs façons de choisir deux axes orthogonaux sur un plan). Il est aussi possible d'épaissir un cadre en fusionnant deux de ses propriétés (prendre un plan au lieu de deux axes).

Des cadres sont dis compatibles si toutes leurs propriétés caractéristiques sont orthogonales deux à deux. On peut montrer que dans ce cas les cadres ont un affinement commun, c'est à dire un cadre plus fin qui permet de définir ces deux cadres. (par exemple, si l'on prend un espace à trois dimensions, x, y et z, on aurait un cadre formé du plan (x, y) et de l'axe z, et un autre formé du plan (x, z) et de l'axe y. Ils sont compatibles, et ont un affinement commun, formé des trois axes x, y et z). La notion de compatibilité est symétrique et réflexive, mais pas transitive : si un cadre X est compatible avec Y et Y avec Z, ça ne signifie pas que X et Z soient compatibles. La notion de compatibilité est une caractéristique des espaces de Hilbert. Dans un système classique, tous les cadres sont compatibles, et ils ont un affinement commun, qui consiste à considérer leurs intersections, ou à la limite, chaque point de l'espace des phases. Mais dans un espace de Hilbert, ça ne fonctionne plus.

Quand deux cadres sont compatibles, on peut utiliser la logique et les probabilités dans ces deux cadres sans problème.

Un cadre est donc en quelque sorte un repère, un référentiel dans l'espace des phases, un découpage de celui-ci en coordonnées, mais qui peut être grossier et ne pas distinguer différentes propriétés.

Si l'on adopte un cadre, on peut voir l'état d'un système (une fonction d'onde) comme définissant une répartition de probabilités sur un ensemble de propriétés (celles du cadre), et le calcul standard des probabilités est applicable. Le cadre spécifie un ensemble de propriétés possibles que le système peut avoir, qui sont disjonctives (le système a au moins l'une d'entre elles, et une seule) et ne s'intéresse pas aux autres propriétés.

On peut prendre l'image (que j'emprunte à Griffith) de différents points de vues sur une montagne, par exemple l'un vue du nord et l'autre du sud. On pourrait dire que d'un point de vue il est possible d'avoir une vision plus ou moins fine ou grossière (si l'on fait mal la mise au point), mais ces différentes vues donneront des images compatibles. Cependant la perspective nord et sud sont incompatibles (et contrairement au cas d'une montagne, où on peut forger une représentation en 3 dimensions contenant tous les points de vues possibles, ce n'est plus vraiment possible ici, sauf à adopter une logique quantique). Peut-être même, pour pousser l'analogie, qu'un point de vue grossier serait compatible avec plusieurs points de vue plus fins légèrement distincts, incompatibles entre eux. Adopter un cadre c'est donc en quelque sorte choisir une perspective sur cette montagne, et une mise au point.

Les histoires consistantes

Il est possible d'étendre tous ces concepts à un système qui évolue au cours du temps. De la même façon que quand on joue à pile ou face, lancer trois pièces simultanément, ou la même pièce trois fois de suite nous donne le même espace de possibilités (2x2x2=8 possibilités), il suffit de considérer les états successifs du système à différents instants discrets du temps pour définir un espace de Hilbert plus large (dans le jargon, on parle du produit tensoriel d'espaces de Hilbert).

De la même façon on peut alors définir des cadres, qui correspondent à un découpage de chaque état instantané en propriétés. Cependant dans le cas dynamique certaines subtilités s'ajoutent. En particulier on considérera uniquement des instants discrets du temps, et il faut des conditions supplémentaires pour que les règles de la logique classique puissent être appliquées, qui dépendent de ce qu'on appelle l'hamiltonien du système (son opérateur d'évolution). On parle alors de cadre consistant.

Dans le cas statique, adopter un cadre consistait à adopter un ensemble de propriétés disjonctives pour décrire le système, définissant des états possibles. Dans le cas dynamique, adopter un cadre revient à adopter une famille d'histoires possibles, une histoire étant simplement une succession de propriétés définies, indexées dans le temps, comme le serait par exemple une succession de "pile" et de "face" pour une pièce qu'on lancerait plusieurs fois. Dans le cas statique, la fonction d'onde nous permet d'obtenir une répartition de probabilités sur des propriétés possibles. Ici, on obtient une répartition de probabilités sur des histoires possibles.

Du fait que le calcul des probabilités standard peut être retrouvé, la structure de ces histoire consistantes correspondra à un arbre dont les branches correspondent à des déroulements différents à partir de l'état initial du système.

L'approche des histoires consistantes consiste donc simplement à nous dire ceci : une fois qu'on a choisi un cadre, une façon de décrire le système, l'ensemble des paradoxes de la mécanique quantique disparaissent. Il n'y a plus de problème de non-localité, de superposition d'états, de rétro-causalité ou que sais-je. Nous avons simplement un système qui évolue au cours du temps de manière aléatoire, certes, mais il est possible de connaître les probabilités que le système se trouve dans tel ou tel état, de faire des inférences et d'utiliser le calcul des probabilités standard.

En outre on peut comprendre également comment passer d'une description quantique à une description classique. Il suffit d'assimiler les mesures macroscopiques effectuées sur un système microscopique à un cadre grossier. Il est possible de montrer, avec la théorie de la décohérence, que ces cadres grossiers dits "quasi-classiques" seront en général consistants, ou suffisamment proche d'un cadre consistant pour qu'on n'ait pas à s'en préoccuper.

Mais qu'est-ce qu'un cadre ?

L'interprétation des histoires consistantes promet donc de résoudre tous les paradoxes de la mécanique quantique de manière simple et parcimonieuse. Il s'agit, pour reprendre les mots de Griffith, de "détrôner" la fonction d'onde : en effet celle-ci ne joue plus de rôle central dans ce formalisme, et on peut même complètement l'éliminer.

En effet dans cette interprétation, il n'est plus nécessaire de prendre en compte l'état initial du système et de le traduire sous forme de fonction d'onde qu'on fera évoluer au cours du temps. On peut se satisfaire de l'hamiltonien du système (son opérateur d'évolution) : celui-ci nous permet déjà de calculer, pour un cadre, les probabilités de chaque histoire consistante, c'est à dire de chaque succession de propriétés. L'état initial du système sera alors simplement l'un des éléments de ces histoires, à savoir la première propriété de chaque histoire possible (ou une répartition de probabilités).

Une représentation équivalente consisterait à associer ces histoires consistantes à des probabilités conditionnelles entre propriétés à différents instants. Il suffit alors de considérer l'état initial pour connaître certaines probabilités aux instants suivants, ou encore un déroulement sous forme d'arbre. Dans tous les cas, seul l'hamiltonien du système est mis à contribution : pas besoin de fonction d'onde. Voilà qui devrait faire plaisir aux métaphysiciens qui s'échignent à essayer de comprendre ce que peut bien représenter ce mystérieux objet...

Cette simplicité, cependant, a un prix, et ce prix est la relativité de ce type de description à un cadre, dont le choix est entièrement arbitraire, et à l'impossibilité de changer de cadre lors d'un raisonnement logique ou probabiliste. Cette contrainte peut sembler un peu mystérieuse. Pourquoi donc serait-il impossible de décrire l'état d'un système de manière complète et définitive ? Pourquoi sommes nous obligés de choisir un cadre ?

En effet les cadres n'existent pas dans le monde, et il ne faut pas, selon la théorie des histoires consistantes, considérer qu'il existe un "bon cadre" (qui correspondrait à ce qu'on mesure en effet sur le système). Il ne faut pas confondre ce qu'on mesure et les propriétés microscopiques du système. Le formalisme des histoires consistantes s'intéresse aux propriétés des systèmes microscopiques, pas aux expériences qu'on réalise sur eux. En particulier, il est toujours possible d'adopter un cadre qui n'a rien à voir avec ce qui est mesuré sur le système. Ce cadre sera certainement peu utile (on n'obtiendra que des probabilités au lieu de valeurs déterminées pour les propriétés auxquelles on s'intéresse) mais qu'importe : c'est un choix possible.

On peut voir les choses un peu comme ceci : il existerait plusieurs langages pour décrire le monde, et ces langages ne peuvent être utilisés simultanément sous peine de contradiction logique. Tout ce que nous fournit la théorie quantique, ce sont des règles d'utilisation de ces différents langages et des moyens de les traduire entre eux. Mais toute affirmation sur le monde reste relative à un langage, sans qu'on ne puisse dire d'aucun qu'il est le "bon" langage.

Toutes les interprétations de la mécanique quantique ont un prix à payer, mais finalement celui-ci n'est peut être pas si grand.

jeudi 13 août 2015

Qu'est-ce qu'une théorie physique ? Qu'est-ce qu'interpréter une théorie ?

Une fois n'est pas coutume, cette entrée ne contient aucune thèse ou position philosophique (ou de manière assez minimale). Il s'agit plutôt de proposer une clarification conceptuelle : qu'est-ce qu'une théorie scientifique ? Un modèle ? Comment est-il confronté à la réalité ? Qu'est ce que l'adéquation empirique d'une théorie ? Qu'est-ce qu'interpréter une théorie ? Pour finir je propose un rapide recensement des positions contemporaines en métaphysique des sciences à l'aulne de cette analyse.

Qu'est-ce qu'une théorie ?

Je propose la caractérisation suivante de ce qu'est une théorie physique :

Un vocabulaire théorique
  • un ensemble de propriétés observables pensées comme contingentes (comme la position, la direction de spin)
  • un ensemble de propriétés fondamentales pensées comme nécessaires à leur objet (comme la masse ou la charge)
  • Des types d'objets (l'électron, ...) pouvant posséder ces propriétés.
Des structures mathématiques
  • des structures pouvant représenter les degrés de liberté d'un système particulier (un espace des phases, l'espace de configuration ou l'espace de Hilbert)
  • D'autres destinées à spécifier des opérations sur ces systèmes, ou leur évolution (un hamiltonien, un opérateur)
  • d'autres servant de cadre général ou relationnel pouvant être communs à plusieurs systèmes (un espace-temps géométrique, un espace de Minkowski).
Des axiomes théoriques
Ces axiomes permettent de faire le lien entre les éléments précédents :
  • ils indiquent comment associer vocabulaire d'observation et structures mathématiques, comment "labelliser" les degrés de liberté, les opérations ou les structures cadres avec les propriétés observables des systèmes.
  • Ils indiquent comment associer les propriétés fondamentales du système et les structures labellisées aux observations ou prédictions, ce qui peut prendre la forme de lois d'évolution (comme l'équation de Schrödinger) ou de règles permettant de déduire des prédictions (comme la règle de Born).

Qu'est-ce qu'un modèle ?

Une théorie physique est comme un langage doté d'un vocabulaire et d'une grammaire (les axiomes) permettant de forger des propositions. Ces propositions, ce sont des modèles.

Un modèle est une structure mathématique, interprétée dans le vocabulaire de la théorie, et qui vérifie ses axiomes, et qu'on peut penser comme étant destinée à représenter des types de systèmes. Construire un modèle demande d'intégrer les éléments suivants :

Une caractérisation du système concerné
Il s'agit d'une caractérisation des degrés de liberté d'un système, de ses propriétés fondamentales (sa masse, sa charge), et de la façon dont il interagit avec son environnement (un champs électromagnétique).
Des entrées physiques
Typiquement, ceci correspond à l'état initial du système, qui peut s'exprimer par une valeur pour une propriété observable, ou une répartition de probabilité sur celles-ci.
Des entrées opérationnelles
Il s'agit de spécifier les mesures que l'on va effectuer sur le système, en terme de propriétés observables indexées dans la structure cadre (l'espace et le temps).

A partir de ces éléments et des axiomes de la théorie, nous pouvons construire un modèle qui contient des prédictions. Typiquement les degrés de libertés permettent de construire un espace des phases (ou un espace de Hilbert) dont les axes sont "labellisés" avec les propriétés observables du système, et associés à une structure cadre (un référentiel correspondant par exemple à une géométrie de l'espace). La façon dont le système interagit avec son environnement, ainsi que les propriétés fondamentales du système permettent d'établir une loi d'évolution du système dans cet espace des phases (un hamiltonien). Enfin la prise en compte des opérations de mesure permet de dériver des prédictions, c'est à dire des résultats de mesures (des valeurs pour les propriétés observables) indexées dans l'espace et le temps.

Bien sûr il s'agit là du cas idéal, et en pratique, les physiciens procèdent à de multiples idéalisations, hypothèses auxiliaires simplificatrices, ou techniques d'approximation mathématiques pour construire le modèle, si bien que souvent le modèle ne vérifie pas à strictement parler les axiomes de la théorie. Simplement on pense qu'il approxime un modèle qui, lui, vérifie ces axiomes.

Comment applique-t-on un modèle ?

Les propositions d'un langage doivent encore être utilisées en contexte : elles doivent être prononcées par un locuteur pour exister. De même les modèles théoriques doivent être appliqués à la réalité, dans un contexte expérimental.

Il peut s'agir de développer une technique, de comprendre le fonctionnement d'un système physique réel, de faire des prédictions, ou encore de simplement vérifier la théorie. Dans tous ces cas, utiliser un modèle en contexte nous demande d'associer chacun de ses éléments à des objets et propriétés de la réalité courante :

  • Identifier un type de système (des degrés de liberté, des propriétés fondamentales) et la façon dont il interagit avec son environnement à un objet ou dispositif expérimental réel (un canon à électron, un aimant), ce qui demande une connaissance préalable, éventuellement certaines mesures préparatoires (la valeur du champs électromagnétique) ou certaines connaissances spécifiques à un domaine (des lois d'observation).
  • Associer les structures cadre (la géométrie) à un référentiel arbitraire (le référentiel du laboratoire).
  • Associer les entrées physiques, les opérations de mesure et les résultats à des appareils de mesure, avec éventuellement une calibration ou des règles de traduction des résultats.

Les règles qui nous permettent de faire correspondre les modèles à la réalité expérimentale ne sont pas formelles et systématiques, mais tacites, techniques, pratiques. Elles peuvent évoluer sans qu'on pense que la théorie a changé (on construit de nouveaux appareils de mesure plus performant...). En outre ces règles utilisent un contenu mixte langage naturel / théorique. Pour ces différentes raisons, on peut avancer qu'elles sont externes à la théorie elle-même.

Quand est-ce qu'une théorie est empiriquement adéquate ?

Une fois qu'on dispose de ces moyens d'appliquer un modèle à un domaine de la réalité, nous sommes à même de comparer les prédictions du modèle et les résultats de mesure concrets obtenus.

L'adéquation empirique joue un rôle central en science. On peut dire qu'un modèle est empiriquement adéquat si chaque fois qu'il s'applique (ce qui dépend des règles du troisième niveau ci-dessus) il fait de bonnes prédictions. Bien sûr, les prédictions probabilistes peuvent demander une analyse plus fine, par exemple en terme statistiques, qui demande de procéder à une induction sur plusieurs expériences.

Si une expérience échoue, il n'est jamais nécessaire de remettre en cause la théorie elle-même : on peut aussi considérer qu'en fin de compte le modèle ne s'appliquait pas réellement à la situation (parce qu'un appareil de mesure est défectueux, parce qu'il manquait une hypothèse à notre modèle, un phénomène perturbateur inconnu...). C'est à dire qu'on peut toujours en principe mettre en cause l'étape consistant à mettre en relation un modèle et une situation concrète (le troisième niveau ci-dessus) plutôt que la théorie elle-même, voire modifier le modèle de manière ad-hoc pour qu'il corresponde à ce qui est observé.

Pour cette raison, et contrairement à une idée largement répandue, ce sont rarement les échecs prédictifs qui motivent les avancées théoriques, mais plutôt des questions purement conceptuelles (comme essayer de combiner plusieurs théories contradictoires s'appliquant à des domaines différents), même si les anomalies dans les prédictions peuvent être prises en compte dans ce processus.

L'adéquation empirique joue cependant plusieurs rôles. D'une part elle permet de confirmer ou d'infirmer les hypothèses ad-hoc qui font suite à une anomalie expérimental (par un jeu d'essai et d'erreur), ce qui peut amener à éliminer certaines anomalies et conforter d'autant plus la théorie dans son succès, ou au contraire rendre une anomalie persistante. D'autre part elle permet de confronter les nouvelles théories entrant sur le marché. Typiquement, celles-ci voudront faire de nouvelles prédictions différentes de la théorie bien établie pour une situation particulière. Enfin elle permet d'éprouver un modèle donné ou une famille de modèles en vue d'applications techniques, ou pour d'autres raisons.

On peut dire qu'une théorie est empiriquement adéquate (et donc mérite d'être bien établie) si tous ses modèles le sont.

Bien sûr nous sommes incapable de tester tous les modèles de la théorie. Cependant nous pouvons procéder à des inductions par généralisations successives : nous induisons sur les entrées physiques, les entrées opératoires, en faisant varier les dispositifs. Nous testons ainsi un modèle général (ou une classe de modèles) dont on peut affirmer qu'ils sont empiriquement adéquats. Enfin on peut également procéder par abstraction sur tous les types de modèles, en testant des configurations diverses. Ces inductions sont souvent utilisées pour résoudre les anomalies expérimentales, en testant les hypothèses ad-hoc dans différents cadres. Elles sont également réalisées quand on étend la théorie à de nouveaux domaines, qu'on conçoit de nouvelles expériences ou de nouvelles techniques. Ce sont elles qui confortent réellement la théorie.

En résumé, on peut dire qu'une théorie est empiriquement adéquate si quelque soient les entrées physiques et opératoires, et quelque soient les systèmes auxquels elle s'intéresse, ses modèles font de bonnes prédictions.

Qu'est-ce qu'une interprétation d'une théorie ?

On peut maintenant se demander ce que signifie interpréter (philosophiquement) une théorie. Il me semble qu'on puisse dégager des sens différents de l'interprétation suivant le niveau auquel on s'intéresse.

On pourrait d'abord penser (si on aime les sémantiques vérificationistes) qu'interpréter une théorie scientifique nous demande de nous intéresser uniquement au troisième niveau : comment le vocabulaire théorique est mis à contribution lors de la confrontation de la théorie à la réalité ? Comment se comporte-t-il en relation avec nos actions et notre langage naturel ?

En considérant tous ces éléments, a-t-on épuisé ce qu'il y a à dire sur l'interprétation ? Il est certain que la façon dont la théorie est utilisée en pratique permet au moins de fixer son domaine d'application. Mais un problème est que ce domaine est susceptible d'évoluer au fil des techniques sans qu'on pense que la théorie elle-même ait changée.

En outre, le discours scientifique ne se limite certainement pas à la vérification expérimentale, à la prédiction ou au développement de techniques. Il joue également un rôle descriptif, explicatif, nous permet de comprendre la nature de la réalité. C'est en tout cas ce qu'on pense si on est d'inclination réaliste (et par ailleurs le vérificationnisme a fait son temps : il existe de bons arguments en philosophie du langage pour nous en convaincre).

Même en considérant que nous nous leurrons quand nous prétendons expliquer la réalité, que nos représentations ne correspondent en rien à quelque chose d'extérieur mais son seulement des outils prédictifs, il faut bien admettre que le discours scientifique sert d'autres buts que la simple vérification expérimentale : il s'agit, également, de faire des inférences, d'émettre des hypothèses, de développer les théories en les appliquant à de nouveaux domaines, de construire de nouveaux modèles. Et ce discours est lui aussi couronné de succès.

On peut donc ici définir un premier sens d'interpréter, qui consiste à se questionner sur la fonction du discours scientifique en général (à tous les niveaux, et en particulier au niveau des modèles) : s'agit-il simplement de faire des prédictions, de développer des techniques ? De décrire des régularités dans les phénomènes ? Ou prétend-on décrire la nature fondamentale de la réalité ? Sa structure ? On peut parler d'interprétation sémantique.

Une fois la fonction du langage scientifique clarifiée, on peut se demander si cette fonction est réalisée avec succès et si on pense que c'est le cas, on pourra chercher à fournir une explication philosophique à ce succès. Alors on peut envisager un second sens d'interpréter : il s'agit de clarifier ce que la science nous apprend de la réalité et d'expliquer son succès en général, que ce soit sont succès empirique ou dans les inférences. On peut parler à ce propos d'interprétation épistémologique

Ce niveau d'interprétation permet de différencier instrumentalisme et réalisme. Il pourra mettre l'accent sur la vérification empirique, qui est en un sens la mesure ultime du succès de la science. Ici l'attitude réaliste consistera à penser que la science est couronnées de succès prédictif parce qu'elle décrit correctement la réalité, sous certains aspects (l'explication de son succès est réaliste), et le rôle de la métaphysique serait de clarifier ces aspects en proposant une ontologie.

Il en découle un troisième sens d'interpréter qui est spécifique au réalisme : associer le contenu théorique (celui du premier niveau théorique) à une ontologie qui correspond au contenu des théories, c'est à dire, en gros, de clarifier ce que représentent le formalisme, les axiomes ou le vocabulaire de la théorie dans la réalité. On peut parler d'interprétation métaphysique.

Suivant ce dernier sens d'interprétation, il nous faudra considérer la vérification, qui permet en effet de fixer le domaine d'application de la théorie, et les modèles qui nous indiquent comment les concepts scientifiques sont mis en oeuvre, mais c'est surtout le contenu théorique général (le vocabulaire, les structures et les axiomes) qui nous intéressera.

Les différentes interprétations contemporaines

C'est dans ce troisième sens qu'on trouve la plupart des interprétations contemporaines en métaphysique. On peut les distinguer en reprenant les trois aspects du niveau théorique ci-dessus :

Le vocabulaire théorique
S'agit-il de propriétés fondamentales ? d'universaux ? de tropes ? de bundles de dispositions ? Ces propriétés sont-elles possédées par des objets, des événements, des processus, ou par une substance ? Ou ne sont-elles que des supports heuristiques pour nos raisonnements, les noeuds d'une structure théorique ?
Les structures formelles
Sont-elles des structures primitives de la réalité ? Des objets mathématiques existant de manière abstraite ? Ou simplement le réseau des relations entre les autres éléments ?
Les axiomes
Correspondent-ils à des lois de la nature primitives ? A la description de dispositions ou de rapports causaux instanciés dans la nature ? A des structures modales ? Des relations entre universaux ? Ou simplement à la description de régularités dans les phénomènes ? Ou encore, des possibilités d'inférence relatives à des agents possédant une connaissance incomplète du monde ?

Le fait est que les théories scientifiques elles-même ne nous indiquent pas quelle ontologie adopter, et en fin de compte, il se peut que nous devions nous reporter de nouveau à la façon dont les modèles théoriques sont utilisés et confrontés à la réalité pour obtenir une réponse. Mais l'inconvénient de l'attitude réaliste est qu'elle ne fournit pas de critères précis pour juger d'une bonne ontologie.