jeudi 13 août 2015

Qu'est-ce qu'une théorie physique ? Qu'est-ce qu'interpréter une théorie ?

Une fois n'est pas coutume, cette entrée ne contient aucune thèse ou position philosophique (ou de manière assez minimale). Il s'agit plutôt de proposer une clarification conceptuelle : qu'est-ce qu'une théorie scientifique ? Un modèle ? Comment est-il confronté à la réalité ? Qu'est ce que l'adéquation empirique d'une théorie ? Qu'est-ce qu'interpréter une théorie ? Pour finir je propose un rapide recensement des positions contemporaines en métaphysique des sciences à l'aulne de cette analyse.

Qu'est-ce qu'une théorie ?

Je propose la caractérisation suivante de ce qu'est une théorie physique :

Un vocabulaire théorique
  • un ensemble de propriétés observables pensées comme contingentes (comme la position, la direction de spin)
  • un ensemble de propriétés fondamentales pensées comme nécessaires à leur objet (comme la masse ou la charge)
  • Des types d'objets (l'électron, ...) pouvant posséder ces propriétés.
Des structures mathématiques
  • des structures pouvant représenter les degrés de liberté d'un système particulier (un espace des phases, l'espace de configuration ou l'espace de Hilbert)
  • D'autres destinées à spécifier des opérations sur ces systèmes, ou leur évolution (un hamiltonien, un opérateur)
  • d'autres servant de cadre général ou relationnel pouvant être communs à plusieurs systèmes (un espace-temps géométrique, un espace de Minkowski).
Des axiomes théoriques
Ces axiomes permettent de faire le lien entre les éléments précédents :
  • ils indiquent comment associer vocabulaire d'observation et structures mathématiques, comment "labelliser" les degrés de liberté, les opérations ou les structures cadres avec les propriétés observables des systèmes.
  • Ils indiquent comment associer les propriétés fondamentales du système et les structures labellisées aux observations ou prédictions, ce qui peut prendre la forme de lois d'évolution (comme l'équation de Schrödinger) ou de règles permettant de déduire des prédictions (comme la règle de Born).

Qu'est-ce qu'un modèle ?

Une théorie physique est comme un langage doté d'un vocabulaire et d'une grammaire (les axiomes) permettant de forger des propositions. Ces propositions, ce sont des modèles.

Un modèle est une structure mathématique, interprétée dans le vocabulaire de la théorie, et qui vérifie ses axiomes, et qu'on peut penser comme étant destinée à représenter des types de systèmes. Construire un modèle demande d'intégrer les éléments suivants :

Une caractérisation du système concerné
Il s'agit d'une caractérisation des degrés de liberté d'un système, de ses propriétés fondamentales (sa masse, sa charge), et de la façon dont il interagit avec son environnement (un champs électromagnétique).
Des entrées physiques
Typiquement, ceci correspond à l'état initial du système, qui peut s'exprimer par une valeur pour une propriété observable, ou une répartition de probabilité sur celles-ci.
Des entrées opérationnelles
Il s'agit de spécifier les mesures que l'on va effectuer sur le système, en terme de propriétés observables indexées dans la structure cadre (l'espace et le temps).

A partir de ces éléments et des axiomes de la théorie, nous pouvons construire un modèle qui contient des prédictions. Typiquement les degrés de libertés permettent de construire un espace des phases (ou un espace de Hilbert) dont les axes sont "labellisés" avec les propriétés observables du système, et associés à une structure cadre (un référentiel correspondant par exemple à une géométrie de l'espace). La façon dont le système interagit avec son environnement, ainsi que les propriétés fondamentales du système permettent d'établir une loi d'évolution du système dans cet espace des phases (un hamiltonien). Enfin la prise en compte des opérations de mesure permet de dériver des prédictions, c'est à dire des résultats de mesures (des valeurs pour les propriétés observables) indexées dans l'espace et le temps.

Bien sûr il s'agit là du cas idéal, et en pratique, les physiciens procèdent à de multiples idéalisations, hypothèses auxiliaires simplificatrices, ou techniques d'approximation mathématiques pour construire le modèle, si bien que souvent le modèle ne vérifie pas à strictement parler les axiomes de la théorie. Simplement on pense qu'il approxime un modèle qui, lui, vérifie ces axiomes.

Comment applique-t-on un modèle ?

Les propositions d'un langage doivent encore être utilisées en contexte : elles doivent être prononcées par un locuteur pour exister. De même les modèles théoriques doivent être appliqués à la réalité, dans un contexte expérimental.

Il peut s'agir de développer une technique, de comprendre le fonctionnement d'un système physique réel, de faire des prédictions, ou encore de simplement vérifier la théorie. Dans tous ces cas, utiliser un modèle en contexte nous demande d'associer chacun de ses éléments à des objets et propriétés de la réalité courante :

  • Identifier un type de système (des degrés de liberté, des propriétés fondamentales) et la façon dont il interagit avec son environnement à un objet ou dispositif expérimental réel (un canon à électron, un aimant), ce qui demande une connaissance préalable, éventuellement certaines mesures préparatoires (la valeur du champs électromagnétique) ou certaines connaissances spécifiques à un domaine (des lois d'observation).
  • Associer les structures cadre (la géométrie) à un référentiel arbitraire (le référentiel du laboratoire).
  • Associer les entrées physiques, les opérations de mesure et les résultats à des appareils de mesure, avec éventuellement une calibration ou des règles de traduction des résultats.

Les règles qui nous permettent de faire correspondre les modèles à la réalité expérimentale ne sont pas formelles et systématiques, mais tacites, techniques, pratiques. Elles peuvent évoluer sans qu'on pense que la théorie a changé (on construit de nouveaux appareils de mesure plus performant...). En outre ces règles utilisent un contenu mixte langage naturel / théorique. Pour ces différentes raisons, on peut avancer qu'elles sont externes à la théorie elle-même.

Quand est-ce qu'une théorie est empiriquement adéquate ?

Une fois qu'on dispose de ces moyens d'appliquer un modèle à un domaine de la réalité, nous sommes à même de comparer les prédictions du modèle et les résultats de mesure concrets obtenus.

L'adéquation empirique joue un rôle central en science. On peut dire qu'un modèle est empiriquement adéquat si chaque fois qu'il s'applique (ce qui dépend des règles du troisième niveau ci-dessus) il fait de bonnes prédictions. Bien sûr, les prédictions probabilistes peuvent demander une analyse plus fine, par exemple en terme statistiques, qui demande de procéder à une induction sur plusieurs expériences.

Si une expérience échoue, il n'est jamais nécessaire de remettre en cause la théorie elle-même : on peut aussi considérer qu'en fin de compte le modèle ne s'appliquait pas réellement à la situation (parce qu'un appareil de mesure est défectueux, parce qu'il manquait une hypothèse à notre modèle, un phénomène perturbateur inconnu...). C'est à dire qu'on peut toujours en principe mettre en cause l'étape consistant à mettre en relation un modèle et une situation concrète (le troisième niveau ci-dessus) plutôt que la théorie elle-même, voire modifier le modèle de manière ad-hoc pour qu'il corresponde à ce qui est observé.

Pour cette raison, et contrairement à une idée largement répandue, ce sont rarement les échecs prédictifs qui motivent les avancées théoriques, mais plutôt des questions purement conceptuelles (comme essayer de combiner plusieurs théories contradictoires s'appliquant à des domaines différents), même si les anomalies dans les prédictions peuvent être prises en compte dans ce processus.

L'adéquation empirique joue cependant plusieurs rôles. D'une part elle permet de confirmer ou d'infirmer les hypothèses ad-hoc qui font suite à une anomalie expérimental (par un jeu d'essai et d'erreur), ce qui peut amener à éliminer certaines anomalies et conforter d'autant plus la théorie dans son succès, ou au contraire rendre une anomalie persistante. D'autre part elle permet de confronter les nouvelles théories entrant sur le marché. Typiquement, celles-ci voudront faire de nouvelles prédictions différentes de la théorie bien établie pour une situation particulière. Enfin elle permet d'éprouver un modèle donné ou une famille de modèles en vue d'applications techniques, ou pour d'autres raisons.

On peut dire qu'une théorie est empiriquement adéquate (et donc mérite d'être bien établie) si tous ses modèles le sont.

Bien sûr nous sommes incapable de tester tous les modèles de la théorie. Cependant nous pouvons procéder à des inductions par généralisations successives : nous induisons sur les entrées physiques, les entrées opératoires, en faisant varier les dispositifs. Nous testons ainsi un modèle général (ou une classe de modèles) dont on peut affirmer qu'ils sont empiriquement adéquats. Enfin on peut également procéder par abstraction sur tous les types de modèles, en testant des configurations diverses. Ces inductions sont souvent utilisées pour résoudre les anomalies expérimentales, en testant les hypothèses ad-hoc dans différents cadres. Elles sont également réalisées quand on étend la théorie à de nouveaux domaines, qu'on conçoit de nouvelles expériences ou de nouvelles techniques. Ce sont elles qui confortent réellement la théorie.

En résumé, on peut dire qu'une théorie est empiriquement adéquate si quelque soient les entrées physiques et opératoires, et quelque soient les systèmes auxquels elle s'intéresse, ses modèles font de bonnes prédictions.

Qu'est-ce qu'une interprétation d'une théorie ?

On peut maintenant se demander ce que signifie interpréter (philosophiquement) une théorie. Il me semble qu'on puisse dégager des sens différents de l'interprétation suivant le niveau auquel on s'intéresse.

On pourrait d'abord penser (si on aime les sémantiques vérificationistes) qu'interpréter une théorie scientifique nous demande de nous intéresser uniquement au troisième niveau : comment le vocabulaire théorique est mis à contribution lors de la confrontation de la théorie à la réalité ? Comment se comporte-t-il en relation avec nos actions et notre langage naturel ?

En considérant tous ces éléments, a-t-on épuisé ce qu'il y a à dire sur l'interprétation ? Il est certain que la façon dont la théorie est utilisée en pratique permet au moins de fixer son domaine d'application. Mais un problème est que ce domaine est susceptible d'évoluer au fil des techniques sans qu'on pense que la théorie elle-même ait changée.

En outre, le discours scientifique ne se limite certainement pas à la vérification expérimentale, à la prédiction ou au développement de techniques. Il joue également un rôle descriptif, explicatif, nous permet de comprendre la nature de la réalité. C'est en tout cas ce qu'on pense si on est d'inclination réaliste (et par ailleurs le vérificationnisme a fait son temps : il existe de bons arguments en philosophie du langage pour nous en convaincre).

Même en considérant que nous nous leurrons quand nous prétendons expliquer la réalité, que nos représentations ne correspondent en rien à quelque chose d'extérieur mais son seulement des outils prédictifs, il faut bien admettre que le discours scientifique sert d'autres buts que la simple vérification expérimentale : il s'agit, également, de faire des inférences, d'émettre des hypothèses, de développer les théories en les appliquant à de nouveaux domaines, de construire de nouveaux modèles. Et ce discours est lui aussi couronné de succès.

On peut donc ici définir un premier sens d'interpréter, qui consiste à se questionner sur la fonction du discours scientifique en général (à tous les niveaux, et en particulier au niveau des modèles) : s'agit-il simplement de faire des prédictions, de développer des techniques ? De décrire des régularités dans les phénomènes ? Ou prétend-on décrire la nature fondamentale de la réalité ? Sa structure ? On peut parler d'interprétation sémantique.

Une fois la fonction du langage scientifique clarifiée, on peut se demander si cette fonction est réalisée avec succès et si on pense que c'est le cas, on pourra chercher à fournir une explication philosophique à ce succès. Alors on peut envisager un second sens d'interpréter : il s'agit de clarifier ce que la science nous apprend de la réalité et d'expliquer son succès en général, que ce soit sont succès empirique ou dans les inférences. On peut parler à ce propos d'interprétation épistémologique

Ce niveau d'interprétation permet de différencier instrumentalisme et réalisme. Il pourra mettre l'accent sur la vérification empirique, qui est en un sens la mesure ultime du succès de la science. Ici l'attitude réaliste consistera à penser que la science est couronnées de succès prédictif parce qu'elle décrit correctement la réalité, sous certains aspects (l'explication de son succès est réaliste), et le rôle de la métaphysique serait de clarifier ces aspects en proposant une ontologie.

Il en découle un troisième sens d'interpréter qui est spécifique au réalisme : associer le contenu théorique (celui du premier niveau théorique) à une ontologie qui correspond au contenu des théories, c'est à dire, en gros, de clarifier ce que représentent le formalisme, les axiomes ou le vocabulaire de la théorie dans la réalité. On peut parler d'interprétation métaphysique.

Suivant ce dernier sens d'interprétation, il nous faudra considérer la vérification, qui permet en effet de fixer le domaine d'application de la théorie, et les modèles qui nous indiquent comment les concepts scientifiques sont mis en oeuvre, mais c'est surtout le contenu théorique général (le vocabulaire, les structures et les axiomes) qui nous intéressera.

Les différentes interprétations contemporaines

C'est dans ce troisième sens qu'on trouve la plupart des interprétations contemporaines en métaphysique. On peut les distinguer en reprenant les trois aspects du niveau théorique ci-dessus :

Le vocabulaire théorique
S'agit-il de propriétés fondamentales ? d'universaux ? de tropes ? de bundles de dispositions ? Ces propriétés sont-elles possédées par des objets, des événements, des processus, ou par une substance ? Ou ne sont-elles que des supports heuristiques pour nos raisonnements, les noeuds d'une structure théorique ?
Les structures formelles
Sont-elles des structures primitives de la réalité ? Des objets mathématiques existant de manière abstraite ? Ou simplement le réseau des relations entre les autres éléments ?
Les axiomes
Correspondent-ils à des lois de la nature primitives ? A la description de dispositions ou de rapports causaux instanciés dans la nature ? A des structures modales ? Des relations entre universaux ? Ou simplement à la description de régularités dans les phénomènes ? Ou encore, des possibilités d'inférence relatives à des agents possédant une connaissance incomplète du monde ?

Le fait est que les théories scientifiques elles-même ne nous indiquent pas quelle ontologie adopter, et en fin de compte, il se peut que nous devions nous reporter de nouveau à la façon dont les modèles théoriques sont utilisés et confrontés à la réalité pour obtenir une réponse. Mais l'inconvénient de l'attitude réaliste est qu'elle ne fournit pas de critères précis pour juger d'une bonne ontologie.

Aucun commentaire: