dimanche 23 août 2015

Des histoires consistantes à la physique relationnelle

Nous avons vu dans le dernier billet que dans le formalisme des histoires consistantes, adopter un cadre (un découpage discret de l'espace des états du système en propriétés disjointes) permet de restaurer l'usage de la logique classique et des raisonnements contre-factuels, et résout la plupart des paradoxes de la mécanique quantique. Le prix à payer est que tout ceci est toujours relatif à un cadre, qui n'est pas quelque chose qui existe dans la nature mais plutôt une façon conventionnelle de voir le monde parmi d'autres (dans l'absolu, tous les cadres se valent).

Il existe une analogie assez forte entre cet aspect et le choix d'un référentiel en relativité restreinte. D'abord, le cadre est lui aussi, sur le plan mathématique, un référentiel dans un espace (l'espace de Hilbert) même si ce dernier n'est pas interprété comme espace physique, mais comme espace des états possibles. Ensuite et surtout, en relativité restreinte, le choix d'un référentiel de coordonnées permet de restaurer une certaine vision classique du temps : relativement à ce référentiel, on peut définir un plan de simultanéité et une succession temporelle des événements, on peut définir des longueurs, des vitesses. Certes certains paradoxes persistent (comme le paradoxe des jumeaux) mais au moins nous restaurons une vision commune du temps comme déroulement uniforme des phénomènes.

Le problème, comme dans le cas du cadre avec les histoires consistantes, c'est que ce référentiel est arbitraire, qu'il n'existe que "dans la tête de l'agent", et donc qu'il n'existe pas de manière objective de notion de simultanéité, ou de succession entre événements distants. Ce n'est qu'une manière de voir qui en vaut une autre (tous les référentiels se valent).

Ainsi dans les deux cas le choix d'un cadre arbitraire permet de restaurer nos intuitions classiques : sur le temps dans un cas, sur les inférences logiques dans l'autre. Mais celles-ci s'avèrent ultimement relatives à un point de vue choisi arbitrairement.

Un référentiel, en relativité, permet d'assigner des coordonnées spatiales et temporelles à des événements. En mécanique quantique, un cadre permet d'assigner des propriétés déterminées, ou une répartition de probabilités sur celles-ci, à des événements. La leçon, dans les deux cas, semble être que ces propriétés (de position ou quantiques) n'ont rien d'absolues mais son relatives au choix du référentiel. La différence est que dans le cas quantique ce ne sont pas les valeurs des propriétés qu'on change quand on change de référentiel, mais ce sont les propriétés que le système possède ou non : soit on s'intéresse à la position, soit à la quantité de mouvement, mais pas les deux. En relativité, changer de référentiel, c'est adopter une autre convention pour déterminer la position des événements. Mais la quantité de mouvement n'est pas une "autre convention pour déterminer la position" : c'est une autre propriété. Cette différence rend difficile de savoir ce qu'on doit considérer comme invariant dans la théorie quantique. En relativité, un intervalle spatio-temporel est un invariant, on le calcul à partir des positions respectives de plusieurs événements, et on obtient le même résultat quelque soit le référentiel choisi. Mais comment définir un invariant à partir de propriétés hétérogènes ?

L'arbitraire du référentiel en relativité implique qu'il n'existe plus de notion de simultanéité absolue. Dans le cas de la mécanique quantique, une implication qui serait équivalente est moins lisible. Mais ce serait quelque chose comme : il n'existe pas de propriété déterminée possédée absolument par un objet donné, ou encore il n'existe pas de faits absolus. Il faut définir un cadre pour pouvoir parler de faits.

C'est ici qu'on voit que l'interprétation des approches consistantes n'est finalement pas si éloigné des interprétations relationnelles de la mécanique quantique, qui affirment que l'état d'un système physique n'est jamais que sa relation à un observateur (au sens de la physique, c'est à dire un autre système physique possédant des enregistrements passés de ce système). Selon les interprétations relationnelles, il n'existe pas de point de vue de nulle-part : pas de fait sans spécifier un observateur.

Cadre abstrait dans un cas, système physique dans un autre, mais dans les deux cas, nous avons une forme de relativité. Peut-on les faire se rejoindre ?

Dans l'interprétation des histoires consistantes, le cadre est arbitraire. Cependant on peut dire qu'un cadre est plus utile qu'un autre : si par exemple il correspond à ce qu'on a l'intention de mesurer sur le système. Mais cette utilité n'est-elle pas objective ? Pourquoi alors n'existerait-il pas un "bon" cadre (même si celui-ci ne nous est pas entièrement accessible : il peut s'agir d'un affinement de notre cadre quasi-classique) ? Un peu comme en relativité, on admet que tous les référentiels se valent, et pourtant en cosmologie, on accepte qu'il existe un "bon" référentiel (qui permet notamment de calculer l'age de l'univers).

Il existe certaines analogies en physique quantique relativiste entre un référentiel et un système physique (par exemple un oscillateur permet de définir une horloge, donc un référentiel). S'il s'avère que ce "bon" cadre se situe dans les relations entre un système physique observateur et un système physique observé, nous retomberions alors, à partir du formalisme des histoires consistantes, sur une interprétation relationnelle.

dimanche 16 août 2015

L'interprétation des histoires consistantes de la mécanique quantique

Je me suis intéressé récemment à l'interprétation des histoires consistantes de la mécanique quantique, et j'avoue avoir été assez convaincu par l'approche. Je vais me contenter, dans ce billet, de proposer une vulgarisation de cette interprétation.

L'espace des phases

Focal stability.png
Classiquement on peut se représenter l'état d'un système dans un espace des phases. Il s'agit d'un espace abstrait dont les coordonnées sont les degrés de liberté du système. Si par exemple une particule a une position et une vitesse, on prendra en abscisse sa position et en ordonnée sa vitesse. Chaque point de l'espace de configuration représente donc un état possible du système. Son état actuel est l'un de ces points, et son évolution temporelle peut être représentée par une trajectoire.

Dans un espace des phases, on peut représenter une propriété quelconque, éventuellement complexe, par une région de cet espace. Par exemple : "avoir une position supérieur à 0,7 et inférieur à 0,8" est une propriété qui correspondra à une certaine zone (une bande dans l'exemple ci-dessus). Mais on peut en fait imaginer n'importe quelle propriété. On pourrait par exemple s'intéresser à un système composé de milliers d'atomes, dont l'espace des phases aurait un nombre incalculable de dimensions (au moins 3 par atomes : leurs coordonnées de positions), chaque point de l'espace représentant une configuration possible de ces atomes, et on pourrait concevoir que la propriété "être un chat" corresponde à une certaine région de cet espace gigantesque : celle contenant tous les points dont l'arrangement correspond à un chat.

Si l'on part du principe qu'une propriété quelconque est une région de l'espace des phases, on peut introduire un formalisme logique comme suit :

  • La conjonction de deux propriétés ("A et B") correspond à l'intersection des régions de chaque propriété
  • La disjonction de deux propriétés ("A ou B") correspond à l'union des régions de chaque propriété
  • La négation d'une propriété ("non A") correspond au complément de sa région dans l'espace complet.

Venn diagram gr la ru
Ces trois opérateurs logiques sont suffisant pour définir la logique classique. Tout ceci correspond à ce qu'on appelle les diagrammes de Venn (voir l'image, pour les propriétés "être une lettre de l'alphabet romain / grec / cyrillique").

Selon ce point de vue, attribuer une propriété à un système physique revient à le situer dans une région de l'espace des phases.

Bien sûr on peut être peu satisfait de ces notions de propriété du type "tout ou rien". Mais rien ne nous empêche d'introduire des probabilités. Celles-ci peuvent servir soit à définir des propriétés "floues", soit, de manière équivalente, à indiquer notre incertitude quant à l'état réel d'un système.

Standard deviation diagram
Concrètement, ceci prendra la forme d'une répartition de probabilité sur l'espace des phases. On associe un nombre à chaque point de l'espace, représentant le degré de probabilité que le système s'y trouve. Pour connaître la probabilité que le système ait une propriété (de type tout ou rien), il suffit d'intégrer ces degrés (d'en faire la somme) sur la région correspondant à cette propriété (si par exemple l'espace des phases est un axe, la probabilité associée à une propriété donnée correspondra au calcul d'une surface : voir l'image ci-dessus).

Avec cette extension, on retrouve alors le calcul classique des probabilités : celles-ci on une valeur entre 0 et 1, la probabilité de l'espace des phases dans son ensemble est de 1 et si deux propriétés sont disjointes, alors la probabilité de leur conjonction est la somme de leurs probabilités respectives. C'est, en substance, ce qu'affirment les axiomes de Kolmogorov.

L'espace de Hilbert

Linear subspaces with shading
Bon, jusqu'ici on est dans un cadre classique. Passons maintenant à la physique quantique. On peut analyser de manière similaire l'espace de Hilbert, qui est l'espace dans lequel sont définis les fonctions d'ondes, représentant les états des systèmes physiques, ainsi que les opérateurs correspondant aux observations possibles, aux résultats de mesure, ou encore aux équations d'évolution de ces systèmes. Autant dire que l'espace de Hilbert joue un rôle central en mécanique quantique.

Il existe une manière assez naturelle de l'interpréter comme un espace des phases, et qui, poussée à son terme, aboutit à ce qu'on appelle les logiques quantiques.

Dans l'espace de Hilbert, les états possibles du système ne sont plus des points mais des axes passant par l'origine. Une propriété quelconque n'est plus représentée par une région (une somme de points) mais par un sous espace passant par l'origine (qui peut être défini par plusieurs axes orthogonaux, par exemple un plan).

Au passage il faut bien voir que nous avons grandement multiplié les dimensions de notre espace. Ainsi un axe de l'espace ne correspond plus à un seul degré de liberté du système (par exemple la position d'une particule), mais il y a un axe pour chaque valeur possible que peut prendre ce degré de liberté (un axe par position possible). Dans cette représentation, un type de propriété (comme "position") ne correspond plus à un axe précis, mais à un référentiel de l'espace de Hilbert, ou à un repère, c'est à dire un système de coordonnées à part entière dans cet espace qui consiste à sélectionner des axes perpendiculaires entre eux (orthogonaux).

On voit également que l'état possible d'un système n'a pas à correspondre à des valeurs de propriétés bien définies. Si par exemple deux positions possibles correspondent à deux axes, il existe une infinité d'états sur le plan que forment ces deux axes. On ne pourra dire d'aucun de ces états qu'il correspond à l'une ou l'autre de ces valeurs de position, sauf quand ils coïncident avec l'un des deux axes.

On peut alors définir les opérations logiques suivantes sur les propriétés :

  • La conjonction de deux propriétés ("A et B") correspond à l'intersection des sous-espaces de chaque propriété (par exemple, l'intersection de deux plans est un axe).
  • La disjonction de deux propriétés ("A ou B") correspond au produit de leurs sous-espaces. Par exemple, le produit de deux axes est un plan, et le produit d'un plan et d'un axe est un volume à trois dimensions.
  • La négation d'une propriété ("non A") correspond au complémentaire de son sous-espace. Le complémentaire d'un sous-espace A est tel que "A ou non A'" nous donne l'espace complet. Par exemple dans un espace à 3 dimensions, le complémentaire d'un plan est un axe perpendiculaire à ce plan, et inversement.

Tout comme dans le cas classique, on peut envisager une répartition de probabilité sur ces propriétés, qui consistera à pondérer chaque axe de l'espace des phases par un coefficient.

Le problème est qu'avec cette représentation on ne retrouve ni les inférences de la logique standard, ni le calcul standard des probabilités. Si l'on prend cette représentation au sérieux, nous devons adopter une logique quantique dont les règles sont différentes. Une de ses caractéristiques est notamment qu'elle n'est pas distributive ("A et (B ou C)" n'est pas équivalent à "(A et B ) ou (A et C)"), ce qui est assez contre-intuitif ("Ceci est un chat mort ou vivant" n'est pas équivalent à "ceci est soit un chat mort, soit un chat vivant").

Les cadres ("framework")

Il existe cependant un moyen de restaurer les règles classiques de la logique et des probabilités. Il s'agit de restreindre les possibilités d'expression du langage, en décrétant que certaines propositions logiques sont dénuées de signification. On décrétera notamment que la disjonction ou la conjonction de deux propriétés n'ont de sens que si les sous-espaces correspondant à ces propriétés sont orthogonaux. C'est ce que propose le formalise des histoires consistantes.

Ces contraintes reviennent à imposer à l'utilisateur de la logique de choisir un cadre (framework) dans lequel ses expressions prennent un sens. Le choix est arbitraire : rien n'empêche de choisir un autre cadre, mais il est interdit de combiner les cadres, c'est à dire de faire des inférences logiques à partir de propositions exprimées dans des cadres différents.

On peut définir un cadre comme un ensemble de propriétés telles que leurs conjonctions respectives est toujours nulle (elles sont orthogonales) et leur disjonction couvre tout l'espace des états. Autrement dit, c'est une manière de découper l'espace des états en propriétés distinctes (l'équivalent, dans un système classique, serait une partition de l'espace des phases en régions disjointes. Voir l'image.). Si par exemple notre espace a trois dimensions, les différents cadres possibles sont : soit trois axes orthogonaux, soit un plan et un axe orthogonal à ce plan, soit l'espace dans son ensemble (qui est un cadre assez peu utile).

Partizione

Il existe des relations intéressantes entre les différents cadres. Par exemple, il est possible d'affiner un cadre en décomposant l'une de ses propriétés en sous-propriétés, dont elle est la disjonction (en définissant un plan à partir de deux axes orthogonaux). Il y a toujours plusieurs façons mutuellement incompatibles d'affiner un cadre (puisqu'il existe plusieurs façons de choisir deux axes orthogonaux sur un plan). Il est aussi possible d'épaissir un cadre en fusionnant deux de ses propriétés (prendre un plan au lieu de deux axes).

Des cadres sont dis compatibles si toutes leurs propriétés caractéristiques sont orthogonales deux à deux. On peut montrer que dans ce cas les cadres ont un affinement commun, c'est à dire un cadre plus fin qui permet de définir ces deux cadres. (par exemple, si l'on prend un espace à trois dimensions, x, y et z, on aurait un cadre formé du plan (x, y) et de l'axe z, et un autre formé du plan (x, z) et de l'axe y. Ils sont compatibles, et ont un affinement commun, formé des trois axes x, y et z). La notion de compatibilité est symétrique et réflexive, mais pas transitive : si un cadre X est compatible avec Y et Y avec Z, ça ne signifie pas que X et Z soient compatibles. La notion de compatibilité est une caractéristique des espaces de Hilbert. Dans un système classique, tous les cadres sont compatibles, et ils ont un affinement commun, qui consiste à considérer leurs intersections, ou à la limite, chaque point de l'espace des phases. Mais dans un espace de Hilbert, ça ne fonctionne plus.

Quand deux cadres sont compatibles, on peut utiliser la logique et les probabilités dans ces deux cadres sans problème.

Un cadre est donc en quelque sorte un repère, un référentiel dans l'espace des phases, un découpage de celui-ci en coordonnées, mais qui peut être grossier et ne pas distinguer différentes propriétés.

Si l'on adopte un cadre, on peut voir l'état d'un système (une fonction d'onde) comme définissant une répartition de probabilités sur un ensemble de propriétés (celles du cadre), et le calcul standard des probabilités est applicable. Le cadre spécifie un ensemble de propriétés possibles que le système peut avoir, qui sont disjonctives (le système a au moins l'une d'entre elles, et une seule) et ne s'intéresse pas aux autres propriétés.

On peut prendre l'image (que j'emprunte à Griffith) de différents points de vues sur une montagne, par exemple l'un vue du nord et l'autre du sud. On pourrait dire que d'un point de vue il est possible d'avoir une vision plus ou moins fine ou grossière (si l'on fait mal la mise au point), mais ces différentes vues donneront des images compatibles. Cependant la perspective nord et sud sont incompatibles (et contrairement au cas d'une montagne, où on peut forger une représentation en 3 dimensions contenant tous les points de vues possibles, ce n'est plus vraiment possible ici, sauf à adopter une logique quantique). Peut-être même, pour pousser l'analogie, qu'un point de vue grossier serait compatible avec plusieurs points de vue plus fins légèrement distincts, incompatibles entre eux. Adopter un cadre c'est donc en quelque sorte choisir une perspective sur cette montagne, et une mise au point.

Les histoires consistantes

Il est possible d'étendre tous ces concepts à un système qui évolue au cours du temps. De la même façon que quand on joue à pile ou face, lancer trois pièces simultanément, ou la même pièce trois fois de suite nous donne le même espace de possibilités (2x2x2=8 possibilités), il suffit de considérer les états successifs du système à différents instants discrets du temps pour définir un espace de Hilbert plus large (dans le jargon, on parle du produit tensoriel d'espaces de Hilbert).

De la même façon on peut alors définir des cadres, qui correspondent à un découpage de chaque état instantané en propriétés. Cependant dans le cas dynamique certaines subtilités s'ajoutent. En particulier on considérera uniquement des instants discrets du temps, et il faut des conditions supplémentaires pour que les règles de la logique classique puissent être appliquées, qui dépendent de ce qu'on appelle l'hamiltonien du système (son opérateur d'évolution). On parle alors de cadre consistant.

Dans le cas statique, adopter un cadre consistait à adopter un ensemble de propriétés disjonctives pour décrire le système, définissant des états possibles. Dans le cas dynamique, adopter un cadre revient à adopter une famille d'histoires possibles, une histoire étant simplement une succession de propriétés définies, indexées dans le temps, comme le serait par exemple une succession de "pile" et de "face" pour une pièce qu'on lancerait plusieurs fois. Dans le cas statique, la fonction d'onde nous permet d'obtenir une répartition de probabilités sur des propriétés possibles. Ici, on obtient une répartition de probabilités sur des histoires possibles.

Du fait que le calcul des probabilités standard peut être retrouvé, la structure de ces histoire consistantes correspondra à un arbre dont les branches correspondent à des déroulements différents à partir de l'état initial du système.

L'approche des histoires consistantes consiste donc simplement à nous dire ceci : une fois qu'on a choisi un cadre, une façon de décrire le système, l'ensemble des paradoxes de la mécanique quantique disparaissent. Il n'y a plus de problème de non-localité, de superposition d'états, de rétro-causalité ou que sais-je. Nous avons simplement un système qui évolue au cours du temps de manière aléatoire, certes, mais il est possible de connaître les probabilités que le système se trouve dans tel ou tel état, de faire des inférences et d'utiliser le calcul des probabilités standard.

En outre on peut comprendre également comment passer d'une description quantique à une description classique. Il suffit d'assimiler les mesures macroscopiques effectuées sur un système microscopique à un cadre grossier. Il est possible de montrer, avec la théorie de la décohérence, que ces cadres grossiers dits "quasi-classiques" seront en général consistants, ou suffisamment proche d'un cadre consistant pour qu'on n'ait pas à s'en préoccuper.

Mais qu'est-ce qu'un cadre ?

L'interprétation des histoires consistantes promet donc de résoudre tous les paradoxes de la mécanique quantique de manière simple et parcimonieuse. Il s'agit, pour reprendre les mots de Griffith, de "détrôner" la fonction d'onde : en effet celle-ci ne joue plus de rôle central dans ce formalisme, et on peut même complètement l'éliminer.

En effet dans cette interprétation, il n'est plus nécessaire de prendre en compte l'état initial du système et de le traduire sous forme de fonction d'onde qu'on fera évoluer au cours du temps. On peut se satisfaire de l'hamiltonien du système (son opérateur d'évolution) : celui-ci nous permet déjà de calculer, pour un cadre, les probabilités de chaque histoire consistante, c'est à dire de chaque succession de propriétés. L'état initial du système sera alors simplement l'un des éléments de ces histoires, à savoir la première propriété de chaque histoire possible (ou une répartition de probabilités).

Une représentation équivalente consisterait à associer ces histoires consistantes à des probabilités conditionnelles entre propriétés à différents instants. Il suffit alors de considérer l'état initial pour connaître certaines probabilités aux instants suivants, ou encore un déroulement sous forme d'arbre. Dans tous les cas, seul l'hamiltonien du système est mis à contribution : pas besoin de fonction d'onde. Voilà qui devrait faire plaisir aux métaphysiciens qui s'échignent à essayer de comprendre ce que peut bien représenter ce mystérieux objet...

Cette simplicité, cependant, a un prix, et ce prix est la relativité de ce type de description à un cadre, dont le choix est entièrement arbitraire, et à l'impossibilité de changer de cadre lors d'un raisonnement logique ou probabiliste. Cette contrainte peut sembler un peu mystérieuse. Pourquoi donc serait-il impossible de décrire l'état d'un système de manière complète et définitive ? Pourquoi sommes nous obligés de choisir un cadre ?

En effet les cadres n'existent pas dans le monde, et il ne faut pas, selon la théorie des histoires consistantes, considérer qu'il existe un "bon cadre" (qui correspondrait à ce qu'on mesure en effet sur le système). Il ne faut pas confondre ce qu'on mesure et les propriétés microscopiques du système. Le formalisme des histoires consistantes s'intéresse aux propriétés des systèmes microscopiques, pas aux expériences qu'on réalise sur eux. En particulier, il est toujours possible d'adopter un cadre qui n'a rien à voir avec ce qui est mesuré sur le système. Ce cadre sera certainement peu utile (on n'obtiendra que des probabilités au lieu de valeurs déterminées pour les propriétés auxquelles on s'intéresse) mais qu'importe : c'est un choix possible.

On peut voir les choses un peu comme ceci : il existerait plusieurs langages pour décrire le monde, et ces langages ne peuvent être utilisés simultanément sous peine de contradiction logique. Tout ce que nous fournit la théorie quantique, ce sont des règles d'utilisation de ces différents langages et des moyens de les traduire entre eux. Mais toute affirmation sur le monde reste relative à un langage, sans qu'on ne puisse dire d'aucun qu'il est le "bon" langage.

Toutes les interprétations de la mécanique quantique ont un prix à payer, mais finalement celui-ci n'est peut être pas si grand.

jeudi 13 août 2015

Qu'est-ce qu'une théorie physique ? Qu'est-ce qu'interpréter une théorie ?

Une fois n'est pas coutume, cette entrée ne contient aucune thèse ou position philosophique (ou de manière assez minimale). Il s'agit plutôt de proposer une clarification conceptuelle : qu'est-ce qu'une théorie scientifique ? Un modèle ? Comment est-il confronté à la réalité ? Qu'est ce que l'adéquation empirique d'une théorie ? Qu'est-ce qu'interpréter une théorie ? Pour finir je propose un rapide recensement des positions contemporaines en métaphysique des sciences à l'aulne de cette analyse.

Qu'est-ce qu'une théorie ?

Je propose la caractérisation suivante de ce qu'est une théorie physique :

Un vocabulaire théorique
  • un ensemble de propriétés observables pensées comme contingentes (comme la position, la direction de spin)
  • un ensemble de propriétés fondamentales pensées comme nécessaires à leur objet (comme la masse ou la charge)
  • Des types d'objets (l'électron, ...) pouvant posséder ces propriétés.
Des structures mathématiques
  • des structures pouvant représenter les degrés de liberté d'un système particulier (un espace des phases, l'espace de configuration ou l'espace de Hilbert)
  • D'autres destinées à spécifier des opérations sur ces systèmes, ou leur évolution (un hamiltonien, un opérateur)
  • d'autres servant de cadre général ou relationnel pouvant être communs à plusieurs systèmes (un espace-temps géométrique, un espace de Minkowski).
Des axiomes théoriques
Ces axiomes permettent de faire le lien entre les éléments précédents :
  • ils indiquent comment associer vocabulaire d'observation et structures mathématiques, comment "labelliser" les degrés de liberté, les opérations ou les structures cadres avec les propriétés observables des systèmes.
  • Ils indiquent comment associer les propriétés fondamentales du système et les structures labellisées aux observations ou prédictions, ce qui peut prendre la forme de lois d'évolution (comme l'équation de Schrödinger) ou de règles permettant de déduire des prédictions (comme la règle de Born).

Qu'est-ce qu'un modèle ?

Une théorie physique est comme un langage doté d'un vocabulaire et d'une grammaire (les axiomes) permettant de forger des propositions. Ces propositions, ce sont des modèles.

Un modèle est une structure mathématique, interprétée dans le vocabulaire de la théorie, et qui vérifie ses axiomes, et qu'on peut penser comme étant destinée à représenter des types de systèmes. Construire un modèle demande d'intégrer les éléments suivants :

Une caractérisation du système concerné
Il s'agit d'une caractérisation des degrés de liberté d'un système, de ses propriétés fondamentales (sa masse, sa charge), et de la façon dont il interagit avec son environnement (un champs électromagnétique).
Des entrées physiques
Typiquement, ceci correspond à l'état initial du système, qui peut s'exprimer par une valeur pour une propriété observable, ou une répartition de probabilité sur celles-ci.
Des entrées opérationnelles
Il s'agit de spécifier les mesures que l'on va effectuer sur le système, en terme de propriétés observables indexées dans la structure cadre (l'espace et le temps).

A partir de ces éléments et des axiomes de la théorie, nous pouvons construire un modèle qui contient des prédictions. Typiquement les degrés de libertés permettent de construire un espace des phases (ou un espace de Hilbert) dont les axes sont "labellisés" avec les propriétés observables du système, et associés à une structure cadre (un référentiel correspondant par exemple à une géométrie de l'espace). La façon dont le système interagit avec son environnement, ainsi que les propriétés fondamentales du système permettent d'établir une loi d'évolution du système dans cet espace des phases (un hamiltonien). Enfin la prise en compte des opérations de mesure permet de dériver des prédictions, c'est à dire des résultats de mesures (des valeurs pour les propriétés observables) indexées dans l'espace et le temps.

Bien sûr il s'agit là du cas idéal, et en pratique, les physiciens procèdent à de multiples idéalisations, hypothèses auxiliaires simplificatrices, ou techniques d'approximation mathématiques pour construire le modèle, si bien que souvent le modèle ne vérifie pas à strictement parler les axiomes de la théorie. Simplement on pense qu'il approxime un modèle qui, lui, vérifie ces axiomes.

Comment applique-t-on un modèle ?

Les propositions d'un langage doivent encore être utilisées en contexte : elles doivent être prononcées par un locuteur pour exister. De même les modèles théoriques doivent être appliqués à la réalité, dans un contexte expérimental.

Il peut s'agir de développer une technique, de comprendre le fonctionnement d'un système physique réel, de faire des prédictions, ou encore de simplement vérifier la théorie. Dans tous ces cas, utiliser un modèle en contexte nous demande d'associer chacun de ses éléments à des objets et propriétés de la réalité courante :

  • Identifier un type de système (des degrés de liberté, des propriétés fondamentales) et la façon dont il interagit avec son environnement à un objet ou dispositif expérimental réel (un canon à électron, un aimant), ce qui demande une connaissance préalable, éventuellement certaines mesures préparatoires (la valeur du champs électromagnétique) ou certaines connaissances spécifiques à un domaine (des lois d'observation).
  • Associer les structures cadre (la géométrie) à un référentiel arbitraire (le référentiel du laboratoire).
  • Associer les entrées physiques, les opérations de mesure et les résultats à des appareils de mesure, avec éventuellement une calibration ou des règles de traduction des résultats.

Les règles qui nous permettent de faire correspondre les modèles à la réalité expérimentale ne sont pas formelles et systématiques, mais tacites, techniques, pratiques. Elles peuvent évoluer sans qu'on pense que la théorie a changé (on construit de nouveaux appareils de mesure plus performant...). En outre ces règles utilisent un contenu mixte langage naturel / théorique. Pour ces différentes raisons, on peut avancer qu'elles sont externes à la théorie elle-même.

Quand est-ce qu'une théorie est empiriquement adéquate ?

Une fois qu'on dispose de ces moyens d'appliquer un modèle à un domaine de la réalité, nous sommes à même de comparer les prédictions du modèle et les résultats de mesure concrets obtenus.

L'adéquation empirique joue un rôle central en science. On peut dire qu'un modèle est empiriquement adéquat si chaque fois qu'il s'applique (ce qui dépend des règles du troisième niveau ci-dessus) il fait de bonnes prédictions. Bien sûr, les prédictions probabilistes peuvent demander une analyse plus fine, par exemple en terme statistiques, qui demande de procéder à une induction sur plusieurs expériences.

Si une expérience échoue, il n'est jamais nécessaire de remettre en cause la théorie elle-même : on peut aussi considérer qu'en fin de compte le modèle ne s'appliquait pas réellement à la situation (parce qu'un appareil de mesure est défectueux, parce qu'il manquait une hypothèse à notre modèle, un phénomène perturbateur inconnu...). C'est à dire qu'on peut toujours en principe mettre en cause l'étape consistant à mettre en relation un modèle et une situation concrète (le troisième niveau ci-dessus) plutôt que la théorie elle-même, voire modifier le modèle de manière ad-hoc pour qu'il corresponde à ce qui est observé.

Pour cette raison, et contrairement à une idée largement répandue, ce sont rarement les échecs prédictifs qui motivent les avancées théoriques, mais plutôt des questions purement conceptuelles (comme essayer de combiner plusieurs théories contradictoires s'appliquant à des domaines différents), même si les anomalies dans les prédictions peuvent être prises en compte dans ce processus.

L'adéquation empirique joue cependant plusieurs rôles. D'une part elle permet de confirmer ou d'infirmer les hypothèses ad-hoc qui font suite à une anomalie expérimental (par un jeu d'essai et d'erreur), ce qui peut amener à éliminer certaines anomalies et conforter d'autant plus la théorie dans son succès, ou au contraire rendre une anomalie persistante. D'autre part elle permet de confronter les nouvelles théories entrant sur le marché. Typiquement, celles-ci voudront faire de nouvelles prédictions différentes de la théorie bien établie pour une situation particulière. Enfin elle permet d'éprouver un modèle donné ou une famille de modèles en vue d'applications techniques, ou pour d'autres raisons.

On peut dire qu'une théorie est empiriquement adéquate (et donc mérite d'être bien établie) si tous ses modèles le sont.

Bien sûr nous sommes incapable de tester tous les modèles de la théorie. Cependant nous pouvons procéder à des inductions par généralisations successives : nous induisons sur les entrées physiques, les entrées opératoires, en faisant varier les dispositifs. Nous testons ainsi un modèle général (ou une classe de modèles) dont on peut affirmer qu'ils sont empiriquement adéquats. Enfin on peut également procéder par abstraction sur tous les types de modèles, en testant des configurations diverses. Ces inductions sont souvent utilisées pour résoudre les anomalies expérimentales, en testant les hypothèses ad-hoc dans différents cadres. Elles sont également réalisées quand on étend la théorie à de nouveaux domaines, qu'on conçoit de nouvelles expériences ou de nouvelles techniques. Ce sont elles qui confortent réellement la théorie.

En résumé, on peut dire qu'une théorie est empiriquement adéquate si quelque soient les entrées physiques et opératoires, et quelque soient les systèmes auxquels elle s'intéresse, ses modèles font de bonnes prédictions.

Qu'est-ce qu'une interprétation d'une théorie ?

On peut maintenant se demander ce que signifie interpréter (philosophiquement) une théorie. Il me semble qu'on puisse dégager des sens différents de l'interprétation suivant le niveau auquel on s'intéresse.

On pourrait d'abord penser (si on aime les sémantiques vérificationistes) qu'interpréter une théorie scientifique nous demande de nous intéresser uniquement au troisième niveau : comment le vocabulaire théorique est mis à contribution lors de la confrontation de la théorie à la réalité ? Comment se comporte-t-il en relation avec nos actions et notre langage naturel ?

En considérant tous ces éléments, a-t-on épuisé ce qu'il y a à dire sur l'interprétation ? Il est certain que la façon dont la théorie est utilisée en pratique permet au moins de fixer son domaine d'application. Mais un problème est que ce domaine est susceptible d'évoluer au fil des techniques sans qu'on pense que la théorie elle-même ait changée.

En outre, le discours scientifique ne se limite certainement pas à la vérification expérimentale, à la prédiction ou au développement de techniques. Il joue également un rôle descriptif, explicatif, nous permet de comprendre la nature de la réalité. C'est en tout cas ce qu'on pense si on est d'inclination réaliste (et par ailleurs le vérificationnisme a fait son temps : il existe de bons arguments en philosophie du langage pour nous en convaincre).

Même en considérant que nous nous leurrons quand nous prétendons expliquer la réalité, que nos représentations ne correspondent en rien à quelque chose d'extérieur mais son seulement des outils prédictifs, il faut bien admettre que le discours scientifique sert d'autres buts que la simple vérification expérimentale : il s'agit, également, de faire des inférences, d'émettre des hypothèses, de développer les théories en les appliquant à de nouveaux domaines, de construire de nouveaux modèles. Et ce discours est lui aussi couronné de succès.

On peut donc ici définir un premier sens d'interpréter, qui consiste à se questionner sur la fonction du discours scientifique en général (à tous les niveaux, et en particulier au niveau des modèles) : s'agit-il simplement de faire des prédictions, de développer des techniques ? De décrire des régularités dans les phénomènes ? Ou prétend-on décrire la nature fondamentale de la réalité ? Sa structure ? On peut parler d'interprétation sémantique.

Une fois la fonction du langage scientifique clarifiée, on peut se demander si cette fonction est réalisée avec succès et si on pense que c'est le cas, on pourra chercher à fournir une explication philosophique à ce succès. Alors on peut envisager un second sens d'interpréter : il s'agit de clarifier ce que la science nous apprend de la réalité et d'expliquer son succès en général, que ce soit sont succès empirique ou dans les inférences. On peut parler à ce propos d'interprétation épistémologique

Ce niveau d'interprétation permet de différencier instrumentalisme et réalisme. Il pourra mettre l'accent sur la vérification empirique, qui est en un sens la mesure ultime du succès de la science. Ici l'attitude réaliste consistera à penser que la science est couronnées de succès prédictif parce qu'elle décrit correctement la réalité, sous certains aspects (l'explication de son succès est réaliste), et le rôle de la métaphysique serait de clarifier ces aspects en proposant une ontologie.

Il en découle un troisième sens d'interpréter qui est spécifique au réalisme : associer le contenu théorique (celui du premier niveau théorique) à une ontologie qui correspond au contenu des théories, c'est à dire, en gros, de clarifier ce que représentent le formalisme, les axiomes ou le vocabulaire de la théorie dans la réalité. On peut parler d'interprétation métaphysique.

Suivant ce dernier sens d'interprétation, il nous faudra considérer la vérification, qui permet en effet de fixer le domaine d'application de la théorie, et les modèles qui nous indiquent comment les concepts scientifiques sont mis en oeuvre, mais c'est surtout le contenu théorique général (le vocabulaire, les structures et les axiomes) qui nous intéressera.

Les différentes interprétations contemporaines

C'est dans ce troisième sens qu'on trouve la plupart des interprétations contemporaines en métaphysique. On peut les distinguer en reprenant les trois aspects du niveau théorique ci-dessus :

Le vocabulaire théorique
S'agit-il de propriétés fondamentales ? d'universaux ? de tropes ? de bundles de dispositions ? Ces propriétés sont-elles possédées par des objets, des événements, des processus, ou par une substance ? Ou ne sont-elles que des supports heuristiques pour nos raisonnements, les noeuds d'une structure théorique ?
Les structures formelles
Sont-elles des structures primitives de la réalité ? Des objets mathématiques existant de manière abstraite ? Ou simplement le réseau des relations entre les autres éléments ?
Les axiomes
Correspondent-ils à des lois de la nature primitives ? A la description de dispositions ou de rapports causaux instanciés dans la nature ? A des structures modales ? Des relations entre universaux ? Ou simplement à la description de régularités dans les phénomènes ? Ou encore, des possibilités d'inférence relatives à des agents possédant une connaissance incomplète du monde ?

Le fait est que les théories scientifiques elles-même ne nous indiquent pas quelle ontologie adopter, et en fin de compte, il se peut que nous devions nous reporter de nouveau à la façon dont les modèles théoriques sont utilisés et confrontés à la réalité pour obtenir une réponse. Mais l'inconvénient de l'attitude réaliste est qu'elle ne fournit pas de critères précis pour juger d'une bonne ontologie.

mercredi 22 juillet 2015

Monisme neutre et physique relationnelle

La physicalisme
est l'idée que le mental se réduit (survient, est déterminé par...) le physique (le physique est primitif).
L'idéalisme
est l'idée que le physique se réduit au mental (le mental est primitif).
Le dualisme
est l'idée que ni le mental ni le physique ne se réduisent l'un à l'autre (le mental et le physique sont tous deux primitifs).
Le monisme neutre
est l'idée que le mental et le physique se réduisent tous deux à une substance neutre (ni le mental ni le physique ne sont primitifs).

J'ai expliqué dans un article récent que pour moi la controverse sur le physicalisme est une querelle de langage. Qu'appelle-t-on physique ? Si on en a une définition assez large, le physicalisme est trivialement vrai. Si on en a une plus positive, il est faux, mais de toute façon le contenu de la physique n'est peut-être pas physique.

Par querelle de langage, j'entends une querelle qui peut être réglée par un choix conventionnel : mettons nous d'accord sur une définition de physique. Enfin, les choix sémantiques ne sont jamais de purs conventions arbitraires, et je pense qu'il existe une bonne façon de régler la querelle qui est de donner à "physique" une définition plutôt restrictive, quit à se mettre en porte-à-faux avec la physique contemporaine.

Cette définition devrait comporter des choses comme : un aspect méréologique / réductionniste (la possibilité d'agencements structuraux de parties en un tout qui n'est rien de plus que l'agencement de ces parties) et surtout un aspect objectif ou intersubjectif : les propriétés physiques sont robustes aux variations de point de vue. On pourrait vouloir y ajouter un aspect causal et une référence à l'espace-temps mais on risque de se prononcer sur des aspects métaphysiques qui ne vont pas de soi (je pencherai personnellement pour une réduction de l'espace-temps à la structure causale du physique, donc définir le physique comme quelque chose qui a un pouvoir causal, sans faire référence à l'espace-temps, mais tout le monde ne serait pas d'accord) et donc je pense qu'il faut rester neutre à ce sujet.

Le choix qui me semble judicieux est donc : adopter une définition a priori, assez stricte du physique, de laquelle on peut déduire que le physicalisme est faux par un argument à la Chalmers, mais aussi, plus directement, à partir de la physique puisque les entités de la physique ne sont (paradoxalement) pas physiques en ce sens.

Il peut paraître étrange d'opter pour une définition du physique que ne respectent même pas forcément les entités de la physique fondamentale. Pour moi ça ne pose pas de problème, parce que la physique ne respecte pas cette définition que dans la mesure où elle pose des problèmes d'interprétations. Chaque fois qu'on tente d'interpréter la physique quantique de manière réaliste, en la complétant de variables cachées ou de dynamiques de projections, on vise à restaurer plus ou moins ces aspects, en particulier l'objectivité. Ceci montre donc que ces aspects sont important, et ça justifie de les prendre en compte dans notre définition de ce qui est physique.

Une autre raison pour laquelle ce n'est pas selon moi un problème est que ce n'est pas parce que les entités de la physique fondamentale ne sont pas physiques en ce sens que rien n'est physique. On peut dire que "l'image manifeste du monde" est supportée par des choses physiques : objectives, structurées méréologiquement. C'est même ce qu'on entend par physique au sens courant. Or d'un point de vue réaliste, une théorie physique doit pouvoir faire le lien avec l'image manifeste du monde, expliquer comment celle-ci émerge de l'ontologie que cette théorie nous propose, et donc même si on considère que les entités de la physique ne sont pas physiques en ce sens, on doit accepter que quelque chose de physique en résulte (au moins approximativement).

Et c'est ici qu'apparaît le point le plus intéressant de cette option purement sémantique, qui est qu'elle ouvre la porte à ce qui serait un monisme neutre, à savoir l'idée que ce qui est physique émerge en fait d'un substrat neutre, qui est celui décrit par la physique.

Bien sûr ce choix sémantique ne force rien. Si l'on fait une petite cartographie des options, on arrive à ceci :

  • Soit on interprète la physique quantique de manière réaliste (on complète la mécanique quantique) et le physique est primitif.
    • Si on pense que le mental est aussi primitif, on est dualiste (D).
    • Sinon on est physicaliste (P).
  • Soit on interprète la physique quantique de manière non réaliste. Le physique n'est pas primitif mais émerge à la limite quantique / classique.
    • soit la physique quantique décrit un contenu mental. On est idéaliste (I).
    • soit la physique quantique décrit un contenu ni mental, ni physique, mais neutre (duquel émerge au moins le physique).
      • soit le mental se réduit au physique. On a toujours une forme de physicaliste car le physique est premier par rapport au mental (même si le physique n'est pas "vraiment" primitif, mais ça reste exotique) (P*)
      • soit le mental est primitif. On a toujours une forme de dualisme, même si le physique n'est pas "vraiment" primitif (D*).
      • soit le mental se réduit à ce substrat neutre. On adopte un monisme neutre (N).

Remarque : les options D* et P* sont un peu "batarde" dans la mesure où on a un substrat non physique, mais qui ne fait rien d'autre que fonder le physique. Disons que dans ces cas là mon choix sémantique s'avérerait peu judicieux, et qu'en fin de compte il serait peut-être préférable de qualifier de "physique" le contenu de la physique, même si celui-ci ne répond pas tout à fait à notre définition a priori.

On voit au passage que la question du réalisme scientifique (la science décrit-elle ce qui est indépendant de l'esprit ?) rejoint celle du rapport physique / mental, dont elle n'est que l'autre face en un sens. Ce qui se dégage, ce sont des "packages métaphysiques" cohérents qui combinent une interprétation du contenu de la physique contemporaine et une position en philosophie de l'esprit.

Afin de savoir où exactement situer ces packages il faut se mettre d'accord sur une définition de "mental". Je propose de parler de mental à propos de ce qui est relatif à un sujet cognitif (non robuste suivant les changements de point de vue). Les interprétations réalistes peuvent soutenir à priori (D) ou (P). Je classerai alors les interprétations type bayesianisme quantique en (I), puisque la physique porte selon eux sur des informations relatives à des agents. Je classerai les interprétations relationnelles en (N), dans la mesure où la physique décrit la relation entre un observateur et un système observé, mais sans que "observateur" face nécessairement référence à un sujet cognitif, puisque ce peut être n'importe quel système physique.

Pour ma part le "package" que je défend, c'est une physique relationnelle et un monisme neutre. Selon la physique relationnelle il n'existe aucun point de vue de nulle-part (un état physique est relatif à une perspective). Le contenu de la physique est donc bien neutre, mais des états objectifs robustes émergent notamment si on prend en compte la décohérence. De plus si les sujets cognitifs sont eux-même émergent (ce qui nécessite une mémoire, etc) on a alors également une émergence du mental, pour peu qu'un contenu macroscopique puisse être relatif à un système observateur macroscopique (ce qui est controversé).

Cette vision des choses est intéressante car elle permet de rendre compte de la causalité mental - physique et physique -mental : c'est l'intrication qui est responsable de la seconde, la décohérence de la première. On résout ainsi le dilemme de la causalité mentale.

Monisme modal et pragmatisme

Depuis Kripke on parle frequemment de modalités métaphysiques, celles-ci étant intermédiaire entre les modalités logiques (ce qui est logiquement nécessaire ou non, associé à nos définitions linguistiques) et les modalités physiques (ce qui est physiquement nécessaire ou non, associé aux lois de la nature).

Les modalités métaphysiques correspondent à ce qui est nécessaire en vertu de l'essence des choses, de leur nature métaphysique, de leur identité. Par exemple l'eau est nécessairement le composé de structure moléculaire H2O, la chaleur est nécessairement de l'agitation moléculaire, etc. Il ne s'agit pas à proprement parler d'une nécessité qui dériverait d'une loi physique, ni non plus d'une nécessité de l'ordre de la convention linguistique puisqu'on parlait d'eau et de chaleur avant la science moderne. C'est quelque chose d'intermédiaire entre les deux.

Il existe certaines tentatives pour ramener les modalités métaphysiques à des modalités purement logiques ou de l'ordre de la convention linguistique. Si c'est la définition de l'eau que d'être le composé de structure H2O, en effet c'est une nécessité mais il n'y a rien de bien métaphysique la dedans. Certes on utilisait le terme "eau" avant de connaître sa constitution moléculaire, mais la nécessité de cette constitution pourrait être déduite d'un fait (que ce qu'on appelle l'eau est de structure H2O) et d'une convention linguistique (que les constitutions chimiques sont possédées nécessairement), comme le propose Sidelle.

Une alternative serait de s'inspirer de Laporte et d'affirmer que "eau" peut changer de signification au cours de l'histoire, et en particulier voir sa signification devenir plus précise, si bien que ce qu'on appelait "eau" avant la chimie moderne n'est pas exactement ce qu'on appelle "eau" aujourd'hui. J'avoue trouver cette approche convaincante. Dans ce cas on peut défendre que le fait que l'eau est nécessairement H2O est simplement une question de définition linguistique, puisque c'est ainsi qu'on définit l'eau aujourd'hui. Ceci n'exclut pas l'approche de Sidelle, puiqu'il est possible que certaines conventions nous poussent à définir les termes en fonction de leur structure moléculaire plutôt que par leurs apparences.

Il existe par ailleurs des tentatives pour assimiler les nécessités physiques et métaphysiques. C'est ce qu'on appelle le dispositionnalisme. Il s'agit de concevoir les lois de la nature comme ne faisant rien d'autre que de décrire le profil causal de propriétés physiques, par exemple : la charge électrique n'est rien d'autre que la propension à attirer d'autres charges, il s'agit de son essence. Les axiomes de l'électromagnétismes devraient en fait s'interpréter comme des définitions implicites de ce qu'est une charge électrique, un champs électromagnétique, etc.

Si tel est le cas il n'y a pas de différence entre les nécessités physiques et métaphysiques, qui relèvent tout deux d'une question d'essence. Les lois physiques sont métaphysiquement nécessaires, en vertu de la nature du monde. La vitesse de la lumière n'aurait pas pu être différente (sinon ç'aurait été autre chose que "notre" lumière) etc.

Le dispositionnalisme est intéressant : il permet d'éviter d'introduire des propriétés catégoriques, ou des universaux un peu mystérieux. Il rend compte de la causalité et de son rapport aux lois sans peine, en plaçant la causalité au niveau fondamental de la réalité plutôt qu'en cherchant à la dériver des lois, ou d'autres choses (ce qui est un véritable casse tête). De nouveau je suis assez convaincu.

Et là peut être me voyez vous venir. Si je suis convaincu que les modalités physiques et métaphysiques sont indistinctes, et que ces dernières sont également indistinctes de modalités logiques ou linguistiques, alors je dois penser que les modalités physiques, associées aux lois de la nature, sont de pures conventions linguistiques : on a choisi d'appeler "charge" ce type de propriété qui fait qu'un objet qui la possède attire les autres qui la possèdent également, et donc la nécessité qui fait que les aimants s'attirent est purement a priori, dans le langage.

En effet c'est exactement ce que j'affirme. Mais il n'y a rien d'incompatible, je pense, à défendre cette position (qui est un monisme modal) est à affirmer qu'il existe une nécessité dans la nature.

Bien sûr que les aimants s'attire qu'on le veuille ou non, qu'on les appelle aimant ou non. Ce n'est pas notre langage qui les fait s'attirer. Tout ce que fait notre langage, c'est décrire ces rapports de nécessité. Mais si notre langage décrit correctement le monde, si en effet nos concepts s'appliquent à la réalité, alors les rapports de nécessité associés à ces concepts doivent refléter les rapports de la nécessité qui existent dans le monde. Notre langage, notre schème conceptuel, se construit en mirroir du monde.

On peut donc être à la fois moniste modal est réaliste modal si on pense que nos conventions linguistiques et conceptuelles ont pour objet de refléter la structure modale du monde. .

En un sens il s'agit de prendre au sérieux la thèse de Quine, suivant laquelle il n'existe pas de moyen de distinguer clairement les aspects linguistiques et factuels du langage, ou les énoncés analytiques et synthétiques. Si on applique la thèse de Quine à la nécessité, on aboutit à la conclusion qu'il n'existe pas de distinction entre la nécessité synthétique, factuelle, c'est à dire les rapports de nécessité dans le monde, et la nécessité linguistique, relevant de conventions. On aboutit exactement au monisme modal défendu ici.

Certes Quine était sceptique à propos de la notion de signification, et de celle de nécessité, mais nous ne sommes pas obligé de le suivre sur ce point. S'il n'y a pas de distinction analytique / synthétique, on peut aussi en déduire que nos significations elles-même, et les rapports de nécessité associés, sont l'objet de découvertes empiriques, ou d'un ajustement pragmatique lors de la confrontation avec la réalité. En un sens on fait ainsi la synthèse de Quine et de Kripke.

Quine était empiriste, d'où son scepticisme sur la nécessité. Il a intégré certains éléments de pragmatisme avec cette absence de distinction analytique / synthétique et le holisme de la confirmation. Les pragmatistes, comme Peirce, n'étaient pas sceptiques vis à vis de la nécessité naturelle. Ils affirmaient que nous devrions comprendre nos concepts par leurs effets causaux concevables (possibles), ce qui est à la fois proche du dispositionnalisme et du conventionnalisme. Le monisme modal que je propose est donc un pas vers le pragmatisme.

mardi 21 juillet 2015

Zombies

Chalmers attaque le physicalisme sur la base d'un argument invoquant des "zombies phénoménaux" : des êtres qui ont toutes les apparences extérieurs d'un être humain (même comportement, etc.) mais pourtant ne sont pas conscients. Si les zombies sont possibles, alors la constitution physique ne suffit pas à nous rendre conscient.

On critique a juste titre le passage de la concevabilité à la possibilité. Les zombies sont concevables, mais pas nécessairement possibles. On peut, pour critiquer ce passage, faire appel à la notion de nécessité a posteriori. Selon Kripke on peut décourvrir a posteriori des nécessités (par exemple quand on découvre la constitution chimique de l'eau, on découvre que nécessairement, l'eau est H2O et qu'il n'aurait pas pu en être autrement puisque c'est sa nature).

Si en effet toute nécessité provient du langage, alors on sait ce qui est possible a priori : c'est ce qui n'est pas impossible (ou pas nécessairement pas le cas). Mais si les nécessités peuvent être l'objet d'une découverte empirique, ce type de découverte peut nous amener à revoir comme impossible ce qu'on croyait possible.

Cependant la notion de nécessité a posteriori va de pair avec celle de référence directe : l'idée que l'eau est nécessairement H2O, bien qu'on l'ignore a priori suppose que le terme "eau" fait directement référence à une entité du monde à laquelle nous sommes causalement relié, mais dont nous ignorons éventuellement la nature. Cette nature est justement l'objet d'une découverte empirique.

Dans le cas des zombies, la nature fondamentale dont il est question est celle du physique. Peut-être découvrira-t-on empiriquement que nécessairement, le physique produit certains aspects qualitatifs, en tout cas ce peut être le cas, et alors les zombies seraient impossibles.

Alors l'objection à l'argument de Chalmers repose sur une certaine conception de "physique" qui suppose implicitement que "physique" serait un terme de sorte naturelle, une catégorie à laquelle nous sommes causalement reliée, et dont la nature profonde pourrait être élucidée, ou pas. Ca suppose que notre définition actuelle de ce qui est physique repose en partie sur des éléments démonstratifs : "ceci", ou encore "ce qui cause toutes ces manifestations".

Mais "physique" peut-il être un terme de classe naturelle ? Pour le dualiste peut-être, mais pour le physicaliste, c'est douteux : une classe qui comprend tout ce qui existe n'est pas vraiment une classe... De quelle subdivision parle-t-on ? Si on fait référence à une classe par ses manifestations spécifiques, c'est bien en la contrastant à d'autres choses. Et s'il s'agit vraiment de la classe de tout ce qui existe dont on espère découvrir la nature par les sciences physiques (ou peut-être de tout ce qui est fondamental par opposition à ce qui est composite ou dérivé), on risque d'aboutir à une définition triviale de "physique", par exemple : ce dont est constitué tout ce qui existe (et puisqu'évidemment nos expériences qualitatives existent, elles sont physiques n'est-ce pas ?).

Le problème c'est que c'est le physicaliste lui-même qui a besoin d'argumenter en faveur de l'idée qu'on puisse découvrir des nécessité a posteriori sur le physique, et donc que "physique" ne soit pas défini a priori, mais par ostentation de certaines manifestations. Mais si ces manifestations sont toutes les manifestations, alors le physicalisme devient trivialement vrai, par définition. Si ce n'est pas le cas, il devient faux.

Il existe peut-être une porte de sortie : adopter un physicalisme non réductionnisme, pointer du doigt certaines manifestations (celles des expériences physiques) comme fondant toutes les autres. Mais un autre risque est alors que ce terme de sorte naturel soit abandonné à l'avenir, comme le fut par exemple le flux calorique censé désigner ce qui est responsable des phénomènes thermiques. De même ce qu'on considère comme responsable des manifestations de la physique pourrait ne plus être considéré comme une véritable sorte naturelle à l'avenir.

Absurde ? Pas tant que ça quand on y pense : on a bien renommé le materialisme en physicalisme, parce que le terme de "matière" ne veut plus dire grand chose en physique fondamentale contemporaine, ou en tout cas ne veut plus dire "tout ce qui existe" ni ne fait référence à une sorte puisque la matière est convertible en énergie, voire est vue comme énergie par certains observateurs et comme matière par d'autres (d'après la relativité).

Donc hier on parlait de matérialisme, aujourd'hui nous parlons de physicalisme. Et demain, de quoi parlerons nous ? Et est-ce que ce physicalisme du futur sera encore suffisamment distinct de ses concurrents (notamment le panpsychisme) ?

Tout ça pour dire qu'à mon avis on a affaire à un faux débat (même si parfois de vrais questions, plus spécifiques, y sont débattues). Si on se donne une définition a priori de "physique" (par exemple une structure méréologique de propriétés objectives localisée dans l'espace temps), alors l'argument de Chalmers semble fonctionner et le physicalisme est faux, mais au fond il est très probable que rien ne soit vraiment physique dans ce bas monde (les aspects de la définition que j'ai proposée étant déjà tous mis à mal par la physique contemporaine). Si on s'en donne une définition a posteriori, susceptible d'évoluer avec notre connaissance du monde, alors l'argument de Chalmers échoue puisqu'on ne sait pas ce qui est possible ou non du physique. Mais une telle définition risque de rendre le physicalisme trivialement vrai et sans intérêt si on s'autorise à arranger la définition de physique pour y intégrer tout ce qu'on découvre du monde.

Il existe peut-être un juste milieu entre ces deux extrêmes, une définition un peu souple mais pas trop, avec quelques éléments a priori suffisamment contraignant pour avoir une position physicaliste consistante, distincte de ses concurrentes et compatible avec la physique contemporaine, tout en laissant suffisamment d'ouverture quant à la nature fondamentale du physique pour réfuter l'argument de Chalmers et supporter les changements théoriques à venir.

Personnellement je doute qu'une telle définition existe, et en son absence, tout ceci me semble relever de la querelle sémantique.

lundi 23 mars 2015

Une petite théorie politique

Pour changer un peu de la philo des sciences, et suite à ces élections qui semblent n'être que le nouvel épisode d'un éternel recommencement, je vous propose mes deux francs six sous de théorie politique.

Alors non, je ne suis pas spécialiste. D'habitude je m'intéresse plutôt à la physique quantique. Vous savez, cette théorie qui donne lieu à tant d'extrapolations fumeuses... Enfin, puisqu'on en n'est pas à une extrapolation fumeuse près, je me suis dit que peut-être on pouvait faire une vague analogie entre la physique quantique et le paysage politique de nos démocraties.

vendredi 6 mars 2015

Peut-on être réaliste et empiriste ?

Rappelons les termes du débat sur le réalisme scientifique. L'empiriste pense que toute connaissance doit être issue de l'expérience. Le problème est que le réalisme scientifique, qui postule que a réalité est correctement décrite par nos théories, est une thèse métaphysique. Or une thèse métaphysique, portant sur la nature fondamentale du monde, ne peut être fondée sur l'expérience uniquement. Elle nous demande d'aller au delà, de recourir à des intuitions, dont il est douteux, pour l'empiriste, qu'elles soient fiables. Ainsi l'empiriste entretiendra une suspicion à l'égard de toute hypothèse qui ferait plus qu'enregistrer des régularités vis-à-vis de ce qui est observable. Il doutera : des essences (des propriétés possédées nécessairement par les objets et qui en déterminent la nature), des rapports de causalité qui supposent une nécessité dans le monde, ou de l'existence de propriétés, relations ou objets inobservables en général. Tout ce que nous devons accepter des sciences, ce sont leurs conséquences observables.

vendredi 27 février 2015

Pragmatisme et réfutabilité

Dans le dernier billet j'ai défendu une interprétation pragmatiste du contenu des théories scientifiques : les énoncés théoriques devraient être interprétées en terme de fonctions possibles, et une théorie est vraie dans la mesure où elle est à même de réaliser toutes les fonctions qu'on peut lui assigner. Aujourd'hui je souhaite faire le lien avec d'autres théories de la signification.

vendredi 20 février 2015

L'interprétation pragmatiste des théories scientifiques

Je viens de lire "Philosophie du langage (et de l'esprit)" de François Recanati.

L'ouvrage est intéressant et offre un panorama assez large de la philosophie du langage. Il revient d'abord sur les concepts classiques de la discipline, en particulier les notion de sens, de référence, d'intension, d'extension, de désignation, de dénotation, de connotation, et j'en passe, telles qu'elles ont été envisagées par différents auteurs (Mill, Frege, Carnap, Kaplan...). Il aborde ensuite d'autres perspectives, notamment la sémantique pragmatique et les rapports entre représentation linguistique et représentation mentale. C'est à la fois une bonne introduction générale à la philosophie du langage et une bonne présentation des thèses de l'auteur.

Mais mon but n'est pas ici de proposer une revue de ce livre. Je vais plutôt résumer quelques aspects d'intérêt, sans m'en tenir nécessairement au contenu du livre, avant d'aborder la manière dont la sémantique pragmatique pourrait être appliquée en philosophie des sciences.