Hervé This: représentations

Affichage des articles dont le libellé est représentations. Afficher tous les articles

mercredi 5 octobre 2022

Et encore à propos de représentations 4/3

Dans un billet précédent à propos de représentations, et, en particulier, d'images calculées par ordinateur, j'avais alerté sur le fait qu'un objet représenté peut très bien ne pas exister, tout comme il ne suffit pas de dire "Père Noël" pour que celui-ci existe vraiment.

Ici je veux insister un peu parce qu'il y a là quelque chose de d'utile, chaque fois que nous regardons des images.

Commençons par l'affaire du Père Noël. Une dénomination, c'est un ensemble de lettres, et ces lettres peuvent être trompeuses quand elles s'assemblent pour faire le mot "père", tout d'abord, puis pour faire le mot "Noël", et, enfin, pour faire l'ensemble "Père Noël".
Bien sûr, il existe des pères ; bien sûr, Noël est quelque chose de réel. Mais le Père Noël n'existe pas, et l'utilisation de deux mots qui renvoient à des objets réels est à l'origine de la tromperie.

Ici, ce sont les mots qui ont trompé, mais les images font de même, tout comme les diverses autres sensations.

Pour les sensations, considérons par exemple un ensemble de molécules qui reproduirait l'odeur d'une truffe : un chien ou un cochon iraient vers l'origine de l'émission d'odorants, croyant à la présence d'une truffe... qui pourtant n'existe pas.

Pour un son, de même, un chat pourrait chercher à chasser un oiseau qui ne serait pas présent, si l'on émettait un enregistrement de chant d'oiseau.

Les data gloves, qui sont des gants muni de capteurs de pression, permettent d'entrer dans un monde virtuel qui peut-être utile par exemple pour l'enseignement de la chimie : on peut "sentir" des forces entre des atomes ou des molécules alors que ceux-ci sont absents, et seulement ne sont représentés sur des lunettes spéciales.

Sons, odeurs... Pour les images et des films calculés par ordinateur il en va de même et il faut être bien naïf pour croire à l'existence d'objet représentés, alors qu'en réalité des pixels colorés ont été assemblés par un ordinateur, sous la commande de celui ou de celle qui savait déposer les pixels au bon endroit.

Dans nos études scientifiques, une image est une représentation, donc une interprétation et je viens encore d'en avoir un exemple avec un article consacré aux gels : il y avait des images de microscopie à force atomique, pour lesquelles j'ai dit précédemment qu'il fallait les interpréter, car on ne voyait en réalité, sous forme d'image, que l'interaction d'une pointe mobile avec la surface d'un échantillon.

Mais ce n'est pas ici le point qui me retient: je veux surtout signaler qu'une de ces images était associée à un schéma qui semblait d'un réalisme parfait : on avait l'impression de voir des atomes, avec des distances, des angles, des volumes. Mais qui dit distance, qui dit volume dit codage de l'image à partir d'informations... venues d'où ?Obtenues comment ?

Les images scientifiques sont particulièrement trompeuses parce qu'elles sont fondées sur des mesures innombrables, interprétées, et interprétées à l'aide d'interprétations, qui, elles-mêmes, résultent d'interprétations, et ainsi de suite.

Il y a donc lieu d'être particulièrement prudent et, peut-être, de préférer un schéma manifestement faux à une image trop réaliste et donc trop trompeuse.

Mais, inversement ta gueule on aurait évidemment tort de se priver d'une représentation que nous maîtrisons et qui nous conduit à nous poser des questions : des questions précisément relatives à l'interprétation, à sa nécessaire amélioration.

Il faut donc douter et douter encore jusqu'à savoir ce que l'on voit, à juger de degré de confiance que l'on décide d'accorder, à l'issue d'un long chemin de renseignements pris sur l'image que nous contemplons.

Et c'est ainsi que la science est belle !

jeudi 11 mars 2021

La représentation des données

Des amis en stage m'interrogent sur la représentation des données, puisqu'ils en sont à ce stade de leur travail de recherche. Doivent-ils faire des courbes ? des histogrammes ? quels textes faut-il porter sur les images ? de quelles couleurs ? dans quelle taille ?

La première réponse à faire, la plus importante, c'est celle de l'objectif : toujours commencer par l'objectif ! Que veut-on faire et pourquoi ?

Et, d'autre part, quand il est question de communication (à soi-même ou aux autres), je ne saurais trop conseiller de distinguer la composante intrinsèque de la question, de la question extrinsèque et des questions concomitantes.
J'explique en prenant une comparaison (utile par ailleurs) : l'intérêt intrinsèque d'une profession, c'est combien l'exercice de ce métier nous intéresse ; l'intérêt extrinsèque, c'est de savoir combien on va gagner ; et l'intérêt concomitant, c'est par exemple la reconnaissance sociale. A vous de transposer, maintenant, en revenant à la question des affichages de données ;-).

Ca y est ? Non ? Alors je vous invite à chercher d'abord pourquoi on affiche des données. Et cela nous impose de nous remettre dans le fil de la recherche scientifique : cette recherche consiste à suivre des étapes qui sont :
1. identifier un phénomène
2. le caractériser quantitativement
3. réunir les données en "lois", c'est-à-dire en équations
4. induire une théorie, quantitativement compatibles avec les lois, et en introduisant des concepts nouveaux
5. chercher des conséquences logiques, testables, de la théorie
6. tester expérimentalement ces prévisions théoriques.

Ici, nous en sommes au point (3), à savoir que nous avons des données, et nous voulons des équations.

Et c'est un fait que, de surcroît, on se repère très difficilement dans d'immenses tableaux de nombres (les résultats des mesures de caractérisations quantitatives).

Autrement dit, ce que l'on voudrait, avec cet affichage, c'est avoir une idée de la formes des équations : proportionnalité, augmentation exponentielle, que sais-je.

Et évidemment, pour cette recherche, il y a lieu de faire des représentations les plus simples possibles.
Notamment des représentations dans un espace à deux dimensions (ce qui est une "coupe" d'un espace qui aurait possiblement plus de dimensions).

Par exemple, considérons une série de spectres d'absorption UV-visible : là, les données sont des courbes... et s'il a plusieurs courbes, on peut les superposer, et regarder l'ordonnée des diverses courbes a une valeur particulière de l'abscisse (une longueur d'onde particulière, choisie pour de vraies raisons scientifiques).
On peut aussi -mais c'est plus compliqué- dessiner une sorte de paysages, avec toutes les courbes, car si ces courbes s'ordonnent, pourquoi ne pas les faire apparaître comme des coupes de l'espace ?
Après tout, les deux dimensions de l'espace des courbes, plus une dimension pour la succession des courbes, cela fait trois dimensions, n'est-ce pas ?

Ou encore, imaginons que l'on ait des données colorimétriques, par exemple dans un espace nommé L*a*b*. Pour cette mesure, on a des triplets de points, c'est-à-dire en réalité des points dans un espace à trois dimensions. Si l'on a plusieurs mesures, on aura plusieurs points dans cet espace. Comment représenter s'il y a un ordre pour les points ? Car ici, il faudrait un espace à quatre dimensions ? Une couleur peut être ajoutée, par exemple.

Et ainsi de suite : ce que l'on cherche à ce stade, ce n'est pas d'épater la galerie, de faire du "beau", de l'extrinsèque, mais de l'intrinsèque, de l'efficace du point de vue de la production scientifique.

C'est seulement plus tard, quand le travail scientifique aura été fait, que l'on pourra se préoccuper de produire de belles représentations. Là, tel le génial mathématicien Carl Friedrich Gauss, on pourra effacer les traces de ses propres hésitations, et afficher un travail d'orfèvre, superbe, ciselé... mais cela ne doit venir que quand le contenu aura été parfaitement déterminé : on ne peut pas mettre des habits mêmes superbes sur un corps inexistant.

D'abord le message, le contenu, avant sa forme.

PS. Connaissez vous le livre The quantitative display of scientific information ?