Affichage des articles dont le libellé est affichage des données. Afficher tous les articles
Affichage des articles dont le libellé est affichage des données. Afficher tous les articles

mercredi 14 juillet 2021

Le gros avant le détail !

Quand il est question d'analyse chimique, il y a deux idées essentielles à bien appliquer en priorité.

D'une part, il ne faut surtout pas regarder d'abord l'écorce de l'arbre  sur laquelle on a le nez, sans quoi on ne voit pas que l'on est devant une forêt.
 

Deuxièmement, il ne faut pas oublier, pour commencer, qu'une feuille de papier rectangulaire à laquelle on a arraché un petit coin est d'abord rectangulaire.

 

Les erreurs qui résultent de l'oubli de ces deux règles s'observent constamment, et notamment dès que des comparaisons de valeurs sont en jeu. Et cela se retrouve en relation avec des questions diverses, telles que les calculs d'incertitudes, les affichages de résultats...

Par exemple, supposons que l'on ait obtenu des mesuré une grandeur (concentrations, masse, etc.)  et obtenu des résultats 1251, 1253, 1249.
J'insiste un peu : il se peut que ces valeurs aient été obtenues après un long processus de préparation d'expérience, de préparation d'échantillons, d'analyse... On est souvent ahuri des détails indispensables à un travail soigneux, et les données s'accumulent en grand nombre. On a le nez sur ces mille détails.

Et c'est là, souvent, que l'on trébuche, notamment parce que les outils que l'on utilise ne font pas toujours les choses aussi intelligemment que l'on voudrait.
Par exemple, si l'on affiche sans précautions les trois valeurs précédentes, on obtient :
with(plots);
with(plottools);
pointplot({[1, 1251], [2, 1253], [3, 1249]});



Ici, les points n'apparaissent pas, mais il n'est pas difficile de les grossir :
pointplot({[1, 1251], [2, 1253], [3, 1249]}, symbol = cross, symbolsize = 50, color = blue);



Et c'est là que l'on est trompé : sur cette représentation, les trois mesures sont très différentes ! Mais nous avons le nez sur l'écorce de l'arbre, et nous avons oublié le premier précepte, à savoir qu'il faut regarder la forêt avant l'écorce, ce que l'on dit en alsacien s'Dicka vor dKleinigkeit. En l'occurrence, le logiciel a recadré automatiquement autour des données, au lieu de donner une vision globale. Demandons-lui (gentiment, c'est-à-dire en utilisant son langage) de faire l'affichage complet :
pointplot({[1, 1251], [2, 1253], [3, 1249]}, view = [0 .. 5, 0 .. 1500], color = blue, symbol = soliddiamond, symbolsize = 40);





Cette fois, on voit bien mieux que les différences sont quand même très faibles !

Mais à ce "très faibles", il y a lieu de s'alerter un peu, parce que nous avons empilé un adjectif sur un adverbe, et les sciences de la nature refusent cet usage : nous devons dire combien... et cette règle de bonne pratique est bienvenue, parce que, quand on compare des valeurs, il y a lieu de prendre en compte leurs incertitudes. Or ici, la taille des symboles utilisés pour la représentation est arbitraire. Il faut donc faire des répétitions, calculer des écarts-types, ou utiliser les incertitudes des instruments de mesure.
Et, dans le cas considéré, si l'incertitude est de 1 %, par exemple, alors les différences ne sont pas significatives (OK, il faudrait dire cela mieux, d'un point de vue statistique) !

Cela, c'est pour la première idée... mais on voit que la seconde idée va dans le même sens : le gros avant le détail.