Oui, il est important pour la recherche scientifique d'explorer les mécanismes des phénomènes : c'est même là l'objectif des sciences de la nature. Et bien sûr, il y a une question relative à la causalité dans cette affaire et de possible confusion entre causalité et corrélation.
Par exemple, il est vrai qu'après la Seconde Guerre mondiale, le nombre de cigognes a augmenté en Alsace en même temps que la natalité humaine, mais l'un n'est pas la cause de l'autre, ni l'autre de l'un : il y a seulement une corrélation.
La question de la causalité a été largement explorée par Émile Meyerson dans son livre Du cheminement de la pensée, où il discute ce paradoxe de la causalité en partant du fait qu'il avait raté son train. S'il avait raté son train, c'est qu'il s'était levé trop tard ; et il s'était levé trop tard, c'est que son réveil n'avait pas sonné ; si si son réveil n'avait pas sonné, c'est parce que le fabricant l'avait mal conçu ; mais si le fabricant... et ainsi de suite jusqu'à la perte de la bataille d'Alésia par Vercingétorix. Bref, si j'ai raté mon train c'est à cause de Vercingétorix qui a perdu contre les Romains à Alésia.
Je ne résumerai pas ici en un petit billet une longue discussion, mais j'invite tous mes amis à aller lire ce livre étonnant, plein d'énergie.
Comment faut-il évoquer cette question dans l'Education nationale ?
On se souvient que l'école a déjà beaucoup à faire, à enseigner à lire, écrire, compter, mais on peut espérer aussi combattre la pensée magique : ce n'est pas un dieu nommé Zeus qui, du haut de l'Olympe, envoie la foudre par temps d'orage !
Je n'exagère pas en évoquant les dieux, car la pensée magique est beaucoup trop répandue, propagée notamment par les anti-vaccins et par ceux qui croient que la Terre est plate, sans parler des thuriféraires de l'homéopathie, de la naturopathie, des massages auditifs, et de bien d'autres ésotérismes venus souvent d'Asie : comme disait Cyrano de Bergerac, le vrai personnage qui a vraiment existé, "à beau mentir qui vient de loin et je n'ai pas entendu d'histoire de sorcier qui n'ait eu lieu à plus de 400 lieux de là".
Il faut plus de science dans l'enseignement !
Ce blog contient: - des réflexions scientifiques - des mécanismes, des phénomènes, à partir de la cuisine - des idées sur les "études" (ce qui est fautivement nommé "enseignement" - des idées "politiques" : pour une vie en collectivité plus rationnelle et plus harmonieuse ; des relents des Lumières ! Pour me joindre par email : herve.this@inrae.fr
jeudi 14 mai 2026
Causalité et corrélation
dimanche 20 septembre 2020
La "corrélation" : méfions-nous un peu !
science/études/cuisine/politique/Alsace/gratitude/émerveillement
1. Dans les débats publics, dans la presse, on entend souvent le mot "corrélation"... mais sait-on bien de quoi il s'agit ? Et, surtout, en sait-on les limites ?
2. Ici, je veux signaler l'existence d'un excellent article, certes un peu ancien, mais dont les justes conclusions sont quasi intemporelles. Et ceux qui utilisent le mot "corrélation" devraient bien le lire, pour éviter de dire des âneries.
3. D'abord les références de ce texte : Anscombe FJ. 1973. Graphs in statistical analysis, The American Stastitician, vol. 27, N°1, pp 17-21.
L'article discute d'abord de l'importance des graphes... à une époque il n'était pas aussi facile d'en faire qu'aujourd'hui, raison pour laquelle son texte est un peu apologétique, de ce point de vue.
4. Mais, rapidement, notre homme discute la question des "régressions", ces analyses que des étudiants qui débutent dans les sciences et les technologies apprennent rapidement à faire, notamment avec ce mauvais logiciel qu'est Excel.
5. De quoi s'agit-il ? D'analyser une série de données : pensons, par exemple, à la quantité de sucres dans un bouillon de carottes, en fonction du temps de cuisson. On obtient une telle série de données en faisant des bouillons de carotte, et en dosant les sucres à des temps de cuisson différents, et en analysant ces échantillons, afin de savoir combien ils renferment de sucre.
6. Ayant fait les analyses, on "contemple" les résultats, qui s'affichent d'abord sous la forme d'un tableau de nombres tel que :
7. C'est immangeable ! La première chose à faire, pour se parler à soi-même et parler aux autres, du résultat obtenu, consiste à représenter ces couples de données, sur un graphe. Les temps de mesure sont sur l'horizontale du bas, et les mesures des quantités de sucres sont sur la verticale de gauche ; à l'intersection de la verticale qui part du temps 5 (en bas), par exemple, et de l'horizontale qui part de la quantité 5,5 (à gauche), on met un point qui correspond à la mesure (temps =5, quantité = 5,5).
Et l'on fait ainsi pour tous les points. De sorte que l'on obtient un graphe fait des onze points de mesure.
8. Mais on voit bien, sur ce graphe, que plus le temps de cuisson augmente, et plus la quantité semble augmenter aussi. Et c'est là que les étudiants apprennent à tracer une "droite de régression", qui est la droite qui passe "le mieux" par les différents de mesure. Je passe sur le calcul simple qui permet de faire cette droite, pour me limiter à dire que beaucoup de ceux qui en font se contentent d'indiquer la "qualité de la régression" (de combien la droite passe bien ou mal par les points) à l'aide nombre qui est désigné par R2. Pour R2 égal à 1, les points sont parfaitement alignés sur la droite. Sur la figure 2, je montre une droite de régression et onze points, avec un R2 qui est égal à 0,667.
9. Là où il faut faire attention, c'est que pour la figure 3, le R2 est encore égal à 0,667 !
10. Tout comme la figure 4.
11. Tout comme pour la figure 5 !
12. On le voit, le R2 qui tous les débutants apprennent est bien insuffisant. Bien sûr, il faut commencer un jour, mais ne nous contentons pas de ce début. Avançons




