La margarine, cause principale de divorce à en croire les statistiques… mais faut-il les croire ?<!-- --> | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
Insolite
La margarine, cause principale de divorce à en croire les statistiques… mais faut-il les croire ?
©Reuters

Ouvrez l'oeil !

Sur son site internet Spurious Correlation, Tyler Vigen publie des graphiques farfelus reliant par exemple les taux de divorces et de consommation de margarine sur dix ans. Le but étant de montrer que ce n'est pas parce que deux variables ont le même mouvement dans le temps que l'un a influé sur l'autre.

Et s'il y avait quelque chose dans la margarine qui poussait au divorce ? Sur son site internet Spurious Correlation, Tyler Vigen a publié un graphique reliant les taux de divorces et de consommation de margarine sur dix ans. "Il y a peut-être un lien qui trouve son origine dans une des molécules présente dans la margarine", s'amuse Vigen, qui aime à se surnommer le "provocateur de statistiques". "Beaucoup de graphiques ont des intitulés sensationnels. Les scientifiques trouvent une connexion entre x et y (…) dans beaucoup de ces cas il peut y avoir une corrélation mais c'est important que nous soyons critiques sur les graphiques de causes à effets", explique le jeune homme. Car ce n'est pas parce que deux variables ont le même mouvement dans le temps que l'un a influé sur l'autre.

Pour mettre en exergue ce point, Tyler Vigen, étudiant en criminologie à l'école de droit d'Harvard, a conçu un programme informatique capable de créer des graphiques à partir de n'importe quelle donnée. "Ce qui est plutôt drôle là-dedans, c'est que cela permet aux gens de devenir scientifiques pour quelques instant, ils peuvent créer leur propres hypothèses", explique le petit génie. Le site vous permet de tester votre capacité à imaginer les mécanismes de causalité les plus improbables. "Quel lien y a-t-il entre la consommation du fromage et l'augmentation du nombre de personnes qui sont mortes dans leurs draps dans un même laps de temps ?" ou "Comment l'augmentation des apparitions cinématographiques de Nicolas Cage a-t-elle pu entraîner celle du nombre de morts noyés dans une piscine ? ", apparaissent notamment sur Spuirous Correlation.  

"Si nous y pensons pendant une seconde, nous réalisons cela repose sur du vent. Rien ne vient solidement confirmer notre hypothèse", explique Vigen. Les exemples sont légions. Un classique : en été, les ventes de glaces et le nombre de morts augmentent. Les deux sont effectivement corrélés mais il est facile de comprendre que l'un n'entraîne pas l'autre. Peut-être est-ce un troisième variable (la chaleur par exemple ?) qui engendre les deux ?

Quand la thérapie par le remplacement d'hormones (HRT) est devenue monnaie courante, les médecins ont réalisé que les femmes qui la suivaient contractaient moins de maladies cardiaques que les autres. Certains d'entre eux ont donc suggéré un mécanisme de cause à effet : la HRT diminuerait le risque d'avoir des maladies coronariennes. Il s'est finalement avéré qu'un troisième facteur entrait en ligne de compte. Les femmes qui suivaient une HRT venaient généralement d'une catégorie socio-économique plus élevée, ce qui va souvent de pair avec un régime alimentaire plus sein et des habitudes sportives. Et c'est précisément cela qui réduit les risques de crises cardiaques. D'autres tests ont ensuite prouvé que la HRT augmentait au contraire légèrement le risque de développer des maladies du cœur !  

Très vite, le site internet de Tyler Vigen a attiré l'attention des réseaux sociaux, chez qui se moquer des corrélations est un véritable mème. Faites un rapide tour sur Google et vous découvrirez de nombreux graphiques farfelus "prouvant" par exemple que Facebook est à l'origine de la crise de la dette grecque ! Spurious Correlations va plus loin en illustrant les pièges du dictat des graphiques statistiques. Premier piège : si vous donnez assez de puissance au traitement d'une donnée, vous déboucherez sur un énorme nombre de corrélations. Et beaucoup seront statistiquement signifiantes. Les relations de cause à effet, elles, sont plus difficiles à prouver. En effet, le moindre changement dans l'un des variables change tout.

Attention également au pouvoir séducteur des graphiques. La plupart des gens ont du mal à saisir les nombres dans les données mais si vous leur montrez deux courbes montant ou descendant à l'unisson, vous les aurez presque convaincu que l'une a une influence directe sur l'autre. Prenez le nombre d'apparence cinématographiques de Nicolas Cage (qui semble être le bouc émissaire de Vigen) : il ne varie qu'entre zéro et quatre chaque année. Pourtant, en choisissant une échelle appropriée, il peut être conjugué avec des millions d'autres variables.

Ainsi donc, conseille Vigen, la prochaine fois que vous tombez sur un graphique à l'intitulé racoleur, ayez l'œil critique ! 

                                                                                                                                                                                                                                       Raphaëlle de Tappie 

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !