Quand on débute en statistique, et en particulier avec les tests statistiques, ce n’est pas évident de comprendre la notion de p-value.

Je vous l’explique avec le cas de Léo.
🙅🏻♀️ Attention âme sensible s’abstenir !
On va parler de quelque chose de grave : la disparition d’un chocolat ! 🍫
Léo et sa soeur, Lucie, ont reçu une boîte de chocolat. Léo a mangé tous ses chocolats en une seule fois, alors que Lucie les a mangés petit à petit.
Nous sommes lundi, 16h30 : Lucie rentre de l’école prête à manger son dernier chocolat.
Oh drame, il a été volé !
Lucie est convaincue de la culpabilité de son frère Léo, le dénonce. L’affaire est portée devant le tribunal. Rien que ça !
L’hypothèse nulle, H0, est : “Léo n'a pas mangé le chocolat de Lucie " (donc il est innocent).
L’hypothèse alternative, H1, est : “Léo a mangé le chocolat de Lucie". (donc il est coupable.)
Mais sans preuve, nous nous plaçons sous l’hypothèse H0 ( c’est là présomption d’innocence).
L’avocat de Lucie doit trouver des preuves de la culpabilité de Léo.
Il y a 2 possibilités :
1️⃣ L’avocat fait bien son job. 🥑
Devant le juge, il énonce les faits :
- Léo était à proximité de la scène de crime (la chambre de Lucie) toute la journée où le vole a été commis, puisqu’il n’avait pas école ce jour-là.
- Des traces de chocolat ont été retrouvées sur les mains de Léo.
- Arrivé à l’heure de dîner, Léo n’avait anormalement pas très faim.
- Lucie a retrouvé le papier du chocolat dans la poubelle de la chambre de Léo.
Il pourrait y avoir des explications à tout ça, mais c’est peu probable d’avoir autant de preuves contre lui et qu’il soit innocent.
La p-value est trop faible. ( en général inférieure à 0,05)
Donc le juge le déclare coupable. Il rejette son innocence.
Il rejette H0 au profit de H1.
La 2ème possibilité :
2️⃣ L’avocat ne trouve pas de preuve intéressante et pertinente. 🥑
La seule preuve : Léo était à proximité.
Ok.
Et bien, la probabilité qu’il soit dans le coin (ou pire : carrément dans la chambre) tout en étant innocent reste assez haute.
Il habite ici, donc forcément… 🤷🏻♀️
Les preuves ne sont pas assez accablantes. Le juge ne peut pas rejeter son innocence (H0).
La p-value est trop forte. (en général supérieure à 0,05)
Léo est libre !
Retour aux tests statistiques.
La p-value est la probabilité d'avoir nos données (nos observations dans notre échantillon) ou pire (ou des données plus extrêmes) en supposant que l'hypothèse H0 est vraie. C'est une probabilité conditionnelle !
P ( données ou pire | H0) : Probabilité d'avoir ces données ou pire sachant H0 👉🏻 Quand elle est inférieure au risque d'erreur choisi (souvent 0,05 ou 0,01), cela signifie que notre observation est trop peu probable si H0 est vraie. Ce n'est pas impossible ! Mais la probabilité est vraiment faible. H0 est incohérent avec ce que l'on observe.
Donc on rejette H0 au profit de H1. 👉🏻 Au contraire, si elle est supérieure au risque d'erreur, cela signifie que ce que l'on observe n'est pas incohérent avec l'hypothèse H0.
On ne peut donc pas la rejeter.
👋🏻 Moi, c'est Anne-Lise, je suis prof de maths indépendante spécialisée pour les reconversions dans la data. Si tu as besoin de te mettre à niveau en maths pour devenir data analyst, data scientist... on se retrouve sur maprofdemaths.com 😊
Comentarios