Fluctuations d’échantillonnage

Par Michel Vendrely

Objectif : Faire découvrir les lois les plus utiles : loi Normale, loi de K.Pearson….

Niveau : Terminale ES, S et post Bac en classe, avec un vidéoprojecteur.

Auteurs : Groupe de travail statistique et probabilités de l’institut de recherche sur l’enseignement des mathématiques (I.R.E.M) de l’Université de Besançon.

Situation : Prenons un dé bien équilibré. Si on joue 200 fois avec ce dé (échantillon de taille 200), les paramètres (moyenne, variance, etc..) de la série statistique obtenue fluctuent. L’étude statistique du comportement de ces paramètres nous permet de découvrir les lois de probabilités les plus connues. Ces études débouchent sur des exercices de tests d’adéquation qui font partie du programme de terminale.

Prérequis : Connaissances des définitions d’un échantillon, d’une moyenne, d’une variance, d’une loi de probabilité.

Exemples

Fluctuation des moyennes

Étude de la moyenne
Dans un dé bien équilibré si chaque face a la même probabilité : la loi de probabilité est l’équiprobabilité.

Faces Probabilités
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6

L’espérance mathématique est de 3,5. La variance est : Var = 91/6-3.5² =35 / 12 soit environ 2,916
Avec un tableur et la fonction TRONQUE(6´ aléa()+1) on simule une éventualité du lancer du dé parfait.
Une simulation d’un échantillon de 200 lancers permet d’avoir une statistique qui est une fluctuation de la loi de probabilité.
On trouve par exemple :

Valeurs Fréquences
1 36
2 28
3 26
4 41
5 29
6 40

Pour cet échantillon : la moyenne est 3,595, la variance est 3,090975, et la distance au modèle d’équirépartition est de 211,33 environ.
On peut comparer graphiquement cette statistique et son modèle (voir la feuille de calcul).
La moyenne des points dans l’échantillon est de 3,595. Un autre échantillon de 200 lancers donnerait une autre moyenne.
On construit 500 échantillons de taille 200. L’histogramme des moyennes des échantillons de ce dé parfait nous permet de mieux cerner les fluctuations d’échantillonnage des moyennes.
On constate statistiquement que la répartition des moyennes a un histogramme en forme de cloche ( loi Normale), et que 90% des moyennes sont entre 3,3 et 3.7.
Pour faire une animation avec le tableur:
Choisir l’onglet « moyenne »
CTRL+e permet de supprimer les échantillons.
CTRL+u permet de visualiser différente situations de moyennes de dé parfaitement équilibré.
CTRL+m permet de visualiser la répartition d’un ensemble aléatoire de 500 moyennes de 200 lancés de dé.
On remarquera la construction statistique d’un intervalle de test qui contient 90% des moyennes observées. Dans la cellule F1 vous pouvez modifier la représentativité de cet intervalle. Dans la cellule J1 : 0 fait disparaître la loi normale 1 la fait apparaître.

Test d’adéquation

Étude de la distance séparant les effectifs observés et les effectifs obtenus par simulation.
(adéquation des observations du dé avec le modèle d’équirépartition).

Si on lance 200 fois un dé réel, la statistique obtenue ressemble à une des simulations du tableur.

distance

Faces Effectifs observés ni Effectifs simulés ai
1 45 33,33 136,11
2 42 33,33 75,11
3 32 33,33 1,77
4 29 33,33 18,77
5 24 33,33 87,11
6 28 33,33 28,44
200 347,33

Dire qu’un dé est équilibré signifie que le modèle d’équiprobabilité est valide pour le dé considéré.
Pour vérifier la validité de ce modèle reprenons l’étude statistique de notre dé.
La distance entre les effectifs observés et ceux attendus du modèle est d²==(45-33,33)² +(42-33,33)² +…+(28-33,33)² = 347,33
La distance observée 347,33 n’est pas nulle.
Pour savoir si cette distance est la conséquence d’un dé mal fait ou si elle est due à une fluctuation d’échantillonnage, utilisons la méthode suivante :

  • Une étude statistique (graphique, paramètres, décilles) des distances calculées à partir des échantillons simulés de taille 200 nous permet de mieux cerner les fluctuations d’échantillonnage des distances.
  • On constate statistiquement que l’histogramme des distances a une forme dissymétrique très particulière ((Distribution de K.Pearson).
  • On constate que 90% des distances sont inférieures à 309,93.
  • On adopte la règle de décision suivante : si la distance observée dans l’échantillon fabriqué à partir de mon dé est plus grande que 309,93,
    je décide de dire qu’il y a peu de chance que mon dé soit parfait.

Avec ce critère, mon dé a moins de 10% de chance d’être parfait.
Je refuse donc de croire que mon dé est conforme au modèle.
Pour faire une animation avec le tableur.
Ouvrir l’onglet « Distances » et faire
CTRL+e pour recommencer une autre animation.
CTRL+u pour visualiser différente situations de distances de dé parfaitement équilibré.
CTRL+m pour visualiser la répartition d’un ensemble aléatoire de 500 moyennes de 200 lancés de dé.
On remarquera la construction statistique d’un intervalle de test qui contient 90% des moyennes observées.

Fichier d’animation

Téléchargement :
Le fichier est réalisé pour Excel 97 . Il faut accepter les macros à l’ouverture.
Pour faire une animation avec le tableur:
Choisir l’onglet « moyenne « ou « distance » ou « variance »
Faire CTRL+e pour effacer les graphiques.
Faire CTRL+u pour visualiser différentes valeurs de moyennes (variances, distances) d’échantillons de taille 200 du dé parfaitement équilibré.
Faire CTRL+m pour visualiser la répartition d’un ensemble aléatoire de 500 moyennes (distances ou variances ) de 200 lancés de dé.
On remarquera la construction statistique d’un intervalle qui contient 90% des moyennes observées (distances ou variances ).

[spoiler show= »Voir la fiche pour fabriquer l’animation »]
[redir enleve=’Retour’]Fluctuations/page3.HTM[/redir]
[/spoiler]

Les commentaires sont clos.