FICHE DE RÉVISION – Probabilité : Echantillonnage
(Niveau : Seconde)
Probabilités : Échantillonnage
Comprendre comment les statistiques (observations) permettent d’estimer les probabilités (théorie) grâce aux échantillons.
Partie 1 : Échantillon et Fréquence Observée
Imagine une expérience aléatoire simple avec seulement deux issues possibles (ex: Pile ou Face, Succès ou Échec, Conforme ou Défectueux). On note \(p\) la probabilité théorique de l’issue « Succès ».
Un échantillon aléatoire de taille \(n\) est le résultat de la répétition \(n\) fois, de manière indépendante, de cette expérience aléatoire.
La fréquence observée (\(f\)) du « Succès » dans cet échantillon est le nombre de fois où le Succès s’est produit, divisé par la taille de l’échantillon \(n\). $$ f = \frac{\text{Nombre de Succès}}{\text{Taille de l’échantillon } n} $$
On lance 100 fois (\(n=100\)) une pièce supposée équilibrée (\(p=0,5\)).
On observe 53 Piles (Succès).
L’échantillon est la liste des 100 résultats (ex: P, F, F, P, …).
La fréquence observée de Pile est \(f = \frac{53}{100} = 0,53\).
Partie 2 : Loi des Grands Nombres et Estimation
1. Fluctuation d’Échantillonnage
Si on refait l’expérience (lancer 100 fois la pièce), on n’obtiendra pas forcément 53 Piles. Peut-être 48, ou 55… La fréquence observée \(f\) varie d’un échantillon à l’autre : c’est la fluctuation d’échantillonnage.
2. Loi des Grands Nombres (Version simplifiée)
Intuitivement, plus on répète l’expérience (plus \(n\) est grand), plus la fréquence observée \(f\) a de chances d’être proche de la vraie probabilité \(p\).
Version du programme : « Lorsque \(n\) est grand, sauf exception, la fréquence observée est proche de la probabilité ».
3. Principe de l’Estimation
Si on ne connaît pas la probabilité \(p\) (ou la proportion dans une population), on peut l’estimer en calculant la fréquence \(f\) observée sur un échantillon de taille suffisamment grande.
On lance 1000 fois une punaise. Elle tombe 612 fois sur la « tête ».
La fréquence observée de « tête » est \(f = \frac{612}{1000} = 0,612\).
On peut estimer que la probabilité (inconnue) que cette punaise tombe sur la tête est d’environ \(p \approx 0,612\).
Partie 3 : Intervalle de Fluctuation (Approche Expérimentale)
Puisque la fréquence \(f\) fluctue autour de \(p\), dans quelle « zone » peut-on s’attendre à la trouver ?
Lorsque \(n\) est assez grand, on observe expérimentalement (par simulation) que, dans la plupart des cas, la fréquence observée \(f\) se situe dans un intervalle centré sur \(p\).
Le programme de Seconde propose d’étudier l’intervalle : $$ I = \left[ p – \frac{1}{\sqrt{n}}, \ p + \frac{1}{\sqrt{n}} \right] $$ On observe (par simulation) qu’environ 95% des fréquences \(f\) observées tombent dans cet intervalle.
On lance \(n=100\) fois une pièce équilibrée (\(p=0,5\)).
Calculons l’intervalle : \(\frac{1}{\sqrt{n}} = \frac{1}{\sqrt{100}} = \frac{1}{10} = 0,1\).
\(I = [0,5 – 0,1, \ 0,5 + 0,1] = [0,4, \ 0,6]\).
Cela signifie que si on fait plein de séries de 100 lancers, dans environ 95% de ces séries, la fréquence de Pile observée sera entre 0,4 (40%) et 0,6 (60%). Si on observe une fréquence très éloignée (ex: 0,2), on peut douter que la pièce soit vraiment équilibrée.
Partie 4 : Lien avec l’Algorithmique (Simulation)
L’échantillonnage est le domaine parfait pour utiliser la programmation (Python, tableur…) afin de simuler le hasard et d’observer les résultats.
Les capacités attendues sont :
- Comprendre une fonction (ex: Python) qui simule un échantillon de taille \(n\) et renvoie le nombre ou la fréquence de succès.
- Utiliser un programme ou un tableur pour simuler un grand nombre de lancers (ou d’expériences) et observer que la fréquence se stabilise près de la probabilité (Loi des Grands Nombres).
- Simuler \(N\) échantillons de taille \(n\) et vérifier dans quelle proportion la fréquence \(f\) tombe dans l’intervalle \( [p – 1/\sqrt{n}, p + 1/\sqrt{n}] \).
Un exercice type pourrait te donner un code Python qui simule 1000 lancers d’un dé et te demander d’interpréter le résultat (la fréquence d’apparition du 6 est-elle proche de 1/6 ?). Ou te demander de modifier le code pour simuler 100 échantillons de 50 lancers et compter combien de fois la fréquence de Pile est entre 0,4 et 0,6.
Partie 5 : Entraînement (Exercices)
-
Exercice 1 (Loi des Grands Nombres) : On lance une pièce truquée. Après 10 lancers, on obtient 7 Piles. Après 100 lancers, on obtient 62 Piles. Après 1000 lancers, on obtient 605 Piles.
a) Calculer la fréquence de Piles dans chaque cas.
b) Quelle semble être la probabilité \(p\) d’obtenir Pile avec cette pièce (estimation) ? -
Exercice 2 (Intervalle de Fluctuation) : Un fabricant affirme que seulement 5% (\(p=0,05\)) de ses produits sont défectueux. On teste un échantillon de 400 produits (\(n=400\)) et on trouve 30 produits défectueux.
a) Calculer la fréquence \(f\) de produits défectueux dans l’échantillon.
b) Calculer l’intervalle de fluctuation \( [p – 1/\sqrt{n}, p + 1/\sqrt{n}] \).
c) La fréquence observée \(f\) est-elle dans cet intervalle ? Que peut-on suspecter ?
Partie 6 : Corrections Détaillées
Correction Exercice 1 (Loi des Grands Nombres)
a) Calcul des fréquences :
Pour \(n=10\) : \(f_{10} = \frac{7}{10} = 0,7\).
Pour \(n=100\) : \(f_{100} = \frac{62}{100} = 0,62\).
Pour \(n=1000\) : \(f_{1000} = \frac{605}{1000} = 0,605\).
b) Estimation de \(p\) :
On observe que plus \(n\) augmente, plus la fréquence observée \(f\) semble se stabiliser autour d’une valeur.
D’après la loi des grands nombres, cette valeur est une bonne estimation de la probabilité \(p\).
On peut estimer que \(p \approx 0,6\) (ou 60%).
Correction Exercice 2 (Intervalle de Fluctuation)
On a \(p=0,05\) et \(n=400\). On observe 30 succès.
a) Fréquence observée \(f\) :
\(f = \frac{\text{Nombre de défectueux}}{n} = \frac{30}{400} = \frac{3}{40} = 0,075\).
b) Intervalle de fluctuation \(I\) :
Calculons \(1/\sqrt{n}\) : \(\frac{1}{\sqrt{400}} = \frac{1}{20} = 0,05\).
L’intervalle est \(I = [p – 1/\sqrt{n}, \ p + 1/\sqrt{n}]\)
\(I = [0,05 – 0,05, \ 0,05 + 0,05]\)
\(I = [0, \ 0,1]\).
c) Comparaison et conclusion :
La fréquence observée est \(f = 0,075\).
L’intervalle de fluctuation « attendu » (où f devrait tomber 95% du temps si p=0,05) est \([0, \ 0,1]\).
On constate que \(0,075\) est bien dans l’intervalle \([0, \ 0,1]\).
Conclusion : La fréquence observée n’est pas anormalement élevée par rapport à ce qu’affirme le fabricant. L’échantillon ne permet pas de remettre en cause son affirmation (au seuil de 95%).
Besoin d'aide en mathématiques ?
Je propose des cours de remise à niveau en visio ou en présentiel
