FICHE DE RÉVISION –Probabilités : Concentration et Loi des Grands Nombres
(Niveau : Terminale)
Probabilités : Concentration et Loi des Grands Nombres
Comprendre comment les variables aléatoires se concentrent autour de leur espérance : inégalités clés et la loi des grands nombres.
Partie 1 : Inégalité de Bienaymé-Tchebychev
Cette inégalité donne une information cruciale : elle **majore** (donne une limite supérieure) la probabilité qu’une variable aléatoire \(X\) s’écarte de son espérance \(\mu\) d’une certaine quantité \(\delta\), en utilisant uniquement sa variance \(V(X)\).
Soit \(X\) une variable aléatoire d’espérance \(E(X) = \mu\) et de variance \(V(X)\).
Pour tout nombre réel \(\delta > 0\), l’inégalité de Bienaymé-Tchebychev stipule que : $$ P(|X – \mu| \ge \delta) \le \frac{V(X)}{\delta^2} $$ Où \(|X – \mu|\) représente l’écart (la distance) entre la variable aléatoire \(X\) et son espérance \(\mu\).
Autre formulation (avec l’écart type \(\sigma = \sqrt{V(X)}\)) : En posant \(\delta = k\sigma\) (où \(k > 0\)), l’inégalité devient : $$ P(|X – \mu| \ge k\sigma) \le \frac{\sigma^2}{(k\sigma)^2} = \frac{\sigma^2}{k^2 \sigma^2} = \frac{1}{k^2} $$ Cela signifie que la probabilité de s’écarter de l’espérance de plus de \(k\) fois l’écart type est inférieure ou égale à \(1/k^2\).
Soit \(X\) une variable aléatoire avec \(E(X)=10\) et \(\sigma(X)=2\) (donc \(V(X)=4\)).
Quelle est la probabilité que \(X\) s’écarte de 10 d’au moins 6 unités (c’est-à-dire \(X \le 4\) ou \(X \ge 16\)) ? On a \(\delta = 6\).
D’après Bienaymé-Tchebychev : \(P(|X – 10| \ge 6) \le \frac{V(X)}{\delta^2} = \frac{4}{6^2} = \frac{4}{36} = \frac{1}{9}\).
La probabilité est d’au plus 1/9 (environ 11%).
Avec la deuxième forme : S’écarter de 6, c’est s’écarter de \(k = \delta/\sigma = 6/2 = 3\) écarts types.
La probabilité de s’écarter de plus de 3 écarts types est \(P(|X – \mu| \ge 3\sigma) \le \frac{1}{3^2} = \frac{1}{9}\).
Partie 2 : Inégalité de Concentration et Loi des Grands Nombres
On applique maintenant l’inégalité de Bienaymé-Tchebychev à la moyenne \(M_n\) d’un échantillon.
1. Inégalité de Concentration
Soit \((X_1, …, X_n)\) un échantillon de taille \(n\) d’une loi d’espérance \(\mu\) et de variance \(V\).
Soit \(M_n = \frac{X_1 + … + X_n}{n}\) la moyenne de l’échantillon.
On sait que \(E(M_n) = \mu\) et \(V(M_n) = \frac{V}{n}\).
En appliquant l’inégalité de Bienaymé-Tchebychev à la variable \(M_n\), on obtient l’inégalité de concentration : Pour tout \(\delta > 0\), $$ P(|M_n – \mu| \ge \delta) \le \frac{V(M_n)}{\delta^2} = \frac{V}{n\delta^2} $$
Cette inégalité montre que la probabilité que la moyenne de l’échantillon \(M_n\) s’écarte de la vraie moyenne \(\mu\) d’une quantité \(\delta\) devient de plus en plus petite lorsque la taille de l’échantillon \(n\) augmente.
On lance \(n\) fois une pièce équilibrée (\(p=0.5\)). Soit \(X_i=1\) si Pile, 0 si Face. \(E(X_i)=p=0.5\), \(V(X_i)=p(1-p)=0.5(0.5)=0.25\).
Soit \(M_n\) la fréquence de Piles observée (\(M_n = S_n/n\)). On a \(E(M_n)=0.5\) et \(V(M_n)=V/n=0.25/n\).
Quelle est la probabilité que la fréquence observée s’écarte de 0.5 d’au moins 0.1 (\(\delta=0.1\)) ?
\(P(|M_n – 0.5| \ge 0.1) \le \frac{V}{n\delta^2} = \frac{0.25}{n(0.1)^2} = \frac{0.25}{n \times 0.01} = \frac{25}{n}\).
Si \(n=100\), la probabilité est \(\le 25/100 = 0.25\).
Si \(n=10000\), la probabilité est \(\le 25/10000 = 0.0025\). On voit bien que la probabilité diminue quand \(n\) augmente.
2. Loi Faible des Grands Nombres
La Loi (Faible) des Grands Nombres est une conséquence directe de l’inégalité de concentration.
Elle dit que pour tout écart \(\delta > 0\) (aussi petit soit-il) : $$ \lim_{n \to +\infty} P(|M_n – \mu| \ge \delta) = 0 $$ Autrement dit : Quand la taille de l’échantillon \(n\) tend vers l’infini, la probabilité que la moyenne de l’échantillon \(M_n\) s’écarte de l’espérance théorique \(\mu\) de plus qu’une petite valeur \(\delta\) tend vers 0.
Cela signifie que la moyenne de l’échantillon \(M_n\) converge en probabilité vers l’espérance \(\mu\).
Partie 3 : Application – Détermination d’une Taille d’Échantillon
On peut utiliser l’inégalité de concentration pour trouver une taille d’échantillon \(n\) suffisante pour garantir que la moyenne observée \(M_n\) soit proche de l’espérance \(\mu\) avec une certaine probabilité (ou un certain risque).
Problème type : On veut que l’écart entre la moyenne de l’échantillon \(M_n\) et l’espérance \(\mu\) soit inférieur à une précision \(\delta\) avec une probabilité d’au moins \(1-\alpha\) (où \(\alpha\) est le risque, souvent petit comme 0.05).
On veut donc \(P(|M_n – \mu| < \delta) \ge 1 - \alpha\).
Cela revient à vouloir que l’événement contraire (l’écart est \(\ge \delta\)) ait une probabilité faible : \(P(|M_n – \mu| \ge \delta) \le \alpha\).
On sait par l’inégalité de concentration que \(P(|M_n – \mu| \ge \delta) \le \frac{V}{n\delta^2}\).
Il suffit donc de choisir \(n\) tel que : $$ \frac{V}{n\delta^2} \le \alpha $$ Ce qui donne : $$ n \ge \frac{V}{\alpha \delta^2} $$ (Il faut connaître ou majorer la variance \(V\) de la loi d’origine).
On veut estimer la proportion \(p\) de pièces défectueuses (inconnue) dans une grande production. On veut que la fréquence \(f\) observée sur un échantillon de taille \(n\) soit à moins de \(\delta=0.02\) de \(p\), avec une probabilité d’au moins 95% (\(1-\alpha=0.95 \Rightarrow \alpha=0.05\)). Quelle taille \(n\) choisir ?
Ici \(M_n = f\), \(\mu = p\). L’inégalité est \(P(|f – p| \ge 0.02) \le 0.05\).
On sait que \(P(|f – p| \ge 0.02) \le \frac{V}{n(0.02)^2}\), où \(V = p(1-p)\) est la variance de la loi de Bernoulli.
Le problème est qu’on ne connaît pas \(p\). On utilise le fait que la fonction \(x \mapsto x(1-x)\) est maximale pour \(x=0.5\), et ce maximum vaut \(0.5(1-0.5) = 0.25\). Donc \(V = p(1-p) \le 0.25\).
Il suffit donc de choisir \(n\) tel que \(\frac{0.25}{n(0.02)^2} \le 0.05\).
\(n \ge \frac{0.25}{0.05 \times (0.02)^2} = \frac{0.25}{0.05 \times 0.0004} = \frac{0.25}{0.00002} = 12500\).
Il faut une taille d’échantillon d’au moins 12500 pour garantir cette précision avec ce risque, en utilisant Tchebychev. (En pratique, avec des théorèmes plus fins comme le Théorème Central Limite, on trouve souvent des tailles bien plus petites).
Partie 4 : Entraînement (Exercices)
- Exercice 1 (Bienaymé-Tchebychev) : Une variable aléatoire \(X\) a une espérance \(\mu=50\) et un écart type \(\sigma=5\). Majorer \(P(X \le 40 \text{ ou } X \ge 60)\).
- Exercice 2 (Concentration et Taille N) : On lance \(n\) fois un dé équilibré. Soit \(M_n\) la moyenne des résultats obtenus. On veut que la probabilité que \(M_n\) s’écarte de l’espérance (qui est 3.5) de plus de 0.1 soit inférieure à 10%. En utilisant l’inégalité de concentration, déterminer une taille d’échantillon \(n\) suffisante. (On rappelle que la variance pour un dé est \(V = 35/12\)).
Partie 5 : Corrections Détaillées
Correction Exercice 1 (Bienaymé-Tchebychev)
\(E(X)=50\), \(\sigma(X)=5 \Rightarrow V(X)=\sigma^2=25\).
On veut majorer \(P(X \le 40 \text{ ou } X \ge 60)\).
L’événement « \(X \le 40 \text{ ou } X \ge 60\) » est équivalent à dire que l’écart entre \(X\) et l’espérance 50 est supérieur ou égal à 10.
En effet, si \(X \le 40\), alors \(X-50 \le -10\), donc \(|X-50| \ge 10\).
Si \(X \ge 60\), alors \(X-50 \ge 10\), donc \(|X-50| \ge 10\).
On veut donc majorer \(P(|X – 50| \ge 10)\). Ici \(\mu=50\) et \(\delta=10\).
D’après l’inégalité de Bienaymé-Tchebychev :
\(P(|X – 50| \ge 10) \le \frac{V(X)}{\delta^2} = \frac{25}{10^2} = \frac{25}{100} = 0.25\).
La probabilité cherchée est inférieure ou égale à 0.25 (ou 1/4).
(Avec la 2ème forme : \(\delta=10\) correspond à \(k = \delta/\sigma = 10/5 = 2\) écarts types. La probabilité est \(\le 1/k^2 = 1/2^2 = 1/4\)).
Correction Exercice 2 (Concentration et Taille N)
Loi du dé : \(\mu = 3.5\), \(V = 35/12\). \(M_n\) est la moyenne sur \(n\) lancers.
On veut que \(P(|M_n – 3.5| \ge 0.1) \le 0.10\).
On a \(\delta = 0.1\) et le risque \(\alpha = 0.10\).
L’inégalité de concentration nous dit : \(P(|M_n – \mu| \ge \delta) \le \frac{V}{n\delta^2}\).
Il suffit donc de choisir \(n\) tel que \(\frac{V}{n\delta^2} \le \alpha\).
\(\frac{35/12}{n(0.1)^2} \le 0.10\)
\(\frac{35/12}{n \times 0.01} \le 0.10\)
\(\frac{35}{12 \times 0.01 n} \le 0.10\)
\(\frac{35}{0.12 n} \le 0.10\)
On isole \(n\) (en multipliant par \(n\) et divisant par 0.10, qui sont positifs) :
\(\frac{35}{0.12 \times 0.10} \le n\)
\(\frac{35}{0.012} \le n\)
\(n \ge 2916.66…\)
Comme \(n\) doit être un entier :
Il faut choisir une taille d’échantillon \(n\) au moins égale à 2917 lancers.
Besoin d'aide en mathématiques ?
Je propose des cours de remise à niveau en visio ou en présentiel
