Chargement…
Chargement…
Un échantillon aléatoire de taille est un ensemble de résultats obtenus en répétant fois, de manière indépendante, une même expérience aléatoire.
On s'intéresse ici aux expériences à deux issues (succès / échec), où la probabilité de succès est .
Exemple : On lance une pièce fois. Chaque lancer a deux issues (Pile ou Face), avec . L'ensemble des résultats forme un échantillon de taille .
La fréquence observée de succès dans un échantillon de taille est :
C'est un nombre entre et .
Exemple : Sur lancers, on obtient « Pile ». La fréquence observée est .
Lorsque est grand, sauf exception, la fréquence observée est proche de la probabilité théorique .
Plus précisément : plus augmente, plus la fréquence se stabilise autour de .
🎯 Illustration : si on lance une pièce équilibrée, la fréquence de « Pile » peut valoir après lancers, après lancers, après lancers… Elle se rapproche de plus en plus de .
Si on ne connaît pas la probabilité d'un événement, on peut l'estimer par la fréquence observée sur un échantillon suffisamment grand.
Exemple : On veut estimer la proportion de gauchers dans une population. On interroge personnes et sont gauchères. On estime .
Plus l'échantillon est grand, plus l'estimation est précise (la fréquence est plus proche de la vraie probabilité).
La « marge d'erreur » typique est de l'ordre de :
| Taille | Précision | |
|---|---|---|
Pour diviser la marge d'erreur par , il faut multiplier la taille de l'échantillon par (pas par !). C'est parce que la précision dépend de , pas de .
import random
def experience(n):
"""Simule n lancers d'une pièce équilibrée
et renvoie la fréquence de Pile."""
nb_succes = 0
for i in range(n):
if random.random() < 0.5: # Pile avec proba 0.5
nb_succes += 1
return nb_succes / n
Lire ce code : la fonction experience(n) :
# Afficher la fréquence pour différentes tailles
for n in [10, 100, 1000, 10000]:
f = experience(n)
print(f"n = {n:>6} → f = {f:.4f}")
Résultat typique :
n = 10 → f = 0.6000
n = 100 → f = 0.4800
n = 1000 → f = 0.5070
n = 10000 → f = 0.4983
On observe que se rapproche de quand augmente.
Pour étudier la fluctuation des fréquences, on simule échantillons de taille :
def simuler_N_echantillons(N, n, p):
"""Simule N échantillons de taille n,
renvoie la proportion d'échantillons
où |f - p| <= 1/sqrt(n)."""
seuil = 1 / n**0.5
nb_dans_intervalle = 0
for _ in range(N):
nb_succes = sum(1 for _ in range(n)
if random.random() < p)
f = nb_succes / n
if abs(f - p) <= seuil:
nb_dans_intervalle += 1
return nb_dans_intervalle / N
Lire ce code :
Résultat typique (avec , , ) : environ des échantillons vérifient .
L'expérience montre que dans la grande majorité des cas (environ ), l'écart entre et ne dépasse pas .
C'est un résultat empirique observé par simulation, qui sera formalisé mathématiquement en première et terminale (intervalle de confiance, théorème central limite).
Un sondage est un échantillon de taille prélevé dans une population. Si des sondés sont favorables et :
Marge :
On estime que la proportion réelle est entre et (approximativement).
Une usine produit des pièces dont sont défectueuses (). On contrôle un échantillon de pièces et on trouve de pièces défectueuses.
Écart : et .
Comme , cet écart est compatible avec → pas d'alerte.
Tuteur qui t'explique pas à pas, quiz pour t'entraîner, flashcards pour mémoriser. Gratuit.
Créer mon compte gratuitement→