Chargement…

Échantillonnage — Cours Mathématiques 2nde | KlarIA

🔢 Mathématiques2ndeCours

Échantillonnage

Voir la fiche de révision →Tous les chapitres

📖

Cours

Échantillonnage

1. Échantillon aléatoire

1.1 Définition

Un échantillon aléatoire de taille $n$ est un ensemble de $n$ résultats obtenus en répétant $n$ fois, de manière indépendante, une même expérience aléatoire.

On s'intéresse ici aux expériences à deux issues (succès / échec), où la probabilité de succès est $p$ .

Exemple : On lance une pièce $100$ fois. Chaque lancer a deux issues (Pile ou Face), avec $p = P(\text{Pile}) = 0{,}5$ . L'ensemble des $100$ résultats forme un échantillon de taille $n = 100$ .

1.2 Fréquence observée

La fréquence observée de succès dans un échantillon de taille $n$ est :

$f = \frac{\text{nombre de succès}}{n}$

C'est un nombre entre $0$ et $1$ .

Exemple : Sur $100$ lancers, on obtient $47$ « Pile ». La fréquence observée est $f = \frac{47}{100} = 0{,}47$ .

2. Loi des grands nombres

2.1 Énoncé (version vulgarisée)

Lorsque $n$ est grand, sauf exception, la fréquence observée $f$ est proche de la probabilité théorique $p$ .

Plus précisément : plus $n$ augmente, plus la fréquence $f$ se stabilise autour de $p$ .

🎯 Illustration : si on lance une pièce équilibrée, la fréquence de « Pile » peut valoir $0{,}3$ après $10$ lancers, $0{,}48$ après $100$ lancers, $0{,}501$ après $10\,000$ lancers… Elle se rapproche de plus en plus de $0{,}5$ .

2.2 Ce que la loi des grands nombres ne dit PAS

Elle ne dit pas que le résultat suivant « compense » les précédents (pas de « mémoire » du hasard).
Elle ne dit pas que $f = p$ exactement : il reste toujours une fluctuation, qui diminue quand $n$ augmente.

3. Estimation d'une probabilité par une fréquence

3.1 Principe

Si on ne connaît pas la probabilité $p$ d'un événement, on peut l'estimer par la fréquence observée $f$ sur un échantillon suffisamment grand.

Exemple : On veut estimer la proportion $p$ de gauchers dans une population. On interroge $n = 500$ personnes et $62$ sont gauchères. On estime $p \approx f = \frac{62}{500} = 0{,}124 = 12{,}4\%$ .

3.2 Précision de l'estimation

Plus l'échantillon est grand, plus l'estimation est précise (la fréquence est plus proche de la vraie probabilité).

La « marge d'erreur » typique est de l'ordre de $\frac{1}{\sqrt{n}}$ :

$|f - p| \leqslant \frac{1}{\sqrt{n}} \quad \text{(dans la plupart des cas)}$

Taille $n$	$\frac{1}{\sqrt{n}}$	Précision
$100$	$0{,}10$	$\pm 10\%$
$400$	$0{,}05$	$\pm 5\%$
$1\,000$	$\approx 0{,}032$	$\pm 3{,}2\%$
$10\,000$	$0{,}01$	$\pm 1\%$

Pour diviser la marge d'erreur par $2$ , il faut multiplier la taille de l'échantillon par $4$ (pas par $2$ !). C'est parce que la précision dépend de $\frac{1}{\sqrt{n}}$ , pas de $\frac{1}{n}$ .

4. Simulation et programmation

4.1 Simuler une expérience aléatoire en Python

import random

def experience(n):
    """Simule n lancers d'une pièce équilibrée
    et renvoie la fréquence de Pile."""
    nb_succes = 0
    for i in range(n):
        if random.random() < 0.5:  # Pile avec proba 0.5
            nb_succes += 1
    return nb_succes / n

Lire ce code : la fonction experience(n) :

Initialise un compteur de succès à $0$
Répète $n$ fois : tire un nombre au hasard entre $0$ et $1$ . Si ce nombre est $< 0{,}5$ , c'est un succès (« Pile »)
Renvoie la fréquence $f = \frac{\text{nombre de succès}}{n}$

4.2 Observer la loi des grands nombres

# Afficher la fréquence pour différentes tailles
for n in [10, 100, 1000, 10000]:
    f = experience(n)
    print(f"n = {n:>6} → f = {f:.4f}")

Résultat typique :

n =     10 → f = 0.6000
n =    100 → f = 0.4800
n =   1000 → f = 0.5070
n =  10000 → f = 0.4983

On observe que $f$ se rapproche de $p = 0{,}5$ quand $n$ augmente.

4.3 Simuler $N$ échantillons

Pour étudier la fluctuation des fréquences, on simule $N$ échantillons de taille $n$ :

def simuler_N_echantillons(N, n, p):
    """Simule N échantillons de taille n,
    renvoie la proportion d'échantillons
    où |f - p| <= 1/sqrt(n)."""
    seuil = 1 / n**0.5
    nb_dans_intervalle = 0
    for _ in range(N):
        nb_succes = sum(1 for _ in range(n)
                        if random.random() < p)
        f = nb_succes / n
        if abs(f - p) <= seuil:
            nb_dans_intervalle += 1
    return nb_dans_intervalle / N

Lire ce code :

On calcule le seuil $\frac{1}{\sqrt{n}}$
Pour chacun des $N$ échantillons, on simule $n$ tirages et on calcule la fréquence $f$
On compte combien d'échantillons vérifient $|f - p| \leqslant \frac{1}{\sqrt{n}}$
On renvoie la proportion de ces échantillons

Résultat typique (avec $p = 0{,}5$ , $n = 100$ , $N = 1000$ ) : environ $95\%$ des échantillons vérifient $|f - 0{,}5| \leqslant \frac{1}{\sqrt{100}} = 0{,}1$ .

4.4 Interprétation

L'expérience montre que dans la grande majorité des cas (environ $95\%$ ), l'écart entre $f$ et $p$ ne dépasse pas $\frac{1}{\sqrt{n}}$ .

C'est un résultat empirique observé par simulation, qui sera formalisé mathématiquement en première et terminale (intervalle de confiance, théorème central limite).

5. Applications

5.1 Sondages

Un sondage est un échantillon de taille $n$ prélevé dans une population. Si $f = 45\%$ des sondés sont favorables et $n = 1\,000$ :

Marge : $\frac{1}{\sqrt{1000}} \approx 0{,}032 = 3{,}2\%$

On estime que la proportion réelle $p$ est entre $41{,}8\%$ et $48{,}2\%$ (approximativement).

5.2 Contrôle qualité

Une usine produit des pièces dont $2\%$ sont défectueuses ( $p = 0{,}02$ ). On contrôle un échantillon de $n = 500$ pièces et on trouve $f = 3{,}6\%$ de pièces défectueuses.

Écart : $|f - p| = |0{,}036 - 0{,}02| = 0{,}016$ et $\frac{1}{\sqrt{500}} \approx 0{,}045$ .

Comme $0{,}016 < 0{,}045$ , cet écart est compatible avec $p = 0{,}02$ → pas d'alerte.

📌 À retenir

Un échantillon de taille $n$ = $n$ répétitions indépendantes d'une même expérience.
Loi des grands nombres : quand $n$ est grand, la fréquence $f$ est proche de la probabilité $p$ .
La précision est de l'ordre de $\frac{1}{\sqrt{n}}$ : pour gagner en précision, il faut augmenter $n$ .
Pour lire un programme Python de simulation : repérer la boucle (nombre de répétitions), le test (succès ou échec) et le calcul final (fréquence).
La simulation de $N$ échantillons montre que dans environ $95\%$ des cas, $|f - p| \leqslant \frac{1}{\sqrt{n}}$ .
Attention : doubler la précision nécessite de multiplier $n$ par $4$ (car $\frac{1}{\sqrt{n}}$ ).

Révise ce chapitre avec KlarIA

Tuteur qui t'explique pas à pas, quiz pour t'entraîner, flashcards pour mémoriser. Gratuit.

Créer mon compte gratuitement→

Besoin d'aide ?

Pose ta question gratuitement→

Échantillonnage

Cours

Échantillonnage

1. Échantillon aléatoire

1.1 Définition

1.2 Fréquence observée

2. Loi des grands nombres

2.1 Énoncé (version vulgarisée)

2.2 Ce que la loi des grands nombres ne dit PAS

3. Estimation d'une probabilité par une fréquence

3.1 Principe

3.2 Précision de l'estimation

4. Simulation et programmation

4.1 Simuler une expérience aléatoire en Python

4.2 Observer la loi des grands nombres

4.3 Simuler NNN échantillons

4.4 Interprétation

5. Applications

5.1 Sondages

5.2 Contrôle qualité

📌 À retenir

Révise ce chapitre avec KlarIA

4.3 Simuler $N$ échantillons