Dans quelle mesure le résultat d’un sondage peut-il être fiable ?

Introduction
Les sondages occupent une place essentielle dans nos sociétés : intentions de vote, habitudes de consommation, enquêtes d’opinion… Mais peut-on vraiment leur faire confiance ? 🤔
En fait, derrière chaque sondage, il y a des mathématiques : elles permettent de transformer un échantillon de personnes en une estimation pour toute une population. Cela soulève immédiatement deux questions : en quoi les mathématiques nous servent-elles pour faire des sondages ? et en quoi les mathématiques nous aident-elles à en analyser la fiabilité ?
Problématique : dans quelle mesure le résultat d’un sondage peut-il être fiable ?
I. Un sondage, c’est une somme de variables aléatoires
1. Modéliser un sondage
Un sondage, c’est simplement poser une question à plusieurs personnes, puis compter leurs réponses.
Pour le modéliser en maths, on utilise des variables aléatoires :
- On note [math]X_i = 1[/math] si la personne sondée répond « oui ».
- On note [math]X_i = 0[/math] si elle répond « non ».
Si chaque personne est choisie de manière indépendante et a la même probabilité [math]p[/math] de répondre « oui », alors la somme des réponses [math]X = X_1 + X_2 + \cdots + X_n[/math] suit une loi binomiale : [math]X \sim \mathcal{B}(n,p)[/math].
Autrement dit, [math]X[/math] représente le nombre total de « oui » obtenus sur [math]n[/math] personnes.
Les formules classiques donnent alors :
- Espérance : [math]\mathbb{E}(X) = np[/math].
- Variance : [math]\mathrm{Var}(X) = np(1-p)[/math].
2. La proportion observée
Dans un sondage, ce qui nous intéresse n’est pas seulement le nombre de « oui », mais la proportion de « oui » : [math]\hat{p} = \frac{X}{n}[/math].
On peut montrer que :
- Espérance : [math]\mathbb{E}(\hat{p}) = p[/math] → donc en moyenne, notre sondage reflète bien la vraie proportion de la population.
- Variance : [math]\mathrm{Var}(\hat{p}) = \frac{p(1-p)}{n}[/math].
Cela veut dire que plus [math]n[/math] est grand, plus la variance diminue, et donc plus le sondage est fiable.
Exemple numérique
Prenons un sondage avec [math]n = 1000[/math] personnes et supposons que la vraie proportion est [math]p = 0,5[/math].
On calcule l’écart-type :
\sigma_{\hat{p}} = \sqrt{\frac{p(1-p)}{n}} = \sqrt{\frac{0,5 \times 0,5}{1000}} \approx 0,016.
Cela veut dire que la proportion mesurée dans un sondage peut naturellement varier de ±1,6% autour de la vraie valeur, uniquement à cause du hasard d’échantillonnage.
II. La notion de marge d’erreur
1. Intervalle de confiance à 95 %
Quand on réalise un sondage, on calcule une proportion observée [math]\hat{p}[/math]. Mais cette valeur n’est qu’une estimation : elle varie selon les personnes interrogées, à cause du hasard d’échantillonnage.
Mathématiquement, on peut montrer que si l’échantillon est assez grand, la variable [math]\hat{p}[/math] suit une loi qui ressemble beaucoup à une loi normale centrée sur [math]p[/math], avec un écart-type :
\sigma_{\hat{p}} = \sqrt{\tfrac{\hat{p}(1-\hat{p})}{n}}.
Cela permet de construire ce qu’on appelle un intervalle de confiance.
À 95 %, la formule est :
\hat{p} \pm 1,96 \cdot \sqrt{\tfrac{\hat{p}(1-\hat{p})}{n}}.
Exemple :
Un sondage auprès de [math]n=1000[/math] personnes donne [math]\hat{p}=0,56[/math] (56 %).
On calcule :
\sqrt{\tfrac{0,56 \times 0,44}{1000}} \approx 0,016.
🔒 La suite est réservée aux membres Premium
Accédez à l’intégralité des 40 sujets rédigés pour le Grand Oral de Maths.
Je veux le Pack Premium