Le dilemme du prisonnier

Introduction
On pense souvent que les mathématiques ne servent qu’à faire des calculs, mais elles permettent aussi d’analyser nos choix et nos comportements (#théorie des jeux). Le dilemme du prisonnier est un exemple célèbre : il montre que ce qui paraît rationnel individuellement peut conduire à un mauvais résultat collectif.
Ce problème n’est pas seulement une curiosité : il s’applique à des situations réelles comme la concurrence entre entreprises, la coopération entre États ou même nos relations quotidiennes. C’est ce qui le rend super intéressant à explorer.
I. Le dilemme du prisonnier : un problème de probabilité et de stratégie
1. Modèle mathématique du dilemme
Imaginons deux prisonniers (A et B) arrêtés ensemble. La police les interroge séparément et leur propose le marché suivant :
- Si les deux se taisent (coopèrent) → chacun prend une peine réduite.
- Si l’un dénonce (trahit) pendant que l’autre se tait → le traître est libéré, l’autre prend la peine maximale.
- Si les deux dénoncent → ils sont tous les deux condamnés à une peine assez lourde, mais moins que la peine maximale.
On peut traduire ce scénario par un tableau de gains.
On note les résultats sous la forme (peine de A ; peine de B), en nombre d’années de prison :
Prisonnier B : Coopère (se tait) | Prisonnier B : Trahit (dénonce) | |
---|---|---|
Prisonnier A : Coopère | (2 ans ; 2 ans) | (10 ans ; 0 an) |
Prisonnier A : Trahit | (0 an ; 10 ans) | (5 ans ; 5 ans) |
On retrouve le schéma classique :
- (C,C) : chacun prend 2 ans → c’est la coopération mutuelle (meilleur résultat collectif).
- (T,C) : le traître est libéré (0 an), l’autre prend 10 ans → tentation de trahir.
- (T,T) : chacun prend 5 ans → résultat sûr mais pire que s’ils avaient coopéré.
Ici, la logique individuelle pousse chacun à trahir, car c’est toujours la meilleure option personnelle… même si collectivement, coopérer aurait été meilleur.
Regardons le raisonnement pour A :
- Si B coopère (se tait) :
- A prend 2 ans en coopérant.
- A prend 0 an en trahissant.
=> A préfère trahir.
- Si B trahit (dénonce) :
- A prend 10 ans en coopérant.
- A prend 5 ans en trahissant.
=> A préfère encore trahir.
Donc, quelle que soit la décision de B, A trahit toujours.
Par symétrie, B raisonne de la même façon et trahit lui aussi.
Le couple (T,T) est donc l’équilibre de Nash : chacun agit «rationnellement» pour lui-même, mais le résultat collectif (5 ans chacun) est moins bon que s’ils avaient coopéré (2 ans chacun).
C’est tout le paradoxe du dilemme du prisonnier : la logique individuelle mène à un mauvais résultat collectif.
2. Exemples concrets d’application
a. Entreprises (entente ou concurrence sur les prix)
Deux entreprises peuvent :
- Coopérer (C) → maintenir des prix élevés (entente tacite).
- Tromper (T) → baisser agressivement ses prix pour capter le marché.
Résultats :
- [math]C,C[/math] → marges correctes pour les deux ([math]3;3[/math]).
- [math]T,C[/math] → l’entreprise qui baisse ses prix prend tout le marché ([math]5;0[/math]).
- [math]T,T[/math] → guerre des prix, marges très faibles ([math]1;1[/math]).
La tentation individuelle pousse vers ([math]T,T[/math]), alors que ([math]C,C[/math]) serait meilleur pour tous.
b. Politique internationale (climat, armement)
Deux États doivent décider de réduire leurs émissions :
- [math]C,C[/math] → bénéfice climatique commun ([math]3;3[/math]).
- [math]T,C[/math] → l’État qui ne fait rien profite du sacrifice de l’autre ([math]5;0[/math]).
- [math]T,T[/math] → inaction générale, la situation s’aggrave ([math]1;1[/math]).
Résultat : chacun a intérêt à laisser l’autre faire l’effort… ce qui bloque souvent l’action collective.
c. Écosystèmes (coopération vs triche)
Dans la nature, certaines espèces coopèrent (pollinisateurs/plantes, nettoyeurs/poissons). Mais d’autres peuvent «tricher» : profiter sans contribuer.
- Tant que la coopération domine → le système est stable et prospère.
- Si la triche se généralise → tout le système s’effondre (analogue à [math]T,T[/math]).
II. Le dilemme itéré : stratégies et résultats
1. Jouer plusieurs fois change tout
Dans le dilemme du prisonnier « simple » (vu en I), chaque joueur prend sa décision une seule fois : coopérer (C) ou trahir (T).
Mais si le jeu est répété plusieurs fois entre les mêmes joueurs, la situation change complètement.
- Si un joueur trahit aujourd’hui, l’autre peut le punir au prochain tour.
- Inversement, si les deux coopèrent, ils peuvent construire une relation de confiance sur le long terme.
On appelle cela le dilemme du prisonnier itéré.
🔒 La suite est réservée aux membres Premium
Accédez à l’intégralité des 40 sujets rédigés pour le Grand Oral de Maths.
Je veux le Pack Premium