Le dilemme du prisonnier

Introduction

On pense souvent que les mathématiques ne servent qu’à faire des calculs, mais elles permettent aussi d’analyser nos choix et nos comportements (#théorie des jeux). Le dilemme du prisonnier est un exemple célèbre : il montre que ce qui paraît rationnel individuellement peut conduire à un mauvais résultat collectif.

Ce problème n’est pas seulement une curiosité : il s’applique à des situations réelles comme la concurrence entre entreprises, la coopération entre États ou même nos relations quotidiennes. C’est ce qui le rend super intéressant à explorer.

I. Le dilemme du prisonnier : un problème de probabilité et de stratégie

1. Modèle mathématique du dilemme

Imaginons deux prisonniers (A et B) arrêtés ensemble. La police les interroge séparément et leur propose le marché suivant :

  • Si les deux se taisent (coopèrent) → chacun prend une peine réduite.
  • Si l’un dénonce (trahit) pendant que l’autre se tait → le traître est libéré, l’autre prend la peine maximale.
  • Si les deux dénoncent → ils sont tous les deux condamnés à une peine assez lourde, mais moins que la peine maximale.

On peut traduire ce scénario par un tableau de gains.

On note les résultats sous la forme (peine de A ; peine de B), en nombre d’années de prison :

Prisonnier B : Coopère (se tait)Prisonnier B : Trahit (dénonce)
Prisonnier A : Coopère(2 ans ; 2 ans)(10 ans ; 0 an)
Prisonnier A : Trahit(0 an ; 10 ans)(5 ans ; 5 ans)

On retrouve le schéma classique :

  • (C,C) : chacun prend 2 ans → c’est la coopération mutuelle (meilleur résultat collectif).
  • (T,C) : le traître est libéré (0 an), l’autre prend 10 ans → tentation de trahir.
  • (T,T) : chacun prend 5 ans → résultat sûr mais pire que s’ils avaient coopéré.
!
Un équilibre de Nash, c’est une situation où aucun joueur n’a intérêt à changer seul sa décision.

Ici, la logique individuelle pousse chacun à trahir, car c’est toujours la meilleure option personnelle… même si collectivement, coopérer aurait été meilleur.

Regardons le raisonnement pour A :

  • Si B coopère (se tait) :
    • A prend 2 ans en coopérant.
    • A prend 0 an en trahissant.
      => A préfère trahir.
  • Si B trahit (dénonce) :
    • A prend 10 ans en coopérant.
    • A prend 5 ans en trahissant.
      => A préfère encore trahir.

Donc, quelle que soit la décision de B, A trahit toujours.

Par symétrie, B raisonne de la même façon et trahit lui aussi.

Le couple (T,T) est donc l’équilibre de Nash : chacun agit «rationnellement» pour lui-même, mais le résultat collectif (5 ans chacun) est moins bon que s’ils avaient coopéré (2 ans chacun).

C’est tout le paradoxe du dilemme du prisonnier : la logique individuelle mène à un mauvais résultat collectif.

?
L’exemple avec les prisonniers aide à comprendre la logique du jeu, mais on n’est pas tous concernés par une garde à vue 😅. Heureusement, on retrouve le même dilemme dans plein de situations de la vie quotidienne, parfois beaucoup plus proches de nous…

2. Exemples concrets d’application

a. Entreprises (entente ou concurrence sur les prix)

Deux entreprises peuvent :

  • Coopérer (C) → maintenir des prix élevés (entente tacite).
  • Tromper (T) → baisser agressivement ses prix pour capter le marché.

Résultats :

  • [math]C,C[/math] → marges correctes pour les deux ([math]3;3[/math]).
  • [math]T,C[/math] → l’entreprise qui baisse ses prix prend tout le marché ([math]5;0[/math]).
  • [math]T,T[/math] → guerre des prix, marges très faibles ([math]1;1[/math]).

La tentation individuelle pousse vers ([math]T,T[/math]), alors que ([math]C,C[/math]) serait meilleur pour tous.

b. Politique internationale (climat, armement)

Deux États doivent décider de réduire leurs émissions :

  • [math]C,C[/math] → bénéfice climatique commun ([math]3;3[/math]).
  • [math]T,C[/math] → l’État qui ne fait rien profite du sacrifice de l’autre ([math]5;0[/math]).
  • [math]T,T[/math] → inaction générale, la situation s’aggrave ([math]1;1[/math]).

Résultat : chacun a intérêt à laisser l’autre faire l’effort… ce qui bloque souvent l’action collective.

c. Écosystèmes (coopération vs triche)

Dans la nature, certaines espèces coopèrent (pollinisateurs/plantes, nettoyeurs/poissons). Mais d’autres peuvent «tricher» : profiter sans contribuer.

  • Tant que la coopération domine → le système est stable et prospère.
  • Si la triche se généralise → tout le système s’effondre (analogue à [math]T,T[/math]).

II. Le dilemme itéré : stratégies et résultats

1. Jouer plusieurs fois change tout

Dans le dilemme du prisonnier « simple » (vu en I), chaque joueur prend sa décision une seule fois : coopérer (C) ou trahir (T).

!
Le problème, c’est qu’il n’y a aucune conséquence future : la tentation de trahir domine toujours.

Mais si le jeu est répété plusieurs fois entre les mêmes joueurs, la situation change complètement.

  • Si un joueur trahit aujourd’hui, l’autre peut le punir au prochain tour.
  • Inversement, si les deux coopèrent, ils peuvent construire une relation de confiance sur le long terme.

On appelle cela le dilemme du prisonnier itéré.

🔒 La suite est réservée aux membres Premium

Accédez à l’intégralité des 40 sujets rédigés pour le Grand Oral de Maths.

Je veux le Pack Premium

Mises à jour de la newsletter

Saisissez votre adresse e-mail ci-dessous et abonnez-vous à notre newsletter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

error: Content is protected !!