Le dilemme du prisonnier

Introduction

On pense souvent que les mathématiques ne servent qu’à faire des calculs, mais elles permettent aussi d’analyser nos choix et nos comportements (#théorie des jeux). Le dilemme du prisonnier est un exemple célèbre : il montre que ce qui paraît rationnel individuellement peut conduire à un mauvais résultat collectif.

Ce problème n’est pas seulement une curiosité : il s’applique à des situations réelles comme la concurrence entre entreprises, la coopération entre États ou même nos relations quotidiennes. C’est ce qui le rend super intéressant à explorer.

I. Le dilemme du prisonnier : un problème de probabilité et de stratégie

1. Modèle mathématique du dilemme

Imaginons deux prisonniers (A et B) arrêtés ensemble. La police les interroge séparément et leur propose le marché suivant :

  • Si les deux se taisent (coopèrent) → chacun prend une peine réduite.
  • Si l’un dénonce (trahit) pendant que l’autre se tait → le traître est libéré, l’autre prend la peine maximale.
  • Si les deux dénoncent → ils sont tous les deux condamnés à une peine assez lourde, mais moins que la peine maximale.

On peut traduire ce scénario par un tableau de gains.

On note les résultats sous la forme (peine de A ; peine de B), en nombre d’années de prison :

Prisonnier B : Coopère (se tait)Prisonnier B : Trahit (dénonce)
Prisonnier A : Coopère(2 ans ; 2 ans)(10 ans ; 0 an)
Prisonnier A : Trahit(0 an ; 10 ans)(5 ans ; 5 ans)

On retrouve le schéma classique :

  • (C,C) : chacun prend 2 ans → c’est la coopération mutuelle (meilleur résultat collectif).
  • (T,C) : le traître est libéré (0 an), l’autre prend 10 ans → tentation de trahir.
  • (T,T) : chacun prend 5 ans → résultat sûr mais pire que s’ils avaient coopéré.
!
Un équilibre de Nash, c’est une situation où aucun joueur n’a intérêt à changer seul sa décision.

Ici, la logique individuelle pousse chacun à trahir, car c’est toujours la meilleure option personnelle… même si collectivement, coopérer aurait été meilleur.

Regardons le raisonnement pour A :

  • Si B coopère (se tait) :
    • A prend 2 ans en coopérant.
    • A prend 0 an en trahissant.
      => A préfère trahir.
  • Si B trahit (dénonce) :
    • A prend 10 ans en coopérant.
    • A prend 5 ans en trahissant.
      => A préfère encore trahir.

Donc, quelle que soit la décision de B, A trahit toujours.

Par symétrie, B raisonne de la même façon et trahit lui aussi.

Le couple (T,T) est donc l’équilibre de Nash : chacun agit «rationnellement» pour lui-même, mais le résultat collectif (5 ans chacun) est moins bon que s’ils avaient coopéré (2 ans chacun).

C’est tout le paradoxe du dilemme du prisonnier : la logique individuelle mène à un mauvais résultat collectif.

?
L’exemple avec les prisonniers aide à comprendre la logique du jeu, mais on n’est pas tous concernés par une garde à vue 😅. Heureusement, on retrouve le même dilemme dans plein de situations de la vie quotidienne, parfois beaucoup plus proches de nous…

2. Exemples concrets d’application

a. Entreprises (entente ou concurrence sur les prix)

Deux entreprises peuvent :

  • Coopérer (C) → maintenir des prix élevés (entente tacite).
  • Tromper (T) → baisser agressivement ses prix pour capter le marché.

Résultats :

  • [math]C,C[/math] → marges correctes pour les deux ([math]3;3[/math]).
  • [math]T,C[/math] → l’entreprise qui baisse ses prix prend tout le marché ([math]5;0[/math]).
  • [math]T,T[/math] → guerre des prix, marges très faibles ([math]1;1[/math]).

La tentation individuelle pousse vers ([math]T,T[/math]), alors que ([math]C,C[/math]) serait meilleur pour tous.

b. Politique internationale (climat, armement)

Deux États doivent décider de réduire leurs émissions :

  • [math]C,C[/math] → bénéfice climatique commun ([math]3;3[/math]).
  • [math]T,C[/math] → l’État qui ne fait rien profite du sacrifice de l’autre ([math]5;0[/math]).
  • [math]T,T[/math] → inaction générale, la situation s’aggrave ([math]1;1[/math]).

Résultat : chacun a intérêt à laisser l’autre faire l’effort… ce qui bloque souvent l’action collective.

c. Écosystèmes (coopération vs triche)

Dans la nature, certaines espèces coopèrent (pollinisateurs/plantes, nettoyeurs/poissons). Mais d’autres peuvent «tricher» : profiter sans contribuer.

  • Tant que la coopération domine → le système est stable et prospère.
  • Si la triche se généralise → tout le système s’effondre (analogue à [math]T,T[/math]).

II. Le dilemme itéré : stratégies et résultats

1. Jouer plusieurs fois change tout

Dans le dilemme du prisonnier « simple » (vu en I), chaque joueur prend sa décision une seule fois : coopérer (C) ou trahir (T).

!
Le problème, c’est qu’il n’y a aucune conséquence future : la tentation de trahir domine toujours.

Mais si le jeu est répété plusieurs fois entre les mêmes joueurs, la situation change complètement.

  • Si un joueur trahit aujourd’hui, l’autre peut le punir au prochain tour.
  • Inversement, si les deux coopèrent, ils peuvent construire une relation de confiance sur le long terme.

On appelle cela le dilemme du prisonnier itéré.

Cette version ouvre la porte à différentes stratégies :

  • «toujours coopérer» (jouer C à chaque fois),
  • « toujours trahir» (jouer T systématiquement),
  • «rancunière» (coopérer, mais trahir dès que l’autre trahit une fois),
  • «lunatique» (coopérer ou trahir au hasard),
    etc.

L’idée clé est que la mémoire du passé influence le futur : la répétition permet de récompenser la coopération et de sanctionner la trahison.

2. Le tournoi d’Axelrod (1980)

Pour étudier ce phénomène, le politologue Robert Axelrod a organisé en 1980 un tournoi informatique. Il a invité des chercheurs à programmer environ 60 stratégies différentes du dilemme du prisonnier itéré. Les stratégies se sont affrontées les unes contre les autres sur un grand nombre de parties.

Résultat surprenant : la stratégie Donnant-Donnant (ou Tit for Tat) a dominé.

  • Elle commence toujours par coopérer.
  • Ensuite, elle imite le coup de l’autre joueur :
    • si l’autre coopère → je coopère,
    • si l’autre trahit → je trahis au coup suivant.

Cette stratégie est à la fois ferme (elle punit immédiatement une trahison) et ouverte (elle pardonne si l’autre redevient coopératif).

Enseignement : dans un jeu répété, la coopération peut devenir une stratégie stable et optimale.

Les maths montrent donc qu’à long terme, être coopératif peut rapporter plus que chercher systématiquement à exploiter l’autre.

?
Super intéressant non ? 😀

III. Enseignements pour la vie réelle

1. L’altruisme peut être rationnel

À première vue, les mathématiques du dilemme du prisonnier simple montrent que trahir est toujours la stratégie la plus «rationnelle». Cela peut sembler cohérent avec une vision de la sélection naturelle : chacun maximise son gain individuel, même si le collectif en souffre.

Mais les expériences et simulations (comme le tournoi d’Axelrod) prouvent le contraire : sur le long terme, ce sont souvent les stratégies coopératives qui dominent.

?
Pourquoi ? Parce que coopérer favorise la confiance, stabilise les interactions et augmente la prospérité du groupe.

Robert Axelrod a montré que les meilleures stratégies avaient quatre points communs :

  • ne pas être le premier à trahir,
  • réagir au comportement de l’autre,
  • ne pas chercher à battre l’autre systématiquement,
  • éviter les stratégies trop complexes.

Résultat paradoxal : ce que l’on pourrait appeler «altruisme» n’est pas forcément naïf ou faible, c’est au contraire une stratégie gagnante à long terme.

2. Parallèles avec la société et la vie quotidienne

Ces quatre caractéristiques ne concernent pas seulement la théorie des jeux : elles peuvent s’appliquer dans la vie réelle.

  • Être gentil → commencer une relation sur la confiance (en entreprise, en amitié, en politique…).
  • Être réactif → savoir répondre quand on est «trahi», sans pour autant rester passif.
  • Ne pas être jaloux → chercher à avancer ensemble plutôt qu’à écraser l’autre.
  • Rester simple → éviter les stratégies compliquées qui finissent par se retourner contre soi (ne pas jouer au plus malin).

Le dilemme du prisonnier nous apprend que ces principes ne sont pas seulement des «conseils de sagesse» : ce sont les mathématiques qui démontrent qu’ils fonctionnent !

Conclusion

Le dilemme du prisonnier nous montre qu’à long terme, la coopération est souvent plus payante que la trahison. Comme quoi, parfois, les maths prouvent qu’il vaut mieux jouer collectif.

On espère que ce sujet vous aidera, et que vous saurez l’exploiter au mieux pour briller à votre épreuve !

Mises à jour de la newsletter

Saisissez votre adresse e-mail ci-dessous et abonnez-vous à notre newsletter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

error: Content is protected !!