134: Extorsion et Hiérarchie
November 17, 2014 Lettres Philippe Gouillou one response
Tagged with: IDP • ManagementDes chercheurs ont trouvé comment transformer le Dilemme du Prisonnier (celui-là même à la base du “Win-Win”) en Jeu de l’Ultimatum (qui porte bien son nom). Mais la morale est sauve : les humains montrent une extraordinaire capacité à détecter les tentatives d’extorsion…
Sommaire
- Stratégie d’extorsion au Dilemme du Prisonnier (win-win)
- Vidéo : Extorsion et création de hiérarchie
- Nouveau livre de Dehaene sur la conscience
1. Stratégie d’extorsion au Dilemme du Prisonnier (win-win)
Le Dilemme du Prisonnier
Le Dilemme du Prisonnier (voir Lettre 15) est une modélisation (un “jeu”) à deux où chacun doit choisir entre coopérer et trahir, et où les choix des deux ont une influence sur le paiement obtenu par chacun :
“Chaque joueur se voit offrir simultanément deux options : coopérer ou trahir. Si les deux joueurs coopèrent, ils reçoivent tous les deux la même rétribution, R ; si tous les deux trahissent, ils reçoivent chacun une rétribution plus faible, P. Cependant, si un joueur coopère quand l’autre trahit, le traitre reçoit la rétribution la plus élevée possible, T, et le coopérateur la plus basse possible, S.”
Stewart & Plotkin (2012)[1][2]
Le dilemme est que les chacun a, individuellement, intérêt à trahir, quoi que fasse l’autre, alors que c’est la coopération des deux qui est le plus profitable.
L’origine de la coopération
Ce jeu peut être à un tour (une seule confrontation), ou se reproduire de multiples fois, et dans ce cas le joueur peut avoir la mémoire du coup précédent, voire de tout l’historique. Dans la vraie vie, les joueurs peuvent aussi avoir une Théorie de l’Esprit (“ToM”, présentée Lettre 25.2), c’est-à-dire être capable de se mettre à la place de l’autre, voire essayer de le tromper sur ses intentions.
L’intérêt du jeu répété (“itéré”) est qu’on peut imaginer des règles fixes de choix (on les appelle : “stratégies”). Par exemple, “Je coopère au premier tour et choisit ensuite systématiquement ce qu’a fait l’autre au tour précédent” est la stratégie “Tit For Tat” (T4T, en français : “Donnant-Donnant”) qui est apparue extrêmement efficace face à d’autres stratégies (et même face à elle-même). “Pavlov” et “Graduelle” sont deux formes de Donnant-Donnant qui punissent plus sévèrement la trahison. La stratégie de toujours trahir s’appelle : “Alld” (“All Defection”).
Dans les tournois entre les stratégies, le résultat est mesuré au total de points obtenu par chaque stratégie face aux autres. On s’est aperçu que les meilleures stratégies ne gagnent pas forcément à chaque confrontation (en fait, Donnant-donnant ne fait jamais mieux que son adversaire) mais qui au global accumulent les points.
On peut aussi compliquer le mode de calcul des points pour reproduire un processus évolutionnaire. Il suffit pour ce faire de sélectionner à chaque tour les stratégies en compétition à partir des points obtenus au tour précédent :
“Les résultats obtenus par ces calculs modélisent la sélection naturelle et conduisent à une conclusion étonnante : sauf dans des cas très rares, l’arène finit par n’être occupée que par des stratégies qui ne prennent jamais l’initiative de trahir (c’est le cas de Donnant- donnant, de Graduelle et de Pavlov). Après quelques générations, l’arène est occupée par des stratégies qui ne jouent entre elles que des coups [c, c], donc dans un état de coopération généralisée. Le phénomène est frappant : bien qu’il n’y ait pas d’autorité de contrôle et que la tentation de la trahison soit présente pour tous à chaque coup joué, l’évolution élimine toutes les stratégies qui succombent à cette tentation.”
Pour La Science
Bien sûr, il manque les mutations entre chaque “génération” pour que l’évolution soit véritablement modélisée, mais ce résultat d’une victoire complète de la coopération généralisée est significatif.
Les stratégies ZD
La suite de cette section est réservée aux Abonnés Premium
Si vous êtes abonné : connectez-vous pour avoir accès à toutes les archives ;
Sinon : Utilisez le formulaire de commande en haut à droite de chaque page pour recevoir cette lettre intégrale par email.
Photos
- Vintage Elegance – Splitshire
- Portmeirion aujourd’hui, via Wikipedia : “Portmeirionpiazza”. Chris Jones. Licence CC BY 2.5
2. Vidéo : Extorsion et création de hiérarchie
La suite de cette section est réservée aux Abonnés Premium
Si vous êtes abonné : connectez-vous pour avoir accès à toutes les archives ;
Sinon : Utilisez le formulaire de commande en haut à droite de chaque page pour recevoir cette lettre intégrale par email.
3. Nouveau livre de Dehaene sur la conscience
La suite de cette section est réservée aux Abonnés Premium
Si vous êtes abonné : connectez-vous pour avoir accès à toutes les archives ;
Sinon : Utilisez le formulaire de commande en haut à droite de chaque page pour recevoir cette lettre intégrale par email.
Citation de cette page :
Gouillou, Philippe (2014) : "Lettre Neuromonaco 134: Extorsion et Hiérarchie". (17 Nov 2014) Neuromonaco. Retrieved from https://neuromonaco.com/lettres/lettre134.htm on 20 Dec 2014. 826 words.
[Lettre Neuromonaco 134: Extorsion et Hiérarchie](https://neuromonaco.com/lettres/lettre134.htm). Philippe Gouillou. _Neuromonaco_. 17 Nov 2014
[…] Des chercheurs ont trouvé comment transformer le Dilemme du Prisonnier (celui-là même à la base du “Win-Win”) en Jeu de l'Ultimatum (qui porte bien son nom). Mais la morale est sauve : les humains montrent une extraordinaire capacité à détecter les tentatives d'extorsion… […]