VĚZŇOVO DILEMA Markéta Reichenbachová II.B Gymnázium a Střední odborná škola Cihelní 410
Vězňovo dilema je typ hry s nenulovým součtem, ve které mají oba hráči dvě možnosti – spolupracovat (cooperate) nebo zradit (defect). V rámci zařazení v teorii her ho označujeme jako hru s nenulovým součtem, ale také jako hru s neúplnými informacemi, hru symetrickou, hru nekooperativní a původně jako hru jednokolovou. Jedná se o skupinu lidí, jejíž členové usilují pouze o vlastní prospěch a cíle, ale mohou tak mít menší úspěch, než kdyby jedinci nesledovali své vlastní cíle individuálně, ale jako skupina. HISTORIE Počátek této struktury byl poprvé diskutován již v roce 1950, a to matematiky Melvinem Drescherem
a Merrillem Floodem. Název "Vězňovo dilema" byl použit o několik let později matematikem A. W. Tuckerem, který chtěl problém nastínit a přiblížit psychologům a veřejnosti, vymyslel tak krátký příběh, jejž použil k ilustraci: Jsou zatčeni dva pachatelé, 1 a 2, za loupežné přepadení banky, a umístěni v separátních oddělených celách. Žalobce však nemá dostatečné důkazy k jejich odsouzení z trestného činu, nýbrž pouze z přestupku, za který by dostali např. rok vězení. Navrhne jim tedy dvě možnosti – přiznat se nebo zůstat mlčet. Pokud se jeden přizná, ale jejich komplic zůstane mlčet, žalobce proti němu stáhne všechna obvinění a použije jeho svědectví k usvědčení jeho spolupachatele, který tak bude odsouzen např. na deset let. Totéž ale platí v opačném případě, takže pokud se přizná pachatel 2, bude zatčen pachatel 1. V případě, že se přiznají oba, bude mít žalobce dvě doznání, tedy k tomu přihlédne a dostanou oba středně vysoký trest, což jsou např. tři roky. Pokud budou oba ale mlčet, bude je moct žalobce odsoudit pouze za nedovolené držení střelné zbraně.
Vězeň 2
Mlčí Přizná se
Vězeň 1 Mlčí Přizná se 1, 1 0, 10 10, 0 3, 3
DOMINANTNÍ STRATEGIE Dominantní strategie, neboli nespolupráce, je taková, kdy jeden vězeň maximalizuje svůj užitek (a tím tak minimalizuje svůj trest) bez ohledu na to, jakou strategii zvolí druhý vězeň. Z tabulky vyplývá, že když bude pachatel 2 mlčet, bude pro pachatele 1 lepší mluvit, jelikož pak bude
volný. Pokud bude pachatel 2 mluvit, bude pro pachatele 1 rovněž lepší mluvit, protože pak dostane 3 roky namísto deseti. Stejně bude uvažovat i druhý pachatel a hra dopadne tak, že budou vypovídat oba. Postup pro určení dominantní strategie je:
Když vězeň 2 zvolí horní řádek, vězeň 1 zvolí pravý sloupec, protože dostane menší trest. Když vězeň 2 zvolí spodní řádek, vězeň 1 opět zvolí pravý sloupec, protože dostane menší trest.
Z toho tedy vyplývá, že pro vězně 1 je dominantní strategií zvolit pravý sloupec.
NASHOVA ROVNOVÁHA Nashova rovnováha se určuje podobně jako dominantní strategie, alespoň v prvním kroku. Ve druhém kroku se ale ptáme na to, co se stane, když se situace obrátí. 2 2, 1 1 0, 0
0, 0 1, 2
Postup je tedy následující:
Když 1 zvolí horní řádek, 2 zvolí levý sloupec, protože nabízí vyšší výplatu. Když 2 zvolí levý sloupec, 1 zvolí horní řádek, protože nabízí vyšší výplatu. Když 1 zvolí spodní řádek, 2 zvolí pravý sloupec, protože nabízí vyšší výplatu. Když 2 zvolí pravý sloupec, 1 zvolí spodní řádek, protože nabízí vyšší výplatu.
Tento postup obsahuje dvě Nashovy rovnováhy. OBECNÁ FORMA
1 1 R, R 2 S, T
2 T, S P, P
Obecná forma je nejjednodušší forma Vězňova dilematu. Splňuje podmínku: T > R > P > S. Každé z možných rozhodnutí hráčů ovlivňují příslušné buňky:
R značí odměnu, kterou získají oba za spolupráci P je částka, kterou oba obdrží za zradu T znázorňuje pokušení a je nejvýhodnější situací za předpokladu, že hráč zradí pouze sám, S je výnos, který jedinec dostane, pokud se pouze on sám snaží spolupracovat
Za předpokladu, že jednotlivé výnosy T, R, P, S mají stejnou hodnotu, tudíž i ordinální význam, máme zde podobnou strukturu dilematu jako v Tuckerově příběhu. Pokud předpokládáme, že osoba ve sloupci bude spolupracovat, potom hráč zastupující řádek může obdržet R za spolupráci nebo T za pokušení podrazit. Vzhledem k podmínce T > R je pro něj výhodnější nespolupracovat. Obdobná je situace i v případě, že “sloupec” nebude spolupracovat. V takovém případě by druhá osoba mohla získat S nebo P. Vezmeme-li opět v potaz podmínku P > S, je jasné, že je pro něj znovu výhodnější podrazit. Můžeme tedy říci, že pro subjekt “řádek” je strategie 2 výhodnější než strategie 1. V případě “sloupce” je situace obdobná - bez ohledu na druhého hráče je pro něj výhodnější zradit. Z toho vyplývá, že dva racionálně uvažující hráči se navzájem podvedou a budou mít pouze P, zatímco iracionální jedinci budou nejspíše kooperovat a jejich výnos bude R. Ve standardním zpracování předpokládá teorie her racionalitu a znalost obecných vědomostí. Každý hráč je chytrý a ví, že i další hráči jsou inteligentní a že ostatní zároveň předpokládají, že i on je inteligentní. Ostatní hráči také vědí, jak si druzí cení jednotlivých výsledků. Z toho tedy plyne, že výsledek (2,2) je v této hře jediným výsledkem, kde si každý z hráčů může jednostranným odchýlením od své strategie jen pohoršit. Tato situace nám ukazuje dilema, které vzniká mezi vězni proto, že se nemohou mezi sebou domluvit na již zmíněných strategiích. Pro každého z nich je nejlepší se přiznat a zároveň udat toho druhého. Jenomže žádný z vězňů neví, jak bude reagovat druhý vězeň. Kdyby se mohli domluvit a hra by se tak stala kooperativní tak by nejlepšími strategiemi pro oba vězně bylo (zapírat, zapírat), přičemž by oba ve vězení strávili R let. Jedná se však o nekooperativní hru, tudíž se vězni mezi sebou nemohou domluvit a taky si nemohou být jistí solidaritou toho druhého. Vzniká zde tak riziko zrady. Oba dva vězni mají strach, že když bude jeden z nich zapírat, tak ten druhý zradí a udá ho. V tomto případě by si vězeň, který se přiznal, odseděl pouze T let, kdežto udaný vězeň by strávil ve vězení daleko více, a to S let. Proto si každý zvolí jistotu tím, že se přizná a bude odsouzen na P let, než aby byl zrazen a strávil tak ve vězení podstatně delší dobu.
OPAKOVANÉ VĚZŇOVO DILEMA K tomuto dilematu dochází, jestliže se hra hraje opakovaně. Hráč tu má možnost „potrestat“ druhého za předchozí nekooperativní hru. Zde se racionální strategií může stát spolupráce. Čím více se počet opakování blíží k nekonečnu, tím více Nashova rovnováha směřuje k Paretovu optimu.
PARETOVO OPTIMUM Paretovské optimum poprvé formuloval italský ekonom Vilfredo Pareto. Je to takový stav společnosti (z hlediska ekonomického), kdy žádný jedinec nebo skupina již nemůže dosáhnout lepšího postavení bez toho, že by se naopak postavení někoho jiného zhoršilo. Je to tedy jakýsi rovnovážný stav, kdy, pokud se někdo chce mít ještě lépe, než na tom je, může tak učinit jen na úkor někoho jiného. APLIKACE VĚZŇOVA DILEMATU Aplikace Vězňova dilematu nalézáme hlavně v matematice, ekonomii, sociologii a v evoluční biologii. Tento typ nekooperativní hry se v hojné míře vyskytuje i v našem reálném životě, a to hlavně v těch případech, kdy se člověk rozhoduje sám za sebe bez spolupráce s ostatními lidmi. Jedná se většinou o případy, kdy samotný jedinec váhá, jestli se má zachovat sobecky vůči ostatním lidem nebo jim vyjít vstříc. Existují však některé lidské vlastnosti (nesolidarita, ziskuchtivost, nedůvěřivost), díky kterým se daný jedinec zachová sobecky. Zachovat se sobecky je pro daného člověka totiž často tou nejlepší variantou. Tuto variantu však použijí i ostatní lidé, kteří budou brát v úvahu také již zmíněné špatné vlastnosti, a proto „zachovat se sobecky“ nebude mít takový výhodný výsledek, jako kdyby tuto variantu použil jedinec sám. Obecně vzato, každá situace v životě, kdy jste v pokušení něco udělat, ale víte, že jakmile to udělají všichni, bude to problém, je jasný příklad Vězňova dilematu. Například bychom nemuseli zamykat naše auta, pokud bychom všem věřili, že nebudou krást. Tím by se ušetřily velké peníze za pojištění, zabezpečovací systémy a pod., takže by na tom každý jen vydělal. V takovém světě ale jeden člověk vydělá víc, pokud podrazí ostatní a začne auta krást. Ten, kdo jedná sobecky, se chová racionálně. SPOTŘEBA VODY V DOMĚ Vězňovo dilema lze hojně použít i v našem každodenním životě. Představme si dům, který má více než jednoho obyvatele, a ve kterém se celková spotřeba vody dělí rovnoměrně. Pro všechny nájemníky je v jejich nejlepším zájmu šetřit vodou. Jenomže se může stát, že se objeví někdo, kdo šetřit vodou nebude. Voda se však platí rovnoměrně, a tudíž zde vzniká riziko, že ostatní nájemníci, kteří vodou šetřili, budou muset zaplatit i za spotřebu toho, kdo vodou nešetřil. Proto, než aby ostatní doplatili za plýtvání vody jednoho jedince, radši budou plýtvat taky, i za cenu toho, že zaplatí daleko více, než kdyby všichni šetřili. OLIGOPOLY Aplikování Vězňova dilematu můžeme nalézt i v ekonomii. Např. jako oligopol mezi Saudskou Arábií a Íránem. Tyto dvě země spolu uzavřely dohodu, že budou vyvážet menší množství ropy. Rozhodly se tak z toho důvodu, že chtějí, aby ceny ropy ve světě zůstaly vysoké. Velká produkce ropy by totiž měla za následek větší nabídku než poptávku, a musely by snížit cenu za jednotku
(v případě ropy za barel). Protože si Saudská Arábie nemůže být jistá tím, že Írán smlouvu neporuší, zvolí pro jistotu vyšší produkci ropy. Je jasné, že tak jak uvažuje Saudská Arábie, bude uvažovat i Írán. Z toho vyplývá, že obě země smlouvu poruší a budou produkovat ropu ve velkém množství. Výsledkem bude více vyprodukované ropy, ale s nižším ziskem. JESTŘÁB A HRDLIČKA S touto situací se můžeme setkat i v aplikacích neekonomických. Jako aplikaci Vězňova dilematu objevující se v evoluční biologii je uváděn model nazvaný "Jestřáb a hrdlička". Pojmenování je pouze obrazné a má vystihovat způsob chování při konfliktu: jestřáb bojuje vždy tvrdě a vzdává se jen tehdy, je-li vážně zraněn, hrdlička se přímým útokům raději vyhýbá. Jedinci mohou bojovat prakticky o cokoliv, může se jednat např. o potravu, jiného jedince nebo výhodnou oblast pro život. Nejdříve budeme uvažovat chování jestřábů. Budeme brát v potaz, že všichni zástupci jestřábů jsou nebojácní a bojují do konce zbytku svých sil. Proto, když se střetnou proti sobě dva jestřábi, vyhraje každý s pravděpodobností 50%. Naopak, když se proti sobě octnou dva jedinci chovající se jako hrdličky, bojí se boje, a proto budou sdílet oblast společně (rovným dílem). Pokud se střetne jestřáb s hrdličkou, dojde k boji, v němž je hrdlička zabita. Rovnovážnou strategií je dvojice (Jestřáb, Jestřáb), přestože by pro skupinu jako celek bylo výhodnější kooperovat a chovat se jako hrdličky. Nalezená rovnovážná strategie odpovídá tomu, že z evolučního hlediska není strategie hrdlička nikdy tzv. evolučně stabilní, protože populace hrdliček muže být napadena jestřábem, jemuž se v populaci hrdliček daří lépe než hrdličkám samotným.
,,Naučil jsem se prokazovat službu druhému, aniž bych mu ve skutečnosti poskytl jakoukoli laskavost. Předvídám totiž, že mi dotyčný se stejným očekáváním službu oplatí, aby tak zachoval vzájemné poskytování laskavostí se mnou i s druhými. A když jsem mu tedy posloužil a on si užívá výhod vyplývajících z mého činu, pociťuje, že je řada opět na něm, neboť předvídá důsledky, jež by mělo jeho odmítnutí." - David Hume zdroje: http://www.simulace.info/index.php/Prisoner's_dilemma/cs#cite_note-Hedl-2 http://dec59.ruk.cuni.cz/~certik/texty/ct/ctnost03.htm https://cs.wikipedia.org/wiki/V%C4%9Bz%C5%88ovo_dilema https://php.vrana.cz/veznovo-dilema.php