Vězňovo dilěma Vojtěch Ptáčník K tomuto tématu jsem se dostal úplnou náhodou. Měli jsme udělat projekt dle své vlastní volby. V té době jsem vůbec nevěděl, jaké téma si mám zvolit. Jednoho dne nám do školy přinesl náš profesor matematiky knihu o matematice, ve které byly stovky témat všech druhů. Pročítal jsem si témata a hledal právě to, které by mě nejvíce zaujalo. S volbou tématu jsem si dával záležet, když jsem narazil na téma, snažil jsem se zjistit základní informace, zda mě to téma udrží v pozornosti stejně jako název, na který jsem narazil v rejstříku knihy. Vysílen jsem prohlížel seznam, když v tu ránu mi do očí vletěl název „Vězňovo dilema“. „Název jak má být“. Řekl jsem si a hned jsem věděl, co bude předmětem mého projektu. Plný odhodlání jsem začal pročítat internet a nasávat informace. Jako detektivní příběh, mě toto téma nechtělo pustit…
Definice Vězňovo dilema je typ hry s nenulovým součtem (zisk jednoho hráče nemusí pro jiného hráče nutně znamenat ztrátu), ve které mají oba hráči dvě možnosti – kooperovat nebo zradit.
Historie Vězňovo dilema bylo vymyšleno a diskutováno matematiky Melvinem Drescherem a Merrillem Floodem, kteří pracovali na výzkumu v oblasti teorie her ve společnosti RAND, někdy kolem roku 1950. Pojem „vězňovo dilema“ byl pojmenován až matematikem Albertem W. Tuckerem, který chtěl Descherovy a Floodovy myšlenky více zpřístupnit psychologům. Z tohoto důvodu si Trucker vymyslel krátký příběh, který použil k ilustraci: Jsou zatčeni dva pachatelé, A a B, za loupežné přepadení banky a umístěni v separátních oddělených celách. Žalobce však nemá dostatečné důkazy k jejich odsouzení z trestného činu, nýbrž pouze z přestupku, za který by dostali dejme tomu jeden rok vězení. Nabídne tedy každému zvlášť dohodu. Navrhne jim dvě možnosti – přiznat se nebo zůstat mlčet. Dohoda zní asi takto: „Pokud se přiznáte, ale váš komplic zůstane mlčet, vztáhnu proti vám všechna obvinění a použiji vaše svědectví k usvědčení vašeho spolupachatele, který tím bude odsouzen na deset let. Podobně však, pokud se přizná váš komplic a vy zůstanete mlčet, on bude volný, zatímco vy půjdete do vězení. V případě, že se přiznáte oba dva a budu mít dvě doznání, přihlédnu k tomu a oba dostanete středně vysoký trest – tři roky. Pokud ovšem oba zůstanete mlčet, budu vás moci odsoudit pouze za nedovolené držení střelné zbraně.“
Pro zápis můžeme použít výplatní matici 2x2.
Neantagonistické hry U neantagonistických konfliktů jsou zájmy hráčů pouze zčásti protichůdné. Vzájemnou spolupráci se může dojít k navýšení přínosů pro hráče. K těmto konfliktům používáme aparátu dvojmaticových her. Číslo na levé straně sloupců matice je výhra pro hráče 1, číslo na pravé straně je výhra pro hráče 2. Pro větší přehlednost je lepší matice zapisovat do jedné tabulky. Vězňovo dilema je právě jeden z nejvýznamnějších příkladů neantagonistické hry. Pro zajímavost opakem neantagonistické hry je opak antagonistická hra, u které zisk jednoho hráče je zároveň ztráta pro hráče druhého.
Dominantní strategie Může zde nastat dominantní strategie, což znamená nespolupráce. Dominantní strategie nastává tehdy, kdy jeden vězeň maximalizuje svůj užit nebo minimalizuje svůj trest bez ohledu na to, jakou strategii zvolí druhý vězeň. Z tabulky můžeme vidět, že když bude vězeň číslo 2 mlčet, pro vězně číslo 1 je lepší mluvit (bude volný). Pokud bude vězeň číslo 2 mluvit, bude znova lepší pro vězně číslo 1 mluvit (dostane místo 10 roků, 3 roky). To znamená, že pro vězně číslo 1 je dominantní strategií zvolení pravého sloupce.
Nashova rovnováha Nashova rovnováha je takové řešení, pro které platí, že pokud se jeden hráč nebude držet své strategie, zatímco ostatní ano, jeho výhra se sníží nebo v nejlepší případě zůstane stejná. Nashova teorie je vhodným nástrojem pro popsání optimálních strategií jednotlivých hráčů, respektive výsledku hry (základní úkol teorie her).
Vlastnosti Nashovy rovnováhy Z definice vyplývají následující vlastnosti, které slouží k jejímu nalezení a interpretaci:
Nashova rovnováha nikdy neleží v silně dominovaném sloupci. Pokud má hra s konstantním součtem sedlový prvek (prvky), pak rovnováha leží v tomto prvku (prvcích) Nashova rovnováha není Pareto-efektivní. Klasickým případem je vězňovo dilema, ve kterém se hráči bez možnosti kooperace racionálně rozhodnou pro řešení, které je pro oba z hráčů horší, než jiný možný výsledek hry. Každá hra dvou hráčů má alespoň jedno rovnovážné řešení.
Příklad č. 1
Postup:
Když A zvolí horní řádek, co udělá B? Zvolí levý sloupec, protože nabízí vyšší odměnu. Když B zvolí levý sloupec, co udělá A? Zvolí horní řádek, protože nabízí vyšší odměnu. Když A zvolí spodní řádek, co udělá B? Zvolí pravý sloupec, protože nabízí vyšší odměnu. Když B zvolí pravý sloupec, co udělá A? Zvolí spodní řádek, protože nabízí vyšší odměnu.
Tato matice obsahuje 2 Nashovy matice.
Příklad č. 2 Pokud se ani jeden z vězňů nepřizná, dostane každý trest 2 roky. Pokud se přizná jeden z vězňů, stráví ve vězení jen jeden rok, ale jeho spolupachatel 10. Pokud se přiznají oba hráči, stráví každý ve vězení 5 let.
2 1 Zde můžeme využít znalost, že rovnovážné řešení nikdy neleží v silně dominovaném řádku či sloupci. Pro prvního hráče silně dominuje druhý řádek. Tento řádek tedy můžeme vyškrtnout.
2 1 Obdobně pro druhého hráče je druhý sloupec dominantní. To znamená, že druhý sloupec můžeme vyškrtnout také. Tato hra má právě jedno rovnovážné řešení, je dáno volbou "Přiznat" obou hráčů a tedy hodnotou (-5, -5).
Příklad č. 3 – Sedlový bod Nalezení optimální strategie obou hráčů a Nashova rovnováha pro následující jednomaticovou hru:
Prostor strategií prvního hráče je dán vektorem (a, b, c), prostor strategií druhého hráče vektorem (α, β, γ). Výplatní matice určuje výplaty prvního hráče, výplaty druhého hráče jsou opačné (jde o hru s nulovým součtem). Řešení zkusíme nalézt pomocí sedlového bodu = maximum ve sloupci, minimum v řádku). Maximum ve sloupci- červená barva, minimum v řádku- zelený rámeček.
Maximum v prvním sloupci (optimální reakce prvního hráče, pokud druhý hráč zahraje strategii α) je 0, označím červeně. Maximum v druhém sloupci (pokud druhý hráč zahraje strategii β) je 3, označím červeně. Maximum ve třetím sloupci (pokud druhý hráč zahraje strategii γ) je 5, označím červeně. Minimum v prvním řádku (optimální reakce druhého hráče, pokud první hráč zahraje strategii a) je 0, označím zeleným rámečkem. Minimum v druhém řádku (pokud první hráč zahraje strategii b) je -2, označím zeleným rámečkem. Minimum ve třetím řádku (pokud první hráč zahraje strategii c) je -7, označím zeleným rámečkem.
V buňce, kde se řádkové minimum a sloupcové maximum setkají, leží sedlový bod, a tedy i Nashova rovnováha. Ve hře s konstantním součtem mohou nastat následující situace:
Existuje jeden sedlový bod, potom Nashova rovnováha leží v tomto sedlovém bodě. Existuje více sedlových bodů o stejné hodnotě, potom Nashova rovnováha leží v každém z nich. Neexistuje sedlový bod, v tomto případě existuje pouze smíšené řešení.
Aplikace vězňova dilematu Hlavně v matematice, ekonomii, sociologii a v evoluční biologii. Také i v našem reálném životě a to hlavně, když se člověk rozhoduje sám za sebe bez spolupráce s ostatními lidmi. Váhání mezi sobeckým nebo vstřícným rozhodnutím. Pro člověka je nejlehčí variantou zachovat se sobecky. Tuto variantu však použijí i ostatní lidé, kteří budou brát v úvahu špatné vlastnosti člověka, a proto „zachovat se sobecky“ nebude mít takový výsledek, jako kdyby tuto variantu použil jedinec sám.
Spotřeba vody v domě Dům, ve kterém je více než 1 obyvatel. Celková spotřeba vody se dělí rovnoměrně. Pro všechny nájemníky je nejlepší s vodou šetřit. Může se stát, že se objeví někdo, kdo šetřit s vodou nebude. Voda se však platí rovnoměrně, tudíž zde vzniká riziko, že nájemníci, kteří neplýtvají (šetří) budou muset zaplatit i za spotřebu „plýtvače“, tak si řeknou, že budou plýtvat také i za cenu zaplacení většího poplatku. Tuto situaci si můžeme názorně ukázat s nájemníky, kteří budou pouze dva a hodnoty budeme zapisovat číselně.
Když budou šetřit, celkový užitek bude 4 jednotky. Jestliže se jeden nájemce rozhodne plýtvat, klesne užitek druhého nájemce na 2 jednotky, protože zaplatí spotřebu vody za nájemce, který nešetřil. „Plýtvačovi“ vzroste užitek na 5 jednotek, protože za přebytečnou část, kterou vypotřeboval, zaplatil již nájemce s užitkem 2. Ani jeden nájemce nechce riskovat to, že bude platit za druhého a budou plýtvat oba dva. Užitek každého z nich budou 3 jednotky.
Oligopoly =ekonomie Saudská Arábie a Íran spolu uzavřeli dohodu, že budou vyvážet menší množství ropy. Tyto země se rozhodly z důvodu, aby zůstaly ceny ropy ve světe vysoké. Velká produkce ropy by měla za následek větší nabídku než poptávku a cena ropy by klesla. Zde je další graf, který znázorňuje scénáře, které mohou nastat.
Na tomto příkladu vidíme, proč mají oligopoly problém udržet si monopolní zisk. Obě dvě země totiž chtějí mít co největší zisk, a proto si zvolí vysokou produkci. Takže místo toho aby společnosti získávaly 70 miliard dolarů, dostávají pouze 50 miliard dolarů. Platí zde, že oba dva hráči se navzájem „zradí“.
Závody ve zbrojení Studená válka mezi USA a SSSR
Z tabulky je zřejmé, že pro obě dvě země byla dominující strategie zbrojit. Toto mělo za následek neustálé ohrožení a mělo i za následek vysoké náklady vyplývající ze zbrojení. Problém byl v tom, že se nebyli schopni domluvit na povoleném množství vyráběných zbraní. Následek- neustálé zbrojení.
Jestřáb a hrdlička -evoluční biologie Představíme si populaci jednoho druhu, jejíž jedinci se při konfliktech řídí jednou ze dvou strategií, které nazýváme jestřáb a hrdlička. Pojmenování je pouze obrazné a má vyjadřovat způsob chování při konfliktu: jestřáb bojuje vždy tvrdě a vzdává se jen tehdy, je-li vážně zraněn, hrdlička se přímým útokům raději vyhýbá. Prostřednictvím boje se daný jedinec může stát udatnějším. Tuto změnu označíme hodnotou V. Nebo se může zranit a tím přijít o hodnotu, kterou označíme C. Platí V>C. Celková zdatnost poraženého nemusí být nulová, je pouze snížená o tuto hodnotu C, což v realitě může znamenat že jedinec zůstává v horším teritoriu. Nejdříve si představíme chování jestřábů.Všichni zástupci jestřábů jsou nebojácní a bojují do konce zbytku svých sil. Proto, když se střetnou proti sobě dva jestřábi, vyhraje každý s pravděpodobností
50%. Naopak, když se proti sobě octnou dva jedinci chovající se jako hrdličky, bojí se boje, a proto budou sdílet oblast společně (rovným dílem). Pokud se střetne jestřáb s hrdličkou, dojde k boji, v němž je hrdlička zabita. Znázorněno v matici:
Rozhodování v reklamních kampani Cigaretové značky Marlboro a Lucky Strike. Souboj reklam.
Když ani jedna z firem nepoužije reklamu, rozdělí si obě firmy trh na půl. Jestliže budou obě inzerovat svůj výrobek, rozdělí si sice trh opět napůl, ale každá z firem přijde o částku, kterou do reklamy investovala. V případě, že jedna bude inzerovat a druhá ne, plyne jí zisk z přetažení zákazníků od konkurence. „Tato teorie byla otestována v roce 1971, kdy Kongres Spojených států schválil zákon zakazující televizní reklamu na cigarety. K překvapení mnoha přihlížejících nevyužily tabákové společnosti svého značného politického vlivu k tlaku na zrušení tohoto zákona. Když zákon vstoupil v platnost, ubylo reklam na cigarety a zisky tabákových společností rostly. Zákon udělal za tabákové společnosti to, co nedokázaly udělat samy. Vyřešil totiž dilema vězňů tím, že přinutil společnosti k rozsahu výroby jako v podmínkách spolupráce s nízkým rozsahem reklamy a vysokými zisky.“ -Greg Mankiw: Zásady ekonomie
Odkazy: http://www.simulace.info/index.php/Nash_equilibrium/cs
http://www.simulace.info/index.php/Prisoner%27s_dilemma/cs