Úvod do teorie her druhé upravené vydání
Martin Dlouhý Petr Fiala
2009
2
Teorie her: analýza konfliktů a spolupráce
Teorie her: analýza konfliktů a spolupráce
3
Obsah Předmluva.......................................................................................................... 5 1. Úvod do teorie her a rozhodování ................................................................. 7 1.1 Vznik, základní pojmy ............................................................................. 7 1.2 Teorie užitku............................................................................................. 9 2. Hry s konstantním součtem ......................................................................... 17 2.1 Definice hry ............................................................................................ 17 2.2 Nashova rovnováha ................................................................................ 20 3. Hry s nekonstantním součtem ..................................................................... 27 3.1 Nekooperativní hra ................................................................................. 27 3.2 Problémy Nashovy rovnováhy ............................................................... 31 3.3 Kooperativní hra dvou hráčů .................................................................. 35 4. Hry v rozvinutém tvaru ............................................................................... 39 4.1 Principy................................................................................................... 39 4.2 Salónní hry.............................................................................................. 41 4.3 Příklad konfliktu dvou firem .................................................................. 44 4.4 Cvičení.................................................................................................... 46 5. Opakované hry ............................................................................................ 47 5.1 Základní pojmy, principy ....................................................................... 47 5.2 Konečně opakované hry ......................................................................... 51 5.3 Nekonečně opakované hry ..................................................................... 52 6. Kooperace ve hře s více hráči ..................................................................... 57 6.1 Koaliční hry ............................................................................................ 57 6.2 Hlasovací hry .......................................................................................... 61 7. Hry s neúplnou informací............................................................................ 73 7.1 Neúplné, nedokonalé a soukromé informace ......................................... 73 7.2 Statická Bayesovská hra ......................................................................... 74 8. Vyjednávání ................................................................................................ 79 8.1 Nashovo vyjednávací řešení ................................................................... 79 8.2 Příklady vyjednávacích her .................................................................... 81 9. Modely nedokonalých trhů ......................................................................... 85 9.1 Nedokonalé trhy ..................................................................................... 85 9.2 Modely oligopolu ................................................................................... 86 9.3 Modely monopolu .................................................................................. 96 9.4 Cvičení.................................................................................................. 101 10. Rozhodování při riziku a neurčitosti ....................................................... 103 10.1 Rozhodování při riziku ....................................................................... 103 10.2 Rozhodování při neurčitosti ............................................................... 104 11. Aukce....................................................................................................... 110 11.1 Typy aukcí .......................................................................................... 110 11.2 Aukce jako Bayesovská hra ............................................................... 112 Literatura ....................................................................................................... 116 Rejstřík .......................................................................................................... 118
4
Teorie her: analýza konfliktů a spolupráce
Teorie her: analýza konfliktů a spolupráce
5
Předmluva Teorie her je vědní obor, který je řazen do matematické ekonomie, ale také do teorie rozhodování a operačního výzkumu. Teorie her se zabývá rozborem širokého spektra rozhodovacích situací s více účastníky (hráči). Pojem „hra“ má v moderní teorii her velmi obecný význam, který nezahrnuje pouze salónní hry typu šachy či poker, nýbrž v podstatě jakoukoli konfliktní situaci mezi jedinci, podniky, armádami, státy, politickými stranami, biologickými druhy. Tato různorodost aplikačních oblastí ukazuje na univerzalitu modelů vyvinutých v rámci teorie her a představuje též zdroj pro tvorbu nových modelů, které by lépe zachytily zvláštnosti určité aplikační oblasti. Teorie her využívá pro zachycení konfliktních situací matematický aparát. Matematika jasně a jednoznačně určuje předpoklady a pravidla hry, tím se vyhýbá skrytým předpokladům a vysvětluje omezení teorie. Samotná matematika však není dostatečným nástrojem, např. při analýze dynamických rozhodovacích situací s mnoha různými účastníky se musíme spoléhat na simulační řešení, neboť analytické řešení není dostupné. V jiných případech se při analýze určitých konfliktních situací pohybujeme na hranici psychologie, kognitivní vědy, biologie a ostatních disciplín. Kombinace vědních oborů obvykle nabízí nové impulsy pro další rozvoj poznání, což zajišťuje, že teorie her zůstává zajímavým a inspirativním oborem. Cílem první kapitoly je představit teorii her jako ekonomickou vědní disciplínu a poukázat na její historické kořeny. Kapitola se též zabývá teorií užitku, popisuje von Neumannovu-Morgensternovu axiomatickou teorii užitku a nejznámější paradoxy teorie užitku. Druhá a třetí kapitola jsou věnovány tzv. hrám v normálním tvaru, které popisují situace, v níž hráči provedou jediné rozhodnutí, a to všichni současně. Druhá kapitola se zabývá hrami s konstantním součtem, které popisují antagonistické konflikty – co jeden hráč získá, druhý ztrácí, takže spolupráce v těchto konfliktech nemá smysl. Základním modelem tohoto druhu konfliktních situací je maticová hra. Třetí kapitola se zabývá hrami s nekonstantním součtem, ve kterých sice každý hráč sleduje své zájmy, ale tyto zájmy nemusí být v přímém protikladu se zájmy ostatních hráčů. Jde tedy o neantagonistický konflikt, jež modelujeme pomocí dvoumaticových her. Čtvrtá kapitola představuje tzv. hry v rozvinutém tvaru. V takových hrách rozumíme pod strategií hráče řadu po sobě následujících rozhodnutí (tahů), přičemž hráči se podle určitých pravidel ve svých tazích střídají. Šachová partie je typickým příkladem hry v rozvinutém tvaru. Pátá kapitola je úvodem do teorie opakovaných her, která se zabývá modelováním konečně či
6
Teorie her: analýza konfliktů a spolupráce
nekonečně opakovaných rozhodovacích situací a studuje, zda opakování rozhodovací situace má vliv na chování hráčů. Šestá kapitola popisuje kooperativní hry s více hráči, kteří mohou vzájemně spolupracovat a utvářet koalice. Cílem kapitoly sedmé je ukázat základní přístupy k rozhodování v konfliktních situacích, ve kterých hráčům nejsou dostupné dokonalé informace. Kapitola osmá se zabývá studiem specifického typu kooperativních her, které modelují vyjednávání hráčů o možné, vzájemně prospěšné spolupráci. Tato část teorie her je známa jako teorie vyjednávání. Devátá kapitola je věnována základním modelům oligopolu a monopolu. Model oligopolu je tradičním příkladem hry s více hráči. V desáté kapitole si vysvětlíme, že rozhodování za rizika a neurčitosti lze dobře popsat i pomocí aparátu teorie her, který modeluje náhodný mechanismus jako dalšího hráče. Poslední, jedenáctá kapitola je úvodem do teorie aukcí.
Teorie her: analýza konfliktů a spolupráce
7
1. Úvod do teorie her a rozhodování 1.1 Vznik, základní pojmy Při studiu ekonomických rozhodovacích situací nemůžeme předpokládat, že jedinec či firma se může volně rozhodovat, aniž svým rozhodnutím vyvolá nějaké protiopatření ze strany okolí. Hypotetická firma Alfa, která zvýší či sníží rozsah výroby nebo cenu výrobku, musí počítat s tím, že konkurenční firmy budou na její rozhodnutí reagovat. Jinými slovy tím říkáme, že firma Alfa není Robinsonem Crusoem na pustém ostrově, a proto není možné hledat optimální strategii k maximalizaci zisku bez nutnosti interakce s dalšími firmami. Konkurenční firmy se tedy nacházejí v konfliktní situaci, v níž každá prosazuje své firemní zájmy. Pokud zájmy firem nejsou zcela protichůdné, může být nakonec řešením pro všechny výhodná spolupráce. Jestliže chce firma Alfa zvolit výrobní strategii, která maximalizuje její zisk, zjistí, že nemá bohužel k dispozici informaci o výrobní strategii konkurenční firmy Beta. Nejlepším způsobem, jak získat nějakou informaci o strategii firmy Beta, je podívat se na stávající situaci z pohledu firmy Beta a předpokládat, že firma Beta rovněž usiluje o maximalizaci zisku. Přitom firma Alfa dojde k poznání, že racionálně uvažující vedení firmy Beta zřejmě také došlo k závěru, že je potřeba se podívat na situaci z pohledu konkurenta, tedy firmy Alfa. Rozbor dané situace z pohledu teorie her poukazuje na to, že optimální strategie pro jednu firmu obdržíme tak, že zároveň stanovíme optimální strategii pro firmu druhou. Rozhodnutí firem je vzájemně propojeno stejně, jako když matematik vyřeší soustavu rovnic o dvou neznámých. Teorie her je ekonomická vědní disciplína, která se zabývá studiem konfliktních rozhodovacích situací. Historicky vzniklý název této disciplíny je poplatný tomu, že teorie her používá terminologii i formální aparát, které jsou založeny na zkoumání jednoduchých modelů konfliktních rozhodovacích situací, jakými jsou různé společenské hry. Mezi první příspěvky do teorie patří práce francouzského matematika A. Cournota (1838), který se zabýval stanovením rozsahu výroby na trhu, na němž existují pouze dvě konkurenční firmy (duopol). Jeho model oligopolu bychom měli nalézt v každé učebnici ekonomie. Základy současné teorie her
8
Teorie her: analýza konfliktů a spolupráce
vznikaly v první polovině 20. století v pracích E. Zermela (1913), E. Borela (1921) a Johna von Neumanna (1928). Přestože některé výsledky z teorie her existovaly již dříve, do povědomí ekonomie a společenských věd vůbec se teorie her jako vědní disciplína dostala až v roce 1944. V tomto roce vyšla kniha Johna von Neumanna a Oskara Morgensterna „Theory of Games and Economic Behavior“ (Teorie her a ekonomické chování), kterou autoři sepsali během druhé světové války v Princentonu ve Spojených státech. Jejich kniha se stala základním dílem („biblí“) teorie her a ustanovila novou ekonomickou vědní disciplínu – teorii her. Kniha se stala „biblí“ i svým rozsahem, neboť svazek obsahoval více než šest set stran textu. Oskar Morgenstern ve svých vzpomínkách uvádí, že při rozhodování o názvu své knihy s Johnem von Neumannem uvažovali kromě názvu Teorie her a ekonomické chování též o názvu Obecná teorie racionálního chování. Dobře, že se tak nestalo, protože jinak by tato vědní disciplína zřejmě přišla o svůj atraktivní název. Ariel Rubinstein v doslovu k vydání u příležitosti šedesátin knihy Teorie her a ekonomické chování píše: „Ten, kdo přišel s názvem teorie her byl génius nejen v matematice, ale také v práci s veřejností (public relations). Představte si, že by se kniha jmenovala Teorie racionality a rozhodování v interaktivních ekonomických situacích. Získala by si kniha a teorie her jako celek takovou popularitu? Slovo hra zní mladě a je důvěrně známé. Každý z nás hraje hry, ať už deskové, počítačové nebo politické.“ Teorie her se původně zabývala společenskými (salónními) hrami (šachy, poker atd.), což se odrazilo v poněkud odlišném názvosloví, než jsou ekonomové běžně zvyklí. Proto začneme výklad malým slovníčkem (tabulka č. 1.1), abychom si vyjasnili význam základních pojmů. Pojem hra má velmi obecný význam, který nezahrnuje pouze salónní hry typu šachy či poker, nýbrž v podstatě jakoukoli konfliktní situaci mezi dvěma a více účastníky (jedinci, podniky, armádami, státy, politickými stranami, biologickými druhy). Účastníci konfliktní rozhodovací situace jsou hráči. Každý hráč vybírá strategii ze svého prostoru strategií podle hodnot výplatní funkce. Výplatní funkce určitého hráče závisí nejen na rozhodnutí hráče samotného, ale také na rozhodnutí ostatních hráčů. Výplatní funkce daného hráče proto musí určit výhru hráče pro všechny možné kombinace rozhodnutí všech hráčů. Strategie, která hráči v dané konfliktní situaci (hře) zajišťuje nejvyšší dosažitelnou hodnotu výplatní funkce, je optimální strategií. Prohlásíme-li o
Teorie her: analýza konfliktů a spolupráce
9
účastníku konfliktu, že je inteligentním hráčem, předpokládáme, že má dokonalé informace o hře a chová se tak, aby maximalizoval hodnotu výplatní fukce (svůj užitek, zisk, výhru). Je to stejné jako kdybychom v ekonomii řekli, že je racionální. Tabulka č. 1.1: Základní pojmy teorie her TEORIE HER
EKONOMICKÁ REALITA
hra
rozhodovací situace, konflikt
hráč
účastník konfliktu, rozhodovatel, firma, jedinec, politická strana konkrétní alternativa, kterou může hráč zvolit hráčem zvolená alternativa, která je pro něj nejvýhodnější seznam všech možných alternativ, které jsou hráči dostupné výsledek hry, tj. užitek, výhra hráče v závislosti na zvolených strategiích účastník konfliktu má dokonalé informace a maximalizuje výhru
strategie optimální strategie prostor strategií výplatní funkce inteligentní hráč
Jsou-li zájmy hráčů v přímém protikladu, tzn. jeden účastník ztrácí právě to, co druhý získává, mluvíme o antagonistickém konfliktu. Při rozhodování se často setkáváme s případy, kdy každý z účastníků sleduje své vlastní zájmy, ale tyto zájmy nemusí být v přímém protikladu, potom mluvíme o neantagonistickém konfliktu. U neantagonistických konfliktů je důležité rozlišit dva případy, zda hráči mají nebo nemají možnost uzavírat před volbou strategií závazné smlouvy o tom, jakou volbu učiní. V prvním případě mluvíme o kooperativní teorii, v druhém o nekooperativní teorii.
1.2 Teorie užitku Aby hráč mohl rozhodnout, která strategie je pro něj optimální, musí být schopen porovnat výsledky různých strategií. V teorii her bude mít výsledek hry číselnou hodnotu, kterou získáme z výplatní funkce hráče. V tom případě je rozhodování už jednoduché, neboť racionální hráč vybere maximální hodnotu. Jenže odkud se taková číselná hodnota vezme a je vždy možné
10
Teorie her: analýza konfliktů a spolupráce
výsledek hry ohodnotit číslem? Pro odpovědi na dané otázky se potřebujeme dozvědět něco o teorii užitku. Teorie užitku je součástí ekonomické teorie, kde slouží především k vysvětlení spotřebitelského chování. Pojem užitek umožňuje analýzu rozhodnutí o tom, jaké statky a služby (a v jakém množství) si spotřebitel při omezeném rozpočtu pořídí. Užitkem nazýváme stupeň uspokojení ze spotřeby určitého statku (obecněji z určité události), což je pojem velmi obecný, uměle definovaný ekonomickou vědou, nikoliv psychologií či jinou příbuznou vědou. Jedinec zakoupením a spotřebou statků a služeb získá určité uspokojení, takže statky a služby, které poslouží k dosažení tohoto účelu (uspokojení), jsou pro jedince užitečné. Pro někoho jiného však může mít spotřeba těchto statků či služeb užitek minimální. Užitek je proto pojem subjektivní, mezi dvěma jedinci neporovnatelný. Ekonomičtí teoretikové se dělí do dvou skupin v názoru na to, do jaké míry je užitek měřitelný. Jedna část teoretiků zastává názor, že jedinec je schopen vyjádřit užitek ze statku určitým číslem, případně dokáže říci, o kolik či kolikrát je pro něj jeden statek užitečnější než jiný. Tento názor se v ekonomii označuje jako kardinalistická teorie užitku. Druhá část teoretiků se domnívá, že jedinec je při porovnání různých statků nanejvýše schopen určit, zda je určitý statek užitečnější než jiný, ale není již schopen určit o kolik či kolikrát. Tento pohled je označován jako ordinalistická teorie užitku. Teorie užitku je pro teorii her důležitá při konstrukci výplatních funkcí hráčů. V některých případech je konstrukce výplatní funkce snadná, neboť výhru, remízu a prohru můžeme vyjádřit jako hodnoty +1, 0 a -1. Jestliže jde o firmu, běžně vystačíme s hodnotami v peněžních jednotkách. I když u rozhodování jedinců je možné v mnohých situacích použít rovněž peněžních jednotek, správně by výplatní funkce měla vždy obsahovat užitky jedinců z jednotlivých variant. Teorie očekávané hodnoty, která byla původním přístupem pro hodnocení variant v případě rozhodování za rizika, předpokládá, že očekávanou hodnotu je možné vypočítat jako vážený průměr hodnot všech možných výsledků, kde váhy představují pravděpodobnosti jednotlivých výsledků. Daniel Bernoulli v roce 1738 prezentoval a navrhl řešení problému, dnes známému jako Petrohradský paradox, na kterém ukázal, že teorie očekávané hodnoty není dostatečná pro vysvětlení rozhodování jedinců za rizika.
Teorie her: analýza konfliktů a spolupráce
11
Petrohradský paradox Předpokládejme hypotetickou hernu nabízející hru, kterou má právo jednou hrát každý hráč a která se hraje podle dosti zajímavých pravidel. Bankéř hází mincí, dokud poprvé nepadne hlava, když hlava padne v n-tém hodu, vyplatí bankéř hráči výhru ve výši 2n Kč. Hrát tuto hru je pro hráče výhodné, protože i v nejhorším případě získá alespoň 2 Kč, ale v případě štěstí může vyhrát daleko více. Hráč má právo vzdát se nabízené hry a požadovat za odstoupení jakoukoli peněžitou částku. Bankéř má však právo na tuto částku nepřistoupit, pokud se mu bude zdát jako příliš vysoká. V tom případě se bude hrát uvedená hra (proběhne náhodný pokus s mincí). Když hráči požadují přiměřené částky, např. 8 Kč, bankéř přistoupí na jejich vyplacení. Jak však hráči a bankéř stanoví, co je přiměřená částka? Podle teorie očekávané hodnoty by při náhodných výhrách měl hráč požadovat a bankéř přijmout peněžní částku přibližně rovnou střední hodnotě výhry. Menší odchylky od střední hodnoty lze interpretovat jako různý postoj hráčů k riziku. Vypočteme tedy střední hodnotu výhry, kterou získá hráč v této hře. K tomu, aby hráč vyhrál 2n Kč, musí se objevit v náhodném pokusu (n–1)-krát orel a v n-tém hodu hlava. Tento jev má na poctivé minci pravděpodobnost (1/2)n. Střední hodnota výhry (očekávaná hodnota podle teorie očekávané hodnoty) je rovna: n
1 1 1 1 1 2 + 4 + 8 + 16 + ... + 2 n + ... = 1 + 1 + 1 + 1 + ... 2 4 8 16 2
= ∞.
Bankéř by měl tedy podle teorie hráči vyplatit libovolně velkou částku hráčem požadovanou a být spokojen, že hernu ochránil před potenciálně ještě vyšší výhrou. To však bankéř ve skutečnosti neudělá a příliš velkou částku odmítne. To si uvědomuje i hráč, takže podle toho musí volit svou strategii. Daniel Bernoulli navrhl vysvětlení situace, v níž se bankéř ani hráč neřídí střední hodnotou, pomocí úvahy o užitečnosti peněz. Když je člověk poměrně bohatý, přináší mu zvýšení jeho bohatství o jednu peněžní jednotku menší užitek, než když je chudý. Užitek z peněz tedy s jejich množstvím klesá. Místo peněžních částek bychom do výpočtu očekávané hodnoty měli používat peněžní částky transformované určitou konkávní funkcí (Bernoulli pracoval s logaritmickou funkcí), kterou dnes nazýváme jako užitková funkce. Rozhodování se řídí nikoliv očekávanou hodnotou, ale očekávaným užitkem.
12
Teorie her: analýza konfliktů a spolupráce
Teorie očekávané hodnoty byla nahrazena teorií očekávaného užitku (expected utility theory, EUT). Petrohradský paradox je pomocí teorie očekávaného užitku vysvětlen tak, že lidé se nerozhodují podle střední hodnoty peněžních částek, ale podle střední hodnoty užitku z těchto peněžních částek. Dobře zvolená užitková funkce zajistí, že střední hodnota užitku již neroste do nekonečna. Jestliže hráč požaduje odstupné například ve výši 10 Kč, znamená to, že pro jeho individuální funkci užitku platí: n
1 1 1 u (10) = u (2) + u (4) + ... + u (2 n ) + ... 2 4 2 Axiomatizace teorie užitku John von Neumann a Oskar Morgenstern navrhli axiomatickou teorii užitku, která vychází z teorie očekávaného užitku, v monografii Teorie her a ekonomické chování. V práci ukazují, že lineární užitková funkce u popisující soustavu preferencí existuje, pokud soustava preferencí splňuje podmínky vyjádřené souborem několika axiomů. Takto definovaná užitková funkce je známa jako von Neumannova-Morgensternova užitková funkce nebo se ztotožňuje s teorií očekávaného užitku, takže autor dovolávající se na teorii očekávaného užitku má na mysli von Neumannovu-Morgensternovu axiomatizace této teorie. Možnost měřitelnosti užitků odvozují von Neumann a Morgenstern pomocí pravděpodobnostního přístupu. Uvažujme události A, B a C, přičemž jedinec preferuje A před B a B před C. Jestliže je možné uvažovat kombinaci (loterii), ve které vzájemně neslučitelné události A nebo C nastanou s pravděpodobností 0,5, je též možné kombinovat užitky z těchto událostí, ať už jsou jakékoliv. Když je událost B preferována před pravděpodobnostní kombinací událostí A a C v poměru (0,5; 0,5), znamená to, že událost B je méně vzdálená od události A než od C. Pokud přijmeme výše uvedenou operaci, je možné soustavu preferencí vyjádřit numericky. Dosazováním různých pravděpodobností událostí A a C, které označíme α a 1-α, určíme polohu B vůči A a C. Již víme, že událost B je preferována před kombinací 0,5A+0,5C, takže stačí pokračovat otázkou, zda je událost B preferována před kombinací 0,6A+0,4C atd. Uvažujme soustavu (abstraktních) užitků U s prvky u, v, w… V soustavě U je dána relace u>v (čti u je preferováno před v) a pro jakékoli číslo α (0<α<1) je dána operace αu+(1-α)v (je možné kombinovat u a v s pravděpodobnostmi α a
Teorie her: analýza konfliktů a spolupráce
13
1-α). Numerické vyjádření užitků je možné tehdy, pokud soustava U s výše uvedenou relací u>v a operací αu+(1-α)v splňuje následující axiomy: 1. Pro jakoukoli dvojici u, v platí právě jeden ze tří vztahů: u=v, u>v, u
v a v>w vyplývá u>w. Tento axiom zavádí tranzitivnost preferencí. 3. Z nerovnosti uv vyplývá u>αu+(1-α)v. První nerovnost říká, že jestliže v je preferováno před u, pak jakákoli šance (1-α) na užitek v v kombinaci s u musí být preferována před samostatným u. Druhá nerovnost je opakem nerovnosti první. 4. Z nerovnosti u<ww>v. Tento princip vyjadřuje spojitost užitkové funkce 5. Platí rovnost αu+(1-α)v=(1-α)v+αu, která vyjadřuje, že výsledná kombinace preferencí nezávisí na pořadí. 6. Platí rovnost α(βu+(1-β)v)+(1-α)v=γu+(1-γ)v, kde γ=αβ. Axiom vyjadřuje, že výsledný užitek nezávisí na pořadí kroků při kombinaci prvků. Za těchto předpokladů existuje užitková funkce u(x), která přiřadí užitkům u, v, w číselné hodnoty u(u), u(v), u(w). K užitkové funkci je přípustné přičíst reálnou konstantu, označme ji třeba b, nebo je možné užitkovou funkci násobit kladným reálným číslem, označme ho a, aniž by došlo ke změně soustavy preferencí. Užitková funkce au(x)+b vyjadřuje stejné preference jako původní užitková funkce u(x). Užitková funkce zachycuje individuální preference, které není možné mezi různými jedinci navzájem srovnávat či sčítat. Jestliže užitková funkce prvního jedince přiřazuje určité události číselnou hodnotu 5 a užitková funkce druhého jedince přiřazuje jiné události hodnotu 5, nelze z toho vyvozovat, že dané události přináší jedincům stejný užitek. Allaisův paradox Maurice Allais (1953), francouzský ekonom, nositel Nobelovy ceny za ekonomii, ukázal, že v určitých modelových situacích lidé projevují preference porušující axiomy teorie očekávaného užitku. Allais zformuloval
14
Teorie her: analýza konfliktů a spolupráce
dvojice loterií, mezi kterými si měli účastníci experimentu volit, přičemž v jedné z dvojic jedna z loterií nabízí určitý výsledek s jistotou. Na základě hlasování účastníků experimentu se Allais pokusil potvrdit hypotézu, že tato jistota povede k posílení přitažlivosti dané varianty pro účastníky a že ovlivní hodnocení ostatních variant (loterií). Výsledky těchto experimentů jsou dnes známy jako Allaisův paradox. Seznámíme se nyní s jedním s Allaisových modelových rozhodovacích problémů. Předpokládejme čtyři možné události (loterie), které označíme A, B, C, D. Účastníci experimentu mají nejprve porovnat loterie A a B, poté loterie C a D. Níže uvádíme možné výhry z určité loterie, pravděpodobnosti výher v procentech. Hra 1 Loterie A: Loterie B:
výhra 1 mil. Kč 5 mil. Kč 1 mil. Kč 0 Kč
pravděpodobnost 100 % 10 % 89 % 1%
Hra 2 Loterie C: 5 mil. Kč 0 Kč Loterie D: 1 mil. Kč 0 Kč
10 % 90 % 11 % 89 %
Očekávané užitky z těchto loterií jsou 1 milión Kč pro loterii A, 1,39 miliónu Kč pro loterii B, 0,5 miliónu pro loterii C a 0,1 miliónů Kč pro loterii D. Účastníci experimentu preferovali loterii A před B, i když podle teorie měli volit loterii B, která nabízí vyšší očekávaný užitek. Ve druhé hře účastníci preferovali loterii C před D. Kombinace těchto voleb vede k rozporu v teorii očekávaného užitku, neboť z takto projevených preferencí účastníků Allaisova experimentu vyplývají nerovnosti: u(1) > 0,10 u(5) + 0,89 u(1) + 0,01 u(0)
(A je lepší než B)
a 0,10 u(5) + 0,90 u(0) > 0,11 u(1) + 0,89 u(0) (C je lepší než D). Ve druhé nerovnosti upravíme malým trikem 0,11u(1) na právě straně, takže dostaneme: 0,10 u(5) + 0,90 u(0) > 1,00 u(1) - 0,89 u(1) + 0,89 u(0).
Teorie her: analýza konfliktů a spolupráce
15
K oběma stranám nerovnice přičteme výraz 0,89u(1)–0,89u(0), čímž získáme nerovnost vyjadřující preferenci B je lepší než A: 0,10 u(5) + 0,89 u(1) + 0,01 u(0) > 1,00 u(1), což je ve sporu s první nerovností, která zachycuje preferenci A je lepší než B. Allaisovy výsledky zpochybňují teorii racionálního očekávání, především předpoklad nezávislosti variant, podle kterého by dvě výhry se stejnou střední hodnotou měly mít stejný užitek. Protože v loterii B existuje možnost nulové výhry, může hráč, který si tuto výhru vylosuje, pociťovat zklamání z toho, že si raději nevybral loterii A, která nabízí jistotu výhry ve výši 1 mil. Kč. Copak by mu asi doma řekla manželka? Tento pocit jistoty, který nabízí jedna z variant, však podle Allaise znamená, že nelze jednotlivé loterie (části hry) posuzovat jako zcela nezávislé od ostatních loterií (částí hry). Ellsbergův paradox Americký ekonom Daniel Ellsberg je autorem podobného paradoxu teorie očekávaného užitku jako Maurice Allais. Účastník se má rozhodnout ve dvou experimentech s taháním míčků z urny mezi různými sázkami. V prvním experimentu je v urně 90 míčků, z toho 30 červených, zbytek tvoří černé a žluté míčky namíchané v neznámém poměru. Účastník si může vybrat mezi sázkami: a) když si vsadí na červenou barvu a je vytažen červený míček vyhraje 10 Kč, jinak získává 0 Kč, b) když si vsadí na černou barvu a je vytažen černý míček vyhraje 10 Kč, jinak získává 0 Kč. Výzkumníci pozorovali, že účastníci tohoto experimentu obvykle sází na červenou barvu, kde je jistá pravděpodobnost výhry 1/3, oproti černé barvě, kde se pravděpodobnost výhry pohybuje někde v intervalu mezi 0 až 2/3. To znamená, že platí podle teorie očekávaného užitku nerovnost: 1/3 u(10) + 2/3 u(0) > p(černá) u(10) + (1- p(černá)) u(0), z čehož vyplývá, že se o pravděpodobnosti vytažení míčku černé barvy účastníci domnívají 1/3 > p(černá).
16
Teorie her: analýza konfliktů a spolupráce
Také v druhém experimentu je v urně 90 míčků, z toho 30 červených, zbytek tvoří černé a žluté míčky namíchané v neznámém poměru. V tomto experimentu se účastník rozhoduje mezi sázkami: a) vytažení červeného nebo žlutého míčku znamená výhru 10 Kč, b) vytažení černého a žlutého míčku znamená výhru 10 Kč. V tomto případě většina účastníků volí sázku na černou a žlutou barvu, kde je pravděpodobnost výhry 2/3, oproti sázce na červenou a žlutou, kde je pravděpodobnost výhry neznámá a pohybuje se v intervalu 1/3 až 1. Z preferencí účastníků získáme podle teorie očekávaného užitku nerovnost: 1/3u(10) + p(žl.)u(10) + p(černá)u(0) < 1/3u(0) + p(žl.)u(10) + p(černá)u(10), z čehož v tomto případě vyplývá, že se o pravděpodobnosti vytažení míčku černé barvy účastníci experimentu domnívají 1/3 < p(černá). Tím vzniká spor, neboť v jednou experimentu účastníci jednají tak, že pravděpodobnost vytažení černého míčku odhadují jako menší než 1/3 a ve druhém experimentu jako větší než 1/3. Tento spor je v ekonomické literatuře znám jako Ellsbergův paradox. Výsledky experimentů jsou interpretovány tím způsobem, že je porušen předpoklad nezávislosti užitkové funkce na riziku. Lidé mají averzi vůči riziku, což se při rozhodování projevuje jejich averzí vůči variantám, které riziko obsahují. V ekonomické literatuře se objevují nové modely teorie užitku, které usilují o vysvětlení některých selhání teorie racionálního očekávání. Například Amos Tversky a Daniel Kahneman (viz Skořepa, 2007) navrhli v roce 1992 tzv. kumulativní prospektovou teorii (cumulative prospect theory). Ve své teorii navrhují tzv. hodnotovou funkci, která je na rozdíl od užitkové funkce v teorii očekávaného užitku, definována jako rozdíl výsledku určité alternativy od jistého referenčního výsledku. Výsledky tak lze rozdělit na zisky a ztráty podle toho, zda se nacházejí pod nebo nad referenčním výsledkem a vzniká možnost, aby hodnotová funkce měla jiný tvar pro zisky a jiný pro ztráty. Druhým novým nástrojem teorie je možnost transformace pravděpodobností výsledků. Hodnotová funkce je pro zisky konkávní, zatímco pro ztráty konvexní, což znamená, že změny ve výsledcích daleko od referenčního výsledku mají menší a menší význam. Kumulativní prospektová teorie sice umí vysvětlit například Allaisův paradox, přesto zatím nelze očekávat, že by v nejbližší době tato nebo nějaká z jiných alternativních teorií vážně ohrozila výsadní postavení teorie očekávaného užitku.
Teorie her: analýza konfliktů a spolupráce
17
2. Hry s konstantním součtem 2.1 Definice hry Teorie her provádí analýzu konfliktních rozhodovacích situací pomocí specifických matematických modelů, které na přiměřené míře abstrakce popisují podstatné charakteristiky dané konfliktní situace a vynechávají ty nepodstatné. Dva nejdůležitější matematické modely teorie her jsou hra v normálním tvaru a hra v rozvinutém tvaru, kterou se budeme podrobněji zabývat později. Naším výchozím teoretickým modelem bude hra v normálním tvaru, která je určena třemi množinami: 1. První množinou je množina hráčů, jinými slovy seznam účastníků konfliktní situace: {1, 2, …, N}. Pokud nebude řečeno jinak, budeme v dalším textu pro zjednodušení předpokládat, že se vždy jedná o hru dvou hráčů, které budeme označovat hráč 1 a hráč 2. 2. Druhou množinou je množina prostorů strategií: {X1, X2, …, XN}. Zde Xi označuje prostor strategií i-tého hráče. U hry dvou hráčů se vyhneme neustálému psaní indexů tak, že X bude označovat prostor strategií hráče 1 a Y bude prostor strategií hráče 2. Konkrétní strategie budeme značit x pro hráče 1 a y pro hráče 2. 3. Třetí je množina výplatních funkcí všech hráčů: {f1(x1, x2, …, xN), f2(x1, x2, …, xN),…, fN(x1, x2, …, xN)}. Výplatní funkce hráčů jsou definovány na kartézském součinu prostoru strategií, neboť musí stanovit výhru hráče pro všechny možné kombinace strategií. U hry dvou hráčů budeme označovat f1(x, y) výplatní funkci hráče 1 a f2(x, y) výplatní funkci hráče 2. Předpokládáme, že hráči jsou inteligentní, takže maximalizují hodnotu své výplatní funkce (svůj užitek) a mají dokonalé informace o hře (znají množinu hráčů, prostor strategií svůj i ostatních hráčů a výplatní funkci svoji i ostatních hráčů). Rozhodnutí provádějí hráči ve stejný okamžik, proto žádný z hráčů v době svého rozhodnutí nemůže znát rozhodnutí ostatních hráčů. V některé literatuře se místo pojmu hra v normálním tvaru používá i název hra ve strategickém tvaru. Nejprve se budeme zabývat hrami, které popisují antagonistické konflikty – co jeden hráč získá, druhý ztrácí, takže spolupráce v těchto konfliktech nemá smysl. Matematickým modelem antagonistického konfliktu je hra v normálním tvaru, kterou v tomto speciálním případě označujme jako hru s konstantním součtem, ve které pro libovolné strategie x∈X, y∈Y pro výplatní funkce hráčů platí (uvažujme hru dvou hráčů):
18
Teorie her: analýza konfliktů a spolupráce
f1(x, y) + f2(x, y) = K, kde K je libovolné reálné číslo. Pro libovolné K je možné hru s konstantním součtem transformovat na ekvivalentní hru s nulovým součtem (K=0). Platí totiž, že přičtením určité konstanty ke všem hodnotám výplatní funkce nedojde ke změně řešení. Ve hře s nulovým součtem o dvou hráčích pro výplatní funkce platí: f1(x, y) = - f2(x, y). Výhra druhého hráče je výhra prvého hráče s opačným znaménkem. Z tohoto důvodu hru s konstantním součtem zjednodušujeme a při analýze sledujeme pouze výhru prvého hráče f1(x, y). Předpokládejme, že pro oba hráče je prostor strategií konečný. První hráč má k dispozici m možných strategií a druhý hráč si může zvolit mezi n strategiemi. Počet možných kombinací strategií je tedy m x n, přičemž každé kombinaci strategií je možné přiřadit výhru f1(x, y). Množinu všech výher ve hře s nulovým součtem znázorníme maticí A = (aij), i = 1, 2,..., m; j = 1, 2,..., n. Výběr i-tého řádku matice A odpovídá výběru i-té strategie hráčem 1, výběr j-tého sloupce odpovídá výběru j-té strategie hráčem 2. Při výběru této dvojice strategií je hodnota výplatní funkce hráče 1 rovna prvku aij, hodnota výplatní funkce hráče 2 je rovna -aij. Tento model se nazývá maticová hra, matici A nazýváme výplatní maticí.
a11 a12 .... a1n a a 22 .... a 2 n 21 . A= . . am1 am 2 .... amn Jakákoliv matice může být považována za maticovou hru. Mějme například matici: 0 − 2 3 1 2 2 .
Teorie her: analýza konfliktů a spolupráce
19
Uvedená matice představuje hru s konstantním součtem s dvěma hráči, ve které má hráč 1 k dispozici dvě strategie a hráč 2 má k dispozici tři strategie. Nyní už máme k dispozici dostatečný modelový aparát pro popis jakékoliv maticové hry. V dalším kroku chceme najít optimální chování hráčů v této hře, což pro hráče 1 znamená zvolit řádek a pro hráče 2 zvolit sloupec v matici. Jak budou hráči postupovat? Prvním možným krokem je vyřadit strategie, které nemá smysl nikdy zvolit a zmenšit tak rozměr matice. První hráč nebude volit ten řádek matice, ve kterém jsou všechny prvky menší než odpovídající prvky v jiném řádku. Druhý hráč nebude volit ten sloupec matice, ve kterém jsou všechny prvky větší (prvky značí jeho prohru) než odpovídající prvky v jiném sloupci. Jde o tzv. silnou dominovanost a platí, že hráč nikdy nezvolí silně dominovanou strategii. Pokud platí, že v jednom řádku (sloupci) jsou všechny prvky menší nebo rovny prvkům druhého řádku (sloupce) jde o slabou dominovanost. Abychom se vyhnuli určitým problémům, které jsou spojeny se slabou dominovaností (viz např. Myerson, 1991, str. 57-61), budeme využívat pouze silnou dominovanost. V naší hře oba hráči dojdou k závěru, že druhý hráč nikdy nezvolí třetí sloupec (silně dominovaná strategie), neboť tento sloupec je pro něj vždy horší než první sloupec (silně dominující/dominantní strategie). Třetí sloupec proto můžeme z matice vyškrtnout, takže matice má nyní tvar:
0 1
− 2 − . 2 −
V takto upravené hře je druhý řádek vždy lepší než řádek první. První strategie hráče 1 je silně dominovaná a bude vyškrtnuta, protože inteligentní hráč ji nikdy nezvolí. Po tomto kroku je matice ve tvaru:
− − − 1 2 − . V dané situaci si hráč 2 může pouze vybrat mezi alternativou prohrát -1 nebo -2 (jiným slovy druhý sloupec je silně dominovaný). Hráč 2 vcelku logicky zvolí „výhru“ v hodnotě -1. Tím jsme dospěli k řešení: optimální strategií hráče 1 je zvolit druhý řádek a optimální strategií hráče 2 je zvolit první
20
Teorie her: analýza konfliktů a spolupráce
sloupec. Hra skončí výhrou hráče 1 v hodnotě 1. Jelikož jde o hru s nulovým součtem, výhra hráče 1 je prohrou hráče 2. V této jednoduché hře se nám podařilo najít řešení hry pomocí postupné eliminace dominovaných řádků a sloupců, byla to však spíše náhoda. Postupná eliminace dominovaných strategií může hru zjednodušit, což je sice výhodné, ale jen výjimečně se podaří najít řešení. Proto je třeba hledat jiné principy, které by zajistily řešení hry ve všech případech.
2.2 Nashova rovnováha Optimální strategie hráčů ve hře (v konfliktní situaci) najdeme pomocí tzv. Nashovy rovnováhy. Nashova rovnováha je takové řešení, ve kterém platí, že když se některý z hráčů nebude držet své optimální strategie, zatímco jeho soupeř ano, jeho výhra se sníží (v nejlepším případě zůstane stejná). Jinými slovy: „ten, kdo se odchýlí od optimálních strategií, si nemůže polepšit“. Nashova rovnováha nastává, pokud najdeme strategie prvého a druhého hráče xo∈X a yo∈Y pro které platí: f1 (x, yo) ≤ f1(xo, yo) a f2(xo, y) ≤ f2(xo, yo). Protože je možno se u her s konstantním součtem omezit pouze na hry s nulovým součtem, označíme f1(x, y) = f(x, y) a tedy f2(x, y) = -f(x, y). Výše uvedené nerovnosti můžeme pak zapsat ve zjednodušeném tvaru: f(x, yo) ≤ f(xo, yo) ≤ f(xo, y). Tyto nerovnosti vyjadřují fakt, že když se některý z hráčů nebude držet optimální strategie, zatímco jeho soupeř ano, jeho výhra se sníží (v nejlepším případě zůstane stejná). Takto definované optimální strategie představují tzv. Nashovu rovnováhu (Nashovo rovnovážné řešení) a nazýváme je rovnovážnými strategiemi. Nashovu rovnováhu získáme nalezením sedlového prvku matice A. Sedlový prvek matice je číslo, které je největší ve svém sloupci a zároveň nejmenší ve svém řádku (cílem hráče 2 je minimalizovat výhru hráče 1, neboť výhra 2 hráče je -aij). Jestliže aij je sedlový prvek, potom i-tá strategie hráče 1 a j-tá strategie hráče 2 jsou optimální (rovnovážné) strategie a hodnotu aij nazýváme cenou hry. Takto nalezené řešení nazýváme Nashovou rovnováhou (rovnovážným řešením) v ryzích strategiích.
Teorie her: analýza konfliktů a spolupráce
21
Při hledání sedlového bodu matice (Nashovy rovnováhy) mohou nastat tyto tři případy: 1. Matice má jeden sedlový prvek (prvek představuje Nashovu rovnováhu). 2. Matice má více sedlových prvků, jejichž hodnoty jsou si rovny, potom tyto sedlové prvky určují alternativní optimální (rovnovážné) strategie. 3. Matice nemá žádný sedlový prvek, rovnovážné strategie se nám daným postupem nepodařilo najít (rovnovážné řešení sice existuje, nikoliv však v ryzích strategiích). Výše uvedené možnosti si ukážeme na příkladě 2.1. Při hledání sedlového prvku budeme postupovat tak, že kulatými závorkami označíme všechna sloupcová maxima a hranatými závorkami všechna řádková minima. Sedlový prvek bude označen kulatými i hranatými závorkami zároveň. Příklad 2.1:
6 6 [− 7] − 6 (7 ) (7 ) [(0 )] [(0 )] [(0 )] (0) [− 2]
[(2)] −6
[− 7]
[(0)] 1 [(0 )] (3) [(0)]
6 (7 ) 6
Matice má jeden sedlový prvek.
2
[− 2] (0) (1) −1
Matice má šest sedlových prvků.
Matice nemá žádný sedlový prvek.
Pokud se nám nepodařilo najít sedlový prvek matice, má to snad znamenat, že hráči nemají žádné rovnovážné strategie? Nikoliv, znamená to pouze, že dosavadní výklad nebyl dostatečný pro nalezení rovnovážných strategií ve všech možných rozhodovacích situacích, které je možné vyjádřit jako maticovou hru. Ukážeme si to na příkladě velmi známe hry kámen, nůžky, papír. Tato hra je hrou dvou hráčů, z nichž každý má k dispozici tři možné
22
Teorie her: analýza konfliktů a spolupráce
strategie. Podle pravidel kámen vyhrává nad nůžkami, nůžky nad papírem a papír nad kamenem. V případě, že oba hráči zvolí stejnou strategii, nastává remíza. V reálné situaci by hráči hru opakovali, od toho však v tomto okamžiku abstrahujeme a považujeme remízu za konečný výsledek hry. Hra kámen, nůžky, papír je hrou s konstantním (nulovým) součtem, která je charakterizována maticí: Kámen
Nůžky
Papír
Kámen
0
+1
-1
Nůžky
-1
0
+1
Papír
+1
-1
0
Jednoduše si můžeme ověřit, že v této matici není možné najít sedlový prvek, takže ani není možné najít Nashovo rovnovážné řešení v ryzích strategiích. Přesto danou hru běžně hrajeme a známe odpovídající rovnovážnou strategii, která spočívá v náhodném výběru z prostoru strategií. Pro oba hráče je rovnovážnou strategií vektor (1/3; 1/3; 1/3), kde čísla představují pravděpodobnosti, že hráč bude volit první, druhou nebo třetí strategii. Tento typ strategií nazýváme smíšenými (pravděpodobnostními) strategiemi. Také pro tyto strategie platí, že hráč, který se od rovnovážné strategie odchýlí (zvolí jiné pravděpodobnosti), nemůže nic získat, ale naopak může ztratit. Pokud maticová hra nemá řešení v ryzích strategiích, použijeme tzv. smíšeného rozšíření maticové hry. Prostory strategií nyní budou představovat vektory pravděpodobností s jakou hráči zvolí jednotlivé strategie. Prostory strategií hráčů jsou: m T X = x; x = [x1 , x2 ,....., xm ], ∑ xi = 1, x ≥ 0 , i =1 n T Y = y; y = [ y1 , y 2 ,....., y n ], ∑ y j = 1, y ≥ 0 . j =1
Hodnota výplatní funkce udává očekávanou střední hodnotu výhry. V případě her s konstantním součtem stačí sledovat výplatní funkci prvního hráče, která má tvar:
Teorie her: analýza konfliktů a spolupráce m
f ( x, y ) = ∑ i =1
n
∑xa j =1
i
ij
23
y j = x T Ay .
Ryzí strategie jsou tedy zvláštním případem (podmnožinou) smíšených strategií, kdy jedna z pravděpodobností je rovná jedné a ostatní pravděpodobnosti jsou rovny nule. Pro maticové hry platí důležitá věta, tzv. základní věta maticových her:
Každá maticová hra má Nashovo rovnovážné řešení ve smíšených strategiích.
Základní věta maticových her tvrdí, že pro každou matici A existují dva vektory x a y (kroužkem označujeme, že jde o rovnovážné strategie), pro které platí nerovnice:
x T Ay o ≤ x oT Ay o ≤ x oT Ay . Tyto nerovnice jsou matematickou definicí Nashovy rovnováhy ve smíšených strategiích. Hráč, který zvolí jinou než Nashovu rovnovážnou strategii, si může pouze pohoršit, nebo zůstat na tom stejně, v žádném případě si nemůže polepšit. Pokud je maticová hra rozměru m x 2 nebo 2 x n je možno použít grafické metody k nalezení Nashovy rovnováhy. V obecném případě se rovnovážné smíšené strategie získají řešením úlohy lineárního programování simplexovou metodou. Postup výpočtu rovnovážných smíšených strategií si nyní blíže vysvětlíme a následně ukážeme na příkladě. Prvním krokem je ověření, zda ve výplatní matici A existují pouze kladné prvky. Pokud v matici A existují nekladné prvky, přičteme ke všem prvkům aij konstantu c tak, aby všechny prvky matice byly kladné. Touto úpravou se rovnovážné strategie nezmění, říkáme že původní i nová hra jsou strategicky ekvivalentní hry. Cena nové hry bude rovna v + c. Díky tomuto triku lze, mimo jiné, transformovat libovolnou hru s konstantním součtem na hru s nulovým součtem. A to tak, že od všech prvků matice odečteme cenu hry (výhru prvního hráče). Druhým krokem výpočtu rovnovážných strategií je řešení jedné ze dvou následujících úloh lineárního programování ve tvaru:
Teorie her: analýza konfliktů a spolupráce
24 Minimalizovat
p1 + p2 + ........+ pm za podmínek a11p1 + a21p2 + ........+ am1pm ≥ 1; … … … a1np1 + a2np2 + ........+ amnpm ≥ 1; pi ≥ 0; i = 1, 2 , ..., m; nebo Maximalizovat q1 + q2 + ........+ qn za podmínek a11q1 + a12q2 + ........+ a1nqn ≤ 1; … … … am1q1 + am2q2 + ........+ amnqn ≤ 1; qj ≥ 0; j = 1, 2 , ..., n. Protože všechny prvky aij jsou kladné, mají obě úlohy přípustné řešení a tedy i řešení optimální. Řešením jakékoli ze dvou uvedených úloh v simplexové tabulce získáme řešení obou úloh, tj. určíme rovnovážné smíšené strategie xo, yo a z hodnoty účelové funkce určíme cenu hry v. Z hlediska výpočetního je výhodnější řešit maximalizační úlohu s proměnnými qj. Řešení v simplexové tabulce v příkladu 2.2 představuje pouze ilustraci postupu, neboť řešení je možné nalézt i bez znalosti lineárního programování, např. pomocí Řešitele v MS Excel či pomocí produktu pro matematické programování (LINDO, LINGO, Xpress). Příklad 2.2: Určete rovnovážné strategie maticové hry, která je charakterizována následující výplatní maticí: 1 -1
0 1
-1 2
Teorie her: analýza konfliktů a spolupráce
25
Hra nemá řešení v ryzích strategiích, ale podle základní věty maticových her již víme, že každá maticová hra má řešení ve smíšených strategiích. Všechny prvky výplatní matice nejsou kladné, přičtením c = 2 ke každému prvku matice získáme strategicky ekvivalentní hru: 3 1
2 3
1 4
Následuje řešení v simplexové tabulce, přičemž výpočetně výhodnější je řešit úlohu pro druhého hráče s proměnnými qj. Klíčové prvky v jednotlivých krocích označují hranaté závorky.
q’1 q’2 q1 q’2 q1 q3
q1 [3] 1 -1 1 0 0 1 0 0
q2 2 3 -1 2 /3 7 /3 -1 /3 5 /11 7 /11 1 /11
q3 1 4 -1 1 /3 11 [ /3] -2 /3 0 1 0
q’1 1 0 0 1 /3 -1 /3 1 /3 4 /11 -1 /11 3 /11
q’2 0 1 0 0 1 0 -1 /11 3 /11 2 /11
1 1 0 1 /3 2 /3 1 /3 3 /11 2 /11 5 /11
Řešením úlohy je qo = ( 3/11; 0; 2/11), po = (3/11; 2/11), hodnota kriteriální funkce 1 /v+c=5/11, čili v+c=11/5. Ze vztahů xoi=pi(v+c) a yoi=qi(v+c) dostaneme rovnovážné strategie: xo = ( 3/5; 2/5), yo = (3/5; 0; 2/5 ), cena hry v = 11/5 – 2 = 1/5. Příklad 2.3 Určete rovnovážné (ryzí či smíšené) strategie maticové hry, která je charakterizována následující výplatní maticí: 0 -2 -3
-1 0 -1
-2 1 0
26
Teorie her: analýza konfliktů a spolupráce
Teorie her: analýza konfliktů a spolupráce
27
3. Hry s nekonstantním součtem V praxi se často setkáváme s konflikty, kdy účastníci rozhodnutí sice sledují své zájmy, které však nejsou v přímém protikladu (jde o tzv. neantagonistické konflikty). Neplatí tedy, že výhra prvého hráče je prohrou druhého hráče a naopak. V těchto případech je třeba dále rozlišit, zda se jedná o hru nekooperativní (hráči nemohou spolupracovat) nebo o hru kooperativní (hráči mohou spolupracovat).
3.1 Nekooperativní hra Matematickým modelem konečných neantagonistických konfliktů tohoto typu pro dva hráče je dvoumaticová hra. Tato hra je určena maticemi A a B, které charakterizují výplatní funkce prvého a druhého hráče. Při výběru i-té strategie (i=1, 2,..., m) prvého hráče a j-té strategie (j=1, 2,..., n) druhého hráče je hodnota výplatní funkce prvého hráče rovna prvku aij a hodnota výplatní funkce druhého hráče prvku bij. Mezi hodnotami výher hráčů není na rozdíl od her s konstantním součtem přímý vztah.
a11 a12 .... a1n a a 22 .... a 2 n 21 . A= . . am1 am 2 .... amn
b11 b12 .... b1n b b 22 .... b 2n 21 . B= . . bm1 bm 2 .... bmn
U nekooperativní teorie využijeme modifikované Nashovo rovnovážné řešení, které již známe s antagonistických konfliktů (her s konstantním součtem). Dvojici strategií xo a yo nazveme Nashovými rovnovážnými strategiemi jestliže platí: f1(x, yo) ≤ f1(xo, yo), f2(xo, y) ≤ f2(xo, yo),
Teorie her: analýza konfliktů a spolupráce
28
pro všechna x ∈ X, y ∈ Y. Rovnovážné řešení v ryzích strategiích najdeme tak, že v matici A označíme všechna sloupcová maxima a v matici B všechna řádková maxima. Pokud určitá dvojice prvků dvoumatice je označena prvním i druhým hráčem, jde o rovnovážné řešení. U dvoumaticových her mohou pro Nashova rovnovážná řešení nastat následující případy: 1. Rovnovážné řešení je jediné. V tom případě dává návod k optimálnímu jednání pro oba hráče. 2. Rovnovážných řešení je více, avšak jedno z rovnovážných řešení je pro oba hráče výhodnější než ostatní rovnovážná řešení (přesněji řečeno dané rovnovážné řešení dominuje ostatní rovnovážná řešení). Hráči tedy zvolí pro oba nejvýhodnější rovnovážné řešení. 3. Rovnovážných řešení existuje ve hře více a alespoň dvě z nich jsou nedominovaná. Hráči neví, které rovnovážné řešení zvolit, neboť každý hráč preferuje jiné rovnovážné řešení. Příklad 3.1: Najděte Nashovy rovnovážné ryzí strategie u dvoumaticových her:
3 1) A = − 2
4 , B= 2
5 7
2 . 1
Hodnoty zapíšeme do dvoumatice a označíme kulatými závorkami sloupcová maxima v matici A a hranatými závorkami řádková maxima v matici B:
(3); [5] − 2; [7]
(4);2 2;1
Strategie (1, 1), tj. první řádek a první sloupec, s výhrami (3; 5) jsou ryzími rovnovážnými strategiemi hráčů.
7
2) A = − 2
−2 , B= 6
9 0
1 4
Teorie her: analýza konfliktů a spolupráce
(7 ); [9 ] − 2 ;0
29
− 2;1 (6 ); [4 ]
Existují dvě rovnovážná řešení v ryzích strategiích. Hráči dají přednost rovnovážnému řešení s výplatami (7; 9), které dominuje řešení s výplatami (6; 4).
3 3) A = − 2
(3 ); [9 ] − 2 ;0
−2 , B= 6
9 0
1 4
− 2 ;1 (6 ); [4 ]
Existují dvě rovnovážná řešení v ryzích strategiích: strategie (1, 1) a strategie (2, 2). Jestliže však z nich první hráč zvolí druhý řádek (rovnovážné řešení na druhém řádku je pro něj výhodnější) a druhý hráč první sloupec (rovnovážné řešení v prvním sloupci je pro něj výhodnější), potom důsledek této volby je nepříznivý pro oba hráče, neboť vede k řešení s výplatami (-2; 0).
3 4) A = 4
2 ,B= − 2
5 1
−1 5
3; [5] (2);−1 (4);1 − 2; [5] Hra nemá Nashovo rovnovážné řešení v ryzích strategiích. Jestliže jsme nenalezli Nashovo rovnovážné řešení v ryzích strategiích, použijeme smíšeného rozšíření dvoumaticové hry. Platí následující věta: Každá dvoumaticová hra má alespoň jedno rovnovážné řešení.
Teorie her: analýza konfliktů a spolupráce
30
Prostory strategií jsou: m T X = x; x = [x1 , x2 ,....., xm ], ∑ xi = 1, x ≥ 0 , i =1 n T Y = y; y = [ y1 , y 2 ,....., y n ], ∑ y j = 1, y ≥ 0 . j =1
Výplatní funkce hráčů mají tvar: m
f 1 ( x, y ) = ∑ i =1 m
f 2 ( x, y ) = ∑ i =1
n
∑xa j =1
ij
y j = x T Ay
i ij
y j = x T By .
i
n
∑xb j =1
Hledání rovnovážných strategií v případě smíšeného rozšíření dvoumaticových her je možno formulovat jako hledání optimálního řešení u úlohy nelineárního programování ve tvaru: Maximalizovat pT(A+B)q - eTp - fTq; za podmínek Aq ≤ e; BTp ≤ f; p ≥ 0; q ≥ 0; kde A a B jsou výplatní matice hráčů o rozměrech m × n (upravené tak, aby jejich prvky byly kladné), p a q jsou vektory o m a n proměnných, e a f jsou vektory složené z m a n jedniček, 0 jsou odpovídající nulové vektory. Smíšené rovnovážné strategie obdržíme po transformacích, které zajistí, že součet pravděpodobností je roven jedné: xo = po/(eTpo) a yo= qo/(fTqo).
Teorie her: analýza konfliktů a spolupráce
31
Tímto postupem jsme našli jedno rovnovážné řešení, nevíme však, zda neexistují další rovnovážná řešení. Nalezení všech rovnovážných řešení je poměrné komplikovanou úlohou. Určitou jednoduchou náhradní možností je spustit řešení úlohy z různých výchozích hodnot proměnných, což většina optimalizačních programových produktů povoluje, a sledovat, zda dojde ke změně optimálního řešení.
3.2 Problémy Nashovy rovnováhy Není jistě pochyb o tom, že Nashova rovnováha představuje jeden ze základních kamenů, na níž je vystavěna teorie her. Přes svou univerzálnost nás však Nashova rovnováha může zavést k řešením, která vzbuzují určité rozpaky. Na modelových konfliktech si ukážeme dva typy problematických návodů k optimálnímu chování. Asi neznámějším modelovým konfliktem z teorie her je hra zvaná vězňovo dilema. Název této hry je odvozen od modelové situace, ve které dva vězni, kteří spáchali určitý zločin, jsou odděleně uvězněni a mají možná rozhodnutí přiznat (P) či nepřiznat (NP). Pokud se jeden z vězňů přizná a druhý nikoliv, je prvnímu vězni udělen nižší trest a druhému naopak vyšší trest. Jestliže se oba nepřiznají, nebudou plně usvědčeni, takže dostanou menší trest, než kdyby se oba přiznali a tím na sebe vzájemně připravili důkazy. Hra vězňovo dilema může být například ve tvaru: P
NP
P − 3;−3 − 1;−4 . NP − 4;−1 − 2;−2 Roky strávené ve vězení mají samozřejmě záporný užitek, proto uvádíme ve výplatní matici pouze záporná čísla. Po nalezení řádkových a sloupcových maxim zjistíme, že ve hře existuje jediná Nashova rovnováha: P
P (− 3); [− 3] NP − 4; [− 1]
NP
(− 1;) − 4
. − 2;−2
32
Teorie her: analýza konfliktů a spolupráce
Hráči, kteří nemohou kooperovat, budou volit vždy strategii přiznat. Paradoxem je, že rovnovážné řešení s výplatami (-3; -3) je horší než řešení s výplatami (-2; -2). Řešení (nepřiznat, nepřiznat) však nesplňuje podmínky Nashovy rovnováhy, neboť změnou své strategie si hráč může polepšit: dosáhne snížení trestu na jeden rok, zatímco druhý hráč si odsedí čtyři roky. Nashova rovnováha nabízí řešení, které je sice rovnovážné (nikdo si individuální změnou strategie nemůže polepšit), ale nejde o paretovsky efektivní rovnováhu, protože volbou nepřiznat by všichni hráči získali, aniž by byl někdo poškozen. Stojí za povšimnutí, že řešení (přiznat, nepřiznat) a (nepřiznat, přiznat) jsou také paretovsky efektivní, takže řešení (přiznat, přiznat) je dokonce jediným, paretovsky neefektivním řešením ve hře vězňovo dilema. Hra ukazuje, že zcela racionální hráči, kteří jednají ve svém nejlepším zájmu, mohou nakonec skončit v situaci, která je pro všechny nevýhodná. V ekonomické teorii má vězňovo dilema význam například při studiu chování nevynutitelných (ze zákona obvykle zakázaných) kartelových dohod. Při uzavírání dohod je vážným problémem možnost porušování dohody, pokud jednostranné porušení může přinést výhody. Uvažujme dvě firmy, které uzavřely dohodu a mají dvě možné strategie: porušit nebo neporušit dohodu. Vězňovo dilema vede k závěru, že nezávazná dohoda, kterou je možné porušovat, přičemž jednostranné porušení může danému účastníkovi přinést výhodu, má stejný efekt jako žádná dohoda. Z tohoto důvodu by měly být tajné kartelové dohody nestabilní a dříve či později být porušeny jedním z hráčů. A to je vlastně pro spotřebitele dobrá zpráva. Na následujících modelových konfliktech si ukážeme, že v některých hrách existuje až příliš mnoho Nashových rovnováh. První konflikt je nazýván kuře (Chicken). Uvažujme dvě firmy, které těží ve stejné oblasti a obě mají v úmyslu zdvojnásobit svoji těžbu. U obou firem uvažujme dvě možná rozhodnutí: U - ustoupit od svého záměru a zůstat při dosavadním rozsahu těžby, N - neustoupit. Pokud obě firmy ustoupí od svého záměru, situace se nezmění. Pokud jedna ustoupí a druhá neustoupí, ustupující firma si zhorší svoji pozici a neustupující si zlepší svoji pozici. Pokud však žádná firma neustoupí dojde k ekologické katastrofě s obrovskými následky pro obě firmy. Tuto situaci je možno zachytit jako dvoumaticovou hru a symbolicky ohodnotit důsledky výběru rozhodnutí firem:
Teorie her: analýza konfliktů a spolupráce
U
33
N
U 0; 0 (− 5); [5] N (5); [− 5] − 10;−10 Tato hra má dvě ryzí Nashovy rovnovážné strategie (U, N) a (N, U). Rovnovážná strategie (U, N) je výhodná pro firmu 2, rovnovážná strategie (N, U) je výhodná pro firmu 1. Při volbě svých vhodnějších strategií se firmy sejdou v situaci (N, N), která je pro obě firmy nevýhodná. Hra kuře je též prezentována jako příběh dvou mladíků (s velkou pravděpodobností pod vlivem alkoholu), kteří se proti sobě rozjedou ve svých vozech, přičemž oba mají dvě strategie: uhnout nebo neuhnout. Ten, kdo uhne, prohrál a je nazván zbabělcem, což je zřejmě vhodnější překlad slova „chicken“ v tomto specifickém kontextu. Když uhnou oba hráči, hra skončí remízou. Jestliže žádný z hráčů neuhne, skončí hra pro oba hráče tragédií. Dalším konfliktem je manželský spor (Battle of Sexes). Manželé se mají dnes večer sejít a strávit společně večer ve městě. Manžel však preferuje jít na fotbalový zápas, zatímco manželka by ráda šla na nákupy do obchodního centra. Nyní jsou v práci a setkají se až večer, přičemž se rozhoduje každý samostatně (to by asi v reálném životě zcela neplatilo, ale předpokládejme to). Každý z manželů získá jednu jednotku užitku, když stráví večer spolu, případně další jednotku užitku, když zvolí program, který preferuje. Pokud stráví večer osamoceně, jejich užitky budou nulové. Tento konflikt je popsán maticí: manželka kopaná nákupy manžel
kopaná (2 ); [1] nákupy 0; 0
0; 0 (1); [2]
Problém spočívá v existenci více rovnovážných řešení, z nichž žádné není dominující, takže hráčům není jasné, které z řešení volit. Manžel by teoreticky měl volit první řádek, neboť preferuje kopanou. Jenže manželka preferuje nákupy, proto zvolí druhý sloupec a dostaneme řešení (0; 0), které není výhodné pro žádného hráče. Kromě rovnovážných řešení v ryzích strategiích existuje též rovnovážné řešení ve strategiích smíšených.
34
Teorie her: analýza konfliktů a spolupráce
Konflikty kuře a manželský spor poukazují na problém vícenásobné Nashovy rovnováhy. Na možnost existence vícenásobné Nashovy rovnováhy jsme již upozornili v oddíle 3.1. Jestliže existuje více rovnovážných řešení, avšak jedno z rovnovážných řešení dominuje ostatní, hráči zvolí toto pro oba nejvýhodnější rovnovážné řešení. Jestliže rovnovážných řešení existuje ve hře více a alespoň dvě z nich jsou nedominovaná (paretovsky efektivní), hráči neví, jaké řešení zvolit, neboť každý hráč preferuje jiné. Koncept Nashovy rovnováhy v tomto případě nedává jednoznačný návod k výběru optimálního rozhodnutí. Thomas C. Schelling (1960), pozdější nositel Nobelovy ceny za ekonomii za rok 2005, navrhl, že v situacích, ve kterých existuje určitý ústřední bod (focal point), je problém vícenásobné rovnováhy řešitelný. Představte si, že se máte s kamarádem setkat na Václavském náměstí v Praze. Setkat se můžete kdekoli, ale je pravděpodobné, že si jako místo setkání vyberete sochu svatého Václava, která je takovým ústředním bodem Václavského náměstí. Podobně v některých hrách s vícenásobnou Nashovou rovnováhou může existovat určitá ústřední rovnováha, která je z nějakého důvodu pro hráče odlišná od jiných Nashových rovnováh. Vraťme se ke konfliktu manželský spor, o němž víme, že má tři rovnovážná řešení. Náhodou jsme u jednoho ze dvou rovnovážných řešení v ryzích strategiích zapomněli závorky označující řádková a sloupcová maxima. Pozornost hráčů, kteří uvidí takovou výplatní matici, bude přitahována k označenému řešení, čímž se zvýší pravděpodobnost, že zvolí právě toto řešení. manželka kopaná nákupy manžel
kopaná 2; 1 nákupy 0; 0
0; 0 (1); [2]
Uvedený příklad je opravdu triviální, nicméně vystihuje podstatu myšlenky ústředního bodu. Ve více realistických modelech spoléháme především na to, že hra je hrána ve společnosti, kde existují určité tradice, zvyklosti. Například od velmi zaměstnaných mužů se očekává, že by se o víkendu měli věnovat rodině, takže budou volit strategii nákupy. Naopak, jde-li o finálový zápas nějakého mistrovství, je jasné, že strategie nákupy nepřichází v úvahu.
Teorie her: analýza konfliktů a spolupráce
35
3.3 Kooperativní hra dvou hráčů Dosud jsme předpokládali, že hráči spolu nekomunikují a nehledají vzájemně výhodné dohody. V případě, že hráči mají možnost uzavírat před volbou strategií závazné smlouvy o tom, jaké volby učiní, potom mluvíme o kooperativní hře. Hráči sice mohou, ale nemusí spolupracovat. Hráči budou spolupracovat jen tehdy, pokud to pro ně bude výhodné, což znamená, že kooperace poskytne oběma hráčům větší výhru, než kdyby nespolupracovali. Prvním krokem v kooperativní hře je tedy zjistit, jaká by byla výhra, kdyby danou kooperativní hru hráči odehráli jako hru nekooperativní. Tuto výhru, která plyne z Nashova rovnovážného řešení nekooperativní hry, označujeme jako rovnovážnou zaručenou výhru. Zaručená výhra prvního hráče nabývá hodnoty v(1), zaručená výhra druhého hráče má hodnotu v(2). Maximální celková částka, kterou si mohou hráči zajistit dohromady spoluprací, je: v(1,2) = max [f1(x, y)+ f2(x, y)] . x∈X y∈Y
Jestliže platí v(1,2)>v(1)+v(2), je pro hráče výhodné spolupracovat. Optimální strategie jsou takové strategie, které odpovídají hodnotě v(1,2). Strategie nalezneme tak, že sečteme prvky matic A a B a najdeme maximální hodnotu v takto vytvořené nové matici. Následnou otázkou je rozdělení společné částky v(1, 2) mezi jednotlivé hráče po skončení hry. Mnoho kriminálních filmů vrcholí přestřelkou zločinců při rozdělování uloupené kořisti. Rozdělením budeme nazývat takovou dvojici částek a1 a a2, pro kterou platí: a1 + a2 = v(1, 2), a1 ≥ v(1), a2 ≥ v(2). Množinu všech rozdělení (a1, a2), které splňují předchozí vztahy, nazveme jádrem hry. Teorie však již nenabízí návod na jakém rozdělení se mají hráči dohodnout. Existuje pouze několik doporučení, jak vybrat optimální rozdělení společné výhry. Jedním z nich je ponechat každému hráči jeho zaručenou výhru plus polovinu z toho, co hráči získali spoluprací navíc, tedy:
Teorie her: analýza konfliktů a spolupráce
36
a1*= v(1) + 1/2 [v(1, 2) - v(1) - v(2)], a *= v(2) + 1/2 [v(1, 2) - v(1) - v(2)]. 2
Příklad 3.2: Mějme kooperativní hru s nekonstantním součtem danou maticemi:
3 A= 4
−3 B= 1
5 1
−1 . 4
Zaručené výhry hráčů, plynoucí s Nashových rovnovážných strategií (2; 2), jsou (1; 4). Nyní sečteme matice A a B a dostaneme novou matici: 8
A+B= 5
−4 . 5
Maximální celková výhra v(1, 2) = max (aij+ bij) = 8. i, j
Jelikož pro výhry platí nerovnost v(1, 2)>v(1)+v(2), je pro hráče výhodné uzavřít dohodu o společné volbě strategií (1, 1) se společnou výhrou v hodnotě 8. Jádro hry (množinu všech možných rozdělení výhry mezi hráče) lze graficky znázornit pomocí obrázku č. 3.1, který sestrojíme na základě podmínek pro vznik spolupráce: a) celá výhra je rozdělena mezi hráče (a1+a2=8); b) první hráč musí získat při rozdělení společné výhry minimálně rovnovážnou zaručenou výhru v hodnotě 1 (a1≥1); c) druhý hráč musí získat při rozdělení společné výhry minimálně rovnovážnou zaručenou výhru v hodnotě 4 (a2≥4). Jádro této hry má podobu úsečky mezi vyznačenými body.
Teorie her: analýza konfliktů a spolupráce
37
Obrázek č. 3.1: Jádro hry
9 8 7 a2
6
jádro hry
5 4 3 2 1 0 0
1
2
3
4
5
6
7
8
9
a1 Alternativním způsobem stanovení zaručené výhry je nalezení výhry v případě, že by protihráč zvolil pro hráče nejhorší možnou strategii. Pro odlišení od výše definované zaručené výhry ji nazveme maximinová zaručená výhra. Maximinovou zaručenou výhru určíme tak, že v prvním kroku určíme pro hráče 1 řádková minima a sloupcová minima pro hráče 2. Z těchto minim vybereme maximální hodnoty. Ve výše uvedeném příkladě jsou pro prvního hráče řádková minima -3 a 1 a pro druhého hráče jsou sloupcová minima 1 a -1. Zaručené výhry tedy nabývají hodnotu 1 pro prvého hráče a hodnotu 1 pro druhého hráče. Uvedený postup je výhodné použít kupříkladu ve dvoumaticových hrách s více Nashovými rovnovážnými řešeními, neboť v těchto hrách máme problém se stanovením rovnovážné zaručené výhry. Příklady k procvičení 1. Sestavte dvoumaticovou hru 2x2, která má čtyři sedlové prvky. 2. Tržby z trhu mobilních telefonů v určité zemi se odhadují na 4 miliardy. Operátoři MOBILSTAR a PHONEMANIA se rozhodují, zda vstoupit na
38
3.
Teorie her: analýza konfliktů a spolupráce daný trh. Oba operátoři mají dvě možnosti: vstoupit nebo nevstoupit na trh. Když vstoupí na trh jeden operátor, obsadí celý trh. Když vstoupí oba operátoři, rozdělí si trh na polovic. Sestavte maticovou hru dané situace a zjistěte, zda existuje rovnovážné řešení. Jak by se změnila hra ze cvičení 2, pokud náklady na provozování mobilní sítě jednoho operátora činí 1,5 miliardy?
Teorie her: analýza konfliktů a spolupráce
39
4. Hry v rozvinutém tvaru 4.1 Principy V konfliktních situacích, popisovaných hrami v normálním tvaru, jsme předpokládali, že hráči realizují své strategie v jednom časovém okamžiku. Určité konfliktní situace lze však lépe popsat jako posloupnost tahů, ve kterých hráči reagují na předchozí tahy protihráčů. Do této skupiny konfliktů patří i mnohé salónní hry, jako například šachy, dáma, go apod., pro něž je typické střídání tahů mezi bílým a černým hráčem. Pro modelování konfliktů, jež jsou charakterizovány řadou po sobě jdoucích tahů (rozhodnutí) používáme hry v rozvinutém tvaru, které jsou též známy pod názvem hry v explicitním tvaru či tahové hry. Hru v rozvinutém tvaru znázorníme pomocí grafu, tzv. stromu hry. Grafem je množina uzlů a hran, strom je graf, který je souvislý, má jeden počáteční uzel, tzv. kořen, a zpravidla několik koncových uzlů, které reprezentují konec hry. Hráči se střídají a určují průběh hry v rozhodovacích uzlech. Rozhodovací uzly reprezentují volbu hráče mezi pro něj dostupnými alternativami v dané fázi hry. Příklad modelového zachycení hry v rozvinutém tvaru si ukážeme na hře zvané Stonožka, jejíž název je odvozen od grafického znázornění hry. Hra má následující pravidla: a) na začátku je dána výhra tak, že začínající hráč vyhrává více než dvojnásobek výhry druhého hráče (v příkladě volíme výhry 3 a 1); b) hráč na tahu může výhru přijmout a ukončit hru, nebo zvolit pokračování hry, přičemž výhry se zdvojnásobí, ale zároveň se vymění mezi hráči; c) je dán konečný počet tahů. V příkladě půjde pouze o pětitahovou hru, takže místo stonožky dostaneme jen „pětinožku“. Model hry Stonožka ve formě stromu včetně výher hráčů ukazuje obrázek č. 4.1. Hra má kořen, šest koncových uzlů a pět rozhodovacích uzlů (počítaje v to i kořen). Číslo uzlu uvádíme tučně v levém horním rohu. Řešení hry dostaneme zpětnou indukcí, tj. začneme analýzu v rozhodovacích uzlech v posledních tazích. Hru rozložíme na tzv. podhry, což jsou části hry, které jsou sami rovněž hrami. V tomto případě jde o uzel č. 9, ve kterém provádí rozhodnutí hráč 1, čímž vzniká podhra složená z uzlů č. 9, 10 a 11. Hráč 1 může zvolit uzel č. 10, což pro něj znamená výhru 48, nebo uzel č. 11, což pro něj znamená výhru 32. Racionální hráč zvolí výhru 48, tj. uzel č. 10. Cena podhry je tedy (48; 16), optimální strategii označíme v obrázku tučnou hranou. Nyní postoupíme o patro výše do uzlu č. 7, ve kterém je na tahu hráč
Teorie her: analýza konfliktů a spolupráce
40
2. Hráč 2 má k dispozici volbu uzlu č. 8 s výhrou 24 a volbu uzlu č. 9, který jsme v předchozí analýze ocenili pro hráče 2 výhrou 16. Optimální strategií této podhry je volba uzlu č. 8, což vyznačíme opět tučnou hranou. Hodnota uzlu č. 7 je (8; 24). Obdobně postupujeme až k uzlu č. 1, ve kterém zjistíme, že optimální strategií hráče 1 je přijmout výhru a hru ukončit. Cena hry je (3; 1). Hra ukazuje na paradox, že i když hráči mohou získat v této hypotetické hře vysoké výhry, jako racionální strategie se doporučuje hru ukončit a přijmout velmi malou výhru. Obrázek č. 4.1: Strom hry „Stonožka“ 1 počátek hráč 1 2 přijmout (3;1)
3 pokračovat hráč 2
4 přijmout (2;6)
5 pokračovat hráč 1
6 přijmout (12;4)
7 pokračovat hráč 2
8 přijmout (8;24)
9 pokračovat hráč 1
10 přijmout (48;16)
11 (32;96)
Tučně označené hrany označují dokonalou rovnováhu podhry (angl. subgame perfect equlibrium), která na rozdíl od Nashovy rovnováhy popisuje optimální strategie hráčů ve všech možných herních situacích. Víme například, že hráč 1 má v uzlu č. 9 volit pokračování do uzlu č. 10. Víme také, že do tohoto rozhodovacího uzlu se racionální hráči nemají vůbec dostat. Poněkud životu nebezpečnou hrou je Ruská ruleta. Předpokládejme dva hráče (šlechtický původ a značná opilost výhodou), kteří se rozhodli řešit spor o
Teorie her: analýza konfliktů a spolupráce
41
jistou dámu pomocí šestiranného revolveru s jediným ostrým nábojem. Náboj je v zásobníku umístěn náhodně. Hráč na tahu může s hanbou odstoupit ze hry nebo pozvednout revolver ke své hlavě a zmáčknout spoušť. Strategie „střílet“ vede k okamžité smrti nebo k radostnému předání revolveru protihráči. Ruská ruleta obsahuje náhodnou složku, neboť hráč nezná přesný výsledek strategie „střílet“. Při předpokladu náhodnosti umístění náboje ovšem může pracovat s pravděpodobnostmi obou variant. Při prvním zmáčknutí spoušti je pravděpodobnost smrti p1=1/6 a přežití p2=5/6. Při druhém zmáčknutí jsou pravděpodobnosti (1/5; 4/5) a při posledním, šestém zmáčknutí jsou pravděpodobnosti samozřejmě (1; 0). Obrázek č. 4.2 popisuje první dva tahy Ruské rulety. Pro řešení hry je nutné znát užitky obou hráčů z výsledků „výhra“, „prohra“ a „smrt“. Potom je možné použít metodu zpětné indukce pro nalezení konkrétního řešení odvislého právě od hodnot užitků. Obrázek č. 4.2: Strom hry „Ruská ruleta“
hráč 1
odstoupit
(prohra, výhra)
střílet
p1=1/6 (smrt, výhra)
p2=5/6 hráč 2
odstoupit
(výhra, prohra)
střílet
p1=1/5 (výhra, smrt)
p2=4/5 další tahy...
4.2 Salónní hry Matematický rozbor salónních her (zejména šachů, pokeru a hry v kostky) byl vcelku přirozeným počátkem teorie her. Mnoho šachových hráčů jistě trápí otázka, zda existuje vítězná strategie v šachové hře. Než se však pokusíme
Teorie her: analýza konfliktů konflikt a spolupráce
42
odpovědětt na tuto komplikovanou otázku, začneme za s rozborem hry NIM, která patří mezi nejjednodušší ednodušší tahové hry. Hru NIM může že hrát libovolný po počet hráčů. Předpokládejme pro jednoduchost jedn dva hráče, kteří se střídají řídají a odebírají herní kameny rozd rozdělené lené do hromádek. Hráč může že odebrat libovolný počet po kamenů,, avšak vždy alespoň alespo jeden a kameny musí být pouze z jedné hromádky. Hráč,, který byl nucen odebrat poslední kámen ve hře, ře, prohrál. Předpokládejme hru NIM se dvěma dv hráči, kteříí odebírají ze dvou hromádek, každá o dvou herních kamenech. Úplný popis hry ukazuje obrázek č. 4.3. Jelikož na pořadí adí hromádek nezáleží, není třeba eba rozlišovat situace (1 2) a (2 1), což dále zjednodušuje zobrazení zobraze hry ve formě grafu. U koncových uzl uzlů grafu označíme íme (+1) výhru prvního hráče hrá a (1) výhru druhé hráče. e. Jde o hru s konstantním (nulovým) součtem, sou v níž spolupráce hráčů nemá smysl. Optimální strategie (dokonalou rovnováhu podhry) obdržíme zpětnou ětnou indukc indukcí. Řešení je označeno tučnými nými hranami. Obrázek č. 4.3: Strom hry NIM 2x2
1 hráč 1 22
8
2 hráč 2
3 hráč 2
21
20
3 hráč 1
4 hráč 1
5 hráč 1
6 hráč 1
20
11
10
10
9 hráč 2
10 hráč 2
10
10
0 0 (-1)
13 0 0 (+1)
11 0 0 (-1)
7 0 0 (+1)
12 0 0 (-1)
14 0 0 (+1)
Hra NIM 2x2 není v žádném případě p intelektuálně zajímavou hrou, neboť nebo racionální hráč 2 vždy vyhraje, což víme již před p ed zahájením hry. Hráč Hrá 1 si pouze může v prvním tahu zvolit, zvoli jakým ze dvou způsobůů chce prohrát. Jedinou dobrou strategií hráče hrá 1 je hru NIM 2x2 vůbec bec nehrát. Přidáním P
Teorie her: analýza konfliktů a spolupráce
43
hromádek a herních kamenů se bude herní strom rozrůstat, přesto nám to nezabrání, abychom již na začátku hry neznali vítěze. Všimněme si, že uzly č. 4, 5, 6, 9 a 10 nejsou typickými rozhodovacími uzly, protože hráči nabízejí pouze jedinou možnost. Z tohoto důvodu jsou někdy označovány jako průchozí uzly. Hra v šachy je ve srovnání s hrou NIM mnohem složitější. Již po prvním tahu obou hráčů může nastat 400 různých pozic na šachovnici, tj. uzlů ve stromu hry. Klíčovým problémem při rozboru šachové hry je tedy především astronomický počet variant, který znemožňuje sestavení úplného stromu hry. Kupodivu se však ukázalo, že z teoretického hlediska jsou šachy stejně nudná hra jako NIM, protože již před začátkem hry by hráči měli vědět výsledek! Zásadní rozdíl je pouze v tom, že doposud se nikomu nepodařilo výsledek šachové hry vypočítat. Platí následující věta, která má zásadní význam pro analýzu šachové hry:
Každá konečná hra v rozvinutém tvaru s dokonalou informací má řešení v ryzích strategiích.
Šachy jako typickou tahovou hru lze popsat hrou v rozvinutém tvaru. Jde o hru s dokonalou informací, neboť každý hráč zná aktuální pozici na šachovnici a všechny předcházející tahy. Jinými slovy, hráč ví, ve kterém uzlu se hra momentálně nachází. To neplatí například v karetních hrách, kde obvykle neznáme karty protihráče, takže neznáme přesnou pozici, ve které se hra nachází. Typické karetní hry jsou proto hry s nedokonalou informací. Hra v rozvinutém tvaru je hra konečná, když má konečný počet tahů a v každém tahu má hráč k dispozici konečný počet strategií. To je u šachů splněno, neboť nekonečné opakování tahů není povoleno. Podle pravidel znamená třikrát opakovaná pozice ukončení hry a prohlášení remízy. Víme, že v šachu platí jedna z těchto možností: 1. bílý má vítěznou strategii (první na tahu vyhraje); 2. černý má vítěznou strategii (první na tahu prohraje); 3. hra skončí remízou. Nevíme a asi v dohledné době nebudeme vědět, která z výše uvedených možností je pravdivá. Zkušenosti ze šachových partií však ukazují na to, že vítězná strategie černého je nepravděpodobná. Jak počítače hrají šachy, když neznají strom hry? Počítače mohou konstruovat pouze části stromu hry a prohledat tak „blízké“ okolí současné pozice na
44
Teorie her: analýza konfliktů a spolupráce
šachovnici. Jelikož částečné stromy hry neobsahují koncové uzly, není možné přímo zjistit cenu podhry, takže je nutné pozice (uzly) hodnotit pomocí vyhodnocovacích funkcí. Každá pozice je číselně ohodnocena podle počtu figurek hráčů a jejich postavení a poté počítač zvolí strategii zajišťující přesun na pozici s nejvyšším hodnocením.
4.3 Příklad konfliktu dvou firem Uvažujme dvě firmy, které označíme jako firma 1 a 2. Firma 1 již operuje na určitém trhu a firma 2 se rozhoduje zda vstoupit či nevstoupit na daný trh. Firma 1 může bojovat proti vstupu firmy 2, nebo může zůstat nečinná. Důležitým faktorem v této hře je časová posloupnost akcí: 1) firmy mohou dělat rozhodnutí současně, pak je modelem hra v normálním tvaru, 2) první tah musí učinit firma 1, 3) první tah musí učinit firma 2. Dostáváme tak tři možné verze konfliktu. Varianta 1: Firmy realizují své strategie současně, takže odpovídajícím modelem dané konfliktní situace je hra v normálním tvaru. Jde o hru s nekonstantním součtem, řádková a sloupcová maxima jsou označena podtržením. Ryzí rovnovážné strategie v této situaci doporučují firmě 1 nereagovat na chování firmy 2 a firmě 2 vstoupit na trh s výplatami (4; 4).
Firma 1 – boj Firma 1 – žádná akce
Firma 2 – žádná akce 7; 0 8; 0
Firma 2 – vstup 0; -2 4; 4
Varianta 2: Firma 1 je první tahu. Firma se musí předem rozhodnout, zda začne boj proti potenciálnímu vstupu jiných firem na trh. Teprve poté následuje odpověď firmy 2. Modelem situace je hra v rozvinutém tvaru, řešení obdržíme použitím zpětné indukce. Dokonalá rovnováha je označena tučně. Firma 1 zahájí boj proti konkurenci, což vede firmu 2 k rozhodnutí nevstoupit na trh. Výplaty firem jsou (7; 0).
Teorie her: analýza konfliktů konflikt a spolupráce
45
Obrázek č. č 4.4: Strom hry - firma 1 má první tah
Firma 1
boj
žádná akce
Firma 2
Firma 2
žádná akce
vstup
žádná akce
vstup
(7; 0)
(0; -2)
(8; 0)
(4; 4)
Varianta 3: Nyní předpokládáme, ředpokládáme, že první na tahu je firma 2, která se rozhoduje vstoupit či nevstoupit na trh. Firma 1 může m že odpovědět odpově bojem nebo nečinností. Obdobněě jako v předchozím případě je dokonalá rovnováha označena tučně.. Firma 2 vstoupí na trh, na což firma 1 odpoví smířlivě, smí protože boj by poškodil i firmu 1 samotnou. Obrázek č. č 4.5: Strom hry - firma 2 má první tah
Firma 2
žádná akce
vstup na trh
Firma 1
Firma 1
boj
žádná akce
boj
žádná akce
(7;0)
(8; 0)
(0; -2)
(4; 4)
Příklad íklad nám názorně ukazuje, že zvolené pojetí časového rozložení rozhodnutí hráčů ovlivň ovlivňuje uje nejen typ zvoleného modelu, ale zejména volbu strategií a očekávaný ekávaný výslede výsledek hry.
46
Teorie her: analýza konfliktů a spolupráce
4.4 Cvičení 1. V ruské ruletě zvolte libovolně preference hráčů a stanovte optimální strategii (dokonalou rovnováhu podhry). 2. Předpokládejte hru NIM o dvou hráčích, třech hromádkách, každou hromádku o dvou kamenech. Kdo bude vítězem hry? 3. Předpokládejte, že ve hře NIM 2x2 vyhraje hráč, který odebere poslední kámen. Kdo bude vítězem hry? 4. Kolik možných pozic vznikne na šachovnici po prvních dvou tazích bílého a černého?
Teorie her: analýza konfliktů a spolupráce
47
5. Opakované hry 5.1 Základní pojmy, principy Až doposud jsme předpokládali, že hráči hrají určitou hru pouze jednou. V reálném světě se však setkáme s mnoha hrami (konflikty), které se neustále opakují. Například konkurenční firmy se opakovaně střetávají na trhu, pravidelně stanovují ceny a výši produkce. Čerpací stanice provádějí denně rozhodnutí o prodejních cenách pohonných hmot, supermarkety rozhodují nejen o cenách, ale také o tom, co prodávat. Lze spekulovat o tom, že dlouhodobý vztah mění chování hráčů. Jinak se chováme k tomu, s kým jsme se setkali poprvé a naposled, jinak k tomu, s kým se budeme setkávat i v budoucnu. Za nedodržení dohody v kooperativním konfliktu, s cílem okamžitého zisku na úkor ostatních, můžeme být v budoucnosti ostatními hráči potrestáni. Mnoho typů konfliktních situací se v životě opakuje, proto je nutné přemýšlet o tom, jak se projeví naše dnešní rozhodnutí v příštím kole. Pro studium opakovaných konfliktních situací byl v teorii her vyvinut model opakované hry. Uvažujme hru G v normálním tvaru s N hráči. Hra G je jednokolová hra, hraje se tedy pouze jednou. Na rozdíl od jednokolové hry budeme volbu strategie hráče i v jednotlivých kolech opakované hry nazývat akcí, termín strategie zde bude znamenat posloupnost zvolených akcí v rámci celé opakované hry. Každý hráč i má konečný neprázdný prostor akcí, který budeme značit Ai. Jestliže je hra G hrána opakovaně, pak řada jednokolových her G je sama o sobě také hrou, tzv. opakovanou hrou neboli superhrou, kterou označíme jako G*. Hra je hrána v diskrétních okamžicích t = 0, 1,…, T. Pokud je T<∞, hovoříme o konečně opakované hře, pokud T=∞, hovoříme o nekonečně opakované hře. Pozor, hodnota indexu t začíná od nuly, takže pro konkrétní T je celkový počet kol T+1. Dolní index v této kapitole bude vždy označovat hráče, horní index vždy kolo opakování hry. V opakované hře vycházíme z následujících předpokladů: • každý hráč má ve všech jednotlivých kolech hry stejný prostor akcí Ai, tedy Ait = Ait+1; • výplaty jsou ve všech jednotlivých kolech stejné, můžou však být diskontovány; • výplaty pro hráče závisí pouze na profilu akcí daného kola bez ohledu na to, které kolo hry se hraje; • hráči se rozhodují a uskutečňují své akce pro dané kolo hry současně.
48
Teorie her: analýza konfliktů a spolupráce
• každý hráč zná akce, které uskutečnili ostatní hráči v předchozím kole. Z prvních tří předpokladů vyplývá, že prostředí pro opakovanou hru je stacionární. Jinak řečeno, výplatní matice má v každém kole stejný rozměr a stejné hodnoty výplat. Z dalších dvou předpokladů vyplývá, že v jednotlivých kolech je volba konkrétní akce hráčem podmíněna minulými rozhodnutími ostatních hráčů. Nechť ait∈Ai je akce, kterou v období t zvolí hráč i. Potom vektor at=(a1, a2,…,an) je profil akcí, které jsou hrány v období t, neboli N-tice individuálních akcí jednotlivých hráčů v jednorázové hře G. Prostor profilů akcí je kartézským součinem prostorů akcí všech hráčů Ai a budeme ho značit A. Podmíněnosti volby akcí minulým chováním vyjádříme pomocí tzv. historie, která představuje všechny předchozí realizované profily akcí. Historie v období t je dána: ht = (a0, a1,…, at-1), pro t = 1, 2, K . Jinak řečeno historie ht v okamžiku t říká, jaké profily strategií (kombinace individuálních akcí v jednorázové hře) byly zvoleny ve všech předcházejících kolech. Pro vysvětlení pojmu historie ještě dodejme: • historie h0 je prázdná; • historie ht v sobě zahrnuje rovněž informaci o historiích ht-1, ht-2,…, h0; • historii hT označíme za konečnou historii, přičemž v nekonečně opakované hře má konečná historie nekonečnou délku (T=∞); • pozor, historie po třetím hraném kole hry je h2, neboť hra začíná v okamžiku nula. Příkladem možné historie po třetím kole v opakované hře kámen, nůžky, papír je: h2 = ((kámen, nůžky), (papír, papír), (kámen, papír)). Dále definujeme prostor historií Ht, což je množina všech možných historií ht v opakované hře. Prostor historií v období t je dán jako kartézský součin prostorů profilů akcí A jednotlivých kol opakované hry: Ht = (A)t = A0 × A1 × … × At.
Teorie her: analýza konfliktů a spolupráce
49
Například prostor historií po prvním kole vězňova dilematu je H1 = {(spolupráce, spolupráce), (spolupráce, zrada), (zrada, spolupráce), (zrada, zrada)}. Po druhém kole prostor historií H2 již obsahuje 4 x 4 = 16 možných historií h2. Nyní se již dostaneme ke strategiím hráčů v opakované hře. Ryzí strategie pro hráče i v opakované hře vyjádříme pomocí posloupnosti funkcí: si(ht): Ht → Ai. Funkce si(ht) přiřazuje akci ait∈Ai hráči i po odehrané historii ht∈Ht. Hráč tedy vyhodnotí výsledek odehrané hry (včetně chování ostatních hráčů) v období t-1 a na základě toho zvolí akci pro období t. Přirozeně v počátečním nultém kole nemá o chování protihráčů žádné informace, neboť historie akcí protihráčů v počátečním období je prázdná. Profil strategií odehraných hráči v kole t je popsán vektorem: st = (s1(ht), s2(ht),…, sn(ht)). Připomínáme, že dolní index v této kapitole vždy označuje hráče a horní index kolo hry. Strategii hráče i v opakované hře vyjádříme jako (T+1)složkový vektor: si = (si(h0), si(h1),…, si(hT)). Prostor strategií Si je množina všech strategií si, které může uskutečnit hráč i v opakované hře. Množina S je prostor profilů strategií, tedy množina obsahující všechny profily strategií, které mohou ve hře nastat. Příkladem ryzí strategie v nekonečně opakovaném vězňově dilematu je následující strategie: si(h0) si(ht){
= spolupráce, = spolupráce když ajτ = spolupráce, j≠i, pro τ=0, 1, 2, …, t-1; = podvod jinak.
Tuto strategii lze interpretovat takto: od počátku spolupracuj, dokud ostatní hráči také spolupracovali ve všech předchozích kolech, jinak podváděj. Významu této strategie se budeme ještě věnovat později v oddíle o nekonečně opakovaných hrách. Jak bude probíhat chování hráčů v průběhu opakované hry? Na počátku hry v nultém období neexistuje žádná historie (přesněji historie h0 existuje, ale je
50
Teorie her: analýza konfliktů a spolupráce
prázdná a tudíž zcela nezajímavá). Každý hráč volí svou akci pro nulté kolo ai0. Po uskutečnění nultého kola se vytvoří historie h1=(a0). Všichni hráči jsou obeznámeni s touto historií a volí své chování pro první kolo si(h1). Po odehrání prvního kola je historie aktualizována, tj. sloučíme profil akcí prvního kola a historii platnou pro první kolo, vznikne historie h2. Tato historie je sdělena všem hráčům, aby mohli zvolit své strategie pro druhé kolo. Ve stejném duchu je hra realizována v dalších kolech. Pro stanovení výplatní funkce ui v opakované hře vezmeme v úvahu přístup založený na diskontování s diskontním faktorem δi ležícím v intervalu (0, 1). Diskontní faktor δi je definován jako společný pro všechny výplaty z jednotlivých kol gi(at). Při přesnějších analýzách se může tento diskontní faktor lišit pro jednotlivé hráče a pro jednotlivá kola hry. Diskontováním zavádíme do výplatní funkce hodnotu času. Diskontní faktor slouží jako míra netrpělivosti hráčů. Hodnoty δi blízké nule značí netrpělivého hráče, který má větší sklon podvádět, neboť hrozba trestu v budoucnosti má pro něj malý význam. Naopak hodnoty δi blízké jedné charakterizují trpělivého hráče, pro kterého jsou budoucí výplaty významné, tudíž ztráty způsobené tresty v budoucnu ponese hůře. Z toho vyplývá, že trpěliví hráči jsou ochotni spolupracovat. Hráčova výplatní funkce je nejčastěji definovaná jako diskontovaný součet výplat z každého kola hry:
ui = g i (a ) + δ i g i (a ) + δ i g i (a ) + K = ∑ δ t i g i (a t ) , T
0
1
2
2
t =0
kde gi(at) jsou výplaty hráče z jednotlivých kol a T je konečné číslo nebo nekonečno. Diskontovaný součet výplat lze nahradit diskontovanou průměrnou výplatou:
u i = (1 − δ i )∑ δ t i g i ( a t ) , T
t =0
kde (1–δi) je normalizační faktor, který umožňuje přímé srovnání výplat opakované hry s jednorázovou hrou. Násobení užitkové funkce kladným číslem nemění preference. Pro hru s výplatou (2, 2, …) dostáváme:
ui = (1 − δ i )∑ δ i 2 =(1 − δ i ) T
t =0
t
2 = 2. (1 − δ i )
Teorie her: analýza konfliktů a spolupráce
51
Strategie si = (si(h0), si(h1),…, si(hT)) je Nashovou rovnováhou v opakované hře, jestliže si je nejlepší odezvou hráče i vůči chování ostatních hráčů, kteří se drží svých rovnovážných strategií.
5.2 Konečně opakované hry Pro konečně opakované hry je stanoven časový horizont opakování T<∞, který je znám všem účastníkům hry. V důsledku předem stanoveného počtu opakování, může dojít v posledních kolech hry ke změnám chování hráčů. V řadě experimentů bylo prokázáno, že hráči obvykle spolupracují až do doby, kdy je hra téměř u konce, a pak spolupráci poruší, neboť jim již nehrozí „trest“ od ostatních hráčů. Takovýto vývoj hry je tradičně vysvětlován na známém konfliktu vězňovo dilema (tabulka č. 5.1).
Tabulka č. 5.1: Jednokolová hra vězňovo dilema Nepřiznat Přiznat (spolupráce) (podvod) Nepřiznat (spolupráce)
2; 2
0; 3
Přiznat (podvod)
3; 0
1; 1
Mějme hru vězňovo dilema, kde δ je diskontní faktor a T je počet opakování hry. Víme, že jednorázová hra má řešení (podvod, podvod). Nyní předpokládejme, že hra má několik kol. V posledním kole má pro hráče spolupráce hodnotu 2, zatímco podvod hodnotu 3. Protože jde o poslední kolo, protihráč již nemůže hráče za podvádění potrestat, takže je výhodné podvádět. Výsledkem bude řešení (podvod, podvod), jak je tomu v jednorázové hře. Nyní uvažujme předposlední kolo, ve kterém opět volba spolupráce má hodnotu 2 a volba podvod hodnotu 3. Protihráč může podvádějícího hráče potrestat v posledním kole volbou podvod, která se však bude hrát v každém případě, takže nejde o žádný skutečný trest. Postupně dojdeme touto úvahou až na počátek hry. Věta: V konečně opakované hře vězňovo dilema existuje jediná Nashova rovnováha (a jediná dokonalá rovnováha podhry), ve které všichni hráči volí podvod.
Teorie her: analýza konfliktů a spolupráce
52
5.3 Nekonečně opakované hry V případě nekonečného časového horizontu modelujeme konfliktní situaci, ve které hráči nevědí, ve kterém kole hra skončí, či zda vůbec skončí. To je zřejmě obvyklá tržní situace, neboť firmy nepočítají s tím, že by hra měla v nějakém budoucím okamžiku skončit. Jelikož v této hře není pevně stanoveno poslední kolo hry, ve kterém by oba hráči určitě podváděli, hráči se drží spolupráce pod hrozbou trestu, který plyne z odchýlení od „dohodnuté“ strategie. Zatímco v konečně opakované hře můžeme stanovit optimální postup pro každé kolo hry, stanovit strategie pro nekonečně opakované hry je problematičtější, protože bychom museli určit akce po všech možných historiích, kterých je nekonečně mnoho. Místo jediné rovnovážné strategie pro nekonečně opakované hry existuje řada potenciálně rovnovážných strategií. Uvedeme pouze ty nejčastěji používané strategie pro vězňovo dilema (Slantchev, 2004, Skálová, 2007). Z hráčů se stávají jakési „automaty“, které jsou naprogramovány zpracovat vstupy (historii do kola t-1) a generovat příslušný výstup (akci hráče pro t-té kolo). 1.
Vždy podvádějte (Always Defect)
Tato strategie je též nazývána jako jestřábí strategie. Při užití jestřábí strategie hráč podvádí po jakékoliv historii, nezajímá se o volbu protihráčů. si(ht) = „podvod“ pro všechny t=0, 1, 2, …. 2.
Vždy spolupracujte (Always Cooperate)
Tato strategie je též známa jako tzv. holubí strategie. Hráč řídící se touto strategií bude vždy spolupracovat bez ohledu na protihráčovu strategii. si(ht) = „spolupráce“ pro všechny t=0, 1, 2, …. 3.
Naivní GrimTrigger
Strategie vybízí ke spolupráci, když ostatní hráči spolupracují, k podvodu v případě, že ostatní hráči podváděli v předchozím kole. Dále k následnému podvodu pro všechna další kola. Strategie navždy postihuje prohřešky ostatních hráčů. si(h0) si(ht){
= spolupráce, = spolupráce když ajτ = spolupráce, j≠i, pro τ=0, 1, 2, …, t-1, = podvod jinak.
Teorie her: analýza konfliktů a spolupráce
4.
53
Grim Trigger
Tato strategie doporučuje spolupracovat v počátečním kole a dále spolupracovat tak dlouho, dokud všichni hráči spolupracovali v předchozích kolech hry. Tato strategie postihuje nejen zradu protihráčů, ale i zradu hráče samotného. si(h0) si(ht){
5.
= spolupráce, = spolupráce když ajτ = spolupráce, pro τ=0, 1, 2, …, t-1, = podvod jinak.
Oko za oko (Tit-for-Tat) aneb půjčka za oplátku
Tato strategie doporučuje spolupráci v prvním kole a dále volit akce dle chování ostatních hráčů v předchozím kole, tj. podvádět, když ostatní podváděli nebo spolupracovat, když ostatní spolupracovali. si(h0) si(ht){
6.
= spolupráce, = spolupráce když ajt-1 = spolupráce, j≠i, = podvod jinak.
Omezená odplata (Limited Retaliation)
Strategie známá též jako „odpouštějící trigger“ doporučuje spolupráci v prvním kole, dále k kol podvádět jako odplatu při podvodu jiného hráče a po k kolech návrat do původního stavu spolupráce bez ohledu na to, co se stalo během odvety. 7.
Win-Stay, Lose-Shift (Pavlov)
Strategie vybízí ke spolupráci v prvním kole a následné spolupráci po jakékoliv historii, ve které posledním výstupem bylo (spolupráce, spolupráce) nebo (podvod, podvod), v ostatních případech podvádět. si(h0) si(ht){
= spolupráce, = spolupráce když at-1∈{(spolupráce, spolupráce), (podvod, podvod)}, = podvod jinak.
Teorie her: analýza konfliktů a spolupráce
54 8.
Jednou podvádějte (Deviate Once)
Doporučení plynoucí z této strategie je užití strategie „Oko za oko“ až do kola L, pak podvádět v kole L, spolupracovat v kole L+1 a poté volit chování dle strategie „Oko za oko“: si(ht) si(ht){ 9.
= spolupráce když t = 0 nebo t = L+1, = spolupráce když ajt-1 = spolupráce, j≠i, t≠L, = podvod jinak.
Grim Deviate Once
Strategie předpokládá aplikaci strategie „Grim Trigger“ až do kola L, v Ltém kole a kolech následujících hráč podvádí. si(h0) si(ht, t
= spolupráce, = spolupráce když ajτ = spolupráce, pro τ=0, 1, 2, …, t-1, = podvod jinak, = podvod.
Pro určení průběhu opakované hry a výpočet výplat potřebujeme určit Nashovy rovnovážné strategie obou hráčů. Jedny z možných rovnovážných strategií představují strategie „Grim Trigger“. Předpokládejme, že ve hře vězňovo dilema z tabulky č. 5.2 oba hráči uvažují použít strategii „Grim Trigger“. Jsou tyto strategie Nashovými rovnovážnými strategiemi? Bude výsledkem hry trvalá spolupráce? Na čem závisí rozhodnutí hráčů?
Tabulka č. 5.2: Jednorázová hra vězňovo dilema Nepřiznat (spolupráce)
Přiznat (podvod)
Nepřiznat (spolupráce)
2; 2
0; 3
Přiznat (podvod)
3; 0
1; 1
Když oba hráči aplikují strategii „Grim Trigger“, budou spolupracovat a výsledkem budou výplaty (2, 2, 2, ...). Jestliže se jeden z hráčů odchýlí (zvolí strategii podvod), bude protihráč od dalšího kroku až do nekonečna volit podvod. Výplaty hráče-podvodníka tedy budou (3, 1, 1,…), což znamená, že získá o jednu jednotku v prvním kole navíc a ztratí jednu jednotku v každém
Teorie her: analýza konfliktů a spolupráce
55
následujícím kole. Pro velmi netrpělivého hráče s nízkou (blízkou nule) hodnotou diskontního faktoru δi, tedy pro hráče jež se nestará o budoucnost, může být strategie podvod výhodnější. Pro opakovanou hru při realizaci strategie spolupracovat dostáváme výplaty (2, 2, …), z čehož odvodíme diskontovanou průměrnou výplatu:
ui = (1 − δ i )∑ δ i 2 =(1 − δ i ) T
t
t =0
2 = 2. (1 − δ i )
Při realizaci strategie podvod v kroku τ dostáváme řadu výplat (2, 2,…,2, 3, 1, 1,…). Diskontovaná průměrná výplata z této řady je:
(1 − δ )(2 + 2δ i
+ 2δ i + K + 2δ i 2
i
τ −1
τ
+ 3δ i + 1δ i
τ +1
)
+K
τ −1 ∞ τ t = (1 − δ i ) ∑ 2δ + 3δ + ∑ δ t t =0 t =τ +1 δ τ +1 2(1 − δ τ ) τ = (1 − δ ) + 3δ + 1 − 1 − δ δ (1 − δ τ )2 + (1 − δ )3δ τ + δ τ +1 = 2 + δ τ − 2δ τ +1 .
Netrpělivý hráč se neodchýlí od strategie spolupracovat, když pro diskontní faktor platí:
2 + δ τ − 2δ τ +1 ≤ 2,
δ τ ≤ 2δ τ +1 , δ ≥ 0,5. Daný výsledek znamená, že podvádění se trpělivým hráčům s diskontním faktorem δ větším nebo rovno 0,5 nevyplatí. Naopak netrpěliví hráči s nízkou hodnotou diskontního faktoru preferují krátkodobý zisk (podvod) před budoucností. Platí tedy, že strategie „Grim Trigger“ je Nashovou rovnováhou v nekonečně opakované hře vězňovo dilema při diskontním faktoru větším nebo rovno 0,5. Odchýlením od rovnovážné strategie nemůže žádný z trpělivých hráčů nic získat. Důležitou součástí teorie nekonečně opakovaných her je tzv. lidová věta (folk theorem), přesněji soubor lidových vět. Lidová věta je jako lidová píseň, každý ji zná, ale nikdo neví, jak vlastně vznikla a kdo je původním autorem. Byla herními teoretiky známa a používána před tím, než byl znám její důkaz. Podle lidové věty platí, že když jsou hráči dostatečně trpěliví, pak jakákoliv
56
Teorie her: analýza konfliktů a spolupráce
přípustná individuálně racionální výplata, která je vyšší než maximinová zaručená výplata, může představovat Nashovu rovnováhu. Jinými slovy pro opakované hry s diskontním faktorem blízkým k jedné existuje mnoho rovnovážných strategií, výše uvedená strategie „Grim Trigger“ je pouze jednou z mnoha alternativ. Význam lidové věty, či spíše věty o přípustnosti, si vysvětlíme na konfliktu vězňovo dilema z tabulky č. 5.2. Ryzí strategie dávají výplaty (2; 2), (0; 3), (3; 0) a (1; 1). Všechny tyto výplaty a jejich konvexní kombinace jsou dosažitelné. Individuálně racionální výplata je taková, která je větší nebo rovna maximinové výplatě (zaručené výhře), což je nejnižší výplata, kterou hráč získá bez ohledu na strategie protihráčů. V našem příkladě je maximinovou výplatou hráčů (1; 1), kterou si hráč může zajistit strategií „vždy podvádějte“.
Teorie her: analýza konfliktů a spolupráce
57
6. Kooperace ve hře s více hráči 6.1 Koaliční hry Jestliže hráči mají možnost uzavírat závazné smlouvy o tom, jaké volby strategií učiní, provádíme analýzu konfliktní rozhodovací situace pomocí kooperativní hry. Kooperativní hrou dvou hráčů jsme se již zabývali v oddílu 3.3. Ve hře s dvěma hráči existují pouze dvě možnosti řešení: buď se hráči dohodnou na vzájemné spolupráci, nebo budou v konfliktu vystupovat jako konkurenti. Jak už víme, kooperace vznikne jen tehdy, pokud bude pro oba hráče výhodná. To znamená, že kooperativní řešení zajistí hráčům výhry vyšší než jsou jejich rovnovážné zaručené výhry, které získají z Nashovy rovnováhy. V kooperativní teorii se při větším počtu hráčů, rozumějme pro N>2, nastoluje hráčům zcela nová otázka, totiž s kým spolupracovat a proti komu. Skupinu hráčů, kteří spolupracují při volbě strategií nazveme koalicí. Proto také kooperativní hry s N hráči nazýváme též jako koaliční hry. Nechť N = {1, 2, ..., N} je množina hráčů, potom koalicí hráčů rozumíme každou podmnožinu S množiny hráčů N. V případě, že S se shoduje s N, jsou v koalici všichni hráči a hovoříme o velké koalici. Pozor, politici si pod pojmem velká koalice představují něco jiného. I když nějaký hráč nevstoupí do žádné koalice s dalšími hráči, budeme ho přesto nazývat koalicí, v tomto případě koalicí jednoprvkovou. Zatímco ve hře se dvěma hráči máme pouze dvě řešení, v koaliční hře se třemi hráči máme již pět možných řešení: • Všichni hráči spolupracují. • Prvý a druhý hráč tvoří koalici proti třetímu hráči. • Prvý a třetí hráč tvoří koalici proti druhému hráči. • Druhý a třetí hráč tvoří koalici proti prvému hráči. • Všichni hráči hrají samostatně. Počet možných řešení rychle roste s počtem hráčů. Ve hře s N hráči je možné vytvořit 2N-1 koalic, přičemž jeden hráč může být členem v 2N-1-1 různých koalicích. Množinu všech utvořených koalic v rámci určité hry budeme nazývat koaliční strukturou. Optimální (rovnovážná) koaliční struktura je
Teorie her: analýza konfliktů a spolupráce
58
řešením koaliční hry. Ve hře o pěti hráčích můžeme popsat koaliční strukturu například následovně: ({1,4},{2, 3},{5}). Ve hře vznikly tři koalice. Spolupracují hráči 1 a 4, dále hráči 2 a 3, hráč 5 hraje samostatně. V typických konfliktních situacích budeme předpokládat hru s volnou disjunktní koaliční strukturou, což znamená, že přípustné jsou jakékoli koalice a že hráč může být členem pouze jedné koalice. V případě volné disjunktní koaliční struktury lze počet všech možných koaličních struktur vypočítat ze vzorce:
k R ( N ) = ∑∑ ( − k ) − j ( k − j ) N . k =1 j = 0 j N
k
Pro rostoucí počet hráčů N dostáváme řadu hodnot R(2)=2, R(3)=5, R(4)=52 atd. Při modelování kooperativních her je výhodné přejít od hry v normálním tvaru k tzv. hře ve tvaru charakteristické funkce. Charakteristickou funkcí hry s množinou hráčů N nazveme takovou funkci v, která je definována pro všechny podmnožiny S, to jest pro všechny koalice, kterých je 2N-1. Každé koalici charakteristická funkce přiřazuje hodnotu v(S), což je výhra (zisk) koalice S. Charakteristická funkce je obdobou výplatní funkce, kterou známe z her v normálním tvaru, s tím rozdílem, že charakteristická funkce přiřazuje výplaty koalicím, nikoliv hráčům. Dvojice (N, v) se nazývá kooperativní hrou N hráčů ve tvaru charakteristické funkce. Hodnotu charakteristické funkce pro koalici S, ve které nejsou zahrnuti všichni hráči, je možné stanovit na základě dvou předpokladů: a) hráči mimo koalici S volí rovnovážné strategie, potom jde o rovnovážnou reprezentaci charakteristické funkce; b) hrači mimo koalici volí nejhorší možné strategie z pohledu koalice S, potom jde o maximinovou reprezentaci charakteristické funkce. Přikláníme se k rovnovážné reprezentaci, neboť hráči mimo koalici S by měli mít zájem maximalizovat svou výhru, než připravovat potrestání koalice S, které bude také pro ně nevýhodné. Charakteristická funkce hry je superaditivní, když pro každou dvojici koalic platí:
v(S1 ∪ S 2 ) ≥ v(S1 ) + v(S 2 ) ,
Teorie her: analýza konfliktů a spolupráce
59
kde S1, S2 jsou disjunktní podmnožiny množiny N. Jinými slovy při vytvoření větší koalice je výhra větší nebo rovna součtu výher menších koalic. V praktických situacích superaditivnost není vždy splněna. Například spojení dvou hráčů proti zbývajícímu třetímu hráči může být pro dva spolupracující hráče výhodnější než spolupráce všech tří hráčů. Jestliže pro každou možnou koaliční strukturu je součet výher všech utvořených koalic roven určité konstantě, jde o hru s konstantním součtem. V opačném případě jde o hru s nekonstantním součtem. Příkladem hry s konstantním součtem by mohla být volební hra (viz níže), ve které vítězná (vládnoucí) koalice získává výhru označenou symbolicky 1 a poražená koalice získává výhru -1. Konečné rozdělení výher mezi hráče nazýváme rozdělením, které má tvar vektoru (a1, a2,…, aN). Předpokládáme, že jde o hru s přenosnou výhrou, takže neexistují žádné překážky pro uzavření dohody o jakémkoli přerozdělení výhry koalice. Uvažovat přenositelnost užitků by bylo teoretickou komplikací, proto si pod výhrou v koaliční hře pro zjednodušení představujme spíše nějakou peněžní částku. Výhra jednotllivého hráče závisí jednak na celkové výhře koalice v níž je členem a jednak na přerozdělení výhry uvnitř koalice. Zájem na maximalizaci výhry koalice vyjadřuje princip kolektivní racionality, podle kterého bychom v prvním kroku měli sestavit koalici s nejvyšší celkovou výhrou. Jestliže jsou v koalici všichni hráči, postup končí, jinak postupujeme dalšími kroky. Ve druhém kroku máme opět sestavit koalici s nejvyšší výhrou, avšak k dispozici máme již jen hráče, kteří netvoří koalici z prvního kroku. Takto pokračujeme, dokud není ustavena úplná koaliční struktura hry. Zájem na maximalizaci výhry hráče či podskupiny hráčů při přerozdělení výhry v rámci koalice vyjadřuje princip skupinové stability. Na řešení tedy ještě požadujeme: a) aby byla mezi hráče vždy rozdělena celá výhra koalice, b) aby každá podkoalice L měla při dělení výhry koalice K zajištěn nejméně takový podíl, který si podkoalice L může zajistit vystoupením z koalice K. Pro každou koalici K musí podle principu skupinové stability platit:
∑a i∈K
i
= v( K ),
∑a i∈L
i
≥ v(L ), L ∈ K .
Pokud některá z koalic není skupinově stabilní, je třeba se vrátit k principu kolektivní racionality a sestavit novou koaliční strukturu. Místo nevyhovující koalice s nejvyšší výhrou vybereme koalici s druhou nejvyšší výhrou. Celý postup opakujeme.
Teorie her: analýza konfliktů a spolupráce
60
Množinu všech přípustných rozdělení (a1, a2,…, an), které splňují podmínky skupinové stability, nazveme jádrem hry. Pokud není koaliční struktura určena jednoznačně (charakteristická funkce nabývá shodných hodnot pro více koalic), přičemž jádra daná těmito koaličními strukturami splňují podmínky skupinové stability, má hra více jader. Pokud podmínky skupinové stability nesplňuje žádné rozdělení, je jádro hry prázdné. Pro řešení her ve tvaru charakteristické funkce byla kromě principu skupinové stability navržena řada koncepcí, žádná z koncepcí však nezaručuje jednoznačné normativní řešení pro daný typ konfliktu. Proto byly kromě postupů pro řešení her, které nebyly zcela úspěšné, rozvíjeny metody pro rozbor her, které však neusilují o nalezení konkrétního řešení. Tyto metody se zaměřují zejména na analýzu vyjednávání hráčů o rozdělení výher a k ohodnocení pozice jednotlivých hráčů v konfliktu. Americký matematik a ekonom Lloyd Stowell Shapley v roce 1953 navrhl metodu odhadu síly hráče z hlediska jeho mezního přínosu ke všem koalicím, v nichž může být členem. Toto řešení se označuje jako Shapleyův vektor a jeho složky bývají označovány jako Shapleyovy hodnoty. Pro hru je Nrozměrný Shapleyův vektor definován jako h = (h1, h2, ..., hN), přičemž jednotlivé složky označují střední hodnotu mezního přínosu i-tého hráče ke všem koalicím, ve kterých může být členem. Přínos hráče ke koalici S vypočteme podle:
v (S ) − v (S − {i}). Komplikací je, že s rostoucím počtem hráčů N prudce narůstá počet koalic a způsobů jejich tvorby. Shapleyovu hodnotu hry pro i-tého hráče vypočteme jako vážený součet mezních přínosů podle vzorce:
( S − 1) ! (N − S ) ! hi = ∑ .[v (S ) − v(S − { i})], N! S kde symbolem |S| je označen počet členů koalice S a sumace probíhá přes všechny koalice, pro které platí i ∈ S. Výpočet Shapleyovy hodnoty si ukážeme v příkladě 6.1. Příklad 6.1:
Teorie her: analýza konfliktů a spolupráce
61
Mějme koaliční hru tří hráčů. Hra je dána charakteristickou funkcí s těmito hodnotami: v({1}) = 1; v({1, 2}) = 2; v({1, 2, 3}) = 6
v({2}) = 2; v({1, 3}) = 3;
v({3}) = 3; v({2, 3}) = 6;
Při výpočtu předpokládáme, že hráči postupně přicházejí na místo, kde se uzavírají koaliční dohody. Ve hře se třemi hráči existuje celkem šest možných pořadí příchodů (viz tabulka č. 6.1). Zápis 1-2-3 v tabulce značí, že nejprve přijde prvý hráč, takže jeho přínos v({1}) – 0. Poté přijde druhý hráč a uzavře koalici s prvým hráčem, takže přínos druhého hráče je v({1, 2}) – v({1}). Poslední přichází třetí hráč a připojí se k již existující koalici prvého a druhého hráče. Přínos třetího hráče je v({1, 2, 3}) – v({1, 2}). Takovým postupem vyplníme všechny řádky tabulky. Každý řádek tabulky má pravděpodobnost 1/6, proto Shapleyovu hodnotu pro každého hráče obdržíme ze sloupcového součtu násobeného 1/6. Tabulka č. 6.1 Postup tvorby koalice 1-2-3 1-3-2 2-1-3 2-3-1 3-1-2 3-2-1 Shapleyova hodnota hi
Hráč 1 1 1 0 0 0 0 2/6
Hráč 2 1 3 2 2 3 3 14/6
Hráč 3 4 2 4 4 3 3 20/6
Nejsilnějším hráčem ve hře je třetí hráč, který je následován druhým hráčem. Vyjednávací pozice (využijme v politice oblíbený pojem „koaliční potenciál“) prvého hráče je minimální, protože žádné koalici nic nepřináší. Tedy s výjimkou jednoprvkové koalice, ve které je sám členem.
6.2 Hlasovací hry Nechť N = {1, 2, ..., N} je množina politických stran v parlamentu. Počet poslanců i-té strany bude označován jako ai a celkový počet zástupců v parlamentu lze vyjádřit ve tvaru
Teorie her: analýza konfliktů a spolupráce
62 N
a0 = ∑ ai . i =1
Důležitým faktorem, který určuje reálný vliv a hlasovací sílu určitého politického seskupení je tzv. hlasovací pravidlo vyjádřené prostřednictvím hodnoty α. Toto hlasovací pravidlo je obvykle chápáno tak, že minimální počet hlasujících, který je potřeba k vítězství v dané hlasovací situaci (např. schválení návrhu zákona), je zjišťován podle vztahu int (α a0) + 1, kde symbol int označuje celou část součinu αa0. Pokud je respektováno hlasovací pravidlo α, pak pro vítěznou m-člennou koalici (1 ≤ m ≤ N) platí: m
∑a i =1
i
− int (αa0 ) > 0.
V opačném případě se jedná o koalici poraženou, která nemůže v parlamentu prosadit svou vůli. Pro měření síly koalic je možno použít koncepci kooperativní hry N hráčů ve tvaru charakteristické funkce. Pokud pro všechny koalice S hry ve tvaru charakteristické funkce platí v(S) = 0 nebo v(S) = 1, používá se pro tuto hru (N, v) označení prostá hra. Funkce v(S)=1, je-li S vítězná koalice, v(S)=0, jeli S poražená koalice, je charakteristickou funkcí hry. Prostá hra (N, v, α) s takto definovanou charakteristickou funkcí je pak označována jako hlasovací hra. V české literatuře jsou tyto hry též známy jako hry volební. My se kloníme k názvu hra hlasovací, neboť nejde o volby, ale o hlasování již zvolených zástupců. Pro další analýzu hlasovací her je nutné přijmout následující tři předpoklady: a) Všichni zástupci jedné strany hlasují vždy jednotně. b) Vytvoří-li se v určité fázi hlasovacího procesu nějaká koalice stran, pak také všichni členové této koalice hlasují totožně. c) Je možno vytvořit libovolnou koalici stran a všechny koalice jsou stejně pravděpodobné. Všechny tyto předpoklady však v praxi bývají splněny zřídka. Přes tento nedostatek jsou však indexy, které vycházejí z řešení takto koncipovaných
Teorie her: analýza konfliktů a spolupráce
63
kooperativních her ve tvaru charakteristické funkce, zajímavým a výhodně použitelným indikátorem situace v parlamentu. Indexy síly vycházejí ze skutečnosti, že pouze samotné rozdělení zástupců mezi jednotlivé strany ve volební hře není postačujícím ukazatelem síly a vlivu politických subjektů. Záleží také na síle (potenciálu) strany pro vytvoření vítězné koalice. Shapleyva hodnota kooperativní hry se stala podnětem i pro pokusy odhadnout rozdělení síly jednotlivých politických stran v parlamentech. V tomto případě se Shapleyova hodnota zjednoduší tak, že složky vektoru h = (h1, h2, ..., hN) vyjadřujeme pomocí vztahu:
( S − 1) ! (N − S ) ! hi = ∑ , N! i∈S kde sumace probíhá přes všechny vítězné koalice S takové, že i∈S a S-{i} je poražená koalice. Pro Shapleyovy hodnoty platí: N
∑h i =1
i
= 1, hi ≥ 0 .
a vektor h je možno interpretovat jako vektor pravděpodobností. V literatuře zabývající se problematikou společenského výběru a v politologických statích je hodnota hi označována zpravidla jako Shapleyův-Shubikův index síly pro i-tého hráče. Lze ji interpretovat jako pravděpodobnost, že i-tá strana bude nezbytná při sestavování vítězných koalicí (všech teoreticky možných).
Příklad 6.2: Předpokládejme, že v parlamentu s 200 poslanci jsou zastoupeny tři strany A, B, C, přičemž strana A má 95 poslanců, strana B má 85 poslanců a strana C má v parlamentu 20 zástupců. Pro úroveň α=0,5 můžeme definovat následující volební hru: v({A}) = v({B}) = v({C}) = 0; v({A,B}) = v({A,C}) = v({B,C}) = 1; v({A,B,C}) = 1. Použitím vzorce pro výpočet hodnot Shapleyova-Shubikova indexu síly lze získat výsledný vektor h = (1/3, 1/3, 1/3). Index síly je totožný pro všechny tři strany.
64
Teorie her: analýza konfliktů a spolupráce
Pro hladinu α = 0,6 (vítězná koalice musí mít 120 hlasů) dostaneme odlišnou volební hru, kterou lze popsat prostřednictvím těchto hodnot: v({A}) = v({B}) = v({C}) = 0; v({A,C}) = v({B,C}) = 0; v({A,B}) = 1; v({A,B,C}) = 1. Zde je h = (1/2, 0, 1/2), moc je v parlamentu soustředěna do rukou dvou velkých stran. Shapleyova hodnota má tvar střední hodnoty počítané za předpokladu, že všechny koalice o stejném počtu členů mají stejnou naději na realizaci. Je tedy možné očekávat, že spíše než k normativnímu použití bude tato hodnota vhodná k popisu očekávaných výsledků konfliktů, jejichž účastníci nejsou příliš schopni orientovat se ve složité situaci tvorby koalic. Jak však ukázala řada vhodně volených experimentů, skutečné výsledky se vyznačují značnou variabilitou a navíc se objevují i značné, často těžko zdůvodnitelné rozdíly v konečných výhrách hráčů, kteří mají ve hře jinak naprosto symetrické postavení. Jindy se stává, že hráč, který má podle Shapleyovy hodnoty nejsilnější pozici, se slabším hráčům znelíbí (např. zásluhou přehnaného zdůrazňování své vlastní síly), takže se nakonec ocitne v izolaci a skončí daleko za slabšími hráči, kteří jednají kolektivně. Výsledky získané tímto způsobem tedy nelze přeceňovat, ale na druhou stranu je pomocí nich možné odhalit celou řadu zajímavých informací. Příklad 6.3: hra 4-3-2 Předpokládejme experimentální hru se třemi hráči a, b, c. Hráč a má 4 hlasy, hráč b má 3 hlasy, hráč c má 2 hlasy. Vítězná koalice si má rozdělit výhru o hodnotě 100. Vytvoření koalice je vázáno na dohodu o rozdělení hodnoty 100 mezi členy koalice. V průběhu času při vyjednávání se mohou koalice měnit. Vítěznou koalicí může být 3-členná koalice a všechny dvoučlenné koalice. Zpočátku se mohou vytvářet nejrůznější koalice s různými návrhy pro rozdělení výhry. Během času se vytvoří 3-členná koalice s rozdělením (1/3, 1/3, 1/3). Tato koalice je však nestabilní, protože si uvědomuje, že členové 2členné koalice mohou získat větší výhru. Hráč a se může ostatním znelíbit tím, že mohl zpočátku požadovat větší výhru vzhledem k jeho největšímu počtu hlasů. Ve většině experimentů se nakonec utvoří stabilní koalice hráčů
Teorie her: analýza konfliktů a spolupráce
65
(b, c) s rozdělením (1/2, 1/2). Tento experiment dokumentuje vlastnost, že síla může být nevýhodou. V roce 1965 použil J. F. Banzhaf novou míru charakterizující rozdělení síly. Nechť (N, v, α) definuje volební hru. Nechť platí v(S) = 1, v(S-{i}) = 0, potom hráče i lze označovat jako nepostradatelného pro vítězství koalice S. Symbolem ei budeme v dalším postupu značit počet všech koalic S takových, pro které je hráč i ∈ S nepostradatelný. Tato míra, která později dostala název Banzhafův index síly, se obvykle značí b = (β1, β2, ..., βn) a její jednotlivé složky pro hráče 1, 2, ..., N jsou definovány jako:
βi =
ei N
∑e k =1
i
a platí N
∑β i =1
i
= 1, β i ≥ 0.
Koeficient βi vyjadřuje pravděpodobnost situace, při které strana svým odstoupením může anulovat vítězné postavení koalice. Příklad 6.4: Předpokládejme parlament s 200 poslaneckými mandáty, ve kterém jsou zastoupeny tři strany, A, B, C. Strana A má 100 poslanců, strany B a C mají shodně 50 poslanců. Charakteristická funkce při úrovni α = 0,5 má potom tuto podobu: v({A}) = v({B}) = v({C}) = 0; v({B,C}) = 0; v({A,B}) = v({A,C}) = 1; v({A,B,C}) = 1. Jak je vidět, při hlasování vyžadujícím absolutní většinu hlasů budou úspěšné ty návrhy, pro které budou hlasovat členové koalice {A,B} nebo {A,C} nebo {A, B, C}. Existuje celkem pět možností, které vedou ke „zničení“ vítězné koalice: a) hráč A může odstoupit z koalic {A, B}, {A, C} a {A, B, C}, b) hráč B může odstoupit z koalice {A, B}, c) hráč C může odstoupit z koalice {A, C}.
66
Teorie her: analýza konfliktů a spolupráce
To znamená, že strana A je nezbytná pro úspěch koalic {A, B}, {A, C} i {A, B, C}, proto je e1 = 3. Stejným způsobem lze dojít k hodnotám e2 =1 a e3=1. Banzhafův index síly, jenž charakterizuje blokovací schopnost v hlasovacím procesu, má tedy tvar b = (3/5, 1/5, 1/5). Shapleyův-Shubikův index síly při hodnotě α = 0,5 (na vítězství je třeba získat 101 hlas) je pro takto zadaný příklad možno stanovit jako h = (2/3, 1/6, 1/6). Banzhafův index síly oproti indexu, který byl navržen Shapleyem a Shubikem, považuje vedoucí roli strany A v příkladě za méně jednoznačnou. Praktickou cestou výpočtu Banzhafových indexů je zpravidla použití kombinatorického algoritmu pro generování všech možných koalic. Jádrem tohoto algoritmu je procedura vytvářející k-prvkové podmnožiny z N-prvkové množiny pro různé hodnoty k = 1, 2, ..., N. Při výpočtu ShapleyovaShubikova indexu síly lze použít postupu, který je založen na konstrukci permutací, které mohou být vytvořeny ze všech stran s ohledem na jejich pořadí ve vytvořené koalici. Předpokládejme, že se parlament může skládat z více částí hlasujících odděleně. Návrhy pak mají naději na schválení pouze v případě, kdy úspěšně prošly každou ze sněmoven. Pro tuto strukturu parlamentu se používá označení vícekomorová legislativa nebo také hlasovací hra v parlamentu s více sněmovnami. Nechť m je počet sněmoven ve vícekomorovém parlamentu a nechť aik je počet poslanců i-té strany v k-té sněmovně. Potom celkový počet poslanců v k-té sněmovně je N
a0 k = ∑ aik , i =1
přičemž počet poslanců v jednotlivých sněmovnách se nemusí shodovat. Máli být m-prvková koalice S prohlášena za vítěznou, musí pro ni platit vztah: m min ∑ aik − int (a * a0 k ) > 0. i =1
Takto definované kritérium zaručuje, že koalice S dosáhla v každé ze sněmoven většinu s požadovanou hranicí α. Pokud tato většina není dosažena alespoň v jedné sněmovně, potom koalice nedokázala zvítězit a prosadit svůj zájem.
Teorie her: analýza konfliktů a spolupráce
67
Příklad 6.5: Uvažujme parlament, který má tři sněmovny, v nichž mají zastoupení tři politické strany A, B a C, jak je vidět v následující tabulce:
Tabulka č. 6.2 strana 1. sněmovna 2. sněmovna 3. sněmovna A 100 40 20 B 80 15 20 C 20 25 40 celkem 200 80 80
celkem 160 115 85 360
V další tabulce jsou uvedeny možné koalice, počty získaných hlasů a výsledky hlasování vyjádřené prostřednictvím hodnot charakteristických funkcí při různé výši koeficientu α.
Tabulka č. 6.3 koalice 1. sněmovna 2. sněmovna 3. sněmovna {A} 100 40 20 {B} 80 15 20 {C} 20 25 40 {A, B} 180 55 40 {A, C} 120 65 60 {B, C} 100 40 60 {A, B, C} 200 80 80
α = 0,5 0 0 0 0 1 0 1
α = 0,6 0 0 0 0 0 0 1
Jak je vidět z tabulky č. 6.3, při použití obou pravidel hlasování je vítězství vázáno na úspěch ve všech třech komorách. Při použití koeficientu α = 0,5 existují dvě vítězné koalice - {A, C} a "velká" koalice {A, B, C}. Při výpočtu Shapleyova-Shubikova indexu pro stranu A je nutno nalézt vítězné koalice, ve kterých je účast této strany nezbytná. Strana A je nepostradatelným členem obou vítězných koalic: odstoupením z koalice {A, B, C} by zbylá dvojice stran nemohla zvítězit, jelikož nemá odpovídající většinu v první ani druhé sněmovně; pokud by strana A odstoupila z koalice {A, C}, pak by se osamocená strana C musela vzdát naděje na úspěch, neboť nedosahuje požadovanou většinu v žádné ze sněmoven.
68
Teorie her: analýza konfliktů a spolupráce
Podobně lze zjistit, že strana C je nezbytnou součástí obou vítězných sdružení, zatímco strana B nemusí být součástí koalice {A, B, C}, protože i bez její účasti lze tuto koalici prohlásit za vítěznou. Vypočteme charakteristiky pro všechny tři strany. Pro α = 0,5 dostáváme výsledek ve tvaru s = (1/2, 0, 1/2). Obdržíme tedy poněkud překvapivý závěr – s ohledem na použití principu absolutní většiny je síla strany C v takto koncipovaném tříkomorovém parlamentním modelu stejná jako síla strany A, ačkoli strana C má pouze 23,6% všech poslanců a podíl strany A je mnohem výraznější (přibližně 44,4%). Zásluhou specifického rozdělení voličů jednotlivých stran ve sněmovnách nemá strana B žádnou sílu při hlasování, i když jejích 115 poslanců tvoří téměř třetinu poslanců. V tomto případě jsou hodnoty Banzhafova indexu síly stejné jako hodnoty Shapleyova - Shubikova indexu. Výpočtem pro hranici α = 0,6 získáme vektor s = b = (1/3, 1/3, 1/3), neboť existuje pouze jediná možná vítězná koalice a všechny tři strany jsou její esenciální součástí. V souvislosti s výsledky dosaženými v tomto tříkomorovém parlamentu se nabízí otázka, jak by vypadalo apriorní rozdělení síly mezi stranami v klasickém parlamentu, který by měl pouze jednu komoru a v kterém by se počet poslanců a jejich poměrné zastoupení mezi stranami nezměnily. Pro tento parlament s 360 poslanci a počty 160, 115 resp. 85 zástupců jednotlivých stran vychází hodnoty značně odlišné v porovnání s parlamentem založeném na principu legislativy více komor. Konkrétně v případě použití α = 0,5 platí s = b = (1/3, 1/3, 1/3) a při α = 0,6 vychází výsledky ve formě s = (2/3, 1/6, 1/6) a b = (3/5, 1/5, 1/5). Teorie formování koalic Teorie formování koalic se používají k předpovídání struktury koalic v parlamentní vládě. Pochopení jak dané volební výsledky vedou k vytvoření vlády je jednou z důležitých prognóz v politologii. Teorie nabízejí množinu koalic podstatně menší, než je množina všech aritmeticky přípustných koalic, kterých je 2N – 1, kde N je počet všech účastníků. Různé teorie poskytují různé předpovědi pro vytvoření koalice a jejich vypovídací schopnost může být potom porovnávána se skutečnou koalicí, což zpětně umožňuje ohodnocení teorií. Jsou dva základní druhy teorií, nepolitické teorie a politické teorie, které se liší v tom, zda účastníci vyjednávání při formování koalice přihlížejí k politickým pozicím účastníků. Podíváme se na některé teorie a rozdíly mezi nimi.
Nepolitické teorie sledují vyjednávání o formování koalice jako určitý druh antagonistického konfliktu. Matematický model antagonistického konfliktu je
Teorie her: analýza konfliktů a spolupráce
69
tzv. hra s konstantním součtem, kde pro libovolné strategie platí, že součet hodnot výplatních funkcí pro všechny hráče je roven konstantě. Všechno, co získá jeden účastník, ztratí jiný účastník a je nepravděpodobné, že by koalice obsahovala účastníky, kteří nejsou bezpodmínečně nutní pro vytvoření většinové koalice. Von Neumann a Morgenstern navrhli teorii, podle které se utvoří minimální většinová koalice. Minimální většinová koalice je taková, která se stane menšinovou v případě, že ji opustí libovolný člen. Nevýhodou této teorie je, že může existovat mnoho minimálních většinových koalic. Riker navrhl koncepci nejmenší většinové koalice, která redukuje počet predikovaných koalic. Z množiny minimálních většinových koalic jsou vybrány koalice s nejmenší celkovou vahou. Jiný způsob pro redukci počtu predikovaných koalic je koncepce vyjednávacího návrhu, kterou navrhl Leiserson. Z množiny minimálních většinových koalic jsou vybrány koalice s nejmenším počtem členů. Tato koncepce je založena na předpokladu o chování členů koalice, čím menší bude jejich počet, tím snadněji dosáhnou dohody.
Politické teorie přihlížejí k politickým pozicím účastníků účastníků vyjmování koalice. Axelrodova teorie minimální souvislé většinové koalice vychází z předpokladu, že je možné politické strany uspořádat podle ideologické dimenze od levicových po pravicové a vytvořená koalice bude ideologicky souvislá v tom smyslu, že všichni členové koalice budou navzájem sousední podle této dimenze. Souvislá většinová koalice bude minimální v tom smyslu, že jestliže ji opustí libovolný člen, koalice už nebude většinová nebo souvislá. Predikovaná koalice s nejmenším vnitřním konfliktem se bude snadněji formovat, snáze zůstane stabilní, a proto bude preferována před jinými. Minimální většinová koalice a minimální souvislá většinová koalice jsou zcela odlišné. Daná koalice může být minimální většinová, aniž by byla minimální souvislou většinovou koalicí. Koalice může být minimální souvislá většinová, aniž by byla minimální většinovou koalicí, nebo může platit oboje zároveň. De Swan navrhl koncepci uzavřené koalice s minimálním rozpětím. Je to taková minimální souvislá koalice, která má nejmenší ideologické rozpětí.
70
Teorie her: analýza konfliktů a spolupráce
Jednodimenzionální teorie vyjednávání při formaci koalice předvídá diktátorskou roli pro stranu, která kontroluje mediánového poslance. Příklad 6.6: Po volbách v roce 1992 se do České národní rady dostalo 8 politických formací, které můžeme uspořádat podle ideologické dimenze od levicových po pravicové: LB, ČSSD, LSU, HSD-SMS, KDU-ČSL, ODS-KDS, ODA, SPR-RSČ. V následující tabulce je uvedeno, kolik získaly jednotlivé politické formace křesel.
Tabulka č. 6.4 Politické formace Počet křesel LB 35 ČSSD 16 LSU 16 HSD-SMS 14 KDU-ČSL 15 ODS-KDS 76 ODA 14 SPR-RSČ 14 Celkem 200 Celkem existuje 255 možných koalic. Skutečná vládní koalice byla vytvořena ze tří stran: (ODS-KDS, ODA, KDU-ČSL). Nyní můžeme porovnat vhodnost jednotlivých teorií se skutečnou koalicí. Existuje 22 minimálních většinových koalic: 2-členná koalice: (ODS-KDS,LB), 3-členné koalice: 15 koalic - ODS-KDS + 2 členy z množiny (ČSSD, LSU, HSD-SMS, KDU, ODA, SPR-RSČ), 6-členné koalice: 6 koalic - LB + 5 členů z množiny (ČSSD, LSU, HSDSMS, KDU, ODA, SPR-RSČ). Jednou z minimálních většinových koalic je skutečná vládní koalice (ODS-KDS, ODA, KDU-ČSL). Existují tři nejmenší většinové koalice: (ODS-KDS, HDS-SMS, ODA), (ODS-KDS, HDS-SMS, SPR-RSČ), (ODS-KDS, ODA, SPR-RSČ), se 104 hlasy. Skutečná vládní koalice (ODS - KDS, ODA,KDU-ČSL) má 105 hlasů. Existuje jediný vyjednávací návrh se 2 členy: (ODS-KDS, LB). Skutečná vládní koalice (ODS - KDS, ODA,KDU-ČSL) má 3 členy.
Teorie her: analýza konfliktů a spolupráce
Politické formace LB ČSSD LSU HSD-SMS KDU-ČSL ODS-KDS ODA SPR-RSČ Celkem
71
Tabulka č. 6.5 Počet křesel Souvislé koalice 35 16 16 14 x 15 x x 76 x x x 14 x x 14 x 200
Existují 3 souvislé většinové koalice: (ODS-KDS, HDS-SMS, KDU-ČSL), (ODS-KDS, KDU-ČSL, ODA), (ODS-KDS, ODA, SPR-RSČ). Skutečná vládní koalice (ODS-KDS, ODA, KDU-ČSL) je jednou ze souvislých většinových koalic. Formace ODS-KDS kontroluje mediánového poslance a skutečná vládní koalice (KDU-ČSL, ODS - KDS, ODA) je uzavřená koalice s minimálním rozpětím.
72
Teorie her: analýza konfliktů a spolupráce
Teorie her: analýza konfliktů a spolupráce
73
7. Hry s neúplnou informací 7.1 Neúplné, nedokonalé a soukromé informace Ve hře v normálním tvaru se vychází z předpokladu, že hráči mají úplné informace. Úplností informace máme na mysli například znalost výplatní matice, která představuje souhrn informací o výplatách (užitcích, preferencích) všech hráčů. Předpokládat, že každý hráč zná svoji výplatní funkci je vcelku přirozené, avšak předpoklad, že každý hráč má informace o výplatních funkcích ostatních hráčů, může být snadno zpochybnitelný. Uveďme některé z konfliktních situací, kde existují oprávněné pochyby o úplnosti informací: • Při aukci není reálné předpokládat, že dražitel zná hodnocení dražených položek ostatními dražiteli. • Při přijímání nových zaměstnanců zaměstnavatel nezná schopnosti uchazečů o zaměstnání. Uchazeči mají zájem na tom, aby vypadali co nejschopnější. • Při vyjednávání není vždy možné předpokládat, že hráč zná dokonale užitkové funkce ostatních hráčů (kapitola 8). • Modely oligopolu (kapitola 9) počítají s tím, že každá firma zná svou nákladovou funkci i nákladové funkce konkurentů. Obvykle firmy své náklady i jakékoli další firemní informace před konkurencí tají. • V modelech oligopolu se rovněž zamysleme nad tím, zda všechny firmy mají za cíl maximalizaci zisku nebo zda některé z firem nesledují jiné cíle. Vlastně bychom měli dojít k závěru, že ve většině reálných situací pracujeme s neúplnou informací. V některých situacích je přesto možné pracovat s hypotézou, že neúplnost informace dramaticky neovlivní výsledky, neboť jakákoli hra je vždy zjednodušeným modelem skutečného světa. A tak je možné i při jisté neúplnosti informací použít her s úplnou informací, které předpokládají úplné a pro všechny hráče shodné výchozí informace o hře (výplatní matice, prostory strategií hráčů či jiná „pravidla“ hry). Pokud je neúplnost informací zásadní vlastností rozhodovací situace, je nutné přejít k modelům patřícím do kategorie her s neúplnou informací, které vycházejí z předpokladů o dostupnosti různých výchozích informací jednotlivým hráčům na počátku hry. Hry s neúplnou informací jsou v teorii také označovány jako Bayesovské hry. Dříve než se pustíme do teorie her s neúplnou informací, považujeme za přínosné se zmínit o hrách s nedokonalou informací, neboť tyto dva typy
74
Teorie her: analýza konfliktů a spolupráce
her se často pletou. Ve hrách s dokonalou nebo nedokonalou informací jde o to, zda hráči znají nebo neznají tahy ostatních hráčů. Šachy představují hru s dokonalou informací, neboť každý hráč zná předchozí tahy a tím i aktuální pozici na šachovnici. Jinými slovy, hráč ví, ve kterém uzlu se hra momentálně nachází. Šachy jsou zároveň hrou s úplnou informací, protože preference hráčů (výplatní funkce) jsou známy. To neplatí například v karetních hrách (mariáš, poker), kde obvykle neznáme karty protihráče, takže ani neznáme přesnou pozici, ve které se hra nachází. Karetní hry mariáš či poker proto patří mezi hry s nedokonalou informací. Dokonalá informace se tedy týká znalosti hráče o průběhu hry, úplná informace se týká znalostí hráče o hře před jejím začátkem. Ke karetním hrám se ještě vrátíme, protože lze na nich jasně demonstrovat význam pojmu soukromá informace, což je jakákoli informace, která není k dispozici ostatním hráčům. Karty, které má hráč v ruce, zná jen on a tato hráčova znalost představuje typickou soukromou informaci. Ve hrách s úplnou informací jsou všechny informace dostupné všem hráčům a považujeme je za všeobecně známé informace (angl. common knowledge). Hru s neúplnou informací můžeme definovat jako hru, ve které na jejím počátku mají kromě všeobecně známé informace někteří z hráčů k dispozici i soukromé informace. Pro počáteční soukromou informaci bylo ve hře s neúplnou informací zavedeno označení typ hráče. Každý hráč zná svůj typ, ale nezná typy ostatních hráčů. Význam tohoto pojmu si vysvětlíme níže v textu.
7.2 Statická Bayesovská hra Způsob, jak modelovat a pochopit konfliktní situaci s neúplnou informací, rozvinul John C. Harsanyi z Kalifornské university v Berkeley. Harsanyi, pozdější nositel Nobelovy ceny za ekonomii za rok 1994, publikoval svoji teorii v rozsáhlém článku, rozděleném na tři části v časopisu Management Science v letech 1967-1968. Jeho teorie nabízí postup, jak ve hře s neúplnou informací neúplnou informaci doplnit. Harsanyi navrhl zavést apriorní tah fiktivního hráče, nazvaného Příroda, který určuje typ každého hráče. Typ každého hráče a tudíž i jeho preference jsou výsledkem hodnoty náhodné proměnné, vybrané Přírodou. Přestože jen hráč sám může zjistit svůj skutečný typ, všichni hráči znají ex ante pravděpodobnostní rozdělení, ze kterého jsou vybrány typy ostatních hráčů. Tudíž každý hráč zná svůj typ, všechny možné typy ostatních hráčů a pravděpodobností rozdělení těchto typů. To znamená, že hra je nyní hrou s úplnou informací, neboť všichni hráči znají všechny možné výplatní
Teorie her: analýza konfliktů a spolupráce
75
hodnoty všech typů všech hráčů. Zároveň jde o hru s nedokonalou informací, protože ne všichni hráči zjistí apriorní tah fiktivního hráče, nazvaného Příroda. Standardním předpokladem je skutečnost, že všichni hráči mají stejné apriorní názory na pravděpodobnostní rozdělení tahu Přírody. Jakmile je použit tento předpoklad, dostáváme hru s úplnou, ale nedokonalou informací, na kterou může být použita koncepce Nashovy rovnováhy. Bayesovská hra je určena: 1. Množinou hráčů: {1, 2, …, N}. 2. Množinou prostorů strategií: {X1, X2, …, XN}. Zde Xi označuje prostor strategií i-tého hráče. Konkrétní strategie budeme značit (x1, x2, …, xN). 3. Množinou prostorů typů hráčů: {T1, T2, …, TN}. Typ ti∈ Ti odpovídá určité výplatní funkci, kterou může mít hráč i. Hráč i zná svůj typ, ale nezná typy dalších hráčů. 4. Množinou názorů hráčů: {p1, p2, …, pN}. Názor pi reprezentuje názor hráče i, který má o typech dalších hráčů. Názor hráče je modelově zachycen subjektivní pravděpodobnostní funkcí. 5. Množinou výplatních funkcí: {f1(x1, x2, …, xN, t1, t2, …, tN),…, fN(x1, x2, …, xN, t1, t2, …, tN)}. Výplatní funkce jsou definovány na kartézském součinu prostoru strategií a prostoru typů hráčů. V Bayesovské hře budeme považovat každý typ každého hráče za samostatného hráče a předpokládat, že Příroda, s využitím hráčům známého pravděpodobnostního rozdělení, náhodně vybere ty hráče, kteří budou hru skutečně hrát. Navíc budeme předpokládat, že každý typ každého hráče musí vybrat svoji strategii dříve, než udělá svůj tah Příroda. Tím dostáváme hru s nedokonalou informací, kterou označíme H*. Původní hra s neúplnou informací H: • N hráčů, i = 1, 2, …, N, • hráč i má mi typů, • množina prostorů strategií: {X1, X2, …, XN}, • množina výplatních funkcí: {f1(x1, x2, …, xN, t1, t2, …, tN),…, fN(x1, x2, …, xN, t1, t2, …, tN)}. Hra s nedokonalou informací H*: N
• M hráčů, j = 1, 2, …, M, kde M = ∑ mi , i =1
Teorie her: analýza konfliktů a spolupráce
76
• nově definovaná množina hráčů se skládá z prvků j = (i, ti), • množina prostorů akcí: {Y1, Y2, …, YM}, • množina výplatních funkcí: {g1(y1, y2, …, yM),…, gM(y1, y2, …, yM)}, • hodnoty výplatních funkcí jsou počítány jako očekávané hodnoty g1(y1, y2, …, yM) =
∑ p (t ) f ( x , t ) . i
i
ti
V takto formulované hře s nedokonalou informací hovoříme místo o strategiích a prostorech strategií o akcích a prostorech akcí. Akcí rozumíme volbu hráče, který už zná svůj typ. Pojem strategie využíváme na označení souboru akcí hráče, který ještě nezná svůj typ, takže musí naplánovat optimální akci pro každý možný typ.
Bayesova-Nashova rovnováha ve hře s neúplnou informací H je Nashova rovnováha ve hře s nedokonalou informací H*, která je reprezentací původní hry s neúplnou informací. Pro konečné hry s neúplnou informací platí následující věta:
V každé konečné hře s neúplnou informací existuje alespoň jedna BayesovaNashova rovnováha.
Příklad 7.1: V příkladu se vrátíme ke konfliktu manželský spor, ve kterém jde o to, že manželé se mají večer sejít a strávit společně večer ve městě. Manžel však preferuje jít na fotbalový zápas, zatímco manželka by ráda šla na nákupy do obchodního centra. Nyní jsou v práci a setkají se až večer, přičemž se rozhoduje každý samostatně (to by asi v reálném životě zcela neplatilo, ale předpokládejme to). Každý z manželů získá jednu jednotku užitku, když stráví večer spolu, případně další jednotku užitku, když zvolí program, který preferuje. Pokud stráví večer osamoceně, jejich užitky budou nulové. Tento konflikt je popsán maticí:
manželka, která chce vidět manžela kopaná nákupy manžel
kopaná 2; 1 0; 0 nákupy 0; 0 1;2
Teorie her: analýza konfliktů a spolupráce
77
Předpokládejme nyní, že manžel si není jistý, jakou má manželka dnes náladu. Manželka možná naopak preferuje dnes večer manžela nevidět, což manžel vzhledem k ranní hádce kvůli návštěvě tchyně odhaduje tak na 50 %. Manžel také preferuje manželku v takové náladě raději nevidět. V tom případě je skutečná výplatní matice ve tvaru: manželka, která nechce vidět manžela kopaná nákupy manžel
kopaná 2;0 0; 2 nákupy 0; 1 1;0
Jde o hru s neúplnou informací, protože manžel neví, zda ho manželka chce či nechce dnes večer vidět, zatímco manželka tuto soukromou informaci samozřejmě ví. Hru dvou hráčů s neúplnou informací převedeme na hru s nedokonalou informací s třemi hráči, a to s manželem, manželka typ 1 (chci vidět večer manžela) a manželka typ 2 (nechci vidět večer manžela). Pravděpodobnostní rozdělení typů (0,5; 0,5) před tahem Přírody znají oba, ale jen manželka se dozví na počátku hry výsledek loterie, která určí její typ. Protože manžel nezná dnešní typ manželky, musí odhadnout optimální akce obou typů manželky. Strategie (k, n) bude označovat situaci, když manželka typ 1 zvolí kopanou a manželka typ 2 zvolí nákupy. Strategie (n, n) znamená, že typ 1 i typ 2 zvolí nákupy. Vytvoříme výplatní matici tří hráčů, v níž prvá hodnota označuje výplatu manžela, druhá hodnota výplatu manželky typ 1 a třetí hodnota výplatu manželky typ 2. Výplatu manžela například při akci nákupy proti dvojici akcí manželky (k, n) vypočteme: 0,50 x 0 + 0,50 x 1 = 0,5. Výplata manželky typ 1 je určena kombinací akcí (nákupy, kopaná) z první matice, což je hodnota 0. Výplata manželky typ 2 je určena kombinací akcí (nákupy, nákupy) z druhé matice, což je opět hodnota 0. Obdobně určíme ostatní prvky výplatní matice, která bude mít následující tvar: manželka typ 1 a 2 (k, k) (k, n) (n, k) (n, n) manžel
kopaná 2;1;0 1;1;2 1;0;0 0;0;2 nákupy 0;0;1 0,5;0;0 0,5;2;1 1;2;0
V dalším kroku zjistíme rovnovážné akce všech hráčů. Manžel hledá sloupcová maxima z prvních hodnot, manželka typ 1 hledá řádková maxima z druhých hodnot a manželka typ 2 hledá řádková maxima z třetích hodnot.
Teorie her: analýza konfliktů a spolupráce
78
Maxima označíme závorkami. Pokud najdeme trojici hodnot v závorkách, našli jsme Bayesovu-Nashovu rovnováhu v ryzích strategiích (akcích). Pro danou hru dostáváme matici s těmito sloupcovými a řádkovými maximálními hodnotami:
(k, k) manžel
manželka typ 1 a 2 (k, n) (n, k)
(n, n)
kopaná (2); [1];0 (1); [1]; [2] (1);0;0 0;0; [2] nákupy 0;0; [1] 0,5;0;0 0,5; [2]; [1] (1); [2];0
Hra manželský spor s neúplnou informací má rovnováhu v ryzích strategiích {kopaná, (kopaná, nákupy)}. Manžel tedy půjde na kopanou a vyčká, zdali přijde také dobře naladěná manželka. Manželka se špatnou náladou vyrazí nakupovat. Hry s neúplnou informací obohacují nástrojové vybavení pro analýzu řady konfliktních situací. Příkladem jsou tzv. signální hry, které jsou aplikovány na ekonomické problémy. Hry s neúplnou informací lze formulovat nejen v normálním tvaru (statická Bayesovská hra), ale také v rozvinutém tvaru (dynamická Bayesovská hra). Pro hry s úplnou informací jsme v předchozích kapitolách uvedli pro normální tvar koncepci Nashovy rovnováhy, pro rozvinutý tvar koncepci dokonalé rovnováhy podhry. V této kapitole je uvedena Bayesova-Nashova rovnováha, která je rozšířením Nashovy rovnováhy. Koncepce použitelná pro hry v rozvinutém tvaru s neúplnou informací je dokonalá Bayesova rovnováha, která je kombinací přístupů Bayesovy-Nashovy rovnováhy a dokonalé rovnováhy podhry. Porovnání koncepcí je v tabulce č. 7.1:
Tabulka č. 7.1 Typ hry
Normální tvar
Rozvinutý tvar
Úplná informace
Nashova rovnováha
Dokonalá rovnováha podhry
Neúplná informace
Bayesova-Nashova rovnováha
Dokonalá Bayesova rovnováha
Teorie her: analýza konfliktů a spolupráce
79
8. Vyjednávání 8.1 Nashovo vyjednávací řešení Teorie her není jen věda o konfliktech, ale také o nalézání vzájemně výhodné spolupráce. Teorie vyjednávání, zvláštní část teorie her, se zabývá tzv. vyjednávací hrou (vyjednávacím problémem), ve které se hráči usilují dohodnout o vzájemně výhodné spolupráci či směně. Příklady vyjednávání mohou zahrnovat jednání firem o podmínkách obchodu, jednání zaměstnavatele a odborů o růstu mezd, politická jednání dvou států atd. Důležitým mezníkem pro rozvoj teorie vyjednávání byly články Johna Nashe z padesátých let 20. století (Nash, 1950, 1953), ve kterých Nash navrhl axiomatický přístup k řešení vyjednávacího problému. Nejprve Nash sestavil soubor požadavků (axiomů), které by řešení vyjednávacího problému mělo splňovat, a poté ukázal, že v každém vyjednávacím problému existuje pouze jediné řešení, které tyto požadavky splňuje. Takto určené řešení je dnes známo jako Nashovo vyjednávací řešení. Ve vyjednávacím problému předpokládáme, že existuje množina přípustných dohod, které mohou být hráči uzavřeny, a bod nedohody, který nastane v případě, že hráči se nedohodnou na žádné spolupráci. Hráči při vyjednávání usilují o nalezení lepšího řešení (dohody) než to, které nastává v bodě nedohody. Bod nedohody je před počátkem vyjednávací hry znám, případně může být stanoven na základě maximinové či rovnovážné zaručené výhry. Vyjednávací problém je charakterizován: 1. množinou hráčů {1, 2, …, N}, přičemž pokud není uvedeno jinak, uvažujeme pouze dva hráče {1, 2}; 2. množinou přípustných dohod (řešení); 3. bodem nedohody; 4. množinou užitkových funkcí, které bodu nedohody a každé přípustné dohodě přiřadí užitek pro i-tého hráče. Předpokládáme, že hráči jsou racionální, maximalizují svůj užitek a dokonale znají navzájem své užitkové funkce. Uvažujme vyjednávací problém se dvěma hráči. Označme užitkovou funkci prvého hráče u(x) a užitkovou funkci druhého hráče v(y). Užitková funkce přiřazuje každé přípustné dohodě (i bodu nedohody) reálné číslo určující hodnotu užitku daného výsledku pro hráče. V případě Nashova vyjednávacího
80
Teorie her: analýza konfliktů a spolupráce
řešení označme užitek prvního hráče u(x*) a užitek druhého hráče v(y*). Užitky v bodě nedohody, tj. v případě, že nedojde ke spolupráci, označme u(x0) a v(y0). Nash využil axiomatickou teorii užitečnosti von Neumanna a Morgensterna a dále formuloval následující požadavky pro vyjednávací řešení: 1. Paretovská efektivnost. Nechť [u(x1), v(y1)] a [u(x2), v(y2)] jsou možné přípustné dohody vyjednávacího problému P. Jestliže u(x1)>u(x2) a v(y1)>v(y2), pak řešení [u(x2), v(y2)] nemůže být vyjednávacím řešením P. Tento požadavek vyjadřuje maximalizaci užitku oběma hráči. 2. Symetrie. Když [u(x), v(y)] a [v(y), u(x)] patří do vyjednávacího problému P a pro bod nedohody platí u(x0)=v(y0), pak je problém P symetrický. Jestliže je vyjednávací problém symetrický, pak u(x*)=v(y*). To lze interpretovat také tak, že oba hráči mají rovné vyjednávací schopnosti. 3. Nezávislost na měřítku. Nechť [u(x*), v(y*)] je vyjednávací řešení vyjednávacího problému P. Transformujeme-li vyjednávací problém P na problém Q pomocí nových užitkových funkcí u(x)=au(x)+b a v(y)=cv(y)+d, pak vyjednávacím řešením problému Q bude [au(x*)+b, cv(y*)+d]. 4. Nezávislost na irelevantních alternativách. Přepokládejme, že máme dva vyjednávací problémy P a Q, kde vyjednávací problém Q je podmnožinou P. Jestliže [u(x*), v(y*)] je vyjednávacím řešením problému P a zároveň leží v Q, pak je též vyjednávacím řešením problému Q. Význam jednotlivých axiómů si ukážeme na příkladě. Předpokládejme, že dva hráči si mohou mezi sebou rozdělit jakýmkoliv způsobem částku 2 Kč. Pokud však nedojde k dohodě o rozdělení dané částky, pak oba hráči obdrží pouze 0 Kč. Pro zjednodušení předpokládejme, že užitek pro oba hráče je roven získané peněžní částce, tudíž užitkové funkce mají tvar u(x)=x a v(y)=y. Popsaný vyjednávací problém P si graficky znázorníme na obrázku č. 8.1. Vyjednávací problém (množina přípustných dohod) představuje pravoúhlý trojúhelník s vrcholy (0; 0), (0; 2) a (2; 0). Bod nedohody má souřadnice (0; 0). Silná čára spojující body o souřadných (0; 2) a (2; 0) představuje paretovsky efektivní řešení (axiom 1). Problém P je symetrický, takže vyjednávací řešení musí ležet na přerušované čáře, která dělí trojúhelník na dvě stejné poloviny (axiom 2). Oba uvedené požadavky splňuje pouze bod A o souřadnicích (1; 1), který je průnikem obou čar. Axiom 3 říká, že řešení problému nezávisí na souřadnicích, vhodnými transformacemi je vždy možné dostat bod A se souřadnicemi (1; 1). Pokud by byla užitková funkce druhého hráče ve tvaru v(x)=2x, můžeme jeho užitkovou funkci upravit na
Teorie her: analýza konfliktů a spolupráce
81
w(x)=0,5v(x). Šedá barva označuje vyjednávací problém Q, který je podmnožinou vyjednávacího problému P. Z axiomu 4 vyplývá, že pokud je bod A vyjednávacím řešením problému P, je tento bod též vyjednávacím řešením problému Q.
Obrázek č. 8.1: Grafické znázornění Nashova vyjednávacího řešení
paretovsky efektivní řešení problému P
symetrie
A hyperbola u(x)v(y)=1
bod nedohody
Q
P
V konkrétním vyjednávacím problému najdeme Nashovo vyjednávací řešení (bod A) tak, že najdeme řešení s nejvyšší hodnotou tzv. Nashova součinu. Nashův součin vypočteme podle vzorce [u(x*) - u(x0)][v(y*) - v(y0)]. V bodě A z obrázku 8.1 nabývá Nashův součin hodnoty [1-0][1-0]=1. Lze snadno ověřit, že žádné jiné řešení, pro které zároveň platí u(x)+v(y)=2, nemůže dosáhnout hodnoty jedna (viz hyperbola na obrázku).
8.2 Příklady vyjednávacích her Příklad č. 8.1: Bill a Jack směňují věci Následující ilustrativní příklad vyjednávacího problému pochází z Nashova originálního článku (Nash, 1950). Bill a Jack jsou dva kamarádi, kteří mají
Teorie her: analýza konfliktů a spolupráce
82
různé věci, které mohou mezi sebou vyměňovat (viz tabulka níže). Každá věc má pro každého chlapce určitý užitek a v několika případech nastává možnost získat pro sebe užitečnější věc výměnou za méně užitečnou. Například pro Billa představuje velký užitek psací pero, za které by mohl Jackovi nabídnout například knížku. Existující rozdělení věcí znamená pro Billa užitek 12 a pro Jacka užitek 6. Jakého nejvýhodnějšího řešení mohou chlapci výměnou věcí dosáhnout?
Billovy věci knížka káča míč pálka krabička
Užitek pro Billa 2 2 2 2 4
Užitek pro Jacka 4 2 1 2 1
Jackovy věci psací pero hračka nůž čapka
10 4 6 2
1 1 2 2
Nashův součin nabývá svého maxima pro směnu, ve které Bill dá Jackovi knížku, káču, míč a pálku výměnou za psací pero, hračku a nůž. Užitky Billa a Jacka budou 24 a 11 a Nashův součin bude mít hodnotu (24-12)(11-6) = 60. Můžete si ověřit, že se Vám nepodaří najít jinou směnu, jež by dosahovala vyšší hodnotu Nashova součinu. Teorie vyjednávání není omezena pouze na směnu objektů, kterou jsme popsali výše. Umožňuje nám analyzovat vyjednávání i v dalších situacích, ve kterých o směnu fyzických objektů nejde. Jedním z příkladů je vyjednávání o společné investici. Příklad č. 8.2: Aleš a Bert vyjednávají o společné investici Dva přátelé, Aleš a Bert, přemýšlejí o možné riskantní investici (viz Fiala, Lagová, Lauber, Málek, 1994). Investice je nejprve nabídnuta Alešovi. Aleš má investovat 60 a vydělat v případě úspěchu 160 (tudíž zisk je 100) nebo nic v případě neúspěchu, přičemž obě alternativy nastávají se stejnou pravděpodobností. Alešova užitková funkce je: u(x) =
x 4x + 60
pro x > -20, jinak,
Teorie her: analýza konfliktů a spolupráce
83
kde x je výnos z investice. Tuto hypotetickou užitkovou funkci můžeme interpretovat tak, že ztráta větší než -20 má pro Aleše velmi negativní dopady. Očekávaný užitek z investice pro Aleše bude: u(x) = 0.50*u(100) + 0.50*u(-60) = 0,50*100 + 0,50*(-180) = -40. Aleš z tohoto důvodu danou investiční příležitost odmítne jako pro něj nevýhodou, neboť při odmítnutí investice dosáhne užitek u(0)=0. V dalším kroku je investice nabídnuta Bertovi. Bertova užitková funkce má tvar: v(y) = y pro x > -30, 3y + 60 jinak, kde y je výnos z investice. To znamená, že potenciální ztráta má pro Berta menší negativní užitek než pro Aleše. Očekávaný užitek z investice pro Berta je: v(y) = 0.50*v(100) + 0.50*v(-60) = 0.50*100 + 0.50*(-120) = -10. Užitek je záporný, takže také Bert odmítne nabízenou investici. Bert však navrhne Alešovi investovat společně v poměru 60:40. Bert zaplatí 60 % počátečních nákladů, což je 36, a Alešovi nabídne podílet se ve výši 40 %, což je 24. Výnosy budou rozděleny ve stejném poměru (60:40), což přináší očekávaný užitek 2 pro Aleše a užitek 6 pro Berta: u(x) = 0.50*u(40) + 0.50*u(-24) = 0,50*40 + 0,50*(-36) = 2, v(y) = 0.50*v(60) + 0.50*v(-36) = 0.50*60 + 0.50*(-48) = 6. Má Aleš přijmout tuto nabídku? Odpověď na tuto otázku podle Nashe získáme tak, že najdeme nejvyšší hodnotu Nashova součinu [u(x)-u(0)][v(y)v(0)]. Pro náš příklad nabývá Nashův součin maxima, tj. hodnotu 25, pro řešení, ve kterém Aleš vloží 20 a z případné výhry obdrží 50 (čistý zisk 30), a Bert vloží 40 a obdrží 110 (čistý zisk 70). Hodnoty užitků jsou 5 pro Aleše a 5 pro Berta:
u(x) = 0.50*u(30) + 0.50*u(-20) = 0,50*30 + 0,50*(-20) = 5, v(y) = 0.50*v(70) + 0.50*v(-40) = 0.50*70 + 0.50*(-60) = 5. Všimněte si, že Aleš zaplatil jednu třetinu nákladů (20), ale z příjmů dostane méně než třetinu (50), což neodpovídá obvykle očekávanému dělení příjmů podle podílu nákladů. Je to tím, že Bert nevnímá ztráty tak citlivě jako Aleš,
84
Teorie her: analýza konfliktů a spolupráce
do společné investice dává vyšší vklad, takže jeho vyjednávací pozice je výhodnější. A nakonec ještě odpověď na otázku, zda má Aleš přijmout původní Bertovu nabídku investovat v poměru 60:40. Teď už víme, že daná nabídka nebyla pro Aleše nejvýhodnější nabídkou. Správným vyjednáváním Aleš dosáhne více.
Teorie her: analýza konfliktů a spolupráce
85
9. Modely nedokonalých trhů 9.1 Nedokonalé trhy Ekonomové při snaze modelově zachytit ekonomické chování jedinců a firem vycházejí z představy tzv. dokonalého trhu. Předpoklady dokonalého trhu podle ekonomické teorie jsou dokonalá informovanost kupujících i prodávajících, nulové náklady na změnu dodavatele, homogenní produkt a velký počet prodávajících, kteří nemohou ovlivňovat cenu, volný vstup do odvětví, neexistence státních regulací. Tyto předpoklady však v reálném ekonomickém světě v podstatě není možné splnit, pouze se k nim přiblížit. Proto v teorii vznikly i modely nedokonalého trhu (např. Holman, 2002), především takové, které se zabývají dopadem porušení předpokladu o velkém počtu prodávajících. V ekonomické praxi běžnými typy nedokonalých trhů jsou monopolistická konkurence a oligopol. Pro monopolistickou konkurenci je typická snaha diferencovat produkt, čímž je porušena podmínka homogenního produktu. Oligopol je trh, na kterém působí jen několik málo rozhodujících firem. Pro společnost jsou nedokonalé trhy ztrátou, protože výrobci, kteří působí na nedokonalých trzích prodávají za vyšší cenu než mezní náklady a nevyrábí v minimu svých průměrných nákladů. Problematikou tržního chování na nedokonalých trzích se zabýval již francouzský matematik Augustin A. Cournot (1838) ve svém modelu duopolu (tj. oligopolu se dvěma výrobci). Extrémním případem nedokonalého trhu je monopol, který představuje situaci s jediným výrobcem a velkým množstvím spotřebitelů. Oligopol je tržní struktura, ve které si výrobci uvědomují vzájemnou provázanost svých strategií. Chování jedné z firem má přímý vliv na ostatní firmy a naopak, takže vlastně jde o jeden z příkladů konfliktních rozhodovacích situací, patřících do teorie her. Ekonomická teorie nabízí řadu modelů oligopolu, z nichž v některých se předpokládá nezávislé konkurenční chování, při kterém se bere v úvahu reakce ostatních, zatímco v jiných modelech se předpokládá kooperativní čili koluzivní jednání oligopolistů. Modely oligopolu je tedy možno rozdělit do dvou skupin, na nekooperativní modely a na kooperativní modely. Cournotův a Stackelbergův model oligopolu patří mezi modely nekooperativního chování. Každá firma se snaží dosáhnout maximálního zisku vzhledem k tomu, co ji ostatní firmy umožní. Modely se sice liší předpoklady, ale vesměs používají koncepce Nashovy rovnováhy z teorie
86
Teorie her: analýza konfliktů a spolupráce
nekooperativních her. Kooperativní chování vede k utváření kartelu, ve kterém firmy uzavírají dohody o koordinaci akcí k dosažení maximálního celkového zisku kartelu. Pro objemy výroby firem jsou stanoveny kvóty, které by firmy měly respektovat pro dosažení maximálního zisku, který je potom rozdělen mezi firmy na základě dohody. Tento přístup odpovídá koncepci kooperativních her. Pro jednoduchost budeme dále uvažovat pouze případ duopolu, což je speciální případ oligopolu, ve kterém se vyskytují pouze dva výrobci. Výsledky získané v modelu duopolu lze zobecnit pro oligopolní trh s více výrobci. V dalších oddílech si ukážeme Cournotův model, Stackelbergův model a kartel (oddíly 9.2 až 9.4). Srovnáním modelů oligopolů se budeme zabývat v oddíle 9.5, monopol popíšeme v oddíle 9.6.
9.2 Modely oligopolu Cournotův model oligopolu vychází z předpokladů konkurence firem, přičemž jedinou strategickou proměnnou je objem produkce. Označme objemy produkce výrobců: q1 - objem výroby prvního výrobce, q2 - objem výroby druhého výrobce. Dále předpokládáme, že třžní cena výrobku je funkcí celkového objemu produkce odvětví: p = g(q1 + q2). Cenová funkce (inverzní poptávková funkce) je klesající, s růstem nabídky cena klesá. Příjmová funkce i-té firmy je součinem funkce ceny a úrovní produkce dané firmy: Ri(q1, q2) = pqi = g(q1, q2) qi. Mezní příjem udává, jak se změní příjem při jednotkové změně produkce a podle pravidla o derivaci součinu funkcí je roven:
∂ Ri ( q1 ,q 2 ) ∂ g ( q1 ,q 2 ) ∂p = g ( q1 ,q 2 ) + q i = p + qi . ∂q i ∂q i ∂qi
Teorie her: analýza konfliktů a spolupráce
87
Vzhledem k tomu, že p = g(q1, q2) je klesající funkce, dostáváme
∂p <0 ∂qi
a tudíž p + q i
∂p < p. ∂qi
Z toho plyne, že u duopolu je mezní příjem firmy menší než cena výrobku. Nákladová funkce i-té firmy je rostoucí v závislosti na objemu produkce: Ci (qi). Mezní náklady udávají, jak se změní celkové náklady firmy v důsledku zvýšení výroby o jednotku: dC i (qi ) . dqi
Vzhledem k tomu, že nákladová funkce je rostoucí, jsou mezní náklady kladné. Zisková funkce i-té firmy závisí nejen na chování dané firmy, ale i na chování druhé firmy: zi(q1, q2) = pqi - Ci(qi) = g(q1+ q2)qi - Ci(qi) = Ri(q1, q2) - Ci(qi). Obě firmy se snaží maximalizovat svůj zisk vzhledem k očekávané strategii konkurenta. Předpokládejme, že druhá firma zvolí svoji strategii stanovením objemu výroby q2°, potom první firma maximalizuje svůj zisk, který bude záviset na jejím objemu výroby q1 a objemu výroby druhé firmy q2°: z1(q1, q2°) = R1(q1, q2°) - C1(q1). Pro dosažení maxima zisku první firmy musí platit podmínka 1. řádu pro existenci extrému, tj. prvá derivace ziskové funkce má být rovna nule:
∂ z1 ( q1 ,q 2 o ) ∂ R1 ( q1 ,q 2 o ) dC 1 ( q1 ) = − = 0. ∂ q1 ∂ q1 dq 1 Jestliže první firma zvolí svoji strategii stanovením objemu výroby q1°, potom druhá firma maximalizuje svůj zisk, který bude záviset na jejím objemu výroby q2 a objemu výroby první firmy q1°: z2(q1°, q2) = R2(q1°, q2) - C2(q2).
88
Teorie her: analýza konfliktů a spolupráce
Pro dosažení maxima zisku druhé firmy musí platit podmínka 1. řádu
∂z 2 (q1o ,q 2 ) ∂R2 (q1o ,q 2 ) dC 2 (q 2 ) = − = 0. ∂q2 ∂q 2 dq 2 Firmy tedy vycházejí z předpokladu znalosti strategie konkurenta. Rovnovážný stav je určen takovou dvojicí strategií q1 a q2, které splňují podmínky maximalizace zisku obou firem:
∂z1 ( q1 ,q 2 ) ∂R1 ( q1 ,q 2 ) dC1 ( q1 ) = − =0 ∂q1 ∂q1 dq1 ∂ z 2 ( q1 ,q 2 ) ∂ R 2(q1 ,q 2 ) dC 2 ( q 2 ) = − =0 ∂q 2 ∂q 2 dq 2 V rovnovážném stavu je mezní příjem roven mezním nákladům u obou firem. Z těchto rovnic je možno odvodit funkce reakce chování duopolistů, která popisuje velikost produkce jednoho výrobce v závislosti na velikosti produkce druhého výrobce: q1 = ϕ1(q2),
q2 = ϕ2(q1).
Příklad 9.1: Mějme odvětví, ve kterém existují dvě firmy. Předpokládejme, že se cena výrobku řídí celkovým objemem produkce v odvětví: p = g(q1 + q2) = 100 - (q1 + q2). Nákladové funkce firem jsou: C1(q1) = 150 + 12q1, C2(q2) = q22. Dosazením do ziskových funkcí dostáváme: z1(q1, q2) = 88q1 – q12 – q1q2 – 150, z2(q1, q2) = 100q2 – 2q22 – q1q2. Z podmínek prvního řádu
∂ z1 = 88 − 2 q1 − q 2 = 0 , ∂ q1
Teorie her: analýza konfliktů a spolupráce
89
∂z 2 = 100 − q1 − 4 q 2 = 0 , ∂q 2
dostáváme z jednotlivých rovnic funkce reakce duopolistů q1 = ϕ1(q2) = 44 – 0,5q2, q2 = ϕ2(q1) = 25 – 0,25q1,
Řešením soustavy dvou rovnic o dvou neznámých dostaneme úrovně produkce duopolistů: q1° = 36,
q2° = 16.
Dosazením do ziskových funkcí dostaneme hodnoty zisků: z1° = 1146,
z2° = 512.
Dosazením celkové produkce odvětví do cenové funkce získáme i rovnovážnou cenu: q° = q1° + q2° = 52,
p° = 100 – 52 =48.
Stackelbergův model oligopolu vychází z předpokladů konkurence úrovní produkce (jediná strategická proměnná) a je rozšířením Cournotova modelu. Sofistikovaný duopolista tzv. vůdce bude jednat jako monopolista a bude brát v úvahu predikovaná rozhodnutí svého konkurenta, tzv. následníka. Předpokládejme, že vůdcem je první firma, která stanoví svůj objem výroby q1. Tato firma potom předpokládá, že druhá firma je následníkem. První firma určí svůj objem výroby podle funkce reakce druhé firmy na své rozhodnutí: q2 = ϕ2(q1). První firma maximalizuje svůj zisk: z1 = (q1, q2) = z1(q1, ϕ2(q1) ), což je funkce jediné proměnné q1. Z podmínky prvního řádu pro maximum ziskové funkce dz 1 = 0, dq 1
90
Teorie her: analýza konfliktů a spolupráce
dostaneme řešením velikost objemu produkce vůdce. Z funkce reakce dostaneme velikost objemu produkce následníka. A dosazením celkového objemu produkce do cenové funkce získáme i rovnovážnou cenu. Analyzujme vztah vůdcovství a následnictví z hlediska obou firem. Existují celkem čtyři možnosti : 1) První firma chce být vůdcem, druhá následníkem. 2) První firma chce být následníkem, druhá vůdcem. 3) Obě firmy chtějí být následníky. 4) Obě firmy chtějí být vůdci. První dva případy vedou k rovnovážnému Stackelbergovu řešení. Třetí případ vede ke Cournotovu řešení (Cournotův model je tedy zvláštním případem Stackelbergova modelu). Čtvrtý případ vede ke Stackelbergově nerovnováze, protože vychází z neuskutečnitelných předpokladů: obě firmy nemohou být vůdci na trhu. Příklad 9.2: Vycházíme ze stejného zadaní jako v předchozím příkladě. předpokládejme, že první firma je vůdcem. Zisk funkce vůdce je:
Dále
z1(q1, q2) = 88q1 – q12 – q1q2 –150. Z předchozího příkladu víme, že funkce reakce následníka je q2 = ϕ2(q1) = 25 – 0,25q1. Jestliže dosadíme funkci reakce následníka do ziskové funkce vůdce, dostáváme: z1(q1,ϕ2(q1)) = 88q1 – q12 – q1(25 – 0,25q1) – 150 = 63q1 – 0,75q12 – 150. Z podmínky prvního řádu dz 1 = 63 − 1 ,5 q 1 = 0 , dq 1
dostáváme objem produkce vůdce q1° = 42
Teorie her: analýza konfliktů a spolupráce
91
a po dosazení do ziskové funkce i hodnotu zisku z1° = 1173. Z funkce reakce vypočteme objem produkce následníka a po dosazení do jeho ziskové funkce i hodnotu zisku: q2° = 25 – 0,25q1° = 14,5, z2° = 420,5. Příklad 9.3: Nyní pro změnu předpokládejme, že druhá firma je vůdcem a první firma je následníkem. Zisk druhé firmy je roven: z2(q1, q2) = 100q2 – 2q22 – q1q2. Funkci reakce první firmy (následníka) q1 = ϕ1(q2) = 44 – 0,5q2 dosadíme do ziskové funkce druhé firmy (vůdce): z2(ϕ1(q2), q2) = 100q2 – 2q22 – (44 – 0,5q2)q2 = 56q2 – 1,5q22. Z podmínky prvého řádu pro existenci extrému dz 2 = 56 − 3 q 2 = 0 , dq 2
dostáváme rovnovážný objem produkce pro firmu-vůdce q2° = 18,67, a po dosazení do ziskové funkce i hodnotu zisku z2° = 522,67. Z funkce reakce vypočteme rovnovážný objem produkce firmy-následníka a po dosazení do ziskové funkce i hodnotu zisku: q1° = 44 – 0,5q2° = 34,67, p = 46,67, z1° = 1058,78.
92
Teorie her: analýza konfliktů a spolupráce
Porovnáním výsledků zjistíme z příkladů 9.2 a 9.3, že pro obě firmy je výhodné chovat se jako vůdce než jako následník. Pokud však obě firmy prosazují strategii vůdce, dostáváme Stackelbergovu nerovnováhu, která vede k následující produkci a odpovídající ceně: q° = q1° + q2° = 42 + 18,67 = 60,67, p° = 100 – 60,67 = 39,33.
Kooperativní model oligopolu předpokládá možnost uzavření dohody mezi firmami. Kartel je formálně uzavřená dohoda mezi oligopolisty o spolupráci při formování nabídky (jde o kooperativní hru). Připomeňme, že spolupráce vzniká jen tehdy, je-li to pro výrobce výhodné, tj. oba výrobci získají více, než kdyby se chovali konkurenčně. Kartelem vlastně vzniká monopol, od kterého si výrobci slibují vyšší celkový zisk, jež si poté rozdělí mezi sebou. Předpokládejme, že firmy se dohodly na výrobních kvótách a ceně. Výrobní kvóty (objemy produkce) označíme: q1 - výrobní kvóta prvního výrobce, q2 - výrobní kvóta druhého výrobce. Cena výrobku je funkcí celkového objemu produkce: p = f(q1 + q2), Tato funkce je klesající, s růstem nabídky cena výrobku klesá. Nákladová funkce i-té firmy je rostoucí v závislosti na objemu produkce Ci (qi). Celkový zisk kartelu je roven z(q1, q2) = p(q1 + q2) – C1(q1) – C2(q2), což je funkcí objemů produkce duopolistů. Z podmínek 1. řádu pro maximalizaci celkového zisku
∂ z = 0 , ∂z = 0 , ∂q1 ∂q 2 dostaneme výrobní kvóty duopolistů, které zajišťují maximální celkový zisk z. Tento celkový zisk je potřeba rozdělit mezi duopolisty. K dohodě o společném postupu musí být připojena i dohoda o rozdělení celkového zisku kartelu. Rozdělení zisku kartelu musí být takové, aby žádná firma nedopadla
Teorie her: analýza konfliktů a spolupráce
93
hůře než při samostatném postupu v rámci Cournotova modelu. Označme jako: zi zisk i-té firmy při samostatném postupu bez kooperace, yi přerozdělený zisk i-té firmy při kooperativním postupu. Celkový zisk z se přerozdělí mezi duopolisty a každý duopolista by měl dostat alespoň to, co je schopen si zajistit bez kooperace, čili musí být splněny podmínky: z = y1 + y2, y1 ≥ z1, y2 ≥ z2. Množina možných rozdělení zisků odpovídá jádru hry. Jedno z možných rozdělení je ponechat každému oligopolistovi to, co získá sám plus polovinu toho, co si zajistí navíc kooperací, tedy: y1 = z1+ 0,5(z - z1 - z2), y2 = z2+ 0,5(z - z1 - z2). Kooperativní chování firem je ze společenského hlediska méně příznivé. Kartel vede k řešení s nižší nabídkou a vyšší cenou ve srovnání s Cournotovým modelem. Z toho vyplývá negativní postoj společnosti ke kartelovým dohodám a postihování takových dohod různými regulačními úřady. Příklad 9.4: Vezměme opět stejné zadání jako v příkladech předcházejících. Po dosazení dostáváme funkci celkového zisku: z(q1, q2) = 100(q1+q2) – (q1+q2)(q1+q2) – (150+12q1) – q22 = 88q1 + 100q2 – q12 – 2q22 – 2q1q2– 150. Z podmínek pro maximalizaci
∂ z = 88 − 2 q − 2 q = 0 1 2 ∂ q1 ∂ z = 100 − 4 q − 2 q = 0 2 1 ∂q 2 dostáváme výrobní kvóty duopolistů
94
Teorie her: analýza konfliktů a spolupráce q1° = 38, q2° = 6.
Po dosazení do ziskové funkce a po dosazení celkového objemu produkce do cenové funkce dostáváme z° = 1822, q° = q1° + q2° = 44, p° = 100 – 44 = 56. V porovnání s Cournotovým nekooperativním modelem dodají firmy na trh méně produkce za vyšší cenu a budou mít dohromady větší zisk. Firmy v případě nekooperativního řešení (Cournotův model) jsou schopny si zajistit zisky: z1 = 1146, z2 = 512. Pro přerozdělení zisků musí platit tyto podmínky: y1 + y2 = 1822, y1 ≥ 1146, y2 ≥ 512. Jedno z možných rozdělení zisků spočívá v rozdělení zisku kartelu tak, že každý dostane zisk z nekooperativního řešení a polovinu z toho, co vydělaly firmy spoluprací navíc. Potom: y1 = 1146 + 0,5(1822 - 1658) = 1228, y2 = 512 + 0,5(1822 - 1658) = 594. Z hlediska ekonomické teorie je zajímavé srovnat objem celkové produkce odvětví a tržní cenu při uplatnění různých modelů oligopolu mezi sebou navzájem a s dokonalým trhem. Nejprve musíme získat řešení pro dokonalý trh, které zatím nemáme. Abychom získali řešení v případě dokonalého trhu, budeme předpokládat, že se oba duopolisté chovají jako dokonale konkurenční firmy. Příjem a mezní příjem i-té firmy jsou rovny: Ri(qi) = pqi dR i = p = g ( q1 + q 2 ) . dq i
Teorie her: analýza konfliktů a spolupráce
95
Mezní náklady i-té firmy jsou rovny: dC i ( qi ) . dqi
Podmínky rovnováhy v případě dokonalé konkurence požadují, aby mezní náklad byl roven meznímu příjmu, který je roven ceně. Z toho vyplývá rovnost: dC i ( q i ) = g ( q1 + q 2 ) . dq i
Příklad 9.5: Použijeme opět stejné zadání jako v předchozích příkladech. Budeme předpokládat, že se firmy chovají jako dokonale konkurenční firmy. Z podmínek rovnováhy 12 = 100 – (q1 + q2), 2q2 = 100 – (q1 + q2), dostáváme řešení q1° = 82, q2° = 6, q° = 88. Z cenové funkce dostáváme rovnovážnou cenu: p° = 12. Porovnáním výsledků ze všech modelů z příkladů 9.1 až 9.5 zjistíme, že se dokonale konkurenční firmy chovají ze společenského hlediska příznivěji než všechny typy oligopolu (viz tabulka č. 9.1). Všechny typy oligopolu nabízejí spotřebitelům oproti dokonalému trhu menší množství zboží za vyšší cenu.
Teorie her: analýza konfliktů a spolupráce
96
Tabulka č. 9.1: Úroveň produkce a cena pro různé modely Model
Produkce
Cena
52
48
Stackelbergův model (1. výrobce vůdcem)
56,5
43,5
Stackelbergův model (2. výrobce vůdcem)
53,3
46,7
Stackelbergův model (oba vůdci)
60,7
39,3
Kartel (kooperativní řešení)
44
56
Dokonalý trh
88
12
Cournotův nekooperativní model
9.3 Modely monopolu Monopol představuje situaci na trhu, kde existuje jediný výrobce a velké množství spotřebitelů. Monopolní firma ovlivňuje cenu velikostí nabídky, přičemž s růstem nabídky cena klesá. V porovnání s konkurenční firmou monopolní firma omezuje výrobu a dosahuje při tom vyšší ceny a zisky. V porovnání s oligopolem se monopolní firma nemusí ohlížet na reakci ostatních firem, protože žádné takové firmy nejsou. Předpokládejme, že poptávka je klesající funkcí v závislosti na ceně produktu: q = f(p), takže z vlastností poptávkové funkce plyne, že její první derivace je záporná dq < 0 , tj. s růstem ceny klesá poptávka. dp K poptávkové funkci existuje funkce inverzní, která vyjadřuje závislost ceny na velikosti nabídky p = g(q), přičemž z vlastností inverzní poptávkové funkce plyne
dp < 0 , tj. s růstem dq
nabídky klesá cena. Příjmová funkce firmy je obecně definována jako součin ceny výrobku a objemu produkce firmy: R(q) = pq.
Teorie her: analýza konfliktů a spolupráce
97
Mezní příjem udává velikost změny příjmu v důsledku jednotkové změny objemu produkce a jeho hodnotu dostaneme jako derivaci příjmové funkce podle objemu produkce: MR = dR . dq
Pro monopolní firmu cena výrobku závisí na velikosti produkce, takže její příjem je pak dán součinem: R(q) = pq = g(q) q. Nákladová funkce monopolu je rostoucí v závislosti na objemu produkce C(q). Mezní náklady udávají, jak se změní celkové náklady firmy v důsledku zvýšení výroby o jednotku: MC = dC . dq
Zisková funkce monopolu je tedy funkcí jedné proměnné, neboť dosažený zisk závisí pouze na objemu produkce q: z(q) = R(q) – C(q) = pq – C(q) = g(q) q – C(q). Cílem monopolu je maximalizace zisku, což znamená najít volný extrém ziskové funkce. Pro ziskovou funkci musí být splněna podmínka 1.řádu dz(q) dR(q) dC(q) = − = 0, dq dq dq
což znamená že v bodě maxima musí být mezní příjem roven mezním nákladům dR ( q ) dC ( q ) , neboli MR = MC . = dq dq
Pro maximalizaci zisku musí být splněna i podmínka 2.řádu
d 2 R(q) d 2C (q) − <0. dq 2 dq 2 Graficky je určení optimálního objemu produkce a ceny v případě monopolní firmy znázorněno na obrázku č. 9.1. Vyplněná plocha znázorňuje monopolní zisk. Monopol způsobuje neefektivnost, neboť produkuje méně produkce za vyšší cenu.
Teorie her: analýza konfliktů a spolupráce
98
Obrázek č. 9.1: Optimální objem produkce monopolu
p
MC AC
p0
p=g(q) MR q0
q
Příklad 9.6: Předpokládejme, že cena závisí na objemu nabídky a je dána cenovou funkcí p = 100 – 2q. Nákladová funkce firmy je C(q) = 150 + 40q. Potom příjmová funkce firmy je rovna R(q) = pq = 100q – 2q2. Zisková funkce je z(q) = 100q – 2q2 – (150 + 40q). Mezní příjem dostaneme jako derivaci příjmové funkce podle q MR = 100 – 4q. Mezní náklady jsou rovny derivaci nákladové funkce podle q MC = 40. Pro optimální řešení musí platit podmínka MR = MC, tj. v našem příkladě 100 – 4q = 40. Z této podmínky dostáváme řešení qo=15 , po = 70 , z(qo) = 300. Kdyby se monopolní firma chovala jako firma při dokonalé konkurenci, musely by platit podmínky
Teorie her: analýza konfliktů a spolupráce
99
p = MC, tj. v našem příkladě 100 – 2q = 40, z čehož dostáváme řešení qo=30 , po = 40, z(qo) = – 150. Příklad demonstruje společenskou neefektivnost monopolu. Firma v monopolním postavení vyrábí méně při vyšší ceně a zisku. Nabízí se otázka, zda je možné tuto společenskou neefektivnost odstranit pomocí ekonomické regulace. Jedním z nástrojů ekonomické regulace jsou daně. Zkoumejme, jaký vliv má určitý typ daně na společenskou efektivnost. Fixní daň Předpokládejme, že bez ohledu na objem výroby, zisku a obratu je zavedena daň o absolutní velikosti t. Potom zisková funkce monopolisty je rovna z(q, t) = R(q) – C(q) – t . Z podmínky prvního řádu dz(q,t) =0 dq dostáváme dR = dC dq dq
což je stejná podmínka jako u monopolistické firmy před zavedením daně a tudíž tato daň nemá vliv na chování monopolisty. Daň ze zisku V tomto případě představuje veličina t∈(0, 1) podíl ze zisku. Potom zisková funkce monopolisty je rovna z(q, t) = R(q) – C(q) – t[R(q) – C(q)] = (1 – t)[R(q) – C(q)]. Z podmínky prvního řádu dostáváme (1 − t ) dR − dC = 0 , dq dq což vede ke stejné podmínce jako u monopolistické firmy před zavedením daně a tudíž ani tato daň nemá vliv na chování monopolisty.
Teorie her: analýza konfliktů a spolupráce
100
Daň z monopolního výrobku
Tato daň znamená zaplacení z každé jednotky produkce t peněžních jednotek. V tomto případě je zisková funkce monopolisty rovna z(q, t) = R(q) – C(q) – tq.
Z podmínky prvního řádu dz = 0 , dq
dostáváme dR = dC + t , dq dq
což je podmínka, která se liší od podmínky pro nezdaněnou monopolistickou firmu. Zkoumejme totální diferenciál předchozího vztahu d 2 R dq = d 2 C dq + dt . dq 2 dq 2
Po úpravě dostáváme
1 dq = 2 , dt d R − d 2 C dq 2 dq 2 což vzhledem k podmínce druhého řádu znamená, že platí dq < 0, dt
tj. zvýšení daně z monopolního výrobku vede k poklesu objemu výroby a tudíž k dalšímu zvýšení ceny. To znamená, že tento typ daně prohlubuje společenskou neefektivnost monopolu. Příklad 9.7. Zaveďme u zadání z příkladu 9.6 daň z monopolního výrobku o velikosti t = 4. Zisková funkce je rovna 2
2
z(q, t) = 100q – 2q – (150 + 40q) – 4q = 56q – 2q – 150.
Teorie her: analýza konfliktů a spolupráce
101
Z podmínky prvého řádu dz = 0 = 56 – 4q, dq
dostáváme řešení o
o
o
q =14 , p = 72 , z(q , t) = 242.
Ze srovnání s výsledky příkladu 9.6 plyne, že se objem produkce snížil o 1 jednotku, cena vzrostla o 2 jednotky a zisk se snížil o 58 jednotek. Vybraná daň bude 56. Kdyby stát použil typ fixní daně o stejné velikosti 56 jednotek, výstup a cena by zůstaly stejné jako před zavedením daně a zisk by klesl o 56 jednotek. Z tohoto příkladu je vidět, že stát nevhodnou volbou daně může poškodit spotřebitele i výrobce, aniž by tím něco získal.
9.4 Cvičení 1.
2.
Jak se změní řešení z příkladů 9.1 až 9.5, pokud první výrobce bude mít nulové fixní náklady? Nákladová funkce prvého výrobce bude mít tedy tvar C1(q1) = 12q1. Předpokládejte, že výrobci z příkladů 9.1 až 9.5 mohou pro technologická omezení stanovit objemy výroby pouze v desítkách (tj. qi = 0, 10, 20,…). Formulujte model ve formě hry v normálním tvaru a nalezněte rovnovážná řešení pro různé typy oligopolů.
102
Teorie her: analýza konfliktů a spolupráce
Teorie her: analýza konfliktů a spolupráce
103
10. Rozhodování při riziku a neurčitosti 10.1 Rozhodování při riziku Rozhodování při jistotě znamená, že rozhodnutím je jednoznačně dán výsledek. Rozhodováním při nejistotě rozumíme situace, kdy rozhodnutí nemá jednoznačný výsledek, ten ještě závisí na daném stavu okolí. V této kapitole se budeme zabývat dvěma typy rozhodování za nejistoty: rozhodováním při riziku a rozhodováním při neurčitosti.
Rozhodováním při riziku rozumíme takové rozhodovací situace, ve kterých výsledek volby určité varianty rozhodnutí není dán s jistotou, nýbrž známým rozložením pravděpodobností. Příkladem může být sázka na to, že při hodu hrací kostkou padne číslo šest. Výsledek hodu kostkou sice není předem znám, ale předem víme, že pravděpodobnost úspěchu je 1/6 a neúspěchu 5/6. Jelikož předpokládáme existenci pouze jediného hráče, může se zdát, že úlohy daného typu by měly být řazeny spíše do teorie pravděpodobnosti, teorie rozhodování či operačního výzkumu než do teorie her. Jde však pouze o nevelkou změnu pohledu, ve kterém budeme chápat rozhodování při riziku jako konfliktní situaci mezi inteligentním hráčem 1 a neinteligentním hráčem 2, kterým je náhodný mechanismus. Přitom předpokládáme, že hráč 2 volí své strategie podle známého rozdělení a nesleduje žádný vlastní cíl. Příklady tohoto teoreticko-herního pohledu na rozhodovací situace při riziku následují níže. Když si pan Polívka (hráč 1) ráno kupoval noviny, neodolal pokušení a vsadil si dva sloupečky Sportky (hráčem 2 je losovací mechanismus). Pravděpodobnosti výher jsou známy, výšku výher v jednotlivých pořadích lze zhruba odhadnout. Firma Česká lesnická a zemědělská a. s. (hráč 1) se rozhoduje, zda se pojistit proti vzniku požáru (hráčem 2 je příroda). Četnosti požárů a vzniklé škody jsou firmě dobře známy z historických statistik. Správce portfolia Prvního hasičského penzijního fondu (hráč 1) se rozhoduje o investici do různých typů státních dluhopisů (hráčem 2 je finanční trh). Výnosy a jejich pravděpodobnosti u těchto cenných papírů lze poměrně spolehlivě odhadnout.
104
Teorie her: analýza konfliktů a spolupráce
Inteligentní hráč (hráč 1) se snaží volbou strategie maximalizovat výhru a za tím účelem provádí analýzu rozhodovací situace, kterou můžeme modelovat jako matici, jejíž řádky odpovídají variantám hráče 1 a sloupce odpovídají možným stavům (variantám hráče 2). Prvky výplatní matice aij (i = 1, 2,..., m; j = 1, 2,..., n) nyní představují výhry hráče 1. Pravděpodobnosti pj (j = 1, 2,..., n) pro možné stavy jsou známy a můžeme se na ně dívat také tak, že známe smíšené strategie hráče 2. V tomto případě se za racionální postup považuje maximalizace střední hodnoty výhry, podle kterého je zvolena varianta maximalizují hodnotu ukazatele n
max ∑ p j aij , i
j =1
Princip maximalizace střední hodnoty výhry je jednoduchým a praktickým kritériem, které však ne vždy dobře popisuje chování v reálných rozhodovacích situacích. Kromě střední hodnoty výhry je pro rozhodnutí důležitý též rozptyl výhry.
10.2 Rozhodování při neurčitosti Rozhodováním při neurčitosti nazýváme situaci, v niž známe možné strategie hráče 2 (náhodného mechanismu), na rozdíl od rozhodování při riziku však nemáme žádnou informaci o rozložení pravděpodobností. V situacích, kdy máme velmi omezenou informaci o povaze protihráče, není možné stanovit jednoznačný postup výběru optimálního rozhodnutí. Nicméně lze doporučit určitá užitečná pravidla, která by optimální rozhodnutí mělo splňovat (Maňas, 2002). Rozhodnutí vybrané inteligentním (racionálním) hráčem musí být nedominované, tedy takové, ke kterému ve výplatní matici neexistuje jiný řádek, který by měl alespoň jeden prvek větší, aniž by měl nějaký jiný prvek menší. Myšlenka prohlásit za optimální všechny nedominované strategie hráče 1 není moc přínosná. Pokud model rozhodovací situace formuluje někdo, kdo má dobrý úsudek a přehled o problému, dominované strategie rovnou vynechá. Podstata rozhodování při neurčitosti je ostatně v tom, že potřebujeme vybrat k realizaci pokud možno jedinou strategii. Algoritmus pro volbu rozhodnutí by měl respektovat axiom irelevance (nedůležitosti) nerozlišující přidané varianty – sloupce. Pokud hráč 1 pomocí algoritmu vybere nějakou řádku jako optimální, měla by tato řádka
Teorie her: analýza konfliktů a spolupráce
105
zůstat optimální, i když se algoritmus aplikuje na tutéž matici, ke které se přidá sloupec s vesměs stejnými prvky. Je totiž zřejmé, že sloupec se stejnými prvky nemůže řádky matice nijak nově rozlišit, a optimalizační algoritmus by tedy neměl označit za optimální jiný řádek než v matici, kde nerozlišující sloupec nebyl. Algoritmus pro volbu rozhodnutí by měl rovněž zachovávat axiom irelevance přidané neoptimální řádky. Jestliže k matici přidáme další strategii hráče 1 (řádku) a aplikujeme na matici znova optimalizační algoritmus, měl by buď tuto přidanou strategii označit za optimální anebo ponechat jako optimální strategii, kterou vybral před přidáním řádky. Zdůvodnění je logické: proč by mělo být možné manipulovat s optimálním rozhodnutím tím, že do prostoru strategií přidáváme špatné strategie? Další žádoucí, i když možná už ne tak názornou, vlastností optimalizačního algoritmu by mělo být splnění axiomu úplnosti množiny optimálních strategií. Jestliže algoritmus označí za optimální řádek v a současně řádek w, a jestliže je v matici řádek z, který je nějakou konvexní kombinací (váženým průměrem) řádků v a w, měl by tento řádek z být také označen jako optimální. Algoritmus má za úkol maximalizovat uživateli očekávanou výhru. Není-li axiom úplnosti množiny optimálních strategií splněn, vzniká otázka, jak vlastně algoritmus optimální strategie vybírá, když mu vadí vážené průměry strategií, které považuje za optimální. Z hlediska praxe by byl důležitý axiom jednoznačnosti, který by požadoval, aby optimalizační algoritmus nevybíral za optimální rozhodnutí příliš mnoho řádků, neboť většinou je možné vykonat jen jednu akci (např. buď se nechat pojistit nebo ne). Nejlépe by bylo, kdyby algoritmus přímo vybral pro každou situaci rozhodování při neurčitosti právě jednu optimální strategii. Technicky by nebylo těžké tento požadavek zajistit třeba dodatkem, že je-li kandidátů na optimalitu více, jeden se jako optimální vylosuje. Problém je však v tom, že takto upravený algoritmus nesplňuje jiné axiomy, třeba zrovna oba výše uvedené axiomy o irelevanci přidaných strategií. Stejně důležitým požadavkem jako (pokud možno) jednoznačnost výběru optimální strategie je i požadavek, aby vždy byla alespoň jedna strategie jako optimální vybrána. Jestliže máme použít nějaký algoritmus pro řešení úloh rozhodování při neurčitosti, musíme zajistit, aby pro jakoukoliv zadanou matici vždy vybral za optimální nedominovanou řádku a ještě splnil co nejvíce dalších axiomů. Praktickým výsledkem je doporučení, používat pro rozhodování několik (dále uvedených) algoritmů, které se nazývají také rozhodovací principy (Maňas, 2002). Všechny uvedené principy splňují požadavek nedominovanosti optimální strategie a většinu dalších axiomů. Jejich výhodou je také to, že
106
Teorie her: analýza konfliktů a spolupráce
každý z nich je založen na celkem dobře sdělitelné filozofii. Jejich nevýhodou naopak je, že aplikovány na jednu a tutéž rozhodovací situaci jsou někdy schopny označit jako optimální různé strategie.
Laplaceův princip Podle Laplaceova principu (známého též jako princip nedostatečné evidence) je třeba se v případě rozhodování při neurčitosti chovat tak, jako by šlo o rozhodování při riziku, kde hráč 2 volí všechny své strategie se stejnou pravděpodobností. To je podle tohoto principu to nejlepší, co lze o rozdělení neznámých pravděpodobností možné předpokládat. Za optimální rozhodnutí vyhlásíme strategii s největším řádkovým průměrem
1 n max ∑ aij . i n j =1 Waldův princip maximinu Podle tohoto pesimistického rozhodovacího principu má inteligentní hráč 1 volit tu strategii, která je optimální v případě, že protivník (náhodný mechanismus) použije takovou strategii, která je pro inteligentního hráče nejhorší. Waldův princip maximinu tak dává rozhodnutí až přehnaně opatrná. Staví hráče 1 do pozice, kdy z toho, že může něco nepříznivého nastat vyvozuje, že to nastane. Princip je vhodný pro případy, které vyžadují krajní opatrnost. Podle principu maximinu zvolíme řádku (strategii) s maximální hodnotou řádkového minima:
max min a ij . j i
Savageův princip maximinu ztráty Tento zajímavý rozhodovací princip je vhodný pro situace, ve kterých se po volbě strategie hráčem 2 objeví kritici, kteří budou posuzovat rozhodnutí hráče 1 z pozic „generálů po bitvě“. Při použití tohoto principu v prvním kroku k zadané výplatní matici sestavíme matici ztrát, které utrpí hráč 1 ve srovnání s rozhodnutím optimálním v případě, kdyby hráč 1 před rozhodnutím znal strategii protivníka. Matice ztrát (označme ji jako matici B) se vypočte tak, že od každého sloupce výplatní matice odečteme největší prvek ve sloupci (sloupcové maximum). Prvky matice ztrát jsou po této úpravě až na sloupcová maxima záporné. Na takto vytvořenou matici ztrát aplikujeme již známý princip maximinu, podle kterého volíme jako optimální
Teorie her: analýza konfliktů a spolupráce
107
strategii řádku s maximální hodnotou řádkového minima. Řešení získáme podle:
bij = aij − max aij ; i max min bij . j i
Hurwiczův princip vyváženého optimismu a pesimismu Použití principu minimaxu je výrazem krajního pesimismu. Opakem pesimistického rozhodovatele je rozhodovatel krajně optimistický, který vždy počítá s tím, že ze všech možných situací nastane ta pro něho nejpříznivější. Rozumný rozhodovatel se pohybuje mezi těmito extrémy. Je tedy optimální volit tu řádku, v níž je průměr nejhorší a nejlepší výhry maximální. Průměr může být i vážený, pokud dovedeme zdůvodnit pro řádkové maximum a minimum jiné váhy, než 0,5 a 0,5. V tom případě hodnotu optimismu označíme řeckým písmenem α a pesimismu 1-α. Podle principu vyváženého optimismu – pesimismu volíme tu řádku výplatní matice, pro niž je maximální výraz:
α min a ij + (1 − α ) max a ij . j j Příklad 10.1: Aplikace principů rozhodování při neurčitosti Firma se rozhoduje o rozsahu produkce nového výrobku. Uvažované hodnoty produkce jsou 100, 200, 300 a 400 výrobků, nebo se vedení firmy může rozhodnout, že nový výrobek vůbec nebude vyrábět (upraveno podle příkladu v Maňas, 2002). Zisk firmy bude především záviset na procentu vadných výrobků. Na základě analýz byla vedení firmy předložena následující tabulka:
Produkce < 1 % 1-2 % >2 % 0 0 0 0 100 20 0 -16 200 35 5 -19 300 50 10 -22 400 65 15 -25
108
Teorie her: analýza konfliktů a spolupráce
K rozhodnutí podle Laplaceova principu vypočteme nejdříve řádkové průměry: 0, 4/3, 7, 38/3, 55/3. Maximum z těchto hodnot je 55/3 a nejlepší rozhodnutí je tedy vyrábět na plnou kapacitu, tj. 400 kusů. K rozhodnutí podle principu maximinu najdeme v prvním kroku nejhorší možné výhry pro jednotlivé řádky (řádková minima): 0, -16, -19, -22, -25. Nejlepší z těchto nejhorších výsledků dává výhru 0 a nejlepší strategií je proto podle tohoto principu nový výrobek vůbec nevyrábět. K rozhodnutí podle principu minimaxu ztráty musíme nejdříve spočítat matici ztrát: -65 -15 0 -45 -15 -16 -30 -10 -19 -15 -5 -22 0 0 -25 Nejhorší ztráty v každém řádku jsou: -65, -45, -30, -22, -25. Z těchto nejhorších ztrát je nejlepší hodnotou -22, čemuž odpovídá doporučení vyrábět 300 kusů výrobků. K rozhodnutí podle principu vyváženého optimismu–pesimismu spočteme průměry nejlepšího a nejhoršího výsledku na každé řádce. Stačí součty, neboť k hledání maxima netřeba dělit dvěma. Dostaneme hodnoty: 0, 4, 16, 28, 40. Nejlepší součet 40 vede k doporučení vyrábět 400 výrobků.
Teorie her: analýza konfliktů a spolupráce
109
110
Teorie her: analýza konfliktů a spolupráce
11. Aukce 11.1 Typy aukcí Aukci je možno definovat jako tržní mechanismus, který vyrovnává poptávku a nabídku. Další tržní mechanismy zahrnují např. prodej s pevnou cenou nebo cenové vyjednávání. U aukcí je charakteristické, že proces vytváření ceny je explicitní. Pravidla, podle kterých se utváří konečná cena, jsou dobře známa a chápána všemi účastníky. Aukce jsou pružnější než prodej s pevnou cenou a méně časově náročné než je cenové vyjednávání. Jejich využití se pohybuje od prodeje uměleckých předmětů, přes prodej květin, alokace radiového spektra, prodej elektřiny či povolenek znečištění až po státní nákupy nebo prodeje. Aukce mohou být klasifikovány podle řady kritérií, např. podle: • způsobu podávání nabídek, • mechanismu změny ceny, • počtu dražených objektů, • typu hodnoty objektů, • počtu prodávajících a kupujících, • kritéria aukce. Rozlišují se aukce otevřené a uzavřené. U otevřených aukcí jsou všechny nabídky viditelné, zatímco u uzavřených aukcí nejsou nabídky vidět, jsou např. podávány v zalepených obálkách (tzv. obálková metoda). Dále se rozlišují aukce s rostoucí cenou a aukce s klesající cenou. U prvního typu se postupně zvyšuje cena až do okamžiku, kdy zůstane jediná nabídka. U druhého typu se cena snižuje až do okamžiku, kdy se objeví první nabídka. Uvažují se aukce s jedním typem objektů a také aukce s více typy objektů. Víceobjektové aukce mohou být sekvenční, kdy se objekty prodávají postupně, nebo simultánní, kdy se prodávají kombinace objektů. Takovéto aukce se nazývají kombinatorické aukce. Podle typu hodnot objektů se většinou uvažují tři případy. V případě soukromé hodnoty draženého objektu každý potenciální kupující zná svoji vlastní hodnotu objektu, která není ovlivněna hodnotami ostatních kupujících. Takový model je vhodný pro objekty krátkodobé spotřeby bez možnosti dalšího prodeje. V případě všeobecně hodnoty draženého objektu je tato
Teorie her: analýza konfliktů a spolupráce
111
hodnota stejná pro každého potenciálního kupujícího, ale v době aukce není skutečná hodnota známa. Kupující však mohou mít určité různé informace o neznámé skutečné hodnotě. Příkladem jsou ropné vrty, kdy jejich hodnota závisí na neznámém množství ropy pod zemí. Kupující však mají různé geologické signály o tomto množství. Obecný model se sdruženými hodnotami zahrnuje předchozí situace jako speciální případy. Sdružené hodnoty zahrnují jak složku soukromého hodnocení, tak i hodnocení objektů dalšími jedinci. Při koupi domu má jeho hodnocení jak privátní složku, tak i složku hodnocení ostatními potenciálními kupujícími pro případ možného budoucího prodeje domu.
Standardní aukce jsou orientovány na prodej, mají jednoho prodávajícího a větší počet kupujících. Reverzní aukce jsou orientovány na nákup, mají naopak jednoho kupujícího a větší počet prodávajících. Dvojité aukce kombinují předcházející dva typy a zprostředkovávají výměnu mezi větším počtem prodávajících a větším počtem kupujících. Kritériem aukce může být maximalizace příjmu prodávajícího nebo efektivnost aukce, která zajistí, že objekt skončí v rukách toho, pro nějž má objekt největší hodnotu. Dalšími ukazateli mohou být transparentnost pravidel a potenciál pro vytváření koluzí účastníků. Dále se budeme zabývat jen aukcemi s jedním typem objektů a uvedeme si čtyři nejznámější typy: 1. Anglická aukce je otevřená aukce s rostoucí cenou. Prodávající začíná aukci s nízkou cenou, kterou postupně zvyšuje. Aukce končí, když žádný z kupujících není ochoten zvýšit nabídku. Aukci vyhrává kupující s nejvyšší nabídkou a za objekt zaplatí tuto nejvyšší nabídku. Anglické aukce jsou typické při prodeji uměleckých předmětů, domů, ojetých aut atd. 2. Holandská aukce je otevřená aukce s klesající cenou. Prodávající začíná aukci s vysokou cenou, kterou postupně snižuje. Aukce končí, když některý z kupujících je ochoten zaplatit průběžnou cenu. Aukci vyhrává kupující, který zastavil dražbu a za objekt zaplatí tuto průběžnou cenu. Holandské aukce jsou typické při prodeji květin v Nizozemí, kdy cenu automaticky mění hodiny a vyhrává kupující, který tyto hodiny zastavil. Podobným způsobem jsou prodávány ryby v Izraeli a tabák v Kanadě. 3. Aukce první ceny je uzavřená (obálková) aukce, kdy účastník aukce zašle svoji nabídku bez znalosti nabídek ostatních účastníků. Vítězem aukce je účastník s nejvyšší nabídkou a zaplatí tuto nejvyšší nabídku. Tato metoda je používána např. v elektronickém obchodování. Používá
112
Teorie her: analýza konfliktů a spolupráce
se rovněž u reverzních aukcí, kdy větší počet prodávajících nabízí jednomu kupujícímu, v tomto případě vyhrává prodávající s nejnižší nabízenou cenou. 4. Aukce druhé ceny (Vickreyova aukce) je uzavřená (obálková) aukce, kdy účastník aukce zašle svoji nabídku bez znalosti nabídek ostatních účastníků. Vítězem aukce je účastník s nejvyšší nabídkou a zaplatí druhou nejvyšší nabídku. Tato aukce byla zavedena zejména pro teoretické analýzy, v současnosti je však používána např. v obchodování B2B.
11.2 Aukce jako Bayesovská hra Analyzujme standardní aukci. Předpokládejme, že prodávající prodává jeden objekt N kupujícím. Aukce jako Bayesovská hra je určena: 1. Množinou hráčů - kupujících: {1, 2, …, N}. 2. Množinou prostorů strategií - nabídek: {B1, B2, …, BN}. Zde Bi označuje prostor strategií i-tého hráče. Konkrétní strategie (nabídky) budeme značit (b1, b2, …, bN). 3. Množinou prostorů typů hráčů - kupujících: {V1, V2, …, VN}. Všechny Vi = [0, v ], i = 1, 2, …, N. Hodnota vi odpovídá vybranému typu hráče i , i = 1, 2, …, N. Hráč i zná svůj typ, ale nezná typy dalších hráčů. 4. Množinou názorů hráčů: {F1, F2, …, FN}. Distribuční funkce F (x) je stejná pro všechny hráče a reprezentuje názor hráče i, který má o typech dalších hráčů. Hodnota F (x) určuje pravděpodobnost, že hodnota náhodné proměnné v je menší nebo rovna x. Odpovídající hustota pravděpodobnosti je označena f(x). 5. Množinou výplatních funkcí: {u1(b1, b2, …, bN, v1, v2, …, vN),…, uN(b1, b2, …, bN, v1, v2, …, vN)}. Výplatní funkce jsou definovány na kartézském součinu prostoru strategií a prostoru typů hráčů.
Často se řeší dvě základní otázky: 1. Jaká je optimální nabídka kupujícího v aukci? 2. Který typ aukce maximalizuje příjem prodávajícího. Jedná se o situaci se soukromými hodnotami objektů. Každý kupující zná vlastní hodnocení objektu a hodnocení ostatních účastníků je popsáno distribuční funkcí F(x) na intervalu [0, v ].
Teorie her: analýza konfliktů a spolupráce
113
Pro jednoduchost předpokládáme, že hodnota objektu je pro prodávajícího nulová, to znamená, že nepřijímá záporné nabídky. Hráči znají vlastní hodnocení objektu vi a dávají nabídky bi = b(vi), pro i = 1, 2, …, N. Při hledání symetrické Bayesovy-Nashovy rovnováhy budeme analyzovat hru z pohledu hráče 1. Předpokládejme, že hráč 1 má svoje hodnocení v = v1 a dává nabídku b1. Hráč získává objekt, pokud jeho nabídka je větší než nejvyšší nabídka ostatních kupujících a nezískává nic, pokud jeho nabídka je menší než nejvyšší nabídka ostatních kupujících. V případě rovnosti předpokládejme, že se objekt neprodá. Výplatní funkce hráče 1 je formulována u i ={
v – b1 , jestliže b1 > max [b(v2), …, b(vN)], 0 , jestliže b1 ≤ max [b(v2), …, b(vN)].
Očekávaný zisk při nabídce b1 může být vyjádřen jako součin možné výhry hráče 1 a pravděpodobnosti, že jeho nabídka je největší. z(b1) = (v – b1)p[b1 > b(v2), …, b1 > b(vN)].
Problém hráče 1 je vybrat x ∈ [0,
v ], které maximalizuje očekávaný zisk.
z(x) = (v – b(x))p[b(x) > b(v2), …, b(x) > b(vN)].
Vzhledem k tomu, že funkce b(x) je ryze rostoucí a že všichni kupující mají stejnou strategii v rovnováze, můžeme očekávaný zisk psát z(x) = (v – b(x))p(x > v2) … p(x > vN) = (v – b(x))F(x)N-1.
Z podmínky prvního řádu dostáváme po řešení diferenciální rovnice a po úpravách optimální velikost nabídky v
∫ F ( x) b (v) = v − *
N −1
0
F (v )
dx
N −1
, jestliže 0 < v ≤
v,
b*(v) = 0 , jestliže v = 0. Vyjádření optimální velikosti nabídky v tomto tvaru ukazuje, o kolik je vhodné snížit tuto nabídku b*(v) ve srovnání s hodnotou objektu v.
114
Teorie her: analýza konfliktů a spolupráce
Příklad 11.1: Obecné výsledky se dají zjednodušit pro konkrétní distribuční funkce. Zejména se používá rovnoměrné rozdělení. Máme určit optimální velikost nabídky pro aukci první ceny, jestliže distribuční funkce F je distribuční funkcí rovnoměrného rozdělení F=U[0, 1] na intervalu [0, 1]. Obecně platí pro určení optimální nabídky v
∫ F ( x) b * (v) = v − 0
N −1
dx
F (v) N −1
.
Po dosazení distribuční funkce rovnoměrného rozdělení dostáváme v
∫x b (v ) = v − *
0
N −1
dx
v N −1
vN N −1 =v− = v. N Nv N −1
S rostoucím počtem kupujících roste i velikost nabídky. Například při dvou kupujících (N=2) by měl kupující nabídnout polovinu svého hodnocení draženého objektu.
Vraťme se k otázce, který ze čtyř základních typů aukcí (anglická, holandská, první ceny, druhé ceny) dává největší očekávaný příjem. Pro aukci první ceny je hodnota očekávaného příjmu rovna očekávané hodnotě největší nabídky R1 = E{max[b* (v1), b* (v2), …, b* (vN)]}. Hodnota očekávaného příjmu se dá vyjádřit následovně v
R = ∫ Nb* (v) F (v) N −1 f (v)dv . 1
0
Důsledkem je skutečnost, že očekávaný příjem prodávajícího roste s počtem účastníků aukce.
Dá se dokázat, že za jistých předpokladů platí tzv. věta o ekvivalentnosti příjmů.
Teorie her: analýza konfliktů a spolupráce
115
Mezi základní předpoklady patří: • Kupující mají nezávisle rozdělené hodnoty. • Kupující jsou rizikově neutrální. • Kupující nemají rozpočtové omezení - jsou schopni zaplatit až do výše jejich hodnocení objektu. • Symetrie – hodnoty všech kupujících jsou rozděleny podle stejné distribuční funkce F. Věta o ekvivalentnosti příjmů: Základní čtyři typy aukcí (anglická, holandská, první ceny, druhé ceny) se soukromými hodnotami poskytují stejný očekávaný příjem.
Věta o ekvivalentnosti příjmů je užitečný a účinný nástroj. Je možno ji například využít při odvození rovnovážných strategií u netypických aukcí a v analýze situací, kdy si kupující nejsou jisti, kolik dražitelů se aukce zúčastní. Při porušení předpokladů již věta o ekvivalentnosti příjmů neplatí. Jestliže je např. porušena podmínka rizikové neutrality a budeme předpokládat, že kupující mají averzi k riziku, potom je očekávaný příjem z aukce první ceny větší než očekávaný příjem z aukce druhé ceny.
116
Teorie her: analýza konfliktů a spolupráce
Literatura 1. Allais, M.: Le comportement de l’homme rationnel devant le risque: critique des postulats et axiomes de l’ecole Américaine. Econometrica, 1953, 21:503-546. 2. Allen, R. G. D.: Matematická ekonomie. Academia, Praha 1971. 3. Binmore, K.: Fun and Games: A Text on Game Theory. D. C. Heath and Company, Lexington 1992. 4. Borel, E.: La Théorie du Jeu et les Équations Intégrales à Noyau Symétrique. Comptes Rendus de l´Académie des Sciences, 1921, 173 1304-1308. 5. Dlouhý, M., Fiala, P.: Úvod do teorie her. Nakladatelství Oeconomica, Praha 2007. 6. Fendek, M.: Kvantitatívna mikroekonómia. Ekonóm, Bratislava 1998. 7. Fendeková, E.: Oligopoly a regulované monopoly. Iura Edition, Bratislava 2006. 8. Fiala, P., Lagová, M., Lauber, J., Málek, J.: Kvantitativní ekonomie. Vysoká škola ekonomická v Praze, Praha 1994. 9. Fiala, P.: Modely a metody rozhodování. Vysoká škola ekonomická v Praze, Praha 2003. 10. Fiala, P., Dlouhý, M.: Základy kvantitativní ekonomie a ekonomické analýzy. Nakladatelství Oeconomica, Praha 2005. 11. Friedman, J. W.: Oligopoly and the theory of games. North-Holland, Amsterdam 1977. 12. Harsanyi J. C.: Games with Incomplete Information Played by „Bayesian” Players, Part I-III. Management Science, 1967-1968, 14: 159-182, 320334, 486-502. 13. Holman, R.: Ekonomie. 3. aktualizované vydání. C. H. Beck, Praha 2002. 14. Holman, R.: Mikroekonomie – středně pokročilý kurz. C. H. Beck, Praha 2002a. 15. Hušek, R., Maňas, M.: Matematické modely v ekonomii. SNTL, Praha 1989. 16. Chobot, M., Turnovec, F., Ulašín, V.: Teória hier a rozhodovania. Alfa, Bratislava 1991. 17. Klemperer, P.: Auctions: Theory and Practice. Princeton University Press, Princeton 2004.
Teorie her: analýza konfliktů a spolupráce
117
18. Krishna, V.: Auction Theory. Academic Press, San Diego 2002. 19. Koutsoyiannis, A.: Modern Microeconomics. 2. vydání, Macmillan Press, London 1979. 20. Maňas, M.: Teorie her a její aplikace. SNTL, Praha 1991. 21. Maňas, M.: Teorie her a konflikty zájmů. Vysoká škola ekonomická v Praze, Praha 2002. 22. Mareš, M.: Principy strategického chování. Karolinum, Praha 2003. 23. Myerson, R. B.: Game Theory: Analysis of Conflict. Harvard University Press, Cambridge 1991. 24. Nash, J. F.: The Bargaining Problem. Econometrica, 1950, 18(2): 155162. 25. Nash, J.: Non-Cooperative Games. The Annals of Mathematics, 1951, 54(2): 286-295. 26. Nash, J.: Two-Person Cooperative Game. Econometrica, 1953, 21(1): 128-140. 27. Osborne, M. J., Rubinstein, A.: Bargaining and Markets. Academic Press, San Diego 1990. 28. Osborne, M. J.: An Introduction to Game Theory. Oxford University Press, New York 2004. 29. Schelling, T. C.: The Strategy of Conflict. Harvard University Press, Cambridge 1960. 30. Schelling, T. C.: Micromotives and Macrobehavior. W. W. Northon and Company, New York 1978 (reprint 2006). 31. Skálová, A., Opakované hry, diplomová práce, Fakulta informatiky a statistiky VŠE v Praze, Praha 2007. 32. Skořepa, M., Zpochybnění deskriptivnosti teorie očekávaného užitku. Politická ekonomie, 2007, 1:106-120. 33. Slantchev, B. L.: Game Theory: Repeated Games. University of California, San Diego 2004. 34. von Neumann, J.: Zur Teorie der Gesellschaftsspiele. Mathematische Annalen, 1928,100:295-320. 35. von Neumann, J., Morgenstern, O.: Theory of Games and Economic Behavior. Princeton University Press, Princeton 1944. 36. Zermelo, E.: Über eine Anwendung der Mengenlehre auf die Teorie des Schashspiels. Proceedings Fifth International Congress of Mathematicians, 1913, 2: 501-504.
118
Teorie her: analýza konfliktů a spolupráce
Rejstřík A akce, 47, 76 B Bayesova-Nashova rovnováha,, 76 bod nedohody, 79 C
hra, opakovaná, 47 hra, prostá, 62 hra, strategicky ekvivaletní, 23 hra, vyjednávací, 79 hráč, 8 hráč, inteligentní, 9 Ch charakteristická funkce hry, 58
cena hry, 20
I D
diskontovaná průměrná výplata, 50 diskontovaný součet výplat, 50 dokonalá rovnováha podhry, 40 dominovanost, silná, 19 dominovanost, slabá, 19 duopol, 86 H historie, 48 historie, konečná, 48 hra, 8 hra NIM, 42 hra s dokonalou informací, 43 hra s konstantním součtem, 17 hra s nedokonalou informací, 43, 73, 74 hra s neúplnou informací, 73 hra s nulovým součtem, 18 hra s úplnou informací, 73 hra Stonožka, 39 hra v normálním tvaru, 17 hra v rozvinutém tvaru, 39 hra ve strategickém tvaru, 17 hra ve tvaru charakteristické funkce, 58 hra, Bayesovská, 73, 75 hra, dvoumaticová, 27 hra, hlasovací, 62 hra, jednokolová, 47 hra, koaliční, 57 hra, konečná, 43 hra, konečně opakovaná, 47 hra, kooperativní, 27, 35, 57 hra, maticová, 18 hra, nekonečně opakovaná, 47 hra, nekooperativní, 27
informace, soukromá, 74 informace, všeobecně známá, 74 J jádro hry, 35, 60, 93 K kartel, 86 koalice, 57 koalice, velká, 57 koaliční struktura, 57 koaliční struktura, volná disjunktní, 58 konflikt, antagonistický, 9 konflikt, neantagonistický, 9 kořen, 39 kuře, 32 L lidová věta, 55 M manželský spor, 33, 76 matice ztrát, 106 matice, výplatní, 18 množina hráčů, 17, 75, 111 množina názorů hráčů, 75, 111 množina prostorů strategií, 17, 75, 111 množina prostorů typů hráčů, 75, 111 množina přípustných dohod, 79 množina výplatních funkcí, 17, 75, 111 model oligopolu, Cournotův, 86 model oligopolu, kooperativní, 92 model oligopolu, Stackelbergův, 89 monopol, 85 monopolistická konkurence, 85
Teorie her: analýza konfliktů a spolupráce N Nashova rovnováha, 20 Nashovo vyjednávací řešení, 79 Nashův součin, 81 následník, 89 netrpělivost, 50 O oligopol, 85 P paradox, Allaisův, 14 paradox, Ellsbergův, 15, 16 paradox, Petrohradský, 10 Petrohradský paradox, 10 podhra, 39 pravidlo, hlasovací, 62 princip maximinu, 106 princip maxinimu ztráty, 106 princip vyváženého optimismu a pesimismu, 107 princip, Laplaceův, 106 principy, rozhodovací, 105 profil akcí, 48 profil strategií, 49 prostor akcí, 47, 76 prostor historií, 48 prostor profilů akcí, 48 prostor strategií, 8 prostor strategií (v opakované hře), 49 R rovnováha, Bayesova-Nashova, 76 rovnováha, dokonalá Baysova, 78 rovnováha, Nashova, 20 rovnováha, paretovsky efektivní, 32 rovnováha, ústřední, 34 rovnováha, vícenásobná Nashova, 34 rovnovážné strategie, 20 rozdělení, 35, 59 rozhodování při neurčitosti, 104 rozhodování při riziku, 103 Ruská ruleta, 40 S sedlový prvek, 20
Shapleyova hodnota, 60 Shapleyův vektor, 60 smíšené rozšíření maticové hry, 22 strategie, 8 strategie (v opakované hře), 47 strategie, optimální, 8 strategie, rovnovážná, 20 strategie, ryzí, 20 strategie, silně dominovaná, 19 strategie, smíšená, 22 strom hry, 39 superhra, 47 T teorie očekávané hodnoty, 10 teorie očekávaného užitku, 12 teorie užitku, 10 teorie užitku, kardinalistická, 10 teorie užitku, ordinalistická, 10 teorie vyjednávání, 79 teorie, kumulativní prospektová, 16 trh, dokonalý, 85 trh, nedokonalý, 85 U uzel, koncový, 39 uzel, průchozí, 43 uzel, rozhodovací, 39 užitek, 10 užitková funkce, 11 užitková funkce, von NeumannovaMorgensternova, 12 V věta, lidová, 55 vězňovo dilema, 31, 51 vůdce, 89 vyjednávací problém, 79 výplatní funkce, 8 Z základní věta maticových her, 23 zaručená výhra, maximinová, 37 zaručená výhra, rovnovážná, 35, 57 zpětná indukce, 39
119