Za´padoˇceska´ univerzita v Plzni Fakulta aplikovany´ch vˇed Katedra matematiky
Bakal´ aˇ rsk´ a pr´ ace ˇ Casov´ e struktury v teorii her
Plzeˇ n 2013
ˇ Lucie Stejrov´ a
Prohl´ aˇ sen´ı Prohlaˇsuji, ˇze jsem bakal´aˇrskou pr´aci vypracovala samostatnˇe a v´ yhradnˇe s pouˇzit´ım citovan´ ych pramen˚ u. V Plzni dne 28. kvˇetna 2013 ˇ Lucie Stejrov´ a
Abstrakt C´ılem t´eto pr´ace je sestavit srozumiteln´e shrnut´ı role ˇcasov´an´ı v teorii her. Hlavn´ı pozornost je upˇrena na hry, kter´e ve sv´e statick´e formˇe maj´ı v´ıce rovnov´ah. Konkr´etnˇe se vˇenuje dvˇema sc´en´aˇr˚ um V´alka pohlav´ı a Jestˇra´bi a holubice. V pr´aci je uk´az´ano, jak ˇcasov´an´ı mˇen´ı poˇcet a zejm´ena jednoznaˇcnost rovnov´ah. Pr´ace se vˇenuje ˇcasov´ ym struktur´am v bˇeˇznˇe zn´am´ ych dynamick´ ych hr´ach, ale i ve speci´aln´ıch typech dynamick´ ych her, kde je ˇcasov´an´ı n´ahodn´e. Kl´ıˇ cov´ a slova: Teorie her, V´alka pohlav´ı, Jestˇr´abi a holubice, statick´e hry, dynamick´e hry, dynamick´e hry s n´ahodn´ ym ˇcasov´an´ım tah˚ u
Abstract The aim of this work is to make clear summary of timing structures in the game theory. The main attention is given to situations, which have multiple Nash equilibria in the form of static game. Namely it is The Battle of Sexes scenario and The Game of Chicken scenario. In the work we show how timing can cause change of number of equilibria and especially uniqueness of equalibria. This work pursues commonly known dynamic games but also gives attention to special types of dynamic games with stochastic timing of moves. Key words: Game theory, Battle of Sexes, Game of Chicken, static games, dynamic games, dynamic games with stochastic timing of moves
Obsah ´ 1 Uvod 2 Z´ akladn´ı pojmy teorie her ´ 2.1 Uvod do teorie her . . . . . . . . . . . . 2.2 Hra, hr´aˇc, strategie, uˇzitek . . . . . . . . 2.2.1 Typy her . . . . . . . . . . . . . . 2.3 Statick´e hry . . . . . . . . . . . . . . . . 2.4 Sc´en´aˇre s nejednoznaˇcn´ ymi rovnov´ahami 2.4.1 V´alka pohlav´ı . . . . . . . . . . . 2.4.2 Jestˇr´abi a holubice . . . . . . . . 2.4.3 Grafick´e zn´azornˇen´ı uˇzitk˚ u . . . .
1
. . . . . . . .
2 2 2 3 3 5 6 8 9
3 Dynamick´ e hry 3.1 Zobrazen´ı dynamick´e hry . . . . . . . . . . . . . . . . . . . . . ˇ sen´ı dynamick´e hry . . . . . . . . . . . . . . . . . . . . . . 3.2 Reˇ 3.3 V´ yhoda poˇrad´ı . . . . . . . . . . . . . . . . . . . . . . . . . .
12 12 13 14
4 Dynamick´ e hry s n´ ahodn´ ym ˇ casov´ an´ım tah˚ u 4.1 Popis hry . . . . . . . . . . . . . . . . . . . . ˇ 4.2 Casov´ an´ı reviz´ı . . . . . . . . . . . . . . . . . 4.3 V´ ybˇer optim´aln´ı rovnov´ahy . . . . . . . . . . 4.3.1 Jin´ y zp˚ usob vyj´adˇren´ı podm´ınky v´ yhry 4.3.2 V´ ymˇena poˇrad´ı hr´aˇc˚ u. . . . . . . . . .
16 16 16 18 22 23
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
5 Pˇ r´ıklady, z´ avislosti na parametrech a uˇ zitc´ıch 25 5.1 Ilustraˇcn´ı pˇr´ıklady . . . . . . . . . . . . . . . . . . . . . . . . 25 5.2 Z´avislost podm´ınek v´ yhry . . . . . . . . . . . . . . . . . . . . 29 5.2.1 Shrnut´ı . . . . . . . . . . . . . . . . . . . . . . . . . . 32 6 Z´ avˇ er
35
´ 1 Uvod C´ılem t´eto pr´ace je pˇredstavit roli ˇcasov´an´ı v teorii her s ohledem hlavnˇe na kooperaˇcn´ı hry a situace s n´asobn´ ymi rovnov´ahami, kde ˇcasov´an´ım m˚ uˇzeme dos´ahnout zmˇeny poˇctu a jednoznaˇcnosti rovnov´ah. Zab´ yv´ame se klasick´ ymi dynamick´ ymi hrami, ale i situacemi, kde je ˇcasov´an´ı tah˚ u n´ahodn´e. Hlavn´ım n´amˇetem pro tuto pr´aci byl ˇcl´anek Libich a Stehl´ık [3]. V zaˇca´tku pr´ace ˇcten´aˇre sezn´am´ıme se z´akladn´ımi pojmy teorie her, kter´e d´ale pouˇz´ıv´ame. Pˇredstav´ıme tak´e z´akladn´ı pˇredpoklady teorie her. Velk´a ˇc´ast t´eto kapitoly je vˇenov´ana statick´ ym hr´am a dvˇema sc´en´aˇr˚ um s n´asobn´ ymi rovnov´ahami: V´alka pohlav´ı a Jestˇra´bi a holubice. V dalˇs´ı kapitole zkoum´ame dynamick´e hry. Uk´aˇzeme jak pˇreveden´ım statick´ ych her, s v´ yˇse uveden´ ymi sc´en´aˇri, na dynamickou hru m˚ uˇzeme vyˇreˇsit probl´em nejednoznaˇcnosti rovnov´ahy. N´aslednˇe se vˇenujeme dynamick´ ym hr´am se speci´aln´ım ˇcasov´an´ım tah˚ u, kter´e je n´ahodn´e, zadan´e nˇejak´ ym pravdˇepodobnostn´ım rozdˇelen´ım. Pop´ıˇseme tento typ hry a snaˇz´ıme se opˇet vyˇreˇsit nejednoznaˇcnost rovnov´ahy. Pro ilustraci nalezen´eho ˇreˇsen´ı uvedeme pˇr´ıklady. Nakonec zkoum´ame z´avislost ˇreˇsen´ı na obsaˇzen´ ych parametrech.
1
2 Z´akladn´ı pojmy teorie her Tato kapitola slouˇz´ı jako struˇcn´ yu ´vod do problematiky teorie her. Jsou zde vysvˇetlen´e z´akladn´ı pojmy a myˇslenky t´eto discipl´ıny. Vˇetˇsina definic a vˇet je pˇrejata z literatury Webb [1] a Fudenberg [2]. D´ale zde pˇredstav´ıme a pop´ıˇseme statick´e hry a uk´aˇzeme dva z´akladn´ı sc´en´aˇre.
2.1
´ Uvod do teorie her
Teorie her je matematick´a discipl´ına, kter´a aplikuje matematick´e poznatky pˇri rozhodovac´ıch a konfliktn´ıch situac´ıch, kter´e mohou bˇeˇznˇe nastat. Situace rozhodov´an´ı racion´aln´ıch hr´aˇc˚ u jsou pˇrev´adˇeny na matematick´e modely. Z tohoto modelu se potom pomoc´ı v´ ypoˇct˚ u snaˇz´ı nal´ezt nejlepˇs´ı strategii pro vˇsechny hr´aˇce. Zde se nach´az´ı hlavn´ı rozd´ıl mezi teori´ı her a optimalizac´ı. Pˇri optimalizaci hled´ame nejlepˇs´ı alternativu pro jednoho hr´aˇce, kter´ y zanedb´av´a okol´ı, zat´ımco v teorii her hled´ame nejlepˇs´ı strategii pro hr´aˇce za pˇredpokladu vlivu naprosto racion´aln´ıho okol´ı (dalˇs´ıch hr´aˇc˚ u). Teorie her m´a mnoho aplikac´ı v soci´aln´ıch, politick´ ych a poˇc´ıtaˇcov´ ych vˇed´ach, stejnˇe jako v biologii. Ze soci´aln´ıch vˇed je to pˇredevˇs´ım ekonomie. Pro biologii jsou d˚ uleˇzit´e evoluˇcn´ı hry, kter´e mohou modelovat chov´an´ı r˚ uzn´ ych ˇzivoˇciˇsn´ ych druh˚ u.
2.2
Hra, hr´ aˇ c, strategie, uˇ zitek
Jako hra je v teorii her oznaˇcov´ana jak´akoliv rozhodovac´ı situace, kde vystupuj´ı alespoˇ n dva hr´aˇci. Pro takov´e hry uvaˇzujeme obecn´e pˇredpoklady teorie her. Pˇ redpoklad 1. (i) Hr´aˇci jsou racion´aln´ı. (ii) Vˇsichni u ´ˇcastn´ıci znaj´ı pravidla a ta se v pr˚ ubˇehu jedn´e hry nemˇen´ı. (iii) Hr´aˇci znaj´ı sv´e vlastn´ı uˇzitky a z´aroveˇ n maj´ı pˇrehled o uˇzitc´ıch ostatn´ıch hr´aˇc˚ u. Jako hr´aˇce uvaˇzujeme jedince, kter´ y m´a moˇznost uˇcinit rozhodnut´ı, tj. vybrat jednu z mnoˇziny moˇzn´ ych strategi´ı. Jedno urˇcit´e rozhodnut´ı je tedy 2
Z´akladn´ı pojmy teorie her
Statick´e hry
oznaˇcov´ano jako strategie. Kaˇzd´ y hr´aˇc m´a dan´e uˇzitky pro kombinaci sv´ ych strategi´ı postupnˇe se vˇsemi strategiemi protihr´aˇc˚ u.
2.2.1
Typy her
Hry m˚ uˇzeme dˇelit dle r˚ uzn´ ych krit´eri´ı. Za z´akladn´ı dˇelen´ı povaˇzujeme dva typy, a to hry statick´e (v norm´aln´ım tvaru) a hry dynamick´e (v explicitn´ım tvaru). Tˇemto typ˚ um her budou vˇenov´any samostatn´e kapitoly v pr˚ ubˇehu t´eto pr´ace. Dalˇs´ı dˇelen´ı m˚ uˇzeme prov´adˇet dle poˇctu hr´aˇc˚ u, nejˇcastˇeji se vˇsak setk´ame s typem her, kde se vyskytuj´ı pouze dva hr´aˇci. Nen´ı potom vylouˇcen´e, ˇze jeden hr´aˇc zastupuje celou skupinu jedinc˚ u se stejn´ ymi z´ajmy. Hry m˚ uˇzeme rozdˇelit i podle poˇctu strategi´ı na hry s koneˇcn´ ym poˇctem strategi´ı a hry s nekoneˇcn´ ym poˇctem strategi´ı. Nekoneˇcn´ y poˇcet strategi´ı m˚ uˇze nastat tehdy, pokud hr´aˇc vyb´ır´a napˇr´ıklad re´aln´e ˇc´ıslo ze spojit´eho intervalu.
2.3
Statick´ e hry
Statick´a hra je jednotahov´a hra dvou nebo v´ıce hr´aˇc˚ u se dvˇema nebo v´ıce strategiemi. Tento typ hry se nˇekdy naz´ yv´a simult´ann´ı hra, protoˇze hr´aˇci uskuteˇcn ˇuj´ı sv´e rozhodnut´ı ve stejn´ y okamˇzik a neznaj´ı pˇredem volbu ostatn´ıch. Matematick´e vyj´adˇren´ı t´eto hry je pops´ano n´asleduj´ıc´ı definic´ı. Definice 1. Statick´a hra je matematick´a struktura skl´adaj´ıc´ı se ze tˇr´ı mnoˇzin: 1. Mnoˇzina hr´aˇc˚ u i ∈ {1, 2, ..., N }, 2. mnoˇzina jejich strategi´ı Si , 3. uˇzitky πi (s1 , s2 , ..., sN ) pro kaˇzdou moˇznou kombinaci ˇcist´ ych strategi´ı vˇsech hr´aˇc˚ u, kde s1 ∈ S1 , s2 ∈ S2 , ..., sn ∈ Sn . D´ale, pro u ´ˇcely t´eto pr´ace, budeme uvaˇzovat pouze hru dvou hr´aˇc˚ u se dvˇema strategiemi. Statickou hru zapisujeme v norm´aln´ım tvaru, kde se vy3
Z´akladn´ı pojmy teorie her
Statick´e hry
skytuj´ı data ze vˇsech tˇr´ı nadefinovan´ ych mnoˇzin. Hra m˚ uˇze vypadat n´asledovnˇe: H2 C A a,w H1 B c,y
D b,x d,z
Z´apis hry pomoc´ı tabulky se naz´ yv´a norm´aln´ı tvar statick´e hry. M´ame tedy mnoˇzinu dvou hr´aˇc˚ u {H1, H2}. Jejich strategie jsou S1 = {A, B} a S2 = {C, D}. Uˇzitky prvn´ıho hr´aˇce jsou {a, b, c, d}, kde napˇr´ıklad uˇzitek a m˚ uˇzeme zapsat jako π1 (A, C). Uˇzitky druh´eho hr´aˇce jsou {w, x, y, z}. Strategie {A, B} a {C, D} uveden´e v tabulce jsou ˇcist´e strategie, jejich kombinac´ı z´ısk´ame sm´ıˇsen´e strategie. Definice 2. Sm´ıˇsen´a strategie i-t´eho hr´aˇce je vektor pravdˇepodobnostn´ıho rozdˇelen´ı σi = (pi1 , pi2 , ..., piN ) ˇcist´ ych strategi´ı, kde kaˇzd´a sloˇzka pij ud´av´a pravdˇepodobnost s jakou bude i-t´ y hr´aˇc hr´at strategii sj . Mnoˇziny vˇsech moˇzn´ ych sm´ıˇsen´ ych strategi´ı oznaˇc´ıme Σi . ˇ sen´ım hry je dvojice strategi´ı, kter´e by racion´aln´ı hr´aˇci pouˇzili. Tuto Reˇ dvojici budeme naz´ yvat rovnov´aha nebo rovnov´aˇzn´y stav hry a budeme ji zapisovat ve tvaru (s1 , s2 ). Speci´aln´ı typ rovnov´ahy je Nashova rovnov´aha, kde ani jeden z hr´aˇc˚ u nem˚ uˇze z´ıskat lepˇs´ı uˇzitek pouˇzit´ım jin´e strategie. Definice 3. Nashova rovnov´aha (pro dva hr´aˇce) je dvojice strategi´ı (σ1∗ ; σ2∗ ) takov´ ych, ˇze plat´ı π1 (σ1∗ ; σ2∗ ) ≥ π1 (σ1 ; σ2∗ )
∀σ1 ∈ Σ1 ,
(2.1)
π2 (σ1∗ ; σ2∗ ) ≥ π2 (σ1∗ ; σ2 )
∀σ2 ∈ Σ2 .
(2.2)
Pozn´amka 1. V pˇr´ıpadˇe, ˇze strategie σ1∗ a σ2∗ jsou ˇcist´e strategie, dostaneme ˇcistou Nashovu rovnov´ahu. Jinak budeme uvaˇzovat sm´ıˇsenou Nashovu rovnov´ahu. Pozn´amka 2. V pˇr´ıpadˇe, ˇze se v rovnici (2.1) nebo (2.2) vyskytne neostr´a nerovnost, kaˇzd´a mal´a zmˇena v hodnot´ach uˇzitk˚ u vytvoˇr´ı nov´e rovnov´ahy nebo vyruˇs´ı st´avaj´ıc´ı rovnov´ahy. Takov´e hˇre budeme ˇr´ıkat negenrick´a hra.
4
Z´akladn´ı pojmy teorie her
Sc´en´aˇre s nejednoznaˇcn´ymi rovnov´ahami
Nen´ı vylouˇcen´e, naopak je sp´ıˇs bˇeˇzn´e, ˇze hra m´a vˇetˇs´ı poˇcet rovnov´ah. Pro nalezen´ı ˇcist´ ych Nashov´ ych rovnov´ah m˚ uˇzeme vyuˇz´ıt ˇreˇsen´ı pomoc´ı dominovan´ ych strategi´ı, kter´e je uvedeno napˇr´ıklad ve Webb [1] a pro nalezen´ı vˇsech Nashov´ ych rovnov´ah (ˇcist´e i sm´ıˇsen´e) je opˇet ve Webb [1] pops´an koncept nejlepˇs´ı odpovˇedi. Probl´em existence Nashovy rovnov´ahy ve statick´ ych hr´ach ˇreˇs´ı n´asleduj´ıc´ı vˇeta, jej´ıˇz d˚ ukaz m˚ uˇze ˇcten´aˇr naj´ıt ve Fudenberg [2]. Vˇ eta 1 (Nashova vˇeta). Kaˇzd´a statick´a hra s koneˇcn´ym poˇctem hr´aˇc˚ u a koneˇcn´ym poˇctem strategi´ı m´a alespoˇ n jednu Nashovu rovnov´ahu. Dalˇs´ı probl´em je jednoznaˇcnost rovnov´ahy. Pro tuto ot´azku neexituje jednoduch´a odpovˇed’. Jsou pouze urˇcit´e postaˇcuj´ıc´ı podm´ınky, kter´e obs´ahnou jen malou mnoˇzinu her. Ale velk´a tˇr´ıda her m´a v´ıce neˇz jednu rovnov´ahu a zde nast´av´a pr´avˇe probl´em v´ ybˇeru optim´aln´ı rovnov´ahy. M˚ uˇzeme pouˇz´ıt v´ıce zp˚ usob˚ u pro v´ ybˇer rovnov´ahy. Nejjednoduˇsˇs´ı je v´ ybˇer dle tradice nebo spoleˇcensk´ ych konvenc´ı (Na silnici mohou jezdit vozidla obou smˇer˚ u vlevo nebo vpravo. Pokud budou jezdit oba vlevo, je to rovnov´aha, ale pokud budou jezdit oba vpravo, je to tak´e rovnov´aha. Potom z´aleˇz´ı napˇr´ıklad na zemi, ve kter´e se vozidla nach´az´ı, protoˇze ve Velk´e Brit´anii by byla optim´aln´ı rovˇ e Republice). Dalˇs´ı moˇznost´ı je pouˇzit´ı evoluˇcn´ı dynov´aha jin´a neˇz v Cesk´ namiky, kde hr´aˇci pˇredstavuj´ı populace jedinc˚ u (v´ıce napˇr. ve Webb [1]). Posledn´ım ˇreˇsen´ım je vyuˇzit´ı ˇcasov´an´ı tah˚ u, ˇc´ımˇz se budeme zab´ yvat ve zbytku pr´ace.
2.4
Sc´ en´ aˇ re s nejednoznaˇ cn´ ymi rovnov´ ahami
Uvaˇzujeme hru dvou hr´aˇc˚ u M a F. Kaˇzd´ y z hr´aˇc˚ u m´a na v´ ybˇer ze dvou strategi´ı, pro hr´aˇce M je to R a S a pro hr´aˇce F je to r a s. Uˇzitky jsou n´asleduj´ıc´ı:
F r R a,w M S c,y
5
s b,x d,z
Z´akladn´ı pojmy teorie her
Sc´en´aˇre s nejednoznaˇcn´ymi rovnov´ahami
Podle hodnot uˇzitk˚ u m˚ uˇzeme odliˇsit r˚ uzn´e sc´en´aˇre hry. Pro tuto pr´aci budou d˚ uleˇzit´e sc´en´aˇre, kter´e maj´ı v´ıce Nashov´ ych rovnov´ah a nast´av´a v nich konflikt. To znamen´a, ˇze kaˇzy ´ hr´aˇc preferuje jinou rovnov´ahu.
2.4.1
V´ alka pohlav´ı
Prvn´ım takov´ ym sc´en´aˇrem je V´alka pohlav´ı. Uˇzitky splˇ nuj´ı nerovnice a>d>b≥c pro hr´aˇce M a z>w>x≥y pro hr´aˇce F. Existuj´ı v nˇem dvˇe ˇcist´e Nashovy rovnov´ahy (R, r) a (S, s). Hr´aˇci se tedy chtˇej´ı zkoordinovat, ale kaˇzd´ y z nich preferuje jinou rovnov´ahu. Hr´aˇc M preferuje (R, r), zat´ımco hr´aˇc F d´av´a pˇrednost rovnov´aze (S, s). V tomto sc´en´aˇri pozorujeme oba probl´emy, jak koordinaˇcn´ı, tak konfliktn´ı. Pro pˇredstavu uvedeme z´akladn´ı pˇr´ıklad hry s t´ımto sc´en´aˇrem. Pˇr´ıklad 1. Hˇra´ˇc M je muˇz, hr´aˇc F je ˇzena. Pl´anuj´ı str´avit spoleˇcn´ y veˇcer a rozhoduj´ı se, kam p˚ ujdou. Oba maj´ı na v´ ybˇer stejn´e strategie: {Hokej, Opera}. Muˇz preferuje Hokej, ˇzena Operu. Uˇzitky mohou b´ yt napˇr´ıklad n´asleduj´ıc´ı: ˇ Zena Hokej Opera Hokej 2,1 0,0 Muˇz Opera 0,0 1,2
Z uˇzitk˚ u vypl´ yv´a, ˇze je d˚ uleˇzit´e, aby ˇsli spoleˇcnˇe (koordinaˇcn´ı probl´em). Hru vyˇreˇs´ıme pomoc´ı reakˇcn´ı funkce (podrobnˇeji ve Webb [1]). Reakˇcn´ı funkci sestroj´ıme tak, ˇze budeme pˇredpokl´adat sm´ıˇsen´e strategie σ1 = (p, 1 − p) hr´aˇce M a σ2 = (q, 1 − q) hr´aˇce F. Tento z´apis m˚ uˇzeme interpretovat tak, ˇze hr´aˇc M bude hr´at strategii Hokej s pravdˇepodobnost´ı p a strategii Opera s pravdˇepodobnost´ı (1 − p), obdobnˇe to plat´ı pro soupeˇre. Nyn´ı spoˇcteme 6
Z´akladn´ı pojmy teorie her
Sc´en´aˇre s nejednoznaˇcn´ymi rovnov´ahami
uˇzitek prvn´ıho hr´aˇce z tˇechto sm´ıˇsen´ ych strategi´ı v z´avislosti na hodnot´ach p a q.
π1 (σ1 , σ2 ) = 2pq + (1 − p)(1 − q) = 2pq + pq − p − q + 1 = 3pq − p − q + 1 = p(3q − 1) − q + 1
(2.3)
Provedeme diskusi posledn´ıho ˇra´dku rovnice (2.3). Kdyˇz bude q < 13 , nejlepˇs´ı reakc´ı bude hr´at p = 0. V pˇr´ıpadˇe, ˇze q > 13 , nejlepˇs´ı odezvou je zahr´at p = 1. Pokud bude q = 31 , na hodnotˇe p nez´aleˇz´ı, protoˇze v´ yraz (3q − 1) bude nulov´ y. Tuto funkci n´am zn´azorˇ nuje modr´a kˇrivka na Obr´azku 2.1. Stejn´ ym postupem spoˇcteme uˇzitek hr´aˇce F ze sm´ıˇsen´ ych strategi´ı (rovnice 2.4) a po proveden´ı diskuse z´ısk´ame ˇcervenou kˇrivku vyobrazenou na Obr´azku 2.1.
π2 (σ1 , σ2 ) = pq + 2(1 − p)(1 − q) = pq + 2pq − 2p − 2q + 2 = 3pq − 2q − 2p + 2 = q(3p − 2) − 2p + 2
(2.4)
V m´ıstˇe protnut´ı obou kˇrivek se nach´az´ı Nashova rovnov´aha. V tomto pˇr´ıkladu existuj´ı tˇri Nashovy rovnov´ahy: (0, 0), (1, 1) a ( 23 , 13 ). Prvn´ı dvˇe rovnov´ahy jsou ˇcist´e, protoˇze hr´aˇc vyb´ır´a pouze jednu strategii s pravdˇepodobnost´ı 1 a v tomto pˇr´ıkladu reprezentuj´ı (Hokej, Hokej) a (Opera, Opera). Posledn´ı rovnov´aha je sm´ıˇsen´a, kde prvn´ı hr´aˇc bude hr´at strategii Hokej s pravdˇepodobnost´ı p = 32 a strategii Opera s pravdˇepodobnost´ı (1 − p) = 13 . Pro druh´eho hr´aˇce plat´ı analogicky. D´ale se budeme zab´ yvat pouze ˇcist´ ymi Nashov´ ymi rovnov´ahami. T´ım m´ame vyˇreˇsen´ y koordinaˇcn´ı probl´em. Nast´av´a probl´em v´ ybˇeru optim´aln´ı rovnov´ahy (konflikt), kter´ y m˚ uˇzeme vyˇreˇsit pr´avˇe ˇcasov´an´ım, jak bude uvedeno v dalˇs´ıch kapitol´ach.
7
Z´akladn´ı pojmy teorie her
Sc´en´aˇre s nejednoznaˇcn´ymi rovnov´ahami
q 1
2 3
1 3
1 3
2 3
1
p
Obr´azek 2.1: Reakˇcn´ı funkce pro V´alku pohlav´ı
2.4.2
Jestˇ r´ abi a holubice
Druh´ y vyhovuj´ıc´ı sc´en´aˇr jsou Jestˇra´bi a holubice. Uˇzitky pro tento sc´en´aˇr mus´ı splˇ novat nerovnice b>c>d≥a pro hr´aˇce M a y>x>z≥w pro hr´aˇce F. V t´eto hˇre opˇet existuj´ı dvˇe ˇcist´e Nashovy rovnov´ahy (R, s) a (S, r). Z rovnov´ah je zˇrejm´e, ˇze hr´aˇci chtˇej´ı m´ıt rozd´ıln´e strategie a opˇet kaˇzd´ y preferuje jinou rovnov´ahu. Pro hr´aˇce M je uˇzitkovˇe v´ yhodnˇejˇs´ı rovnov´aha (R, s), zat´ımco pro hr´aˇce F je to rovnov´aha (S, r). Tento sc´en´aˇr obsahuje antikoordinaˇcn´ı probl´em i konflikt. Pˇr´ıklad 2. Oba hr´aˇci pˇredstavuj´ı ˇridiˇce, kteˇr´ı jedou proti sobˇe na silnici. Maj´ı na v´ ybˇer strategie {N evyhnout, V yhnout}. Hr´aˇc, kter´ y se vyhne je oznaˇcen jako ”chicken”(anglick´ y n´azev hry je Game of Chicken), tedy zbabˇelec. Nejlepˇs´ı uˇzitek dostane hr´aˇc v situaci, kdy se nevyhne, ale jeho soupeˇr ano. Nejhorˇs´ı uˇzitek maj´ı oba hr´aˇci, pokud se ani jeden nevyhne (auta do sebe nabouraj´ı). Hra m˚ uˇze vypadat napˇr´ıklad takto:
8
Z´akladn´ı pojmy teorie her
Sc´en´aˇre s nejednoznaˇcn´ymi rovnov´ahami
ˇ c2 Ridiˇ Nevyhnout Vyhnout Nevyhnout -10,-10 10,1 ˇ c1 Ridiˇ 1,10 0,0 Vyhnout
Pro nalezen´ı vˇsech rovnov´ah hry pouˇzijeme stejn´ y postup jako v pˇredchoz´ım pˇr´ıkladu. Budeme uvaˇzovat sm´ıˇsen´e strategie σ1 = (p, 1 − p) a σ2 = (q, 1 − q). Nalezneme uˇzitky hr´aˇce M pro tyto sm´ıˇsen´e strategie a sestroj´ıme reakˇcn´ı funkci, kter´a je zn´azornˇen´a modrou kˇrivkou na Obr´azku 2.2.
π1 (σ1 , σ2 ) = −10pq + 10p(1 − q) + (1 − p)q = −10pq + 10p − 10pq + q − pq = −21pq + 10p + q = p(−21q + 10) + q ˇ D´ale vypoˇcteme uˇzitky hr´aˇce F pro sm´ıˇsen´e strategie σ1 a σ2 . Cervenou kˇrivkou je vyznaˇcena reakˇcn´ı funkce hr´aˇce F.
π2 (σ1 , σ2 ) = −10pq + p(1 − q) + 10(1 − p)q = −10pq + p − pq + 10q − 10pq = −21pq + p + 10q = q(−21p + 10) + p Nashovy rovnov´ahy jsou opˇet pr˚ useˇc´ıky obou kˇrivek. Dvˇe ˇcist´e Nashovy rovnov´ahy (1, 0) a (0, 1) znamenaj´ı (N evyhnout, V yhnout), 10 10 , 21 ). Opˇet (V yhnout, N evyhnout). Sm´ıˇsen´a Nashova rovnov´aha je v bodˇe ( 21 zde nast´av´a konflikt, kter´ y m˚ uˇzeme vyˇreˇsit ˇcasov´an´ım.
2.4.3
Grafick´ e zn´ azornˇ en´ı uˇ zitk˚ u
Pro pˇredstavu m˚ uˇzeme hodnoty uˇzitk˚ u obou hr´aˇc˚ u ve v´ yˇse zm´ınˇen´ ych sc´en´aˇr´ıch vyj´adˇrit graficky. Hr´aˇc m´a ˇctyˇri uˇzitky, kaˇzd´ y jako v´ ysledek kombinace dvou strategi´ı. Dvˇema uˇzitk˚ um pˇriˇrad´ıme fixn´ı hodnotu a budeme zkoumat 9
Z´akladn´ı pojmy teorie her
Sc´en´aˇre s nejednoznaˇcn´ymi rovnov´ahami
q 1
10 21
10 21
1
p
Obr´azek 2.2: Reakˇcn´ı funkce pro Jestˇra´by a holubice
d 4
2
-4
-2
JH
VP
2
4
a
-2
-4
Obr´azek 2.3: Grafick´e zn´azornˇen´ı uˇzitk˚ u a a d hr´aˇce M pro oba sc´en´aˇre pˇri volbˇe b = 1 a c = 0
10
Z´akladn´ı pojmy teorie her
Sc´en´aˇre s nejednoznaˇcn´ymi rovnov´ahami x 4
2
JH
y -4
-2
VP
2
4
-2
-4
Obr´azek 2.4: Grafick´e zn´azornˇen´ı uˇzitk˚ u x a y hr´aˇce F pro oba sc´en´aˇre pˇri volbˇe z = 1 a w = 0
pˇr´ıpustn´e oblasti pro zbyl´e hodnoty uˇzitk˚ u. Grafy jsme rozdˇelili podle hr´aˇc˚ u na graf uˇzitk˚ u hr´aˇce M a graf uˇzitk˚ u hr´aˇce F. Na Obr´azku 2.3 jsou vyznaˇcen´e dvˇe oblasti. Oblast VP vymezuje moˇznou volbu uˇzitk˚ u a a d pro sc´en´aˇr V´alka pohlav´ı, za pˇredpokladu, ˇze zb´ yvaj´ıc´ı uˇzitky maj´ı zafixovan´e hodnoty, a to b = 1 a c = 0. Oblast JH zn´azornˇ nuje tak´e moˇznou volbu uˇzitk˚ u a a d pˇri stejnˇe zafixovan´ ych uˇzitc´ıch b a c, ale pro sc´en´aˇr Jestˇra´bi a holubice. Na dalˇs´ım Obr´azku 2.4 jsou vyznaˇcen´e moˇzn´e volby uˇzitk˚ u x a y, pokud w = 0 a z = 1. Oblast VP opˇet znaˇc´ı moˇznosti pro sc´en´aˇr V´alka pohlav´ı a JH pro sc´en´aˇr Jestˇr´abi a holubice.
11
3 Dynamick´e hry V t´eto kapitole pˇredstav´ıme tˇr´ıdu dynamick´ ych her. V tomto typu her nenast´avaj´ı tahy hr´aˇc˚ u souˇcasnˇe, ale postupnˇe. Hry jsou tedy minim´alnˇe dvoutahov´e (v prvn´ı tahu hraje jeden hr´aˇc, ve druh´em tahu hraje druh´ y hr´aˇc). Pokud by byla dynamick´a hra jednotahov´a, jednalo by se pouze o optimalizaci. Hlavn´ı odliˇsnost od statick´ ych her je fakt, ˇze hr´aˇc zn´a v´ ysledek pˇredchoz´ıho tahu a m´a moˇznost na nˇej reagovat.
3.1
Zobrazen´ı dynamick´ e hry
Dynamick´e hry se zobrazuj´ı v explicitn´ım tvaru pomoc´ı strom˚ u. Na Obr´azku 3.1 je zn´azornˇena hra V´alka pohlav´ı jako dynamick´a hra. V prvn´ım pˇr´ıpadˇe m´a moˇznost prvn´ıho tahu hr´aˇc M a vyb´ır´a opˇet ze dvou strategi´ı {R, S}. Aˇz po ukonˇcen´ı tahu prvn´ıho hr´aˇce zaˇc´ın´a tah druh´eho hr´aˇce, kter´ y uˇz zn´a v´ ysledek pˇredchoz´ıho tahu. Hr´aˇc F m´a na v´ ybˇer strategie {r,s}, ale nem˚ uˇze uˇz nijak ovlivnit tah prvn´ıho hr´aˇce. V druh´em pˇr´ıpadˇe prob´ıh´a hra stejn´ ym zp˚ usobem, pouze je vymˇenˇen´e poˇrad´ı hr´aˇc˚ u.
Obr´azek 3.1: Dynamick´a hra - V´alka pohlav´ı
12
ˇ sen´ı dynamick´e hry Reˇ
Dynamick´e hry
3.2
ˇ sen´ı dynamick´ Reˇ e hry
Pro nalezen´ı rovnov´ahy dynamick´e hry pouˇz´ıv´ame zpˇetnou indukci. Proch´az´ıme hru od konce a vyuˇz´ıv´ame znalost´ı o pˇredchoz´ıch taz´ıch. Pokud tuto metodu pouˇzijeme na hru z Obr´azku 3.1 (moˇznost, kde hr´aˇc M hraje jako prvn´ı), budeme postupovat n´asledovnˇe: Hr´aˇc F m´a v kaˇzd´e vˇetvi dvˇe moˇznosti, a to r nebo s. Pokud by hr´aˇc M zahr´al R, hr´aˇc F vybere tak´e r, protoˇze z t´eto strategie m´a lepˇs´ı uˇzitek, ve druh´e vˇetvi dopadne v´ ybˇer analogicky. Nyn´ı se pˇresuneme na tah hr´aˇce M. Hr´aˇc M uˇz v´ı, ˇze pokud zahraje R, F zahraje taky r a pokud zahraje S, hr´aˇc F zahraje taky s. Staˇc´ı pouze vybrat strategii, ze kter´e m´a lepˇc´ı uˇzitek, tedy R. T´ımto postupem dostaneme rovnov´ahu (R, r). Pro dynamick´e hry m˚ uˇzeme tak´e definovat Nashovu rovnov´ahu, kter´a vych´az´ı z konstrukce zpˇetn´e indukce. Nejprve ale potˇrebujeme zav´est pojem dynamick´a podhra. Definice 4. Dynamick´a podhra je podstrom, kter´ y mus´ı splˇ novat n´asleduj´ıc´ı podm´ınky: 1. Zaˇc´atek se nach´az´ı v libovoln´em uzlu stromu (vyjma koneˇcn´ ych uzl˚ u s uˇzitky). 2. Hr´aˇc zn´a vˇsechna rozhodnut´ı proveden´a do tohoto ˇcasu (ve kter´em se nach´az´ı poˇca´teˇcn´ı uzel). 3. Podhra obsahuje vˇsechny uzly, kter´e n´asleduj´ı poˇca´teˇcn´ı uzel. Definice 5. Nashova rovnov´aha vzhledem k podhr´am je rovnov´aha dynamick´e hry, kter´a je Nashovou rovnov´ahou v kaˇzd´e podhˇre t´eto dynamick´e hry. Probl´em existence takov´e rovnov´ahy je vyˇreˇsen n´asleduj´ıc´ı vˇetou, jej´ıˇz d˚ ukaz je uveden ve Webb [1]. Vˇ eta 2. Kaˇzd´a koneˇcn´a dynamick´a hra m´a alespoˇ n jednu Nashovu rovnov´ahu vzhledem k podhr´am. Ot´azka jednoznaˇcnosti rovnov´ahy je u dynmaick´ ych her snaˇzˇs´ı neˇz u statick´ ych her. 13
Dynamick´e hry
V´yhoda poˇrad´ı
Vˇ eta 3. Pokud je hra generick´a, tj. nenast´av´a rovnost uˇzitk˚ u, pak existuje pr´avˇe jedna Nashova rovnov´aha vzhledem k podhr´am. D˚ ukaz. Vypl´ yv´a z konstrukce zpˇetn´e indukce.
3.3
V´ yhoda poˇ rad´ı
Z Vˇety 3 vypl´ yv´a, ˇze dynamick´a verze hry V´alka pohlav´ı m´a pr´avˇe jednu Nashovu rovnov´ahu vzhledem k podhr´am, stejnˇe jako dynamick´a verze hry Jestˇr´abi a holubice. Pro nalezen´ı jednoznaˇcn´e rovnov´ahy tˇechto statick´ ych her je staˇc´ı pouze pˇrev´est na dynamickou hru. Je zˇrejm´e (kv˚ uli jednoznaˇcnosti rovnov´ahy), ˇze v´ ysledn´a rovnov´aha je v´ yhodnˇejˇs´ı pouze pro jednoho hr´aˇce. Zavedeme pojem v´ yhra hr´aˇce. Definice 6. Budeme ˇr´ıkat, ˇze hr´aˇc, jehoˇz preferovan´a rovnov´aha je Nashova rovn´aha vzhledem k podhr´am, vyhr´al. N´asleduj´ıc´ı vˇety uv´adˇej´ı podm´ınky v´ yhry hr´aˇc˚ u. Lemma 1. Uvaˇzujeme sc´en´aˇr V´alka pohlav´ı. Hru vyhraje hr´aˇc, kter´y m´a moˇznost prvn´ıho tahu. D˚ ukaz. D˚ ukaz provedeme tak, ˇze vyˇreˇs´ıme hru zpˇetnou indukc´ı pro obˇe dvˇe varianty zaˇc´ınaj´ıc´ıho hr´aˇce. T´ım bude vˇeta dok´azan´a pro oba dva hr´aˇce, protoˇze uk´aˇzeme, ˇze hr´aˇc M vyhraje, kdyˇz bude zaˇc´ınat a z´aroveˇ n nevyhraje, kdyˇz bude zaˇc´ınat hr´aˇc F. Varianta hry, kde zaˇc´ın´a hr´aˇc M je uˇz vyˇreˇsen´a v kapitole 3.2. Nashova rovnov´aha je v tomto pˇr´ıpadˇe (R, r), coˇz je v´ ysledek preferovan´ y hr´aˇcem M. Pokud zaˇc´ın´a hru hr´aˇc F, zpˇetn´a indukce bude vypadat takto: Hr´aˇc M vyb´ır´a lepˇs´ı strategii v obou vˇetv´ıch. Ve vˇetvi stromu, kde v´ı, ˇze F zahr´al strategii r vybere strategii R, ve druh´e vˇetvi vybere S. Hr´aˇc F v´ı, jak´e strategie bude hr´at M v z´avislosti na jeho volbˇe, vybere tedy v´ yhodnˇejˇs´ı strategii, kterou je S. Nashova rovnov´aha he tedy (s, S), v´ ysledek preferovan´ y hr´aˇcem F. (V rovnov´aze u dynamick´ ych her p´ıˇseme nejprve strategii zaˇc´ınaj´ıc´ıho hr´aˇce, z toho d˚ uvodu jsou strategie v opaˇcn´em poˇrad´ı.) Lemma 2. Uvaˇzujeme sc´en´aˇr Jestˇr´abi a holubice. Hru vyhraje hr´aˇc, kter´y m´a moˇznost prvn´ıho tahu.
14
Dynamick´e hry
V´yhoda poˇrad´ı
D˚ ukaz. D˚ ukaz provedeme stejnˇe jako u pˇredchoz´ı vˇety. Zpˇetn´a indukce pro pˇr´ıpad, kdy zaˇc´ın´a hr´aˇc M: Hr´aˇc F vyb´ır´a lepˇs´ı strategii v obou vˇetv´ıch stromu. Ve vˇetvi, kde v´ı, ˇze hr´aˇc M zahr´al strategii R, zahraje strategii s, ve druh´e vˇetvi vybere strategii r. Hr´aˇc M zn´a strategie, kter´e bude hr´at hr´aˇc F v z´avislosti na jeho volbˇe v prvn´ım kole. Vybere tedy v´ yhodnˇejˇs´ı strategii R a vznikne Nashova rovnov´aha (R, s). Zpˇetn´a indukce pro hru, kdyˇz zaˇc´ın´a hr´aˇc F: Hr´aˇc M opˇet vybere nejv´ yhodnˇejˇs´ı strategii v obou vˇetv´ıch. Ve vˇetvi, kde hr´aˇc F vybral r, vybere S, ve druh´e vˇetvi zvol´ı R. Hr´aˇc F zn´a reakce hr´aˇce M, vybere tedy v´ yhodnˇejˇs´ı strategii r a vznikne Nashova rovnov´aha (r, S). Kaˇzd´a rovnov´aha je opˇet preferovan´ y v´ ysledek zaˇc´ınaj´ıc´ıho hr´aˇce. Hr´aˇc, kter´ y m´a v´ yhodu prvn´ıho tahu se naz´ yv´a Stackelberg˚ uv leader. Probl´em nejednoznaˇcnosti rovnov´ahy ve statick´e hˇre je moˇzn´e vyˇreˇsit pˇreveden´ım na dynamickou hru. Preferovanou rovnov´ahu potom z´ısk´a hr´aˇc, kter´ y m´a moˇznost prvn´ıho tahu, tedy Stackelberg˚ uv leader.
15
4 Dynamick´e hry s n´ahodn´ym ˇ casov´ an´ım tah˚ u Tato kapitola popisuje tak´e dynamick´e hry, ale se speci´aln´ım ˇcasov´an´ım tah˚ u. Budeme uvaˇzovat ˇcasov´an´ı n´ahodn´e, zadan´e nˇejak´ ym pravdˇepodobnostn´ım rozdˇelen´ım. Tato myˇslenka m´a sv´e koˇreny pˇredevˇs´ım v ˇcl´anc´ıch Libich a Stehl´ık [3], Cho a Matsui [4], Lagunoff a Matsui [5] a Kamada a Kandori [6]. Ve ˇcl´anku Libich a Stehl´ık [3] autoˇri uvaˇzovali n´ahodn´e ˇcasov´an´ı tah˚ u pouze pro jednoho hr´aˇce. Druh´ y hr´aˇc mˇel moˇznost pouze simult´ann´ıho tahu. V t´eto kapitole se budeme zab´ yvat situac´ı, kde se n´ahodn´e ˇcasov´an´ı tah˚ u t´ yk´a obou hr´aˇc˚ u, ale pravdˇepodobnostn´ı rozdˇelen´ı tohoto ˇcasov´an´ı tah˚ u jednotliv´ ych hr´aˇc˚ u se navz´ajem nepˇrekr´ yv´a.
4.1
Popis hry
Hra prob´ıh´a v ˇcasov´em intervalu od 0 do 1. V ˇcase 0 zahraj´ı oba hr´aˇci simult´ann´ı tah, tedy ani jeden nev´ı, jakou strategii zahr´al soupeˇr. D´ale pˇredpokl´ad´ame, ˇze hr´aˇc M m´a moˇznost opakov´an´ı tah˚ u v ˇcasov´em intervalu [0, K], kde 0 < K < 1. Hr´aˇc F m´a moˇznost opakov´an´ı tah˚ u v ˇcasov´em intervalu [L, 1], kde K ≤ L < 1. Definice 7. Tahy, kter´e n´asleduj´ı po simult´ann´ım tahu, budeme naz´ yvat revize. Prvn´ı provedenou revizi kaˇzd´eho hr´aˇce oznaˇc´ıme jako Revize (s velk´ ym p´ısmenem). Pro oba hr´aˇce je d˚ uleˇzit´a pouze prvn´ı Revize. T´ımto tahem mohou poprv´e reagovat na simult´ann´ı tah (v pˇr´ıpadˇe prvn´ıho hr´aˇce) nebo reagovat na Revizi prvn´ıho hr´aˇce (v pˇr´ıpadˇe druh´eho hr´aˇce). Vˇsechny ostatn´ı revize jsou zanedbateln´e, protoˇze jsou prov´adˇeny za stejn´ ych podm´ınek jako Revize a nemaj´ı uˇz ˇza´dn´ y vliv na pr˚ ubˇeh hry.
4.2
ˇ Casov´ an´ı reviz´ı
Hr´aˇci maj´ı moˇznost reviz´ı omezenou na urˇcit´ y podinterval ([0, K] pro hr´aˇce M a [L, 1] pro hr´aˇce F) celkov´eho hern´ıho ˇcasu [0,1] a z´aroveˇ n je ˇcasov´an´ı reviz´ı 16
ˇ Casov´ an´ı reviz´ı
Dynamick´e hry s n´ahodn´ym ˇcasov´an´ım tah˚ u CDF 1 0.3
1
à H1-MHtLLdt
à H1-FHtLLdt
0
0.6
MHtL
0.1
FHtL
0.3
à MHtLdt
à FHtLdt
0
0.6
0.2
1
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
t
Obr´azek 4.1: Revizn´ı funkce
urˇceno pravdˇepodobnostn´ım rozdˇelen´ım na tomto podintervalu. Definice 8. Pravdˇepodobnostn´ı rozdˇelen´ı n´ahodn´eho ˇcasov´an´ı reviz´ı je pops´ano pravdˇepodobnostn´ı funkc´ı nebo funkc´ı hustoty dan´eho pravdˇepodobnostn´ıho rozdˇelen´ı. Pro hr´aˇce M oznaˇc´ıme funkci m(t), pro hr´aˇce F ji oznaˇc´ıme f(t). Pro u ´ˇcely naˇs´ı pr´ace bude d˚ uleˇzitˇejˇs´ı distribuˇcn´ı funkce tohoto pravdˇepodobnostn´ıho rozdˇelen´ı. Definice 9. Distribuˇcn´ı funkce pravdˇepodobnostn´ıho rozdˇelen´ı M (t) : [0, 1] → [0, 1], M (0) = 0, M (K) = 1, F (t) : [0, 1] → [0, 1], F (L) = 0, F (1) = 1, nazveme Revizn´ı funkce. Pˇr´ıklady Revizn´ıch funkc´ı m´ame na Obr´azku 4.1. Rozdˇelen´ı n´ahodn´ ych tah˚ u je pro jednoduchost rovnomˇern´e a hodnoty parametr˚ u jsouR K = 0, 3 K a L = 0, 6. Plochy pod funkcemi M (t) a F (t) jsou urˇceny integr´aly 0 M (t)dt 17
Dynamick´e hry s n´ahodn´ym ˇcasov´an´ım tah˚ u
V´ybˇer optim´aln´ı rovnov´ahy
R1 a L F (t)dt. Tyto plochy ud´avaj´ı rychlost reakc´ı hr´aˇc˚ u, zat´ımco integr´aly RK R1 (1 − M (t))dt a L (1 − F (t))dt, tedy plochy nad funkcemi M (t) a F (t), 0 ud´avaj´ı rigiditu hr´aˇc˚ u (vˇernost p˚ uvodn´ımu rozhodnut´ı). Z Obr´azku 4.1 je zˇrejm´e, ˇze pro hr´aˇce M bude platit Z
K
K
Z (1 − M (t))dt +
K= 0
M (t)dt 0
a pro hr´aˇce F bude platit Z
1
Z
L
4.3
1
(1 − F (t))dt +
1−L=
F (t)dt. L
V´ ybˇ er optim´ aln´ı rovnov´ ahy
Zkoum´ame takov´ yto typ hry pro dva uveden´e sc´en´aˇre: V´alka pohlav´ı a Jestˇra´bi a holubice. V tˇechto hr´ach ve statick´e formˇe existuj´ı dvˇe ˇcist´e Nashovy rovnov´ahy, ale doch´az´ı ke stˇretu z´ajm˚ u hr´aˇc˚ u. Kaˇzd´ y hr´aˇc preferuje jinou rovnov´ahu. Stejnˇe jako klasickou dynamickou hrou, m˚ uˇzeme i t´ımto zp˚ usobem vyˇreˇsit probl´em v´ ybˇeru optim´aln´ı rovnov´ahy. Nejprve definujeme pojem v´ yhra. Definice 10. Pokud hr´aˇcova preferovan´a rovnov´aha bude Nashovou rovnov´ahou v cel´em pr˚ ubˇehu hry, potom ˇrekneme, ˇze hr´aˇc vyhr´av´a hru. N´asleduj´ıc´ı vˇety ud´avaj´ı podm´ınky v´ yhry hr´aˇce M pro oba zm´ınˇen´e sc´en´aˇre. Postup nalezen´ı tˇechto podm´ınek bude demonstrov´an v d˚ ukazu. Vˇ eta 4. Uvaˇzujeme sc´en´aˇr V´alka pohlav´ı. Hr´aˇc M vyhraje hru (tj. rovnov´aha (R, r) bude Nashova rovnov´aha v cel´em pr˚ ubˇehu hry), pokud budou splnˇen´e podm´ınky RK R1 M (t)dt + L (1 − F (t))dt + (L − K) a−d 0 < , (4.1) R1 d−b F (t)dt L
RK 0
R1 M (t)dt + L (1 − F (t))dt + (L − K) z−y . > RK w−x (1 − M (t))dt 0 18
(4.2)
Dynamick´e hry s n´ahodn´ym ˇcasov´an´ım tah˚ u
V´ybˇer optim´aln´ı rovnov´ahy
1 Pozn´amka 3. Levou stranu nerovnice (4.1) oznaˇc´ıme UM , pravou stranu VV1P . 2 Lev´a strana nerovnice (4.2) bude m´ıt oznaˇcen´ı UM a prav´a strana VV2P .
D˚ ukaz. Pˇri d˚ ukazu Vˇety 4 budeme postupovat od konce hry, tzv. zpˇetnou indukc´ı. Pro v´ yhru hr´aˇce M, je nutn´e, aby oba hr´aˇci ve vˇsech sv´ ych taz´ıch volili strategie R (v pˇr´ıpadˇe hr´aˇce M) a r (v pˇr´ıpadˇe hr´aˇce F). Zaˇcneme tedy Reviz´ı hr´aˇce F. Tento tah je hr´aˇc˚ uv posledn´ı, coˇz znamen´a, ˇze mus´ı volit strategii, ze kter´e mu plyne nejvˇetˇs´ı uˇzitek. Tento uˇ Rz1itek pak pro nˇej pˇretrv´av´a pouze do konce hry, tedy ˇcas dan´ y v´ yrazem L F (t)dt. Mohou nastat dvˇe situace v z´avislosti na strategii, kterou zvol´ı hr´aˇc M ve sv´e Revizi: (I) Hr´aˇc M zvol´ı v Revizi strategii R. (II) Hr´aˇc M zvol´ı v Revizi strategii S. V prvn´ım pˇr´ıpadˇe (I) je pro hr´aˇce F nejlepˇs´ı reakce strategie r a v druh´em pˇr´ıpadˇe (II) strategie s. Z obou tˇechto voleb m´a nejvˇetˇs´ı moˇzn´ y uˇzitek. V´ıme tedy, ˇze hr´aˇc F se svoj´ı Reviz´ı pˇrizp˚ usob´ı Revizi hr´aˇce M. Nyn´ı nalezneme podm´ınku pro Revizi hr´aˇce M. Potˇrebujeme, aby hr´aˇc M volil ve sv´e Revizi strategii R. Opˇet m˚ uˇzeme rozdˇelit na dva pˇr´ıpady v z´avislosti na simult´ann´ım tahu hr´aˇce F: (I) Hr´aˇc F zvol´ı v simult´ann´ım tahu strategii r. (II) Hr´aˇc F zvol´ı v simult´ann´ım tahu strategii s. Pokud nastane situace (I), nejlepˇs´ı reakce hr´aˇce M je zahr´at strategii R a to z toho d˚ uvodu, ˇze F v Revizi zahraje tak´e r. T´ım je zajiˇstˇeno, ˇze hr´aˇc M bude m´ıt aˇz do konce hry uˇzitek a, kter´ y je podle nerovnice (2.4.1) z kapitoly 2.4.1 vˇzdy vˇetˇs´ı neˇz jak´ ykoliv jin´ y. V pˇr´ıpadˇe ˇze nastane situace (II), mus´ı b´ yt splnˇena n´asleduj´ıc´ı nerovnice, aby se hr´aˇci M vyplatilo zahr´at strategii R, tj. celkov´ y souˇcet uˇzitk˚ u, kter´e hr´aˇc m´a ze strategie R, n´asoben´ ych ˇcasem, ve kter´em pˇretrv´avaj´ı, mus´ı b´ yt vˇetˇs´ı, neˇz celkov´ y souˇcet uˇzitk˚ u n´asoben´ ych ˇcasem, ve kter´em pˇretrv´avaj´ı, jeˇz hr´aˇci plynou ze strategie S.
K
Z
1
Z M (t)dt + b(L − K) + b
b 0
Z
(1 − F (t))dt + a L
K
Z
0
F (t)dt > L
1
M (t)dt + d(L − K) + d
d
1
Z Z (1 − F (t))dt + d
L
F (t)dt L
19
(4.3)
1
Dynamick´e hry s n´ahodn´ym ˇcasov´an´ım tah˚ u
V´ybˇer optim´aln´ı rovnov´ahy
Jednotliv´e ˇcleny nerovnice (4.3) znamenaj´ı vˇzdy nˇejak´ y ˇcasov´ yu ´sek hry. InRK tegr´al 0 M (t)dt ud´av´a ˇcas po Revizi hr´aˇce M, L − K je doba od ˇcasu K do R1 ˇcasu L, L (1 − F (t))dt je doba od ˇcasu L do ˇcasu, kdy hr´aˇc F provede Revizi. R1 Nakonec intergr´al L F (t)dt ud´av´a ˇcas po Revizi hr´aˇce F. V tˇechto ˇcasech potom pˇretrv´avaj´ı uˇzitky ze zvolen´ ych strategi´ı obou hr´aˇc˚ u. Napˇr´ıklad v ˇcase RK M (t)dt pˇretrv´av´a pro hr´aˇce M uˇzitek b, kter´ y odpov´ıd´a tomu, ˇze hr´aˇc F 0 zvolil v simult´ann´ım tahu strategii s a hr´aˇc M zahr´al v Revizi strategii R. Nerovnici (4.3) m˚ uˇzeme d´ale upravit.
Z (b − d)
K
Z
1
M (t)dt + (L − K) + 0
(1 − F (t))dt
Z
1
> (d − a)
L
F (t)dt L
(4.4) R1 Vydˇel´ıme nerovnici (4.4) ˇcleny L F (t)dt a (b−d). Protoˇze (b−d) je z´aporn´ y, mus´ıme z´aroveˇ n zamˇenit znam´enko nerovnosti. RK 0
M (t)dt +
R1
(1 − F (t))dt + (L − K) d−a < R1 b−d F (t)dt L
L
(4.5)
Pokud uˇz jen rozˇs´ıˇr´ıme zlomek na prav´e stranˇe nerovice (4.5) hodnotou −1, dost´av´ame tvar (4.1) uveden´ y v dokazovan´e vˇetˇe, kter´ y je n´azornˇejˇs´ı, protoˇze na jedn´e stranˇe obsahuje pouze hodnoty z´avisl´e na parametrech K a L a na stranˇe druh´e zase jen hodnoty uˇzitk˚ u a, b a d. Nakonec mus´ıme zajistit, aby oba hr´aˇci volili v simult´ann´ım tahu strategii R, popˇr´ıpadˇe r. Nejprve vyˇsetˇr´ıme simult´ann´ı tah hr´aˇce F. Znovu se n´am tato situace rozpadne na dvˇe ˇca´sti: (I) Hr´aˇc M zvol´ı v simult´ann´ım tahu strategii R. (II) Hr´aˇc M zvol´ı v simult´ann´ım tahu strategii S. V prvn´ım pˇr´ıpadˇe (I) je pro hr´aˇce F vˇzdy nejlepˇs´ı zvolit strategii r, nebot’ z´ısk´a po celou dobu do sv´e Revize uˇzitek w, kter´ y je dle nerovnic (2.4.1) vˇetˇs´ı neˇz x. Pokud nastane situace (II), mus´ı b´ yt splnˇena n´asleduj´ıc´ı nerovnice, aby hr´aˇc F zahr´al strategii r. 20
Dynamick´e hry s n´ahodn´ym ˇcasov´an´ım tah˚ u
Z
K
Z
K
V´ybˇer optim´aln´ı rovnov´ahy
Z
M (t)dt + w(L − K) + w 0 0 Z K Z Z K (1 − M (t))dt + x M (t)dt + x(L − K) + x z
1
(1 − M (t))dt + w
y
0
0
(1 − F (t))dt > L 1
(1 − F (t))dt
L
(4.6) R1 ˇ po Revizi hr´aˇce F dan´ Cas y integr´alem L F (t)dt uˇz neuvaˇzujeme, protoˇze ˇclen obsahuj´ıc´ı tento integr´al by byl na obou stran´ach nerovnice (4.6) stejn´ y. Tuto nerovnici (4.6) m˚ uˇzeme stejn´ ymi algebraick´ ymi u ´pravami dostat do poˇzadovan´eho tvaru (4.2), kter´ y je uveden´ y v dokazovan´e vˇetˇe. Stejn´ ym zp˚ usobem zjist´ıme podm´ınku pro to, aby hr´aˇc M volil v simult´ann´ım tahu strategii R. Tentokr´aRt n´as bude ale zaj´ımat jen ˇcas do Revize hr´aˇce M, K kter´ y je dan´ y integr´alem 0 (1 − M ((t))dt. Pokud budeme pˇredpokl´adat, ˇze hr´aˇc F v simult´ann´ım tahu zahraje strategii r, staˇc´ı pouze porovnat jak´ y bude m´ıt ve zm´ınˇen´em ˇcase hr´aˇc M uˇzitek ze zvolen´ı strategie R, coˇz je uˇzitek a, a ze zvolen´ı strategie S, coˇz je uˇzitek c. Dle nerovnic (2.4.1) je zˇrejm´e, ˇze a > c, hr´aˇc M tedy bude volit strategii R v simult´ann´ım tahu pokud bude splnˇen´a podm´ınka pro simult´ann´ı tah hr´aˇce F oznaˇcen´a (4.2).
Vˇ eta 5. Uvaˇzujeme sc´en´aˇr Jestˇr´abi a holubice. Hr´aˇc M vyhraje hru (tj. rovnov´aha (R, s) bude Nashova rovnov´aha v cel´em pr˚ ubˇehu hry), pokud budou splnˇen´e podm´ınky RK R1 M (t)dt + (1 − F (t))dt + (L − K) b−c 0 L < , (4.7) R1 c−a F (t)dt L
RK 0
R1 M (t)dt + L (1 − F (t))dt + (L − K) y−z > . RK x−w (1 − M (t))dt 0
(4.8)
1 1 Pozn´amka 4. Levou stranu nerovnice (4.7) oznaˇc´ıme UM , pravou stranu VJH . 2 2 Lev´a strana nerovnice (4.8) bude m´ıt oznaˇcen´ı UM a prav´a strana VJH .
D˚ ukaz. D˚ ukaz bude proveden´ y stejn´ ym zp˚ usobem jako pro Vˇetu 4.
21
Dynamick´e hry s n´ahodn´ym ˇcasov´an´ım tah˚ u
4.3.1
V´ybˇer optim´aln´ı rovnov´ahy
Jin´ y zp˚ usob vyj´ adˇ ren´ı podm´ınky v´ yhry
V nˇekter´ ych pˇr´ıpadech mohou b´ yt Revizn´ı funkce sloˇzit´e, tˇeˇzko integrovateln´e nebo je nezn´ame pˇresnˇe. Z toho d˚ uvodu jsme naˇsli jin´ y ekvivalentn´ı tvar podm´ınky v´ yhry hr´aˇce M, kter´ y vyuˇz´ıv´a pouze znalosti parametr˚ u K a L a stˇredn´ıch hodnot pravdˇepodobnostn´ıch rozdˇelen´ı n´ahodn´eho ˇcasov´an´ı tah˚ u. N´asleduj´ıc´ı lemma je bˇeˇznˇe zn´am´ y statistick´ y v´ ysledek, vysvˇetlen´ y napˇr´ıklad v Kallenberg [7], z toho d˚ uvodu je zde uv´adˇena bez d˚ ukazu. Lemma 3. Uvaˇzujeme funkci M (t) z Definice 9. Potom plat´ı Z
K
(1 − M (t))dt = µM .
(4.9)
0
Stejnˇe tak uvaˇzujeme funkci F (t) z Definice 9. Potom plat´ı Z 1 (1 − F (t))dt = µF − L.
(4.10)
L
Vˇ eta 6. Pˇredpokl´adejme, ˇze µM a µF jsou stˇredn´ı hodnoty pravdˇepodobnostn´ıch rozdˇelen´ı n´ahodn´eho ˇcasov´an´ı tah˚ u hr´aˇc˚ u M a F. Potom budou podm´ınky v´yhry hr´aˇce M ve tvaru µF − µM < Vi1 1 − µF
i = {V P, JH},
(4.11)
µF − µM > Vi2 µM
i = {V P, JH}.
(4.12)
1 2 D˚ ukaz. Abychom mohli aplikovat pˇredchoz´ı Lemma 3 na v´ yraz UM a UM , je RK R1 nutn´e upravit integr´aly 0 M (t)dt a L F (t)dt pouˇzit´ım vzorc˚ u pro linearitu a aditivitu urˇcit´ ych integr´al˚ u.
Z
K
K
Z
(M (t) + 1 − 1)dt =
M (t)dt = 0
1
1
Z
L
Z
1
1dt − L
22
0
1
(F (t) + 1 − 1)dt =
F (t)dt = L
(1 − M (t))dt,
0
Z
K
Z 1dt −
0
Z
K
Z
(1 − F (t))dt. L
Dynamick´e hry s n´ahodn´ym ˇcasov´an´ım tah˚ u
V´ybˇer optim´aln´ı rovnov´ahy
Uˇzit´ım Lemmatu 3 dost´av´ame Z K M (t)dt = K − µM , 0
Z
1
F (t)dt = 1 − µF . L
Po dosazen´ı za integr´aly do podm´ınek v´ yhry hr´aˇce M m´ame
K − µM + µF − L + L − K µF − µM = < Vi1 1 − µF 1 − µF
i = {V P, JH},
µF − µM K − µM + µF − L + l − K = > Vi2 µM µM
i = {V P, JH},
coˇz jsou pˇresnˇe dokazovan´e nerovnice (4.11) a (4.12).
4.3.2
V´ ymˇ ena poˇ rad´ı hr´ aˇ c˚ u
Doposud jsme pˇredpokl´adali, ˇze hr´aˇc M m´a moˇznost opakovat tah dˇr´ıve neˇz hr´aˇc F. Nyn´ı budeme pˇredpokl´adat opaˇcn´e poˇrad´ı hr´aˇc˚ u. Pozn´amka 5. M˚ uˇzeme tak´e uvaˇzovat, ˇze hr´aˇc F bude m´ıt moˇznost prov´est Revizi jako prvn´ı. Revizn´ı funkce jsou v tomto pˇr´ıpadˇe F (t) : [0, 1] → [0, 1], F (0) = 0, F (K) = 1, M (t) : [0, 1] → [0, 1], M (L) = 0, M (1) = 1. Podm´ınky v´ yhry hr´aˇce F jsou ve stejn´em tvaru, pouze jsou pouˇzity pˇr´ısluˇsn´e Revizn´ı funkce a uˇzitky. Hr´aˇc F vyhraje, tj. jeho preferovan´a rovnov´aha bude Nashovou rovnov´ahou v cel´em pr˚ ubˇehu hry, pokud bude splnˇeno, ˇze
RK 0
R1 F (t)dt + (L − K) + L (1 − M (t))dt < Wi1 R1 M (t)dt L 23
i = {V P, JH}, (4.13)
Dynamick´e hry s n´ahodn´ym ˇcasov´an´ım tah˚ u
RK 0
R1 F (t)dt + (L − K) + L (1 − M (t))dt > Wi2 RK (1 − F (t))dt 0
V´ybˇer optim´aln´ı rovnov´ahy
i = {V P, JH}. (4.14)
Levou stranu nerovnice (4.13) oznaˇc´ıme jako UF1 a levou stranu nerovnice (4.14) jako UF2 . Podm´ınku v´ yhry m˚ uˇzeme vyj´adˇrit i ve tvaru s vyuˇzit´ım stˇredn´ıch hodnot pravdˇepodobnostn´ıch rozdˇelen´ı n´ahodn´eho ˇcasov´an´ı tah˚ u. µM − µF < Wi1 1 − µM µM − µF > Wi2 µF
i = {V P, JH}, i = {V P, JH}.
Pro sc´en´aˇr V´alka pohlav´ı je WV1 P =
z−w , w−x
WV2 P =
a−c . d−b
2 WJH =
b−d . c−a
Pro sc´en´aˇr Jestˇra´bi a holubice je
1 WJH =
y−x , x−w
24
5 Pˇr´ıklady, z´avislosti na parametrech a uˇ zitc´ıch V t´eto kapitole uvedeme pˇr´ıklady pro ilustraci v´ yˇse uveden´ ych Vˇet 4 a 6, kter´e ud´avaj´ı podm´ınku v´ yhry hr´aˇce M ve sc´en´aˇr´ıch V´alka pohlav´ı a Jestˇr´abi a holubice. D´ale prozkoum´ame, jak jsou tyto podm´ınky v´ yher z´avisl´e na zmˇen´ach parametr˚ u (K, L) a uˇzitk˚ u (a, b, c, d, w, x, y, z).
5.1
Ilustraˇ cn´ı pˇ r´ıklady
Uvedeme zde dva pˇr´ıklady. V prvn´ım pˇr´ıkladu vyuˇzijeme pro v´ ypoˇcet Vˇetu 4, ve druh´em pouˇzijeme zjednoduˇsˇsen´e tvary tˇechto podm´ınek z Vˇety 6. Pˇr´ıklad 3. Uvaˇzujeme sc´en´aˇr V´alka pohlav´ı a uˇzitky zvol´ıme n´asledovnˇe: F a A 2,1 M B 0,0
b 0,0 1,2
Parametry K a L zvol´ıme tak, ˇze K = L = 0, 5. Revizn´ı funkce jsou distribuˇcn´ı funkce rovnomˇern´eho rozdˇelen´ı zn´azornˇen´e na Obr´azku 5.1: 0 kdyˇz t ≤ 0 2t kdyˇz t ∈ (0; 0, 5) , M (t) = 1 kdyˇz t ≥ 0, 5 kdyˇz t ≤ 0, 5 0 2t − 1 kdyˇz t ∈ (0, 5; 1) . F (t) = 1 kdyˇz t ≥ 1 Aby hr´aˇc M vyhr´al, mus´ı b´ yt splnˇen´e obˇe dvˇe podm´ınky, (4.1) i (4.2), kter´e 1 2 ud´av´a Vˇeta 4. Vypoˇcteme tedy hodnoty v´ yraz˚ u UM , UM , VV1P a VV2P a porovn´ame. 25
Pˇr´ıklady, z´avislosti na parametrech a uˇzitc´ıch
Ilustraˇcn´ı pˇr´ıklady
CDF 1 0.5
1
à H1-MHtLLdt
à H1-FHtLLdt
0
0.5
MHtL
0.1
FHtL
0.5
à MHtLdt
à FHtLdt
0
0.5
0.2
0.3
1
0.4
0.5
0.6
0.7
0.8
0.9
1
t
Obr´azek 5.1: Revizn´ı funkce pouˇzit´e v pˇr´ıkladu 3
RK 1 UM
=
0
M (t)dt +
R1
(1 − F (t))dt + (L − K) 0, 25 + 0, 25 + 0 = =2 R1 0, 25 F (t)dt L
L
VV P =
2−1 a−d = =1 d−b 1−0
1 V tomto pˇr´ıpadˇe je UM > VV1P , tud´ıˇz nen´ı splnˇen´a uˇz prvn´ı podm´ınka v´ yhry (4.1) z Vˇety 4, kter´a zajiˇst’uje, aby hr´aˇc M ve sv´e Revizi zvolil strategii R. Hr´aˇc M nevyhr´av´a tuto hru.
Obdobn´ y pˇr´ıklad m˚ uˇzeme uk´azat tak´e pro druh´ y zpracov´avan´ y sc´en´aˇr. Pˇr´ıklad 4. Uvaˇzujeme sc´en´aˇr Jestˇr´abi a holubice a uˇzitky zvol´ıme n´asledovnˇe: F a A 0,0 M B 1,5
26
b 5,1 0,0
Pˇr´ıklady, z´avislosti na parametrech a uˇzitc´ıch
Ilustraˇcn´ı pˇr´ıklady
Zvol´ıme K = 0, 4 a L = 0, 6. Revizn´ı funkce v tomto pˇr´ıpadˇe nezn´ame. Zn´ame pouze stˇredn´ı hodnoty pravdˇepodobnostn´ıch rozdˇelen´ı Reviz´ı, a to µM = 0, 1 a µF = 0, 7. 1 1 Vypoˇcteme zjednoduˇsˇsen´e UM a VJH a zjist´ıme, zda je splnˇen´a podm´ınka (4.11), kterou ud´av´a Vˇeta 6.
1 UM =
0, 7 − 0, 1 µF − µM = =2 1 − µF 1 − 0, 7
1 VJH =
5−1 b−c = =4 c−a 1−0
1 1 M´ame UM < VJH , podm´ınka pro revizi hr´aˇce M je splnˇen´a. Nyn´ı zjist´ıme, zda je splnˇen´a i druh´a podm´ınka (4.8) z Vˇety 6.
2 UM =
µF − µM 0, 7 − 0, 1 = =6 µM 0, 1
2 VJH =
y−z 5−0 = =5 x−w 1−0
Druh´a podm´ınka v´ yhry je v tomto pˇr´ıkladˇe tak´e splnˇen´a, m˚ uˇzeme ˇr´ıct, ˇre hr´aˇc vyhr´av´a hru. Jeho preferovan´a rovnov´aha (R, s) bude Nashovou rovnov´ahou v cel´em pr˚ ubˇehu hry. V Tabulce 4 je udˇelan´ y mal´ y pˇrehled z´avislosti stˇredn´ı hodnoty µF na stˇredn´ı hodnotˇe µM pˇri nˇekter´ ych hodnot´ach prav´ ych stran podm´ınek v´ yhry 1 2 VJH a VJH . Vyznaˇcen´a oblast obsahuje hodnoty µM a µF , pˇri kter´ ych budou podm´ınky v´ yhry hr´aˇce, kter´e jsou zaveden´e ve Vˇetˇe 6. Obr´azek v ˇra´dce 1 2 VJH = 4 a sloupci VJH = 5 se vztahuje pˇr´ımo k Pˇr´ıkladu 4. V Pˇr´ıkladu 3 nen´ı splnˇen´a prvn´ı podm´ınka v´ yhry (4.1) z Vˇety 4. Tento fakt m˚ uˇzeme ovlivnit zmˇenou jednotliv´ ych parametr˚ u a uˇzitk˚ u, coˇz je n´aplˇ n dalˇs´ı podkapitoly.
27
Pˇr´ıklady, z´avislosti na parametrech a uˇzitc´ıch
Ilustraˇcn´ı pˇr´ıklady
2 VJH =2
2 VJH =5
mi_F
mi_F
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
1 VJH =2
mi_M 0.1
0.2
0.3
0.1
0.2
0.3
0.4
0.1
0.2
0.3
0.4
0.1
0.2
0.3
0.4
0.1
0.2
0.3
0.4
mi_F
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
1 VJH =4
mi_M 0.1
0.2
0.3
mi_M
0.4
mi_F
mi_F
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
1 VJH =7
mi_M 0.1
0.2
0.3
mi_M
0.4
mi_F
1 VJH = 10
mi_M
0.4
mi_F
mi_F
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
mi_M 0.1
0.2
0.3
0.4
mi_M
Tabulka 5.1: Oblast v´ ybˇeru µM a µF , aby z˚ ustaly splnˇen´e obˇe podm´ınky 1 2 v´ yhry za dan´ ych hodnot prav´ ych stran VJH a VJH 28
Pˇr´ıklady, z´avislosti na parametrech a uˇzitc´ıch
5.2
Z´avislost podm´ınek v´yhry
Z´ avislost podm´ınek v´ yhry
V podm´ınk´ach v´ yhry hr´aˇce figuruje v´ıce uˇzitk˚ u (a, b, c, d, w, x, y, z) a parametr˚ u (K, L), jejichˇz zvˇetˇsov´an´ım nebo zmenˇsov´an´ım m˚ uˇzeme ovlivˇ novat v´ ysledek hry. V t´eto ˇca´sti pr´ace pop´ıˇseme jak m˚ uˇzeme ˇsanci hr´aˇce na v´ yhru zv´ yˇsit zmˇenou hodnoty vˇzdy pouze jednoho uˇzitku nebo parametru. Nejprve vyˇreˇs´ıme prvn´ı podm´ınku, tj. podm´ınka pro Revizi prvn´ıho hr´aˇce 1 (4.1), (4.8) a (4.13). Lev´e strany tˇechto nerovnic oznaˇcen´e UM a UF1 jsou vˇzdy pro oba sc´en´aˇre stejn´e. Rozd´ıl pro hr´aˇce je pouze ve v´ ymˇenˇe pˇr´ısluˇsn´ ych Revizn´ıch funkc´ı. 1 Lemma 4. V´yraz UM , popˇr´ıpadˇe UF1 , se zmenˇsuje s klesaj´ıc´ım L. 1 . D˚ ukaz pro UF1 by byl proD˚ ukaz. Provedeme d˚ ukaz pouze pro v´ yraz UM v´adˇen´ y stejn´ ym zp˚ usobem, pouze se zamˇenˇen´ ymi Revizn´ımi funkcemi. V´ y1 raz UM mus´ıme zderivovat podle parametru L.
d dL
RK 0
M (t)dt +
R1
(1 − F (t))dt + (L − K) L R1 F (t)dt L
! =
1 − L + F (L) R1 F (t)dt L
A protoˇze z Definice 9 v´ıme, ˇze F (L) = 0, m˚ uˇzeme derivaci v´ yrazu UM d´ale upravit na
d dL
RK 0
M (t)dt +
R1
(1 − F (t))dt + (L − K) L R1 F (t)dt L
!
1−L = R1 . F (t)dt L
1 Derivace UM podle L je vˇzdy kladn´a, protoˇze m´ame zavedeno, ˇze L < 1. 1 V´ yraz UM se tedy zmenˇsuje s klesaj´ıc´ım L. 1 Pozn´amka 6. O tom, jak se v´ yrazy UM a UF1 chovaj´ı v z´avislosti na K nem˚ uˇzeme obecnˇe rozhodnout. Derivace obou v´ yraz˚ u podle K se rovn´a 0.
Prav´e strany nerovnic (4.1), (4.7), (4.13), jsou postupnˇe oznaˇceny VV1P , 1 1 VJH , WV1 P a WJH . Pˇri snaze o zv´ yˇsen´ı ˇsance na v´ yhru je nutn´e tyto zlomky zvˇetˇsit. N´asleduj´ıc´ı lemma demonstruje, jak´ y vliv maj´ı uˇzitky vystupuj´ıc´ı v jednotliv´ ych zlomc´ıch na prvn´ı podm´ınku v´ yhry. 29
Pˇr´ıklady, z´avislosti na parametrech a uˇzitc´ıch
Z´avislost podm´ınek v´yhry
Lemma 5. (a) VV1P je rostouc´ı v a, b, klesaj´ıc´ı v d. 1 (b) VJH je rostouc´ı v b, a, klesaj´ıc´ı v c.
(c) WV1 P je rostouc´ı v z, x, klesaj´ıc´ı v w. 1 (d) WJH je rostouc´ı v y, w, klesaj´ıc´ı v x.
D˚ ukaz. D˚ ukaz provedeme pouze pro ˇca´st (a), pro ostatn´ı ˇca´sti staˇc´ı v d˚ ukazu pouze zamˇenit odpov´ıdaj´ıc´ı si uˇzitky. Abychom dok´azali monot´onnost v´ yrazu VV1P je nutn´e tento v´ yraz zderivovat postupnˇe podle vˇsech obsaˇzen´ ych uˇzitk˚ u. d da
a−d d−b
=
1 d−b
yraz VV1P je Derivace VV1P podle promˇenn´e a je vˇzdy kladn´a (d > b), tud´ıˇz v´ rostouc´ı v a. d db
a−d d−b
=
a−d (d − b)2
Derivace v´ yrazu podle b je tak´e vˇzdy kladn´a (a > d > b), VV1P je rostouc´ı v b. d dd
a−d d−b
=−
a−b (d − b)2
Derivace v´ yrazu VV1P podle promˇenn´e d je vˇzdy z´aporn´a (a > d > b), proto je VV1P klesaj´ıc´ı v d. Nyn´ı se dost´av´ame ke druh´e podm´ınce v´ yhry, tj. podm´ınka pro simult´ann´ı tah hr´aˇce F. Rozbor provedeme stejn´ ym zp˚ usobem jako pro prvn´ı podm´ınku. Jedin´ y rozd´ıl je v tom, ˇze nyn´ı chceme, aby lev´e strany nerovnic (4.2), (4.8) 2 a (4.14) oznaˇcen´e UM a UF2 byly co nejvˇetˇs´ı a naopak prav´e strany tˇechto 2 2 nerovnic VV2P , VJH , WV2 P a WJH zase co nejmenˇs´ı. 2 Lemma 6. V´yraz UM , popˇr´ıpadˇe UF2 , se zvˇetˇsuje s rostouc´ım K i L.
30
Pˇr´ıklady, z´avislosti na parametrech a uˇzitc´ıch
Z´avislost podm´ınek v´yhry
2 D˚ ukaz. D˚ ukaz opˇet provedem jen pro UM , pro d˚ ukaz druh´eho v´ yrazu staˇc´ı zamˇenit Revizn´ı funkce.
d dK
! R1 RK M (t)dt + (1 − F (t))dt + (L − K) (M (K) − 1) (1 − M (t))dt 0 0 + = RK R KL 2 ( (1 − M (t))dt) (1 − M (t))dt 0 0 RK R1 −( 0 M (t)dt + L (1 − F (t))dt + (L − K))(K − M (K)) + RK ( 0 (1 − M (t))dt)2
RK
Pokud dosad´ıme za M (K) = 1 (Definice 9), m˚ uˇzeme derivaci jeˇstˇe zjednoduˇsˇsit.
! RK R1 M (t)dt + L (1 − F (t))dt + (L − K) d 0 = RK dK (1 − M (t))dt 0 RK R1 −( 0 M (t)dt + L (1 − F (t))dt + (L − K))(K − 1) RK ( 0 (1 − M (t))dt)2 2 podle K je M´ame zaveden´e, ˇze K < 1 a L ≥ K, takˇze derivace v´ yrazu UM 2 vˇzdy kladn´a. UM je rostouc´ı v K.
d dL
RK 0
! R1 M (t)dt + L (1 − F (t))dt + (L − K) 1 − L + F (L) = RK RK (1 − M (t))dt (1 − M (t))dt 0 0
2 Za F (L) dosad´ıme 0 dle Definice 9 a v´ıme, ˇze L < 1, potom je derivace UM podle L vˇzdy kladn´a a tento v´ yraz je rostouc´ı v L.
Lemma 7. (a) VV2P je rostouc´ı v z, x, klesaj´ıc´ı v y, w. 2 (b) VJH je rostouc´ı v y, w, klesaj´ıc´ı v z, x.
(c) WV2 P je rostouc´ı v a, b, klesaj´ıc´ı v c, d. 2 (d) WJH je rostouc´ı v b, a, klesaj´ıc´ı v d, c.
31
Pˇr´ıklady, z´avislosti na parametrech a uˇzitc´ıch
Z´avislost podm´ınek v´yhry
D˚ ukaz. Provedeme d˚ ukaz pouze pro ˇca´st (a), pro ostatn´ı ˇca´sti by byl analogick´ y. Abychom zjistili, jak se bude mˇenit v´ yraz VV2P v z´avislosti na zmˇen´ach uˇzitk˚ u, mus´ıme ho postupnˇe zderivovat podle vˇsech uˇzitk˚ u, kter´e se v nˇem nach´azej´ı. d dz d dx
d dy d dw
z−y w−x
z−y w−x
=
=
z−y w−x
z−y w−x
1 w−x
z−y (w − x)2
=
=−
−1 w−x z−y (w − x)2
Z nerovnic pro uˇzitky (2.4.1) vypl´ yv´a, ˇze derivace podle z i podle x je vˇzdy 2 kladn´a. V´ yraz VV P je rostouc´ı v z a x. Zat´ımco derivace podle y a w je vˇzdy z´aporn´a, proto je vV2 P klesaj´ıc´ı v y a w.
5.2.1
Shrnut´ı
N´aslednˇe ve dvou tabulk´ach pˇrehlednˇe shrneme v´ ysledky z Lemma 4, 5, 6 a 7. ˇ C´asti tabulek pro prvn´ı podm´ınku ˇr´ıkaj´ı, co je tˇreba udˇelat, abychom zmenˇsili 1 rozd´ıl UM −Vi1 v pˇr´ıpadˇe, kdy Revizi prov´ad´ı prvn´ı hr´aˇc M. Pro opaˇcn´ y pˇr´ıpad 1 1 zmenˇsujeme rozd´ıl UF − Wi . Rozd´ıly v uveden´ ych tvarech vych´az´ı z prvn´ı 1 1 podm´ınky v´ yhry, kter´a je ve tvaru UM < Vi , respektive UF1 < Wi1 , kde ˇ asti tabulek pro druhou podm´ınku zase d´avaj´ı n´avod, jak i = {V P, JH}. C´ 2 zvˇetˇsit rozd´ıl Ui − Vi2 (v pˇr´ıpadˇe, ˇze prvn´ı prov´ad´ı Revizi hr´aˇc M), respektive UF2 − Wi2 (v pˇr´ıpadˇe, ˇze prvn´ı prov´ad´ı Revizi hr´aˇc F). Rozd´ıly opˇet vych´az´ı 2 z podm´ınky v´ yhry, druh´a podm´ınka je ve tvaru UM > Vi2 , pˇr´ıpadnˇe UF2 > Wi2 , kde opˇet i = {V P, JH}.
32
Pˇr´ıklady, z´avislosti na parametrech a uˇzitc´ıch
Z´avislost podm´ınek v´yhry
Sc´en´aˇr V´alka pohlav´ı Jestˇr´abi a holubice Podm´ınka 1. podm´ınka 2. podm´ınka 1. podm´ınka 2. podm´ınka a ↑ × ↑ × b ↑ × ↑ × c nem´a vliv × ↓ × a ↓ × nem´a vliv × w × ↑ × ↓ x × ↓ × ↑ y × ↑ × ↓ z × ↓ × ↑ K nelze ob. urˇcit ↑ nelze ob. urˇcit ↑ L ↓ ↑ ↓ ↑ Tabulka 5.2: Z´avislost podm´ınek v´ yhry hr´aˇce M na uˇzitc´ıch a parametrech
Sc´en´aˇr V´alka pohlav´ı Jestˇr´abi a holubice Podm´ınka 1. podm´ınka 2. podm´ınka 1. podm´ınka 2. podm´ınka a × ↓ × ↓ b × ↑ × ↓ c × ↑ × ↑ d × ↑ × ↑ w ↓ × ↑ × x ↑ × ↓ × y nem´a vliv × ↑ × z ↑ × nem´a vliv × K nelze ob. urˇcit ↑ nelze ob. urˇcit ↑ L ↓ ↑ ↓ ↑ Tabulka 5.3: Z´avislost podm´ınek v´ yhry hr´aˇce F na uˇzitc´ıch a parametrech
33
Pˇr´ıklady, z´avislosti na parametrech a uˇzitc´ıch
Z´avislost podm´ınek v´yhry
Vysvˇetlivky pro Tabulky 5.2 a 5.3: ↑ - je tˇreba zv´ yˇsit hodnotu parametru nebo uˇzitku, ↓ - je tˇreba sn´ıˇzit hodnotu parametru nebo uˇzitku, × - parametr nebo uˇzitek se v podm´ınce nevyskytuje.
34
6 Z´avˇer V poˇca´tku pr´ace jsme vytvoˇrili teoretick´e z´azem´ı a zavedli vˇsechny d˚ uleˇzit´e pojmy jako jsou statick´a hra, uˇzitek, rovnov´aha a Nashova rovnov´aha. Uvedli jsme z´akladn´ı pˇredpoklady teorie her a zm´ınili jsme Nashovu vˇetu, kter´a n´am zaruˇcuje existenci rovnov´ahy. Zamˇeˇrili jsme se v´ yhradnˇe na sc´en´aˇre V´alka pohlav´ı a Jestˇra´bi a holubice, protoˇze v obou sc´en´aˇr´ıch nal´ez´ame probl´em v´ ybˇeru jednoznaˇcn´e rovnov´ahy. Oba tyto sc´en´aˇre jsme d˚ ukladnˇe popsali a uk´azali jejich konkr´etn´ı pˇr´ıklady. Uvedli jsme teoretick´ y z´aklad ke klasick´ ym dynamick´ ym hr´am, definovali jsme zde Nashovu rovnov´ahu vzhledem k podhr´am a zm´ınili jsme vˇety existence a jednoznaˇcnosti Nashov´ ych rovnov´ah. Definovali jsem v´ yhru hr´aˇce v dynamick´e hˇre tak, ˇze preferovan´a rovnov´aha hr´aˇce mus´ı b´ yt Nashovou rovnov´ahou vzhledem k podhr´am. N´aslednˇe jsme uk´azali, ˇze zde plat´ı v´ yhoda poˇrad´ı. Zaˇc´ınaj´ıc´ı hr´aˇc vˇzdy z´ısk´av´a preferovanou rovnov´ahu. T´ımto jsme z´ıskali pouze jedinou Nashovu rovnov´ahu jako ˇreˇsen´ı hry, kter´a je optim´aln´ı pro zaˇc´ınaj´ıc´ıho hr´aˇce. V dalˇs´ı ˇca´sti pr´ace jsme se vˇenovali dynamick´ ym hr´am s n´ahodn´ ym ˇcasov´an´ım tah˚ u, kter´e je zadan´e pravdˇepodobnostn´ım rozdˇelen´ım. Uvaˇzovali jsme pouze pˇr´ıpad, kdy se pravdˇepodobnostn´ı rozdˇelen´ı pro jednotliv´e hr´aˇce nepˇrekr´ yv´a. Prvn´ı opakov´an´ı tahu jsme oznaˇcili jako Revizi. Distribuˇcn´ı funkce pravdˇepodobnostn´ıch rozdˇelen´ı n´ahodn´eho ˇcasov´an´ı Reviz´ı jsme definovali jako Revizn´ı funkce. Opˇet jsme hledali podm´ınku v´ yhry hr´aˇce za pˇredpokladu, ˇze hr´aˇc vyhr´av´a, pokud je jeho preferovan´a rovnov´aha Nashovou rovnov´ahou v cel´em pr˚ ubˇehu hry. Tyto podm´ınky jsme naˇsli vyuˇzit´ım metody zpˇetn´e indukce a urˇcili jsme je pro oba sc´en´aˇre, ale i pro obˇe moˇznosti zaˇc´ınaj´ıc´ıho hr´aˇce z pohledu Reviz´ı (jako prvn´ı prov´ad´ı Revizi hr´aˇc M nebo naopak F). Podm´ınky v´ yhry v z´akladn´ım tvaru obsahuj´ı urˇcit´e integr´aly z Revizn´ıch funkc´ı, a proto jsme naˇsli jednoduˇsˇs´ı z´apis podm´ınek, kde se vyskytuj´ı pouze stˇredn´ı hodnoty pravdˇepodobnostn´ıch rozdˇelen´ı Reviz´ı. Pro ilustraci uveden´ ych podm´ınek v´ yhry jsme uvedli pˇr´ıklady, kde jeden demonstruje p˚ uvodn´ı podm´ınky v´ yhry a druh´ y ty upraven´e. V posledn´ı ˇradˇe jsme prozkoumali z´avislost podm´ınek v´ yhry na jednotliv´ ych parametrech hry (K, L) a uˇzitˇ c´ıch (a, b, c, d, w, x, y, z). Reˇsili jsme tyto z´avislosti za pˇredpokladu, ˇze se mˇen´ı vˇzdy pouze jeden parametr nebo uˇzitek a ostatn´ı z˚ ust´avaj´ı stejn´e. Nakonec je uvedeno shrnut´ı tˇechto z´avislost´ı v tabulk´ach pro oba sc´en´aˇre. V pr´aci jsme tedy nast´ınili roli ˇcasov´an´ı v teorii her, kdy pˇreveden´ım sta35
Z´avˇer
tick´e hry, kter´a m´a v´ıce rovnov´ah, na dynamickou hru dos´ahneme jednoznaˇcnosti rovnov´ahy. D´ale jsme naˇsli podm´ınky v´ yher jednotliv´ ych hr´aˇc˚ u v obou zkouman´ ych sc´en´aˇr´ıch ve dvou typech dynamick´ ych her, klasick´e dynamick´e hˇre a dynamick´e hˇre s n´ahodn´ ym ˇcasov´an´ım tah˚ u. Tato pr´ace by mohla b´ yt rozˇs´ıˇrena o dalˇs´ı typy dynamick´ ych her s n´ahodn´ ym ˇcasov´an´ım tah˚ u, napˇr´ıklad v´ıcekolov´e hry (probˇehne v´ıce kol reviz´ı) nebo hry s pˇrekr´avaj´ıc´ım se pravdˇepodobnostn´ım rozdˇelen´ım reviz´ı.
36
Literatura [1] J. N. Webb, Game Theory: Decisions, Interaction and Evolution, Springer, 2007. [2] D. Fudenberg, J, Tirole, Game Theory, The MIT Press, 1991. [3] J. Libich, P. Stehl´ık, Monetary Policy Facing Fiscal Indiscipline under Generalized Timing of Actions, Journal of Institutional and Theoretical Economics, 168(3), 393-431, 2012. [4] I. Cho, A. Matsui, Time Consistency in Alternating Move Policy Games, The Japanese Economic Review, 56(3), 273-294, 2005. [5] R. Lagunoff, A. Matsui, Asynchronous Choice in Repeated Coordination Games, Econometrica, 65, 1467-1477, 1977. [6] Y. Kamada, M. Kandori, Revision Games, Harvard University, 2008. [7] O. Kallenberg, Foundations of Modern Probability Series: Probability and Its Applications, Springer, New York, 2002.
37