THE: Nekooperativn´ı hry v norm´aln´ı formˇe (Non-cooperative Normal-Form Games) Martin Hrub´y Brno University of Technology Brno Czech Republic
October 1, 2014
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
´ Uvod ˇ ano z: Cerp´ ◮ ◮
◮
◮
Fudenberg, D., Tirole, J.: Game Theory, The MIT Press, 1991 Osborne, M., Rubinstein, A.: A Course in Game Theory, The MIT Press, 1994 McCarthy, N., Mierowitz, A.: Political Game Theory: An Introduction, Cambridge University Press, 2007 Magdal´ena Hykˇsov´ a: Pˇredn´ aˇsky z teorie her, Fakulta dopravn´ı ˇ CVUT
´ Uvod: ◮
◮ ◮
Hry v norm´aln´ı formˇe (tzv. strategick´e hry) jsou nejobecnˇejˇs´ım pojet´ım strategick´e interakce. V r´amci nich zkoum´ ame kooperativn´ı a nekooperativn´ı hry. Provedeme klasifikaci her. Dneˇsn´ı pˇredn´ aˇska bude o nekooperativn´ıch strategick´ych hr´ ach s nenulov´ym souˇctem. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Dˇelen´ı strategick´ych her Podle zp˚ usobu hran´ı hry: ◮
Hry jednotahov´e – hry v norm´ aln´ı formˇe (normal-form games).
◮
Hry dynamick´e (sekvenˇcn´ı hry, hry v rozˇs´ıˇren´e formˇe) – hr´ aˇci se stˇr´ıdaj´ı v taz´ıch (angl. dynamic games, extensive-form games). ˇ asteˇcn´a pˇrevoditelnost. C´
◮
Podle moˇznost´ı komunikace mezi hr´ aˇci pˇred volbou strategie: ◮
Nekooperativn´ı – z´ akladn´ı forma strategick´e interakce.
◮
Kooperativn´ı – fundament´ alnˇe odliˇsn´e. Zkoum´ame sp´ıˇse pˇredpoklady pro kooperativnost v jedn´ an´ı.
Podle m´ıry konkurence/soutˇeˇzivosti: ◮
S nenulov´ym souˇctem.
◮
S konstantn´ım/nulov´ym souˇctem – striktnˇe kompetitivn´ı hry.
Pozn.: Dalˇs´ı dˇelen´ı je podle m´ıry informace hr´ aˇc˚ u. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Dalˇs´ı pokraˇcov´an´ı studia her Ve strategick´ych hr´ach: ◮
Sm´ıˇsen´e strategie.
◮
Opakov´an´ı ve hr´ach.
◮
Korelovan´e ekvilibrium.
◮
Evoluˇcnˇe stabiln´ı strategie.
V mechanism designu: ◮
N´avrh mechanism˚ u.
◮
Teorie veˇrejn´e volby.
◮
Teorie aukc´ı.
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
´ Uvodn´ ı kr´atk´e demo strategick´e hry s nenulov´ym souˇctem A/B top bottom
left 1,2 5,6
right 3,4 7,8
Jak se hraje nekooperativn´ı hra v norm´ aln´ı formˇe (ilustrativn´ı pˇredstava): ◮ ◮ ◮
◮ ◮
◮
Hr´aˇci si vˇsichni uvˇedomuj´ı, ˇze jsou u ´ˇcastn´ıky ve hˇre. Hr´aˇci spolu nekomunikuj´ı. Hr´aˇci se rozhodnou, jakou strategii budou hr´ at, nap´ıˇs´ı ji na l´ıstek, ten vloˇz´ı do ob´ alky a ob´ alku odevzdaj´ı nez´avisl´emu arbitrovi. Vˇsichni hr´aˇci odevzdaj´ı svou ob´ alku ve stejn´y okamˇzik. Arbitr najednou otevˇre vˇsechny ob´ alky a zveˇrejn´ı hran´e strategie hr´aˇc˚ u. Hr´aˇc˚ um je pˇridˇelen zisk dan´y modelem situace a podle hran´ych strategi´ı. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Demo, proveden´ı tahu A/B top bottom
left 1,2 5,6
right 3,4 7,8
1. Hr´aˇci oba (vˇsichni) zvol´ı tajnˇe svou strategii. V naˇsem pˇr´ıkladˇe ˇr´adkov´y (A) zvol´ı ”top”, sloupcov´y (B) zvol´ı ”right”. 2. Nez´avisl´y arbitr zjist´ı volbu strategi´ı a pˇridˇel´ı hr´aˇc˚ um jejich zisky: ◮ ◮
ˇ adkov´y dostane zisk 3 R´ Sloupcov´y dostane 4
3. Pokud se v´ysledek hr´ aˇc˚ um nel´ıb´ı, maj´ı sm˚ ulu: dalˇs´ı kolo hry uˇz nebude. Mˇeli uvaˇzovat l´epe. V pozn´an´ı jedno-tahovosti mnoha her spoˇc´ıv´ a znaˇcn´e rozˇcarov´an´ı v mnoha lidsk´ych situac´ıch. Lid´e se mnohdy nechovaj´ı racion´alnˇe (spr´avnˇe) proto, ˇze maj´ı dojem ˇze se to pˇrece vˇzdycky d´a napravit, n´e´e´e...?! – Experiment´ aln´ı teorie her. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Co je to ta hra...? ◮
Hra je strategick´a interakce mezi dvˇema a v´ıce hr´aˇci, kteˇr´ı svou ˇcinnost´ı chtˇej´ı dos´ ahnout optim´ aln´ıho v´ysledku ve hˇre.
◮
Hra je matematick´y model rozhodovac´ı situace – je to tedy zjednoduˇsen´ı probl´emu na jeho podstatn´e prvky.
◮
Hlavn´ım zjednoduˇsuj´ıc´ım pˇredpokladem je pˇredpoklad racionality hr´aˇc˚ u.
Pod toto oznaˇcen´ı spad´ a velmi mnoho vˇec´ı, cokoli od rulety po ˇsachy, od bakaratu po bridˇz. A nakonec kaˇzd´ a ud´ alost – jsou-li d´any vnˇejˇs´ı podm´ınky a u ´ˇcastn´ıci situace (a ti se chovaj´ı dle svobodn´e v˚ ule) – m˚ uˇze b´yt povaˇzov´ ana za spoleˇcenskou hru, jestliˇze sledujeme u ´ˇcinek, jak´y m´ a na u ´ˇcastn´ıky [John von Neumann, 1928]. Juli Zeh: Hr´aˇcsk´y instinkt, Odeon, 2006 Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Hry s nulov´ym a nenulov´ym souˇctem
◮
Historicky dˇr´ıve byly zavedeny hry s nulov´ym souˇctem. Vˇeta o minimaxu, John von Neumann.
◮
Aˇz pozdˇeji (1950-1) byl definov´ an koncept ekvilibria ve hr´ach s nenulov´ym souˇctem (J. Nash).
◮
V THE probereme nejdˇr´ıve hry s nenulov´ym souˇctem (jsou pˇrirozenˇejˇs´ı). Hry s nulov´ym souˇctem jsou speci´aln´ım pˇr´ıpadem her s nenulov´ym souˇctem (matematicky).
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Sociologick´y/psychologick´y aspekt her s nulov´ym souˇctem (doc. Franˇek, UHK) Nulov´y souˇcet: ◮ Situace, jeˇ z m´a skonˇcit nulov´ym souˇctem, je situac´ı soutˇeˇzen´ı. ◮ B´ yt hr´aˇcem s nulov´ymi souˇcty znamen´ a vˇeˇrit, ˇze ve vˇsech ˇzivotn´ıch situac´ıch jsou jen dvˇe moˇznosti: z´ıskat nebo ztratit. ◮ Z psychologick´ eho (i etick´eho) hlediska je poj´ım´an´ı mezilidsk´ych kontakt˚ u jako ”her s nulov´ym souˇctem” poruchov´e, v ˇradˇe pˇr´ıpad˚ u sociopatick´e. Nenulov´y souˇcet: ◮ Oba mohou ”zv´ ıtˇezit”. ◮ Je nadˇ eje na kooperativn´ı chov´ an´ı vedouc´ı k efektivnˇejˇs´ımu v´ysledku hry. Pedro/Juana Rozdˇelit spravedlivˇe Rozdˇelit vychytrale Martin Hrub´ y
Spolupracovat 10,10 100,1
Trestat 0,0 0,0
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Common knowledge Aumann, R: Agreeing to Disagree, The Annals of Statistics, Vol. 4, No. 6. (Nov., 1976), pp. 1236-1239. (v knihovnˇ e: Aumann: Collected Papers, vol. 1) Zat´ım pouze zkr´acenˇe definujme spoleˇcnou znalost. ◮ ◮
Mˇejme dva hr´aˇce A a B Ud´alost E je pro hr´ aˇce {A, B} common knowledge, pokud: ◮ ◮ ◮ ◮ ◮ ◮
... hr´aˇci {A, B} oba v´ı o ud´alosti E ... hr´aˇc A v´ı, ˇze B v´ı o ud´alosti E ... hr´aˇc B v´ı, ˇze A v´ı o ud´alosti E ... hr´aˇc A v´ı, ˇze B v´ı, ˇze A v´ı o ud´alosti E ... hr´aˇc B v´ı, ˇze A v´ı, ˇze B v´ı o ud´alosti E takto aˇz do nekoneˇcn´eho zanoˇren´ı
Pˇr´ıklad: dva vojev˚ udci se informuj´ı o m´ıstˇe a ˇcasu bitvy. Vojev˚ udce A vyˇsle k B posla, ... Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Common knowledge – pˇr´ıklad s modrook´ymi na ostrovˇe Mˇejme ostrov, kde ˇzij´ı lid´e s modr´yma (M) a zelen´yma (Z) oˇcima. Poˇcet M je k ≥ 1. Na ostrovˇe nejsou zrcadla a lidi se o barvˇe oˇc´ı nebav´ı (maj´ı moˇznost pouze pozorovat). Pˇredpokl´ad´ame, ˇze jsou vˇsichni naprosto logicky uvaˇzuj´ıc´ı. ◮
Pokud se ˇclovˇek o sobˇe dozv´ı, ˇze je M, pak mus´ı n´asleduj´ıc´ı den za sv´ıt´an´ı ostrov opustit.
◮
Jednoho dne pˇrijde cizinec a vˇsem veˇrejnˇe ozn´am´ı: ”je tu alespoˇ n jeden M”.
◮
Pˇred pˇr´ıchodem cizince nebyl tento stav common knowledge.
Co se stane? ◮
k = 1, pˇr´ıˇst´ı den M odejde
◮
k = 2, pˇr´ıˇst´ı den nic, 2. sv´ıt´ an´ı odejdou oba. Kaˇzd´y M v´ı, ˇze existuje M, ale kaˇzd´y M nev´ı, ˇze jin´y M m´ a tu stejnou znalost.
◮
k > 2, k−t´e sv´ıt´an´ı odejdou vˇsichni M Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Struktura hry
◮
Pravidla – zp˚ usob hran´ı hry, pˇredpoklady, ...
◮
Hr´aˇci – nez´avisl´e inteligentn´ı entity sleduj´ıc´ı sv˚ uj z´amˇer (jednou z definic racionality je ”snaha definovat sv´e c´ıle a ty se snaˇzit naplnit”).
◮
Hr´aˇci hraj´ı hru t´ım, ˇze vol´ı sv´e tahy – strategie, akce, volby.
◮
Volba akce vede k nˇejak´emu n´ asledku – uˇzitku ve hˇre.
◮
Hr´aˇci maj´ı jistou informaci o hˇre – znaj´ı protihr´aˇce, jejich akce a formu (a velikost) uˇzitku.
◮
Hr´aˇci se na z´akladˇe znalost´ı o hˇre rozhoduj´ı.
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Definice strategick´e hry N hr´aˇc˚ u, N ≥ 2 Definition Strategick´a hra N hr´aˇc˚ u je (2N + 1)-tice Γ = (Q; S1 , S2 , ..., SN ; U1 , U2 , ..., UN ) ◮
Q = {1, 2, ..., N} je koneˇcn´ a mnoˇzina hr´ aˇc˚ u ve hˇre.
◮
Si , i ∈ Q jsou (koneˇcn´e) mnoˇziny ryz´ıch strategi´ı hr´aˇc˚ u i ∈ Q.
◮
Ui : S1 × S2 × ... × SN → U jsou funkce uˇzitku hr´aˇc˚ u.
Pozn´amky: ˇ ◮ U je univerzum vˇ sech moˇzn´ych uˇzitk˚ u. Casto klademe U = R. ◮ S = S1 × S2 × ... × SN je mnoˇ zina strategick´ych profil˚ u ve hˇre. s ∈ S je strategick´y profil. ◮ Prostor S n´ am ud´ av´ a rozmˇer probl´emu, kter´y mus´ıme algoritmicky ˇreˇsit. ◮ Ryz´ ı (angl. pure) a sm´ıˇsen´e (angl. mixed) strategie. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Pˇr´ıklad hry
A/B top bottom
left 1,2 5,6
right 3,4 7,8
◮
Q = {A, B}.
◮
SA = {top, bottom}, SB = {left, right}.
◮
S = SA × SB = {(top, left), (top, right), (bottom, left), (bottom, right)}
◮
UA (top, left) = 1, UA (top, right) = 3, ..., UB (bottom, right) = 8
Uˇzitky zapisujeme pˇrehlednˇe do matice – maticov´e hry.
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Informace o hˇre Aby hr´aˇci mohli prov´est rozhodnut´ı, mus´ı m´ıt nˇejak´e informace o hˇre. Zat´ım pˇredpokl´ad´ ame (pro jednoduchost), ˇze jim ˇza´dn´a informace o hˇre nechyb´ı (jinak by si museli udˇelat o stavu nˇekter´ych vˇec´ı stochastick´y model). Proto zavedeme pojem kompletn´ı informace ve hˇre (angl. complete information):
Definition Mˇejme hru Γ = (Q; {Si }i ∈Q ; {Ui }i ∈Q ). Pokud jsou pro vˇsechny z´ uˇcastnˇen´e hr´aˇce Q n´asleduj´ıc´ı informace common knowledge: ◮
struktura hry Γ,
◮
v´yplatn´ı (uˇzitkov´e) funkce Ui ; i ∈ Q,
◮
zp˚ usob hran´ı hry a forma hern´ıho ekvilibria,
a souˇcasnˇe tento fakt samotn´y je common knowledge, pak maj´ı hr´aˇci kompletn´ı informaci o hˇre. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Rozsah informac´ı ve hˇre
◮
Common knowledge.
◮
Kompletn´ı informace (complete information). Nekompletn´ı informace (incomplete information, Bayesian games)
◮
Dokonal´a informace (perfect information). Nedokonal´a informace (imperfect information).
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Nulov´y versus Nenulov´y souˇcet form´alnˇe
Definition
ˇ Mˇejme hru Γ. Rekneme, ˇze Γ je hra s konstantn´ım souˇctem k ∈ R, pokud plat´ı X ∀s ∈ S : Ui (s) = k i ∈Q
Pokud je k = 0, pak je Γ hra s nulov´ym souˇctem. U her s nenulov´ym souˇctem nelze naj´ıt k ∈ R takov´e, ˇze by platila pˇredchoz´ı podm´ınka.
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Co je c´ılem? Solution concept... Strategick´a hra N hr´aˇc˚ u s nenulov´ym souˇctem je matematick´y model konfliktn´ı situace. ◮
Tento model obdrˇz´ıme nebo vytvoˇr´ıme (vˇeˇr´ıme, ˇze vˇsichni hr´aˇci model odvod´ı stejnˇe).
◮
Vˇeˇr´ıme, ˇze existuje nˇejak´e racion´ aln´ı chov´ an´ı hr´aˇc˚ u, kter´e je formalizovateln´e. Hled´ ame ˇreˇsen´ı hry.
◮
Pokud existuje model chov´ an´ı ve formˇe algoritmu nad modelem hry, pak matematick´ym ˇreˇsen´ım hry z´ısk´am predikci chov´an´ı hr´aˇc˚ u ve skuteˇcnosti.
◮
Formalizace chov´ an´ı – solution concept.
Snahou je predikovat chov´ an´ı hr´ aˇc˚ u nebo alespon rozumˇet jejich chov´an´ı.
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Model chov´an´ı hr´aˇc˚ u Hr´aˇci ˇcel´ı situaci a mus´ı zvolit sv˚ uj tah. Prov´ ad´ı urˇcitou u ´vahu. ◮
Budeme zkoumat postup hr´ aˇcova uvaˇzov´ an´ı.
◮
Teoreticky se nemus´ıme uˇcit, jak se rozhodnout. Model rozhodov´an´ı pouze algoritmizuje pˇrirozenou inteligenci a racion´aln´ı pˇr´ıstup k ˇreˇsen´ı rozhodov´ an´ı.
V´ysledkem rozhodov´an´ı kaˇzd´eho hr´ aˇce i ∈ Q je volba nˇejak´e ryz´ı strategie si∗ ∈ Si , u kter´e hr´ aˇc vˇeˇr´ı, ˇze mu pˇrinese maxim´aln´ı uˇzitek (outcome). V´ysledek volby vˇsech hr´ aˇc˚ u je pak strategick´y profil s ∗ ∈ S, s ∗ = (s1∗ , s2∗ , ..., sN∗ ) Pokud profil s ∗ splˇ nuje urˇcit´e vlastnosti, je naz´yv´ an ekvilibrium ve hˇre (ˇcesky rovnov´aha). Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
´ Uvod do anal´yzy her A/B top bottom
left 1,2 5,6
right 3,4 7,8
◮
Jakou strategii zvol´ı hr´ aˇc A, pokud by hr´ aˇc B mˇel hr´at left? Hr´aˇc maximalizuje sv˚ uj uˇzitek.
◮
Hr´aˇc si rozm´yˇsl´ı svoje moˇzn´e nejlepˇs´ı odpovˇedi na moˇzn´e tahy protihr´aˇce.
◮
Pozor, hra je jednotahov´ a, tzn. veˇsker´e prom´yˇslen´ı se odehr´av´a v mysl´ıch hr´ aˇc˚ u. Hr´ aˇci mus´ı hru kompletnˇe strategicky rozebrat.
◮
Hr´aˇci maj´ı pouze jednu moˇznost t´ ahnout!
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Charakteristika Best-response (BR), nejlepˇs´ı odpovˇedˇ Hra Γ = (Q; S; U). ◮
◮
Nechˇt hr´aˇc i ∈ Q pˇrem´yˇsl´ı, co bude hr´ at, kdyˇz jeho protivn´ıci Q−i = Q \ {i } budou hr´ at konkr´etn´ı strategie sj , j ∈ Q−i . Q Pˇripomeˇ nme mnoˇzinu S = i ∈Q Si . Zavedeme mnoˇzinu: Y S−i = Sj j∈Q−i
◮ ◮
Prvek s−i ∈ S−i je jak´ysi kontext rozhodov´ an´ı (sub-profil). Notace: (si , s−i ) je sloˇzen´ı do cel´eho profilu, (si , s−i ) ∈ S V kontextu s−i ∈ S−i hr´ aˇ c i vol´ı si ∈ Si tak, ˇ ze aln´ı. Ui (si , s−i ) je na {(si , s−i )|si ∈ Si } maxim´ Mi (Si , s−i , ≥) = {si∗ ∈ Si |Ui (si∗ , s−i ) ≥ Ui (si , s−i ); ∀si ∈ Si } Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Charakteristika Best-response, form´alnˇe Mnoˇzina profil˚ u hry: S=
Y
Si
i ∈Q
Mnoˇzina sub-profil˚ u hry (pro kaˇzd´eho hr´ aˇce i ∈ Q !!!): S−i =
Y
Sj
j∈Q−i
Best-response hr´aˇce i v sub-profilu s−i ∈ S−i : BRi (s−i ) = arg max [Ui (si , s−i )] si ∈Si
Pozn´amka: promyslete si algoritmus v´ypoˇctu BRi (s−i ). Jak´e m´a vstupy a v´ystupy? Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Charakteristika Best-response Z definice: BRi (s−i ) ⊆ Si . ◮
◮
◮
◮
ˇ BRi (s−i ). Hr´aˇc v kontextu s−i vol´ı svou nejlepˇs´ı odpovˇed Takto se zˇrejmˇe budou chovat vˇsichni. ˇ bude asi rovnov´ Vz´ajemn´a nejlepˇs´ı odpovˇed aˇzn´y profil ve hˇre – tzn. rovnov´aha – ˇz´ adn´y hr´ aˇc nechce mˇenit svou strategii. Situace, kdy pro nˇejak´e i ∈ Q a s−i ∈ S−i je |BRi (s−i )| > 1 vyjadˇruje urˇcitou nejistotu hr´ aˇce v jeho tahu. Vede na sm´ıˇsen´e chov´an´ı (pozdˇeji). Zˇrejmˇe vˇzdy plat´ı: ∀i ∈ Q, ∀s−i ∈ S−i : |BRi (s−i )| > 0. Proˇc??
Best-response je z´aklad vˇsech hernˇe-teoretick´ych algoritm˚ u. Best-response je korespondence: BRi : S−i →→ Si Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Dominantnost strategi´ı ve hˇre Pedro/Juana Rozdˇelit spravedlivˇe Rozdˇelit vychytrale
Spolupracovat 10,10 100,1
Trestat 0,0 0,0
V nˇekter´ych rozhodovac´ıch situac´ıch jasnˇe c´ıt´ıme, ˇze jedna strategie s 1 je v´yraznˇe lepˇs´ı neˇz druh´ a s 2 bez ohledu na dalˇs´ı ˇ ık´ame, ˇze takov´ okolnosti. R´ a strategie s 1 striktnˇe dominuje nad s 2 .
Definition Mˇejme hru Γ = (Q; {Si }i ∈Q ; {Ui }i ∈Q ). Strategie si1 hr´aˇce i ∈ Q striktnˇe dominuje nad jeho strategi´ı si2 , pokud plat´ı ˇze: ∀s−i ∈ S−i : Ui (si1 , s−i ) > Ui (si2 , s−i ) Co z toho plyne? Racion´ aln´ı hr´ aˇc i ∈ Q bude vˇzdy preferovat si1 nad si2 . Strategie si1 je dominantn´ı (dominant) a strategie si2 je dominovan´a (dominated). Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Dominantnost strategi´ı ve hˇre ◮
◮
Pokud plat´ı, ˇze si1 striktnˇe dominuje nad vˇsemi Si \ {si1 }, pak je si1 pro hr´aˇce i striktnˇe dominantn´ı. Pokud ∀si1 ∈ Si \ {si2 } plat´ı, ˇze si1 striktnˇe dominuje nad si2 , pak je si2 striktnˇe dominovan´ a.
◮
Pokud m´a racion´aln´ı hr´ aˇc striktnˇe dominantn´ı strategii, bude ji vˇzdy hr´at.
◮
Pokud m´a racion´aln´ı hr´ aˇc striktnˇe dominovanou strategii, tak ji nikdy hr´at nebude.
◮
Racion´aln´ı hr´aˇc si uvˇedomuje existenci dominantn´ıch strategi´ı sv´ych protihr´aˇc˚ u.
◮
M´a kaˇzd´a hra striktnˇe dominantn´ı strategii?
Pozn´amka: promyslete si algoritmus v´ypoˇctu dominance strategi´ı. Jak´e m´a vstupy a v´ystupy? Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Dominantnost strategi´ı ve hˇre Striktn´ı dominance zav´ ad´ı opˇet formu preference hr´aˇce. Jak´a je to relace? ≻i ⊆ S i × S i ◮
Je u ´pln´a? Plat´ı ∀si1 , si2 ∈ Si ; si1 6= si2 : si1 ≻i si2 ∨ si2 ≻i si1 ??
◮
Je reflexivn´ı?
◮
Je tranzitivn´ı?
◮
Je symetrick´a?
◮
Je asymetrick´a?
◮
Je antisymetrick´a?
D´a se o striktn´ı preferenci nad strategiemi nˇeco ˇr´ıci?
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Pˇr´ıklad: Vˇezˇnovo dilema Jedna z nejslavnˇejˇs´ıch hern´ıch situac´ı. Mnoho v´yklad˚ u. ◮
◮
◮
◮
◮
Policie zadrˇz´ı Petera a Johna, kteˇr´ı jsou podezˇrel´ı z bankovn´ı loupeˇze. Neexistuje vˇsak proti nim pˇr´ım´y d˚ ukaz. Podezˇrel´ı Peter a John jsou um´ıstˇeni do oddˇelen´ych cel a vysl´ych´ani zvl´aˇsˇt ⇒ nemohou spolu komunikovat (kooperace, vyjedn´av´an´ı). Maj´ı kaˇzd´y dvˇe moˇznosti: vypov´ıdat (pˇriznat se a zradit kump´ana), mlˇcet (spolupracovat s kump´ anem). C´ılem policie je z nich dostat pˇrizn´ an´ı. Policie kaˇzd´emu sdˇel´ı: pokud budeˇs vypov´ıdat a tv˚ uj kump´an mlˇcet, pak tˇe pust´ıme a tv˚ uj kump´ an dostane 20 let. Pokud budete vypov´ıdat oba (pˇrizn´ ate se), dostanete oba 10 let. Pokud budete oba mlˇcet, dostanete aspoˇ n kaˇzd´y 1 rok za nedovolen´e drˇzen´ı zbranˇe. Kaˇzd´y podezˇrel´y pˇredpokl´ ad´ a: racionalitu protihr´aˇce, kompletn´ı informaci o hˇre. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Pˇr´ıklad: Vˇezˇnovo dilema Peter/John vypov´ıdat mlˇcet
vypov´ıdat -10,-10 -20,0
mlˇcet 0,-20 -1,-1
◮
Jak´a je BRPeter (vypovidat) a BRPeter (mlcet)?
◮
Dominuje vypovidat nad mlcet?
◮
vypovidat je striknˇe dominantn´ı strategie, racion´aln´ı hr´aˇc ji bude vˇzdy hr´at.
◮
Oba hr´aˇci maj´ı striktnˇe dominantn´ı strategii. Vznik´a ekvilibrium striktnˇ e dominantn´ıch strategi´ı (nepˇr´ıliˇs v realitˇe ˇcast´e).
◮
Ekvilibrium: s ∗ = (vypovidat, vypovidat) ⇒ Ui (s ∗ ) = −10
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Pˇr´ıklady vˇezˇnova dilematu v naˇsem ˇzivotˇe ◮
Vˇezˇ novo dilema m´ a pˇrekvapivˇe hodnˇe realizac´ı v naˇsem ˇzivotˇe. Ve vˇsech je pak patrn´e, ˇze sobeckost a neschopnost kooperovat vede na m´enˇe optim´ aln´ı v´ysledek hry.
◮
Vˇsechny aspekty reklamy a obchodu: investovat do reklamy, uv´adˇet DPH u v´yrobk˚ u, ...
◮
Zbrojen´ı, mezin´arodn´ı vztahy.
◮
Uˇz´ıv´an´ı hromadn´e dopravy versus osobn´ı auta. A/B Zrada Spolupr´ace
Zrada (trest,trest) (oˇskub´ an´ı,pokuˇsen´ı)
Spolupr´ace (pokuˇsen´ı,oˇskub´an´ı) (odmˇena,odmˇena)
oˇskub´ an´ı < trest < odmˇ ena < pokuˇsen´ı
Jsme jako spoleˇcnost urˇceni k z´ aniku? , Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Varianty vˇezˇnova dilematu Peter/John vypov´ıdat mlˇcet
vypov´ıdat -10,-10 -20,0
mlˇcet 0,-20 -1,-1
Zlepˇs´ı se v´ysledek, kdyˇz: ◮
vˇezni maj´ı moˇznost komunikace pˇred proveden´ım rozhodnut´ı?
◮
se situace opakuje?
◮
je common knowledge, ˇze zr´ adce bude b´ıdnˇe zastˇrelen kump´any venku? (d˚ uvˇeryhodn´ a hrozba): Peter/John vypov´ıdat mlˇcet
vypov´ıdat -500,-500 -20,-1000
Martin Hrub´ y
mlˇcet -1000,-20 -1,-1
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Iterativn´ı eliminace dominovan´ych strategi´ı Myˇslenka: pokud hr´aˇc nikdy nebude hr´ at striktnˇe dominovanou strategii, pak je tato ve hˇre zbyteˇcn´ a (resp. v jeho mnoˇzinˇe strategi´ı). ◮
Kter´e strategie jsou pro hr´ aˇce racion´ aln´ı?
◮
Hru Γ = (Q; {Si }i ∈Q ; {Ui }i ∈Q ) je tedy moˇzno redukovat na Γ′ = (Q; {Si′ }i ∈Q ; {Ui′ }i ∈Q ) bez ztr´ aty strategick´e vˇerohodnosti.
◮
Redukce Γ ⊢ Γ′
◮
Redukce iterativnˇe prob´ıh´ a, dokud je ve hˇre nˇejak´a dominovan´a strategie
◮
Γ ⊢ Γ1 ⊢ ... ⊢ Γj−1 ⊢ Γj , kde Γj = Γj−1
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Iterativn´ı eliminace dominovan´ych strategi´ı: ⊢
Vstup: hra Γ = (Q; {Si }i ∈Q ; {Ui }i ∈Q ) V´ystup: hra Γ′ = (Q; {Si′ }i ∈Q ; {Ui′ }i ∈Q ) 1. ∀i ∈ Q: Sdi := {si ∈ Si |si je striktnˇe dominovan´a }. 2. Γ′ = (Q; {Si \ Sdi }i ∈Q ; {Ui′ }i ∈Q ) 3. ∀i ∈ Q : ∀s ′ ∈ S ′ : Ui′ (s ′ ) = Ui (s ′ ) jsou redukovan´e funkce uˇzitku (restrikce Ui na Ui′ )
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Slab´a dominance ◮
Podobn´y druh dominance, kter´y vˇsak uˇz nen´ı striktn´ı.
◮
Nen´ı jiˇz zcela korektn´ı eliminovat slabˇe dominovan´e strategie (mohly by tvoˇrit ekvilibrium).
Definition Strategie si1 hr´aˇce i ∈ Q slabˇe (weakly) dominuje nad jeho strategi´ı si2 , pokud plat´ı, ˇze: ∀s−i ∈ S−i : Ui (si1 , s−i ) ≥ Ui (si2 , s−i ) a souˇcasnˇe ∃s−i ∈ S−i : Ui (si1 , s−i ) > Ui (si2 , s−i ) Pozn.: Aplikace eliminace zaloˇzen´e na slab´e dominanci jsou moˇzn´e v politick´ych vˇed´ach (volebn´ı mechanismy). Pˇr´ıklad viz McCarthy. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Eliminace her algoritmicky
Zaj´ımav´e pojedn´an´ı je v ˇcl´ anku: Itzhak Gilboa, Ehud Kalai, Eitan Zemel: The Complexity of Eliminating Dominated Strategies, MATHEMATICS OF OPERATIONS RESEARCH, Vol. 18, No. 3, August 1993, pp. 553-565
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
(Strategick´a) ekvivalence her
Definition Hra Γ = (Q, {Si }i ∈Q , {Ui }i ∈Q ) je ekvivalentn´ı s hrou Γ′ = (Q, {Si }i ∈Q , {Ui′ }i ∈Q ), pokud existuj´ı pro kaˇzd´eho hr´aˇce i ∈ Q re´aln´a ˇc´ısla Ai , Bi , kde Ai > 0 a plat´ı ∀s ∈ S: Ui′ (s) = Ai Ui (s) + Bi
Tzn., pokud ke hˇre pˇripoˇctu nˇejak´e ˇc´ıslo (resp. vyn´asob´ım konstantou), strategick´ y charakter hry se nezmˇ en´ı. Pozn´amka: Probl´em finanˇcn´ıho poradce.
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Best-response ekvivalence
Definition Mˇejme hru Γ = (Q; {Si }i ∈Q ; {Ui }i ∈Q ). Nechˇt BRsi =
[
BRi (s−i )
s−i ∈S−i
Pak je hra Γ′ = (Q; {BRsi }i ∈Q ; {Ui′ }i ∈Q ) BR-ekvivalentn´ı s Γ. Pozn.: zamyslete se nad algoritmem v´ypoˇctu BR-ekvivalentn´ı hry. Pozn.: m˚ uˇze Γ′ obsahovat striktnˇe nebo slabˇe dominovan´e strategie?
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Never Best-response strategie
Definition Mˇejme hru Γ = (Q; {Si }i ∈Q ; {Ui }i ∈Q ). Pro kaˇzd´eho hr´aˇce i ∈ Q lze strategie z hlediska BR rozdˇelit do tˇechto kategori´ı: ◮
BR strategie – BRsi .
◮
Always-BR (vˇzdy) strategie – ABRi ⊆ BRsi a plat´ı ∀si ∈ ABRi : si ∈ BRi (s−i ) pro vˇsechny s−i ∈ S−i
◮
Never-BR (nikdy) strategie – NBRi = Si \ BRsi .
Jak´y je vztah BR a strategick´e dominance? Vˇeta, d˚ ukaz...
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Hry bez striktnˇe dominantn´ıch strategi´ı Striktn´ı dominance je neobvykl´ a. Situace (Skinner˚ uv chl´ıvek): m´ame dvˇe prasata (dominantn´ı a submisivn´ı) zavˇren´a ve chl´ıvku vybavan´em p´akou a korytem. Kdyˇz se stiskne p´ aka, do koryta spadne ˇzr´adlo s energetickou hodnotou 10 jednotek. Cesta k p´ace a zp´atky ke korytu spotˇrebuje dvˇe jednotky energie. Pˇredpokl´ad´ame, ˇze dominantn´ı prase v souboji o koryto vˇzdy v´ıtˇez´ı.
dominantn´ı/submisivn´ı stiskni p´ aku stiskni p´aku 8,-2 ˇ u koryta sed 10,-2 Martin Hrub´ y
ˇ u koryta sed 5,3 0,0
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Nashovo ekvilibrium v ryz´ıch strategi´ıch
◮
Hr´aˇc bude vˇzdy hr´ at Best-response. Vˇsichni hr´aˇci budou vˇzdy hr´at best-response na best-response protivn´ıka, na BR na BR na BR, ...
◮
Vz´ajemn´a BR je rovnov´ aha.
◮
Snaha hr´at BR je zˇrejmˇe common knowledge ve hˇre.
◮
Ekvilibrium je strategick´y profil, ve kter´em ˇza´dn´y hr´aˇc nem˚ uˇze zlepˇsit sv˚ uj uˇzitek zmˇenou sv´e strategie (tzn. zmˇenou sv´e strategie si m˚ uˇze zhorˇsit uˇzitek).
◮
Pure Nash Equilibrium (PNE).
◮
Mixed Nash Equilibrium (MNE).
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Definice Nashova ekvilibria v ryz´ıch strategi´ıch Definition Mˇejme hru Γ. Profil s ∗ ∈ S se naz´yv´ a Nashovo ekvilibrium v ryz´ıch strategi´ıch, pokud plat´ı: ∗ ∗ ∀i ∈ Q : ∀si ∈ Si : Ui (si∗ , s−i ) ≥ Ui (si , s−i )
Definice plat´ı bez ohledu na to, zda-li si = si∗ nebo si 6= si∗ . Nashovo ekvilibrium je nejv´ yznamnˇ ejˇs´ı solution concept v nekooperativn´ıch strategick´ ych hr´ ach s nenulov´ ym souˇ ctem. Celkovˇe je NE z´ akladn´ı koncept vˇsech her. Pozn.: Znalost definice NE a jeho pochopen´ı je absolutnˇe nezbytn´e pro pˇredmˇet THE. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
John Forbes Nash jr., (nar. 1928) Nashovo ekvilibrium bylo poprv´e definov´ ano v tˇechto ˇcl´anc´ıch: ◮
Nash, J.: Equilibrium points in n-person games, Proceedings of the National Academy of Sciences 36(1):48-49., 1950
◮
Nash, J.: Non-Cooperative Games, The Annals of Mathematics 54(2):286-295, 1951
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Alternativn´ı definice NE
Vych´az´ıme z pozn´an´ı, ˇze NE je sloˇzeno ze vz´ ajemnˇe nejlepˇs´ıch odpovˇed´ı, tud´ıˇz:
Definition Mˇejme hru Γ. Profil s ∗ ∈ S se naz´yv´ a Nashovo ekvilibrium v ryz´ıch strategi´ıch, pokud plat´ı: ∗ ∀i ∈ Q : si∗ ∈ BRi (s−i )
Pozn.: vˇsimnˇeme si, ˇze matematika definuje pojem v´ysledku, ale neukazuje cestu k jeho v´ypoˇctu. Budeme zkoumat algoritmy v´ypoˇctu PNE (a ˇcasem MNE).
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Vlastnosti PNE Pojem efektivnost profilu/ekvilibria: E (s) =
X
U(s)
i ∈Q ◮
Pokud je hra Γ modelem nˇejak´e re´ aln´e situace a Γ m´a PNE, pak je velmi pravdˇepodobn´e, ˇze i hr´ aˇci v realitˇe se budou chovat podle PNE (PNE je self-enforcing).
◮
Hra m˚ uˇze m´ıt v´ıce PNE. Pak si pˇredstavme PNE jako energetickou stabiln´ı hladinu, kter´ a udrˇzuje hr´aˇce v nˇejak´em chov´an´ı. Pokud pˇripust´ıme opakov´ an´ı hry, tak m˚ uˇze doj´ıt k pˇresunu chov´an´ı hr´ aˇc˚ u z jednoho ekvilibria do jin´eho (obvykle efektivnˇejˇs´ıho).
◮
M˚ uˇze existovat hra bez PNE, ale nˇejak´e chov´an´ı v n´ı hr´aˇci pˇresto maj´ı (bude m´ıt stochastick´y charakter). Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Vlastnosti PNE: NE je neeliminovateln´e
Theorem Je-li (s1∗ , s2∗ , ..., sN∗ ) Nashovo ekvilibrium, pak ˇz´ adn´a z jeho strategi´ı si∗ nem˚ uˇze b´yt ze hry eliminov´ ana iterativn´ı eliminac´ı striktnˇe dominovan´ych strategi´ı. Intuitivnˇe ch´apeme, ˇze strategie hr´ aˇc˚ u v ekvilibriu jsou jaksi v´ıtˇez´ıc´ı a ˇze nem˚ uˇze pro ˇz´adn´eho hr´ aˇce i ∈ Q existovat takov´a strategie ∗ ) > U (s ∗ ). s ′ ∈ Si \ {si∗ }, ˇze by Ui (s ′ , s−i i Tento fakt je pro anal´yzu her velmi d˚ uleˇzit´y. Plyne z toho, ˇze iterativn´ı eliminace dominovan´ych strategi´ı m˚ uˇze b´yt pouˇzita jako nˇejak´e ”pˇredzpracov´an´ı” hry.
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Vlastnosti PNE
Theorem ustal po iterativn´ı eliminaci Je-li (s1∗ , s2∗ , ..., sN∗ ) jedin´y profil, kter´y z˚ striktnˇe dominovan´ych strategi´ı, pak je tento profil jedin´ym Nashov´ym ekvilibriem. Toto je taky jasn´e, protoˇze pak je tento profil ekvilibrium striktnˇe dominantn´ıch strategi´ı. Mimo to, pokud m´ a hra Γ = (Q; S; U) mnoˇzinu profil˚ u takovou, ˇze S = {s} (tzn. |S| = 1), pak s je ekvilibrium, protoˇze neexistuje pro ˇz´ adn´eho hr´ aˇce jin´ a (lepˇs´ı) strategie.
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Algoritmy nalezen´ı PNE Algoritmy pro nalezen´ı PNE jsou v z´ akladu jednoduch´e. Jejich problematiˇcnost m˚ uˇze spoˇc´ıvat v algoritmick´e ˇcasov´e sloˇzitosti. Algoritmy: ◮ PNEs(Γ) = {s ∈ S|s je ekvilibrium} ◮ Redukce na BR-ekvivalentn´ ı hru, n´ aslednˇe konvenˇcn´ı algoritmus ◮ Redukce iterativn´ ı eliminac´ı striktnˇe dominovan´ych strategi´ı, ... Konvenˇcn´ı v´ypoˇcet: S 1. Let BRprofsi = s−i ∈S−i {(b, s−i )|b ∈ BRi (s−i )} T 2. PNEs = i ∈Q BRprofsi dominantn´ı/submisivn´ı stiskni p´ aku stiskni p´aku 8,-2 ˇ u koryta sed 10,-2 Martin Hrub´ y
ˇ u koryta sed 5,3 0,0
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Efektivita v´ysledku hry, dominance nad profily Pˇredpokl´adejme, ˇze v´ypoˇctem dos´ ahneme mnoˇziny ekvilibri´ı ∗,1 ∗,2 PNEs = {s , s ...}. ◮
Zkoum´ame, je-li nˇejak´y profil efektivnˇejˇs´ı neˇz druh´y, tzn. E (s ∗,1 ) >? E (s ∗,2 ).
◮
Ot´azkou je opˇet naˇse schopnost predikovat chov´an´ı hr´aˇc˚ u– ∗,j tedy, kter´y profil s zvol´ı.
◮
Zn´am´ym modelem t´eto situace jsou koordinaˇcn´ı hry.
Pochopme, ˇze TH ned´ av´ a odpovˇedi na ot´ azky, co hr´aˇci udˇelaj´ı. Teorie her je dle jedn´e hezk´e definice (Osborne,Rubinstein) pytel analytick´ych n´astroj˚ u pro pochopen´ı chov´ an´ı jedinc˚ u pˇri strategick´em rozhodov´ an´ı.
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Jak naloˇzit s v´ysledkem?
Interpretace v´ysledk˚ u anal´yzy hern´ıho modelu je proto d˚ uleˇzit´a. ˇ pak je tˇreba Pokud trv´ame na to, ˇze chceme od modelu odpovˇed, dodat model chov´an´ı v situaci v´ıce ekvilibri´ı. R˚ uzn´e varianty pojet´ı optim´ aln´ıho v´ysledku. Nejzn´amˇejˇs´ı je pojet´ı pojmenovan´e podle Vilfreda Pareto (1848–1923, italsk´y ekonom).
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Pareto efektivita (optimalita) Mˇejme hru Γ = (Q; {Si }i ∈Q ; {Ui }i ∈Q ):
Definition Strategick´y profil (ekvilibrium) s ∈ S pareto dominuje nad profilem s ′ ∈ S, jestliˇze plat´ı: ∀i ∈ Q : Ui (s) ≥ Ui (s ′ ) a souˇcasnˇe existuje alespoˇ n jedno i ∈ Q, ˇze Ui (s) > Ui (s ′ ) Pak m˚ uˇzeme pokraˇcovat v rozhodov´ an´ı nad ekvilibrii tak, ˇze hled´ame Pareto efektivn´ı ˇreˇsen´ı.
Definition Strategick´y profil (ekvilibrium) s ∈ S je pareto efektivn´ı (optim´aln´ı), pokud neexistuje jin´y profil s ′ ∈ S, kter´y by pareto dominoval s. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Koordinaˇcn´ı hra Koordinaˇcn´ı hra je speci´ aln´ım pˇr´ıpadem hry, kdy je pro hr´ aˇce lepˇs´ı se domluvit na spoleˇcn´e volbˇe strategie (napˇr. stejn´eho IT standardu). Pˇr´ıklady: j´ızda po silnici, Battle of sexes, Stag hunt (Lov na jelena, modeluje konflikt ”zabezpeˇcen´ı se” versus soci´ aln´ı kooperace, Jean-Jacques Rousseau) A/B left right
left 10,10 0,0
right 0,0 10,10
A/B lovit jelena lovit zaj´ıce
ˇzena/muˇz box balet
lovit jelena 10,10 7,0
Martin Hrub´ y
box 2,3 1,1
balet 1,1 3,2
lovit zaj´ıce 0,7 7,7
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Antikoordinaˇcn´ı hra Slavn´a je hra ”Game of chicken”. Dva puberˇt´ aci se potˇrebuj´ı veˇrejnˇe zviditelnit. Sednou do sv´ych aut a jedou proti sobˇe. Kdo uhne, je srab (ovˇsem zp˚ usob´ı, ˇze oba pˇreˇzij´ı). A/B srab drsˇ n´ ak
srab 0,0 1,-1
drsˇ n´ ak -1,1 -100,-100
Je to uk´azka hry, kdy je l´epe volit navz´ ajem opaˇcn´e strategie. Tuto situaci budeme studovat d˚ ukladnˇeji v dynamick´ych hr´ach, kde si zavedeme pojem ”d˚ uvˇeryhodn´ a/ned˚ uvˇeryhodn´ a hrozba”. Tuˇs´ıme, ˇze c´ılem je pˇresvˇedˇcit protivn´ıka, ˇze vy rozhodnˇe neuhnete, pak je jeho BR uhnout. Tato situace je zn´ am´ a tak´ e z tzv. Kub´ ansk´ e krize (Cuban missile crisis, ˇr´ıjen 1962). Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Ultimatum game
Dva hr´aˇci se maj´ı podˇelit o 100 duk´ at˚ u. Dˇelba prob´ıh´ a tak, ˇze ˇ ˇra´dkov´y hr´aˇc navrhne rozdˇelen´ı a sloupcov´y ho bud pˇrijme (a pak je provedeno) nebo odm´ıtne (a pak pen´ıze nedostane nikdo). Jak´y je model hry? M´ a hra PNE? Vˇeˇr´ıte tomu PNE?
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Nekooperativn´ı versus kooperativn´ı chov´an´ı Peter/John pˇriznat se zatloukat
pˇriznat se -10,-10 -20,0
zatloukat 0,-20 -1,-1
◮
PNE je stabiln´ı ˇreˇsen´ı hry. B´yv´ a pˇrekvapuj´ıc´ı, jak tento outcome m˚ uˇze b´yt neefektivn´ı ve srovn´ an´ı s jin´ymi profily (kter´e ovˇsem nejsou self-enforcing).
◮
Pˇr´ıkladem je profil (zatloukat,zatloukat) ve Vˇezˇ novˇe dilematu.
◮
Kooperativn´ı ˇreˇsen´ı hry m˚ uˇze b´yt efektivnˇejˇs´ı pro spoleˇcnost, ale dominov´ano jinou strategi´ı jedince.
◮
Budeme zkoumat moˇznosti tvorby koalic a vyjedn´av´an´ı.
◮
Kooperativnost do chov´ an´ı zav´ ad´ı taky opakov´an´ı hern´ı situace (kde hr´aˇci mus´ı ˇcelit n´ asledk˚ um pˇredchoz´ı hry) – model: restaurace v turistick´e z´ onˇe versus hospoda pro m´ıstn´ı. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Pˇr´ıklad hry bez PNE: Matching pennies Kaˇzd´y hr´aˇc m´a penny. Tajnˇe otoˇc´ı svoje penny na heads/tails (t´ım vol´ı strategii). A/B heads tails
heads 1,-1 -1,1
tails -1,1 1,-1
◮
Jak se zachovaj´ı hr´ aˇci, pokud nemaj´ı PNE?
◮
Co znamen´a, ˇze neexistuje PNE?
◮
Budou hr´aˇci hru hr´ at? Zˇrejmˇe mus´ı...
◮
Zopakujme si, ˇze TH je analytick´y n´ astroj pro zkouman´ı interakc´ı.
◮
Hr´aˇci hru hraj´ı, rozhoduj´ı se, takˇze mus´ı existovat jej´ı matematick´y model. Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e
Z´avˇer
◮
Definice a v´yznam hry v norm´ aln´ı formˇe.
◮
Best-response, strategick´ a dominance, ...
◮
Nashovo ekvilibrium v ryz´ıch strategi´ıch (PNE).
◮
Existuj´ı hry bez PNE, ale zˇrejmˇe maj´ı jinou formu ˇreˇsen´ı.
ˇ sen´ı sm´ıˇsen´eho NE. Pˇr´ıˇstˇe: Reˇ
Martin Hrub´ y
THE: Nekooperativn´ı hry v norm´ aln´ı formˇ e