Műszaki folyamatok közgazdasági elemzése Kevert stratégiák és evolúciós játékok Fogalmak: 1. Tiszta stratégia 2. Vegyes stratégia. Ha m tiszta stratégia létezik és a p ij annak valószínűsége, hogy az i-
T
edik játékos a j-edik stratégiát választja, j 1,..., m , akkor a p i p1i , p2i , ..., pmi vektor az i-edik játékosnak egyik lehetséges vegyes stratégiája, ahol nyilván m
p j 1
i j
1.
3. Nash-stratégia: valamely játékos legjobb válasza az ellenfél bármelyik stratégiája, azaz ha S i és S j két játékos stratégia-halmazai, i si ; s j pedig az a kifizetés, amelyet az i-deik játékos kap, ha si -t választ, a j-edik játékos pedig s j -t, si S i és s j S j , akkor si S i Nash-stratégia, ha minden s j S j esetén
i si ; s j i si ; s j , si Si . 4. Nash-egyensúly: minden játékos Nash-stratégiát választ. Példa: Két cég ugyanazt a terméket állítja elő. A forgalom növelése érdekében reklámozni kellene ezt, de az ezzel kapcsolatos költségek magasak. Mit csináljanak? a) nem vesznek részt a reklámtevékenységben kicsi a forgalom b) mindkettő részt vesz a reklámozásban mindkettőnek nő a forgalma, de a költségek is nőnek, c) Csak az egyik vesz részt a reklámozásban aránytalanul magas költségek merülnek fel, de a másik profitál mint potyautas
Legyen a kifizetési mátrix (R – részvétel; N – nem vesz részt II. játékos
R
N
R
5;5
1;4
N
4;1
0;0
I. játékos
Könnyen kimutatható, hogy tiszta stratégiák esetén nincs Nash-egyensúly.
0,5 0,5 Ha vegyes stratégiákat is megengedünk, akkor a p I , valamint a p II stratégiák 0,5 0,5 Nash-egyensúlyt alkotnak, hiszen mindkét esetben az I. játékos kifizetése 2, a II. játékos kifizetése pedig 3. Gyakorló feladat: Ábrázolja a vegyes stratégiák halmazát! Adott a héja-galamb-játék, amelynek keretében valamely populáció két tagja valamely erőforrásért folytatott harcban vagy héjaként (agresszíven) vagy galambként (békésen) viselkedhet. Az erőforrás értéke legyen V, a „harc” költségei legyenek C. Véletlenszerűen kiválasztunk két individuumot. Ebből a következő kifizetések adódnak: (H – héja; G – galamb) II. játékos
H I. játékos G
H
G
V C V C ; 2 2
V ;0
0;V
V V ; 2 2
Legyen C V , ekkor a kifizetések sorrendje:
V C V 0 V . 2 2
Gyakorló feladat: Határozza meg a tiszta stratégiák mellett kialakuló Nash-egyensúly(oka)t! Tegyük fel, hogy az I. játékos p valószínűséggel H-t választ és – ennek megfelelően – 1 p valószínűséggel G-t; a II. játékos pedig q valószínűséggel H-t választ és – ennek megfelelően – 1 q valószínűséggel G-t.
Gyakorló feladat: Vizsgálja meg, hogy létezik-e Nash-egyensúly vegyes stratégiák esetén. Ha igen, akkor q p határozza meg ezeket, azaz határozza meg a p , valamint a q vektorokat! 1 p 1 q
V C T A számolási menet során képezzük a p Aq 1 1 p 2 0
V q szorzatot, ami nem V 1 q 2 q más, mint az I. játékos várható kifizetése, ha a II. játékos a q vegyes stratégiát 1 q választja. Amennyiben T T pˆ Aq pˆˆ Aq , pˆˆ S I ,
Azt mondjuk, hogy pˆ az I. játékos legjobb válasza a II. játékos q stratégiájára. Ebből következik, hogy ha minden játékos esetében pˆ a legjobb válasza a saját pˆ stratégiájára, azaz, ha T T pˆ A pˆ pˆˆ A pˆ , pˆˆ Si , i I , II ,
akkor pˆ nyilván Nash-egyensúly.
Evolúciós játékok esetében a vegyes stratégiájú játékokban szereplő valószínűségeket adottnak tekintjük, mégpedig azon részarányokkal azonosítjuk ezeket, amelyekben a két különböző viselkedést mutató egyedből álló részpopulációk az összpopulációban jelen vannak. Tehát tegyük fel valamely populációt (élőlények, vállalatok, fogyasztók, stb.), amely
két csoportba osztható: az egyik csoport héja-viselkedést mutat (mindig!), azaz agresszív, a másik csoportba tartozó egyedek mindig galamb-viselkedést mutatnak, azaz békések, azaz egyedek viselkedése úgyszólván genetikailag meghatározott. Legyen N (t ) valamely populáció (vállalat, fogyasztók, élőlények, stb.) száma a t-edik időpontban, N i (t ), i 1, ..., n , pedig egy meghatározott viselkedésű részpopuláció száma, szintén a t-edik időpontban. Jelöljük A aij , i, j 1, ..., n , a kifizetési mátrixot, amelynek aij eleme azt mutatja, hogy mekkora az i-edik csoporthoz tartozó egyed „életképessége”, ha
valamely j-edik csoportbeli egyeddel találkozik; általában azt szokták mondani, hogy aij az iedik csoporthoz tartozó egyed utódainak száma, ha valamely j-edik csoportbeli egyeddel T találkozik. Azt tételezzük fel, hogy az A mátrix szimmetrikus, azaz aij a ji , illetve A A . Ha – mint a héja-galamb-játék esetében – n 2 , akkor N1 (t ) az agresszív viselkedésű egyedek száma, N 2 (t ) pedig a békésebb egyedek száma, mindkettő természetesen a t-edik időpontban. Igaz, hogy N (t ) N1 (t ) N 2 (t ) . Ha -vel jelöljük a – mindkét csoportra egyaránt érvényes – (természetes) halálozási rátát, akkor
N i (t 1) N i (t ) 1 ei A p (t ) , i 1,2 T
p (t ) 1 0 N (t ) ahol e1 , e 2 és p(t ) 1 ; továbbá pi (t ) i , i 1,2 . N (t ) 0 1 p2 (t ) Gyakorló feladat: Határozza meg N1 (t ) -t és N 2 (t ) -t! Az A mátrixot használja a következő alakban
a a A 11 12 ! a21 a22 Ha meghatároztuk N i (t 1) -t, i 1,2 , akkor ebből adódik
1 e i A p(t ) N (t 1) , i 1,2 , pi (t 1) i pi (t ) T N (t 1) 1 p A p(t ) T
illetve e i A p(t ) p (t ) A p(t ) T
pi (t 1) pi (t ) pi (t )
T
1 p (t ) A p(t ) T
.
Gyakorló feladat: T
Határozza meg az e1 A p(t ) értéket és értelmezze ezt! Ha a periódus hossza nem egységnyi, hanem , akkor
pi (t ) pi (t )
e i A p(t ) p (t ) A p(t ) T
pi (t )
T
1 p (t ) A p(t ) T
,
azaz lim
pi (t ) pi (t )
0
e i A p(t ) p (t ) A p(t ) T
lim pi (t ) 0
T
1 p (t ) A p(t ) T
,
tehát
dpi (t ) T T p i (t ) pi (t ) e i A p(t ) p (t ) A p(t ) . dt
Nyilván, ha ei A p(t ) p (t ) A p(t ) 0 , akkor pi (t ) nő, ha ei A p(t ) p (t ) A p(t ) 0 , akkor T
T
T
T
csökken pi (t ) . Más szóval: Ha az i-edik csoporthoz tartozó egyedek kifizetése meghaladja a populáció egészére átlagosan érvényes kifizetést, akkor az i-edik csoport részaránya a populáción belül nő, s fordítva, ha az i-edik csoporthoz tartozó egyedek kifizetése elmarad a populáció egészére átlagosan érvényes kifizetés mögött, akkor az i-edik csoport részaránya a populáción belül csökken. Ennek értelmében a populáció összetétele változatlan, azaz a populáció egyensúlyban van, ha minden részpopuláció az átlagos kifizetést realizál, hiszen ekkor p i (t ) 0, i . Gyakorló feladat: Vegyük a fenti kétszereplős esetet és vizsgáljuk meg, mikor aszimptotikusan stabil a populációs egyensúly! A fenti egyensúlyi állapot stabilitás különbözik az evolúciósan stabil stratégia, illetve egyensúlytól. Definíció:
Evolúciósan stabilnak nevezzük azt a p stratégiát, amely az összes p p esetén kielégíti a következő feltételeket:
T
(i)
p Ap p Ap ,
T
T
T
ha p A p p A p , akkor p A p p A p .
(ii)
T
T
Következmény: Minden evolúciósan stabil stratégia egyben Nash-egyensúly. De nem minden Nash-egyensúly evolúciósan stabil. Értelmezés:
1. Nincs olyan p stratégia, amely egy evolúciósan stabil p stratégiával szemben magasabb kifizetést realizál. 2. Ha a két kifizetés egyenlő egymással, akkor az evolúciósan stabil p stratégia a másikkal szemben nagyobb kifizetést biztosít, mint az utóbbi saját magával szemben. Tehát az evolúciósan stabil stratégia rezisztens minden másik stratégiával szemben, de ugyanakkor arra képes, hogy bármilyen másik stratégiát gyengít(hes)se. Gyakorló feladat: Vizsgáljuk meg, hogy a következő kifizetési mátrix-szal megadott játék evolúciósan stabil-e, ha feltételezzük, hogy a populációnak van olyan csoportja, amely mindig az A stratégiát választja, szemben a másik csoporttal, amely mindig B-t választ:
II. játékos
A
B
A
2;2
2;5
B
5;2
5;5
I. játékos