Speltheorie Versie 2.0
Sake Elzinga (29347) Lerarenopleiding Algemene Economie 1e graad Wergea, 9 augustus 2006
1
Inhoud 1.
Inleiding....................................................................................... 3 1.1.
Wat is een spel? ........................................................................................................ 3
1.2.
Geschiedenis ............................................................................................................. 3
1.3.
Modellen ..................................................................................................................... 5
1.4.
Rationele keuzes en verwachtingen ........................................................................ 5
2.
Theorie ........................................................................................ 7 2.1.
Strategisch spel......................................................................................................... 7
2.2.
Nash evenwicht ......................................................................................................... 8
2.3.
“Best response function” ......................................................................................... 8
2.4.
De twee gevangenen ................................................................................................. 9
2.5.
Bach of Stravinsky .................................................................................................. 11
2.6.
Matching pennies .................................................................................................... 11
2.7.
Hertenjacht............................................................................................................... 12
3.
4.
Toepassingen ........................................................................... 13 3.1.
Republiek van Plato. ............................................................................................... 13
3.2.
Monetair beleid ........................................................................................................ 13
3.3.
De Dijken .................................................................................................................. 15
3.4.
Het Cournot model .................................................................................................. 15
3.5.
Het Stackelberg model............................................................................................ 17
Toets.......................................................................................... 18
2
1. INLEIDING 1.1.
Wat is een spel?
Volgens van Dale is een spel een bezigheid ter ontspanning volgens vaste regels met elementen als verbeelding, competitie, behendigheid, inzicht en kans. Bekende spelen ter ontspanning zijn: • • •
Mens erger je niet Solitair Kolonisten van Catan
Solitair is een spel voor één speler. Op een speelbord staan een aantal pionnen (zie figuur 1).
Figuur 1 De bedoeling van het spel is dat je één pion overhoud. Deze pion moet in het midden van het speelbord komen te staan.(zie figuur 2). Je moet je hierbij aan de volgende spelregels houden. Je mag alleen horizontaal of verticaal over een pion heen springen. De pion waar je over heen springt, moet verwijderd worden.
Figuur 2 Zoals je ziet kent het spel één speler en spelregels. Om het spel tot een goed einde te brengen heb je inzicht nodig in de volgorde van de stappen (strategieën), die je moet zetten. Wij zullen het in deze lesbrief verder niet hebben over spelen ter ontspanning, maar over het verschijnsel dat een economische situatie weergegeven kan worden als de uitkomst van een spel met twee of meerdere spelers. Dit verschijnsel staat bekend als speltheorie. Voordat wij ons daadwerkelijk bezig gaan houden met speltheorie eerst een stukje geschiedenis en een paar belangrijke begrippen, zoals modellen en rationele keuzes, die je moet kennen om speltheorie te kunnen begrijpen.
1.2.
Geschiedenis
De basis voor de speltheorie werd in 1928 gelegd door een artikel van Oostenrijkse wiskundige John von Neumann met als titel “Zur Theorie der Gesellschaftsspiele”. In de jaren dertig van de vorige eeuw emigreerde hij naar de Verenigde Staten en ging daar werken aan de universiteit van Princeton. Aan deze universiteit ontmoette John von Neumann de econoom Oscar Morgenstein. Deze ontmoeting leidde in 1944 tot de publicatie van het boek “Theory of Games and Economic Behavior”. Dit boek zou later de basis blijken te zijn van de speltheorie.
3
In hun boek maken von Neumann en Morgenstern onderscheid tussen niet-coöperatieve spelen en coöperatieve spelen. In het eerste geval gaat het om situaties waarbij spelers geen bindende afspraken kunnen maken. Wat de optimale uitkomst is voor de ene speler is dan afhankelijk van de keuze van de andere speler. In het tweede geval kunnen de spelers gewoon overleggen welke keuzes zij zullen maken. Omdat er dan een cultuur ontstaat, waarin zowel competitie als samenwerking belangrijk zijn, zijn er bij deze situaties ook veel meer mogelijkheden. Door de vele mogelijkheden zijn coöperatieve spelen moeilijker op te lossen. Eerder werd de speltheorie ook al bestudeerd, maar na dit boek van von Neumann en Morgenstern, was hier veel meer belangstelling voor. Zie om een indicatie te geven hoeveel eerder speltheorie al werd bestudeerd “Uit de Talmud” in het kader. In het begin van de jaren vijftig loste John F. Nash enkele problemen van von Neumann en Morgenstern op. De belangrijkste was de ontdekking van het naar Nash vernoemde Nash evenwicht bij niet-coöperatieve spelen. Von Neumann en Morgenstern dachten dat een evenwicht in strategieën, wat voor de eerste keer in 1832 door Cournot werd vermeld, niet genoeg was om een gehele theorie te onderbouwen. Zij beperkten zich hierdoor tot de zerosum spelen. De omschrijving van het evenwicht in strategieën door Nash maakte echter duidelijk dat deze beperking niet nodig was. Het Nash-evenwicht is tegenwoordig misschien zelfs het belangrijkste middel in de speltheorie. Rond deze tijd is ook het ”prisoner’s dilemma” bedacht door Albert W. Tucker. Hij bracht een bezoek aan de Stanford Universiteit om de structuur van de puzzel (het spel), die was ontwikkeld door Merril Flood en Melvin Dresher, uit te leggen aan een gezelschap van psychologen. Na de jaren vijftig van de vorige eeuw is de speltheorie steeds verder ontwikkeld. In 1994 heeft dit geresulteerd in een Nobelprijs voor de economie voor John Nash, John C. Harsanyi en Reinhard Selten voor hun pioniers werk op het terrein van evenwicht bij niet-coöperatieve spelen. En in 2005 heeft dit opnieuw geresulteerd in een Nobelprijs voor de economie. Deze keer voor Robert J. Aumann en Thomas C. Schelling voor hun werk op het terrein van een verbetering van ons begrip op conflicten en samenwerking met behulp van speltheorie. UIT DE TALMUD Een voorbeeld van coöperatieve speltheorie vinden we al in de Talmud. De Talmud is een compilatie van oude wetten en tradities samengesteld gedurende de eerste vijf eeuwen van onze jaartelling. De Talmud dient als de basis voor het Joods religieus, straf en burgerlijk recht. Één van de problemen die in de Talmud worden besproken is het probleem van het huwelijkscontract: een man heeft in zijn testament laten opnemen dat zijn drie vrouwen na zijn dood respectievelijk 100, 200 en 300 zullen ontvangen. De Talmud lijkt tegenstrijdige adviezen te geven in geval de man niet voldoende nalaat. Bedraagt de nalatenschap 100, dan adviseert de Talmud een gelijke verdeling. Bedraagt de nalatenschap 300, dan adviseert de Talmud een proportionele verdeling (50, 100, 150). Bedraagt de nalatenschap echter 200 dan adviseert de Talmud een verdeling van (50, 75, 75). Eeuwenlang heeft dit tegenstrijdige advies onderzoekers voor een onoplosbaar raadsel geplaatst. Uiteindelijk bleek het advies overeen te komen met een oplossing uit de moderne coöperatieve speltheorie. Dit werd in 1985 door R.J. Aumann en M. Maschler ontdekt. Om te begrijpen hoe de voorgeschreven verdeling van de Talmud tot stand is gekomen, is het raadzaam het probleem eerst wat te vereenvoudigen door uit te gaan van slechts twee personen. Laten we dus aannemen dat een man twee vrouwen heeft en dat hij in zijn testament heeft opgenomen dat ze respectievelijk 200 en 300 krijgen. Zijn nalatenschap bedraagt echter slechts 300. Hoe moeten we deze nalatenschap verdelen? In de Talmud wordt, zonder dat het wordt vermeld, als volgt geredeneerd: Geen van de vrouwen behoort meer te krijgen dan haar nagelaten is. Maar dit betekent dat de eerste vrouw dus niet meer dan 200 dient te krijgen. De tweede vrouw heeft dus een exclusieve claim op de 100 die boven deze 200 uitgaat. 100 is dus zondermeer voor de tweede vrouw. De eerste vrouw heeft echter geen exclusieve claim. Als de tweede vrouw immers alles heeft gekregen wat haar volgens het testament zou worden nagelaten, blijft er niets meer over. Het gedeelte van de nalatenschap waarover strijd wordt gevoerd is dus 200. Dit gedeelte wordt gelijk over de vrouwen verdeeld. Dit betekent dat de eerste vrouw 100 (de helft van het gedeelte waarover strijd is) krijgt, terwijl de tweede vrouw 200 (de helft van het deel waarover strijd is + het deel waarop zij een exclusieve claim heeft) krijgt. Nu gaan we weer terug naar het oorspronkelijke probleem. Het oplossen gaat in twee stappen. Beschouw in de eerste stap de tweede en derde vrouw als één “vrouw”. Deze “vrouw” heeft dan
4
volgens het testament recht op 200 plus 300 is 500 uit de nalatenschap. Pas de eerder beschreven methode met twee personen toe op de vrouw, die volgens het testament 100 krijgt en de “vrouw”, die 500 krijgt. Na toepassing van deze methode is bekend welk bedrag de tweede en derde vrouw daadwerkelijk uit de nalatenschap krijgen. De tweede stap bestaat uit het toepassen van de methode met twee personen op de tweede en de derde vrouw. Een man heeft in zijn testament staan dat zijn twee vrouwen respectievelijk 300 en 400 krijgen. De nalatenschap bedraagt 500. Hoe zou dit bedrag verdeeld moeten worden volgens de Talmud? Verklaar de adviezen uit de Talmud.
1.3.
Modellen
Net zoals veel andere wetenschappen bestaat de speltheorie uit een verzameling modellen. Een model is een abstractie van de werkelijkheid om onze observaties en ervaringen beter te kunnen begrijpen. Als je met een tennisracket een tennisbal wegslaat dan volgt de tennisbal een baan door de lucht. Deze baan wordt bepaald door de snelheid van de bal en de zwaartekracht, die op de tennisbal wordt uitgeoefend. De baan (het model) is altijd een parabool. Hierbij maakt het niets uit met welke snelheid of onder welke hoek de tennisbal wordt weggeslagen. Het hoeft ook geen tennisbal te zijn. Het kan elk mogelijk voorwerp zijn, als je het maar een snelheid kunt geven. Een model zal ons niet helpen om iets beter te begrijpen als de veronderstellingen sterk afwijken van wat wij observeren en ervaren. Aan de andere kant is de kracht van een model de eenvoud. Alleen de essentie moet worden meegenomen en geen irrelevante details. Wat de essentie is en wat irrelevante details zijn, is soms moeilijk vast te stellen. Wanneer ik de kortste route wil weten van Leeuwarden naar Harlingen dan ga ik ervan uit dat de aarde plat is. Dat de aarde in werkelijkheid een bol is, is in dit geval een irrelevant detail. Het wordt anders als ik met een vliegtuig van Amsterdam naar Tokyo wil vliegen. Om nu de kortste afstand te kunnen bepalen is het essentieel dat je rekening houdt met het feit dat de aarde een bol is. Als je een berg wilt beklimmen is het irrelevant of de aarde nu een bol is of gewoon plat is. Een van de redenen waarom wij een beter begrip willen krijgen van wat er om ons heen gebeurt, is om de omgeving gericht te kunnen beïnvloeden. Modellen uit de speltheorie hebben vooral tot doel om een beter begrip te krijgen van sociale, politieke en economische verschijnselen. Een beter begrip van economische verschijnselen kan er toe leiden dat wij ons (individuele) gedrag aanpassen om bijvoorbeeld een hoger welvaartsniveau te bereiken.
1.4.
Rationele keuzes en verwachtingen
Een belangrijk uitgangspunt bij vele spelen is de theorie van de rationele keuzes. In het kort komt het erop neer dat iemand uit een aantal mogelijkheden de mogelijkheid kiest, die zijn grootste voorkeur heeft. De keuzemogelijkheden, die iemand tot zijn beschikking heeft noemen wij ook wel de acties, die iemand uit kan voeren. Stel je kunt kiezen tussen een vakantie naar Londen, Parijs of Rome. Je hebt nu drie keuzemogelijkheden en daarmee beschik je over drie mogelijke acties, die je uit kunt voeren. Welke keuze maak je of in andere woorden welke actie ga je uitvoeren? Dit zal van persoon tot persoon verschillend zijn. De een gaat nu eenmaal liever naar Rome en de ander naar Parijs. Stel je gaat zelf het liefst naar Rome. Als dat om de een of andere reden niet lukt dan ga je het liefst naar Londen en als ook dat niet lukt dan maar naar Parijs. Je hebt een duidelijke volgorde van voorkeur voor de actie, die je uit wilt voeren. Op de eerste plaats een vakantie naar Rome op de tweede plaats een vakantie naar Londen en op de derde plaats een vakantie naar Parijs. Zoals je ziet, zet je de actie, die je het liefst uitvoert op de eerste plaats. De volgende actie op de tweede plaats enzovoort. In de speltheorie is het echter gebruikelijk om aan de actie, die je het liefst uitvoert de hoogste getalswaarde toe te kennen. Waarom dit zo gedaan wordt zal je duidelijk worden bij het gedeelte, wat gaat over de ‘ best response function’. Je voorkeurslijstje komt er dan bijvoorbeeld als volgt uit te zien:
5
3 Rome 2 Londen 1 Parijs Dit lijkt op de manier, waarop in het Nederlandse onderwijs cijfers gegeven worden. De ‘beste’ leerling krijgt het hoogste cijfer (maximaal een tien) en de ‘slechtste’ leerling het laagste cijfer (minimaal een één). Het toekennen van een waarde aan een actie wordt ook wel een functie genoemd. Neem bijvoorbeeld de functie u. De keuze voor de functie u is niet helemaal willekeurig. De u staat voor het Engelse woord “utility”. In het Nederlands betekent dit nut en we spreken dan ook wel over een nutsfunctie. Je voorkeurslijstje komt er dan als volgt uit te zien:
u (Rome ) = 3
u (Londen ) = 2 u (Parijs ) = 1
Persoon 1 maakt zich zorgen over zowel zijn eigen inkomen als het inkomen van persoon 2. Het verschil in maandinkomen mag hooguit 1.000 euro bedragen. Bedenk een nutsfunctie bij de volgende maandinkomens (€ 4.100, € 4.900), (€ 6.200, € 4.900), (€ 2.300, € 3.400), (€ 7.800, € 9.500), (€ 4.300, € 3.700). Het eerste getal tussen haakjes is het inkomen van persoon 1 en het tweede getal dat van persoon 2.
6
2. THEORIE 2.1.
Strategisch spel
Zoals in hoofdstuk 1 al aan de orde is gekomen bestaat een spel uit spelers en spelregels. Hoewel een strategisch spel met meerdere spelers gespeeld kan worden zullen wij ons beperken tot twee spelers. De spelers kunnen meerdere acties uitvoeren. Wij zullen ons meestal beperken tot twee acties. De spelregels van het strategische spel zijn dat de spelers niet met elkaar mogen overleggen. Het spel is snel afgelopen, want je mag maar één zet doen en deze ene zet moet door alle spelers simultaan worden uitgevoerd. Je kunt dus niet afwachten wat een ander gaat doen en afhankelijk van de keuze van de ander je eigen strategie gaan bepalen. Tot slot wordt van je verwacht dat je rationeel handelt, dus niet zo maar wat doet. We gaan nu een strategisch spel spelen. Je wilt graag met een vriend(in) op vakantie. Jullie hebben de keus tussen Rome en Parijs. Kunnen jullie dit conflict oplossen? Zowel jij als je vriend(in) zullen jullie voorkeuren moeten vaststellen. Jij gaat natuurlijk het liefst met je vriend(in) naar Rome. Als hij/zij niet wil dan ga je alleen naar Rome. Je gaat absoluut niet naar Parijs. Je vriend gaat natuurlijk het liefst met jou naar Parijs, maar als je absoluut niet wilt naar Parijs wilt is hij/zij bereid met je mee te gaan naar Rome. De uitkomst van dit (onderhandeling)spel is dat jullie met zijn beiden naar Rome gaan. Je kunt dit spel, zoals in de speltheorie gebruikelijk is, modelleren. Dat gaan we nu doen. Het eerste wat we gaan doen is jouw voorkeuren op een rijtje zetten. Hierbij moeten we ook rekening houden met wat je vriend(in) wil. We noteren eerst jouw keuze en dan die van je vriend(in). We krijgen dan het volgende voorkeurslijstje:
u (Rome, Rome ) = 3 u (Rome, Parijs ) = 2 u (Parijs, Parijs ) = 1 u (Parijs, Rome ) = 0 Het tweede wat we gaan doen is de voorkeuren van je vriend(in) op een rijtje zetten. Ook hier geldt dat we eerst jouw keuze noteren en dan de keuze van vriend(in).
u (Parijs, Parijs ) = 3
u (Rome, Rome ) = 2 u (Rome, Parijs ) = 1 u (Parijs, Rome ) = 0
Nu gaan we deze voorkeuren in een tabel plaatsen. Als we dit gaan hebben ziet de tabel er als volgt uit:
Je vriend(in) Rome Parijs Jezelf
Rome
(3,2)
(2,1)
Parijs
(0,0)
(1,3)
De getallen tussen haakjes zijn de getallen, die de voorkeur van jou (eerste getal) en die van je vriend(in) (tweede getal) voor het betreffende profiel laten zien. Zoals je misschien al begrepen hebt wordt met een profiel één van de vier vakjes bedoeld, waar de getallen tussen haakjes in staan. De laatste stap bestaat uit het zoeken naar het Nash evenwicht. Maar voordat we dat kunnen doen moeten we eerst weten wat een Nash evenwicht is.
7
2.2.
Nash evenwicht
Als twee mensen een strategie spelen (een actie uitvoeren) en geen van beiden kan zijn positie verbeteren door eenzijdig van strategie te veranderen (een andere actie kiezen), spreken we van een Nash-evenwicht. In een Nash evenwicht is er sprake van een (sociaal) stabiele situatie. Een eenvoudig voorbeeld van Nash-evenwichten vinden we in het verkeer. Iedere verkeersdeelnemer speelt een spel waarin twee strategieën (uit te voeren acties) mogelijk zijn, te weten links rijden of rechts rijden. In onderstaande tabel zijn de voorkeuren van de verkeersdeelnemers weergegeven. Het is waarschijnlijk niet nodig de voorkeuren toe te lichten. Je zult er de voorkeur aan geven om links te rijden als ook alle anderen links rijden.
De ander rijdt aan de linkerkant Jij rijdt aan de linkerkant Jij rijdt aan de rechterkant
De ander rijdt aan de rechterkant
(1,1)
(0,0)
(0,0)
(1,1)
Uit de tabel kunnen we vaststellen dat er twee Nash evenwichten zijn. Iedereen aan de linker kant van de weg rijden of iedereen aan de rechterkant van de weg rijden. In de praktijk kun je beide Nash evenwichten dan ook tegen kunnen komen. In Engeland rijdt iedereen aan de linkerkant van de weg en in Nederland rijdt iedereen aan de rechter kant van de weg. Nu we weten wat een Nash evenwicht is kunnen we de laatste stap uit de vorige paragraaf uitvoeren. Zoals we in bovenstaand voorbeeld hebben gezien kunnen er meerdere Nash evenwichten zijn. Van elk profiel zullen we dan ook vast moeten stellen of er sprake is van een Nash evenwicht. We beginnen met het profiel beide naar Rome. Dit is een Nash evenwicht, want geen van beide kunnen jullie je positie verbeteren door eenzijdig af te wijken. Je vriend(in) kan zich potentieel verbeteren, maar daar zul jij niet akkoord mee gaan. Het profiel jij naar Rome en je vriend(in) naar Parijs is geen Nash evenwicht, want jullie kunnen beide je positie verbeteren. Hetzelfde geldt voor de andere twee profielen. De uitkomst van dit (onderhandeling)spel volgens de speltheorie is dat jullie beide naar Rome gaan, zoals dat al eerder is geconstateerd. Het onderzoeken van alle profielen om vast te kunnen stellen of er sprake is van een Nash evenwicht is erg arbeidsintensief als het aantal te onderzoeken profielen erg groot wordt. In de volgende paragraaf zullen we een methode bespreken, de methode van de “Best response function”, om sneller de Nash evenwichten te vinden.
2.3.
“Best response function”
Zoals we gezien hebben, kunnen we Nash-evenwichten in een spel vinden door elk profiel te onderzoeken. Een snellere manier om Nash evenwichten te vinden is de methode van de “Best response function”. De methode werkt als volgt: Je gaat voor elke actie van een andere speler vaststellen wat je beste (re)acties zijn (dit kunnen meerdere zijn). Vervolgens markeer je de uitkomst. De beste acties zijn acties, die je het meeste opleveren. Wat je nu voor één speler hebt gedaan ga je herhalen voor elke speler. Alle gemeenschappelijke acties, dit zijn de acties, die voor alle spelers de beste acties zijn, zijn Nash-evenwichten. Een voorbeeld: L
C
R
T
(1, 2*)
(2*, 1)
(1*, 0)
M
(2*, 1*)
(0, 1*)
(0, 0)
B
(0, 1)
(0, 0)
(1*, 2*)
8
We beginnen met speler 1. We moeten de beste acties van speler 1 op de acties van speler 2 zien te vinden. Als speler 2 actie L kiest dan is de beste actie van speler 1 actie M (2 is de hoogste uitkomst in deze kolom). De uitkomst van speler 1 wordt gemarkeerd met een ster. Als speler 2 actie C kiest, dan is de beste actie van speler 1 actie T (2 is de hoogste uitkomst in deze kolom). En als speler 2 actie R kiest, dan zijn de beste acties van speler 1 actie T en actie B (1 is de hoogste uitkomst in deze kolom). Nu nemen we speler 2. We moeten de beste acties van speler 2 op de acties van speler 1 zien te vinden. Als speler 1 actie T kiest dan is de beste actie van speler 2 actie L (2 is de hoogste uitkomst in deze rij). De uitkomst van speler 2 wordt gemarkeerd met een ster. Als speler 1 actie M kiest, dan zijn de beste acties van speler 2 actie L en actie C (1 is de hoogste uitkomst in deze rij). En als speler 1 actie B kiest dan is de beste actie van speler 2 actie R (2 is de hoogste uitkomst in deze rij). Als zowel een ster bij de uitkomst van speler 1 staat als een ster bij de uitkomst van speler 2, dan zijn dit de acties, die voor beide spelers de beste acties zijn. In dit geval zijn dat de profielen (M, L) en (B, R). Deze profielen zijn beide Nash evenwichten. Pas de methode van de “Best response function” toe om het Nash evenwicht van het ‘vakantie’ spel te bepalen.
2.4.
De twee gevangenen
Twee verdachten zijn gearresteerd in verband met een moord en worden in afzonderlijke cellen vastgehouden. Er is genoeg bewijs om ze allebei te beschuldigen van huisvredebreuk, maar niet voldoende bewijs om ze allebei te beschuldigen van moord. Als één van de verdachten vertelt dat de andere verdachte de moord heeft gepleegd dan wordt de eerste verdachte vrij gelaten en de andere verdachte krijgt een gevangenisstraf van 4 jaar. Als beide verdachten zwijgen dan worden ze veroordeeld voor huisvredebreuk en krijgen ze beide een gevangenisstraf van 1 jaar. Als ze beiden vertellen dat de andere verdachte de moord heeft gepleegd dan krijgen ze elk een gevangenisstraf van 3 jaar. Deze situatie kan gemodelleerd worden als een strategisch spel. Spelers: de twee verdachten Acties: De mogelijke acties van elke speler zijn de ander beschuldigen of zwijgen. Voorkeuren: De voorkeursvolgorde van de profielen van verdachte 1 ziet er als volgt uit: profiel
Aantal jaren gevangenisstraf
(Beschuldigen, Zwijgen) (Zwijgen, Zwijgen) (Beschuldigen, Beschuldigen) (Zwijgen, Beschuldigen)
0 1 3 4
Hoe ziet de voorkeursvolgorde van verdachte 2 eruit? Het spel kan eenvoudig op een compacte manier in een tabel worden ondergebracht. Voordat wij dit kunnen doen moeten wij eerst een nutsfunctie bedenken, die uitdrukking geeft aan de voorkeuren van de beide verdachten. Voor verdachte 1 hebben wij een functie u1 nodig, waarvoor geldt:
u1( Beschuldigen, Zwijgen) ≥ u1( Zwijgen, Zwijgen) ≥ u1( Beschuldigen, Beschuldigen) ≥ u1( Zwijgen, Beschuldigen) Een eenvoudige functie, die aan de eisen voldoet is:
9
u1( Beschuldigen, Zwijgen) = 3 u1( Zwijgen, Zwijgen) = 2 u1( Beschuldigen, Beschuldigen) = 1 u1( Zwijgen, Beschuldigen) = 0 Voor verdachte 2 kunnen wij een gelijksoortige functie u2 bedenken. Deze ziet er bijvoorbeeld als volgt uit:
u 2( Zwijgen, Beschuldigen) = 3 u 2( Zwijgen, Zwijgen) = 2 u 2( Beschuldigen, Beschuldigen) = 1 u 2( Beschuldigen, Zwijgen) = 0 Door de keuze van de nutsfuncties u1 en u2 krijgen wij de volgende tabel.
Zwijgen Verdachte 1
Verdachte 2 Beschuldigen
Zwijgen
(2,2)
(0,3)
Beschuldigen
(3,0)
(1,1)
Bedenk twee andere nutsfuncties u1 en u2 en maak opnieuw de tabel. Dit is het voorbeeld dat Albert W. Tucker heeft voorgelegd aan een gezelschap van psychologen aan de Stanford universiteit. Later is dit bekend geworden als het prisoner’s dilemma. In de volgende tabel wordt de algemene vorm van het prisoner’s dilemma weergegeven. Speler 2 A3
(a, w) (c, y )
A1 Speler 1 A2
A4
(b, x ) (d, z )
De volgende relaties moeten altijd gelden: c > a > d > b en x > w > z > y Als wij de vier mogelijke combinaties van acties (profielen) onderzoeken dan zien wij dat alleen het profiel (Beschuldigen, Beschuldigen) een Nash evenwicht is. Verdachte 2 Zwijgen Verdachte 1
Beschuldigen
Zwijgen
(2,2)
(0,3)
Beschuldigen
(3,0)
(1,1)
Het profiel (Beschuldigen, Beschuldigen) is een Nash evenwicht. Verdachte 1 zal Beschuldigen kiezen, omdat deze optie de kans biedt op de grootste opbrengst (rationaliteits principe). Ook Verdachte 2 zal om dezelfde reden als Verdachte 1 voor Beschuldigen kiezen. Ga na dat de andere profielen niet tot een Nash evenwicht leiden. Het Prisoner’s dilemma kent dus maar één Nash evenwicht. De prikkel van de mogelijkheid van ‘free ride’ voorkomt dat wordt gekozen voor de gezamenlijk betere uitkomst (profiel) van (Zwijgen, Zwijgen).
10
Werken aan een gezamenlijk project. Je werkt samen met een vriend aan een gezamenlijk project. Ieder van jullie kan hard werken of de kantjes ervan af lopen. Als je vriend hard werkt, dan geef je er de voorkeur aan om de kantjes ervan af te lopen. (de uitkomst van het project zou beter zijn als je hard zou werken, maar deze betere uitkomst is de extra inspanning niet waard). Je geeft de voorkeur aan beide hard werken dan aan beide de kantjes ervan aflopen. In het laatste geval komt het project niet tot een goed einde. Het slechtste resultaat is dat jij hard hebt gewerkt en dat je vriend er de kantjes vanaf heeft gelopen. Zet voor elke speler de profielen in de voorkeursvolgorde, bedenk een nutsfunctie en maak een tabel. Ga na wat de Nash evenwichten zijn.
Kernwapen wedloop Veronderstel dat er twee landen zijn, die in staat zijn om een kernwapen arsenaal op te bouwen. Veronderstel verder dat de favoriete uitkomst van het eerste land is, dat deze zelf kernwapens heeft en het andere land niet. De volgende meest favoriete uitkomst is dat geen van beide landen een kernwapenarsenaal opbouwt (kernwapens zijn duur). De volgende meest favoriete uitkomst is dat beide landen een kernwapen arsenaal hebben De meest ongunstige uitkomst is, dat het andere land een kernwapen arsenaal heeft. Zet voor elk land de profielen in de voorkeursvolgorde, bedenk een nutsfunctie en maak een tabel. Ga na wat de Nash evenwichten zijn.
2.5.
Bach of Stravinsky
Een echtpaar wil samen een avondje uit. Die avond worden er twee concerten gegeven. Een concert van Bach en een concert van Stravinsky. De man geeft de voorkeur aan een concert van Bach. De vrouw geeft de voorkeur aan een concert van Stravinsky. Als ze elk afzonderlijk naar het concert van hun voorkeur gaan dan blijven ze liever thuis. Zet zowel voor de man als de vrouw de profielen in de voorkeursvolgorde, bedenk een nutsfunctie en maak een tabel. Uit dit spel blijkt dat de spelers het erover eens zijn dat het beter is om samen te werken, dan om niet samen te werken. De spelers zijn het alleen niet eens over de beste uitkomst. In de volgende tabel wordt de algemene vorm van Bach of Stravinsky weergegeven. Speler 2 A3
(a, w) (c, y )
A1 Speler 1 A2 De volgende relaties moeten altijd gelden. w > z > x.
A4
(b, x ) (d , z )
d > a > b, d > a > c, w > z > y,
Ga na wat de Nash evenwichten zijn.
2.6.
Matching pennies
Twee personen gooien tegelijkertijd een munt op. Als bij beide munten kop of munt boven komt dan betaalt persoon 2 twee euro aan persoon 1. Als bij de ene munt kop boven komt en bij de andere munt dan betaalt persoon 1 twee euro aan persoon 2. Beide personen zijn ieder afzonderlijk geïnteresseerd in een zo hoog mogelijk bedrag. Zet zowel voor persoon 1 als persoon 2 de profielen in de voorkeursvolgorde, bedenk een nutsfunctie en maak een tabel.
11
In dit spel zijn de belangen van de twee spelers tegengesteld. Speler 1 wil dezelfde actie uitvoeren als speler 2, terwijl speler 2 de tegenovergestelde actie wil uitvoeren. In de volgende tabel wordt de algemene vorm van matching pennies weergegeven. Speler 2 A3
(a, w) (c, y )
A1 Speler 1 A2 De volgende relaties moeten altijd gelden:
A4
(b, x ) (d , z )
c = b = −a = −d , w = z = − x = − y .
Ga na wat de Nash evenwichten zijn.
2.7.
Hertenjacht
In een gedeelte van het boek ”Discourse on the origin and foundations of inequality among men (1755)” van de filosoof Jean-Jacques Rousseau wordt gesproken over een groep jagers, die op hertenjacht gaan. Zo af en toe komt er een haas langs en elke jager komt in de verleiding om een haas te schieten. Juist als één van de jagers een haas schiet komt een hert langs en deze weet te ontsnappen. Kortom de jagers zullen er alleen in slagen om een hert te schieten als ze allemaal voldoende attent blijven. Het is voor de jagers aantrekkelijker om met zijn allen een hert te schieten en dan het vlees onderling te delen, dan dat elk één haas schiet. Modelleer deze hertenjacht in de vorm van een spel. Wie zijn de spelers, wat zijn de acties, bedenk een nutsfunctie en maak een tabel. In de volgende tabel wordt de algemene vorm van hertenjacht weergegeven. Speler 2 A3
(a, w) (c, y )
A1 Speler 1 A2 De volgende relaties moeten altijd gelden:
A4
(b, x ) (d , z )
a >c ≥ d >b, w> x ≥ z > y.
Ga na wat de Nash evenwichten zijn.
12
3. TOEPASSINGEN 3.1.
Republiek van Plato.
Socrates maakt zich daar zorgen over de volgende situatie. Stel dat een soldaat zich aan het front bevindt. Als hij blijft en meevecht en de oorlog wordt verloren, gaat hij een zekere dood tegemoet. Als hij echter besluit te vluchten, zal dat niet van bijzonder veel invloed zijn op de uitslag van het gevecht, want hij is slechts één van velen. Dus of het gevecht gewonnen of verloren wordt, vluchten is eigenlijk altijd beter. Maar als iedereen zo denkt wordt het gevecht zeker verloren, wat weer een extra stimulans is om te vluchten. Vlucht niemand, dan zal (zullen we aannemen) het gevecht worden gewonnen, maar is jou deelname niet van belang (ook zonder jou zullen ze wel winnen). De matrix van dit dilemma ziet er als volgt uit:
Jij blijft vechten Jij vlucht
De anderen blijven vechten. (2, 2) (3, 2)
De anderen vluchten (0, 1) (1, 1)
Uit de matrix blijkt duidelijk dat jij een dominante strategie hebt. Deze dominante strategie is “vluchten”. Het lijkt nu echter alsof de anderen een andere dominante strategie hebben namelijk “blijven vechten”. Dit is echter beslist niet het geval. De reden is duidelijk. “De anderen” is geen eenheid die een keuze kan maken. “De anderen” is een groep individuen die allemaal stuk voor stuk een keuze moeten maken. Bij het maken van die keuze hebben ze allemaal individueel een dominante strategie, namelijk “vluchten”. Niet alleen Socrates heeft nagedacht over dit dilemma. Iedere legerleider wordt met dit probleem geconfronteerd. Twee oplossingen zijn bedacht om dit probleem op te lossen. De eerste en belangrijkste is het instellen van discipline. Vluchten betekent dat je deserteert, dus mag je onmiddellijk geëxecuteerd worden. De tweede en eigenlijk betere oplossing is het doen ontstaan van het idee van eerzaamheid. Een soldaat die vlucht schendt een moreel gebod en verricht een oneervolle daad. Hoewel hij de dood is ontlopen, zal zijn geweten hem de rest van zijn leven blijven achtervolgen. Bepaal het Nash evenwicht.
3.2.
Monetair beleid
Wij nemen aan dat de overheid streeft naar een lage inflatie, maar ook belang hecht aan een hoog nationaal inkomen en werkgelegenheid. Het streven naar een hoog nationaal inkomen en werkgelegenheid heeft als effect dat uiteindelijk alleen de inflatie stijgt, want om een hoger nationaal inkomen en extra werkgelegenheid te krijgen moet een ruimer monetair beleid gevoerd worden. Door het voeren van een ruimer monetair beleid trekt de vraag aan (er komt extra geld beschikbaar). Zie ook de grafiek in figuur 3. In deze grafiek is de verticale lijn LT de aanbodcurve op lange termijn. De lijn KT de aanbodcurve op korte termijn. De lijn V0 geeft de huidige vraag weer en de lijn V1 geeft de vraag weer na toepassing van een ruimer monetair beleid. Het hogere nationale inkomen en de extra werkgelegenheid zijn maar van beperkte duur, want de economie zal zich weer richten naar de aanbodcurve op lange termijn. Het uiteindelijke effect van het ruimere monetaire beleid is inflatie. De overheid is één van de twee spelers in dit spel. De andere speler (de vakbonden) komen dadelijk aan de orde. De overheid kan kiezen uit twee waarden voor de inflatie: geen inflatie (p = 0) en een inflatie van 10% (p = 0,1). Wordt er gekozen voor geen inflatie dan komt een “normale” productie tot stand (Y = 100). Wordt er gekozen voor een inflatie van 10% (een ruim monetair beleid), dan worden de productie en de werkgelegenheid op korte termijn gestimuleerd. Wij nemen aan dat voor de overheid het hogere nationale inkomen en de extra werkgelegenheid zo zwaar telt (de verkiezingen zijn in aantocht) dat zij steeds zal kiezen voor een ruim monetair beleid (en dus uiteindelijk een inflatie van 10%).
13
Prijsniveau V1
P
LT
V0 P1
KT
P0
100
0
110
Nationaal inkomen Y
Figuur 3
Wij nemen aan dat de vakbonden (de tweede speler in het spel) streven naar een lage inflatie en werkgelegenheid, maar ook belang hechten aan hogere lonen voor de werknemers, die ze vertegenwoordigen. Het streven naar hogere lonen heeft als effect dat uiteindelijk alleen de inflatie stijgt en de lonen reëel gezien niet gestegen zijn. Op korte termijn zal het effect van de hogere lonen zijn dat het nationale inkomen en de werkgelegenheid afneemt, want de werkgevers zullen de hogere lonen zo snel mogelijk in hun prijzen verwerken. Zie ook onderstaande grafiek in figuur 4. In deze grafiek is de verticale lijn LT de aanbodcurve op lange termijn. De lijn KT0 de huidige aanbodcurve op korte termijn en de lijn KT1 de aanbodcurve op korte termijn nadat de hogere looneisen zijn ingewilligd. De lijn V geeft de vraag weer.
Prijsniveau P
LT
V
KT1
P1
KT0
P0
0
90
100
Nationaal inkomen Y
Figuur 4
14
De hogere lonen zullen in eerste instantie tot gevolg hebben dat de koopkracht voor de werknemers zal stijgen, maar dat er ook werknemers ontslagen zullen worden. Deze laatste groep profiteert dan niet van de gestegen koopkracht. Uiteindelijk zal de economie zich weer richten op de aanbodcurve op lange termijn, met als effect dat de koopkracht verbetering te niet gedaan wordt. Eindresultaat is alleen inflatie. De vakbonden kunnen kiezen uit twee waarden voor de inflatie: geen inflatie (p = 0) en een inflatie van 10% (p = 0,1). Wordt er gekozen voor geen inflatie dan komt een “normale” productie tot stand (Y = 100). Wordt er gekozen voor een inflatie van 10% (een loonsverhoging), dan stijgt de koopkracht op korte termijn, maar er zullen ook werknemers ontslagen worden. De vakbonden zullen een voorkeur hebben voor geen inflatie. De vakbonden weten echter ook dat de overheid streeft naar een hoger nationaal inkomen en extra werkgelegenheid (rationele verwachting). De vakbonden zullen hier in de loon onderhandelingen rekening mee houden. Zij zullen een loonsverhoging vragen van 10%. Daardoor vervalt het stimulerende effect en komt er een “normale” productie (Y = 100) tot stand. Omdat de vakbonden het beleid van de overheid doorzien, lukt het niet om de productie met een onverwacht ruim monetair beleid te vergroten. Het beleid van de overheid is niet effectief. Het eindresultaat is dat er wel een hoge inflatie is, maar zonder het gehoopte gunstige effect op de productie en de werkgelegenheid. Modelleer dit probleem. Wie zijn de spelers, wat zijn de acties, bedenk een nutsfunctie en maak een tabel. Bepaal tevens het Nash evenwicht.
3.3.
De Dijken
Een groot deel van Nederland ligt onder de zeespiegel. Er is zelfs land gecreëerd onder de zeespiegel (polders). Vroeger kwamen regelmatig overstromingen voor. Deze overstromingen veroorzaakten erg veel schade. Op een zeker moment was het interessant om dijken te gaan aanleggen. De kosten van de aanleg van dijken was lager dan de kosten als gevolg van overstromingen. Maar wie gaat de aanleg van de dijken betalen? Een individu zal de aanleg van een dijk niet kunnen betalen. Een groep individuen zullen de dijk, als ze dat al kunnen, niet willen betalen. De anderen, die niet mee betalen, kunnen er dan gratis van profiteren (meeliften). De dijk wordt alleen aangelegd als iedereen er aan meebetaald. Modelleer dit probleem. Wie zijn de spelers, wat zijn de acties, bedenk een nutsfunctie en maak een tabel. Bepaal tevens het Nash evenwicht.
3.4.
Het Cournot model
Dit model van een duopoly (oligopolie die uit twee bedrijven bestaat) is voor het eerst geïntroduceerd door de Franse econoom Augustin Cournot in 1838. In dit model wordt verondersteld, dat de twee bedrijven een homogeen goed produceren en dat ze de vraagcurve van hun markt kennen. Elk bedrijf moet afzonderlijk bepalen hoeveel het bedrijf wil produceren en de twee bedrijven moeten hun besluit gelijktijdig nemen. De vraag is nu: Welke hoeveelheden zullen beide bedrijven gaan produceren? We zullen het model van Cournot verder behandelen in de vorm van een voorbeeld. De vraagcurve van de markt ziet er als volgt uit:
P = 30 − Q Q = Q1 + Q2 ). Verder nemen we aan dat de marginale kosten van beide bedrijven nihil en aan elkaar gelijk zijn ( MC1 = MC 2 = 0 ).
Q
is de totale productie van beide bedrijven (
De hoeveelheid productie van firma 1, waarbij de winst wordt gemaximaliseerd, is afhankelijk van wat firma 1 denkt dat firma 2 zal gaan produceren. Als firma 1 denkt dat firma 2 niets zal gaan produceren dan gaat firma 1 een hoeveelheid van 15 produceren. Leg uit waarom firma 1 een hoeveelheid van 15 gaat produceren en niet een hoeveelheid van 30?
15
Als firma 1 denkt dat firma 2 een hoeveelheid van 10 zal gaan produceren dan gaat firma 1 ook een hoeveelheid van 10 produceren. Leg uit waarom firma 1 een hoeveelheid van 10 gaat produceren. Wellicht herken je in deze werkwijze het bepalen van de “best response function”. We bepalen immers bij iedere actie van firma 2 de beste actie van firma 1. Gezien de enorme hoeveelheid mogelijke acties (oneindig veel) van de firma 2 is het niet handig om deze wijze verder te gaan. We kunnen de “best response function” ook op een andere manier bepalen. De winst van firma 1 is maximaal als de marginale opbrengsten gelijk zijn aan de marginale kosten. De totale opbrengsten van firma 1 kan als volgt worden weergegeven:
O1 = PQ1 = (30 − Q )Q1
= 30Q1 − (Q1 + Q2 )Q1 = 30Q1 − Q12 − Q2 Q1
De marginale opbrengsten
MO1
zijn:
MO1 = dO1 / dQ1 = 30 − 2Q1 − Q2 Stel
MO1 = MK 1 . We krijgen dan de “best response function” van firma 1.
1 Q1 = 15 − Q2 2 Controleer de eerder gevonden resultaten met de “best response function”. Op dezelfde manier kunnen we de “best response function” van firma 2 bepalen. Deze ziet er als volgt uit:
1 Q2 = 15 − Q1 2 De laatste stap is het vaststellen welke punten gemeenschappelijk zijn. Dit kan gerealiseerd worden door de twee vergelijkingen op te lossen. De oplossing is:
Q1 = Q2 = 10 Dit evenwichtspunt wordt wel het Cournot evenwicht genoemd. Dit evenwicht is uiteraard ook een Nash evenwicht! Toevoeging: Tot op heden hebben we verondersteld dat de twee bedrijven met elkaar concurreren. Stel de mededingings autoriteit staat toe dat de bedrijven meer met elkaar mogen samenwerken. In dat geval zouden de bedrijven hun productieniveau zodanig kiezen dat de totale winst wordt gemaximaliseerd en dat ze deze winst onder elkaar verdelen. Wij gaan nu onderzoeken wat voor gevolgen dit heeft voor de productie. De totale omzet van de twee bedrijven is:
O = PQ = (30 − Q )Q = 30Q − Q 2 De marginale opbrengst is:
MO = dO / dQ = 30 − 2Q Stel
MO = MK . Dan krijgen we als resultaat Q = 15 .
Conclusie: De bedrijven produceren samen 15. Als de bedrijven met elkaar tot overeenstemming kunnen komen om de winst te delen dan zullen ze elk de helft van de productie voor hun rekening nemen.
16
Is deze overeenkomst een Nash evenwicht?
3.5.
Het Stackelberg model
Bij het Cournot model hebben wij verondersteld dat de beide bedrijven hun productie beslissing op hetzelfde tijdstip nemen. Laten we nu eens gaan kijken wat er gebeurt als een bedrijf als eerste zijn productie vaststelt. Er zijn twee interessante vragen. De eerste vraag, heeft het voordelen om als eerste de productiebeslissing te nemen. De tweede vraag, hoeveel zal elk bedrijf gaan produceren? We nemen weer hetzelfde voorbeeld als bij het Cournot model. De marginale kosten zijn bij beide bedrijven gelijk aan nul en de vraagcurve van de markt is:
P = 30 − Q Veronderstel nu dat Bedrijf 1 als eerste zijn productiehoeveelheid vaststelt en dat Bedrijf 2 dat pas doet als deze heeft vastgesteld wat Bedrijf 1 produceert. Laten we beginnen bij Bedrijf 2. Omdat dit bedrijf zijn productiehoeveelheid pas vaststelt als Bedrijf 1dit gedaan heeft kan Bedrijf 2 de output van Bedrijf 1 als een gegeven beschouwen. Bij het Cournot model hebben we gezien dat de “best response function” in dit geval er als volgt uitziet:
1 Q2 = 15 − Q1 2 Maar hoe zit het nu met Bedrijf 1? Om de winst te maximaliseren moet Bedrijf1 zijn productiehoeveelheid zodanig kiezen dat de marginale opbrengsten gelijk zijn aan de marginale kosten. De omzet van Bedrijf 1 is gelijk aan:
O1 = PQ1 = 30Q1 − Q12 − Q1Q2 Omdat de omzet van Bedrijf 1 ( O1 ) afhankelijk is van de productiehoeveelheid Q2 van bedrijf 2, zal Bedrijf 1 moeten anticiperen op wat Bedrijf 2 zal gaan produceren. Gelukkig weet Bedrijf 1 hoe Bedrijf 2 zal gaan reageren, namelijk volgens de `best response function`. Vervanging van de “best response function” in de omzetfunctie van Bedrijf 1 levert op:
1 ⎞ ⎛ O1 = 30Q1 − Q12 − Q1 ⎜15 − Q1 ⎟ 2 ⎠ ⎝ 1 = 15Q1 − Q12 2 De marginale opbrengst is dan:
MO1 = 15 − Q1 Stel
MO1 = MK 1 . De productie omvang van Bedrijf 1 is dan 15.
De (re)actie van Bedrijf 2 is dan volgens de “ best response function” dat Bedrijf 2 een productieomvang vaststelt van 7,5. Wat is nu het antwoord op de oorspronkelijke vragen?
17
4. TOETS Twee bedrijven produceren ergonomische bureaustoelen. De firma BMA en de firma Giroflex. Beide bedrijven hebben dezelfde kostenfunctie. De kostenfunctie ziet er als volgt uit:
C (q ) = 30q + 1,5q 2 De marktvraag voor ergonomische bureaustoelen ziet er als volgt uit:
P = 300 − 3Q Verder geldt
Q = q1 + q 2 .
a.
Beide bedrijven willen hun winst maximaliseren, waarbij ze elkaars productiehoeveelheid als uitgangspunt nemen. Hoe groot is de productie van elk bedrijf? Hoe groot is de totale productie? Wat is de verkoopprijs? Hoeveel winst heeft elk bedrijf?
b.
De directies van BMA en Giroflex hebben het idee, dat ze een beter resultaat kunnen bereiken als ze gaan samenwerken. Stel de twee bedrijven gaan samenwerken. Hoeveel moeten ze dan gaan produceren om een maximale winst te behalen? Wat is dan de verkoopprijs? Hoe groot is de productie van elk bedrijf afzonderlijk?
c.
De directies van beide bedrijven realiseren zich, dat expliciete afspraken niet toegestaan zijn. Elk bedrijf moet afzonderlijk besluiten of ze de hoeveelheid, die je bij a hebt berekend wil produceren of de hoeveelheid, die je bij b hebt berekend. Modelleer dit probleem. Wie zijn de spelers, wat zijn de acties, bedenk een nutsfunctie en maak een tabel. Bepaal tevens het Nash evenwicht.
d.
Veronderstel dat BMA zijn productie hoeveelheid kan vaststellen voordat Giroflex dit doet. Hoeveel zullen BMA en Giroflex dan gaan produceren? Wat is de verkoopprijs? Wat is de winst voor elk bedrijf? Heeft BMA er goed aan gedaan om als eerste zijn productiehoeveelheid vast te stellen? Leg uit waarom wel of waarom niet?
18