Onderneming en omgeving - Speltheorie
1
1
Inleiding ....................................................................................................................................... 1
2
Het oplossen van een standaard tweepersonenspel .................................................................. 1
3
Twee aanbieders van bronwater................................................................................................. 3
4
Links of rechts rijden ................................................................................................................... 5
5
Free rider gedrag ......................................................................................................................... 6
Inleiding
Bij het woord ‘spel’ denk je al snel aan een spelletje zoals ganzenbord, risk, stratego, monopoly, bridge, dammen, schaken of poker. Misschien denk jij alleen nog maar aan computergames. Hier bedoelen we met spel even iets anders. Het gaat om wat ze een strategische situatie noemen. Dat is een situatie waarin twee of meer spelers iets moeten beslissen zonder dat ze van elkaar weten wat de ander gaat doen. Als je bij voetbal een strafschop mag nemen, kun je de bal links of rechts en hoog of laag in het doel schieten. De keeper weet niet wat jij gaat doen. Hij kan niet wachten tot je hebt geschoten want daarvoor is de afstand te klein en de tijd te kort. Hij zal daarom voordat jij schiet in een bepaalde hoek moeten duiken. Dit is een typische spelsituatie. Een tweede voorbeeld: je weet als klas dat hoe hard je ook je best doet bij de toets de docent de 30 procent laagste cijfers laat afvallen. Je spreekt met elkaar af om allemaal niet al te goed je best te doen; het maakt toch niet uit want er valt altijd 30 procent af. Vervolgens zit je thuis te peinzen, als ik nou een beetje meer mijn best doe dan heb ik een voorsprong. Stilletjes doe je extra je best. Maar omdat al je medeleerlingen dit ook kunnen bedenken, doen jullie allemaal stilletjes je best. Resultaat: je hebt allemaal hard gestudeerd en nog steeds valt er 30 procent af. Hier vatten we de meest eenvoudige speltheorie samen, zoals deze ook in de hoofdstukken van dit boek is gebruikt. − Er wordt van twee spelers uitgegaan die op hetzelfde moment moeten beslissen. − Ze hebben tegengestelde belangen. Dit wil zeggen dat het voordeel voor de één een nadeel betekent voor de ander. − Het spel wordt maar één keer gespeeld, er is geen herhaling. − De spelers zijn niet volledig op de hoogte. De een weet niet van de ander wat hij of zij gaat doen. − De regels staan vast, ze kunnen dus niet veranderd worden. − De actie die een speler onderneemt, noemen we zijn strategie. Een strategie heeft een bepaald resultaat. − Uit zichzelf komen de spelers niet tot samenwerking. Om tot samenwerking te kunnen komen is een derde partij nodig, bijvoorbeeld een overheid.
2
Het oplossen van een standaard tweepersonenspel
Het standaardvoorbeeld van een spel zoals in de inleiding hierboven beschreven, is het dilemma van de gevangenen. We zijn dit tegengekomen in hoofdstuk 1 in de paragraaf ‘Kiezen als je niet weet wat de ander doet’. We vatten de oplossing daarvan samen. 1 Onderneming en omgeving –Speltheorie © ThiemeMeulenhoff, 2011
Twee mannen, Karel en Ernst, die samen een misdrijf hebben gepleegd, worden in aparte cellen opgesloten. Ze kunnen bekennen of hun mond houden en ze weten de gevolgen van elk van die acties. Die zijn: 1 2 3
Als Karel bekent en Ernst niet, dan wordt Karel getuige. Hij wordt vrijgelaten, terwijl Ernst 20 jaar cel krijgt (het omgekeerde geldt ook). Als ze allebei bekennen, krijgt elk 5 jaar gevangenisstraf. Als ze allebei zwijgen, worden ze na een jaar vrijgelaten wegens gebrek aan bewijs.
In tabel 1.1 zie je de verschillende keuzemogelijkheden en de uitkomsten voor allebei. Elke verdachte kan bekennen of niet bekennen. Het resultaat voor Karel is steeds als eerste en in het zwart vermeld. Het resultaat voor Ernst staat steeds als tweede en cursief aangegeven. Dus bijvoorbeeld: als Karel bekent en Ernst niet, dan komt Karel vrij en krijgt Ernst 20 jaar. We gaan nu in het schema de oplossing van dit dilemma zoeken. Dit doen we door na te gaan wat de beste reactie is van de een op een handeling van de ander. Ofwel we gebruiken de best response methode. We starten bij Karel. Deze redeneert zo. Hij bekijkt in de resultatentabel de kolom bekennen van Ernst. Stel dat Ernst bekent, dan kan ik beter ook bekennen; ik zit liever 5 dan 20 jaar. We zetten in de kolom bekennen van Ernst een pijl van 20 naar 5. Tabel 1.1 Resultatentabel bij het dilemma van de twee gevangenen
bekennen
bekennen 5 jaar, 5 jaar
niet bekennen
20 jaar, vrij
Ernst niet bekennen vrij, 20 jaar
Karel 1 jaar, 1 jaar
Nu gaat Karel na wat voor hem het beste is als Ernst niet bekent. Hij kijkt dus in de kolom niet bekennen van Ernst. De resultatentabel laat zien dat Karel dan zal bekennen. Hij is liever vrij dan dat hij 1 jaar moet zitten. Hier een pijl van 1 jaar naar vrij in de kolom niet bekennen van Ernst. Het is nu al te zien dat Karel 1 zal bekennen, wat Ernst ook beslist. Bekennen is wat we noemen de dominante (=overheersende) strategie van Karel. Omdat ze allebei dezelfde mogelijkheden hebben, zal ook Ernst bekennen als dominante strategie hebben. Maar laten we dit nog even controleren. Hoe redeneert Ernst? Stel dat Karel bekent, dan kiest Ernst voor bekennen, immers hij zit liever 5 jaar dan 20. Een pijl van 20 jaar naar 5 jaar. Stel dat Karel kiest voor niet bekennen, dan kiest Ernst voor bekennen want hij is liever vrij dan dat hij 1 jaar het gevang in moet. Een pijl van 1 jaar naar vrij. Kortom: Ernst kiest wat Karel ook doet, voor bekennen. ‘Bekennen’ is in deze resultatentabel een evenwichtssituatie. We noemen het een Nash-evenwicht naar de beroemde wiskundige John Nash (1928), die veel voor de speltheorie heeft gedaan. Het kenmerk van zo'n evenwicht is dat daarin geen van de spelers de prikkel heeft een andere strategie te volgen. In de tabel wordt zo'n evenwicht gevonden doordat er twee pijlen naar die cel in de tabel wijzen. Het resultaat is dat beide verdachten 5 jaar de gevangenis in gaan. Terwijl het voor allebei beter was geweest als ze niet hadden bekend. Dan hadden ze maar 1 jaar vast moeten zitten. Maar dat hadden ze alleen kunnen bereiken door met elkaar af te spreken dat ze allebei niet zouden bekennen.
2 Onderneming en omgeving –Speltheorie © ThiemeMeulenhoff, 2011
3
Twee aanbieders van bronwater
In hoofdstuk 6 staat een voorbeeld van spel waarbij twee aanbieders van bronwater tegenover elkaar staan. Dit voorbeeld geeft een aardig inzicht in de problemen waartoe de onderlinge afhankelijkheid bij een oligopolie, in dit geval een duopolie, leidt. In een klein dorpje in de Franse bergen zijn Augustine en Bernard de enige twee die over een bron beschikken waaruit drinkbaar water komt. De afnemers vinden het water van Augustine of dat van Bernard precies even goed. We hebben dus te maken met een homogeen duopolie. Voor de eenvoud nemen we aan dat de productie en levering van het water niets kost. De totale opbrengst is dan gelijk aan de totale winst. Augustine en Bernard moeten elke week ieder voor zich beslissen hoeveel water ze zullen oppompen en aanbieden. De een weet niet van de ander hoeveel deze zal aanbieden. Ze willen allebei een zo groot mogelijke totale winst maken. In dit geval komt dat dus neer op een zo groot mogelijke totale opbrengst, want er zijn immers geen kosten. In tabel 3.1 is de totale vraag naar water aangegeven. Tabel 3.1 De totale vraag naar water in een week
prijs per liter, euro
gevraagde hoeveelheid, ltr
120 110 100 90 80 70 60 50 40 30 20 10 0
0 10 20 30 40 50 60 70 80 90 100 110 120
totale opbrengst = totale winst in euro 0 1100 2000 2700 3200 3500 3600 3500 3200 2700 2000 1100 0
Als er maar een aanbieder zou zijn die naar maximale winst streeft, dan zou hij 60 liter aanbieden; zijn winst is dan 3600 euro. Bij het duopolie van Augustine en Bernard ligt de zaak wat lastiger. Dat gaan we nu bekijken. Het homogeen duopolie als spel Augustine en Bernard kennen de totale vraag. Maar de een weet niet van de ander hoeveel hij/zij gaat aanbieden. Augustine zou 30 kunnen aanbieden, de helft van de 60 die voor de monopolist maximale winst geeft. Zou Bernard hetzelfde doen, dan wordt in totaal 60 aangeboden Elk zou 1800 winst ontvangen. Maar Augustine vraagt zich af waarom zij niet 40 in plaats van 30 zou aanbieden. Het totale aanbod is dan 70, de prijs 50. De winst van Augustine zou 40 x 50 = 2000 zijn. Wat Augustine kan verzinnen, kan Bernard ook bedenken.
3 Onderneming en omgeving –Speltheorie © ThiemeMeulenhoff, 2011
Tabel 3.2 laat zien wat de resultaten zijn van de verschillende combinaties. Tabel 3.2 De verschillende combinaties
Augustine biedt aan 30 40 30 40
Bernard biedt totale aanbod prijs totale winst winst Bernard aan winst Augustine 30 60 60 3600 1800 1800 30 70 50 3500 2000 1500 40 70 50 3500 1500 2000 40 80 40 3200 1600 1600
Tabel 3.3 laat de in tabel 3.2 genoemde combinaties en uitkomsten zien. Tabel 3.3 De resultaten
Augustine verkoopt 40 liter
Augustine verkoopt 30 liter
B winst 1600; A winst 1600
B winst 2000; A winst 1500
B winst 1500; A winst 2000
B winst 1800; A winst 1800
Bernard verkoopt 40 liter
Bernard verkoopt 30 liter
De eerste regel uit tabel 3.3, waarbij ze allebei 30 liter aanbieden, is in tabel 3.3 de situatie rechtsonder. De gezamenlijke winst zou 3600 zijn. Voor ieder 1800. Deze toestand wordt niet bereikt omdat elk (regel 2 en 3 in de tabel) de ander te slim af denkt te zijn. Augustine denkt haar situatie te kunnen verbeteren door 40 aan te bieden. Dan ontstaat de situatie linksonder in de figuur, waarbij Augustine haar winst verhoogt tot 2000. Maar wat Augustine kan bedenken kan Bernard ook verzinnen. En dat zou de situatie rechtsboven geven. Door beide 40 liter aan te bieden, is linksboven in de figuur het eindresultaat: een totale winst van 3200, waarvan ieder 1600 ontvangt. Dit is een stabiel evenwicht omdat het voor geen van de twee aanbieders zin heeft een andere hoeveelheid aan te bieden. Er bestaat nu een situatie waarin een partij zijn of haar beste strategie kiest, gegeven de strategieën die de anderen hebben gekozen. Geen van de personen kan zijn of haar situatie verbeteren door een andere strategie te kiezen. Het opsporen van het evenwicht De oplossing van deze situatie sporen we weer op met behulp van de ‘beste-reactie’ methode (best response method). We volgen als eerste de redenering van Bernard. Stel dat Augustine 40 liter aanbiedt. Wat is dan mijn beste reactie? Kijk in de eerste kolom van de resultatentabel. Als Bernard 40 zou aanbieden, ontvangt hij een winst van 1600; zou hij 30 liter aanbieden dan is zijn winst 1500. Hij biedt, als Augustine 40 aanbiedt, dus ook 40 liter aan. Kijk nu in de tweede kolom. Stel Augustine biedt 30 liter aan. Wat is nu Bernards beste reactie? Als hij 40 liter aanbiedt, is zijn winst 2000. Als hij 30 liter aanbiedt, is zijn winst 1800. Hij biedt dus 40 aan. Dus wat Augustine ook doet, Bernard biedt 40 liter aan. Keren we de zaak om en gaan we na hoe Augustine reageert op Bernard, dan blijkt dat ook Augustine 40 liter aanbiedt. Of Bernard nu 30 of 40 liter aanbiedt... Beide bieden 40 liter aan. De cel linksboven, het Nash-evenwicht, is de enige waar twee pijlen naartoe wijzen. Dit evenwicht waarbij in totaal 80 liter wordt aangeboden en beide een winst van 1600 ontvangen is niet optimaal. Daarmee bedoelen we hier dat beide nu niet de hoogste totale winst (elk 1800) behalen.
4 Onderneming en omgeving –Speltheorie © ThiemeMeulenhoff, 2011
Kartelvorming en ontduiking Ze zouden allebei beter af zijn als ze samen de hoeveelheid zouden aanbieden die een monopolist op de markt zou brengen (60). Maar daarvoor zouden ze contact met elkaar moeten opnemen en een afspraak maken. Stel dat ze afspreken ieder 30 (samen 60) aan te bieden en elk een winst van 1800 binnen te halen. Op dat moment is een kartel geboren, een afspraak om de concurrentie te beperken. Maar dan krijgen we weer het probleem dat het aantrekkelijk is om de ander te bedotten. Augustine spreekt af om 30 liter op de markt te brengen, maar stiekem verkoopt zij 40 liter en incasseert 2000 in plaats van 1800. En weer geldt: als Augustine dit kan bedenken, kan Bernard het ook. Met als resultaat dat ze weer in het stabiele evenwicht (beide een winst van 1600) eindigen.
4
Links of rechts rijden
Er zijn situaties met meer dan één Nash-evenwicht mogelijk. Stel je voor dat in het verkeer de deelnemers Marie en Nico kunnen kiezen links of rechts te rijden. Tabel 4.1 vat de uitkomsten samen. Cursief zijn de resultaten voor Nico. Tabel 4.1 Links of rechts rijden
rijdt rechts
rijdt rechts OK, OK
rijdt links
botsen, botsen
Nico rijdt links botsen, botsen
Marie OK, OK
Het resultaat OK wil zeggen dat er zich geen verkeersprobleem voordoet. Het resultaat botsen spreekt voor zichzelf. We starten met Marie, die kiest voor rechts rijden. Nico kiest dan ook voor rechts rijden, want OK is beter dan botsen. Een pijl naar links van botsen naar OK. Stel nu dat Marie links rijdt. Nico kiest ook voor links rijden, want OK is beter dan bosten. Een pijl naar rechts van botsen naar OK. We bekijken nu Nico. Stel hij kiest voor rechts rijden. Dan kiest Marie ook voor rechts rijden. Want OK is beter dan botsen. Een pijl omhoog van botsen naar OK. Rijdt Marie links, dan kiest Nico ook voor links. Een pijl omlaag. Er zijn nu twee cellen waarheen twee pijlen wijzen. Er zijn twee Nash-evenwichten. Ze kunnen allebei links rijden of allebei rechts. Zelfbinding Het dilemma links of rechts rijden wordt ook weggenomen als een van de partijen van tevoren verklaart dat hij of zij wat de ander ook doet altijd rechts gaat rijden. Stel dat Marie luid en duidelijk verklaart dat zij wat Nico ook doet altijd rechts zal houden. We noemen dit zelfbinding. Nico weet dan waar hij zich aan te houden heeft, namelijk ook rechts rijden om ongelukken te voorkomen. Door de overheid opgelegde regels Het dilemma rechts of links rijden bestaat niet meer als de overheid aan alle spelers de regel oplegt: je moet rechts rijden. Iedereen beschikt dan over dezelfde informatie dat er rechts gereden moet worden. Een eenvoudig voorbeeld dat laat zien dat het optreden van een overheid dilemma's kan helpen oplossen. In dit geval zelfs door het dilemma van begin af aan de kop in te drukken. 5 Onderneming en omgeving –Speltheorie © ThiemeMeulenhoff, 2011
5
Free rider gedrag
Free rider gedrag (gratis 'meeliften') bestaat wanneer een partij profiteert van een voorziening zonder daaraan bij te dragen. Bij collectieve goederen kan het optreden van de overheid helpen free rider gedrag te voorkomen Hannah en Olivia zijn twee buurvrouwen die graag een klimrek voor de kinderen willen hebben op het grasveldje tegenover hun huizen. Het handigste zou natuurlijk zijn als ze eens samen om de tafel gaan zitten. Maar daar komt het steeds niet van. Ze hebben dus geen overleg. Allebei bedenken ze dat ze het klimrek kunnen laten bouwen, maar dat ze niet willen dat de ander daar dan gratis van profiteert. In de tabel staat een overzicht van de verschillende mogelijkheden en hoe ze die waarderen. Schema 5.1 Free rider gedrag
betaalt mee
betaalt mee 3,3
Olivia betaalt niet mee 1,4
Hannah betaalt niet mee
4,1
2,2
De tabel lees je zo. Bekijk in de meest rechtse kolom de bovenste cel. Als Hannah meebetaalt en Olivia niet meedoet, waardeert Hannah dit met een 1. En Olivia (cursief) waardeert het met een 4. De vraag is: komt het klimrek er wel of niet? Je wordt nu stap voor stap naar de oplossing van dit probleem gebracht. Stap 1 Start bij Hannah betaalt mee (waardering 3) Wat kiest Olivia? Olivia kiest 'niet meebetalen', want 4 is groter dan 3. We zetten een horizontale pijl in de tabel die laat zien wat Olivia doet. Stap 2 Hannah betaalt niet mee; Olivia kiest 'niet meebetalen'. Want 2 is groter dan 1. Weer tekenen we een horizontale pijl die laat zien wat Olivia kiest. We zien nu dat Olivia, wat Hannah ook doet, niet meebetaalt. Olivia gedraagt zich als free rider. Stap 3 Start nu bij Olivia betaalt mee. Hannah kiest nu voor 'niet meebetalen', want 4 is groter dan 3. Een pijl verticaal naar beneden. Stap 4 Olivia betaalt niet mee; Hannah kiest 'niet meebetalen', want 2 is groter dan 1. Een tweede pijl verticaal naar beneden. Stap 5 Er is maar een cel in de tabel waarheen twee pijlen wijzen, een pijl van Hannah en een pijl van Olivia. Die cel, rechtsonder, laat de oplossing zien. Het resultaat is dat de speelplaats er niet komt. Hannah en Olivia zijn allebei bang dat zij met de rekening komen te zitten. Terwijl de ander meeprofiteert. Stap 6 Er zijn twee oplossingen mogelijk. Ze zoeken contact met elkaar en spreken af de kosten samen te delen. Zolang het om twee partijen gaat, ligt zo'n oplossing voor de hand. Gaat het om zeg tien buurvrouwen of 6 Onderneming en omgeving –Speltheorie © ThiemeMeulenhoff, 2011
de hele buurt, dan worden de transactiekosten van overleg en het delen van de kosten plus het controleren dat ieder zijn toezeggingen waarmaakt al snel te hoog. Dan zou er een overheid moeten optreden, de gemeente in dit geval, die de betrokkenen een voorstel doet, bij akkoord de speelplaats laat aanleggen, de kosten over de partijen verdeelt en de bedragen incasseert.
7 Onderneming en omgeving –Speltheorie © ThiemeMeulenhoff, 2011