Klaslokaalexperiment: het gevangenenprobleem
Voor lee rling en docen t
Het gevangenenprobleem ‘Moet je horen’, zegt Corine, ‘Twee studenten bekennen schuld.’ Ze laat de krantenkop aan Bart zien. ‘Wat hebben ze bekend?’ vraagt Bart. ‘Drugsmokkel, naar Thailand’, antwoordt Corine. ‘Tegenover de Nederlandse pers houden ze vol dat ze onschuldig zijn, maar tijdens de verhoren in Thailand hebben ze bekend. De Thaise politie had een slimme ondervragingsmethode bedacht.’ ‘Ondervragen met de harde hand zeker’, grapt Bart. ‘Nee, dat niet’, antwoordt Corine ‘met een methode uit de speltheorie.’ ‘Speltheorie?’ Bart is verbaasd. ‘Ondervragen is toch geen spel?’ ‘Luister’, zegt Corine. ‘Ik zal het voorlezen.’ ‘De twee studenten, Richard en Twan, werden gearresteerd na beschuldigingen van Thaise medestudenten aan wie ze de drugs verkocht zouden hebben. Bewijs voor de drugsmokkel was er niet. Bij hun arrestatie hadden Richard en Twan wel een tas met nagemaakte merkartikelen bij zich. Die wilden ze verkopen in Nederland. Op heling van nagemaakte merkartikelen staat een gevangenisstraf van een jaar. Om Richard en Twan ook de drugssmokkel te laten bekennen werden ze ieder in een aparte verhoorcel geplaatst. Zo konden ze niet met elkaar praten en wisten ze niet wat de ander zou zeggen. Aan de verdachten werd vervolgens de situatie uitgelegd. Als ze niet zouden bekennen, en de ander deed dat ook niet, dan moesten ze beiden voor een jaar de gevangenis in vanwege heling van nagemaakte merkartikelen. Als een verdachte toegaf dat de ander de drugs het land in gesmokkeld had, werd deze straf kwijtgescholden in ruil voor de bekentenis. De ander moest dan als enige dader twaalf jaar de gevangenis in. Als ze beiden bekenden dat de ander de drugs het land in had gesmokkeld, moesten ze beiden acht jaar de gevangenis in. Wie de drugs heeft gesmokkeld is
dan niet met zekerheid vast te stellen. De straf valt daardoor lager uit. Geconfronteerd met deze keuzes bekenden beide verdachten spontaan dat de ander de drugs had gesmokkeld. Beide verdachten zullen nu voor acht jaar achter Thaise tralies moeten zitten.’ ‘Maar waarom hebben ze dan bekend?’ vraagt Bart. ‘Ze hadden toch gewoon niks moeten zeggen? Dan waren ze alleen maar veroordeeld voor heling van die namaakartikelen!’ ‘Dat is zo’, antwoordt Corine, ‘maar wat zou jij doen als je voor de keuze werd gesteld?’ ‘Tja’, zegt Bart, ‘dat weet ik niet. Het lijkt me nogal ingewikkeld.’ ‘Oh, maar dat is het niet’, zegt Corine. ‘Je moet gewoon alle mogelijkheden aflopen en dan je beste keuze bepalen. Kijk, ik ben even voor het gemak Richard. Als Twan mij niet aangeeft heb ik twee keuzes: Twan wel aangeven of niet aangeven. Als ik hem niet aangeef, verdwijn ik voor één jaar achter de tralies. Maar als ik Twan wel aangeef, kom ik direct vrij. Dus: als Twan mij niet aangeeft, geef ik hem wel aan.’ ‘Oké’, zegt Bart, ‘dat begrijp ik. Maar wat nu als Twan jou wel heeft aangegeven?’ ‘Dan ga je precies hetzelfde te werk’, antwoordt Corine. ‘Ik heb dan weer twee keuzes: Twan wel aangeven of niet. Als ik hem niet aangeef, dan verdwijn ik voor twaalf jaar achter de tralies. Maar als ik hem wel aangeef, dan moet ik acht jaar brommen. Kortom, als Twan mij wel aangeeft, geef ik hem ook aan.’ ‘Dus, als ik het goed begrijp’, reageert Bart ‘geef jij Twan altijd aan. Of hij jou wel of niet aangeeft, maakt niet uit.’ ‘Ja, zo zit het precies’ antwoordt Corine. ‘En daarom bekenden ze spontaan dat de ander die drugs het land had binnengesmokkeld. Merkwaardig is het wel, want ze zouden er beiden op vooruit gaan als ze allebei niet zouden bekennen. Maar ja, de speltheorie leert ons dat het zo niet werkt.’
1 De logica van het gevangenenprobleem Het gevangenenprobleem is een situatie die in de praktijk veel voorkomt. Een wapenwedloop, markten die geen collectieve goederen voortbrengen, en uitgeverijen die te dure stands bouwen op een congres zijn allemaal voorbeelden van uitkomsten van het gevangenenprobleem. In de economie neemt het gevangenenprobleem een centrale plaats in. Het gevangenenprobleem is een 2-bij-2 spel: er zijn 2 spelers die allebei kiezen uit 2 acties: {wel aangeven} en {niet aangeven}. Iedere speler komt in één van twee situaties terecht: de andere speler geeft niet aan, of de andere speler geeft wel aan. Voor beide situaties bepaalt de strategie van een speler de actie die hij onderneemt. Een voorbeeld van een strategie bij het gevangenenprobleem is het volgende: ‘Ik geef de ander aan als hij mij aangeeft, en ik geef de ander aan als hij mij niet aangeeft.’ Het gevangenenprobleem is ook een simultaan spel want beide spelers bepalen tegelijkertijd hun actie. Zoals we eerder zagen is hier eigenlijk iets anders aan de hand: een speler maakt zijn keuze zonder dat hij de actie van de andere speler kent. Dat een speler niet weet wat de ander doet,
komt op hetzelfde neer als de situatie waarbij beide spelers tegelijkertijd hun actie bepalen. Vandaar dat het gevangenenprobleem een simultaan spel is.
Bron 1 De opbrengstenmatrix van het gevangenenprobleem. Speler 2 Niet aangeven Wel aangeven Speler 1
Niet aangeven
(–1, –1)
(–12, 0)
Wel aangeven
(0, –12)
(–8, –8)
De opbrengstenmatrix voor het gevangenenprobleem staat in bron 1. Omdat gevangenisstraf een negatieve opbrengst is, zijn de getallen in bron 1 die horen bij een gevangenisstraf negatief. De cel linksboven in bron 1 komt overeen met de acties {niet aangeven, niet aangeven}. Zowel speler 1 als speler 2 geeft de ander niet aan. Beide verdachten moeten in dit geval één jaar de gevangenis in. Vandaar dat de opbrengst (–1, –1) is. De cel linksonder komt overeen met de acties {wel aangeven, niet aangeven}. Speler 1 geeft speler 2 aan, maar andersom doet speler 2 dat niet. De opbrengst is dan (0, –12): speler 1 gaat vrijuit, speler 2 moet twaalf jaar de gevangenis in. En zo verder.
Bron 2 De oplossing van het gevangenenprobleem. Speler 2
Speler 1
Niet aangeven
Wel aangeven
Niet aangeven
(–1, –1)
(–12, 0)
Wel aangeven
(0, –12)
(–8, –8)
In bron 2 is het spel opgelost. Als speler 2 kiest voor {niet aangeven}, is voor speler 1 alleen de linkerkolom nog relevant. Speler 1 moet dan kiezen tussen een opbrengst van 0, wanneer hij speler 2 wel aangeeft, en –1, wanneer hij speler 2 niet aangeeft. Speler 1 kiest dan voor {wel aangeven}. Om het spel op te lossen moest steeds de hoogste opbrengst onderstreept worden, want die hoort bij de actie van speler 1 die hem het meeste voordeel oplevert. Daarom is de opbrengst 0 in de cel linksonder onderstreept. Als speler 2 kiest voor {wel aangeven}, is voor speler 1 alleen de rechterkolom nog relevant. Dan moet speler 1 kiezen tussen een opbrengst van –8 en –12. Logischerwijs kiest hij dan voor –8, en ook die wordt weer onderstreept. In bron 2 zijn ook voor speler 2 de hoogste opbrengsten onderstreept. Hieruit volgt het evenwicht van het spel: {wel aangeven, wel aangeven}.
2 Toepassingen van het gevangenenprobleem Het gevangenenprobleem kent tal van toepassingen in de economie. We behandelen er hier drie: reclameuitgaven, prijsafspraken en handelsoorlogen.
2.1 Reclame Producenten geven jaarlijks miljarden euro’s uit aan reclame. Dat is zinvol, want consumenten kopen meer van producten waar reclame voor wordt gemaakt. Maar deze aankopen gaan wel ten koste van andere aankopen. Consumenten kunnen hun geld maar één keer uitgeven. In de regel snoept reclame vooral consumenten af van de concurrent. Neem bijvoorbeeld de markt voor cola. Er zijn twee producenten, Coca-Cola en Pepsi, die beiden veel reclame maken voor hun product. Door deze reclame gaan mensen nauwelijks méér cola drinken. Wat die reclame vooral doet is coladrinkers bij de concurrent weghalen. De situatie die zo ontstaat, is precies hetzelfde als het gevangenenprobleem, want beide colaproducenten gaan erop vooruit als ze alle twee geen reclame zouden maken. Dat scheelt in de kosten, en consumenten blijven toch wel cola drinken. En toch zullen beide producenten miljoenen euro’s per jaar aan reclame blijven uitgeven, gevangen als ze zitten in het gevangenenprobleem.
Bron 1 De opbrengstenmatrix op de colamarkt. Pepsi
Coca-Cola
Geen reclame
Wel reclame
Geen reclame
(100, 100)
(25, 150)
Wel reclame
(150, 25)
(75, 75)
In bron 1 staat een voorbeeld van de opbrengstenmatrix voor de colamarkt. Als beiden geen reclame maken, verdienen beide producenten 100. Als bijvoorbeeld Pepsi wel reclame maakt, dan gaan zijn verdiensten omhoog ten koste van die van Coca-Cola. Pepsi investeert 25 in reclame. Hierdoor haalt hij 75 van de opbrengsten weg bij Coca-Cola. Met reclame verdient Pepsi dan 100 + 75 – 25 = 150. Coca-Cola verdient dan nog maar 25. Andersom geldt hetzelfde. Als beide producenten reclame maken, behaalt geen van beiden hier voordeel mee. Ze halen geen consumenten meer weg bij de concurrent. Beiden verdienen dan 100 – 25 = 75. In het evenwicht geven beide producenten 25 uit aan reclame en verdienen 75. Beiden zouden beter af zijn als ze geen reclame maken. Ze verdienen dan 100 ieder. Maar beide producenten hebben een prikkel om wel reclame te maken, onafhankelijk van wat de ander doet. Als Pepsi geen reclame maakt, dan doet Coca-Cola dat wel. Zijn inkomsten nemen dan toe van 100 tot 150. Als Pepsi wel reclame maakt, dan doet Coca-Cola dat ook. Zijn inkomsten stijgen dan van 25 tot 75. Dezelfde redenering gaat op voor Pepsi. In het evenwicht maken beide ondernemingen daarom reclame terwijl dit in het nadeel is van beide producenten.
2.2 Prijsafspraken Het maken van een prijsafspraak is bij wet verboden. Producenten die dat wel doen lopen kans door de Nederlandse Mededingingsautoriteit (NMa) te worden beboet. Toch zijn er ondernemingen die prijsafspraken maken. In 2005 bijvoorbeeld werden de fietsfabrikanten Accell, Gazelle en Giant beboet voor het maken van prijsafspraken. In totaal moesten de drie producenten 26,5 miljoen euro aan boetes betalen. Toch is het opmerkelijk dat een prijsafspraak in de praktijk stand kan houden. Omdat een prijsafspraak illegaal is, wordt een prijsafspraak nooit officieel gemaakt. Er bestaan geen documenten van. Een prijsafspraak is een mondelinge afspraak waar niemand zich aan hoeft te houden. Want als een producent de afspraak schendt, heeft de andere producent het nakijken. Er bestaan immers geen officiële documenten van de afspraak. Het bewijs van het bestaan van een afspraak is er dan niet. En daarom kun je de ander er niet aan houden. Ook nu weer speelt het gevangenenprobleem. In bron 2 staat de opbrengstenmatrix van de fietsenmarkt. Voor het gemak gaan we uit van twee producenten, Gazelle en Giant. Beiden maken dezelfde fiets. De productiekosten bedragen € 200 per fiets. Er zijn 100 consumenten die de fiets voor € 200 willen kopen. Consumenten kiezen altijd de fiets die het goedkoopst is. Maar bij een prijs van € 200 verdienen beide producenten niets. Bij een prijs van € 400 zijn er nog 50 consumenten die een fiets kopen. Omdat de fietsen van Gazelle en Giant hetzelfde zijn, kiest de consument op basis van de prijs. Als die ook hetzelfde is, wordt de markt gelijkelijk verdeeld: zowel Gazelle als Giant verkoopt 25 fietsen bij een prijs van € 400. Beiden maken dan een winst van (€ 400 – € 200) × 25 = € 5.000. Maar kan Gazelle nog meer winst maken als Giant een prijs van € 400 vraagt? Ja, dan kan. Wat Gazelle dan moet doen is een prijs van € 399 vragen. Daarmee haalt Gazelle alle klanten weg bij Giant. De winst van Gazelle is dan (€ 399 – € 200) × 50 = € 9.950. Door de prijsafspraak te schenden, verdubbelt Gazelle bijna zijn winst. Giant heeft dan een probleem want hij heeft wel 25 fietsen geproduceerd die niet meer verkocht worden. Zo ontstaat er voor Giant een verlies van € 200 × 25 = € 5.000. Als reactie hierop zal Giant een prijs vragen van € 398. Daarmee haalt het bedrijf alle klanten weg bij Gazelle, maakt een winst van (€ 398 – € 200) × 50 = € 9.900, en zadelt Gazelle met een verlies op van € 200 × 50 = € 10.000. Hier reageert Gazelle weer op door een prijs te vragen van € 397, en zo verder. Giant en Gazelle raken verwikkeld in een prijzenoorlog. En die gaat door net zolang totdat de prijs € 200 per fiets is. Een verdere prijsverlaging geeft verlies.
Bron 2 De opbrengstenmatrix bij prijsafspraken. Giant Gazelle
Prijsafspraak naleven
Prijsafspraak naleven (€ 5.000, € 5.000)
Prijsafspraak schenden (€ –5.000, € 9.950)
Prijsafspraak schenden
(€ 9.950, –5.000)
(€ 0, € 0)
In bron 2 is het evenwicht afgeleid. Beide producenten zullen altijd de prijsafspraak schenden. Als bijvoorbeeld Giant zich wel aan de afspraak houdt, dan verhoogt Gazelle zijn winst door zich niet aan de afspraak te houden.
En als Giant zich niet aan de afspraak houdt, dan kan Gazelle zijn verliezen wegwerken door een prijzenoorlog te beginnen. Dat prijsafspraken in de praktijk toch bestaan komt doordat het gevangenenprobleem dan niet één, maar meerdere keren achter elkaar wordt gespeeld.
2.3 Handelsoorlogen Landen kunnen extra belasting heffen op producten die uit het buitenland worden geïmporteerd. Deze invoerrechten hebben twee gevolgen. De buitenlandse producten worden voor de binnenlandse consument duurder. Hierdoor neemt de concurrentie in het binnenland vanuit het buitenland af. Dat is in het voordeel van binnenlandse producenten. Ten tweede strijkt de overheid extra belastinginkomsten op. Invoerrechten zijn dan ook erg populair en worden in de praktijk veel gebruikt. Op de website van de Wereldhandelsorganisatie (WTO) is gedetailleerde informatie beschikbaar over invoerrechten van alle landen in de wereld. Kijk op www.wto.org.
Bron 3 De gevolgen van invoerrechten (NL = Nederland; B = België). NL: geen invoerrechten B: geen invoerrechten
NL: wel invoerrechten B: geen invoerrechten
NL: wel invoerrechten B: wel invoerrechten
NL
B
NL
B
NL
B
Consumentensurplus
10
10
9
10
9
9
Producentensurplus
20
20
22
15
17
17
Invoerrechten
0
0
2
0
2
2
Totale surplus
30
30
33
25
28
28
Toch is iedereen beter af als er helemaal geen invoerrechten zouden bestaan. Neem als voorbeeld Nederland en België. Als er geen invoerrechten bestaan dan is het consumentensurplus in beide landen 10. Het Nederlandse en Belgische producentensurplus is 20. Producenten uit beide landen behalen een winst van 12 in het binnenland, en verdienen nog eens 8 met export. Dit zijn fictieve waarden. Het totale surplus is in beide landen dan 10 + 20 = 30. Als alleen Nederland invoerrechten oplegt op de importen uit België, verkopen producenten uit België minder in Nederland. In bron 3 staat wat er gebeurt met het totale surplus in de twee landen. Belgische producenten verdienen nog maar 3 met export naar Nederland zodat het Belgische producentensurplus daalt tot 15. De Nederlandse overheid haalt 2 op aan invoerrechten. En het Nederlandse producentensurplus stijgt tot 22: Nederlandse producenten verdienen nog steeds 8 met de exporten naar België, maar door de verminderde concurrentie in het binnenland nemen de winsten behaald in Nederland toe van 12 tot 14. Consumenten in België merken niets van de invoerrechten die Nederland oplegt want Nederlandse producenten kunnen nog steeds onbelemmerd exporteren naar België. Het consumentensurplus in België blijft 10 zodat het totale Belgische surplus uitkomt op 10 + 15 = 25. Voor consumenten in Nederland verandert er wel wat. Door de verminderde concurrentie in Nederland stijgt de prijs en daalt het consumentensurplus tot 9. Het totale surplus in Nederland is dan 9 + 22 + 2 = 33. Als reactie hierop kan België besluiten om ook een importheffing op te leggen. Daardoor dalen de Nederlandse exporten naar België. Belgische producenten verdienen dan 3 met de export naar Nederland en 14 op de thuismarkt. Het Belgische producentensurplus stijgt dan van 15 tot 17. De Belgische overheid haalt 2 op aan invoerrechten. Het consumentensurplus in België daalt tot 9 vanwege de verminderde concurrentie. Het totale surplus in België is nu 17 + 2 + 9 = 28. En dat is het in dit geval ook in Nederland want beide landen hanteren nu dezelfde invoerrechten.
Bron 4 De opbrengstenmatrix bij invoerrechten. België
Nederland
Geen invoerrechten
Wel invoerrechten
Geen invoerrechten
(30, 30)
(25, 33)
Wel invoerrechten
(33, 25)
(28, 28)
In bron 4 staat de opbrengstenmatrix van invoerrechten. In het evenwicht leggen beide landen invoerrechten op aan import terwijl beide landen erop vooruit gaan als ze dat niet zouden doen. Maar omdat het hier een gevangenenprobleem betreft zullen er toch invoerrechten bestaan. De WTO is opgericht om uit dit gevangenenprobleem te komen. Tijdens grootschalige, internationale vergaderingen, handelsronden genoemd, wordt geprobeerd om afspraken te maken om invoerrechten af te schaffen. Maar keer op keer worden die afspraken geschonden. Landen kunnen de verleiding niet weerstaan om invoerrechten op te leggen. En dat komt
vanwege het gevangenenprobleem waar landen zich in bevinden. Zo ontstaan er ‘handelsoorlogen’: oorlogen waarin landen elkaar bestrijden met de hoogte van invoerrechten. Het is de vraag of deze ooit zullen verdwijnen.
3 Het experiment 3.1 Handelsinstructie We gaan een aantal ronden achter elkaar een kaartspel spelen waarin je wordt gekoppeld aan een willekeurig ander persoon in de klas. Van tevoren weet je nooit wie dit zal zijn. En in iedere ronde is het weer iemand anders. Deze koppeling gebeurt via je identificatienummer. Dit nummer krijg je één keer uitgedeeld en zal tijdens het experiment niet meer veranderen. Onthoud dit nummer dus goed. Wanneer je je identificatienummer hebt gekregen, moet je dit opschrijven in de linkerbovenhoek van de opbrengstentabel. Deze tabel staat aan het einde van deze handelinstructie. Ik ga nu de identificatienummers uitdelen. Iedereen krijgt twee speelkaarten uitgedeeld, een rode kaart (harten of ruiten), aangegeven met de letter R, en een zwarte kaart (schoppen of klaveren), aangegeven met de letter B. Het cijfer of de kaartsoort maakt niet uit; alleen de kleur telt. Ik ga je nu vragen om in iedere speelronde één van deze kaarten ‘te spelen’ door hem tegen je borst te houden met de neutrale kant boven. Zo kan iedereen zien dat je je kaart gespeeld hebt, maar nog niet welke van de twee. In iedere speelronde ga ik telkens achter elkaar twee identificatienummers opnoemen. Als je je nummer hoort, moet je je gespeelde kaart omdraaien zodat iedereen kan zien welke kleur je hebt gekozen. Jouw opbrengst in een speelronde wordt bepaald door de kaart die je hebt gekozen (Z of R) en door de kaart die je tegenspeler heeft gekozen. De opbrengst die je krijgt per speelronde is als volgt: • Als je allebei de zwarte kaart speelt, dan verdien je allebei 2 punten. • Als je allebei de rode kaarten speelt, dan verdien je allebei 8 punten. • Als jij je rode kaart speelt en de ander speelt de zwarte kaart, dan verdient de ander 16 punten en verdien jij niets. • Als jij je zwarte kaart speelt en de ander speelt de rode kaart, dan verdient de ander niets en verdien jij 16 punten. Je houdt je verdiensten bij in de tabel. Gedurende het experiment mag er niet gepraat worden. Als je nog een vraag hebt, dan moet je me die nu stellen. Als er geen vragen zijn, dan begin ik met de eerste ronde door het opnoemen van de eerste twee identificatienummers.
Identificatienummer: _____ Ronde 1 2 3 4 5 6 7 8
Jouw kaart (Z of R)
Kaart tegenspeler (Z of R)
Jouw opbrengst
3.2 Experimentvragen
1 Stel de opbrengstenmatrix op van het spel. 2 Welke kleur kaart zou je kiezen als je weet dat de ander R speelt? Welke kleur kaart zou je kiezen als je weet dat de ander Z speelt? Wat kun je hieruit concluderen over het evenwicht van het spel?
3 Is het mogelijk om meer punten te halen als je mag overleggen met de speler aan wie je gekoppeld wordt? Is het daarvoor nodig een bindende afspraak te maken?
4 Als je de ander kent, ben je dan eerder geneigd R of Z te spelen? Maakt het uit of je elkaar buiten de klas nog ontmoet?
5 Lees de drie toepassingen in het handboek. Geef voor iedere toepassing aan welke actie overeenkomt met het spelen van R en welke actie overeenkomt met het spelen van Z.
6 Bedenk een andere toepassing die overeenkomt met het experiment. Daarvoor moet je het volgende bedenken:
• Wie zijn de twee spelers? • Wat zijn hun twee acties? • Wat zijn de opbrengsten die behoren bij de acties? Vul dan de opbrengstenmatrix in. Geef ook aan welke actie overeenkomt met het spelen van de zwarte kaart en welke actie overeenkomt met het spelen van de rode kaart.