De enveloppenparadox Mats Vermeeren (Berlin Mathematical School)
6 april 2013
1
Inleiding
Een spel gaat als volgt. Je krijgt twee identiek uitziende enveloppen aangeboden, waarvan je er ´e´en moet kiezen. Je weet dat er in ´e´en envelop dubbel zo veel geld zit als in de andere, maar je weet niet welke bedragen dat zijn. Nadat je een envelop gekozen hebt mag je hem openmaken. Daarna krijg je de mogelijkheid om nog van gedachten te veranderen. Je mag de andere envelop nemen, maar je mag ook gewoon het geld dat je in de eerste envelop gevonden hebt mee naar huis nemen. Wat is de beste keuze? De na¨ıve aanpak gaat als volgt. Noem het bedrag dat je in de eerste envelop gevonden hebt x. In de andere envelop zit ofwel 2x, ofwel x2 . Omdat er geen verschil te zien is tussen de twee enveloppen, is het even waarschijnlijk dat we de vette genomen hebben als dat we de magere gekozen hebben. In andere woorden: de kans dat de andere envelop x2 bevat is 21 , net zoals de kans dat de andere envelop 2x bevat. De verwachtingswaarde als we van envelop wisselen is dus 1 1 x x 5x · 2x + · = x + = , 2 2 2 4 4 en dat is groter dan x. Gemiddeld gezien is het dus beter om te wisselen, ongeacht de waarde van x. Probleem opgelost? Niet echt. Als je deze redenering volgt zal je keuze niet afhangen van wat je in de eerste envelop vind. Dus je had even goed van het begin af de andere envelop kunnen nemen. En dan zou je met dezelfde redenering besluiten dat het beter is om te wisselen, dus dat toch de eerste envelop beter is! Het gras is altijd groener bij de buren, zegt men, maar in de wiskunde zou het niet mogelijk mogen zijn dat A beter is dan B ´en B beter dan A. Wat is er misgelopen? 1
2
De jacht op de paradox
Noem de envelop die je in eerste instantie kiest A en de andere B. Het probleem is dat de kans dat envelop B het bedrag 2x (respectievelijk x2 ) bevat een voorwaardelijke kans is. Het is namelijk dat kans dat B de vette (respectievelijk magere) envelop is gegeven het feit dat A het bedrag x bevat. De correcte verwachtingswaarde is P(B is vet | A bevat x) · 2x + P(B is mager | A bevat x) ·
x . 2
Deze voorwaardelijke kansen hangen af van de kansverdeling van de hoeveelheid geld die in de enveloppen zit. De kansen zijn enkel gelijk aan 12 voor elke waarde van x als die verdeling uniform is. Maar alle positieve re¨ele getallen zijn mogelijke bedragen, en er bestaat geen uniforme verdeling op al deze getallen. Om het probleem toegankelijk te houden is het beter om de mogelijke waarden ietwat te beperken, namelijk tot machten van twee. De mogelijke waarden zijn dan dus, 21 = 2, 22 = 4, 23 = 8, . . . maar ook 20 = 1, 2−1 = 12 , 2−2 = 14 , . . . Verder gaan we ervan uit dat elk van deze waarden met een kans verschillend van nul optreedt. Deze aannamen maken het rekenwerk veel gemakkelijker, maar veranderen niets essentieels aan het probleem.1 Het enveloppenspel kunnen we met twee toevalsvariabelen modelleren: • X is het bedrag dat in de magere envelop zit. • Y is 1 als we de magere envelop kiezen en 2 als we de vette envelop kiezen. Er geldt dus dat P(Y = 1) = P(Y = 2) = 12 . Het bedrag dat we in de gekozen envelop vinden wordt dan gemodelleerd door de toevalsvariabele XY . We geven de geobserveerde waarde van dit bedrag de naam a. Het bedrag dat we krijgen als we van envelop wisselen is X ·(3−Y ): als Y = 1 vinden we na het wisselen de vette envelop met bedrag 2X = X · (3 − 1); als Y = 2 vinden we na het wisselen de magere envelop met bedrag X = X · (3 − 2). De (voorwaardelijke) verwachtingswaarde als we wisselen is dan E(X · (3 − Y ) | XY = a) = E(3X − XY | XY = a) = E(3X | XY = a) − E(XY | XY = a) = 3 · E(X | XY = a) − a. 1
In het bijzonder bestaat er ook op deze verzameling van getallen geen uniforme verdeling.
2
We weten niet wat E(X|XY = a) is, dat hangt van de verdeling van X af. Wat we willen weten is welke verdelingen tot een paradox leiden, dus voor welke verdelingen de voorwaardelijke verwachtingswaarde bij wisselen groter is dan a, het bedrag dat we krijgen als we niet wisselen. Dit feit wordt beschreven door de ongelijkheid 3 · E(X|XY = a) − a > a, of equivalent, 2 · a. (1) 3 Ik kan het belang van deze ongelijkheid niet genoeg benadrukken: de kern van de enveloppenparadox is dat wisselen voordeel biedt ongeacht van wat we in de eerste envelop vinden, dus dat deze ongelijkheid voor alle waarden van a voldaan is. E(X|XY = a) >
Stelling. Als ongelijkheid (1) geldt voor alle mogelijke waarden van a, dan is E(X) = ∞. Met andere woorden: als er een paradox is, dan is het verwachte bedrag in de enveloppen oneindig. Opmerking. De verwachting in de stelling is geen voorwaardelijke verwachting, we spreken dus over het bedrag dat we verwachten voordat we de eerste envelop geopend hebben. Bewijs. We willen informatie over de verdeling van X, maar ongelijkheid (1) zegt enkel iets over de voorwaardelijke verdeling van X gegeven XY = a. Een verband tussen die twee vinden we door in de formule a a E(X | XY = a) = a·P(X = a | XY = a)+ ·P X = XY = a (2) 2 2 het rechterlid te herschrijven. Hiervoor maken we ervan gebruik dat X en Y onafhankelijk zijn en dat P (Y = 1) = P (Y = 2): P(X = a en XY = a) P(XY = a) P(X = a en Y = 1) = P(X = a en Y = 1) + P X = a2 en Y = 2 P(X = a)P(Y = 1) = P(X = a)P(Y = 1) + P X = a2 P (Y = 2) P(X = a) = P(X = a) + P X = a2
P(X = a | XY = a) =
3
en P X = a en XY = a a 2 P X = XY = a = 2 P (XY = a) P X = a2 en Y = 2 = P (X = a en Y = 1) + P X = a2 en Y = 2 P X = a2 . = P (X = a) + P X = a2
Dus vergelijking (2) kan geschreven worden als a · P (X = a) + a2 · P X = E (X | XY ) = P (X = a) + P X = a2
a 2
.
Hiermee kunnen we ongelijkheid (1) zonder voorwaardelijke verachting herschrijven: a · P (X = a) + a2 · P X = a2 2 > · a. a 3 P (X = a) + P X = 2 Dit is equivalent met P (X = a) +
1 a 2 a ·P X = > · P (X = a) + P X = , 2 2 3 2
en dus met
a . 2 · P (X = a) > P X = 2 Uit deze ongelijkheid volgt dat voor elk natuurlijk getal n 2n · P (X = 2n ) > 2n−1 · P X = 2n−1 > . . . > P (X = 1) .
(3)
Dit heeft grote gevolgen als we de verwachte waarde van X berekenen. Deze verwachting is namelijk gelijk aan X E (X) = 2n · P (X = 2n ) n∈Z
1 1 = ... + · P X = + P (X = 1) + 2 · P (X = 2) + . . . 2 2 Al deze termen zijn positief, dus door termen te schrappen volgt hieruit dat X E (X) ≥ 2n · P (X = 2n ) = P (X = 1) + 2 · P (X = 2) + . . . n∈N
4
Door op al deze termen ongelijkheid (3) toe te passen, volgt tenslotte dat X E(X) ≥ P (X = 1) = P(X = 1) + P(X = 1) + ... = ∞, n∈N
want per aanname is P(X = 1) > 0.
3
Interpretatie
Als het verwachte bedrag oneindig is, is het niet meer paradoxaal dat wisselen een betere verwachte waarde geeft. Je verwacht dan oneindig veel geld, dus elk mogelijk eindig bedrag is een teleurstelling. Daarom kan je altijd verwachten dat er in de andere envelop meer geld zit. Als je het niet eens bent met deze interpretatie, dan ben ik er waarschijnlijk in geslaagd om een andere moraal mee te geven: verdelingen met een oneindige verwachting zijn vreemd! In de praktijk zijn zulke verdelingen dan ook heel zeldzaam. In de context van het enveloppenprobleem zou een oneindige verwachting impliceren dat de organisator van het spel over oneindig veel geld beschikt. Dat is natuurlijk een compleet onrealistische aanname. Dus als je het enveloppenprobleem nog steeds paradoxaal vindt, besef dan tenminste dat de paradox zijn wortels in deze absurde aanname heeft, niet in de wiskunde.
5