Speltheorie in de computerwetenschappen Patrick De Causmaecker Met dank aan Katja Verbeeck Katholieke Universiteit Leuven Campus Kortrijk
Mezelf • Licentiaat Wiskunde (Gent) • Doctor in de Fysica (Leuven) • Professor Informatica (Leuven-Kortrijk) Richtingen Wiskunde, Fysica, Informatica
Mijn Groep • ~20 onderzoekers • Artificiele intelligentie voor complexe combinatorische optimalisatie Optimalisatie in gedistribueerde systemen/Planning en Scheduling/Roosters voor personeel/bioinformatica/e-learning/digitale beeldverwerking/
Waarover gaat ‘speltheorie’? Speltheorie (Game Theory) = De theorie van rationele keuzes Onderwerp = Het gedrag van interagerende rationele beslissingsmakers
Rationeel? Het Monty-hall probleem
Wat is een spel? • Een spel beschrijft de STRATEGIEEN die de spelers kunnen kiezen • Een spel is geen relaas van keuzes en gebeurtenissen
1.e4 e5 2.Pf3 Pc6 3.Lb5 a6 4.La4 Pf6 5.d3 b5 6.Lb3 Lc5 7.Pc3 d6 8.Pd5 Pg4 9.00 Pa5 10.Lg5 f6 11.Ld2 Pb3 12.ab c6 13.La5
Een voorbeeld, we zullen verder niet over schaken spreken… •Bach/Stravinsky •2 spelers - 2 mogelijke acties
Bach
Strav.
Bach
2,1
0,0
Strav.
0,0
1,2
Een rationele keuze • De rijspeler is rationeel • …en weet dat de kolomspeler rationeel is L T
1,1
M
2,2
B
1,0
M
R
0,2
2,1
1,1 0,0
0,0 -1,1
Een beetje geschiedenis
• Gaat voor een deel terug tot de 18de eeuw. • Moderne grondleggers: • Emile Borel (1871~1956 • John Von Neumann (1903~1957)
Het eerste boek • Speltheorie wordt een onderzoeksdomein met het boek van John von Neumann en Oskar Morgenstern (1944)
John Nash (1928--)
Doctoraat Princeton 1950 (28 bladzijden!) Nash Equilibrium Theorie van het bieden
Toepassingen van speltheorie • • • • •
Economisce wet. Politieke wet. Psychologie Evolutieleer Computerwet.
• Prijszetting oligarchien,… • Drijgingen, koude oorlog • Probleem van de commons • Cooperatie in soorten • Netwerken, software
Nobelprijzen economie 1994
John C. Harsanyi
John F. Nash Jr.
Reinhard Selten
"for their pioneering analysis of equilibria in the theory of non-cooperative games"
Nobelprijzen economie 2005
Robert J. Aumann
Thomas C. Schelling
"for having enhanced our understanding of conflict and cooperation through game-theory analysis"
Kolom: Ik wil heel graag naar Bach gaan luisteren, ook wel naar Stravinsky Rij: Ik hoor liever Stravinsky, maar als het niet anders kan zit ik wel een Bachje uit Beiden: Alleen gaan is helemaal niets
Bach
Strav.
Bach
2,1
0,0
Strav.
0,0
1,2
Dit is een voorbeeld van een strategisch spel • Ook wel ‘matrix’ spel. • Beide spelers weten mekaars voorkeuren • Ze kunnen één voorstel doen, daarna ligt de beslissing vast • Hierbij weten ze (nog) niet waar de ander voor gaat
B S
Bach 2,1 0,0
Strav. 0,0 1,2
Stategische spelen • In het algemeen gaat het over n spelers • Het aantal spelers is hier 2 • In dit geval spreken we van rij (Stravinsky fan) en kolom (Bach liefhebber)
B S
Bach 2,1 0,0
Strav. 0,0 1,2
Acties • Elke speler beschikt over een verzameling acties • Een spel is eindig als het aantal acties voor elke speler eindig is
B S
Bach 2,1 0,0
Strav. 0,0 1,2
B
S
E
B
2,1
0,0
0,0
S
0,0
1,2
0,0
E
0,0
0,0
3,3
Acties • De spelers hebben voorkeuren • Deze voorkeuren zijn meestal voorgesteld door een getal (utility)
B S
Bach 2,1 0,0
Strav. 0,0 1,2
B
S
E
B
2,1
0,0
0,0
S
0,0
1,2
0,0
E
0,0
0,0
3,3
Een aantal klassieke voorbeelden: Het dilemma van de gevangenen • Prisoners dilemma
Ontken
Beken
Ontken
(1,1)
(4,0)
Beken
(0,4)
(3,3)
• De getallen stellen de te verwachten straf voor • De gevangenen verkiezen de lagere ‘waarden’
‘Battle of the sexes’
Bach
Strav.
Bach
2,1
0,0
Strav.
0,0
1,2
Een coördinatiespel
Mozart
Mahler
Mozart
2,2
0,0
Mahler
0,0
1,1
De havik en de duif Welk gedrag kiezen we? Duif
Havik
Duif
3,3
1,4
Havik
4,1
0,0
Chicken game
Chicken
Straight
Chicken
0,0
-1,1
Straight
1,-1
-10,-10
Kop of munt Zuiver competitief
Chemistry
Voor
Achter
Voor
1,-1
-1,1
Achter
-1,1
1,-1
Nash evenwichten • De verhandeling van John Nash in 1950 had als titel ‘Non-cooperative games’ • Hij toonde aan dat de oplossingen van spelen die tot dan toe bekend waren een kenmerk gemeen hadden: Nash Evenwicht
Informele definitie
Rationeel
• Een verzameling acties in een spel is in Nash Evenwicht als geen van de spelers een reden heeft om zijn gedrag te veranderen
• Prisoners dilemma
Ontken
?
? Beken
Ontken
(1,1)
(4,0)
Beken
(0,4)
(3,3)
‘Battle of the sexes’
Bach
Strav.
Bach
2,1
0,0
Strav.
0,0
1,2
De havik en de duif Welk gedrag kiezen we? Duif
Havik
Duif
3,3
1,4
Havik
4,1
0,0
Kop of munt Zuiver competitief
Chemistry
Voor
Achter
Voor
1,-1
-1,1
Achter
-1,1
1,-1
Een oneindig spel • Verkoop per opbod • Bieders 1,2,…,n • v1 > v2 > … > vn • Bod b1,b2,…,bn • Utility vi-bi voor de winnaar, 0 voor de anderen
Wat zijn de Nash Evenwichten voor dit spel?
Een oneindig spel • Verkoop per opbod • Bieders 1,2,…,n • v1 > v2 > … > vn • Bod b1,b2,…,bn • Utility vi-bi voor de winnaar, 0 voor de anderen
Elk bod van b1 met • v1 >= b1 >= v2 • b1 >= bj voor j <> 1 • b1 = bj, minstens één j > 1
Een oneindig spel • Onderstelling: – Alle vi zijn door iedereen gekend (iedereen weet wat het goed waard is voor elke andere)
• Andere technieken zijn nodig indien dit niet zo is
Elk bod van b1 met • v1 >= b1 >= v2 • b1 >= bj voor j <> 1 • b1 = bj, minstens één j > 1
Hoe komen we de echte waarde te weten?
• Alle spelers bieden, de hoogste bieder wint, maar betaalt de prijs van de tweede hoogste bieder • Vickery auction
Domante strategie: bj = vj, voor elke j
Nobelprijs economie 1996
William Vickery, vader van de theorie van veilingen
Dominante strategieën • Prisoners dilemma
Dominant voor de rijspeler
Dominant voor de kolomspeler
Ontken
Beken
Ontken
(1,1)
(4,0)
Beken
(0,4)
(3,3)
Pareto-optimale strategieën • Prisoners dilemma
Ontken
Beken
Ontken
(1,1)
(4,0)
Beken
(0,4)
(3,3)
• Er is geen andere strategie die – voor niemand slechter is – voor iemand beter is
Som nul spelen Steen Schaar Papier
• Voor elke strategie is de som van de utilities gelijk nul
Steen
0
1
-1
Schaar
-1
0
1
Papier
1
-1
0
Hoe speel je Schaar-Papier-Steen? 1/3
Rock
1/3
1/3
Scissor Paper
0.4
Rock Scissor
0 -1
1 0
-1 1
0.3
Paper
1
-1
0
0.3
• Geef de tegenspeler niets om zich aan vast te houden • Kies ALTIJD willeurig • Voorbeeld van een GEMENGDE strategie
STELLING
• Elk spel met n spelers en een eindig aantal zuivere strategieen heeft minstens één (misschien gemengd) Nash Evenwicht
Even proberen • The Da Vinci Code
• Mission Impossible III
1,0 1,0 0,1 0,1 2/3, 1/3 1/3, 2/3
DVC 2,1 0,0
DVC MI:3
MI:3 0,0 1,2
Speltheorie en Computerwetenschappen
• Berekenen van Nash evenwichten is een moeilijk en ingewikkeld probleem – Gebruik sterke rekencomputers – ‘Computational gametheory’
Speltheorie en Computerwetenschappen
• Bijvoorbeeld : – e-commerce – Beurs – Netwerken – Youtube – Productie –…
Speltheorie en Computerwetenschappen
• Het internet is een (grote) verzameling toestellen en programma’s die iets doen in opdracht van hun gebruikers (waarschijnlijk mensen) – Deze toestellen en programma’s gedragen zich rationeel en spelen eigenlijk een spel met heel veel spelers en heel veel acties
Morality • Rationaliteit is egocentrisch • Is dit realistisch • Misschien heb ik een beeld van mijn ‘tegenstrever’ • Wat brengt de toekomst • Kan dit echt gevat worden in speltheorie?
• We laten gehandicapten en ouderen zitten op de bus • Mijn tegenstrever is mijn tweelingbroer – Die doet wel net als ik
Wat brengt de toekomst? • Misschien ontmoeten we mekaar nog wel eens. • Als we het spel van de gevangenen herhaald spelen, wat doen we dan best?
• Spelen we oneindig lang of is er ooit een laatste keer?
• Als we het oneindig lang kunnen spelen is vertrouwen noodzakelijk
• De laatste keer kun je je tegenspeler niet meer vertrouwen… • De voorlaatste keer? • Prisoners dilemma
Ontken
Beken
Ontken
(1,1)
(4,0)
Beken
(0,4)
(3,3)
Gaat dit echt zo? • Axelrod 1984 – Laat ons dit uitproberen – We laten echte spelers het dilemmaspel spelen
• Een wedstrijd, diegene met de laagste straf of de hoogste opbrengst wint
And the winner is… • TIT-FOR-TAT – Begin met samen te werken (ontken) – Daarna doe je telkens wat er in de ronde ervoor werd gedaan
?