VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY
DIPLOMOVÁ PRÁCE
2012
Jan Preibisch
VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY
Název diplomové práce:
Rozhodovací situace v pokerových turnajích
Autor:
Jan Preibisch
Katedra:
Katedra ekonometrie
Obor:
Ekonometrie a operační výzkum
Vedoucí práce:
Mgr. Jana Sekničková, Ph.D.
Prohlášení: Prohlašuji, že jsem diplomovou práci na téma „Rozhodovací situace v pokerových turnajích“ zpracoval samostatně. Veškerou použitou literaturu a další podkladové materiály uvádím v seznamu použité literatury. V Praze dne 16. května 2012
........................................... Jan Preibisch
Poděkování: Na tomto místě bych rád poděkoval Mgr. Janě Sekničkové, Ph.D., za odborné vedení práce, za vstřícnost, se kterou přijala mnou vybrané téma, za poskytnuté připomínky a v neposlední řadě také za trpělivost a pečlivost při korektuře.
Dále mé poděkování patří Lukáši Horákovi, přednímu českému pokerovému hráči, za konzultace a zpětnou vazbu, zejména v oblasti praktické aplikace konceptů a modelů popisovaných v této práci.
ABSTRAKT Název práce:
Rozhodovací situace v pokerových turnajích
Autor:
Jan Preibisch
Katedra:
Katedra ekonometrie
Vedoucí práce:
Mgr. Jana Sekničková, Ph.D.
Tato diplomová práce se zabývá faktory, které jsou důležité pro rozhodování v karetní hře poker. Klade si za cíl nalézt určitý návod, jakým způsobem mohou hráči zvýšit svoje šance na úspěch v této karetní hře. V prvních dvou kapitolách jsou popsány základní teoretická východiska z teorie her a také pravidla samotné hry, dále jsou rozebrány konkrétní matematické modely a předpoklady, za kterých se dají aplikovat v samotné hře. Tyto modely se snaží nalézt optimální řešení jednotlivých rozhodovacích situací. Uvažuje se statický stav, kdy chování jednotlivých hráčů je předem dané a rozhodovatel se snaží nalézt adekvátní strategii. Také se uvažuje dynamická varianta, kdy jednotliví hráči na sebe reagují navzájem, což směřuje do rovnovážného stavu. Vzhledem k nárůstu obliby pokerových turnajů roste množství a dostupnost literatury, které se zabývají strategií, stejně tak množství analytického softwaru. Přesto však není a v nejbližší době pravděpodobně ani nebude možné matematicky vyřešit všechny rozhodovací situace, které v této karetní hře mohou nastat. Nadále bude významným faktorem úspěchu určitá hráčská intuice, zkušenosti a mentální dovednosti. Matematický aparát však bude hrát stále významnější roli. Tato práce by měla dopomoci pochopit základní principy využití matematických modelů v pokeru. Klíčová slova: turnajový poker, independent chip model, teorie her, Nashova rovnováha.
ABSTRACT Title:
Decision situations in tournament poker
Author:
Jan Preibisch
Department:
Department of Econometrics
Supervisor:
Mgr. Jana Sekničková, Ph.D.
This thesis deals with factors which are important for making decisions in the game of poker. The goal is to find a way to improve players chances of success in this game. The first two chapters describe the rules of poker and the basics and presumptions of the game theory The following chapters analyze some mathematical models and assumptions for applying these models in the game. These models should find the optimal solution for individuals in decision making situations. It can be considered a static situation, where the behavior of each player is predetermined and the decision maker tries to find an appropriate strategy. It is also can be considered a dynamic situation, when all players react to each other, which heads to equilibrium solution. As a consequence of rising popularity of poker tournaments many strategy books have appeared, as well as analytic software. Nevertheless, it is and probably will remain impossible to solve all decision situations which can occur. A very important factor of success are some gamblers attitude, experience and mental skills. Mathematical knowledge, however, will become more and more important. This thesis will help to understand the basic of mathematic models and their application in poker game. Keywords: tournament poker, independent chip model, game theory, Nash equilibrium.
Obsah 1.
Úvod ...............................................................................................................................................................................8 1.1. Vymezení tématu diplomové práce ...............................................................................................................8 1.2. Cíle práce a metodika ..........................................................................................................................................9 1.3. Jazyková poznámka .......................................................................................................................................... 11
2.
Poker jako sázková hra ....................................................................................................................................... 12 2.1. Rozhodovací situace a očekávaná hodnota ............................................................................................. 12 2.2. Očekávaný užitek a averze k riziku ............................................................................................................ 15 2.3. Poker z pohledu teorie her ............................................................................................................................ 17 2.4. Antagonistický konflikt a Nashova rovnováha ...................................................................................... 18 2.5. Snižování averze k riziku a bankroll management .............................................................................. 19
3.
Pravidla a základní pojmy a principy ............................................................................................................ 23 3.1. Pravidla Texas Hold´em pokeru................................................................................................................... 23 3.2. Značení a zápis .................................................................................................................................................... 25 3.3. Základní pojmy a předpoklady..................................................................................................................... 26 3.4. Předpoklady a omezení ................................................................................................................................... 27 3.5. Turnaje a Independent Chip Model ............................................................................................................ 29
4.
Heads-up a Nashova rovnováha ...................................................................................................................... 34 4.1. Síla startovní kombinace ................................................................................................................................ 36 4.2. Rozhodování o dorovnání sázky.................................................................................................................. 38 4.3. Rozhodování o sázení....................................................................................................................................... 40 4.4. Nashova rovnovnáha ........................................................................................................................................ 41
5.
Hra více hráčů ......................................................................................................................................................... 46 5.1. Klesající hodnota žetonů................................................................................................................................. 47 5.2. Nashova rovnováha při hře na bublině .................................................................................................... 50 5.3. Problémy a doporučení ................................................................................................................................... 52
6.
Závěr ........................................................................................................................................................................... 54
7.
Literatura .................................................................................................................................................................. 57
7
1. ÚVOD Na začátku 21. století zažívá poker obrovský rozmach, který se odráží také v oblibě této karetní hry v České republice. Hra samotná, jejíž historie sahá několik století zpět, má v sobě určitý punc tajemna i jistou kontroverzi. V mnoha státech světa je tato hra legislativně omezována, v jiných dochází k diskuzi, zdali poker patří do kategorie hazardu a úspěch či neúspěch účastníků závisí pouze na štěstí, nebo se jedná o dovednostní disciplínu a volbou správné strategie dokáží dobří hráči porážet ty slabé. Spolu se šachy, go a dalšími salónními hrami (jak bývají v literatuře tyto aktivity souhrnně označovány), dal poker podnět ke vzniku nové ekonomicko-matematické disciplíny, teorie her. Sami hráči shrnují základní princip úspěšnosti v pokeru jako dělání dobrých rozhodnutí v každé jednotlivé herní situaci. Kvůli nedostupnosti některých informací důležitých pro rozhodování (například neznalost karet soupeřů) a míchání karet, které funguje jako generátor náhodných událostí, je v pokeru zastoupen i aspekt štěstí, což činí tuto hru mimořádně atraktivní pro širokou veřejnost. Osobně se této hře věnuji několik let a jsem přesvědčen, že poker je především dovednostní disciplína a že v dlouhodobém horizontu se efekt štěstí výrazně snižuje na úkor schopností hráče, které spočívají především ve vyhodnocení hry a učinění správného rozhodnutí v dané situaci. Mým cílem v této práci je popsat některé zásadní matematické a ekonomické aspekty hry na základě znalostí získaných během studia na Vysoké škole ekonomické, zejména v kurzech katedry Ekonometrie na Fakultě informatiky a statistiky.
1.1. VYMEZENÍ TÉMATU DIPLOMOVÉ PRÁCE Samotná hra poker existuje v mnoha variantách a je nemožné matematicky popsat všechny tyto varianty a optimální strategii, ale dokonce není možné detailně prozkoumat ani jedinou z nich. Celá hra je natolik komplexní v rozhodovacím procesu, že zvládnutý matematický aparát je výraznou, nikoliv však jedinou výhodou dobrého hráče nad ostatními. Svojí významnou roli hrají i tzv. měkké dovednosti, jako je psychologie, schopnost čtení soupeřů, vyhodnocování hry a samozřejmě zkušenost. S určitým zjednodušením by se dalo říci, že matematický aparát určí optimální strategii pro každou herní situaci na základě parametrů, jejichž hodnotu musí hráč správně určit či alespoň odhadnout s dostatečnou přesností. Rozhodl jsem se věnovat se variantě Texas Hold´em s neomezenou velikostí sázek (No Limit), jelikož se jedná o v současné době nejpopulárnější pokerovou disciplínu, které se celosvětově, podle odhadů, rekreačně i profesionálně věnují desítky milionů lidí. V kamenných obchodech 8
i na internetu se objevují knihy, články, diskusní fóra či výuková videa věnující se strategii na všech úrovních hry, od začátečníků až po profesionály. Dále je k dispozici mnoho softwarů, které zaznamenávají a rozebírají hru a správná interpretace a analýza výstupů z těchto programů je pro mnoho hráčů významným faktorem úspěchu. Texas Hold´em, stejně jako ostatní varianty, se hraje ve dvou disciplínách. První disciplína je cash game, kdy hráč za své finanční prostředky obdrží ekvivalent v žetonech, veškeré výhry a prohry v jednotlivých hrách reprezentují skutečnou peněžní hodnotu. Povinné sázky zůstávají po celou dobu hry stejné, hráč může kdykoliv do hry vstoupit a kdykoliv odejít a směnit si žetony zpět za peníze. Druhá disciplína je turnajový poker, kdy každý účastník obdrží předem daný počet žetonů a končí ve chvíli, kdy přijde o všechny tyto žetony. Turnaj pokračuje do doby, než zůstane poslední účastník, sázky se zvyšují v pravidelných časových intervalech. Výhry i prohry v jednotlivých hrách nereprezentují skutečnou hodnotu peněz z důvodu nemožnosti ukončit turnaj předčasně a proměnit žetony zpět za hotovost, existuje pouze teoretický matematický model pro tento přepočet, který bude v této práci zmíněn. Výhry v turnaji se poté rozdělí mezi nejlepší účastníky podle předem daného klíče, celková finanční (či jiná) dotace (tzv. prizepool) je zpravidla tvořena vklady hráčů1. Ve své práci se hodlám věnovat turnajové hře, zejména střední a pozdní fázi, kdy povinné sázky budou tvořit významnou část počtu žetonů jednotlivých hráčů. V těchto situacích roste význam matematiky na úkor psychologie a dalších měkkých dovedností, což je ještě posíleno při hře na internetu, kdy jednotliví hráči nejsou ve fyzickém kontaktu a odpadá tak možnost sledování vnějších vlivů. Naopak mnozí z nich mají podpůrné softwarové programy, které uchovávají statistiky o soupeřích a významně tak napomáhají k rozhodování.
1.2. CÍLE PRÁCE A METODIKA Přestože je poker čím dále populárnější, není mi známo, že by se v České republice někdo tímto tématem zabýval na akademické půdě. Na druhou stranu o hře samotné existuje i v českém jazyce mnoho materiálů, většina z nich je věnována základním strategiím (jejichž zvládnutí samo o sobě je dostatečným předpokladem pro dobrou hru, alespoň na nižších finančních limitech),
V praxi si provozovatel ponechává určitou část z prizepoolu jako provizi. V mnohých kasinech či internetových hernách jsou poměrně oblíbené turnaje s garancí, kdy pořadatel zaručuje minimální velikost dotace. V případě malé účasti, kdy se částka nevybere z vkladů hráčů, doplácí provozovatel peníze ze svých zdrojů. Overlay, tedy doplácená částka, je významným marketingovým prvkem řady kasin i on-line heren. 1
9
některé z těchto pramenů obsahují určité výpočty, jedná se většinou o matematiku na středoškolské úrovni, kde je postačující elementární zvládnutí základů kombinatoriky a pravděpodobnosti. Drtivá většina dostupné literatury do poloviny první dekády 21. století se pokeru věnovala dosti povrchně a byla určena především začínajícím a mírně pokročilým hráčům. Přestože se zde objevují některé zajímavé texty (zejména práce od Davida Sklanskeho [17] nebo knihy pro turnajové hráče od Dana Harringtona [7; 8]), většina literatury se zabývá pouze obecnými radami a pokerová matematika je zmiňována pouze na úrovni hodnocení poměru velikosti sázky k banku a procentuální šance na jeho získání. Do určité doby alespoň průměrné zvládnutí této problematiky bylo dostačující k úspěchu jak v turnajích, tak i cash game. Spolu s růstem hráčské základny nejprve ve Spojených státech, následně pak celosvětově, a zároveň rozmachem on-line pokeru, se objevují nové formáty v turnajové hře. Na internetu je možné hrát na více stolech najednou, klesá význam čtení soupeře na základě mimiky, nonverbálních signálů a dalších měkkých faktorů, zároveň lze poměrně snadno uchovávat a zaznamenávat jednotlivé hry pomocí specializovaných programů. Výstupem jsou statistické ukazatele, na jejichž základě je poté možno určit adekvátní reakci na konkrétní akci každého jednotlivého soupeře. Na významu získávají tvrdé faktory, pro hráče je více než dříve důležité zvládnutí matematického aparátu, pravděpodobnosti a podobně. Na tento vývoj reaguje i dostupná literatura. Vznikají specializované webové stránky, diskusní fóra, ale samozřejmě také tištěné knihy. Mezi autory proniká mnoho mladých hráčů, kteří vzešli z online prostředí. Objevují se pokročilejší koncepty, zaměřené na matematickou stránku hry, začínají se objevovat i české překlady některých knih. Ze zdrojů, ke kterým jsem se během práce dostal, je nejdále asi titul Raiser´s Edge od Bertranda Grospelliera [6] a dalších autorů, tato kniha na počátku roku 2012 nebyla přeložena do češtiny. V českém prostředí se matematickými aspekty hry zabývá nejčastěji Lukáš Horák, profesionální hráč píšící strategické články pro portál Pokerarena.cz. Cílem mé práce je shrnout dostupné informace a vytvořit práci v českém jazyce, která zahrnuje právě matematickou část hry. Na poskytování rad ohledně psychologie a dalších faktorů se necítím dostatečně povolaným a zkušeným hráčem, přesto v některých případech se tomu nedokážu vyhnout, budu proto citovat dostupnou literaturu, nebo uvedu v textu převládající názor předních českých hráčů. Byl bych rád, kdyby tato práce měla hodnotu akademickou, aby v sobě shrnovala poznatky zejména z teorie her a teorie rozhodování s ohledem na aplikaci v turnajové hře No Limit Texas Hold´em pokeru. Zároveň věřím, že mé bádání bude prospěšné i pro českou pokerovou komunitu a najde si čtenáře i mimo akademickou půdu. Mnozí hráči mi poskytli materiály, které 10
zlepšují moji hru a zároveň jsou mi zdroji či inspirací pro tuto diplomovou práci. Díky svým kontaktům mám přístup k některým neveřejným zdrojům, jako jsou soukromá diskusní fóra nebo výuková videa. Aby tato práce byla srozumitelná, na začátku se ve stručnosti zmíním o pravidlech hry samotné, vysvětlím základní pojmy, se kterými budu v textu dále pracovat. Shrnu teoretické poznatky a východiska, na kterých budu stavět teoretickou část své práce. V další části hodlám pomocí matematického aparátu popsat základní strategické koncepty hry, které přicházejí na řadu ve střední a pozdní fázi pokerových turnajů, také naznačit odlišnosti v počáteční fázi. Zároveň se pokusím nalézt i optimální či rovnovážné řešení pro typické situace. Vzhledem k množství parametrů (počet hráčů u stolu, pořadí hry, výplatní struktura, velikost povinných sázek a počtu žetonů, charakteru jednotlivých účastníků a jejich postoj k riziku a podobně) není možné sestavit univerzální recept na optimální řešení každé situace, pokusím se podat určitý návod a směřovat čtenáře k tomu, které faktory jsou při rozhodování relevantní.
1.3. JAZYKOVÁ POZNÁMKA V pokeru, stejně jako v jiných sportovních, společenských a zájmových aktivitách, existuje určité specifické názvosloví, které vychází z anglického jazyka. V české literatuře se některé pojmy uvádějí v českém ekvivalentu, některé jsou ponechány v angličtině, často se tento přístup kombinuje. Ve své práci se budu snažit respektovat zvyklosti českých hráčů a většinu pojmů budu uvádět v tom jazyce, který je pro hráče přirozený, nebudu se snažit násilím hledat český ekvivalent, ale veškeré pojmy vysvětlím v textu.
11
2. POKER JAKO SÁZKOVÁ HRA Na konci roku 2011 probíhala v České republice na úrovni vlády a poslanecké sněmovny debata, jakým způsobem legislativně podchytit stále rostoucí popularitu pokeru. Na jedné straně vystupovali zastánci této karetní hry formálně zastoupení Asociací českého pokeru, jejich názoroví oponenti byly zejména sázkové společnosti. Asociace hájila zejména dovednostní charakter pokeru a skutečnost, že dobří hráči jsou v dlouhodobém horizontu schopni porážet ty slabší, druzí zdůrazňovali fakt, že se poker hraje o peníze, a proto má být regulován a podléhat loterijnímu zákonu, stejně jako black jack, ruleta, kurzové sázení a další hazardní hry. Ve většině ekonomických učebnic určených pro studenty ekonomických oborů je člověk chápán jako tvor racionální, který se na základě daných omezení (vzácností zdrojů, finančních možností a podobně) snaží maximalizovat svůj užitek, který může být vyjádřen penězi, subjektivním pocitem uspokojení nebo jakoukoliv další veličinou nebo stavem, který je žádoucí a porovnatelný se stavem jiným. Do rozhodovacích situací se všichni dostáváme každý den. Ať už se jedná o věci nepříliš důležité, například které jídlo si vybereme z poledního menu nebo jakým způsobem strávíme večer, nebo o záležitosti zásadní, například volba školy nebo povolání, vždy se snažíme předvídat klady a zápory naší volby, málokdy však dokážeme s naprostou přesností zvážit všechny důsledky našich činů. Každé rozhodnutí je ovlivněno určitým stupněm rizika. Sázkové hry jsou svým způsobem zjednodušením reality a jsou mezi lidmi velmi oblíbené. Pro bližší zkoumání mají tyto hry jednu nespornou výhodu: riziko a výnos je zpravidla možné poměrně přesně kvantifikovat. Přesto se najde velké množství lidí, kteří jsou ochotni akceptovat pro ně nevýhodný poměr velikosti a pravděpodobnosti výhry. Podle údajů ministerstva financí v roce 2010 prosázeli Češi 125,6 miliardy korun [2], přitom zpět na výhrách bylo vyplaceno 93,8 miliardy, tedy 74,7% vsazených prostředků. Ponechme nyní stranou debatu, jestli máme považovat poker za hazard a v jaké míry se jedná o dovednostní disciplínu. Zajisté ale můžeme poker označit jako hru sázkovou. V drtivé většině případů se hraje o reálné peníze, obecně ale stačí body či jakékoliv jiné kvantifikovatelné ohodnocení jednotlivých účastníků.
2.1. ROZHODOVACÍ SITUACE A OČEKÁVANÁ HODNOTA V sázkových hrách, ale i v běžném životě se dostáváme do situací, kdy výsledek naší činosti nelze s jistotou určit. Matematicko-ekonomické modely pro tuto situaci předpokládají, že může nastat 12
jeden z několika stavů S1 S2, … , Sn, které mají ohodnocení a1, a2, … , an. Pravděpodobnost jejich výskytu je potom p1, p2, … , pn, přičemž tyto stavy jsou navzájem disjunktní a součet jejich pravděpodobností je 1. Pokud máme více variant, ohodnocení každé z nich pro každý stav vyjadřujeme v matici, kde řádky reprezentují jednotlivé varianty a slopce všechny možné stavy. Známe-li pravděpodobnostní rozdělení stavů, hovoříme o rozhodováni při riziku, v opačném případě o rozhodování při neurčitosti. Více se tímto tématem zabývá například Fiala [5, str. 22 a dále]. Očekávaná hodnota je váženým průměrem ohodnocení všech možných stavů, které násobíme pravděpodobností jejich výskytu. Jedná se tedy o střední hodnotu výsledku naší volby. Formálně zapsáno:
Toto číslo může nabývat jak kladných, tak záporných hodnot. Racionální člověk si většinou vybírá z více variant tu, která má očekávanou hodnotu nejvyšší. To sice není pravidlem, jiným kritériem může být například minimalizace rizika, maximalizace minimální hodnoty a další, přesto je očekávaná hodnota považována za významné rozhodující kritérium. V sázkových hrách většinou nastává pouze jedna ze dvou variant, a sice výhra nebo prohra. Tuto situaci je možné zapsat ve tvaru
kde W značí velikost výhry a L velikost prohry v absolutních číslech, druhá proměnná je zpravidla rovna velikosti sázky. Proměnná p je potom pravděpodobnost výhry. Očekávaná hodnota znamená potom průměrnou výhru či ztrátu hráče v dlouhodobém horizontu, pokud by se do stejné situace dostával opakovaně. Někdy je výhodnější vyjádřit očekávanou hodnotu nikoliv jako průměrnou budoucí výhru, ale jako budoucí stav. Modifikovaný vzoreček je potom
kde SW značí stav v případě výhry (například množství peněz), SL je potom stav v případě prohry. Oba přístupy jsou ekvivalentní, liší se pouze v interpretaci. Pokud nebude řečeno jinak, budu v dalším textu psát o očekávané hodnotě ve smyslu prvního přístupu. Sázka je považována pro hráče za výhodnou, pokud má kladnou očekávanou hodnotu podle (2.2), případně pokud je očekávaná hodnota podle (2.3) vyšší, než je původní stav. Tyto situace 13
bývají mezi pokerovými hráči a sázkaři obecně označovány jako +EV, analogicky se značí –EV, pokud má sázka záporné očekávání; můžeme take hovořit o situaci EV neutrální. Ne vždy je nutné znát očekávanou hodnotu sázky, často postačí pouze určení znaménka. U většiny hazardních her je předem známa velikost sázky a výše případné výhry, její pravděpodobnost může a nemusí být známa. Potom řešíme otázku, jak velká musí být pravděpodobnost výhry, aby byla situace výhodná. Po úpravě vzorečku (2.2) dostáváme
Pokud je L velikost sázky, potom součet L+W znamená, kolik hráči bude skutečně vyplaceno za předpokladu, že původní sázka propadne (což je v praxi častý případ). Pravděpobnost výhry tedy musí být vyšší, než je poměr sázky a výplaty, v případě rovnosti poměru sázky a výplaty a pravděpodobnosti výhry hovoříme o spravedlivé hře [10, str. 118]. Pokud sází hráč proti provozovateli, například kasinu nebo sázkové společnosti, je sázející v nevýhodě, tyto sázky v drtivé většině případů mívají zápornou očekávanou hodnotu. Ztráta hráče je potom příjmem provozovatele. Například ve francouzské ruletě2 je očekávaná hodnota každé sázkové příležitosti rovna -1/37L, marže kasina je tedy v průměru 2,7 % ze vsazené částky. Ve sporovním sázení nejsou na rozdíl od rulety či jiných kasinových her pevně dané poměry sázek a výplat, to určuje na základě vlastního uvážení bookmaker. Nejprve ohodnotí pravděpodobnost, že nastane událost, na kterou je nabízena sázková příležitost, potom stanoví rovnovážný kurz, tedy převrácenou hodnotu pravděpodobnosti tohoto jevu. Výsledné číslo se dále sníží o určitou část, což tvoří zisk sázkové kanceláře. Občas bookmaker vyhodnotí špatně pravděpodobnost dané události a vypíše kurz příliš vysoký, taková situace se potom nazývá kurzová chyba. Profesionální sázkaři potom tyto chyby vyhledávají a sázejí na ně, bez ohledu na to, jak je vypsaná událost pravděpodobná. Poker se od tradičních hazardních her liší tím, že hráči nesázejí proti provozovateli, ale mezi sebou. Dříve, než se pustím do popisu pravidel, stačí ve stručnosti shrnout, že v každé partii pokeru hráči, kteří sázejí, vytvářejí podobu sázkových kurzů pro své soupeře. Ostatní hráči se snaží odhadnout svoji šanci na výhru banku a porovnat ji s cenou, kterou musejí zaplatit pro
Francouzská ruleta je kolo, které je rozděleno na 37 výsečí očíslovaných od 0 do 36. Veškeré kurzy jsou nastaveny tak, že v případě absence jedné výseče by se jednalo o spravedlivou hru. Pokud hráč například uhodne konkrétní číslo, získá třicetipěti násobek vsazené částky a původní sázku zpět. 2
14
možnost soupeřit o bank, a také s velikostí banku. Správná velikost sázek a správné vyhodnocení svých šancí jsou v dlouhodobém horizontu klíčem k úspěchu v pokeru.
2.2. OČEKÁVANÝ UŽITEK A AVERZE K RIZIKU V předchozím textu jsem zmínil očekávanou hodnotu jako významné kritérium pro rozhodovací situace racionálně uvažujícího jedince. V běžném životě se ale často setkáváme se situací, kdy se lidé rozhodují pro situace, které jsou –EV, případně odmítnou pro ně výhodnou situaci. Nemusí to být nutně v rozporu s racionalitou. Jedna z příčin může být špatné odhadnutí míry rizika a výnosu. Většina hazardních her má sice zápornou očekávanou hodnotu, ale zpravidla velký rozptyl možných výsledků. V krátkodobém horizontu lze dosahovat poměrně zajímavých výher a tato vidina zbohatnutí motivuje hráče k dalšímu sázení. Častý omyl u her, jako je ruleta, je zdálnivá závislost jednotlivých náhodných pokusů. Pokud například padla pětkrát po sobě červená barva, vždy se najde dobrodruh, který bude tvrdit, že nyní už černá musí padnout. Na tomto principu jsou založeny různé systémy sázení, jak „zaručeně“ zvítězit na ruletě. Pokud jsou ale jednotlivé pokusy opravdu nezávislé (což u mechanické rulety platí vždy a u elektronické se to dá předpokládat) a zároveň má každá jednotlivá sázka zápornou očekávanou hodnotu, neexistuje způsob, jak být za těchto podmínek dlouhodobě v zisku, pokud máme konečné finanční prostředky. Další možná příčina vychází z ekonomické teorie užitku, která vysvětluje preference a chování spotřebitelů. Na několika příkladech to ilustruje například Holman [10, str. 119]. Pokud budeme uvažovat závislost velikosti užitku na množství finančních prostředků, dostaneme funkci rostoucí, ale konkávní. Spotřebiteli z modelového příkladu přináší například 10 000 korun větší užitek nežli 1 000, málokdy se ale jedná o užitek desetinásobně větší. V podmínkách rozhodování při riziku se často využívá nikoliv očekávané hodnoty (či výnosu), ale očekávaného užitku. Vzorec je podobný (2.3), tedy
kde UW značí užitek v případě příznivé situace, UL je potom užitek v případě situace nepříznivé. Očekávaný užitek potom porovnáváme s užitkem ve výchozím stavu. Holman ve své knize uvádí příklad chudého Lukáše, který má majetek 4 000 Kč a rozhoduje se, jestli se zůčastní hodu mincí. Pravděpodobnost výhry je p = 0,5, nevratná sázka je 3 000 Kč,
15
výplata v případě výhry je 6 000 Kč. Očekávaná hodnota bohatství je 4 000 Kč3, jedná se tedy o spravedlivou hru a situaci EV neutrální. Lukášovy subjektivní užitky jako bezrozměrná veličina byly v tomto příkladě zvoleny tyto hodnoty: UW = 800, UL = 200, výchozí užitek U0 = 630. Jednoduchým výpočtem zjistíme, že očekávaný užitek je EU = 500, Lukáš tedy hru odmítne. Celá situace je ilustrována na obrázku 2.1
OBR. 2.1 – FUNKCE UŽITKU V ZÁVISLOSTI NA BOHATSTVÍ, ÚSEČKA BC REPREZENTUJE HODNOTU OČEKÁVANÉHO UŽITKU PRO VŠECHNY PRAVDĚPODOBNOSTI VÝHRY, BOD E JE OČEKÁVANÝ UŽITEK ZE HRY. PODÍL CE/BC JE PRAVDĚPODOBNOST VÝHRY, V TOMTO KONKRÉTNIM PŘÍPADĚ 0,5 [10, STR. 121]
Je možné, že by Lukáš byl ochoten akceptovat hru ze vzorového příkladu, pokud by se hrálo například o deset korun. Jeho očekávaný užitek ze hry by byl sice menší, než kdyby nehrál, rozdíl může být ale natolik malý, že bude pod jeho rozlišovacími schopnostmi. Také by se pravděpodobně našel hráč, který by byl ochoten si zahrát klidně o celé tři tisíce. Tvar užitkové křivky je individuální, pro některé jedince se může mít mnohem menší zakřivení nebo se dokonce může jednat o přímku. Důvodem konkávního zakřivení užitkové funkce je averze k riziku, tedy psychologická vlastnost, kvůli které většina lidí dává přednost jistotě před spravedlivou hrou.
3
Zde je výhodnější zkoumat nikoliv velikost výhry, ale budoucí stav podle vzorce (2.3).
16
2.3. POKER Z POHLEDU TEORIE HER Zatímco u většiny sázkových her proti sobě stojí hráč a provozovatel, v pokeru se utkávají hráči mezi sebou navzájem. Každý hráč svými sázkami tvoří kurzy pro ostatní, zároveň je ale akceptuje. Nevystačíme si nyní se statickým pohledem jako v ostatních hrách, kdy jsou velikosti a pravděpodobnosti výher pevně dané, musíme vzít v potaz, že hráči hrají proti sobě a jejich zájmy jsou tedy v rozporu. Řešením konfliktních rozhodovacích situací s více účastníky se zabývá matematicko-ekonomická disciplína teorie her. Ta vznikla jako reakce na hledání strategií v šachách nebo karetních hrách, v dnešní době je uplatnění poznatků této disciplíny poměrně široké. Skripta Úvod do teorie her [3] používané na Vysoké škole ekonomické popisují základní modely používané v rozhodovacích situací s více účastníky. Pomocí matematického aparátu jsou zde popsány jednotlivé problémy a ukázáno nebo alespoň naznačeno, jakým způsobem by se měli jednotliví účastníci konfliktu chovat, pokud jsou racionální. Pokud se na konflikt dvou nebo více účastníků díváme pohledem teorie her, ne vždy je možné každou situaci zařadit do typické škatulky. Poker je jedním z takových příkladů. Jakým způsobem tuto karetní hru modelovat? Bez ohledu na skutečnost, jestli se jedná o turnajový poker nebo cash game, se každý jednotlivý hráč snaží pro sebe získat co největší výhru na úkor ostatních. V cash game se hráči snaží připravit soupeře o peníze, se kterými si přisedl ke stolu, toto množství je neměnné4, stejně jako v turnajích se každý snaží získat co největší podíl z prizepoolu. Jedná se tedy o antagonistický konflikt, kdy jeden hráč získá právě to, co druhý ztratil, v případě více než dvou hráčů se součet výher a proher (s opačným znaménkem) musí rovnat nule v případě cash game, v případě turnajů se součet výher rovná finanční dotaci turnaje. Zároveň se jedná o opakovanou hru. Poker se skládá z jednotlivých partií a strategie dobrých hráčů není univerzální, ale snaží se přizpůsobit oponentům, hledat a trestat jejich chyby i za cenu, že sami nabídnou jiným hráčům možnost zneužít odklon od ideální strategie. Většina lidí se snaží reagovat na chování svých soupeřů, což vyvolává reakci z druhé strany. Kdo se dokáže přizpůsobit efektivněji, vyhrává. David Sklansky toto popisuje jako výhru v bitvě chyb [17, str. 30], kdy chybou se rozumí odklon od rovnovážné strategie, nikoliv špatné rozhodnutí. Zde více
Neuvažujeme případnou provizi provozovatele, podobně jako například v modelech oligopolu neuvažujeme zdanění zisků firem. Ani jedno nemá vliv na použití modelu, kterým danou situaci popisujeme. 4
17
než matematické znalosti rozhodují psychologické dovednosti, schopnost čtení hry, dobrý pozorovací talent a analytické myšlení. Poker lze také chápat jako hru s nedokonalou informací. Známe pouze svoje karty na ruce a případně společné karty, nevíme, co drží v ruce soupeř. Tuto informaci můžeme pouze s určitou pravděpodobností odhadnout. Opět platí, že zde důležitou roli hrají měkké faktory a zkušenosti.
2.4. ANTAGONISTICKÝ KONFLIKT A NASHOVA ROVNOVÁHA Přes určité výhrady a omezení je asi nejpřesnější popis pokeru jako antagonistického konfliktu. Vycházejme z teoretického předpokladu, že máme dva účastníky konfliktu (hráče), oba jsou racionální a také znají důsledky všech kombinací vlastního a soupeřovo rozhodnutí, které dokážeme kvantifikovat a zachytit v matici. Tento model nazýváme hra v normálním tvaru [3, str. 17]. Variantu v terminologii teorie her nazýváme strategií a výběr patřičné strategie je v maticích znázorněn v řádcích pro prvního hráče a ve sloupcích pro hráče druhého. V antagonistickém konfliktu jeden hráč získává přesně to, co druhý ztratil, součet výnosů obou účastníků je konstantní. Vzhledem k tomu, že výše této konstanty je důležitá pouze pro interpretaci, nikoliv model samotný, je možné jednoduchou matematickou operací bez újmy na obecnosti úlohu upravit na hru s nulovým součtem. Proto se v matici zachycuje pouze zisk prvního hráče, který je zároveň ztrátou pro hráče druhého. Základním úkolem teorie her je najít rovnovážnou strategii, tedy situaci, kdy žádný hráč nemůže odchýlením od optimální strategie získat více za předpokladu, že soupeř se bude nadále držet rovnovážné strategie. Tento stav se nazývá Nashova rovnováha. Uvažujme případ, kdy oba hráči mají na výbeř ze tří variant a výplatní funkce (tedy zisk prvního hráče, respektive ztráta hráče druhého) je zapsána v následující matici.
Rovnovážný bod (vyznačen tučně) se nalézá v prvním řádku a ve třetím sloupci a tato hodnota se nazývá cena hry. Z pohledu na matici je patrné, že si žádný z hráčů nemůže polepšit. V tomto případě se jedná o tzv. sedlový bod, který je největší ve svém sloupci (první hráč maximalizuje svůj zisk) a zároveň nejmenší ve svém řádku (druhý hráč minimalizuje svojí ztrátu). Řešení podobné úlohy je jednoduché a nepříliš zajímavé. Jiná situace nastává, pokud matice hry nemá žádný sedlový bod. I zde existuje Nashovo rovnovážné řešení. Pro hráče představuje optimální strategie vektor x (respektive vektor y pro 18
druhého hráče), kdy jednotlivé složky vektoru přestavují pravděpodobnost, že si hráč zvolí první až n-tou strategii). V tomto případě hovoříme o smíšených nebo pravděpodobnostních strategiích. Cenou hry nazýváme očekávanou hodnotu výhry pro prvního hráče, kterou vypočteme podle vzorce uvedeného níže [3, str. 23]. Matice A je výplatní matice hry.
Toto je například demonstrováno na hře kámen, nůžky, papír [3, str. 22], která je popsána pomocí následující matice (řádky i sloupce představují varianty kámen, nůžky a papír v tomto pořadí).
Rovnovážné strategie pro oba hráče jsou popsány vektorem x=y=(1/3; 1/3; 1/3)T, cena hry je potom rovna hodnotě nula. Pokud se druhý hráč odchýlí od své optimální strategie, očekávaná hodnota výhry prvního hráče se nezmění. Pokud druhý hráč bude stále volit variantu „kámen“, první hráč v jednom ze tří případů nic nezíská ani neztratí (kámen), v jednom ze tří případů získá -1 (nůžky) a v jednom ze tří případů získá 1 (papír). První hráč tedy není schopen potrestat vychýlení hráče 2 od rovnovážného stavu, pokud sám neudělá chybu podle Sklanského slova smyslu. Pokud například můj soupeř bude z nějakého důvodu preferovat variantu kámen před ostatními varantami v poměru (0,4; 0,3; 0,3), bude pro mě nejvýhodnější preferovat variantu papír. Moje strategie (0,3; 0,3; 0,4) bude zisková, očekávaná hodnota výhry je 0,01. Při výběru strategie (0; 0; 1) se moje očekávaná hodnota zvýší na 0,1.
2.5. SNIŽOVÁNÍ AVERZE K RIZIKU A BANKROLL MANAGEMENT Nashova rovnováha v antagonistických konfliktech je pouze teoretickou odpovědí na hledání optimální strategie obou hráčů zároveň. Ne vždy je situace tak jednoduchá, jako v případě hry kámen, nůžky, papír. Ne každá situace, kde se střetávají dva soupeři protichůdných zájmů, se dá popsat maticově, jako v případě hry v normálním tvaru. Hledání Nashovy rovnováhy může být záležitostí poměrně složitou, ne vždy bude analytické řešení dostupné, v tom případě se hledá alespoň přibližné řešení, například pomocí počítačových simulací.
19
Stěží můžeme předpokládat, že v reálných rozhodovacích situacích budou znát jednotliví účastníci svoji optimální strategii, pokud ji nedokáže spolehlivě zjistit ani moderní výpočetní technika. Bitva chyb podle Davida Sklanského předpokládá, že při opakování jednotlivých pokerových partií se jednotliví hráči přizpůsobují sobě navzájem. Neplatí to ale vždy, mnoho hráčů se drží, často nevědomky, svého typického stylu hry a ten nemění vůbec nebo pouze velmi pozvolna. Zatímco na příkladu hry kámen, nůžky, papír z předchozí podkapitoly si i méně bystří jedinci všimnou, že soupeř v reakci na jeho mírnou preferenci variant „kámen“ odpovídá volbou „papír”, v pokeru situace nebývá tak očividná. Pokud se v pokeru hráč není schopen či ochoten přizpůsobit, v zásadě se jedná o jeden ze dvou případů. Buď se hráč účastní příliš mnoha partií včetně těch, které jsou pro něj nevýhodné, nebo je hráč příliš opatrný a vyhýbá se situacím, které jsou pro něj rizikové, ale výhodné podle kritéria očekávané hodnoty. V prvním případě se většinou jedná o notorické gamblery či o lidi, kteří mají užitek ze hry samotné a případná finanční ztráta pro ně nehraje významnou roli, ve druhém případě se jedná o lidi se silnou averzí vůči riziku. Takové chování je ovšem poměrně snadno napadnutelné. Profesionální pokerový hráč Ryan Fee toto shrnuje v jednoduchém principu: „Dokud vám protivník nedá důvod toho zanechat, zneužívejte slabin v jeho hře.“ [4, str. 16] Tato problematika bude probrána podrobněji ve čtvrté kapitole. Pokud se sami nechceme sami stát snadným terčem dravců, kteří čekají na snadnou kořist, musíme být schopni se co nejefektivněji bránit. Pokud patříme do kategorie gamblerů, kteří hrají pouze pro radost, pravděpodobně nám bude chybět motiv cokoliv měnit. Pokud jsme ale averzní vůči riziku, existuji způsoby, jak tuto nevýhodu eliminovat. Drtivá většina webových stránek, které se zabývají pokerem, ve strategikých rubrikách zdůrazňují důležitost tzv. bankroll managementu, tedy správy finančních prostředků. Základní poučky tvrdí, že by hráč měl do hry vstupovat (startovné do turnaje nebo prvotní směna hotovosti za peníze v cash game) pouze se zlomkem peněz, které má vyčleněné na hru. Tento princip je velmi podobný diverzifikaci portfolia při investování do rizikových aktiv. V literatuře se liší názory, jak velkou část našeho bankrollu (finančních prostředků určených pro hru) si můžeme v jednotlivém turnaji či jednotlivé herní seanci na cash game dovolit riskovat,
20
aniž by nám hrozilo nebezpeční, že vše prohrajeme. Toto je velmi individuální a záleží jednak na schopnostech a ziskovosti5 hráče, jednak na jeho averzi vůči riziku. Veškeré poučky týkající se bankroll managementu lze shrnout do jednoho základního pravidla. Hráč by měl hrát sázet pouze tolik, kolik je ochoten prohrát bez větších emocí, které mohou negativně ovlivnit kvalitu jeho hry. Jedině tak se užitek z jistoty (tedy neúčasti na hře) a z očekávané hodnoty spravedlivé hry budou rovnat nebo jejich rozdíl bude zanedbatelný. Pokud je hráč dlouhodobě ziskový, užitek z jeho hry bude potom vyšší než užitek z jistoty. Jak je tato problematika důležitá, zejména v turnajích, lze ukázat na jednoduché simulaci, ke které nám postačí generování náhodných čísel v program MS Excell. Uvažoval jsem modelovou situaci, kdy se hráč opakovaně účastní turnaje vypsaného pro 18 účastníků. Startovné je 1,75$, kdy 1,50$ jde do banku, který se rozdělí mezi 4 nejlepší hráče podle pořadí sestupně v poměru 40 %, 30 %, 20 % a 10 %, tedy 10,8$, 8,1$, 5,4$ a 2,7$. Zbylých 0,25$ na hráče je provize (fee) herny. Tato data jsou založená na reálných propozicích turnajů nabízených na herně PokerStars v říjnu 2010, nyní by se vstupní hodnoty mohly nepatrně lišit. Pravděpodobnost výhry (umístění na placených pozicích) jsem pro tento experiment stanovil 0,3, přičemž šanci pro umístění na prvním, druhém, třetím nebo čtvrtém místě jsem považoval za shodnou, tedy 0,075 pro každé z těchto pozic. Pravděpodobnost prohry je potom 0,7. Za těchto podmínek je průměrná výplata je 2,025$, očekávaná hodnota výhry je tedy 0,275$, což odpovídá průměrné ziskovosti 15,7% ze vsazené částky. Jedná se o modelový příklad a takovéto ziskovosti je možné u dobrých hráčů skutečně dosáhnout. Simuloval jsem průběh 2 000 opakování tohoto turnaje a i na takto velkém vzorku je stále patrný vliv štěstí. Po opakovaném spouštění jsem pro ilustraci vybral dva případy, kdy hráč má štěstí a kdy má smůlu. V obou případech je sice v zisku, ten se ale od teoretických hodnot značně liší. V následujících dvou grafech je na vodorovné ose znázorněn počet turnajů, na svislé potom aktuální stav konta. Počáteční stav byl 87,5$, tedy padesátinásobek startovného.
5
Pokud je hráč dlouhodobě ztrátový, dříve nebo později prohraje celý bankroll.
21
OBR. 2.2 – SIMULACE OPAKOVANĚ HRANÝCH TURNAJŮ. HRÁČ SE POHYBUJE POD TEORETICKOU HODNOTOU VÝHER, JEHO NEJVĚTŠÍ PROPAD JE V TOMTO PŘÍPADĚ 57 NÁSOBEK STARTOVNÉHO.
OBR. 2.3 - SIMULACE OPAKOVANĚ HRANÝCH TURNAJŮ. HRÁČ SE POHYBUJE NAD TEORETICKOU HODNOTOU VÝHER, JEHO VÝHRY SE OPAKUJÍ BEZ VĚTŠÍCH VÝKYVŮ. I ZDE ALE JEHO NEJVĚTŠÍ PROPAD JE V TOMTO PŘÍPADĚ 23 NÁSOBEK STARTOVNÉHO.
Cílem těchto experimentů bylo ukázat, nakolik se liší teoretická očekávaná hodnota od empirických výsledků simulace a zároveň demonstrovat nutnost dodržování bankroll managementu jako prostředku pro snižování averze vůči riziku a schopnosti rozhodovat se na základě očekávané hodnoty.
22
3. PRAVIDLA A ZÁKLADNÍ POJMY A PRINCIPY V této kapitole budu popisovat základní pravidla pokerové varianty Texas Hold´em, která je v současnosti nejoblíbenější karetní hrou na světě. Popíši zde pravidla v rozsahu nutném k pochopení problematiky této práce. Pro zájemce lze doporučit jeden z mnoha českých i zahraničních webů6.
3.1. PRAVIDLA TEXAS HOLD´EM POKERU Hraje se s balíčkem 52 karet, rozdělených ve čtyřech barvách po třinácti kartách. Barvy jsou ♠ piky (spades), ♥ srdce (hearts), ♦ káry (diamonds) a ♣ kříže (clubs), jejich hodnoty jsou potom vzestupně čísla od 2 do 10, dále J (kluk – Jack ), Q (dáma – Queen), K (král – King), A (eso – Ace). Hráči sedí u stolu v počtu minimálně dvou a maximálně deseti hráčů. Jeden z hráčů má u sebe značku dealera7, hráč po jeho levici dává na začátku hry small blind (malá povinná sázka), další hráč vlevo dává big blind (velkou povinnou sázku), která je (až na výjimečné případy) dvojnásobkem small blindu. V některých případech je ve struktuře turnaje další povinná sázka, tzv. ante, která je povinná pro všechny hráče bez ohledu na pozici. Schéma rozesazení hráčů u stolu (pro 10 hráčů) je na obrázku 3.1 V prvním sázkovém kole každý hráč obdrží dvě karty a může se rozhodnout, jestli karty zahodí a nebude ve hře pokračovat (fold), sázku dorovná (call) nebo navýší (raise). Hráč, který zahodí karty, už se neúčastní hry. Hráči se vyjadřují po směru hodinových ručiček, první akci činí hráč následující za pozicí big blind. Pokud nikdo nenavýší a do hry se zapojil alespoň jeden účastník, má hráč na big blindu možnost ponechání sázky (check), může také navýšit (raise). Hráči, kteří mají v úmyslu dorovnat, musejí doplatit dosud nejvyšší sázku. Sázkové kolo končí ve chvíli, kdy dorovná poslední aktivní hráč v pořadí před posledním sázejícím či navyšujícím, žádný hráč nemůže navýšit dvakrát v jednom sázkovém kole, pokud jeho sázka není navýšena. Sázkové kolo také končí, pokud jeden hráč přinutí všechny své soupeře zahodit. Hráči, kteří v daném kole učinili sázku (včetně povinných) a nejsou ochotni dorovnat případné navýšení, přicházejí o všechny investované prostředky do aktuální partie.
www.pokerman.cz, www.pokerzive.cz, www.poker24.cz a další tento tzv. dealer button značí rozdávajícího hráče. V dnešní době jde spíše o zvyklost, ve skutečnosti karty rozdává krupiér nebo počítačový program. 6 7
23
OBR.3.1 – POZICE HRÁČŮ U POKEROVÉHO STOLU. MODŘE JSOU ZNAČENY POZICE SMALL BLIND A BIG BLIND, ORANŽOVĚ HRÁČI NA BRZKÉ POZICI (EARLY POSITION), ŽLUTĚ HRÁČI NA STŘEDNÍ POZICI (MIDDLE POSITION), ZELENĚ HRÁČI NA POZDNÍ POZICI (LATE POSITION). ZDROJ: POKERSTRATEGY.COM
V druhém kole hry se rozdají doprostřed stolu tři společné karty (flop). Z hráčů, kteří pokračují ve hře, se vyjadřuje jako první hráč nejbližší na řadě po pozici dealera. Všichni hráči mohou vsadit (bet), vzdát se sázky nebo už vloženou sázku ponechat (check, pouze v případě, že dosud nikdo nevsadil, respektive nenavýšil), sázku navýšit (raise) nebo karty zahodit. Opět platí, že hráč, který zahodí karty, se neúčastní dalších sázkových kol. Ve třetím sázkovém kole se rozdá jedna společná karta (turn), ve čtvrtémkole se rozdá pátá společná karta (river). Sázení probáhá po turnu i po riveru obdobně jako na flopu. Bank (pot) pro každou jednotlivou hru (hand) je vytvořen ze sázek, které hráči během jednotlivých kol učinili. Vyhrává jej osoba, která ve hře zůstala jako poslední (ostatní nedorovnali jeho sázky), v případě dvou a více hráčů, kteří zbyli po čtyřech sázkových kolech, vyhrává hráč, který ukáže (showdown) nejlepší sestavu vytvořenou z libovolné pětikaretní kombinace svých dvou karet (hole cards) a pěti karet společných (community cards). V případě rovnosti dvou nebo více kombinací si hráči dělí bank rovným dílem (split pot). Pokud hráč vsadil v průběhu hry všechny své žetony (all-in), nemůže se zapojit do dalšího sázení, ale zůstává stále ve hře. Může však vyhrát od každého ze svých soupeřů maximálně tolik, kolik sám vložil do banku. V případě, že je spolu s ním ve hře více hráčů a ti pokračují v sázení, vytvoří se vedlejší bank (side pot), o který hrají pouze tito hráči.
24
Cílem hry je maximalizovat vyhrané prostředky, nikoliv počet jednotlivých vítězných partií. Dobří hráči ve vyhraných handách8 v průměru získají více a v prohraných ztratí méně než jejich oponenti. Karty, které jsou účastníkům rozdány, jsou věcí pouhé náhody, správné rozhodnutí kdy a kolik vsadit je klíčem k úspěchu či neúspěchu.
3.2. ZNAČENÍ A ZÁPIS V pokerové literatuře se jednotlivé karty zapisují ve formátu hodnota a barva (suit). Hodnota se značí číslem 2-10, případně znakem vyznačeným na kartě, tedy A pro eso, K pro krále, Q pro dámu a J pro kluka. Místo desítky se často uvádí znak T. První písmeno anglického názvu pro barvu potom danou barvu reprezentuje, může se též uvádět příslušný typografický znak. Například 10♣ a Tc jsou dva přípustné způsoby pro označení karty „křížová desítka (ten of clubs)”. Pro analýzu rozhodovacích situací je více než společné karty (community cards) důležitější, jaké dvě karty držím já nebo můj oponent (hole cards). Jelikož je v balíčku 52 karet, existuje dohromady
, tedy 1326 různých startovních kombinací, přičemž na pořadí nezáleží (při
zápisu se karta vyšší hodnoty píše dříve). Jelikož všechny barvy jsou si navzájem rovnocenné, rozlišujeme pouze, jestli jsou obě hole cards ve stejné barvě (suited), nebo má každá jinou barvu (offsuit). Například kombinaci eso-král v barvě, respektive mimo barvu zapisujeme jako AKs, respektive AKo. Po započítání párů a odstranění duplicit hovoříme o 169 neekvivalentních startovních kombinacích, přičemž pár lze sestavit 6 různými způsoby, zatímco dvě nespárované karty 16 způsoby (z toho 4 suited a 12 offsuit). Ne vždy nám stačí zápis jedné konkrétní startovní kombinace. Pokud v určité herní situaci budeme hrát my nebo soupeř více startovních kombinací stejně, potřebujeme zapsat tuto množinu (range). Příklad takového zápisu může být 66+, A9s+, KQs, AJo+. Tento zápis značí množinu, do které patří všechny páry od šestek výše, eso s devítkou či vyšší kartou ve stejné barvě, král a dáma ve stejné barvě a eso s klukem, dámo u či králem v rozdílné barvě. Graficky je tato range znázorněna na obrázku 3.2. Občas je nutné formálně zapsat, na které pozici se hráč nachází. Pozice povinných sázek se značí SB a BB9, další hráč po směru hodinových ručiček se nachází na pozici UTG (under the gun), další pozice v pořadí hry se dále označují jako UTG+1, UTG+2 atd. Hráč, který má u sebe značku
jedna partie nebo rozdání, z anglického „hand“. Český ekvivalent se v praxi nepoužívá. zkratka BB může být použita buď pro hráče, který se nachází na pozici big blind, nebo jako jednotka pro velikost sázky vyjádřena v násobcích velké sázky naslepo. 8 9
25
dealera, se nachází na pozici BTN (button), hráč před ním, tedy vpravo, sedí na pozici CO (cut off). Další hráč proti směru hry potom sedí na pozici HJ (hijack). Pro potřeby dalšího textu dodejme, že velikost povinných sázek se značí ve formátu SB/BB, případně SB/BB Ante, pokud je v turnaji přítomna sázka ante. Značení 200/400 A50 tedy znamená, že hráč na pozici SB musí před začátkem hry vložit 200 žetonů, hráč na pozici BB 400 a všichni hráči (včetně blindů) dalších 50 žetonů.
OBRÁZEK 3.2 – PŘÍKLAD MNOŽINY STARTOVNÍCH KOMBINACÍ 66+, A9S+, KQS, AJO+. SCREENSHOT Z PROGRAMU POKERSTOVE
3.3. ZÁKLADNÍ POJMY A PŘEDPOKLADY Texas Hold ´em se hraje zpravidla ve dvou sázkových variantách – limitní (limit) a bezlimitní (no-limit), přičemž nyní výrazně dominuje druhá jmenovaná. V limitní verzi je možné vsadit či navýšit přesně stanovenou sumu, v bezlimitní padá horní omezení velikosti sázek10. Pokud nebude řečeno jinak, ve své práci budu hovořit pouze o No-limit Texas Hold´emu.
Pokud necháme stranou historky z divokého západu, tak hráč může vsadit maximálně tolik žetonů, kolik má v danou chvíli na stole. V průběhu handy nelze přikupovat další žetony. V cash game je možné si mezi jednotlivými partiemi dokupovat žetony až do omezení stolu (pokud existuje), v turnajích toto v zásadě není možné. 10
26
Bez ohledu na výši povinných sázek jsou rozhodujícím údajem o velikosti stacku (počtu žetonů) jednotlivých hráčů jeho vyjádření v násobcích big blindu (BB). Vyjádření v absolutních číslech ve skutečnosti nemá příliš velkou vypovídající hodnotu. Pokud například někdo prohlásí, že minulý večer vyhrál na cash game pět tisíc, pro laika to bude pravděpodobně zajímavý údaj, pro člověka znalého problematiky chybí doplňující informace, a sice velikost povinných sázek. Takový zisk je vynikajícím výsledkem ve hře o koruny, ve hře o tisíce se nejedná o nic zásadního. Tento princip platí v turnajích ještě mnohem silněji než v cash game. Jelikož turnajové žetony nelze vyměnit za peníze, nemá stack jednotlivých hráčů reálnou finanční hodnotu. Lze vyčíslit pouze určitou teoretickou hodnotu držených žetonů, v pozdních fázích přesně například podle modelu ICM (Independent Chip Model), který bude popsán v následující kapitole. V počáteční a střední fázi turnaje lze porovnat aktuální počet žetonů s počátečním a jejich poměr vynásobit startovným, jedná se však o odhad velmi nepřesný, zavádějící a většinou zbytečný.
3.4. PŘEDPOKLADY A OMEZENÍ Z hlediska teorie her se poker řadí mimo jiné (více ve druhé kapitole) mezi hry s neúplnou informací [3, str. 73]. V jakékoliv situaci jsme na základě znalosti vlastních a případných společných karet schopni určit pravděpodobnost výhry proti jednomu nebo více soupeřům, pokud známe jejich karty. Už na první pohled je patrné, že tento předpoklad nebude dodržen téměř nikdy. V lepším případě dokážeme odhadnout (ať už vlastním pozorováním, analytickým softwarem v případě hry online nebo kombinací těchto faktorů), jaká je pravděpodobná množina (range) jednotlivých dvojic rozdání, které soupeř nebo soupeři drží. I kdybychom přesně věděli, na čem v kokrétní hře jsme, stále bude obtížné najít optimální akci, případně velikost sázky. V jednotlivé handě lze totiž vyhrát v principu dvěma způsoby: 1) soupeř zahodí na naši sázku či sázky, nebo 2) dorovná a v showdownu ukážeme lepší kombinaci. Důvod pro sázku by tedy v principu měl být motivován jedním ze dvou případů. 1) Buď sázíme, abychom byli dorovnáni s horší kombinací (bet for value), nebo 2) abychom přinutili hráče s lepší kartou zahodit (bet for bluff) [16, str. 6]. Vzhledem k existenci čtyř sázkových kol, kde je možnost zvolit několik akcí a téměř libovolnou velikost sázky, stává se hledání optimální strategie na základě znalosti vlastních karet úlohou velice komplikovanou, která nemůže být řešena pouze za pomoci matematických metod. Na Albertské univerzitě v Edmontonu byl vyvinut počítačový program Polaris [18], pokerový bot, který se v červenci 2007 postavil dvěma profesionálním hráčům. Přestože tým vědců sestavil takové podmínky, aby byl co nejvíce eliminován prvek náhody (první počítač dostával 27
stejné karty jako profesionál soupeřící s druhým a naopak). Celkem byly odehrány 4 session, každá měla 500 jednotlivých hand. Profesionálové zvítězili ve dvou případech, jednou prohráli a jednou remizovali. Tento stroj se nadále vyvýjel a v následujících experimentech dokázal porážet profesionální hráče, protože mu byly implementovány prvky samoučení a přizpůsobení soupeřům, nikoliv pouze statické kalkulace. V literatuře se občas objevují příklady na matematicky optimální řešení některých situací. Příklad podobné úlohy by mohl vypadat takto: „Mám na ruce dvě karty stejné barvy a další dvě karty stejné barvy jsou na stole. Soupeř na flopu vsadí. Jaká je maximální velikost soupeřovy sázky, abych byl dlouhodobě v zisku?” Řešení této úlohy není příliš obtížné, nejprve je potřeba zjistit pravděpodobnost, naší výhry. V balíčku je zatím 47 neznámých karet (znám dvě své karty a tři společné), a dvě ještě příjdou na stůl. Pokud mezi nimi bude jedna z devíti karet, které budou kompletovat mojí barvu, tak vyhraji, v opačném případě prohraji. Pravděpodobnost mé výhry je tedy . Zbytek se dopočítá podle vzorce pro očekávanou hodnotu (2.2), zbývá dosadit velikost sázky a velikost případné výhry (aktuální bank, moje a soupeřova sázka). Úlohu je možné formulovat obráceně, tedy: „Kolik mám vsadit, aby soupeř čekající na barvu nemohl výhodně dorovnat?” Bez ohledu na to, jestli se na úlohu díváme z pohledu vlastního či soupeřova, její využití v praxi je dosti omezené. Nemůžeme nikdy s jistotou vědět, že soupeř opravdu čeká na barvu. Pokud tomu tak není, budeme mít zájem, aby nám zaplatil případné slabší kombinace. Mnohem větším problémem je, že tento příklad předpokládá, že dojde pouze k sázce na flopu, nikoliv na turnu. Pokud budeme uvažovat, že čekáme na barvu a na turnu nám opravdu přijde, nemůžeme dopředu vědět, jestli bude soupeř sázet i nadále, případně jestli bude ochoten dorovnat naši sázku či naše navýšení, může se stát, že nás odhalí správně a nedokážeme získat od něj další žetony. Naopak, pokud na turnu naši kartu netrefíme, soupeř nás další dostatečně vysokou sázkou dokáže vyhnat ze hry, opět ale nevíme, zda vsadí a kolik. Původně jednoduchá úloha se s růstem počtu sázkových kol stává obtížně řešitelná, roste počet parametrů a správné rozhodnutí kromě porovnání velikosti sázky a banku závisí především na odhadnutí soupeřova úmyslu. Dalším problémem je, že výherní kombinace mají ordinální charakter. Nemůžeme tedy říci, o kolik nebo kolikrát je jedna sestava lepší, než druhá, můžeme je mezi sebou pouze porovnávat. 28
Lze sice určit, jak pravděpodobné je například složení dvou párů, tato informace není příliš užitečná. Relevantní je pouze relativní síla karet v porovnáním se soupeřem, ta se také v jednotlivých sázkových kolech mění. Pokud k tomu připočteme, že stejně tak, jako se snažíme na soupeře vymyslet co nejlepší strategii, stejně tak činí (za předpokladu racionality) i oponent, dostáváme se k zajímavé modifikaci antagonistického konfliktu, kde nalezení rovnovážného řešení je velmi obtížné. Přestože má poker velice jednoduchá pravidla, rozhodovací situace jsou velice komplexní. Je obtížné, skoro až nemožné, vytvořit univerzální matematický model pro všechna čtyři sázková kola. Pokud si ale vybereme pouze určité situace, které řešíme na jednom jediném sázkovém kole, potřebujeme zajistit, aby analýza těchto případů měla skutečný přínos v reálné hře. V No-Limit Hold´emu platí, že čím větší počet žetonů (vyjádřeno v BB) mají jednotliví hráči k dispozici, tím mají více možností, jak každou jednotlivou hru zahrát. Během čtyř sázkových kol má každý možnost volit velikost sázky ze širšího intervalu, může vytvářet tlak na soupeře a může potenciálně vyhrát více, naopak může i mnoho ztratit, je potřeba být obezřetný. Velkou roli hraje pozorování soupeřů, vyhodnocování společných karet a předvídání, matematika zde hraje spíše okrajovou úlohu. Zjištění očekávané hodnoty je problematické, protože málokdy budeme znát konečnou velikost banku. Pokud je naopak stack jednotlivých hráčů malý, čekají na okamžik, kdy budou hrát o všechny své žetony. V tom případě dochází k rozhodování o zvolené akci už v prvním sázkovém kole. Hráč s malým počtem žetonů vsadí all-in už před flopem. Pokud je dorovnán, pouze pasivně čeká na výsledek a jeho pravděpodobnost výhry je možné přesně spočítat. Takové případy nastávají v pozdních fázích pokerových turnajů (nazývané též push/fold fáze), kdy počet žetonů se dostane pod určitou kritickou hranici, která je mezi hráči obecně považována za 10-15BB. Toto je situace, kterou se budu zabývat ve velké části své práce vzhledem k přílišné komplexnosti pokeru ve všech čtyřech sázkových kolech.
3.5. TURNAJE A INDEPENDENT CHIP MODEL V dnešní době je nabídka pokerových turnajů na internetu, v kasinech, pokerových klubech a dalších místech poměrně široká. Je užitečné si tyto turnaje rozdělit na několik kategorií.
Multi table turnaje (MTT) – vícestolové turnaje, někdy přesněji označované jako scheduled (naplánované). Jedná se o turnaje, které začínají v konkrétní den a hodinu a
29
může se jich zúčastnit libovolný počet hráčů až do maximální kapacity provozovatele11. Po vypadnutí určitého počtu hráčů se vždy zruší jeden hrací stůl, hráči na něm budou přesazeni na uvolněná místa na dalších stolech. Toto pokračuje až do doby, než se hraje na posledním stole (final table). Zpravidla je vypláceno nejlepších 10-15 % hráčského pole. Nejvyšší výhru si odnese vítěz turnaje, odměny na dalších pozicích jsou nižší, někdy mohou být stejné.
Sit and Go turnaje (SnG) – turnaje, které jsou vypsané na konkrétní počet hráčů. Turnaj začne ve chvíli, kdy se zaregistruje tento počet. Většinou se jedná o jednostolové turnaje (typicky pro deset či devět hráčů), v poslední době získávají na oblibě vícestolové SnG turnaje.
Kvalifikační turnaje – nazývané též satelity. Úspěšným hráčům není vyplacena finanční prémie, ale získávají vstup do dalšího turnaje. Všechny výplatní pozice tak mají stejnou hodnotu. Mohou se hrát jak ve formátu MTT, tak ve formátu SnG.
Hybridní turnaje – turnaje, jejichž výplatní struktura se liší od tradičních turnajů. Příklad může být turnajový formát Double or Nothing (DoN), hraný zpravidla jako SnG turnaj pro deset lidí, kdy nejlepších pět hráčů získá dvojnásobek startovného.
Ve všech turnajích platí, že každý hráč skončí ve chvíli, než přijde o všechny své žetony, nebo turnaj vyhraje. Není možné si v průběhu turnaje žetony směnit zpět na hotovost, jejich přepočet na finanční ekvivalent je tedy trochu nepraktický. Rozhodování v herních situací podle kritéria očekávané hodnoty je možné v cash game. Pokud bychom podobný princip aplikovali v turnajích s tím rozdílem, že místo peněz budeme používat žetony, dostaneme se často do problémů. Tento přístup je možný pouze v omezené míře, zpravidla v počátečních fázích MTT. Hodnota
jednoho
žetonu
v průběhu
turnaje
klesá.
Uvažujme
příklad
standardního
jednostolového SnG turnaje, kterého se účastní deset hráčů, každý vloží startovné 100$ a obdrží 1 000 turnajových žetonů. Výhry jsou vypsány pro první tři hráče, vítěz obdrží 50 % z celkové částky, druhý a třetí v pořadí potom 30 %, respektive 20 %. Provizi herny zanedbáváme. Jednoduchým propočtem zjistíme, že hodnota jednoho žetonu na začátku turnaje odpovídá 0,1$. Na konci turnaje však vítěz akumuluje všech 10 000 chipů a odnese si výhru 500$, což znamená 0,05$ za žeton. Naopak druhý a třetí hráči v pořadí získají finanční odměnu, přestože v době
Zatím největší turnaj hraný naživo byl Main Event WSOP (World Series of Poker) v roce 2006, tedy hlavní turnaj světové pokerové série, který je považován za neoficiální mistrovství světa. Startovné $10 000 tehdy zaplatilo 8 773 účastníků. Největší turnaj hraný online se odehrál 4. prosince 2011 na herně PokerStars. Startovné činilo $1 a zúčastnilo se ho 200 000 hráčů. 11
30
svého vypadnutí přišli o všechny své prostředky. Jediný případ, kdy by hodnota jednoho žetonu zůstala konstantní, je v turnaji s výplatní strukturou „winner takes all“, tedy že vítěz obdrží 100 % z dotace turnaje. Ještě více je nevhodnost přepočtu žetonů na finančí ekvivalent pouhým vydělením počátečního stacku startovným vidět na turnajích typu Double or Nothing, případně na satelitech. Pokud se mi v DoN turnaji podaří ztrojnásobit počáteční žetony, nikdy nemůžu získat více než dvojnásobek vkladu. Toto má vliv na zvolenou strategii. Zatímco v cash game mi pro zisk trojnásobku vsazené sázky stačí vyhrát jednou ze tří případů, abych byl break even, tedy ani v zisku, ani ve ztrátě, v turnajích tohle neplatí, potřebuju oproti cash game vyšší šanci na výhru ceteris paribus. Tuto problematiku asi nejlépe řeší Independent Chip Model. Jedná se o matematickou metodu, pomocí které můžeme zjistit naši equity (čistou hodnotu) v jakékoliv fázi turnaje [15]. Většinou se využívá v push/fold situacích u SnG turnajů, jde však aplikovat i na pozdní fáze MTT. Čistá hodnota žetonů se vypočítá podle vzorce
kde Pi je pravděpodobnost umístění a zi je výplata na i-tém místě, n je potom počet placených pozic v turnaj. Pro dosazení do vzorce je potřeba spočítat pravděpodobnost umístění na jednotlivých vyplácených pozicích. ICM vychází z předpokladu, že všichni hráči mají stejné schopnosti a dovednosti, nikdo nedokáže přehrát své soupeře. Zároveň se předpokládá, že veškeré akce budou buď push (navýšení all-in), nebo fold (zahození karet). Pokud dojde ke konfrontaci, hráč s menším počtem žetonů bude vyřazen a nebo svůj stack zdvojnásobí. V praxi jsou tyto předpoklady splněny dostatečně často, aby bylo možné s ICM pracovat. Lukáš Horák [11] popisuje výpočet pravděpodobnosti umístění na prvním místě v turnaji.
kdy
je počet žetonů hráče i a t je celkový počet žetonů v turnaji Rovnice
lepší přehlednost zápisu Množina H reprezentuje všechn
31
slouží pouze pro
hráče v turnaji Proměnná n
v jadřuje kolikrát člověk musí zdvojnásobit svůj stack ab získal všechn žeton v turnaji. Z rovnice
v plývá
Pokud jsou všichni hráči na stejné úrovni pravděpodobnost zdvojnásobení pro každého z nich je Šance na první místo pro hráče i je
ted podíl hráčova stacku na součtu všech žetonů ve hře Pokud by bylo pouze jediné placené místo hodnota jednoho žetonu b zůstala stejná a equit jednotlivých hráčů b la v poměru počtu jejich žetonů Většinou bývá v pláceno více míst Pravěposobnost že se hráč umístí na druhém místě se zjišťuje složitěji Pokud hráč i skončí na druhém místě a hráč j vyhraje, znamená to že hráč i musí v hrát „podturnaj“ nad všemi hráči s výjimkou vítěze Podmíněná pravděpodobnost druhého místa pro hráče i za předpokladu vítězství hráče j zapíšeme
Pravděpodobnost umístění na druhém místě je potom
Pro třetí a další pořadí platí analogická úvaha ale složitost výpočtu i formálního zápisu se zv šuje Uvedu ještě vzorec pro pravděpodobnost umístění na třetím místě
Počítat čistou hodnotu pro každého hráče ručně je poměrně časovně náročné Na internetu e istuje dost kalkulátorů12 které kromě equit jsou schopn spočítat také pravděpodobnosti umístění všech hráčů na jednotlivých placených pozicích
12
Osobně používám http://www.icmpoker.com/Calculator.aspx.
32
Uvažujme příklad ze začátku podkapitol zaregistrovaných z
V SnG turnaji zbývají poslední čt ři hráči z deseti
Původní startovné činilo
$, výplatní struktura je
z
a počty žetonů jednotlivých hráčů jsou
. V následující tabulce jsou vyjádřeny pravděpodobnosti umístění na jednotlivých výplatních pozicích pro všechny hráče, stejně tak jako jejich equity a hodnota jednoho žetonu.
i 1 2 3 4
si 4500 2500 2000 1000
P1i 45,00% 25,00% 20,00% 10,00%
P2i 31,25% 29,48% 25,25% 14,02%
P3i 17,84% 28,73% 31,38% 22,06%
33
equity 354,42$ 270,91$ 238,51$ 136,16$
hodnota jednoho žetonu 0,079$ 0,108$ 0,119$ 0,136$
4. HEADS-UP A NASHOVA ROVNOVÁHA Situace, kdy proti sobě hrají poker dva hráči, se nazývá heads-up a z matematického hlediska se jedná o nejjednodušší situaci, která může v pokeru nastat. Pravidla jsou následující: Hráč 1 položí small blind (SB), hráč 2 položí big blind (BB), což je dvojnásobek SB. V prvním sázkovém kole, tedy před flopem, je jako první na tahu hráč 1 a může si zvolit z následujících možností:
fold (složení karet) – v tomto případě přichází o small blind a vyhrává hráč 2,
call (dorovnání sázky),
raise (navýšení sázky),
all-in (hraní o všechny žetony), označované též jako push, speciální případ navýšení.
Hráč, který se vyjadřuje jako druhý v pořadí, volí z následujících variant (za předpokladu, že první hráč nesložil karty):
fold (složení karet) – v tomto případě přichází o big blind a vyhrává hráč 1,
check (ponechání sázky) – přípustné pouze, pokud soupeř zvolil možnost call. V tomto případě hra pokračuje dalším sázkovým kolem.
call (dorovníní sázky), pokud soupeř navyšoval,
raise (navýšení sázky), pokud soupeř dorovnával či navyšoval.
all-in (hraní o všechny žetony). Může mít formu dorovnání (v případě, že hráč 2 má méně žetonů, než původní sázka hráče 1, nebo navýšení.
Dále se pokračuje podobně jako při hře u více hráčů. Pokud dojde k dorovnání sázek, hra pokračuje dalšími sázkovými koly, pokud se hra dostane do all-in situace, dojde ke konfrontaci karet, přičemž výhra nebo prohra jednoho z hráčů je výsledkem náhodné události. Oba účastníci už mají zajištěnou výhru pro druhé místo, hraje se pouze o rozdíl mezi finančním ohodnocením vítěze a druhého v pořadí. Equity obou hráčů jsou:
Odečtením konstanty (jisté výhry)
lze transformovat na situaci, kdy vítěz bere vše. Hodnota
peněz je přímo úměrná hodnotě žetonů, není tedy potřeba používat ICM model.
34
Pokud jsou velikosti stacku v porovnání s povinnými sázkami nízké, hráči volí pouze ze dvou možných situací – push (hraní o vše) nebo fold (složení karet), ostatní varianty jsou neefektivní v ideální hře13. Formálně se dá celá situace napsat jako hra v rozvinutém tvaru (obr. 4.1).
Hráč1
Fold
All-in
-0.5BB
Hráč 2
Fold
Call
1BB
náhodný pokus
OBR. 4.1 – SCHÉMA PRO PUSH/FOLD FÁZI V HEADS-UP SITUACI
Vzhledem k tomu, že se jedná o antagonistický konflikt, v konečných uzlech je uvedena výhra prvního hráče, výhra druhého hráče je potom stejná hodnota s opačným znaménkem. Jedná se o hru s nulovým součtem, protože první získává přesně to, co druhý ztrácí. Velikost sázek v absolutních číslech nemá žádnou vypovídající hodnotu, proto vyjadřujeme počet žetonů jednotlivých hráčů v násobcích big blindu14. Pokud dojde k all-in konfrontaci, hráč s nižším počtem žetonů může od svého soupeře získat pouze to, co sám vsadí. Hovoříme potom o efektivním stacku, tedy menším z obou čísel vyjadřující počet žetonů jednotlivých hráčů. Pokud například první hráč drží 12BB a druhý 9BB, efektivní stack je v tomto případě 9BB. I kdyby první hráč učinil sázku all-in se svými dvanácti big blindy a byl dorovnán, 3BB je mu navráceno zpět ještě před samotnou konfrontací. Rozhodnutí, jestli vsadit všechny své žetony (ať už jako sázející či jako dorovnávající) závisí na třech faktorech. Prvním z nich je síla startovní kombinace, kterou má hráč na ruce, druhý faktor je soupeřova range, tedy s jakými kartami on sází či dorovnává. Třetím faktorem je potom efektivní velikost stacku. V této kapitole budu hledat optimální strategii, pokud jsem hráč, který sází a soupeř mě bude dorovnávat s pevně danou statickou range. Dále budu řešit, se kterými kartami můžu dorovnat
Bude vysvětleno na konci kapitoly. Není uvažována sázka ante. Tato sázka není v heads-up situacích pravidlem, pokud by existovala, výsledky se budou mírně lišit, ale způsob výpočtu zůstane nezměněn. 13 14
35
soupeřovu sázku opět za předpokladu, že jeho hra se nemění. Nakonec se pokusím o nalezení Nashovy rovnováhy, tedy stavu, kdy si žádný ze soupeřů nemůže jednostranně polepšit změnou své strategie.
4.1. SÍLA STARTOVNÍ KOMBINACE Za předpokladu, že k jediné sázce dojde již před rozdáním společných karet a pouze se pasivně čeká na výsledek, zajímá nás, jaká je šance na výhru, pokud naše karta bude dorovnána soupeřem. Pokud budou odhaleny hole cards (dvojice karet, která je rozdána na počátku partie každému hráči), je možnost spočítat pravděpodobnost na výhru pro každého hráče. Před vyložením 5 společných karet je v balíčku 48 neznámých karet, je tedy celkem
možných
kombinací rozdání společných karet, což odpovídá číslu 1 712 304. Pravděpodobnost naší výhry je potom počet rozdání, ve kterých vyhrajeme vydělený počtem všech možných kombinací. Je velmi pracné, téměř nemožné, zjišťovat pravděpodobnost manuálně. Počítačové programy, jako například PokerStove15, dokáží toto spočítat během zlomku sekundy vygenerováním všech možných kombinací společných karet. Pokud proti sobě postavíme například J♠ 10♠ držené prvním hráčem a 9♥ 7♣ hráče druhého, první zvítězí v 1 162 850 případech (67,91 %), druhý hráč v 530 576 případech (30,99 %) a v 18 878 případech (1,10 %) se bank rozdělí mezi oba hráče. V případě remízy se procenta na vítězství přičtou rovnoměrně k oběma variantám, v tomto příkladu budeme hovořit, že v konfrontaci J♠ 10♠ a 9♥ 7♣ je šance na vítězství pro první dvě karty 68,46 % a 31,54 % pro devítku se sedmičkou. PokerStove umožňuje výpočet šance na výhru nejenom dvou startovních kombinací proti sobě navzájem, ale je možné zjistit i šanci na výhru startovní kombinace proti náhodným dvěma kartám (někdy značené jako ATC z anglického any two cards), nebo proti určité range startovních kombinací, dokonce je možné porovnávat i dvě range mezi sebou. Také není nutné se omezit na dva hráče. V obtížnějším případě je možno místo generování všech karetních kombinací použít metodu Monte Carlo, kdy PokerStove náhodně simuluje průběh jednotlivých partií, přesnost výsledku je pro praxi dostačující. Příklad výstupu z programu PokerStove je na obrázku 4.2. Pokeroví hráči mezi sebou často diskutují, která startovní kombinace je silnější a která je slabší. Ve skutečnosti je sestavení jakéhokoliv žebříčku dosti problematické. Uvažujme relaci
15
Volně ke stažení na http://www.pokerstove.com/
36
,
která znamená, že startovní kombinace a má více než 50% šanci na vítězství v konfrontaci se startovní kombinací b. Nemůžeme sestavit úplné uspořádání, protože relace není tranzitivní. Platí například AKo > JTs > 22 > AKo. Přesto se můžeme pokusit sestavit žebříček startovních kombincí, záleží na zvoleném kritériu. Pokud v program PokerStove zadáme procentuální počet startovních kombinací (na obrázku 4.2 je range nejlepších deseti procent startovních kombinací), jsou řazeny podle pravděpodobnosti na výhru oproti náhodné kartě. Pokud nebude řečeno jinak, budu v textu pracovat s tímto žebříčkem, pojem „lepší” či „horší” karta bude znamenat vyšší, respektive nižší šanci na výhru oproti náhodné kartě.
OBR 4.2 – VÝSTUP Z PROGRAMU POKERSTOVE. PRVNÍ HRÁČ DRŽÍ KQ MIMO BARVU, DRUHÝ HRÁČ DRŽÍ NĚKTEROU Z DESETI PROCENT NEJSILNĚJŠÍCH HOLE CARDS (PODLE KRITÉRIA PRAVDĚPODOBNOSTI NA VÝHRU OPROTI NÁHODNÉ KARTĚ), RANGE DRUHÉHO HRÁČE JE V PRAVÉ ČÁSTI OBRÁZKU. PRVNÍ HRÁČ V TOMTO PŘÍPADĚ ZVÍTĚZÍ PŘIBLIŽNĚ VE 39% PROCENTECH PŘÍPADŮ PO PŘIČTENÍ POLOVIČNÍHO PODÍLU Z REMÍZY.
Další možnost řazení startovních kombinací je na základě empiricky zjištěných průměrných výher či ztrát. V dnešní době existuje velké množství trackovacího softwaru a je možné uchovat průběh velkého množství partií. Žebříček výnosnosti jednotlivých startovních kombinací 37
pochází z reálně odehraných cash game partií a celkově bylo zaznamenáno více než 100 milionů hand. Výhoda je velký rozsah vzorku a skutečnost, že se jedná o reálné, nikoliv teoretické údaje. Nevýhoda je, že tato data byla posbírána během partií cash game, kde se sází zpravidla na všech čtyřech sázkových kolech. Některé silné kombinace mohou být ztrátové (hráči s nimi vyhrávají v průměru menší banky, než kolik ztratí v těch prohraných) nebo naopak. Pro heads-up all-in situace jeho použití je omezené.
4.2. ROZHODOVÁNÍ O DOROVNÁNÍ SÁZKY Na obrázku 4.1 na začátku kapitoly je uvedeno schéma, v jakém probíhá sázková akce před flopem, pokud hovoříme o push/fold fázi v heads-upu. Pokud hráč 1 zahodí, vyhráváme bez boje sázku o velikosti 0,5BB. Pokud hráč 1 vsadí všechny své žetony, budeme se rozhodovat o dorovnání podle naší očekávané hodnoty. Tu zjistíme pomocí modifikace vzorce 2.2, tedy
kde S značí efektivní velikost stacku a platí, že S>1BB16. Nyní porovnáváme varianty „zahodit” a „dorovnat”. Pokud zahodíme karty, příjdeme o naší povinnou sázku, očekávaná hodnota je tedy . Abychom mohli dorovnat ziskově, musí platit
Ze vzorců
Vzorec
a
v jádříme p a S což jsou parametr které budeme nadále zkoumat
odpovídá na otázku jaká je minimální požadovaná šance na výhru ab ch mohl
ziskově dorovnat sázku all-in při dané velikosti efektivních stacků Vzorec
odpovídá na otázku jakou ma imální sázku mohu ziskově dorovnat pokud znám
svoji pravděpodobnost na výhru a ta je menší než
Pokud je větší nebo rovna
znamená to
že mohu ziskově dorovnat jakkoliv velkou sázku Vzájemná závislost hodnot p a S je ilustrována v grafu 4.1.
Teoreticky může být efektivní stack i menší, potom jsou ale oba hráči automaticky v all-in situaci a nejedná se tedy o rozhodovací situaci. 16
38
V pra i ale neřešíme jak velkou pravděpodobnost potřebujeme na ziskové dorovnání ale jestli máme s danou startovní kombinací dorovnat sázku all-in či nikoliv Hodnot p a S představují parametr
které se pro každou konkrétní rozhodovací situaci liší Velikost efektivního stacku
zjistíme velice snadno Pravděpodobnost naší či soupeřovy výhr zjistíme podle kalkulátorů můžeme v užít například již zmíněný program PokerStove Problém je že neznáme soupeřovu startovní kombinaci a ani nemůžeme očekávat že b nám oponent kart dobrovolně ukázal Můžeme se pouze domnívat co zrovna může držet snažíme se určit jeho range se kterou bude sázet Zde bohužel nee istuje stoprocentně spolehlivý a přesný způsob jak tuto informaci zjistit navíc se jedná o velmi individuální záležitost Musíme se spolehnout na vlastní pozorování intuici a zkušenosti případně v užít pokud hrajeme na internetu některý ze softwarových programů zaznamenávajících soupeřovu hru Nesprávné určení soupeřov range má za důsledek špatná zpravidla ztrátová rozhodnutí
0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0
5
10
15
20
S
GRAF 4.1 – MINIMÁLNÍ POŽADOVANÁ PROCENTUÁLNÍ ŠANCE NA VÝHRU PŘI DANÉ VELIKOSTI STACKU
Ilustrujme si toto na konkrétním příkladu. Hráč 1 vsadí všechny své žetony a hráč 2 přemýšlí o dorovnání. Efektivní stack je 10BB. Můžeme předpokládat, že variantu all-in zvolí pro nejlepších 50 % startovních kombinací, zbytek zahodí. S jakými kartami je správné dorovnat? Pro efektivní stack 10BB je potřeba minimálně 45% šance na výhru, aby dorovnání soupeřovy sázky bylo dlouhodobě ziskové. Odhadovaná range soupeře je 33+, A2s+, K2s+, Q2s+, J4s+, T6s+, 96s+, 86s+, 76s, 65s, A2o+, K5o+, Q7o+, J7o+, T8o+, 98o. Pomocí programu PokerStove zjistím, které startovní kombinace mají proti této range minimální požadovanou šanci na výhru. Vyjde mi řešení, že je správné dorovnat s kartami 22+, A2s+, K3s+, Q8s+, J9s+, A2o+, K7o+, Q9o+, což je 33,3% všech startovních kombinací. Ostatní bych měl zahodit. 39
4.3. ROZHODOVÁNÍ O SÁZENÍ Rozhodnutí hráče, jestli vsadit všechny své žetony či nikoliv, také vychází z porovnání očekávané hodnoty pro sázku all-in a zahození karet, což se v tomto případě rovná ztrátě 0,5BB. Pokud se rozhodne pro vsazení všech svých žetonů, může vyhrát dvěma způsoby. Buď získá sázku o velikosti 1 BB bez boje, pokud soupeř zahodí, nebo bude lepší v následující konfrontaci. Očekávaná hodnota pro prvního hráče se dá zapsat
kde f je tzv. fold equity, což značí pravděpodobnost, že soupeř své karty zahodí. Ostatní proměnné jsou stejné jako v předchozím textu. Pokud budeme znát soupeřovu range, respektive dokážeme s dostatečnou přesností určit, s jakými startovními kombinacemi bude soupeř ochoten dorovnat, dokážeme poměrně jednoduše spočítat, s jakými kartami hrát o vše a jaké karty zahodit. Rozdíl oproti situaci z pohledu hráče 2 je ve fold equity. Získáváme navíc žetony, pokud se soupeř rozhodne zahodit. Díky těmto extra žetonům můžeme při dané velikosti efektivních stacků některé karty ziskově pushnout, aniž bychom museli znát soupeřovu range. Naše hra se stává unexploitable [1; 13], znamená to, že vždy naše očekávaná hodnota bude vyšší než při zvolení varianty fold bez ohledu na reakci soupeře. Toto se dá demonstrovat na příkladu, že držíme nadprůměrnou, ale nikoliv vynikající startovní kombinaci, jako je například QJo. Naše šance na výhru proti náhodné kombinaci je 58,14%, pokud by se soupeř rozhodl hrát veškeré startovní kombinace, budeme dlouhodobě v zisku. Čím méně karet dorovná, tím klesá naše procentuální šance na výhru v případné konfrontaci, to je ovšem kompenzováno ziskem soupeřovy povinné sázky v případě, že se vzdá bez boje. Pokud bude hrát soupeř správně a dorovná pouze se startovní kombinací, která má proti QJo pravděpodobnost na výhru alespoň 50 %17. Jedná se tedy o range 33+, A2+, K2+, QJ+, což je 34,4% všech startovních kombinací. V případě dorovnání máme 40,27% šanci na výhru. Naše fold equity je 65,8%. Zbývá nám zjistit, jaká je maximální velikost efektivního stacku, aby bylo možné ziskově vsadit s QJo všechny své žetony. Úpravou vzorce (4.7) dostaneme
Ve skutečnosti stačí o trochu méně, pravděpodobnost potřebná ke správnému dorovnání závisí na velikosti efektivního stacku a spočítá se podle vzorce (4.5). Tento zjednodušený předpoklad je ale dostatečný k vysvětlení principu unexploitable hry. 17
40
a po dosazení získáme hodnotu
.
Ještě stručný komentář k omezení ve vzorci (4.8). Pokud by hodnota f byla rovna jedné, znamená to, že soupeř vždy zahodí a získáváme bank bez boje. Hodnota efektivního stacku potom může být libovolně vysoká. Hodnota p nikdy nemůže být vyšší, než 0,5, to by odporovalo předpokladu, že nás soupeř dorovná pouze jako favorit. Vzácná situace, kdy p = 0,5 nastane pouze v situaci, kdy držíme kombinaci AA. Soupeř nás může dorovnat pouze se stejnou kombinací, potom vzorec (4.8) nelze použít. Protože ale neexistuje silnější startovní kombinace než AA, tak sázka all-in je zisková bez ohledu na velikost stacku. Na podobném principu je postaveno Sklansky-Chubukovovo hodnocení [17, str. 222], které je ještě přesnější. Připouští totiž, že soupeř může dorovnat i jako mírný outsider, pokud má kladné očkávání podle vzorce (4.5). Soupeř by oproti předchozímu příkladu proti našemu QJo dorovnal i s kombinací 22. Sklanskeho-Chubukovovo množství (S-C) [17, str. 304] potom reprezentuje velikost efektivního stacku, se kterou je hra s příslušnou startovní kombinací unexploitable. Jedkotka S-C je SB, tedy 0,5BB, znamená velikost stacku vyjádřenou v dolarech při povinných sázkách 1$/2$.
4.4. NASHOVA ROVNOVNÁHA V předchozích dvou případech jsme řešili ideální strategii pro hráče, který dorovnává i pro hráče, který sází. Ke správnému rozhodnutí jsme potřebovali v obou případech znát range našeho soupeře, přestože z pozice agresora18 se daly najít některé případy, kdy toto nebylo zcela nutné. V realitě však bývá situace taková, že stejně jako my se snažíme přizpůsobit soupeři, on se snaží reagovat na nás. Za předpokladu setkání dvou racionálních soupeřů, kteří hrají vždy optimálně, se situace dostává do rovnovážného stavu, kdy si žádný z hráčů nemůže změnou strategie jednostranně polepšit. Tato situace se v teorii her nazývá Nashova rovnováha. Vzhledem k tomu, že range jednotlivých soupeřů jsou v Nashově rovnováze perfektně vybalancované, je pro jejich zjištění důležitý jediný parameter, a sice velikost efektivního stacku. V zásadě platí, že čím vyšší je počet žetonů ve hře, tím přísnější jsou požadavky na volbu
v pokeru hovoříme o agresivním hráči, pokud často sází nebo navyšuje sázky soupeřů. Agresivní akcí se potom rozumí sázení či navyšování. Naopak pasivní hráč zpravidla sázky pouze dorovnává. 18
41
startovní kombinace. Hráč, který čelí sázce, s rostoucím efektivnějším stackem potřebuje větší pravděpodobnost na výhru, aby mohl ziskově dorovnat. Stejně tak hráč, který volí agresivní akci, bude pečlivěji vybírat startovní kombinaci s rostoucím počtem žetonů. V případě dorovnání tak bude čelit mnohem silnější range, sám bude tedy potřebovat silnější startovní kombinaci19. Vyšší fold equity a častější zisk soupeřova big blindu není dostatečnou kompenzací pro riziko ztráty všech žetonů v případě dorovnání a prohry. Není mi znám matematický postup, jak přesně najít Nashovu rovnováhu pro konkrétní stack. Existují však softwarové produkty20 nebo internetové kalkulátory21, které rovnováhu počítají pomocí metody fiktivní hry, která vychází z postupného učení v konfliktních situacích a upravuje strategie hráčů v reakci na sebe navzájem [12]. Pro každý stack lze nalézt rovnovážné řešení po dostatečném počtu kroků, během kterého hráči na sebe reagují navzájem. Ve chvíli, kdy se range jednotlivých hráčů nemění, hovoříme o rovnovážném stavu [12]. Příklad výpočtu Nashovy rovnováhy pro efektivní velikost stacků 10BB by vypadal následovně [12]. 1. Začínáme hráčem 1. Jeho range může být jakákoliv, pro začátek nastavíme 100% range (any two cards) 2. Hráč číslo 2 potřebuje na dorovnání alespoň 45% na výhru. Proti náhodé kombinaci se jedná o tuto range: 22+, A2+, K2+, Q2+, J3o+, J2s+, T6o+, T3s+, 97o+, 95s+, 87o, 86s+, 76s, tedy 66,2% všech startovních kombinací. 3. Hráč 1 reaguje změnou strategie, bude pushovat 46,6 % kombinací, hráč 2 na to zareaguje dorovnáváním 30,3 % startovních kombinací. 4. Krok 3 se opakuje doby, než se ustálí rovnovážný stav. To nazýváme Nashovou rovnováhou. Graf 4.2 zobrazuje, jak se vyvíjí rovnovážná range pro sázku all-in i pro dorovnání v závislosti na efektivní velikosti stacku. Nashovy rovnovážné strategie pro heads-up push/fold fázi jsou také znázorněny na obrázku 4.3. V tabulce jsou vypočítány efektivní velikosti stacků, pro které se vyplatí akce push, případně call. Pokud je efektivní stack větší, než 20BB, většinou nebývá splněna podmínka jediného sázkového
Jedná se o trend, ale při určitých velikostech stacku existují výjimky, jedná se však o odchylky v řádu desetin procent. 20 například SitNGo Wizard – http://www.sngwiz.com 21 například http://www.holdemresources.net/hr/sngs/hucalculator.html 19
42
kola a nehovoříme o push/fold fázi, dostáváme se mimo rámec této kapitoly. Podle S-C hodnoty i Nashovy rovnováhy je možné vždy ziskově vsadit all-in s kombinací AA, ale většinou se nejedná o nejlepší možné řešení – naše sázka bude málokdy soupeřem dorovnána a nedokážeme využít plně potenciál silné startovní kombinace. Pokud efektivní stack přesáhne určitou hranici, dobří hráči ve více sázkových kolech vyhrají na dvě esa více22, než pokud by vsadili all-in před flopem. 0
5
10
15
20
0 10 20 30 40
push
50
call
60 70 80 90 100 GRAF 4.2 – PUSH A CALL RANGE PODLE NASHOVY ROVNOVÁHY. NA VODOROVNÉ OSE JE VYZNAČENA EFEKTIVNÍ VELIKOST STACKU V BB, NA SVISLÉ OSE PROCENTUÁLNÍ PODÍL STARTOVNÍCH KOMBINACÍ, SE KTERÝMI JE MOŽNÉ VSADIT, RESPEKTIVE DOROVNAT SÁZKU ALL-IN.
Při bližším zkoumání zjistíme, že startovní kombinace, se kterými je možné výhodně vsadit allin, nejsou seřazeny sestupně, podle toho, jak si stojí proti náhodným dvěma kartám. Například podle tabulky je vhodné hrát o všechny žetony s 20BB s kombinací 54s (šance na výhru proti dvěma náhodným kartám je 41,45 %), zatímco stejná akce není optimální s K8o (56,02 % na výhru proti any two cards). Princip, kdy v naší range pro all-in jsou jednak slabé, tak velmi silné startovní kombinace, zatímco se středně silnými kartami volíme fold, se nazývá balancování range a jedná se o důsledek fold equity. Podle vzorce 4.7 pro očekávanou hodnotu hráče, získáváme, pokud soupeř dostatečně často zahodí (to je náš úmysl, pokud držíme například 54s). Stejně tak získáváme, pokud nás soupeř dorovná a naše startovní kombinace je favorit na výhru v all-in konfrontaci (toho chceme dosáhnout, pokud držíme AA, KK nebo jinou velmi silnou kombinaci).
Jedná se však o individuální záležitost. Špatný hráč naopak může s AA prohrát velké částky, pokud hraje všechna 4 sázková kola. Na flopu, turnu a riveru může být poražen, a přesto stále dorovnávat soupeřovy sázky v domění, že drží stále nejsilnější kombinaci. 22
43
Pokud chceme, aby soupeř karty zahodil, je naše sázka bluf (to při stacku 20BB příklad karty K8o). Pokud chceme, aby soupeř karty zahodil, ale při jeho dorovnání máme stále nezanedbatelnou šanci na výhru, jedná se o semibluf (což je případ 54s).
OBR 4.3 – NASHOVO ROVNOVÁHA PRO VŠECH 169 NEEKVIVALENTNÍCH STARTOVNÍCH KOMBINACÍCH. ZELENĚ JSOU VYJÁDŘENY KARTY VE STEJNÉ BARVĚ, ORANŽOVĚ KARTY V RŮZNÝCH BARVÁCH, SVĚTLE MODŘE PÁRY. ČÍSLA ZNAMENAJÍ, JAKÁ JE MAXIMÁLNÍ VELIKOST EFEKTIVNÍHO STACKU PRO SÁZKU ALL-IN, RESPEKTIVE JEJÍ DOROVNÁNÍ. ZDROJ: HTTP://WWW.HOLDEMRESOURCES.NET/HR/SNGS/HUNE.HTML
44
Přestože K8o je silnější než 54s jednak v přímé konfrontaci, jednak v porovnání s náhodnou kartou, pokud budeme soupeřem dorovnání podle tabulky Nashovy rovnováhy, má karta 54s vyšší šanci na výhru (36,14 %) proti soupeřově range v případě efektivního stacku 20BB, než karta K8o (33,68 %). Předpokladem pro použití tabulky Nashovy rovnováhy je, aby strategie hráče byla konzistentí. Někteří hráči mají tendenci minraisovat23 silné handy jako AA, KK, QQ a zbytek hrát podle tabulek. Tím však výrazně oslabí svojí range a semiblufy přestanou být tak účinné [12]. Zároveň však hráč nedostane dostatečně často zaplaceny svoje prémiové startovní kombinace, protože minimální navýšení vzbudí u pozorného hráče podezření. Z tohoto důvodu není považována jiná akce než push nebo fold za efektivní. Jen hráči na světové úrovni dokáží mít perfektně vybalancovanou range pro všechny přípustné akce před flopem, tedy call, raise a all-in. Nashova rovnováha je situace, při které nemůžeme ztrácet. Ne vždy to je nejlepší možná varianta. Pokud soupeř volí strategii odlišnou od Nashovy rovnováhy, nemůže si polepšit. Ne vždy to nutně znamená, že my tím získáváme navíc. Vždy by mělo být naším cílem správně určit soupeřovu range a zareagovat na ni, jen to nám přinese v dlouhodobém horizontu nejvyšší zisky.
23
Velmi malé navýšení původní sázky, často nejnižší možné (tedy 2BB)
45
5. HRA VÍCE HRÁČŮ V předchozí kapitole jsme se snažili odhalit optimální strategii pro hru dvou hráčů, ať už z pohledu statického, kdy se hráč snaží maximalizovat svoji očekávanou hodnotu na základě známé strategie soupeře, nebo dynamického, kdy jsme hledali Nashovu rovnováhu pro hru dvou hráčů. Ať už pomocí ručního výpočtu, nebo internetového kalkulátorů, bylo možno vždy nalézt optimální řešení, které bylo přesné za předpokladu, tedy správného určení soupeřovy range. S rostoucím počtem hráčů se problematika značně komplikuje. Uvažujme pozdní fázi SnG turnaje, kdy jsou počty žetonů jednotlivých hráčů v porovnání s povinnými sázkami dostatečně nízké, aby bylo možné hovořit o push/fold fázi. Počet hráčů je o jednoho vyšší než je počet vyplcených pozic, hovoříme o hře na bublině. Bublina (bubble) je označení pro nejvyšší umístění, které není ohodnoceno žádnou finanční prémií. V SnG turnaji pro deset hráčů je většinou standardní výplatní struktura z1 = 0,5, z2 = 0,3, z3 = 0,2. O bublině hovoříme tehdy, pokud v turnaji zbývají čtyři hráči. Pokud provedeme určité úpravy vstupních parametrů, jako jsou velikosti stacků jednotlivých hráčů a výplatní struktura, dají se poznatky ze hry na bublině aplikovat na jakýkoliv počet hráčů v SnG turnaji či na finálový stůl MTT turnaje. Hra na bublině je ale velice atraktivní záležitost, mezi hráči shodně oblíbená a nenáviděná. V této kapitole se budu primárně zaměřovat na tuto situaci. S určitým zjednodušním se dá tvrdit, že před bublinou si hráči v turnaji připravovali co nejlepší výchozí pozici, zatímco nyní začínají hrát o skutečné peníze. Jeden z nich odejde s prázdnou, zbytek si rozdělí finančí prémii podle propozic turnaje. V této fázi hry se projevuje velmi silně zákon o snižování hodnoty žetonů [14], budeme proto potřebovat hodnotu žetonů přepočítávat na finanční prostředky. K tomuto účelu využijeme model ICM, který je popsán ve třetí kapitole. V push/fold fázi turnaje budeme opět řešit, kdy karty zahodit a s jakou startovní kombinací budeme hrát o všechny žetony, ať už z pozice agresora nebo naopak hráče, který sázce čelí. Rozhodovacím kritériem bude opět očekávaná hodnota. Pokud využíváme modelu ICM, je potřeba rozlišit, jestli hovoříme o očekávané hodnotě žetonů (cEV) nebo očekávané hodnotě peněz ($EV). Funkce $EV v závislosti na cEV je konkávní a připomíná svým tvarem užitkovou funkci ze druhé kapitoly. Skutečně je zde možné nalézt určité paralely. Zatímco užitek v podmínkách rozhodování při riziku je chápán jako bezrozměrná veličina, která popisuje
46
subjektivní vnímání peněz, očekávaná hodnota peněz v pokerových turnajích se dá interpretovat jako finanční užitek ze získaných žetonů. Ta se dá přesně kvantifikovat pomocí ICM.
5.1. KLESAJÍCÍ HODNOTA ŽETONŮ Důvod, proč s rostoucím počtem žetonů stejně rychle neroste také finanční ekvivalent, jsem popsal ve třetí kapitole. Ze způsobu výpočtu čisté hodnoty (3.1; 3.4 – 3.7) každého hráče v turnajích vyplývá, že naše equity nezáleží pouze na našem vlastním stacku a na výplatní struktuře, ale zároveň na počtu žetonů oponentů. Dokonce přesun žetonů od jednoho soupeře ke druhému ovlivní naši čistou hodnotu, přestože náš stack zůstane nezměněn. V následujících modelových příkladech budeme uvažovat následující zadání: V SnG turnaji zbývají poslední čtyři hráči z deseti zaregistrovaných. Původní startovné činilo 100$, výplatní struktura je
z
z
. Každý ze začátku získal 1 000 turnajových
žetonů. Příklad 1 – všichni jsou si rovni. V tomto příkladu uvažujeme výchozí zadání, kdy všichni hráči mají schodný počet žetonů. Výchozí stav je
Předpokládáme, že první hráč získává žetony od hráče druhého. Stacky ostatních hráčů se nemění. Budeme zkoumat, jak se mění equity jednotlivých hráčů. Jelikož . Hodnota
se bude pohybovat v intervalu
, hodnota
, musí platit, že . Jelikož
stacky hráčů 1 a 2 jsou v tomto experimentu souměrné podle hodnoty 2 500 a zároven počet žetonů třetího a čtvrtého hráče jsou shodné, postačí nám prozkoumat, jak se mění equity hráčů 1 a 3. Změna těchto hodnot je znázorněna na grafu 5.1 Příklad 2 – dva vůdcové. Ve druhém příkladě budeme uvažovat situaci, kdy dva hráči mají velký počet žetonů a dva naopak malý. Výchozí stav je
47
Opět uvažujeme, že a) žetony se přesouvají od hráče 1 směrem k hráči 2, ostatní stacky zůstanou nezměny, nebo že b) žetony se přesouvají od hráče 3 směrem k hráči 4 ostatní stacky zůstanou nezměny. Výsledky jsou znázorněny na grafech 5.2a a 5.2b.
GRAF 5.1. ILUSTRACE K PŘÍKLADU 1. ZMĚNA ČISTÉ HODNOTY ŽETONŮ PRO HRÁČE 1 (MODŘE) A HRÁČE 3 (ČERVENĚ) V ZÁVISLOSTI NA ZMĚNĚ STACKU PRVNÍHO HRÁČE. NA VODOROVNÉ OSE JE POČET ŽETONŮ PRVNÍHO HRÁČE, NA SVISLÉ JE EQUITY OBOU HRÁČŮ VYJÁDŘENA V DOLARECH.
GRAF 5.2A –ILUSTRACE K PŘÍKLADU 2A
48
GRAF 5.2B – ILUSTRACE K PŘÍKLADU 2B
Příklad 3 – David a Goliáš. Ve třetím příkladě budeme uvažovat situaci, kdy jeden hráč má velký počet žetonů, další malý a dva hráči se pohybují na průměru. Výchozí stav je
Uvažovat přesun žetonů od hráče 1 k hráči 2 by bylo pouze opakováním prvního příkladu. Tentokrát budeme zkoumat přesun od prvního hráče ke třetímu hráči. V grafu 5.3 budou zaneseny tentokrát čisté hodnoty pro každého hráče. V předchozích příkladech jsem se pokusil zachytit některé modelové situace, které mohou nastat během hry na bublině. Efekt klesající hodnoty žetonů se projevuje při každém rozdělení chipů mezi jednotlivé hráče rozdílně. V zásadě ale platí, že nezúčastnění hráči si polepší, pokud se rozdíly v počtu žetonů mezi soupeři prohlubují, a vice versa. Pokud se do vzájemné konfrontace pustí hráči, kteří nejsou bezprostředně ohroženi vyřazením, výrazně tím ovlivní čistou hodnotu hráče, který má nejnižší počet žetonů, zejména pokud dojde k vyřazení jednoho ze soupeřů.
49
GRAF 5.3 – ILUSTRACE K PŘÍKLADU 3 – ČISTÁ HODNOTA VŠECH HRÁČŮ. NA VODOROVNÉ OSE JE ZNÁZORNĚN POČET ŽETONŮ PRVNÍHO HRÁČE. STACK HRÁČŮ 2 A 4 SE NEMĚNÍ, PŘESTO SE MĚNÍ JEJICH EQUITY.
5.2. NASHOVA ROVNOVÁHA PŘI HŘE NA BUBLINĚ Stejně jako v heads-up, také pro více hráčů u pokerového existuje Nashovo rovnovážní řešení pro každou kombinaci konkrétního počtu hráčů, jejich stacků a výplatní struktury. Jedná se o rovnovážnou strategii pro všechny hráče a jednostrannou změnou si žádný z nich nedokáže polepšit. Pomocí analytických metod je prakticky nemožné tuto rovnovážnou strategii nalézt. Používají se proto kalkulátory založené, stejně jako v případě heads-up situací, na metodě fiktivní hry. Jedním z nich je kalkulátor na serveru holdemresources.net. Jeho autoři připouštějí, že nezískají přesnou Nashovu rovnováhu, ale pouze její aproximaci, pro kterou platí, že si žádný hráč nemůže jednostrannou změnou své strategie významně polepšit [9]. V praxi se nejedná o zásadní problém. S počtem hráčů hra získává na komplexnosti a není nutné získat naprosto přesný výsledek, ale pouze princip, jakým se k němu dokážeme dopracovat. Použití internetových kalkulátorů na vypočítání Nashovy rovnováhy je sice rychlé, ale nikoliv dostatečně rychlé, aby byl hráč schopen činit během hraní online pokeru výpočty stejně rychle, jako ubíhá hra (jeho čas na rozhodnutí je omezen). Tyto informace slouží většinou pro kontrolu, jestli se hráč v konkrétní situaci zachoval racionálně či nikoliv. Dobrý hráč nikdy nebude schopen si bez pomocných programů přesně spočítat optimální řešení v každé situaci, ale bude se mu přibližovat, získá dostatečně přesný odhad.
50
Výstup z internetového kalkulátoru pro Nashovu rovnováhu může vypadat jako na obrázku 5.1. Stacky jednotlivých hráčů jsou stejné jako ve třetím příkladu (David a Goliáš), povinné sázky jsou 150/300 A25. Hráč 1 se nachází na pozici BB, hráč 2 se nachází na pozici SB, hráč 3 se nachází na pozici BTN a hráč 4 na pozici CO.
OBR.
5,1:
PŘÍKLAD
APROXIMACE
NASHOVY
ROVNOVÁHY
POMOCÍ
KALKULÁTORU
HOLDEMRESOURCES.NET. V PRVNÍ TABULCE JSOU SHRNUTY STACKY JEDNOTLIVÝCH HRÁČŮ NA ZAČÁTKU PARTIE, S JAKÝM MNOŽSTVÍM STAROVNÍCH KOMBINACÍ BY MĚL KAŽDÝ JEDNOTLIVÝ HRÁČ VSADIT ALL-IN, POKUD NIKDO PŘED NÍM NEVSTOUPIL DO HRY (OPEN PUSH), DÁLE HRÁČOVA EQUITY PŘED HROU, PO HŘE A JEJÍ ZMĚNA, KTERÁ ZNAMENÁ OČEKÁVANOU HODNOTU PRO HRÁČE. NA POZICÍCH SB A BB SE JEDNÁ O ZÁPORNÉ ČÍSLO, PROTOŽE ALTERNATIVNÍ STRATEGIE JE ZAHODIT KARTY A PŘIJÍT O POVINNÉ SÁZKY. V DRUHÉ TABULCE JE POTOM ZNÁZORNĚNO, PRO KTERÉ KONKRÉTNÍ STARTOVNÍ KOMBINACE BY MĚL HRÁČ VSADIT ALL-IN (PU = PUSH), KTERÉ BY MĚL DOROVNAT (CA = CALL) A SE KTERÝMI BY MĚL DOROVNAT I ZA PŘEDPOKLADU, ŽE NĚKTERÝ HRÁČ PŘED NÍM UŽ DOROVNAL (OC = OVERCALL). ZDROJ: HOLDEMRESOUCES.NET
51
5.3. PROBLÉMY A DOPORUČENÍ Přestože bývá Nashova rovnováha považována za řešení konflktních situací z teorie her, použití v pokeru, obzvlášť ve hře s více hráči má svá úskalí. O několika problémech doslovné aplikace Nashovy rovnovážné strategie se zmiňuje Tysen Streib [6, str. 77]. Streib považuje za rozšířený mýtus, že Nashovo řešení je perfektní strategie a nemůže prohrát. S tímto tvrzením nesouhlasí, odkazuje se na definici, podle které nelze změnou rovnovážné strategie vydělat. V pokeru je hraní podle Nashe považováno za defenzivní strategii, kterou je těžké porážet. To ještě neznamená, že se jedná o nejlepší možnou strategii, pokud se soupeř odkloní od rovnovážné strategie, bývá lepší variantou patřičné přizpůsobení se, jak už bylo několikrát uvedeno v předchozím textu. Pokud je ve hře více hráčů, může být hraní podle Nashovy rovnováhy ztrátové. Platí pouze, že oponent nám nemůže uškodit, aniž by uškodil sám sobě. V předchozím příkladu Davida a Goliáše máme dva hráče, které se dělí o průběžné druhé a třetí místo. Hráč na pozici CO může podle Nashovy rovnováhy ziskově sázet all-in s 30 % svých startovních kombinací. Hráč na pozici BTN může dorovnat pouze s velmi silnou kartou, jeho rovnovážná range na call je QQ+. V praxi většina hráčů sice opravdu opatrná, bude dorovnávat s širší range, pravděpodobně málokdo zahodí karty jako střední pár (TT, JJ) nebo silné eso (AQ, AK). Pokud k takovéto konfrontaci dojde, bude mít situace zápornou očekávanou hodnotu pro oba hráče. Vydělá na tom hráč na pozici SB, který bude mít zajištěnou minimální výplatu 200$ bez ohledu na to, kdo konfrontaci mezi prvními dvěma hráči vyhraje, částečně si polepší také pozice BB. Streib dále zpochybňuje následující tvrzení: „Strategie podle Nashovy rovnováhy sice nemůže prohrát, ale nemůže také získat nic navíc“. To platí skutečně pouze pro některé hry, jako například kámen, nůžky, papír popsané ve druhé kapitole. V pokeru nastává situace, že pokud hráč bude dorovnávat méně často, než by měl, připravuje sám sebe o zisk, který si mezi sebou rozdělí ostatní hráči. Stejně tak hráč může zvýšit svojí equity bez boje pouhou chybou dalších účastníků konfliktní situace, jak bylo popsáno v dalším odstavci. Jakým způsobem se tedy rozhodnout, jestli se svojí startovní kombinací jít all-in, dorovnat soupeřovo sázku nebo se karet zbavit? Jako v předchozích případech bude pro nás klíčovým kritériem očekávaná hodnota. Na rozdíl od heads-up situace je nutné vzoreček upravit jako důsledek zákona o snižování hodnoty chipů.
52
Vzorec pro očekávanou hodnotu v turnajích, ve kterých uvažujeme je potřeba používat ICM (tedy SnG turnaje a finálové stoly MTT), bude vypadat následovně:
kde eF je equity hráče po skončení hry, pokud zahodí karty, a je pravděpodobnost, že hráč vsadí all-in, f je hráčova fold equity, tedy pravděpodobnost, že všichni soupeři zahodí, eB je equity hráče, pokud všichni oponenti složí karty a hráč posbírá povinné sázky, eW je equity hráče, pokud vsadí all-in, bude dorovnán a vyhraje, p je pravděpodobnost této události a nakonec eL reprezentuje hráčovo equity, pokud jeho all-in sázka bude dorovnána a on prohraje.
53
6. ZÁVĚR Vznik teorie her, ekonomicko-matematické disciplíny se traduje do čtyřicátých let 20. století. Do té doby se předpokládalo, že každý ekonomický subjekt se v každodenním životě rozhoduje na základě informací, které jsou neměnné a statické. Teorie her se snaží nacházet řešení v situacích, kdy rozhodovatel na základě své volby vyvolává reakce okolí. Poker, stará hra s určitým nádechem tajemna, se jako příklad konfliktní situace stal jedním z impulzů k rozvoji teorie her. Hra, ve které se u partičky karet sejde skupina lidí, kteří se snaží obehrát sebe navzájem. Staří mazáci se snaží obrat naivní kavky a bohaté byznysmeny, chlapi bez nervů soupeří o velký balík peněz. Taková je ještě dnes častá představa. Ve skutečnosti je poker sázková hra, ve které si hráči navzájem přerozdělují peníze mezi sebou. Po určité době skončí větší hromádka u těch, kteří jsou šikovnější, stejně tak u těch, kteří mají větší štěstí. Kdo se pokeru věnuje, nepochybuje, že dlouhodobých úspěchů lze dosahovat pouze kvalitní a promyšlenou hrou. Karty, které jsou rozdány hráčům, jsou věcí náhody a při dostatečně dlouhém opakování každý zažije šťastné i smolné chvilky. Čím větší bude počet odehraných partií, tím více bude efekt štěstí potlačen a naopak bude více záležet na schopnostech jednotlivých hráčů. Poker je hra, kde úspěch závisí na dobrém rozhodování každého hráče. Pro každou situaci je potřeba vzít v úvahu velké množství faktorů, zejména charakter hry protihráčů. Pro podporu rozhodování může sloužit jak matematický aparát, tak hráčská intuice. Za celou dobu, co se pokeru aktivně věnuji, se snažím studovat dostupnou literaturu a číst si strategické články, které zlepšují moji hru. Věřil jsem, že bezchybné zvládnutí matematického aparátu je dostatečným předpokladem pro úspěch v pokeru. Ve své práci jsem měl původní cíl nalézt jakýsi univerzální vzorec či návod, který zapříčiní, že v dlouhodobém horizontu budu neporazitelný, to vše mělo být vysvětleno pomocí matematických modelů. V průběhu psaní práce jsem došel k závěru, že tohoto cíle nelze zcela dosáhnout. Důvodem je především vysoká komplexnost rozhodovacích situací v pokerové variantě No-limit Texas Hold´em, kdy do modelu vstupuje velmi mnoho parametrů (počet hráčů, jejich počet žetonů, pořadí, ve kterém se jednotliví hráči vyjadřují, počet sázkových kol, více přípustných akcí v každém sázkovém kole, libovolná velikost sázek a další), přičemž ne všechny tyto parametry se dají kvantifikovat a vyjádřit konkrétní proměnnou.
54
Lze dosáhnout pouze dílčích cílů a sice hledání optimálního řešení pro konkrétní vybrané herní situace. Zvolil jsem si proto takové, které se dají popsat pomocí matematickými modely a zároveň mají reálné uplatnění v pokeru, zejména v turnajové hře. Myslím si, že těchto dílčích cílů se mi podařilo dosáhnout a ukázal jsem, jakým způsobem postupovat při rozhodování, pokud jsou splněny předpokady nutné pro aplikaci daných modelů. Začal jsem situací, kdy proti sobě hrají dva hráči a jejich souboj se redukuje na jediné sázkové kolo. Za těchto předpokladů jsem se snažil najít optimální strategii pro každého z nich. Ani v této situaci, ve které je problematika nejméně složitá, jsem nedokázal najít čistě matematické řešení. Vždy je nutné brát v potaz charakter soupeře a patřičně na něj reagovat. V tomto ohledu se poker pohybuje na rozhraní teorie rozhodování a teorie her. Matematický aparát sice dává odpověď na otázku, jak se chovat v každé konkrétní situaci, správné odhanutí motivů soupeře a patřičná adaptace však výrazně zvyšuje úspěšnost nejenom v pokeru, ale v jakékoliv jiné konfliktní situaci. To je však záležitostí společenskovědních oborů. V další kapitole jsem se zaměřil na další typickou situaci, a sice posledních několik hráčů v pokerových turnajích. Už zde se situace stávala velice komplikovaná pro analytické řešení, přesto jsem ukázal cestu, na základě kterých faktorů učinit rozhodnutí. V teorii her je Nashova rovnováha často chápána jako určité vybalancované řešení v konfliktních situacích. V pokeru se Nashova rovnováha dá chápat jako výchozí strategie do doby, než se dokážu přizpůsobit svým soupeřům, jejich tendencím a chybám. Snažil sem se, aby celá práce měla kvalitní teoretický základ a nestala se pouhou cvičebnicí, kde bych popisoval jednotlivé příklady, přestože jsem to obzvláště v pozdějších kapitolách považoval za vhodné pro ilustrování dané problematiky. V dostupné literatuře se podobné příklady sice občas objevují, většinou se jedná o formu jednotlivých článků na internetu či kapitol v knihách, které se zabývají pokerovou strategií. Matematický základ, ze kterého tyto příklady vycházejí, bývá vysvětlen povrchně v rozsahu nutném pro pochopení konkrétního příkladu. Jako největší přínos svojí práce vidím nikoliv v řešení a analýze konkrétních rozhodovacích situacích, ale v tom, že jsem popsal matematické modely, ze kterých tyto příklady vycházejí. Zároveň tato práce může sloužit jako odrazový můstek pro další bádání. Dosud jsem pracoval s předpokladem, že hledáme optimální řešení, pokud se počet žetonů jednotlivých hráčů pohybuje pod určitou kritickou hranicí a jediná rozumná varianta je hrát o všechny tyto žetony nebo karty zahodit. Zároveň bereme v potaz, že využijeme pouze jediné sázkové kolo, v ostatních hráči pasivně čekají na výsledek. 55
První možností, jak práci rozšířit, je zrušit požadavek na nízký počet žetonů, přesto stále zůstat v jediném sázkovém kole. Hra by potom vypadala tak, že hráč navyšuje, aniž by automaticky hrál o všechny žetony. Soupeř nebo soupeři buď karty složí, nebo sázku znovu navýší a to až do doby, než zůstane poslední hráč v partii, nebo hra skončí all-in konfrontací. Tento trend, kdy hráči rádi a často sázejí a vytvářejí tlak na protivníka, je fenoménem posledních několika let a souvisí s nárůstem online pokeru. Hra se stává mnohem agresivnější, než tomu bylo před nedávnou dobou. Nalézt návod na optimální řešení těchto situací pomocí matematického aparátu se snaží například skupina autorů kolem Bertranda Grospelliera [6, str. 77 a dále], připouštějí však, že nalézt rovnovážný stav je velmi obtížné. Druhou možností rozšíření je zrušení předpokladu jediného sázkového kola a ponechání volnosti v rozhodování na všech čtyřech sázkových kolech. Rozhodovací strom, který by tuto situaci popsal, by byl ale poměrně složitý a to ještě za předpokladu, že by hráči neměli volnost ve volbě velikosti sázky. Zde mě nenapadá mnoho možností, jak tuto problematiku řešit a také v literatuře, kterou jsem během psaní této práce a přípravy prostudoval, se objevují pouze obecné návody, jaké faktory brát v potaz, nikoliv matematické modely s obecnou platností. Pouze na základě přečtení této práce se asi nikdo nestane kvalitním hráčem. Věřím ale, že zvládnutí problematiky v rozsahu této práce může pomoci některým hráčům nalézt odpovědi na určité problémy, na které se dá narazit v pokerových turnajích.
56
7. LITERATURA [1]
Bluffmagazine.com. Rajkumar, V.: Unexploitable Play and When To Use It [online], 200901, Dostupné z: http://www.bluffmagazine.com/magazine/Unexploitable-Play-andWhen-To-Use-It-Vivek-Rajkumar-1591.htm [cit. 2012-04-16].
[2]
Česká televize.: Češi vloni prosázeli 1
, miliardy, [online], 2011-07-04, Dostupné z
http://www.ceskatelevize.cz/ct24/ekonomika/129296-cesi-loni-prosazeli-125-6miliardy/ [cit. 2012-03-31]. [3]
Dlouhý, M., Fiala, P.: Úvod do teorie her, Nakladatelství Oeconomia, 2009, IBSN 978-80245-1609-7.
[4]
Fee, R.: Ryan Fee´s
Max NL Strategy Guide [online], 2008, Dostupné z:
http://www.gamblingsystem.biz/books/2p2NL6max.pdf [cit. 2012-04-04]. [5]
Fiala, P.: Modely a metody rozhodování, Nakladatelství Oeconomia, 2008, IBSN 978-80245-1345-4.
[6]
Grospellier, B., Nelson, L., Streib, T., Dunst, T.: The Raiser´s Edge, Tournament-Poker Strategies for Today´s Aggressive Game, Huntington Press, 2011, IBSN 978-1-935396-987.
[7]
Harrington, D., Robertie, B.: Harrington on Hold´em, Expertenstrategie für No-LimitTurniere, Band 1: Strategisches Spiel, Premium Poker Publishing, 2007, IBSN 978-39811543-0-6. Z anglického originálu Harrington on Hold´em, Expert Strategy for No-Limit Tournaments, Volume 1: Strategic Play, Two Plus Two Publishing, 2004, přeložili Katja Lappe-Liebergesell a Andreas Liebergesell.
[8]
Harrington, D., Robertie, B.: Harrington on Hold´em, Pokročilé strategie pro No-Limit turnaje, Díl : Závěrečné faze turnajů, PokerBooks CZ, 2010, IBSN 978-80-904707-0-5. Z anglického originálu Harrington on Hold´em, Expert Strategy for No-Limit Tournaments, Volume 2: The Endgame, Two Plus Two Publishing, 2005, přeložili Jan Blahynka.
[9]
Holdem
resources.net.:
ICM
calculator
FAQ
[online]
Dostupné
z:
http://www.holdemresources.net/hr/sngs/icmcalculator/icmcalcfaq.html [cit. 2012-0417]. [10]
Holman, R.: Mikroekonomie. Středně pokročilý kurz, C. H. Beck, 2002, IBSN 80-7179-7375 57
[11]
Horák, L.: SnG - ICM [online], Publikováno na PokerGamers.CZ, 2009-01-16 2008, Dostupné z: http://pokergamers.cz/view_topic.php?id=34824 [cit. 2012-04-12].
[12]
Horák, L.: Nashova rovnováha v pokeru No Limit Hold'em [online], Publikováno na PokerArena.cz,
2011-06-16
Dostupné
z:
http://www.online-poker-
zdarma.cz/rubriky/strategie/sit-and-go/jednostolova-sit-and-go/nashova-rovnovaha-vpokeru-no-limit-hold-em_2814.html [cit. 2012-04-12]. [13]
Pocket Fives. Online poker forums and rankings: Poker Math – Unexploitable shoves. [online] 2009-02-23. Dostupné z http://www.pocketfives.com/f20003/poker-mathunexploitable-shoves-626859/ [cit. 2012-04-16]
[14]
Pokerman.cz. Základy ICM na bublině v SnG. [online] 2010-05-03. Jennifear (Pocket Fives) a Filip Novák Dostupné z http://www.pokerman.cz/zaklady-icm-na-bubline-vsng-2118/ [cit. 2012-04-12]
[15]
Pokerterms.com. The internet´s premier online poker dictionary: ICM. [online], Dostupné z: http://pokerterms.com/icm.html [cit. 2012-04-12].
[16]
Seidman, A, Colleta, M, Cesaro, S.: Easy Game, Making Sense of No Limit Hold´em, Vol. 1, 2009, dostupné z http://uloz.to/xHPiJ8A/easy-game-volume-ii-by-andrew-balugawhaleseidman-pdf [cit. 2012-05-14].
[17]
Sklansky, D., Miller, E.: No limit Hold´em Poker: Teorie a praxe, Baronet, 2009, IBSN 97880-7384-248-2. Z anglického originálu No Limit Hold´em: Theory and Practice, Two Plus Two Publishing, 2007, přeložil Ondřej Káhn.
[18]
Wikipedia.
The
free
encyklopedia:
Polaris
(poker
http://en.wikipedia.org/wiki/Polaris_(poker_bot) [cit. 2012-03-10].
58
bot)
[online],
PŘÍLOHY PŘÍLOHA A – POŘADÍ VÝHERNÍCH KOMBINACÍ Seznam výherních kombinací od nejvyšší po nejnižší. V Texas Hold´em pokeru hráč má k dispozici dvě individuální a pět společných karet, ze kterých musí sestavit co nejsilnější kombinaci. Barva (suit) nehraje roli. V případě, že pětikaretní kombinace více hráčů je stejně silná, jedná se o remízu a výhra se dělí rovným dílem.
Royal flush – královská postupka. Karty A, K, Q, J a 10 ve stejné barvě. V případě, že více hráčů drží tuto kombinaci (v Texas Hold´em pouze v případě, že tato sestava je společná pro všechny hráče), dělí se bank.
Straight flush – čistá postupka. Sekvence pěti po sobě jdoucích karet ve stejné barvě. V případě remízy vítězí nejvyšší karta v postupce. Eso může být použito zároveň jako hodnota 1.
Four of a kind – poker, čtveřice. Čtyři karty stejné hodnoty. V případě remízy vítězí vyšší poker, v případě, že i ten je u obou hráčů stejný (leží mezi společnýma kartama), o vítězství rozhoduje pátá doplňková karta.
Fullhouse – tři karty karty stejné hodnoty a dvě další karty, taktéž stejné hodnoty. V případě remízy o vítězství rozhoduje vyšší trojice, pokud ani to nerozhodne, potom vyšší dvojice
59
Flush – barva. Pět karet ve stejné barvě. V případě remízy rozhoduje nejvyšší karta ve flushi, případně druhá, třetí, čtvrtá či pátá nejvyšší.
Straigh – postupka. Sekvence pěti po sobě jdoucích karet. Eso může také reprezentova hodnotu 1. V případě remízy vítězí nejvyšší karta na vrcholu postupky.
Three of a kind – trojice. Tři karty stejné hodnoty. V případě remízy rozhoduje vyšší trojice, případně první či druhá doplňková karta v tomto pořadí.
Two pair – dva páry. Dvě karty stejné hodnoty následované dvěma jinými karty stejné hodnoty. V případě rovnosti rozhoduje vyšší dvojice, případně nižší dvojice. Pokud ani to nerozhodne, rozhoduje pátá doplňková karta.
Pair – pár, dvojice. Dvě karty stejné hodnoty. v případě remízy rozhoduje vyšší pár, případně první, druhá či třetí doplňková karta v tomto pořadí. Pokud nikdo z hráčů nesestavil žádnou z výše uvedených figur, vítězí ten, kdo drží nejvyšší kartu. Pokud ta je u více hráčů stejná, rozhoduje druhá, třetí, čtvrtá či pátá nejvyšší karta v tomto pořadí.
60
PŘÍLOHA B – POROVNÁNÍ VYBRANÝCH STARTOVNÍCH KOMBINACÍ Jakékoliv dvě startovní kombinace je možné mezi sebou porovnat podle šance na výhru jedné nebo druhé z nich při vzájemné konfrontaci. Je prakticky nemožné porovnat mezi sebou všech 169 neekvivaletních kombinací a ani to není nutné. Zde uvedu pouze typické příklady a jejich vzájemné procentuální šance, u podobných dvojic se čísla budou lišit pouze nepatrně. Pro hráče je užitečné zapamatovat si tyto typické příklady. [17, str. 228] 1. Pokud proti sobě stojí vyšší pár proti nižšímu, má šanci na výhru přibližně 4 : 1. Q♦ Q♠ vs. 7♣ 7♥ 80,25 % vs. 19,75 % 2. Pokud proti sobě stojí pár a dvě vyšší karty, jsou šance na vítězství vyrovnané, pár bývá zpravidla mírný favorit. J♥ T♦ vs. 4♠ 4♣ 49,98 % vs. 50,02 % 3. Pokud proti sobě stojí pár a jedna vyšší a jedna nižší karta, pár je favorit v poměru přibližně 2,5 : 1. 5♥ 5♠ vs. A♣ 2♠ 70,59 % vs 29,41 % 4. Pokud proti sobě stojí dvě nepárové kombinace, u kterých vyšší z obou karet je stejná, lepší kombinace má šanci na výhru v poměru přibližně 3 : 1. A♣ K♠ vs. A♥ Q♣ 74,75 % vs. 25,25 % 5. Pokud proti sobě stojí pár a jedna vyšší karta a jedna karta stejné hodnoty, jako karty v páru, potom je pár přibližně 2,5 : 1 favorit. 8♥ 8♠ vs. A♦ 8♣ 70,08 % vs. 29,92 % 6. Pokud proti sobě stojí pár a jedna stejná a jedna nižší karta, pár je favorit v poměru přibližně 9 : 1. 8♣ 8♦ vs. 8♥ 5♣ 89,89 % vs 10,11 %
61
7. Pokud proti sobě stojí pár a dvě nižší karty, šance páru na výhru je přibližně 5,5 : 1. Q♣ Q♦ vs. 9♥ 7♠ 82.59 % vs. 17,41 % 8. Pokud proti sobě stojí nepárová kombinace proti jiné nepárové kombinaci, kde obě karty jsou nižší, potom šance na výhru pro lepší kombinaci je přibližně 2 : 1. A♣ K♥ vs. 10♣ 6♦ 65,95 % vs. 34,05 % 9. Pokud proti sobě stojí nepárová kombinace proti jiné nepárové kombinaci, přičemž jedna karta u slabší kombinace je mezi dvěma kartami silnější a jedna je níže, lepší kombinace je favorit v poměru přibližně 7 : 4. A♣ 9♥ vs. Q♠ 7♦ 63,52 % vs. 36,48 % 10. Pokud proti sobě stojí dvě nepárové kombinace, přičemž hodnota obou karet slabší z nich leží mezi hodnotami kombinace silnější, je slabší kombinace outsider v poměru přibližně 3 : 4. A♣ 7♦ vs. Q♠ 9♥ 57,55 % vs. 42,45 %
62
PŘÍLOHA C – SKLANSKEHO – CHUBUKOVOVO HODNOCENÍ Počet kombinací z 1225, které Kombinace mohou dorovnat
měly by složit
Procentuální úspěčnost Sklansky-Chubukovovo v případě dorovnání množství
AA
1
1224
0,5
Nekonečno
KK
7
1218
0,226177
953,995465
AKs
75
1150
0,457697
554,509992
QQ
13
1212
0,207007
478,008197
AKo
79
1146
0,433132
331,887184
JJ
19
1206
0,201104
319,213589
AQs
84
1141
0,424149
274,211191
TT
25
1200
0,198947
239,821017
AQo
93
1132
0,403144
192,670217
99
31
1194
0,197142
191,413933
AJs
96
1129
0,401528
183,221336
88
41
1184
0,226651
159,296894
ATs
108
1117
0,385544
138,913083
AJo
105
1120
0,379834
136,31047
77
61
1164
0,285621
134,847705
66
103
1122
0,355264
115,348532
ATo
117
1108
0,362908
106,264712
A9s
123
1102
0,367405
104,124788
55
153
1072
0,389493
98,629873
A8s
135
1090
0,361211
89,865649
KQs
256
969
0,4295
86,627695
44
275
950
0,431528
81,97959
A9o
129
1096
0,339884
81,716196
A7s
147
1078
0,356565
79,175905
KJs
265
960
0,419399
72,621257
A5s
171
1054
0,367031
72,292128
A8o
141
1084
0,332789
70,956513
A6s
159
1066
0,352858
70,744533
A4s
183
1042
0,366358
66,650529
33
455
770
0,454268
65,440821
KTs
277
948
0,411707
62,805558
A7o
155
1070
0,329722
62,747746
A3s
195
1030
0,366882
62,275315
KQo
265
960
0,400723
58,771664
A2s
207
1018
0,366815
58,141993
A5o
181
1044
0,340952
56,542087
63
Počet kombinací z 1225, které Kombinace mohou dorovnat
měly by složit
Procentuální úspěčnost Sklansky-Chubukovovo v případě dorovnání množství
A6o
171
1054
0,329477
56,15123
A4o
202
1023
0,347061
51,93949
KJo
277
948
0,391325
50,838788
QJs
418
807
0,432774
49,51544
A3o
220
1005
0,351305
48,445438
22
709
516
0,467553
48,054119
K9s
295
930
0,392879
47,812358
A2o
240
985
0,355839
45,172344
KTo
289
936
0,383383
44,946538
QTs
430
795
0,426952
43,809464
K8s
307
918
0,378141
39,91081
K7s
325
900
0,378587
37,330652
JTs
570
655
0,440073
36,106522
K9o
301
924
0,361114
35,754152
K6s
337
888
0,37594
34,890001
QJo
433
792
0,404082
32,816822
Q9s
457
768
0,40988
32,519706
K5s
349
876
0,371933
32,303331
K8o
324
901
0,351582
30,473887
K4s
367
858
0,371425
30,163283
QTo
445
780
0,398126
29,716401
K7o
344
881
0,353033
28,541184
K3s
379
846
0,369025
28,381805
K2s
394
831
0,367883
26,730843
Q8s
469
756
0,394731
26,718552
K6o
368
857
0,355714
26,675708
J9s
597
628
0,422213
25,712524
K5o
408
817
0,363569
24,680974
Q9o
459
766
0,377014
23,419539
JTo
585
640
0,411106
23,085252
K4o
458
767
0,373684
22,845021
Q7s
484
741
0,381931
22,685237
T9s
721
504
0,434081
22,491482
Q6s
499
726
0,382276
21,785164
K3o
508
717
0,383123
21,392219
J8s
609
616
0,406766
20,636243
Q5s
514
711
0,379236
20,32186
K2o
555
670
0,389958
19,999415
64
Počet kombinací z 1225, které Kombinace mohou dorovnat
měly by složit
Procentuální úspěčnost Sklansky-Chubukovovo v případě dorovnání množství
Q8o
479
746
0,363775
19,819326
Q4s
547
678
0,381543
18,916352
J9o
597
628
0,38947
17,79938
Q3s
568
657
0,380696
17,734011
T8s
733
492
0,418399
17,465705
J7s
624
601
0,393116
17,194521
Q7o
520
705
0,359844
17,077335
Q2s
591
634
0,380441
16,641032
Q6o
566
659
0,37011
16,295139
98s
841
384
0,427277
15,293343
Q5o
652
573
0,386607
15,034981
J8o
613
612
0,374112
14,867761
T9o
721
504
0,40219
14,832206
J6s
648
577
0,383218
14,718597
T7s
748
477
0,404171
14,199426
J5s
686
539
0,388455
14,048416
Q4o
748
477
0,400659
13,662167
J4s
751
474
0,396332
12,955471
J7o
657
568
0,368521
12,666038
Q3o
857
368
0,415272
12,503232
97s
853
372
0,412903
12,251417
T8o
733
492
0,385474
12,156984
J3s
792
433
0,39877
12,040344
T6s
767
458
0,391983
11,921088
Q2o
975
250
0,428097
11,30295
J2s
891
334
0,412488
11,138727
87s
945
280
0,422015
11,110552
J6o
755
470
0,378294
10,780675
98o
841
384
0,394874
10,271257
T7o
765
460
0,374878
10,204755
96s
878
347
0,401527
10,097673
J5o
855
370
0,395413
9,987293
T5s
886
339
0,401897
9,9469
T4s
949
276
0,408748
9,260066
86s
969
256
0,410324
8,994746
J4o
947
278
0,405076
8,906238
T6o
877
348
0,385581
8,571955
97o
873
352
0,384566
8,570963
65
Počet kombinací z 1225, které Kombinace mohou dorovnat
měly by složit
Procentuální úspěčnost Sklansky-Chubukovovo v případě dorovnání množství
T3s
1026
199
0,415998
8,415718
76s
1045
180
0,418616
8,318417
95s
970
255
0,403431
8,261043
J3o
1047
178
0,415307
7,914721
T2s
1123
102
0,425488
7,538836
87o
976
249
0,396225
7,505732
85s
1039
186
0,406723
7,239171
96o
987
238
0,393276
7,074151
T5o
1003
222
0,394962
6,920957
J2o
1129
96
0,42042
6,885765
75s
1115
110
0,414674
6,59416
94s
1063
162
0,403925
6,583641
T4o
1097
128
0,406874
6,248512
65s
1159
66
0,418775
6,207388
86o
1087
138
0,402754
6,099835
93s
1121
104
0,409454
6,058991
84s
1145
80
0,409633
5,692773
95o
1133
92
0,406508
5,650827
T3o
1145
80
0,406672
5,480421
76o
1164
61
0,410142
5,439126
92s
1153
72
0,406646
5,359298
74s
1198
27
0,412623
5,109201
54s
1225
0
0,414534
4,850294
T2o
1149
76
0,397258
4,832254
85o
1197
28
0,407938
4,81223
64s
1225
0
0,413333
4,769221
83s
1201
24
0,403003
4,463809
94o
1201
24
0,400861
4,345783
75o
1225
0
0,40512
4,269797
82s
1207
18
0,398164
4,129509
73s
1225
0
0,400359
4,018033
93o
1200
25
0,393756
4,000304
65o
1225
0
0,399443
3,972305
53s
1225
0
0,39693
3,851054
63s
1225
0
0,395336
3,777173
84o
1225
0
0,394468
3,737896
92o
1215
10
0,388261
3,585219
43s
1225
0
0,386419
3,402163
66
Počet kombinací z 1225, které Kombinace mohou dorovnat
měly by složit
Procentuální úspěčnost Sklansky-Chubukovovo v případě dorovnání množství
74o
1225
0
0,385498
3,366747
72s
1225
0
0,381559
3,221509
54o
1225
0
0,381553
3,221293
64o
1225
0
0,380105
3,170312
52s
1225
0
0,378493
3,114999
62s
1225
0
0,37669
3,054809
83o
1225
0
0,374838
2,994827
42s
1225
0
0,36829
2,796223
82o
1225
0
0,368277
2,795837
73o
1225
0
0,366023
2,731972
53o
1225
0
0,362648
2,640274
63o
1225
0
0,360776
2,591343
32s
1225
0
0,359844
2,567461
43o
1225
0
0,351459
2,366073
72o
1225
0
0,345836
2,243309
52o
1225
0
0,342846
2,181602
62o
1225
0
0,340751
2,139745
42o
1225
0
0,331998
1,976146
32o
1225
0
0,323032
1,825374
67
PŘÍLOHA D – SÍLA STARTOVNÍ KOMBINACE PODLE EV Síla startovní kombinace vyjádřená podle empiricky zjištěné střední hodnoty výhry vyjádřená v tzv. big bets (dvojnásobek big blindu) na vzorku 115 591 080 hand reálně odehraných na cash game stolech (stav k 18. 4. 2012). Zdroj: http://www.tightpoker.com/poker_hands.html Cards AA KK QQ JJ AK s AQ s TT AK AJ s KQ s 99 AT s AQ KJ s 88 QJ s KT s A9 s AJ QT s KQ 77 JT s A8 s K9 s AT A5 s A7s KJ 66 T9 s A4 s Q9 s J9 s
EV 2,32 1,67 1,22 0,86 0,78 0,59 0,58 0,51 0,44 0,39 0,38 0,32 0,31 0,29 0,25 0,23 0,2 0,19 0,19 0,17 0,16 0,16 0,15 0,1 0,09 0,08 0,08 0,08 0,08 0,07 0,05 0,05 0,05 0,04
Count 521 324 522 652 520 663 521 866 348 364 348 759 520 705 1 048 008 348 126 346 772 522 454 348 013 1 042 962 346 582 521 972 348 870 348 774 348 992 1 045 857 346 115 1 045 069 524 345 348 235 349 431 348 286 1 047 289 348 544 349 949 1 047 098 520 946 348 264 347 862 348 760 349 965
Cards Q7 s K9 65 s T9 86 s A8 J7 s 33 54 s Q6 s K3 s Q9 75 s 22 J9 64 s Q5 s K2 s 96 s Q3 s J8 98 T8 97 A7 T7 Q4 s Q8 J5 s T6 75 J4 s 74 s K8
68
EV -0,06 -0,07 -0,07 -0,07 -0,07 -0,07 -0,07 -0,07 -0,08 -0,08 -0,08 -0,08 -0,09 -0,09 -0,09 -0,09 -0,09 -0,09 -0,09 -0,1 -0,1 -0,1 -0,1 -0,1 -0,1 -0,1 -0,1 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11
Count 348 073 1 045 630 348 590 1 045 306 348 374 1 042 209 345 009 522 632 348 260 349 068 348 865 1 049 468 349 781 524 131 1 044 150 349 689 350 110 349 276 349 514 348 009 1 046 506 1 044 759 1 048 779 1 046 152 1 046 587 1 044 950 348 979 1 048 251 348 923 1 043 014 1 047 447 347 508 350 325 1 048 167
Cards Q9 75 s 22 J9 64 s Q5 s K2 s 96 s Q3 s J8 98 T8 97 A7 T7 Q4 s Q8 J5 s T6 75 J4 s 74 s K8 86 53 s K7 63 s J6 s 85 T6 s 76 A6 T2 95 s 84 62 T5 s 95 A5 Q7 T5 87 83 65
EV -0,08 -0,09 -0,09 -0,09 -0,09 -0,09 -0,09 -0,09 -0,1 -0,1 -0,1 -0,1 -0,1 -0,1 -0,1 -0,1 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,11 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12
Count 1 049 468 349 781 524 131 1 044 150 349 689 350 110 349 276 349 514 348 009 1 046 506 1 044 759 1 048 779 1 046 152 1 046 587 1 044 950 348 979 1 048 251 348 923 1 043 014 1 047 447 347 508 350 325 1 048 167 1 047 524 346 930 1 043 698 346 449 347 570 1 048 159 348 875 1 046 722 1 046 762 1 047 032 348 477 1 046 266 1 049 495 348 928 1 044 601 1 046 285 1 046 099 1 048 428 1 044 635 1 048 550 1 045 971
Cards Q2 s 94 74 54 A4 T4 82 64 42 J7 93 85 s 73 53 T3 63 K6 J6 96 92 72 52 Q4 K5 J5 43 s Q3 43 K4 J4 T4 s Q6 Q2 J3 s J3 T3 s A3 Q5 J2 84 s 82 s 42 s 93 s 73 s 69
EV -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,12 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,13 -0,14 -0,14 -0,14 -0,14
Count 348 912 1 047 422 1 043 278 1 046 435 1 046 931 1 047 976 1 043 638 1 043 079 1 043 357 1 046 565 1 045 989 347 928 1 047 020 1 047 022 1 043 908 1 044 818 1 045 039 1 045 991 1 047 156 1 049 342 1 046 167 1 049 213 1 045 087 1 047 359 1 047 697 348 802 1 047 649 1 047 900 1 046 562 1 048 129 350 639 1 046 958 1 046 353 349 254 1 046 204 349 673 1 046 970 1 047 946 1 045 715 349 390 348 622 350 591 348 835 349 007
Cards K3 J2 s 92 s 52 s K2 T2 s 62 s
EV -0,14 -0,14 -0,14 -0,14 -0,14 -0,14 -0,14
Count 1 045 968 348 259 347 868 348 401 1 048 521 349 612 348 033
Cards 32 A2 83 s 94 s 72 s 32 s
70
EV -0,14 -0,15 -0,15 -0,15 -0,15 -0,15
Count 1 044 956 1 047 979 349 355 348 259 348 368 349 794