FAKULTA INFORMAČNÍCH TECHNOLOGIÍ

ˇ Í TECHNICKE ´ V BRNE ˇ VYSOKE´ UCEN BRNO UNIVERSITY OF TECHNOLOGY

ˇ ÍCH TECHNOLOGIÍ FAKULTA INFORMACN ´ ´ U ˚ USTAV INTELIGENTNÍCH SYSTEM FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INTELLIGENT SYSTEMS

ˇ ˇ ˇ SEN Í ULOH ´ Í RE S NEURCITOST SOLVING PROBLEMS WITH UNCERTAINTY

´ RSK ˇ ´ PRACE ´ BAKALA A BACHELOR’S THESIS

´ AUTOR PRACE

´ LIBOR HRDY

AUTHOR

´ VEDOUCÍ PRACE SUPERVISOR

BRNO 2007

ˇ ˇ Doc. Ing. FRANTISEK V. ZBORIL, CSc.

Zad´ an´ı bakal´ aˇ rsk´ e pr´ ace

Licenˇ cn´ı smlouva Licenˇcn´ı smlouva je uloˇzena v archivu Fakulty informaˇcn´ıch technologi´ı Vysokého uˇcen´ı technického v Brnˇe.

Abstrakt V dokumentu je popsána implementace logické-deskové hry Vrhcáby (anglicky Backgammon), hry pro dva hráˇce, pˇriˇcemˇz jeden z hráˇc˚ u je zastoupen poˇc´ıtaˇcem. V dokumentu je rozvedena problematika programován´ı grafického uˇzivatelského rozhran´ı pomoc´ı toolkitu WxWidgets a dále implementace hern´ıho jádra (ovládán´ı hry + UI poˇc´ıtaˇce) s pouˇzit´ım algoritmu ExpectMiniMax, jeˇz se vyuˇz´ıvá právˇe pro implementaci her jako Vrhcáby, tedy her, v nichˇz se vyskytuje prvek náhody, v tomto konkrétn´ım pˇr´ıpadˇe hod kostkou.

Kl´ıˇ cov´ a slova WxWidgets, GUI, UI, Alfa-beta, MiniMax, ExpectMiniMax, náhoda, hry s neurˇcitost´ı, neurˇcitost, C++

Abstract In this thesis is described implementation of the logical deskgame Backgammon, which is a game for two players, whereas one is substituted by computer. This thesis is focused on the problems of the programming the graphical user interface with help of toolkit WxWidgets and also the implemetnation of the game core (game controls and AI of the computer) by using ExpectMiniMax algorithm, that is used for the implementation of the games with the strong influence of random, games where random plays a big role, in this particular case throwing the cube.

Keywords WxWidgets, GUI, UI, Alpha-beta, MiniMax, ExpectMiniMax, chance, games with uncerntainty, uncerntainty, C++

Citace ˇ sen´ı u Libor Hrd´ y: Reˇ ´loh s neurˇcitost´ı, bakaláˇrská práce, Brno, FIT VUT v Brnˇe, 2007

ˇ sen´ı u Reˇ ´ loh s neurˇ citost´ı Prohl´ aˇ sen´ı Prohlaˇsuji, ˇze jsem tuto bakaláˇrskou práci vypracoval samostatnˇe pod veden´ım pana doc. Ing. Frantiˇska V´ıtˇezslava Zboˇrila CSc. a ˇze jsem uvedl vˇsechny literárn´ı prameny a publikace, ze kter´ ych jsem ˇcerpal. ....................... Libor Hrd´ y 15. kvˇetna 2007

Podˇ ekov´ an´ı Zde bych rád podˇekoval panu doc. Ing. Frantiˇsku V´ıtˇezslavu Zboˇrilovi CSc. za pomoc a rady, které mi poskytl pˇri ˇreˇsen´ı této práce a také za studijn´ı oporu pro pˇredmˇet Z´ aklady umˇelé inteligence, která se pˇri práci na totmo projektu stala m´ ym hlavn´ım studijn´ım materiálem.

c Libor Hrd´

y, 2007. Tato pr´ ace vznikla jako ˇskoln´ı d´ılo na Vysokém uˇcen´ı technickém v Brnˇe, Fakultˇe informaˇcn´ıch technologi´ı. Pr´ ace je chr´ anˇena autorským z´ akonem a jej´ı uˇzit´ı bez udˇelen´ı opr´ avnˇen´ı autorem je nez´ akonné, s výjimkou z´ akonem definovaných pˇr´ıpad˚ u.

Obsah ´ 1 Uvod

2

2 Charakteristika souˇ casn´ eho stavu

3

3 Teoretick´ y n´ ahled 3.1 Umˇelá inteligence . . . . . . . 3.2 Metody ˇreˇsen´ı u ´loh . . . . . . 3.3 Metody hran´ı her . . . . . . . 3.3.1 Jednoduché hry . . . . 3.3.2 Sloˇzité hry . . . . . . 3.3.3 Alfa-beta proˇrezáván´ı 3.3.4 Hry s neurˇcitost´ı . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

4 Praktick´ aˇ c´ ast 4.1 V´ ybˇer hry pro demonstraci - Vrhcáby 4.2 Anal´ yza problému . . . . . . . . . . . 4.2.1 Vlastn´ı ˇreˇsen´ı . . . . . . . . . . 4.3 Grafické uˇzivatelské rozhran´ı . . . . . 4.3.1 Reprezentace hrac´ı plochy . . . 4.3.2 Reprezentace hrac´ıch kostek . . 4.4 Hern´ı jádro . . . . . . . . . . . . . . . 4.4.1 Poˇcáteˇcn´ı stav hry . . . . . . . 4.4.2 Fáze hodu kostkou . . . . . . . 4.4.3 Fáze tahu hráˇce . . . . . . . . 5 Z´ avˇ er

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

. . . . . . . . . .

. . . . . . .

4 4 5 6 8 8 10 12

. . . . . . . . . .

14 14 15 15 16 17 19 20 20 20 20 22

1

Kapitola 1

´ Uvod ˇ sen´ı u Téma mé bakaláˇrské práce je Reˇ ´loh s neurˇcitost´ı a spadá do kategorie umˇelé inteligence. V této dokumentaci, strukturované do dvou hlavn´ıch ˇcást´ı, v prvn´ı z nich nazvané Teoretický n´ ahled nejprve popisuji aktuáln´ı stav této práce. Dále se snaˇz´ım ukázat jednotlivá odvˇetv´ı vˇedn´ıho oboru UI. V u ´vodu se zamˇeˇruji na oblast Metody ˇreˇsen´ı u ´loh, kterou specializuji v kapitole Metody hran´ı her, kde jsou popsány nˇekteré základn´ı metody hran´ı her napˇr. procedury MiniMax a Alfa-beta proˇrez´ av´ an´ı. V samotném závˇeru této sekce se dostávám k popisu problematiky neurˇcitosti a k popisu algoritmu ExpectMiniMax, kter´ y se ˇcasto pouˇz´ıvá právˇe ve spojen´ı s problematikou neurˇcitosti. Na zaˇcátku druhé ˇcásti popisuji v kapitole Výbˇer hry pro demonstraci v´ ybˇer demonstraˇcn´ı hry z dané mnoˇziny her obsahuj´ıc´ıch prvek náhody a také d˚ uvody, které mˇe vedly ke koneˇcnému rozhodnut´ı vybrat si hru Vrhcáby (Backgammon). Pravidla zvolené hry jsou shrnuta v pˇr´ıloze A. Osvojen´ı tˇechto pravidel bylo nutn´ ym krokem pro správnou anal´ yzu a návrh vlastn´ıho ˇreˇsen´ı, které tvoˇr´ı dalˇs´ı dvˇe kapitoly praktické ˇcásti. Za tˇemito dvˇema body následuje v ˇcásti s názvem Grafické uˇzivatelské rozhran´ı popis GUI a jeho koneˇcného návrhu. Souˇcást´ı kapitoly je i realizace hrac´ı plochy a objekt˚ u, které plocha obsahuje. V následuj´ıc´ı kapitole nazvané Hern´ı j´ adro jsou popsány jednotlivé stavy hry, které se bˇehem hran´ı pravidelnˇe stˇr´ıdaj´ı. Posledn´ı souˇcást´ı dokumentu je závˇer, ve kterém se snaˇz´ım zhodnotit odvedenou práci. Také uvád´ım moˇzná rozˇs´ıˇren´ı r˚ uzn´ ych ˇcást´ı programu vedle pˇr´ınos˚ u, které mi ˇreˇseni této práce dalo. Na konci dokumentu jsou vloˇzeny dvˇe pˇr´ılohy. Pˇr´ıloha A s pravidly hry Vrhcáby a pˇr´ıloha B obsahuj´ıc´ı adresaáˇrovou strukturu na pˇriloˇzeném CD, postup pˇri pˇrekladu programu a struˇcn´ y návod k jeho pouˇzit´ı.

2

Kapitola 2

Charakteristika souˇ casn´ eho stavu V rámci semestráln´ıho projektu jsem prostudoval metody ˇreˇsen´ı her s neurˇcitost´ı a z nich jsem si vybral pouˇzit´ı algoritmu ExpectMiniMax (viz 3.3.4). Pro demonstraci jsem si zvolil hru Vrhcáby (viz kapitola 4.1) a tuto jsem implementoval za pouˇzit´ı jazyka C++. Aktuáln´ım stavem, kter´ y je popsán v této dokumentaci, je hratelná verze této hry. Jsou implementována vˇsechna základn´ı pravidla nutná ke hran´ı jedné hry, tzn. kaˇzdá hra konˇc´ı v´ıtˇezstv´ım jednoho z hráˇc˚ u, ale tyto v´ ysledky nejsou dále nijak zpracovávány. Série her se závˇereˇcn´ ym vyhodnocen´ım je moˇzné rozˇs´ıˇren´ı, které bych rád doimplementoval jiˇz jako mimoˇskoln´ı projekt. V této souvislosti bych téˇz implementoval modul zvyˇsován´ı hodnoty v´ıtˇezstv´ı hry. K tomuto zvyˇsován´ı se pouˇz´ıvá speciáln´ı sázec´ı kostka, která se nacház´ı jiˇz v souˇcasné verzi, ale zat´ım nen´ı aktivn´ı. Hra je ovládána v´ yhradnˇe myˇs´ı. Aktuáln´ı grafické uˇzivatelské rozhran´ı (dále jen GUI) je vytvoˇreno pomoc´ı toolkitu WxWidgets. GUI je tvoˇreno hern´ım menu, stavov´ ym ˇrádek a interaktivn´ı hrac´ı plochou, která je dále rozdˇelena do menˇs´ıch oblast´ı (viz 4.4) reaguj´ıc´ıch na vstup uˇzivatele. Kaˇzd´ y objekt ve hˇre je reprezentován obrázkem ve formátu png. Tento pˇr´ıstup umoˇzn ˇuje jednoduˇse zmˇenit vzhled hry. Dalˇs´ım moˇzn´ ym rozˇs´ıˇren´ım je právˇe volba vzhledu hrac´ı desky, hrac´ıch kamen˚ u, ˇci kostek ve hˇre. Do GUI jsem následnˇe zakomponoval hern´ı jádro, které je implementováno pro hru hr´ aˇce (uˇzivatele) proti poˇc´ıtaˇci. Skládá se z d´ılˇc´ıch funkc´ı, které ˇreˇs´ı jednotlivé problémy v pr˚ ubˇehu hry. Jedná se napˇr. o zjiˇstˇen´ı korektn´ıho tahu v dané situaci nebo nalezen´ı nejlepˇs´ıho tahu pro hráˇce ovládaného poˇc´ıtaˇcem. Nalezen´ı nejlepˇs´ıho tahu tvoˇr´ı vlastn´ı umˇelou inteligenci poˇc´ıtaˇce a je implementováno pomoc´ı algoritmu ExpectMiniMax (viz 3.3.4). I tuto oblast je moˇzné rozˇs´ıˇrit a sice aplikac´ı procedury alfa-beta proˇrez´ av´ an´ı (viz 3.5) na algoritmus ExpectMiniMax. Uvaˇzovan´ ym rozˇs´ıˇren´ım je napˇr. i zv´ yraznˇen´ı kamene, j´ımˇz se právˇe táhne, nebo kostky, jej´ıˇz hodnota je právˇe k tahu pouˇz´ıvána. Dále pak implementace modulu umoˇzn ˇuj´ıc´ıho krok zpˇet.

3

Kapitola 3

Teoretick´ y n´ ahled V této ˇcásti dokumentace se nejprve zm´ın´ım o umˇelé inteligenci (dále jen UI) coby vˇedn´ım oboru a o jej´ım souˇcasném rozdˇelen´ı do d´ılˇc´ıch odvˇetv´ı. Následuje náhled na oblast metody ˇreˇsen´ı u ´loh, z nichˇz se zamˇeˇr´ım na metody hran´ı her.

3.1

Umˇ el´ a inteligence

Na UI se m˚ uˇzeme d´ıvat bud’ jako na vlastnost umˇele vytvoˇreného systému (viz 3.1.1) nebo jako na vˇedn´ı discipl´ınu (viz 3.1.2). Definice 3.1.1 “Umˇel´ a inteligence je vlastnost ˇclovˇekem umˇele vytvoˇrených systém˚ u vyznaˇcuj´ıc´ıch se schopnost´ı rozpozn´ avat pˇredmˇety, jevy a situace, analyzovat vztahy mezi nimi a tak vytv´ aˇret vnitˇrn´ı modely svˇeta, ve kterých tyto systémy existuj´ı, a na tomto z´ akladˇe pak pˇrij´ımat u ´ˇceln´ a rozhodnut´ı, pˇredv´ıdat d˚ usledky tˇechto rozhodnut´ı a objevovat nové z´ akonitosti mezi r˚ uznými modely nebo jejich skupinami.” [3] Definice 3.1.2 “Umˇel´ a inteligence je vˇeda o vytv´ aˇren´ı stroj˚ u nebo systém˚ u, které budou pˇri ˇreˇsen´ı urˇcitého u ´kolu uˇz´ıvat takového postupu, který - kdyby ho dˇelal ˇclovˇek - bychom povaˇzovali za projev jeho inteligence.” [4] Dále v textu bude UI chápána dle znˇen´ı definice jako vˇedn´ı obor, kter´ y nemá pevnˇe vymezen´ y pˇredmˇet zkoumán´ı ani teoretick´ y základ. Jedná se sp´ıˇse o soubor metod, teoretick´ ych pˇr´ıstup˚ u a algoritm˚ u, slouˇz´ıc´ıch k ˇreˇsen´ı velmi sloˇzit´ ych u ´loh. V´ ysledky tˇechto d´ılˇc´ıch ˇreˇsen´ı slouˇz´ı bud’ jin´ ym vˇedn´ım discipl´ınám k aplikaci nebo jako základ k formov´ an´ı nov´ ych vˇedn´ıch discipl´ın. Souˇcasná UI se pˇreváˇznˇe zamˇeˇruje na práci s nejist´ ymi a ne´ upln´ ymi informacemi, na tzv. Softcomputig (zahrnuje neuronové s´ıtˇe, genetické algoritmy, fuzzy mnoˇziny a fuzzy logiku, hrubé mnoˇziny, chaos). Také je intenz´ıvnˇe zkoumána problematika distribuované UI, tj. problematika agent˚ u a multiagentn´ıch systém˚ u. Tyto u ´lohy, kter´ ymi se UI zab´ yvá, mohou do jisté m´ıry nahradit nˇekteré intelektuáln´ı ˇcinnosti ˇclovˇeka a t´ım se UI rychle rozˇsiˇruje z v´ yzkumn´ ych laboratoˇr´ı do reálného svˇeta.

4

Aplikaˇcn´ı oblasti UI v dneˇsn´ı dobˇe jsou napˇr´ıklad tyto: • Autonomn´ı plánován´ı (roboti na mimozemsk´ ych objektech) • Hran´ı her (ˇsachy) • Medic´ınská diagnostika (expertn´ı systémy) • Logické plánován´ı (pouˇzito napˇr. pˇri plánován´ı logistick´ ych operac´ı bˇehem války v Perském zálivu v roce 1991) • Porozumˇen´ı pˇrirozenému jazyku (spotˇrebiˇce ovládané hlasem) • Neuronové s´ıtˇe (snaha o napodoben´ı lidského mozku) • Automatické ˇreˇsen´ı sloˇzit´ ych u ´loh (napˇr. luˇstˇen´ı kˇr´ıˇzovek)

3.2

Metody ˇ reˇ sen´ı u ´ loh

Metody ˇreˇsen´ı u ´loh jsou v´ yznamnou problematikou pˇredstavuj´ıc´ı jednu z hlavn´ıch oblast´ı klasické UI. Tato oblast se zab´ yvá konstrukc´ı inteligentn´ıch systém˚ u, jejichˇz d˚ uleˇzit´ ym rysem je schopnost vytváˇret vnitˇrn´ı model svˇeta a pracovat s n´ım. Je-li dán poˇcáteˇcn´ı a c´ılov´ y model prostˇred´ı, je u ´kolem systém˚ u UI vyhledat takovou posloupnost akc´ı, jejichˇz aplikac´ı lze doj´ıt od stavu poˇcáteˇcn´ıho do stavu c´ılového. Kaˇzdému modelu odpov´ıdá urˇcit´ y stav prostˇred´ı, jejich mnoˇzina spolu s mnoˇzinou akc´ı (operátor˚ u), které umoˇzn ˇuj´ı stavy u ´lohy mˇenit, tvoˇr´ı stavov´ y prostor. C´ılov´ ych stav˚ u m˚ uˇze b´ yt v´ıce a mohou b´ yt popsány podm´ınkami, které mus´ı splˇ novat. Reprezentaci ˇreˇsené u ´lohy (stavového prostoru) lze znázornit r˚ uzn´ ym zp˚ usobem. Nejˇcastˇeji se pouˇz´ıvá znázornˇen´ı orientovan´ ym stromem s uzly, které pˇredstavuj´ı jednotlivé stavy a hranami, které znázorˇ nuj´ı pˇrechody mezi tˇemito uzly. Na obrázku 3.1 je pˇr´ıklad stavového prostoru, kde uzel A je uzlem koˇrenov´ ym, zároveˇ n oznaˇcuje i poˇcáteˇcn´ı stav a je v hloubce 0. Uzly H, K aˇz U jsou uzly listové a uzel R reprezentuje koncov´ y stav v hloubce 3.

Obrázek 3.1: Ukázka stavového prostoru 5

Prvn´ım u ´kolem pˇri ˇreˇsen´ı kaˇzdé u ´lohy je jednoznaˇcná formulace jej´ıch c´ıl˚ u a jednoznaˇcn´ a definice operátor˚ u, která zahrnuje i pˇr´ıpadné podm´ınky omezuj´ıc´ı jejich pouˇzit´ı. Metody ˇreˇsen´ı u ´loh nám pak nab´ızej´ı postupy, kter´ ymi lze c´ılové stavy, resp. posloupnosti operátor˚ u vedouc´ı k c´ılov´ ym stav˚ um, nalézat a pˇredstavuj´ı tak prostˇredky nepostradatelné ve vˇsech aplikaˇcn´ıch oblastech UI. Pˇri automatickém ˇreˇsen´ı u ´loh je tˇreba pro nalezen´ı ˇreˇsen´ı pouˇz´ıt vhodnou metodu (strategii). Pro kaˇzd´ y typ problému se hod´ı jiné metody. Podle tohoto kritéria se daj´ı metody ˇreˇsen´ı u ´loh rozdˇelit napˇr. následovnˇe: • Metody zaloˇzené na prohledáván´ı stavového prostoru (prohledáván´ı do ˇs´ıˇrky, prohledáván´ı do hloubky, backtracking aj.) • Metody ˇreˇsen´ı u ´loh s omezuj´ıc´ımi podm´ınkami (forward checking, metoda minimáln´ıho konfliktu) • Metody zaloˇzené na rozkladu u ´loh/problém˚ u na podproblémy (pouˇzit´ı AND/OR graf˚ u) • Metody hran´ı her (algoritmus MiniMax)

3.3

Metody hran´ı her

Metody hran´ı her uvedené v této kapitole jsou omezeny pouze na hry se dvˇema (proti)hr´ aˇci, kteˇr´ı se po jednotliv´ ych taz´ıch hry pravidelnˇe stˇr´ıdaj´ı. Oba hráˇci maj´ı vˇsechny informace o hˇre a jej´ım souˇcasném stavu. Tato informace je koneˇcná (pozice) a obsahuje téˇz u ´daj o tom, kter´ y hráˇc právˇe táhne. Dále existuj´ı pravidla hry, jenˇz urˇcuj´ı ke kaˇzdé pozici pro pr´ avˇe táhnouc´ıho hráˇce koneˇcn´ y poˇcet pˇr´ıpustn´ ych tah˚ u. Krokem hry (tahem, popˇr. p˚ ultahem) je, kdyˇz si táhnouc´ı hráˇc vybere jeden z pˇr´ıpustn´ ych tah˚ u a provede jej. T´ım vznikne nov´ a pozice a na tahu je soupeˇr. Hra pokraˇcuje, dokud se nedostane do závˇereˇcné fáze, u které mus´ı b´ yt téˇz definováno, kdo vyhrál ˇci prohrál, pˇr´ıp. ˇze jde o rem´ızu. Dále zm´ınˇené metody jsou zaloˇzeny na rozkladu u ´lohy na podproblémy, coˇz je pˇrirozen´ a metoda, kterou pˇri ˇreˇsen´ı obt´ıˇzn´ ych problém˚ u pouˇz´ıvá i ˇclovˇek. Pˇri rozkladu m˚ uˇzeme narazit na dva typy podproblém˚ u (viz obrázek 3.2). Problém AND (na obrázku uzel A), kter´ y je ˇreˇsiteln´ y pokud jsou ˇreˇsitelné vˇsechny jeho podproblémy a problém OR (uzel Z), kter´ y je ˇreˇsiteln´ y, je-li ˇreˇsiteln´ y alespoˇ n jeden z jeho podproblém˚ u.

Obrázek 3.2: Podproblémy typu AND a OR.

6

Na obrázku 3.3 je vidˇet pˇr´ıpadné ˇreˇsen´ı nesourodosti problému na stejné u ´rovni zanoˇren´ı, jeˇz spoˇc´ıvá v pˇridán´ı pomocného uzlu (na obrázku uzel P) ˇci odebrán´ı pˇrebyteˇcného uzlu (uzel D). Touto u ´pravou vznikne tzv. “ˇcist´ y” AND/OR graf, kter´ y lze pˇri ˇreˇsen´ı hern´ıch u ´loh procházet podobnˇe jako stavov´ y prostor.

Obrázek 3.3: Pˇr´ıklad pˇrevodu na “ˇcist´ y” AND/OR graf

Pˇri hran´ı her, respektive pˇri aplikaci metod pro hran´ı her, je ˇreˇsen´ ym problémem nalezen´ı tahu hráˇce, kter´ y právˇe táhne (hráˇc A). Z pohledu tohoto hráˇce bude problém ˇreˇsiteln´ y, pokud k jeho v´ yhˇre povede alespoˇ n jeden z jeho moˇzn´ ych následuj´ıc´ıch tah˚ u (problém OR). Pˇri dalˇs´ım kroku táhne protihráˇc (hráˇc B), kter´ y se snaˇz´ı zabránit ve v´ yhˇre hráˇci A. Drˇz´ımeli se pohledu hráˇce A, mus´ı b´ yt vˇsechny tahy hráˇce B následuj´ıc´ı po tahu hráˇce A pro hr´ aˇce B neˇreˇsitelné, jinak ˇreˇceno, vˇsechny tahy hráˇce B mus´ı b´ yt ˇreˇsitelné pro hráˇce A (problém AND). Hledán´ı tahu vedouc´ıho k v´ yhˇre tak vede na klasické prohledáván´ı AND/OR grafu. Kdyˇz se hráˇc A dostane znovu na ˇradu, nem˚ uˇze pouˇz´ıt v´ ysledky z pˇredchoz´ıho pr˚ uchodu, protoˇze na rozd´ıl od nového stavu hry nejsou tyto ovlivnˇeny právˇe skonˇcen´ ym tahem hr´ aˇce B, ale mus´ı znovu naj´ıt a vybrat sv˚ uj tah jiˇz z nového konkrétn´ıho stavu u ´lohy. Po vyhodnocen´ı vˇsech pˇr´ıpustn´ ych tah˚ u si hráˇc, kter´ y táhne (uvaˇzujme hráˇce A), vybere tah s nejlepˇs´ım ohodnocen´ım, které urˇcuje tzv. “funkce zisku” nebo téˇz “pˇr´ınosnosti”, kde toto ohodnocen´ı odráˇz´ı aktuáln´ı stav hry ve prospˇech hráˇce A. Z toho plyne, ˇze zat´ımco hr´ aˇc A si vyb´ırá tahy s nejvˇetˇs´ım ohodnocen´ım, hráˇc B vyb´ırá (respektive je toto pˇri strojovém vyhodnocen´ı uvaˇzováno) nejménˇe ohodnocené tahy, aby hráˇci A co nejv´ıce znemoˇznil ˇsanci na v´ yhru. U normáln´ıho vyhledávac´ıho problému by hráˇc A prostˇe hledal sekvenci tah˚ u vedouc´ıch do v´ıtˇezného koneˇcného stavu (s pouˇzit´ım funkce pˇr´ınosnosti) a po nalezen´ı cesty by vybral prvn´ı z tah˚ u takové sekvence. Protihráˇc B ale hru ovlivˇ nuje, proto mus´ı hráˇc A naj´ıt strategii vedouc´ı ke koneˇcnému stavu bez ohledu na to, co hráˇc B dˇelá. Strategie obsahuje korektn´ı tah (tah podle pravidel) pro hráˇce A jako odpovˇed’ na kaˇzd´ y moˇzn´ y tah protihráˇce. Existuj´ı cesty k nalezen´ı strategie, i kdyˇz omezen´ım pro v´ ypoˇcet m˚ uˇze b´ yt (a b´ yvá) ˇcasov´ y limit. Takto popsané hry lze rozdˇelit na jednoduché, sloˇzité a hry s neurˇcitost´ı.

7

3.3.1

Jednoduch´ e hry

Za jednoduché hry se povaˇzuj´ı takové hry, u nichˇz je moˇzné v reálném ˇcase prohledat cel´ y jejich AND/OR graf aˇz do nalezen´ı nˇejakého c´ılového stavu (v´ yhra, prohra, rem´ıza). K ˇreˇsen´ı se m˚ uˇze pouˇz´ıt napˇr´ıklad AO algoritmus, kter´ y je základn´ım neinformovan´ ym algoritmem. Podobnˇe jako u prohledáván´ı stavového prostoru m˚ uˇzeme i nyn´ı vyˇsetˇrovat ˇreˇsitelnost problému procházen´ım AND/OR grafu do hloubky nebo do ˇs´ıˇrky (podle toho, kter´ y z uzl˚ u vyjmeme ze seznamu OPEN). AO algoritmus 1. Sestroj prázdné seznamy OPEN a CLOSED. Do seznamu OPEN uloˇz poˇcáteˇcn´ı uzel (problém). 2. Vyjmi uzel zleva ze seznamu OPEN a oznaˇc jej jako uzel X. 3. (a) Pokud je uzel (problém) X ˇreˇsiteln´ y, pˇridej informaci o jeho ˇreˇsitelnosti jeho pˇredch˚ udc˚ um. Je-li X zároveˇ n poˇcáteˇcn´ım problémem, ukonˇci ˇreˇsen´ı jako u ´spˇeˇsné vytvoˇr a vrat’ relevantn´ı ˇcást AND/OR grafu. (b) Nen´ı-li uzel (problém) X ˇreˇsiteln´ y a nelze-li jej rozloˇzit na podproblémy, pˇredej informaci o jeho neˇreˇsitelnosti jeho pˇredch˚ udc˚ um. Je-li X zároveˇ n poˇcáteˇcn´ım problémem, ukonˇci ˇreˇsen´ı jako ne´ uspˇeˇsné. (c) Expanduj X (rozloˇz X na podproblémy) a vˇsechny jeho následn´ıky uloˇz do OPEN. 4. Uloˇz X do CLOSED. 5. Je-li seznam OPEN prázdn´ y, ukonˇci ˇreˇsen´ı jako ne´ uspˇeˇsné, jinak se vrat’ na bod 2. S t´ım, ˇze v pˇr´ıpadˇe ˇreˇsitelnosti nen´ı nutné vracet celou ˇcást AND/OR grafu, ale pouze tah hráˇce A, kter´ y vede k jeho v´ yhˇre.

3.3.2

Sloˇ zit´ e hry

Za sloˇzité hry povaˇzujeme hry, u kter´ ych, pro velk´ y poˇcet uzl˚ u v prohledávac´ım stromu (AND/OR grafu), nen´ı kompletn´ı pr˚ uchod tohoto stromu z ˇcasov´ ych d˚ uvod˚ u reáln´ y (napˇr. ˇsachy, Vrhcáby). K ˇreˇsen´ı takov´ ychto her se m˚ uˇze pouˇzit napˇr. algoritmus MiniMax. Základem algoritmu MiniMax je rekurzivn´ı procedura, oznaˇcovaná také jako MiniMax, která se zavolá pro aktuáln´ı stav hry (koˇrenov´ y uzel AND/OR grafu) a hráˇce, kter´ y je na tahu (hráˇc MAX). Tato procedura vrac´ı ohodnocen´ı uzlu a pro hráˇce MAX i tah k uzlu s maximáln´ım ohodnocen´ım, tj. tah, kter´ y je v daném stavu hry pro tohoto hr´ aˇce nejv´ yhodnˇejˇs´ı. Samotné ohodnocen´ı uzlu poˇc´ıtá jiˇz dˇr´ıve zmiˇ novaná funkce zisku, která tak ˇcin´ı na základˇe pˇrevodu situace na hrac´ım poli na jediné konkrétn´ı ˇc´ıslo. Funkce zisku se pro kaˇzdou hru liˇs´ı a pˇri jej´ım návrhu lze zohlednit napˇr. poˇcet figur, jejich “s´ılu”, pozici na hrac´ı ploˇse apod.

8

Na rozd´ıl od ˇreˇsen´ı jednoduch´ ych her, kdy je moˇzné proj´ıt prohledávac´ım stromem aˇz k uzlu, kter´ y je koncov´ ym stavem u ´lohy, zde procedura MiniMax pˇredpokládá, ˇze je zadána maximáln´ı hloubka prohledáván´ı (poˇcet zkouman´ ych tah˚ u) a hodnoty termináln´ıch uzl˚ u tak neodráˇz´ı v´ yhru nebo poráˇzku.1

Procedura MiniMax 1. Nazvˇeme pˇredan´ y vstupn´ı uzel uzlem X. 2. Je-li uzel X listem (koneˇcn´ ym stavem hry nebo uzlem v maximáln´ı hloubce), vrat’ ohodnocen´ı tohoto uzlu. Jinak pokraˇcuj. 3. Je-li na tahu hráˇc MAX, tak postupnˇe pro vˇsechny jeho moˇzné tahy (bezprostˇredn´ı následn´ıky uzlu X a hráˇce MIN) volej proceduru MiniMax a vrat’ maximáln´ı z navrácen´ ych hodnot. Je-li X koˇrenov´ ym uzlem vrat’ i tah, kter´ y vede k nejlépe ohodnocenému bezprostˇredn´ımu následn´ıkovi. 4. Je-li na tahu hráˇc MIN, tak postupnˇe pro vˇsechny jeho moˇzné tahy (bezprostˇredn´ı následn´ıky uzlu X a hráˇce MAX) volej proceduru MiniMax a vrat’ minimáln´ı z navrácen´ ych hodnot. Pˇri pouˇzit´ı procedury MiniMax docház´ı ke zbyteˇcnému vyˇsetˇrován´ı velké ˇcásti AND/OR uvodu, kter´ y je bl´ıˇze vysvˇetlen v následuj´ıc´ım pˇr´ıkladu na prografu (viz obrázek 3.4) z d˚ ceduru MiniMax. V obrázku jsou vyznaˇceny zbyteˇcnˇe vyˇsetˇrované uzly ˇcervenˇe, takov´ ych uzl˚ u je pˇribliˇznˇe 30% (13 ze 40ti). Tento pˇr´ıklad je z velké ˇcásti pˇrevzat z opory pˇredmˇetu IZU. [1] Pˇ r´ıklad pouˇ zit´ı algoritmu MiniMax Hráˇc MAX (koˇrenov´ y uzel A) volá proceduru MiniMax na sv˚ uj prvn´ı tah a hráˇce MIN (uzel B) a ten volá tuto proceduru na sv˚ uj prvn´ı tah a hráˇce MAX (uzel C). Hráˇc MAX (uzel C) volá proceduru MiniMax postupnˇe na vˇsechny své moˇzné tahy a hráˇce MIN, protoˇze vˇsichni jeho bezprostˇredn´ı následn´ıci jsou uzlov´ ymi listy, procedura MiniMax pouze postupnˇe vrac´ı ohodnocen´ı tˇechto list˚ u a hráˇc MAX pak vybere (vrát´ı) maximáln´ı hodnotu z jejich ohodnocen´ı (tj. ˇc´ıslo 8). Hráˇc MIN (uzel B) tuto hodnotu akceptuje a volá proceduru MiniMax na sv˚ uj druh´ y tah a hráˇce MAX (uzel D). Prvn´ı bezprostˇredn´ı následn´ık tohoto uzlu (listov´ y uzel) vrac´ı hodnotu 9. Je zˇrejmé, ˇze prohledáván´ı dalˇs´ıch následn´ık˚ u uzlu D je zbyteˇcné, protoˇze jiˇz nyn´ı je jasné, ˇze tento uzel vrát´ı hodnotu ≥ 9, a ˇze hráˇc MIN (uzel B), kter´ y si vyb´ırá tah s minimáln´ım ohodnocen´ım, si tento tah nevybere, protoˇze ohodnocen´ı jeho prvn´ıho tahu je menˇs´ı. Hráˇc MIN (uzel B) pak volá proceduru MiniMax na sv˚ uj posledn´ı tah a hráˇce MAX (uzel E). Hráˇc MAX (uzel E) opˇet volá postupnˇe proceduru MiniMax na vˇsechny své bezprostˇredn´ı následn´ıky a z vrácen´ ych hodnot vybere (vrát´ı) hodnotu maximáln´ı, tj. hodnotu 4. Protoˇze tato hodnota je menˇs´ı neˇz hodnota 8, hráˇc MIN (uzel B) si vybere a vr´ at´ı 1

Pˇri oceˇ nov´ an´ı hry s omezenou hloubkou mohou nˇekdy vést heuristicky slibné cesty pozdˇeji ve hˇre do ˇspatné situace - jedn´ a se o tzv. horizont efekt.

9

tuto hodnotu. Hráˇc MAX (uzel A) hodnotu 4 akceptuje a volá proceduru MiniMax na sv˚ uj druh´ y moˇzn´ y tah a hráˇce MIN (uzel F). Dalˇs´ı postup pro tento tah je velmi podobn´ y postupu pro prvn´ı tah. Hráˇc MIN (uzel F) volá postupnˇe proceduru MiniMax na své bezprostˇredn´ı následn´ıky (uzly G, H a I) a vrát´ı minimum z vrácen´ ych hodnot, tj. ˇc´ıslo 5. Nˇekteré listové uzly, na obrázku oznaˇcené ˇcervenou barvou, se opˇet vyˇsetˇruj´ı zbyteˇcnˇe, z d˚ uvod˚ u popsan´ ych v´ yˇse. Protoˇze 5 > 4, akceptuje hráˇc MAX (uzel A) tuto hodnotu (druh´ y tah je pro nˇej v´ yhodnˇejˇs´ı, neˇz tah prvn´ı) a volá proceduru MiniMax na sv˚ uj tˇret´ı tah a hráˇce MIN (uzel J). Hráˇc MIN (uzel J) vol´ a proceduru MiniMax na sv˚ uj prvn´ı tah a hráˇce MAX (uzel K) a od tohoto uzlu dostane navrácenu hodnotu 3. Proto je jiˇz v tomto okamˇziku zˇrejmé, ˇze hráˇc MIN (uzel J), kter´ y si vyb´ırá minimum, vrát´ı koˇrenovému uzlu hodnotu ≤ 3 a hráˇc MAX (uzel A) si tento tah nevybere. Dalˇs´ı vyˇsetˇrován´ı tah˚ u hráˇce MIN (uzlu J) je tak zbyteˇcné.

Obrázek 3.4: Ukázka pouˇzit´ı algoritmu MiniMax pro jednoduché hry

3.3.3

Alfa-beta proˇ rez´ av´ an´ı

Podstata algoritmu alfa-beta proˇrez´ av´ an´ı spoˇc´ıvá v nalezen´ı “ˇspatné vˇetve” (tj. horˇs´ı neˇz doposud nalezená nejlepˇs´ı) v prohledávac´ım stromu. D˚ uleˇzité pˇritom je, ˇze nepotˇrebujeme vˇedˇet, jak moc ˇspatná tato vˇetev je. Nav´ıc nás ani nezaj´ımá, zda-li tam nebude lepˇs´ı podvˇetev, protoˇze soupeˇr by se j´ı jistˇe umˇel vyhnout. Z porovnán´ı algoritm˚ u minimaxu a alfa-beta proˇrezáván´ı vypl´ yvá vlastnost, ˇze algoritmus alfa-beta proˇrezáván´ı vrac´ı hodnotu, kterou by vrátil p˚ uvodn´ı algoritmus, aniˇz by musel proj´ıt cel´ ym stromem, coˇz je pˇresnˇe to, co jsme potˇrebovali z´ıskat. Pˇri aplikaci algoritmu postupujeme tak, ˇze si pamatujeme nˇejaké maximum (nebo minimum, pokud jde o minimalizuj´ıc´ı u ´roveˇ n) pro mnoˇzinu uzl˚ u na jedné u ´rovni a pokud zjist´ıme, ˇze ohodnocen´ı syn˚ u dalˇs´ıho uzlu v ˇradˇe je menˇs´ı (vˇetˇs´ı) neˇz toto maximum (minimum), nepotˇrebujeme tento uzel dál rozv´ıjet, protoˇze v´ıme, ˇze uˇz minimaxovou hodnotu svého otce neovlivn´ı.

10

Procedura Alfa-beta 1. Je-li X poˇcáteˇcn´ım/koˇrenov´ ym uzlem, nastav α = −∞, β = ∞ (v praxi nastav hodnoty tˇechto promˇenn´ ych na minimáln´ı a maximáln´ı moˇznou hodnotu). 2. Je-li uzel X listem (koneˇcn´ ym stavem hry nebo uzlem v maximáln´ı hloubce) ukonˇci proceduru a vrat’ ohodnocen´ı tohoto uzlu. 3. Je-li uzel typu AND (na tahu je hráˇc MIN) jdi na bod 4, jinak pokraˇcuj (uzel je typu OR, na tahu je hráˇc MAX): (a) Dokud je α < β, tak postupnˇe pro prvn´ı/dalˇs´ı tah (bezprostˇredn´ıho následn´ıka uzlu X a hráˇce MIN) volej proceduru Alfa-beta s aktuáln´ımi hodnotami promˇenn´ ych α a β. Po kaˇzdém vyˇsetˇreném tahu nastav hodnotu promˇenné a na maximum z aktuáln´ı a navrácené hodnoty . (b) Ukonˇci proceduru, vrat’ aktuáln´ı hodnotu promˇenné α a pro koˇrenov´ y uzel vrat’ i tah, kter´ y vede k nejlépe ohodnocenému bezprostˇredn´ımu následn´ıkovi. 4. Uzel je typu AND (na tahu je hráˇc MIN): (a) Dokud je α < β, tak postupnˇe pro prvn´ı/dalˇs´ı tah (bezprostˇredn´ıho následn´ıka uzlu X a hráˇce MAX) volej proceduru Alfa-beta s aktuáln´ımi hodnotami promˇenn´ ych α a β. Po kaˇzdém vyˇsetˇreném tahu nastav hodnotu promˇenné β na minimum z aktuáln´ı a navrácené hodnoty . (b) Ukonˇci proceduru a vrat’ aktuáln´ı hodnotu promˇenné β. Na obrázku 3.5 je vidˇet pouˇzit´ı procedury Alfa-beta. Princip pr˚ uchodu je tu stejn´ y jako u algoritmu MiniMax 3.4 s t´ım, ˇze se “proˇreˇzou” vˇetve, které by se pˇri pouˇzit´ı algoritmu MiniMax procházeli zbyteˇcnˇe. Pod´ıváme-li se v obrázku na uzel C, hráˇc MAX si zde vybere ze sv´ ych synovsk´ ych uzl˚ u ten s maximáln´ım ohodnocen´ım (8). Tuto hodnotu vrát´ı rodiˇcovskému uzlu (B) a hr´ aˇci MIN, kter´ y ji akceptuje a zavolá proceduru Alfa-beta pro sv˚ uj dalˇs´ı synovsk´ y uzel D a hráˇce MAX. V uzlu D se hráˇc snaˇz´ı opˇet vybrat maximum ze sv´ ych synovsk´ ych uzl˚ u, ale jiˇz u prvn´ıho naraz´ı na hodnotu, která je vyˇsˇs´ı neˇz hodnota, kterou vrátil z uzlu C. Z pohledu

Obrázek 3.5: Ukázka pouˇzit´ı procedury Alfa-beta 11

hráˇce MIN (uzel B), kter´ y vyb´ırá minimum, je jiˇz ted’ vidˇet, ˇze si uzel D nevybere, protoˇze hodnota, která se z uzlu D vrát´ı nebude niˇzˇs´ı neˇz 9. Proto se prohledáván´ı v uzlu D ukonˇc´ı a vrát´ı se hodnota 9, kterou ale hráˇc MIN (uzel B) vyb´ıraj´ıc´ı minimum neakceptuje. Stejn´ y princip se uplatn´ı v uzlu F, kde si hráˇc MIN vyb´ırá minimum a kde jiˇz po prohledán´ı prvn´ıho podstromu (uzel G) je pro hráˇce MAX (uzel A) zˇrejmé, ˇze vˇetev zaˇc´ınaj´ıc´ı uzlem F je ménˇe atraktivn´ı neˇz vˇetev zaˇc´ınaj´ıc´ı uzlem B, ˇc´ımˇz dojde k “odˇr´ıznut´ı” podstrom˚ u maj´ıc´ıch koˇreny v uzlech H a I.

3.3.4

Hry s neurˇ citost´ı

Dalˇs´ım typem her, v nichˇz opˇet hraj´ı dva protihráˇci, kteˇr´ı se po jednotliv´ ych taz´ıch hry pravidelnˇe stˇr´ıdaj´ı, maj´ı u ´plnou informaci o stavu hry, hraj´ı ˇcestnˇe a oba si pˇrej´ı zv´ıtˇezit, jsou hry s neurˇcitost´ı. Jedin´ ym a podstatn´ ym rozd´ılem je, ˇze se pˇri hran´ı tˇechto her pouˇz´ıv´ a kostka, respektive kostky, ˇc´ımˇz do hry vstupuje náhoda - neurˇcitost. Základn´ı princip algoritmu ExpectMiniMax je na obrázku 3.6. Hráˇc MAX hodil kostkou ˇc´ıslo ˇsest, hodnota na kostce vˇsak nen´ı pro dalˇs´ı postup podstatná.

Obrázek 3.6: Základn´ı princip algoritmu ExpectMiniMax

Hr´ aˇc MAX nyn´ı v´ı, které své tahy na u ´rovni B m˚ uˇze uskuteˇcnit. A z tˇechto tah˚ u si bude vyb´ırat uzel s maximáln´ı (funkce Max()). Vyjde z u ´vahy, ˇze hráˇc MIN by pro znám´ y v´ ysledek hodu vybral tah do stavu (´ uroveˇ n D) s minimáln´ım ohodnocen´ım. Hráˇc MIN vˇsak v´ ysledek svého hodu nezná, a proto m˚ uˇze pracovat pouze s ohodnocen´ım oˇcekávan´ ym, které je na obrázku oznaˇceno jako expectMin() (oˇcekávané minimum): expectM in() =

X

P (h) ∗ min(D)

Kde h je v´ ysledek hodu kostkou (1, 2, 3, 4, 5, 6), P (h) je pravdˇepodobnost s jakou m˚ uˇze na kostce padnout konkrétn´ı hodnota h a min(D) je minimáln´ı hodnota z uzl˚ u na u ´rovni D. 12

Ohodnocen´ı expectMin je tedy dáno souˇctem ohodnocen´ı po vˇsech moˇzn´ ych v´ ysledc´ıch hodu kostky (´ uroveˇ n C), kdy kaˇzdé jednotlivé ohodnocen´ı je dáno souˇcinem pravdˇepodobnosti daného v´ ysledku hodu kostky a následného minimáln´ıho ohodnocen´ı stavu, kterého je moˇzné po daném hodu dosáhnout (´ uroveˇ n D). Podobn´ ym zp˚ usobem se postupuje pˇri vyˇsetˇrován´ı oˇcekávaného ohodnocen´ı na u ´rovni D. Hráˇc MAX vyb´ırá maximum z moˇzn´ ych ohodnocen´ı, na obrázku toto hodnocen´ı oznaˇceno jako expectMax() (oˇcekávané maximum): expectM ax() =

X

P (h) ∗ max(F )

Kde h je opˇet v´ ysledek hodu kostkou, P (h) je pravdˇepodobnost s jakou m˚ uˇze na kostce padnout konkrétn´ı hodnota h a max(F ) je maximáln´ı hodnota z uzl˚ u na u ´rovni F. I pˇresto, ˇze se m˚ uˇze zdát algoritmus ExpectMiniMax sloˇzit´ y, je opˇet snadno realizovateln´ y rekurzivn´ı procedurou. Procedura ExpectMiniMax 1. Nazvˇeme pˇredan´ y vstupn´ı uzel uzlem X. 2. Je-li uzel X listem (koneˇcn´ ym stavem hry, nebo uzlem v maximáln´ı hloubce) vrat’ ohodnocen´ı tohoto uzlu. Jinak pokraˇcuj. 3. Je-li na tahu hráˇc MAX, tak postupnˇe pro vˇsechny jeho moˇzné tahy (bezprostˇredn´ı následn´ıky uzlu X a hráˇce MIN) volej proceduru ExpectMiniMax a vrat’ maximáln´ı hodnotu z hodnot expectMax. Je-li X koˇrenov´ ym uzlem vrat’ i tah, kter´ y vede k nejlépe ohodnocenému bezprostˇredn´ımu následn´ıkovi. 4. Je-li na tahu hráˇc MIN, tak postupnˇe pro vˇsechny jeho moˇzné tahy (bezprostˇredn´ı následn´ıky uzlu X a hráˇce MAX) volej proceduru ExpectMiniMax a vrat’ minimáln´ı hodnotu z hodnot expectMin. I na algoritmus ExpectMiniMax se dá stejn´ ym efektem aplikovat procedura Alfa-beta proˇrez´ av´ an´ı (viz 3.5).

13

Kapitola 4

Praktick´ aˇ c´ ast Tato ˇcást dokumentace zaˇc´ıná v´ ybˇerem hry pro demonstraci metod, které se pouˇz´ıvaj´ı k ˇreˇsen´ı problematiky neurˇcitosti. Následuje anal´ yza a návrh ˇreˇsen´ı. Hlavn´ı kapitoly praktické ˇcásti tvoˇr´ı návrh a zpracovnán´ı GUI a popis implementace hern´ıho jádra.

4.1

V´ ybˇ er hry pro demonstraci - Vrhc´ aby

Vhodné hry pro demonstraci metod ˇreˇs´ıc´ıch problém neurˇcitost´ı jsem hledal mezi hrami aleatorick´ ymi1 , které jsou zaloˇzené na principu náhody nebo ˇstˇest´ı nezávislém na v˚ uli jedince. Mezi aleatorické hry patˇr´ı hry v kostky, rulety, loterie, Vrhc´ aby, ˇclovˇeˇce nezlob se, domina, Scrablle apod. Zaujaly mˇe pˇredevˇs´ım hry ˇclovˇeˇce nezlob se a Vrhc´ aby2 (viz 4.1), v nichˇz proti sobˇe hraj´ı dva hráˇci a snaˇz´ı se porazit jeden druhého. U tˇechto her maj´ı oba hráˇci po celou dobu hry ˇ ımˇz u ´plnou informaci o jej´ım stavu a pˇri hˇre se pouˇz´ıvá hrac´ı kostka, respektive kostky. C´ jsou splnˇeny podm´ınky z u ´vodu kapitoly 3.3.4 Hry s neurˇ citost´ı. Pˇri koneˇcném rozhodován´ı, kterou hru si vybrat, jsem si nakonec zvolil hru Vrhc´ aby z tˇechto d˚ uvod˚ u: • Vrhc´ aby jsem doposud neznal a pravidla mˇe velice zaujala, protoˇze se nepodobala ˇzádn´ ym, se kter´ ymi jsem se doposud setkal • aˇc v této hˇre hraje náhoda podstatnou roli, na rozd´ıl od ˇclovˇeˇce nezlob se v´ ysledek hry mnohem v´ıce závis´ı na zkuˇsenosti hráˇce a na pouˇzité strategii

1

Aleatorické hry - z latinského alea, coˇz v pˇrekladu znamen´ a kostka Vrhc´ aby - anglicky Backgammon - je jedna z nejstarˇs´ıch zn´ am´ ych deskov´ ych her, pˇredpokl´ ad´ a se, ˇze se hr´ ala jiˇz ve starovˇekém Egyptˇe, Sumeru, Mezopot´ amii ˇci Persii. 2

14

Obrázek 4.1: Hra Vrhcáby (Backgammon)

4.2

Anal´ yza probl´ emu

Hlavn´ı problém projektu naimplementovat hru Vrhcáby v jazyce C/C++ s grafick´ ym uˇzivatelsk´ ym rozhran´ım jsem si rozdˇelil na dva základn´ı podproblémy, podle nichˇz je koncipov´ ana i tato dokumentace. A sice na implementaci GUI a hern´ıho jádra. Stˇeˇzejn´ım u ´kolem je naprogramovat hern´ı jádro, respektive UI poˇc´ıtaˇce, nic ménˇe celková grafick´ a podoba programu pro mˇe má téˇz velk´ y v´ yznam. Také jsem se rozhodl zahrnout moˇznost pˇreloˇzit program jak na platformˇe Linux, tak i v operaˇcn´ım systému Windows XP. Základn´ı verze hry by mˇela umoˇzn ˇovat hru hráˇce proti poˇc´ıtaˇci. Celkov´ y problém implementace je zapotˇreb´ı dále rozdˇelit na d´ılˇc´ı podproblémy jako napˇr. uˇzivatelské ovlád´ an´ı programu ˇci jeho interakce. Je téˇz potˇreba vyˇreˇsit jednotlivé fáze hry, jako je nalezen´ı korektn´ıch tah˚ u pro hráˇce na tahu, realizace tˇechto tah˚ u atd. S programován´ım UI poˇc´ıtaˇce, souvis´ı i v´ ybˇer nˇekteré z metod pro ˇreˇsen´ı u ´loh s neurˇcitost´ı. Také k tvorbˇe GUI je nutné si vybrat vhodn´ y nástroj. S tvorbou GUI souvis´ı i problém stanovit jak´ ym zp˚ usobem budou reprezentovány jednotlivé objekty na hrac´ı ploˇse a jak bude ˇreˇsena jejich správa (vykreslováni, pohyb objektu apod.).

4.2.1

Vlastn´ı ˇ reˇ sen´ı

Pro tvorbu programu jsem si zvolil implementaˇcn´ı prostˇred´ı Linux. V OS Windows XP jsem si nakonfiguroval prostˇred´ı MSYS s pouˇzit´ım pˇrekladaˇce MINGW, kde jsem si pˇrekládal zdrojové soubory vytvoˇrené v Linuxu a následnˇe kontroloval kompatibilitu programu s OS Windows. Pro vytvoˇren´ı GUI jsem si na základˇe dˇr´ıvˇejˇs´ı zkuˇsenosti vybral toolkit WxWidgets. V rozhodován´ı mi pomohla i skuteˇcnost, ˇze toolkit WxWidgets je multiplatformn´ı. Vlastn´ı program tvoˇr´ı dva hlavn´ı objekty. A sice hlavn´ı okno, objekt frame, obsahuj´ıc´ı hern´ı menu, stavov´ y ˇrádek a hrac´ı plochu. Hrac´ı plocha je zastoupena objektem scene. Hra se ovládá v´ yhradnˇe pomoc´ı myˇsi, nepoˇc´ıtám-li klávesové zkratky pro rychlejˇs´ı pˇr´ıstup k poloˇzkám menu. 15

4.3

Grafick´ e uˇ zivatelsk´ e rozhran´ı

Jak jsem uvedl v´ yˇse, pro implementaci GUI jsem si vybral toolkit WxWidgets, ve kterém jsem implementoval základn´ı objekt programu frame. Tento objekt po spuˇstˇen´ı aplikace vytvoˇr´ı hlavn´ı okno s hern´ım menu, stavov´ ym ˇrádkem a vytvoˇr´ı i objekt hrac´ı plochy, kde prob´ıhá vlastn´ı hra. Na obrázku 4.2 je vidˇet u ´vodn´ı okno zobrazené po startu aplikace.

´ Obrázek 4.2: Uvodn´ ı obrazovka zobrazená po spuˇstˇen´ı hry

Vykreslen´ı hrac´ı plochy prob´ıhá ve funkci OnPaint(), která je volána pˇri zneplatnˇen´ı hrac´ı plochy, vˇetˇsinou nˇekteré jej´ı ˇcásti. Zneplatnˇen´ım se mysl´ı napˇr. pˇresun hlavn´ıho okna nebo jeho pˇrekryt´ı jin´ ym oknem a následné zobrazen´ı. V tˇechto pˇr´ıpadech je tˇreba pˇrekreslit ta ˇcást okna, která byla naruˇsena (zneplatnˇena). Zneplatnˇen´ı se dá u ´ˇcelnˇe vyvolat i v samotném programu. Napˇr. po té co byl proveden tah hráˇce. Pˇrekreslován´ı okna pˇri zmˇenˇe stavu hry prob´ıhá následuj´ıc´ım zp˚ usobem: Nejprve se zavolá funkce RedrawBuffer(), která do pomocného bufferu (bitmapy) nejprve zakresl´ı prázdnou hrac´ı plochu a poté vykresl´ı jednotlivé hrac´ı kameny. Na závˇer vykresl´ı zbylé objekty scény (hrac´ı kostky, sázec´ı kostka, ˇsipka ukazuj´ıc´ı smˇer hry). N´ asledn´ ym volán´ım funkce Refresh(), která je ˇclenskou metodou tˇr´ıdy wxWindow, z n´ıˇz je odvozen objekt scene, se zneplatn´ı obsah hrac´ı plochy. Na tuto událost aplikace reaguje zavolán´ım fce OnPaint() zmiˇ nované v´ yˇse. Funkce OnPaint() jiˇz pouze vykresl´ı pomocn´ y buffer do device kontextu okna.

16

Bˇehem hry program pomoc´ı zpráv reaguje na ˇspatn´ y vstup uˇzivatele (pokus o nesprávn´ y tah) nebo rad´ı, co má uˇzivatel udˇelat. Na obrázku 4.2) je vidˇet zpráva v ˇcerveném rámeˇcku. Vzhled vˇsech objekt˚ u ve hˇre je realizován pomoc´ı obrázku ve formátu png. Vˇsechny obrázky jsou naˇcteny po startu aplikace z adresáˇre graphics.

4.3.1

Reprezentace hrac´ı plochy

Jedn´ım z hlavn´ıch problém˚ u, kter´ y jsem musel ˇreˇsit, je samotné uchován´ı stavu hry. To znamená jednotlivé rozloˇzen´ı hrac´ıch kamen˚ u. P˚ uvodn´ı návrh objektu hrac´ı plochy spoˇc´ıval v reprezentaci jednotliv´ ych troj´ uheln´ıkov´ ych ploch (kl´ın˚ u) jako samostatn´ ych objekt˚ u. Tyto uchovávaly poˇcet a typ hrac´ıch kamen˚ u um´ıstˇen´ ych na kl´ınu. Pozdˇeji pˇri implementaci metod manipuluj´ıc´ıch s tˇemito objekty, jako nalezen´ı moˇzn´ ych tah˚ u, realizace tahu nebo pˇri generován´ı prohledávac´ıho stromu se tyto objekty ukázaly nepˇrehledné. Z tohoto d˚ uvodu jsem hrac´ı plochu implementoval jako jednorozmˇerné homogenn´ı pole, jehoˇz prvky reprezentuj´ı v´ yˇse zmiˇ nované kl´ıny. Tato struktura se ukázala jednak pˇrehlednˇejˇs´ı, ’ tak i ménˇe nároˇcná na pamˇet a v neposledn´ı ˇradˇe i rychlejˇs´ı, co se t´ yká pˇr´ıstupu k jednotliv´ ym kl´ın˚ um a manipulace s nimi. Pole je sloˇzeno z 28 základn´ıch prvk˚ u a 6 prvk˚ u pouˇzit´ ych pˇri generován´ı prohledávac´ıho stromu. Tuto základn´ı strukturu je moˇzné vidˇet na obrázku 4.3. Jednotlivé prvky pole maj´ı tento v´ yznam: 0 - uchovává poˇcet kamen˚ u na baru pro hráˇce ovládaného poˇc´ıtaˇcem 1 - 24 - uchovává poˇcet kamen˚ u na oˇc´ıslovan´ ych kl´ınech ve hˇre 25 - uchovává poˇcet kamen˚ u na baru pro hráˇce (uˇzivatelem) 26 - reprezentuje pole, kam hráˇc vyvád´ı své kameny 27 - reprezentuje pole, kam poˇc´ıtaˇc vyvád´ı své kameny 28 - pˇr´ıznak vyhozen´ı protihráˇcova kamene 29 - u ´daj o prvn´ı kostce pouˇzité pro tah 30 - 32 - u ´daj ze kterého kl´ınu bylo kostkou 1 - 4 táˇz

Obrázek 4.3: Struktura uchovávaj´ıc´ı aktuáln´ı stav hry

17

Z´ akladn´ı prvky pole Na obrázku 4.4 jsou zv´ yraznˇeny v´ yˇse zmiˇ nované základn´ı prvky pole s indexy 0 - 27. Pˇriˇcemˇz u prvk˚ u 1 - 24 jsou zv´ yraznˇeny jen krajn´ı hodnoty. Index jednotliv´ ych kl´ın˚ u se zvyˇsuje od prvku 1 ve smˇeru hodinov´ ych ruˇciˇcek aˇz k prvku 24. Informace, kterou tyto základn´ı prvky uchovávaj´ı, je poˇcet kamen˚ u na daném kl´ınu. Jak je vidˇet na obrázku na jednom kl´ınu m˚ uˇze b´ yt zobrazeno maximálnˇe pˇet hrac´ıch kamen˚ u, ale ve hˇre jich m˚ uˇze stát na jednom kl´ınu vˇsech 15 najednou. Toto je pˇri vykreslován´ı vyˇreˇseno ˇc´ıslic´ı udávaj´ıc´ı skuteˇcn´ y poˇcet kamen˚ u um´ıstˇen´ ych na kl´ınu, která se zobrazuje v okamˇziku, kdy poˇcet kamen˚ u pˇrekroˇc´ı 5. I pˇresto, ˇze je toto pole jednorozmˇerné, uchovává kaˇzd´ y ze základn´ıch prvk˚ u dvˇe informace. Prvn´ı je samozˇrejmˇe poˇcet kamen˚ u um´ıstˇen´ ych na daném kl´ınu a druhá je typ kamene, kde typ ˇr´ıká, kterému hráˇci kameny patˇr´ı. Toto je implementováno rozd´ıln´ ym znaménkem u poˇctu kamen˚ u. Poˇcet kamen˚ u hráˇce je uchováván s kladnou hodnotou a kameny protihráˇce (hráˇce ovládaného poˇc´ıtaˇcem) se zápornou hodnotou. Podle typu se urˇcuje i vzhled kamene.

Obrázek 4.4: Hrac´ı plocha s vyznaˇcen´ ymi ˇcástmi

Speci´ aln´ı prvky pole Prvn´ım ze speciáln´ıch prvk˚ u je prvek s indexem 28 reprezentuj´ıc´ı pˇr´ıznak, kter´ y se nastav´ı v pˇr´ıpadˇe, vede-li pohyb hrac´ıho kamene hráˇce na pol´ıˇcko obsazené soupeˇrov´ ym kamenem, jin´ ymi slovy doˇslo-li k vyhozen´ı soupeˇrova kamene. Tento pˇr´ıznak se pouˇz´ıvá pˇri ohodnocov´ an´ı termináln´ıho stavu v prohledávac´ım stromu, kdy stav hry, v nˇemˇz doˇslo k vyhozen´ı soupeˇrova kamene, je hodnocen pomoc´ı jin´ ych hodnot, neˇz kdyby doˇslo k obyˇcejnému pˇresunu kamene. 18

Vˇsechny dalˇs´ı speciáln´ı prvky spolu u ´zce souvis´ı. Jsou totiˇz vˇsechny pouˇzity pˇri rekonstrukci tahu poˇc´ıtaˇce, poté co je nalezen nejlepˇs´ı z tah˚ u. Prvn´ı s indexem 29 ˇr´ıká, kter´ a z kostek byla pouˇzita pˇri realizaci tahu jako prvn´ı. Zbylé ˇctyˇri prvky obsahuj´ı index kl´ınu, ze kterého bylo pomoc´ı dané kostky taˇzeno s t´ım, ˇze prvn´ı kostku zastupuje prvek s indexem 30, druhou prvek s indexem 31 atd. Problematika hrac´ıch kostek je detailnˇe popsána v následuj´ıc´ı podkapitole.

4.3.2

Reprezentace hrac´ıch kostek

Dalˇs´ı objekty, kter´ ymi jsou hrac´ı kostky, sázec´ı kostka a ˇsipky urˇcuj´ıc´ı smˇer hry jsou jiˇz samostatné a nesou si informaci o um´ıstˇen´ı na hrac´ı ploˇse a informaci o svém vzhledu. Z obrázku 4.4 je vidˇet skuteˇcn´ y poˇcet vytvoˇren´ ych objekt˚ u a jejich um´ıstˇen´ı na hrac´ı ploˇse. Jedná se o dvˇe pomocné ˇsipky oznaˇcené v obrázku p´ısmeny D a E, z nichˇz maximálnˇe ˇ jedna m˚ uˇze b´ yt zobrazena na hrac´ı ploˇse. Cerven´ a ˇsipka (D) ukazuje smˇer hry pro hr´ aˇce uˇzivatele a je zobrazena vˇzdy po ˇcas jeho tahu. Modrá ˇsipka pracuje obdobnˇe pro hr´ aˇce ovládaného poˇc´ıtaˇcem a má sp´ıˇse informativn´ı charakter pro hráˇce uˇzivatele, ˇze zrovna nen´ı na tahu. Dalˇs´ım objektem je sázec´ı kostka (C), jej´ıˇz funkce bude implementována aˇz pro hran´ı série her, pˇri nichˇz se poˇc´ıtá skóre. Tato kostka urˇcuje násobek základn´ı hodnoty v´ yhry (viz 5) a m˚ uˇze nab´ yvat hodnot 2, 4, 8, 16, 32 a 64. Zde je tato kostka reprezentována celkem tˇremi kostkami, z nichˇz právˇe jedna je vˇzdy zobrazena. Jej´ı poloha je urˇcena t´ım, kter´ y z hráˇc˚ u si naposledy vsadil na svoji v´ yhru. Na konec jsem si nechal hrac´ı kostky pouˇz´ıvané bˇehem hry ze vˇsech v´ yˇse zm´ınˇen´ ych objekt˚ u nejˇcastˇeji. Ve skuteˇcnosti se pˇri hˇre pouˇz´ıvaj´ı pouze dvˇe kostky. Pro rozliˇsen´ı hráˇce, kter´ y je zrovna na tahu, se tyto dvˇe kostky zobrazuj´ı stˇr´ıdavˇe v levé (A) a pravé ˇcásti (B) hern´ı plochy. V levé pro hráˇce ovládaného poˇc´ıtaˇcem a v pravé pro hráˇce uˇzivatele. Tyto kostky jsou na obrázku 4.4 zobrazeny s hodnotami 2 a 3. Zbylé dvˇe (ˇctyˇri) kostky se zobrazuj´ı pouze v pˇr´ıpadˇe, kdy padne na obou kostkách stejná hodnota. Pˇri tomto hodu totiˇz pravidla ˇr´ıkaj´ı, ˇze hráˇc má k dispozici dalˇs´ı dva tahy stejné hodnoty nav´ıc. Hrac´ı kostky se objevuj´ı ve tˇrech základn´ıch podobách (viz obrázek 4.5). Prvn´ı vzhled, kdy kostky nemaj´ı ˇzádnou hodnotu (A) a ˇcekaj´ı na hráˇce, kter´ y kliknut´ım do hrac´ı plochy realizuje jejich vrh. Po “hodu” se zobraz´ı jiˇz se svou aktuáln´ı hodnotou (B). Posledn´ı moˇzn´ y vzhled se objev´ı na kostce po odehrán´ı jej´ı hodnoty (C).

Obrázek 4.5: Zobrazen´ı hrac´ıch kostek ve hˇre

19

4.4

Hern´ı j´ adro

Objekt scene se stará o vykreslován´ı hrac´ı plochy a jednotliv´ ych objekt˚ u, jak popisuje pˇredchoz´ı kapitola, ale i o vlastn´ı hran´ı hry, coˇz bude popsáno v této kapitole. Pˇri hˇre se stˇr´ıdá 6 základn´ıch stav˚ u (fáz´ı) hry. Jsou to: • poˇcáteˇcn´ı stav hry • fáze hodu kostkou (na tahu je hráˇc uˇzivatel) • fáze tahu hráˇce (uˇzivatele) • fáze hodu kostkou (na tahu je poˇc´ıtaˇc) • fáze tahu hráˇce (poˇc´ıtaˇce) • koneˇcn´ y stav hry (jednomu z hráˇc˚ u se podaˇrilo zv´ıtˇezit)

4.4.1

Poˇ c´ ateˇ cn´ı stav hry

Poˇcáteˇcn´ı stav hry reprezentován fc´ı NewGameHandler() je vidˇet na obrázku 4.2, kde aplikace ˇceká na kliknut´ı uˇzivatele na hrac´ı plochu. Po té, co se tak stane, se pomoc´ı generátoru pseudonáhodn´ ych ˇc´ısel vygeneruje hodnota pro kaˇzdou z kostek. Podle toho, která z hodnot je vyˇsˇs´ı, zda levá ˇci pravá, se pˇrejde bud’ do fáze hodu kostkou hráˇce, pro vyˇsˇs´ı pravou hodnotu, nebo do fáze hodu kostkou poˇc´ıtaˇce v opaˇcném pˇr´ıpadˇe. Poˇcáteˇcn´ı stav hry tedy pouze vygeneruje hod kostkami a urˇc´ı, kter´ y z hráˇc˚ u zapoˇcne hru.

4.4.2

F´ aze hodu kostkou

Fáze hodu kostkou reprezentovaná fc´ı P1RollHandler() nebo P2RollHandler(), v pˇr´ıpadˇe, ˇze ji pˇredcházel poˇcáteˇcn´ı stav, pˇrej´ımá hodnotu na kostkách vygenerovanou v poˇcáteˇcn´ım stavu nebo sama vygeneruje nové hodnoty. Postará se prostˇrednictv´ım funkc´ı SetDiceValue() a GetDiceLook() o zobrazen´ı správn´ ych hodnot. Následnˇe zavolá funkci FindPossPlMoves() (v pˇr´ıpadˇe ˇze táhne hráˇc) nebo funkci FindPossPcMoves(), která vyhledá na základˇe pravidel a aktuáln´ım stavu hry vˇsechny pˇr´ıpustné tahy pro hodnotu prvn´ı hrac´ı kostky. Poté se zmˇen´ı stav hry na fázi tah hráˇce a ˇceká se na hráˇc˚ uv vstup, v pˇr´ıpadˇe, ˇze je na tahu hráˇc. Nebo se po krátkém intervalu samovolnˇe pˇrejde do fáze tahu hráˇce poˇc´ıtaˇce, aby to stihl hráˇc postˇrehnout. Neexistuje-li ˇzádn´ y korektn´ı tah pro prvn´ı hodnotu, opakuje se zm´ınˇen´ y postup pro hodnotu na druhé kostce a v pˇr´ıpadˇe nalezen´ı alespoˇ n jednoho tahu se pˇrejde do stavu fáze tahu pˇr´ısluˇsného hráˇce s informac´ı, ˇze prvn´ı tah bude realizován pomoc´ı druhé hodnoty. Pokud se ani pro druhou hodnotu nenajde pˇr´ıpustn´ y tah, zmˇen´ı se stav hry na fázi hodu kostkou protihráˇce.

4.4.3

F´ aze tahu hr´ aˇ ce

V této fázi se obsluha pro hráˇce a poˇc´ıtaˇc natolik liˇs´ı, ˇze je pop´ıˇs´ı v samostatn´ ych podkapitolách.

20

F´ aze tahu hr´ aˇ ce uˇ zivatele Obsluhu této fáze zajiˇst’uje funkce P1MoveHandler(), které se pˇredá parametr obsahuj´ıc´ı souˇradnice bodu, do kterého hráˇc kliknul lev´ ym tlaˇc´ıtkem myˇsi. Toto je d˚ uleˇzité pro dalˇs´ı fázi obsluhy. Kliknul-li hráˇc na jinam neˇz na kl´ın, ze kterého je moˇzné táhnout, je na to upozornˇen zprávou v horn´ı ˇcásti okna, která po dvou vteˇrinách zmiz´ı. Kliknul-li na kl´ın, ze kterého je moˇzn´ y tah, tento se provede a dojde k pˇrekreslen´ı scény a vyhodnot´ı se dalˇs´ı moˇzn´ y tah pro druhou kostku. Pokud takov´ y tah neexistuje, pˇrejde se do fáze hodu kostkou protihráˇce. F´ aze tahu hr´ aˇ ce poˇ c´ıtaˇ ce Obsluhu této fáze zajiˇst’uje funkce P2MoveHandler(). V této fázi je známa hodnota kostky, pro kterou existuje alespoˇ n jeden pˇr´ıpustn´ y tah. A proto prvn´ı vˇec, která se provede, je vygenerován´ı stav˚ u hry po vˇsech moˇzn´ ych taz´ıch, o co se stará funkce CreateNodes(). Tyto stavy jsou uloˇzeny do vektoru a v vzápˇet´ı budou tvoˇrit koˇrenové uzly vygenerovan´ ych prohledávac´ıch strom˚ u, pˇri hledán´ı nejlépe ohodnoceného tahu. Dále následuje jiˇz samotné volán´ı funkce ExpectMiniMax() (viz 3.3.4) postupnˇe pro vˇsechny vygenerované uzly. Funkce ExpectMiniMax() po pr˚ uchodu prohledávac´ım stromem do definované hloubky vrac´ı ohodnocen´ı pˇredaného uzlu, z nˇehoˇz vybere maximum. V poli, ve kterém je uloˇzen stav hry po nejlépe ohodnoceném tahu je uloˇzena i informace nutn´ a pro rekonstrukci tahu (viz 4.3). Následuj´ıc´ım krokem, jak jsem jiˇz pˇredeslal, je rekonstrukce nejlépe hodnoceného tahu. Realizuj´ı se tahy pro jednotlivé hodnoty na hrac´ıch kostkách a to s nutnou prodlevou, aby bylo hráˇci uˇzivateli zˇrejmé, jak poˇc´ıtaˇc táhnul. Realizace algoritmu ExpectMiniMax() Algoritmus ExpectMiniMax je realizován podle pokyn˚ u uveden´ ych v teoretické ˇcásti této dokumentace (viz 3.3.4). Funkce zisku zastoupená ve zdrojovém kódu funkc´ı Eval() je implementována dle vzoru uvedeného na webov´ ych stránkách (viz [5]). Je zaloˇzena na ohodnocen´ı stavu hry po ukonˇcen´ı tahu, s t´ım, ˇze ohodnocen´ı jednoho uzlu (stavu hry) spoˇc´ıvá v souˇctu vˇsech ohodnocen´ı jednotliv´ ych kl´ın˚ u, na kter´ ych se nacház´ı nˇejak´ y kámen. Ohodnocen´ı je závislé na poˇctu kamen˚ u se na daném kl´ınu a také na tom zda pˇri tahu doˇslo k “vyhozen´ı” protihráˇcova kamene. K ohodnocen´ı d´ılˇc´ıch kl´ınu jsou pouˇzity konstanty uvedené v souboru weight.h.

21

Kapitola 5

Z´ avˇ er Po nastudován´ı a pˇredevˇs´ım pochopen´ı teorie ˇreˇsen´ı u ´loh s neurˇcitost´ı pomoc´ı algoritmu ExpectMiniMax jsem si jako demonstraˇcn´ı ˇreˇsen´ı vybral implementaci hry Vrhcáby. Hru se mi podaˇrilo naimplementovat do stavu, ve kterém je plnˇe hratelná. Bohuˇzel z nedostatku ˇcasu, kter´ y jsem musel rozdˇelit mezi v´ıce projekt˚ u ˇreˇsen´ ych prakticky paralelnˇe, jsem nestihl naprogramovat nˇekterá rozˇs´ıˇren´ı, ˇci vylepˇsen´ı, která mˇe napadala bˇehem ˇcasu, kter´ y jsem tvorbou této práce strávil. Rozˇs´ıˇren´ı se t´ ykaj´ı prakticky vˇsech základn´ıch ˇcást´ı aplikace. Napˇr. v ˇcásti GUI by moˇzn´ ym rozˇs´ıˇren´ım mohla b´ yt volba vzhledu hrac´ı desky, ˇci hrac´ıch kamen˚ u. Nebo zv´ yraznˇen´ı kamene, kter´ ym se právˇe táhne. V ˇcásti hern´ıho jádra by to mohlo b´ yt rozˇs´ıˇren´ı t´ ykaj´ıc´ı se hodnot´ıc´ı funkce, ˇci moˇznost zvyˇsován´ı hodnoty hry pomoc´ı sázec´ı kostky, s ˇc´ımˇz je spojena moˇznost hrát sérii her a uchovávat v´ ysledky pro r˚ uzné hráˇce. Zaj´ımav´ ym vylepˇsen´ım by mohla b´ yt i implementace moˇznosti kroku zpˇet ˇci ukládán´ı rozehrané partie. I pˇresto, ˇze spousta moˇznost´ı jak rozˇs´ıˇrit hru z˚ ustala jen na pap´ıˇre, mi tento projekt mnohé dal. Pro vytvoˇreni vzhledu jednotliv´ ych objekt˚ u jsem se napˇr. nauˇcil základy Photoshopu. Z´ıskal jsem nové zkuˇsenosti s pouˇzit´ım typografického nástroje LATEX, ve kterém je vysázena tato dokumentace. Samotné ˇreˇsen´ı problému implementovat hru s umˇelou inteligenc´ı, nav´ıc s prvkem náhody, mˇe v mnohém obohatilo. Nemal´ y v´ yznam také dáv´ am z´ıskan´ı nov´ ych zkuˇsenost´ı pˇri plánován´ı ˇcasu pro soubˇeˇzné ˇreˇsen´ı v´ıce projekt˚ u. Hra Vrhcáby je po hˇre Piˇskvorky, kterou jsem implementoval jeˇstˇe jako student stˇredn´ı ˇskoly, teprve druhou hrou, kterou se mi podaˇrilo naprogramovat. Proto bych rád v budoucnu navázal na z´ıskané zkuˇsenosti v oblasti umˇelé inteligence a pokusil se naimplementovat nˇejakou z dalˇs´ıch zaj´ımav´ ych her.

22

Literatura [1] F. V. Zboˇril a F. Zboˇril. Základy umˇelé inteligence [studijn´ı opora], v.3 2006 [citováno 2007]. Publikace pˇr´ıstupná pouze osobám pˇrihláˇsen´ ym do predmˇetu IZU, pˇr´ıstupné z https://www.fit.vutbr.cz/study/courses/IZU/. [2] V. Maˇr´ık a kol. Umˇel´ a inteligence 1. Academia, Praha, 1993. ISBN:80-200-0496-3. ˇ ˇ [3] Z. Kotek a kol. Metody rozpozn´ av´ an´ı a umˇel´ a inteligence. CSVTS FE VSSE, Plzeˇ n, 1983. Citováno dle [2]. [4] M. Minsky. Computation: Finite and Infinite Machines. Prentice-Hall, 1967. Citováno dle [2]. [5] WWW stránky. Benchmark player ’pubeval.c’. http://www.bkgm.com/archive.html. kategorie ’Source Code’. [6] WWW str´ anky. Vrhc´ aby. http://cs.wikipedia.org/wiki/Vrhc%C3%A1by.

23

Pˇ r´ıloha A Pravidla hry Vrhc´ aby [6] Tahy Na zaˇcátku hry hod´ı kaˇzd´ y hráˇc jednou kostkou a ten hráˇc, kter´ y hodil vˇetˇs´ı ˇc´ıslo (pˇri stejn´ ych hodnotách se ház´ı znovu), zaˇc´ıná hru t´ım, ˇze odehraje obˇe hozená ˇc´ısla. V dalˇs´ıch kolech jiˇz ház´ı kaˇzd´ y hráˇc obˇema kostkami sám. Hod se bere jako dvˇe oddˇelená ˇc´ısla, urˇcuj´ıc´ı poˇcet pol´ı, o které sm´ı hráˇc postoupit zvolen´ ymi kameny. Hráˇc m˚ uˇze postoupit jedn´ım kamenem o souˇcet obou ˇc´ısel, ale pouze tak, ˇze nejprve posune kámen o hodnotu jedné kostky (coˇz mus´ı b´ yt sám o sobˇe platn´ y tah, tzn. kámen nesm´ı skonˇcit na poli obsazeném v´ıce neˇz jedn´ım soupeˇrov´ ym kamenem), teprve poté o hodnotu druhé kostky. Pokud na obou kostkách padne stejné ˇc´ıslo, bere se dvojnásobnˇe, tzn. jako by padlo na ˇctyˇrech kostkách. Tyto ˇctyˇri hodnoty hráˇc m˚ uˇze rozdˇelit na posun ˇctyˇr r˚ uzn´ ych kamen˚ u, na posun jednoho kamene o ˇctyˇrnásobek hozené hodnoty (ovˇsem opˇet ve ˇctyˇrech nezávisl´ ych kroc´ıch!), nebo libovolnou kombinaci tˇechto moˇznost´ı. Hráˇc se nesm´ı vzdát svého tahu, tˇrebaˇze je pro nˇej nev´ yhodn´ y. Pokud existuje nˇejak´ y tah splˇ nuj´ıc´ı pravidla, mus´ı hráˇc táhnout. Pokud hráˇc m˚ uˇze legálnˇe hrát pouze ˇcást tahu (napˇr. pouze hodnotu jedné kostky), mus´ı odehrát co nejvˇetˇs´ı ˇcást tahu splˇ nuj´ıc´ı pravidla. Pokud hráˇc m˚ uˇze odehrát libovolnou hodnotu z obou kostek, ale nem˚ uˇze hrát obˇe, mus´ı hrát tu vyˇsˇs´ı. Vyhazov´ an´ı a vracen´ı do hry Jak uˇz bylo zm´ınˇeno, pokud kámen skonˇc´ı tah (nebo jeho ˇcást danou posunem o hodnotu na jedné kostce) na poli, obsazeném jedn´ım soupeˇrov´ ym kamenem, tento kámen vyhod´ı, tzn. pˇrem´ıst´ı na bar (také zvan´ y pˇrepáˇzka ˇci závora), coˇz je vyv´ yˇsené m´ısto uprostˇred desky. Bar se chápe jako pole um´ıstˇené pˇred zaˇcátkem desky, nejvzdálenˇejˇs´ı od c´ıle. Kdyˇz m´ a hráˇc nˇejak´ y kámen (nebo kameny, poˇcet kamen˚ u na baru nen´ı omezen) na baru a chce je dostat zpˇet do hry, provede to pˇresnˇe tak, jako by dan´ y kámen opravdu stál jedno pole pˇred deskou, tzn. napˇr. hodem 1 pˇresune kámen na prvn´ı pole desky (pochopitelnˇe pokud nen´ı obsazeno soupeˇrem). Dokud má hráˇc alespoˇ n jeden kámen na baru, mus´ı tyto kameny dostat do hry pˇred t´ım, neˇz hraje jin´ ym kamenem. Pokud mu hod kostky toto neumoˇzn ˇuje, hod mu propadá a hráˇc nehraje (popˇr. hraje pouze hodnotu na druhé kostce). Pokud je na nˇekterém poli dva nebo v´ıce kamen˚ u, je pole obsazeno a soupeˇr na tomto poli nesm´ı ukonˇcit tah ani jeho ˇcást. Z tohoto d˚ uvodu je zˇrejmé, ˇze ˇsest obsazen´ ych pol´ı v ˇradˇe je pro soupeˇre nepˇrekroˇcitelnou pˇrekáˇzkou (této formaci se ˇr´ıká prima). Pokud se nav´ıc podaˇr´ı hráˇci obsadit vˇsech ˇsest pol´ı ve své domác´ı ohradˇe (tzn. v tom kvadrantu desky, ze kterého vyvád´ı kameny, coˇz je souˇcasnˇe kvadrant, do kterého soupeˇr nasazuje kameny vracej´ıc´ı se z baru) v dobˇe, kdy má soupeˇr nˇejak´ y kámen na baru, soupeˇrovi se nem˚ uˇze 24

podaˇrit vrátit tento kámen do hry, takˇze nem˚ uˇze hrát a dokud tato situace trvá (dokud nen´ı prima rozpuˇstˇena), ani neház´ı kostkami. Vyv´ adˇ en´ı kamen˚ u Ve chv´ıli, kdy jsou vˇsechny kameny hráˇce um´ıstˇeny v jeho domác´ı ohradˇe (na posledn´ıch ˇsesti pol´ıch desky), m˚ uˇze hráˇc vyvádˇet kameny mimo desku. To provád´ı tak, ˇze kameny jakoby táhne na fiktivn´ı pole tˇesnˇe za deskou, tzn. pokud na kostce padlo napˇr. ˇc´ıslo ˇctyˇri, odstran´ı hráˇc jeden kámen ze ˇctvrtého pole. Pokud hráˇci padne ˇc´ıslo vyˇsˇs´ı, neˇz je jeho nejvzdálenˇejˇs´ı kámen, odstran´ı jeden z kamen˚ u na nejvzdálenˇejˇs´ım poli. (Tato pouˇcka se net´ yká situace, kdy na daném poli sice neleˇz´ı ˇzádn´ y kámen, ale nˇejak´ y kámen je jeˇstˇe za dan´ ym polem. Tehdy mus´ı hráˇc provést bˇeˇzn´ y tah kamenem po desce.) Pokud se v pr˚ ubˇehu této koncovky stane, ˇze se nˇekter´ y z kamen˚ u dostane mimo domác´ı ohradu (soupeˇr ho vyhozen´ım poˇsle na bar), hráˇc nem˚ uˇze pokraˇcovat ve vyvádˇen´ı kamen˚ u do té doby, neˇz jsou opˇet vˇsechny jeho zbylé kameny v domác´ı ohradˇe. Hra konˇc´ı ve chv´ıli, kdy jeden z hráˇc˚ u vyvede z desky posledn´ı kámen, ˇc´ımˇz se st´ av´ a v´ıtˇezem. Hru je samozˇrejmˇe také moˇzné ukonˇcit v jej´ım pr˚ ubˇehu (pˇred hodem hráˇce) t´ım, ˇze hráˇc nab´ıdne soupeˇri svou rezignaci, kterou soupeˇr m˚ uˇze a nemus´ı pˇrijmout.

25

Pˇ r´ıloha B Adres´ aˇ rov´ a struktura na pˇ riloˇ zen´ em CD - bakalarskaPrace - doc - dokumentace bakaláˇrské práce - cls - sablona fitthesis.cls a obrázky v n´ı pouˇzité - fig - obrázky pro dokumentaci - graphics - obrázkeky vˇsech objektu na hrac´ı ploˇse - include - hlaviˇckové soubory - src - zdrojové soubory

Postup pˇ ri pˇ rekldau programu Program je pˇreloˇziteln´ y jak v OS Linux, tak v OS Windows XP, napˇr. za pouˇzit´ı systému MSYS v kombinaci s pˇrekladaˇcem MinGW. Jedin´ y poˇzadavek na systém je nainstalovan´ y GUI toolkit WxWidgets GTK verze 2.8.0 nebo v´ yˇsˇs´ı. Pˇreklad se spust´ı z pˇr´ıkazové ˇrádky pˇr´ıkazem make. Vznikne spustiteln´ y soubor backgammon (Linux) nebo backgammon.exe (Windows XP).

Struˇ cn´ y n´ avod k pouˇ zit´ı Pˇred spuˇstˇen´ım hry, doporuˇcuji prostudovat pravidla hry Vrhcáby, která jsou obsahem pˇr´ılohy A. Po spuˇstˇen´ı aplikace zaˇcnˇete hru kliknut´ım lev´ ym tlaˇc´ıtkem myˇsi do hrac´ı plochy. Pˇri hˇre jsou uˇzivateli vypisovány základn´ı zprváy, které mu rad´ı co v dané situaci dˇelat. Hru je moˇzné myˇs´ı, ovládán´ı je zcela intuitivn´ı. Pro hod kostkou kliknˇete na kostky, poku jste na tahu objev´ı se na nich hodnota se kterou m˚ uˇzete táhnout. Pro pˇresun kamene kliknˇete na kámen, kter´ ym chcete táhnout. Korektnost tahu je automaticky kontrolována. Pro pˇresun se pouˇzije vˇzdy prvn´ı kostka s hodnotou, pro kterou existuje korektn´ı tah.

26

FAKULTA INFORMAČNÍCH TECHNOLOGIÍ

Recommend Documents