Evoluční algoritmy I - poznámky

Evoluˇcn´ı algoritmy I - poznámky Martin Vˇsetiˇcka

Knihy • Goldberg: Generic algorithms, ’89 • John Holland - Adaptation in natural and artifical algorithms, ’75 a ’91. Holland poloˇzil základy genetick´ ym algoritm˚ um, napsal na evoluˇcn´ı algoritmy disertaci. • Mellanie Mitchell: Introduction to Genetic algorithms ’95 - obsahuje vˇse, co bude na pˇrednáˇskách. • Michalewicz: Genetic algorithms + Data structures = Evolutionary Programs, 3ed

´ Uvod Evoluˇcn´ı algoritmy jsou algoritmy, které se inspiruj´ı pˇr´ırodou a aplikuj´ı jej´ı mechanismy (selekce, kˇr´ıˇzen´ı a mutace) na hledán´ı (alespoˇ n suboptimáln´ıho) ˇreˇsen´ı r˚ uzn´ ych problém˚ u. Nejˇcastˇeji jde o problémy optimalizaˇcn´ıho charakteru. Nejsou to vˇsak pravé optimalizaˇcn´ı algoritmy, je lepˇs´ı se na nˇe d´ıvat opravdu jako na pouhou simulaci pˇr´ırody, která jako vedlejˇs´ı produkt ˇreˇs´ı nˇejakou optimalizaˇcn´ı u ´lohu. Pˇ r´ıklady pouˇ zit´ı evoluˇ cn´ıch algoritm˚ u Hledán´ı Hamiltonovské kruˇznice

1

D˚ uleˇzit´ ym abstraktn´ım pohledem na obecné ˇreˇsen´ı problém˚ u je d´ıvat se na hledán´ı ˇreˇsen´ı jako na prohlédáván´ı prostoru potenciáln´ıch ˇreˇsen´ı. Tento pohled na ˇreˇsen´ı problém˚ u se v evoluˇcn´ıch algoritmech objevuje velmi ˇcasto.

1.1

Ok´ enko do historie

Zakladatelem genetiky se stal Gregor Mendel, brnˇensk´ y mnich, kter´ y se zab´ yval kˇr´ıˇzen´ım hrachu a d˚ usledky, které to pˇrenáˇs´ı na potomstvo. Neznal vˇsak podstatu genetiky, pouze si vˇsiml jisté zákonitosti. Charles Darvin byl britsk´ y pˇr´ırodovˇedec a zakladatel evoluˇcn´ı biologie. Dostal grant od královny na cestu kolem svˇeta, na Galapágách si vˇsiml, ˇze zde ˇzij´ı zv´ıˇrec´ı druhy, které se adaptovali ve svém ˇzivotn´ım prostˇred´ı. Sepsal knihu ”O p˚ uvodu druh˚ u”, ve které evoluˇcn´ı teorii opˇrel o proces, kter´ y nazval jako ”pˇr´ırodn´ı v´ ybˇer”. 1.1.1

Jean-Baptiste Lamarck

Vˇedec, kter´ y se pˇrel s Darwinem o tom, kdy se m˚ uˇze mˇenit genetická informace jednotlivce. Tvrdil, ˇze to m˚ uˇze b´ yt po celou dobu ˇzivota jednotlivce. Pˇ r´ıklad Pokud rachitick´ y ˇclovˇek bude m´ıt d´ıtˇe s dˇevˇcetem, tak bude také rachitické, pokud se ale rachitick´ y ˇclovˇek vypracuje ve svalovce, tak d´ıtˇe bude také svalovec. 1.1.2

John Holland

Holland prisel s myslenkou, ze si vezme to podstatne s genetiky. Inspiroval se konceptem evoluce od Charlese Darwina a od Mendelovy genetiky.

2

No free lunch theorem

The no free lunch theorem for search and optimization (Wolpert and Macready 1997) applies to finite spaces and algorithms that do not resample points. All 2

algorithms that search for an extremum of a cost function perform exactly the same when averaged over all possible cost functions. So, for any search/optimization algorithm, any elevated performance over one class of problems is exactly paid for in performance over another class.

3

Genetick´ e algoritmy

Jsou zaloˇzené na pozorován´ı pˇr´ırody. Vezmˇeme si napˇr´ıklad král´ıky a liˇsky. ˇ ım je tedy král´ık rychlejˇs´ı, Pomal´ı král´ıc´ı nepˇreˇzij´ı, protoˇze je liˇska dohon´ı. C´ t´ım má vˇetˇs´ı ˇsanci, ˇze pˇreˇzije a t´ım pádem, ˇze se i rozmnoˇz´ı. Populace král´ık˚ u, která pˇreˇzije má ˇsanci se rozmnoˇzit. Mnoˇz´ı se pomal´ı král´ıci s rychl´ ymi, rychl´ı s rychl´ımi, pomal´ı s pomal´ ymi apod. Pˇr´ıroda nav´ıc ˇcas od ˇcasu zasáhne a v genetickém materiálu se objev´ı mutace. Podstatné je, ˇze ve v´ ysledku bude následuj´ıc´ı generace v pr˚ umˇeru rychlejˇs´ı neˇz minulá. U liˇsek prob´ıhá to samé (jinak by jiˇz ˇza´dného král´ıka nedohonily). Genetické algoritmy vyuˇz´ıváj´ı princip nast´ınˇen´ y v´ yˇse k ˇreˇsen´ı r˚ uzn´ ych problém˚ u. Evoluˇcn´ı proces urˇcité populace jedinc˚ u (ˇreˇsen´ı problému) prohledává prostor ˇreˇsen´ı a pˇritom mus´ı udrˇzet v rovnováze dva navzájem konfliktn´ı c´ıle: prohledat co nejˇsirˇs´ı prostor a zároveˇ n vyuˇz´ıt souˇcasné nejlepˇs´ı ˇreˇsen´ı k budouc´ımu zlepˇsen´ı. Pomoc´ı genetick´ ych algoritm˚ u se ˇreˇs´ı spousta praktick´ ych u ´loh, napˇr´ıklad u ´loha obchodn´ıho cestuj´ıc´ıho (TSP), optimalizace databázov´ ych dotaz˚ u, . . .

3.1

Pojmy

• Jedinec (nebo také ˇretˇezec nebo chromozom) je jedno ˇreˇsen´ı problému (odpov´ıdá jednomu králikovi z pˇr´ıbˇehu v´ yˇse :-)). V genetickém algoritmu se jedná o pole bit˚ u. • Geny jsou jednotky, ze kter´ ych je sloˇzen chromozom. Gen reprezentuje nˇejakou vlastnost objektu, napˇr´ıklad rychlost král´ıka, IQ král´ıka apod. U genetického algoritmu odpov´ıdá gen jednomu bitu pole. • Allela je konkrétn´ı hodnota genu. U genetického algoritmu je to 1 nebo 0. 3

• Genotyp je vektor gen˚ u 1 jednotlivce (v´ıc informac´ı). • Fenotyp je konkrétn´ı instance genotypu. • Selekce TODO • Kˇr´ıˇzen´ı TODO • Mutace TODO • M´ıra mutace TODO • Fitness funkce (také u ´ˇcelová funkce) je funkce, která pro daného jedince vrac´ı reálné ˇc´ıslo, které udává, jak moc je jedinec dobr´ y. Z pohledu pˇr´ırody jde tedy o ˇc´ıslo, které udává, jak moc je dan´ y jedinec v prostˇred´ı adaptovan´ y. Podle fitness funkce se typicky ˇr´ıd´ı selekce (napˇr. vyberu nejlepˇs´ıch n jedinc˚ u do dalˇs´ı generace). • Explorace je prohledáván´ı prostoru ˇreˇsen´ı. • Exploatace je vyuˇzit´ı slibn´ ych oblast´ı. prostoru ˇreˇsen´ı ke zleˇsen´ı. • Hillclimbing je pˇr´ıkladem exploatace. Jde o iterativn´ı strategii pro prohledáván´ı prostoru ˇreˇsen´ı vyuˇz´ıvaj´ıc´ı nejlepˇs´ı souˇcasné ˇreˇsen´ı, aby naˇsla v okol´ı tohoto ˇreˇsen´ı ˇreˇsen´ı jeˇstˇe lepˇs´ı. Tato strategie konˇc´ı v lokáln´ım nebo globáln´ım maximu prostoru ˇreˇsen´ı. Protoˇze jeden hillclimber by ve velkém prostoru ˇreˇsen´ı skonˇcil s velkou pravdˇepodobnost´ı v lokáln´ım maximu, tak se ”vysad´ı”do prostoru ˇreˇsen´ı mnoho hillclimber˚ u, ˇc´ımˇz se zv´ yˇs´ı pravdˇepodobnost, ˇze nalezneme globáln´ı maximum.

3.2

Genetick´ y algoritmus

Klasické genetické algoritmy pouˇz´ıvaj´ı k reprezentaci jedinc˚ u binárn´ı ˇretˇezce pevné délky. • (Binárn´ı) mutace je pak jednoduchá zmˇena jednoho ˇci v´ıce bit˚ u na opaˇcn´ y. Pˇresnˇeji máme danou nˇejakou pravdˇepodobnost (typicky malé ˇc´ıslo v ˇra´du procent) s jakou se má zmˇenit bit na opaˇcn´ y, generujeme tedy pro kaˇzd´ y bit náhodné ˇc´ıslo z intervalu [0,1] a pokud je menˇs´ı neˇz stanová pravdˇepodobnost, pak zmˇenu provedeme. Toto opakujeme pro vˇsechny bity. 4

• (Binárn´ı) kˇr´ıˇzen´ı probˇehne tak, ˇze vezmeme dva jedince (dvˇe pole), rozdˇel´ıme je ve stejn´ ych m´ıstech a prohod´ıme ocásky, ˇc´ımˇz vzniknou dva potomci.

3.3

Obecn´ y genetick´ y (i evoluˇ cn´ı) algoritmus procedure Evolution_program begin t <- 0 5

initialize P(t) evaluate P(t) while (not termination-condition) do begin t <- t + 1 select P(t) from P(t-1) alter P(t) evaluate P(t) end end

3.4

Jednoduch´ y genetick´ y algoritmus

- Osnova algoritmu: - Prohledavaci metaheuristika - Generacni princip - Zakodovany problem | | v - Geneticke operatory - Reseni - Parametry si zakodujeme do binarniho retezce. [ | | | | ] - Ilustrace na problemu batohu: - v_1, ..., v_n (veci davane do batohu), kapacita batohu C [0|0|1|0|1]

<- dame do batohu v_3 a v_5

6

- Musime si udelat ohodnoceni, hantyrkou fitness funkce f: \sum v_i

(pokud nepresahnu C)

f(j) ~> - oo

(staci i nula) (pokud presahnu sumou C)

Pozn: Fitness funkci se take rika ucelova funkce. Pozn #2: Fitness funkce se obecne spocita velmi jednoduse, pouze projde zakodovany retezec.

- P_0 ... nahodne K jedincu - P_i -> P_{i+1} - ohodnot P_i - pokud uz je nejaky jedinec dost dobry, tak skonci - jinak: - selekce - vybira ze stare populace jedince - vetsinou jednoduse tak, ze vybereme dva jedince a - roulette wheel selection: \sum_{i \in P} f_i = 1

Kazdou fitness dokazu preskalovat, tak aby jeji hodnoty byly v interval Pak f(i) odpovida pravdepodobnosti vyberu i. - krizeni - vybereme jedince x z populace P_i y P_i pak krizime jedince x, y a dostavame x’ a y’. [oooooooooo] [----------] nekde udelam caru | 7

[----ooooo] - mutace - vezmeme jedince a koukam na jednotlive bity zakodovani a s nejakou pravdepodobnosti u kazdeho bitu zmenim hodnotu na opacnou. - vloz x’, y’ do P_{i+1} Pozn. pravdepodobnost krizeni je typicky velka: 0.5, 0.6 pst. mutace je vetsinou mala: setina, tisicina, ... Inicializace b´ yvá náhodn´ y v´ ybˇer jedinc˚ u, pˇr´ıpadnˇe se mohou k inicializaci pouˇz´ıt ˇreˇsen´ı, které z´ıskáme z nˇejaké heuristiky pro dan´ y problém.

Proˇ c funguj´ı genetick´ e algoritmy TODO page 57 (Michalewitz)

Genetick´ e vs. evoluˇ cn´ı algoritmy Genetické algoritmy jsou podtˇr´ıdou evoluˇcn´ıch algoritm˚ u, jelikoˇz evoluˇcn´ı algoritmy nemus´ı pouˇz´ıvat binárn´ı reprezentaci jedinc˚ u a operátory pro mutaci a kˇr´ıˇzen´ı mohou b´ yt také jiné.

3.5

Teorie sch´ emat

Def: Schéma je slovo v abecedˇe {0, 1, ∗}, které reprezentuje mnoˇzinu (binárn´ıch) ˇretˇezc˚ u1 . Znak * je zástupn´ y za hodnotu 1 nebo 0. Pˇ r´ıklad: Schéma ∗ ∗ ∗ ∗ ∗ reprezentuje 25 ˇretˇezc˚ u (jedinc˚ u). Reprezentuje napˇr´ıklad jedince 10101.

E E

Pozorov´ an´ı: Existuje 3m schémat délky m. ˇ ezec délky m je reprezentován 2m schématy. Pozorov´ an´ı: Retˇ

1

ˇretˇezec = jedinec

8

D˚ ukaz. Pro kaˇzd´ y bit ˇretˇezce vyberu bud’ jeho hodnotu nebo pouˇziju hvˇezdiˇcku, tedy mám dvˇe volby na jeden bit, z toho plyne 2m schémat.

E

Pozorov´ an´ı: V populaci velikosti n je 2m aˇz n · 2m schémat, kde m znaˇc´ı délku ˇretˇezc˚ u.

D˚ ukaz. Jednomu ˇretˇezci odpov´ıdá 2m schémat. Horn´ı odhad na poˇcet schémat pro n ˇretˇezc˚ u je n · 2m . ˇ ad schématu S, znaˇc´ıme o(S), je poˇcet nul a jedniˇcek v zápisu schémata2 . Def: R´ Def: Definuj´ıc´ı délka schématu S, znaˇc´ıme d(S), vzdálenost mezi prvn´ı a posledn´ı pevnou pozic´ı3 . Pˇ r´ıklad: d(1**10*) = 4 Def: Fitness schématu S, znaˇc´ıme F (S), je pr˚ umˇerná fitness vˇsech ˇretˇezc˚ u v populaci. Vˇ eta: Krátká4 nadpr˚ umˇerná5 s mal´ ym ˇra´dem schémata se v populaci bˇehem bˇehu genetického algoritmu exponenciálnˇe mnoˇz´ı6 . Pozn´ amka: L´ıb´ı se nám napr˚ umˇen´ı jedinci, protoˇze jsou to kandidáti na dobré ˇreˇsen´ı. Mal´ y ˇra´d nám vyhovuje proto, ˇze neomezuje ˇreˇsen´ı. Malá délka je vhodná proto, aby kompaktn´ı bloky z˚ ustaly zachovány. A vˇeta ˇr´ıká, ˇze tac´ı jedinci se mnoˇz´ı exponenciálnˇe. D˚ ukaz. Oznaˇcme si populace v jednotliv´ ych generac´ıch P (t), P (t + 1), . . . . Promˇenná n oznaˇcuje poˇcet jedinc˚ u ve vˇsech generac´ıch a m oznaˇcuje délku kaˇzdého jedince. D˚ ukaz je zaloˇzen na rozebrán´ı, co se dˇeje s konkrétn´ım schématem S pˇri: • selekci, • kˇr´ıˇzen´ı a • mutaci. 2

Jednoduˇse nepoˇc´ıt´ ame hvˇezdiˇcky Pevn´ a pozice znaˇc´ı 0 nebo 1. 4 Ve smyslu definuj´ıc´ı délky. 5 Maj´ıc´ı fitness vˇetˇs´ı neˇz pr˚ umˇernou. 6 Bez pˇr´ıkras: Kr´ atk´ a schémata, která maj´ı nadpr˚ umˇernou hodnotu fitness funkce a maj´ı mal´ y ˇr´ ad, se v populaci bˇehem práce Genetického algoritmu exponenciálnˇe mnoˇz´ı. 3

9

Oznaˇcme si C(S, t) ˇcetnost schématu S v populaci P (t), tedy poˇcet ˇretˇezc˚ u v populaci, které vyhovuj´ı schématu S. D˚ ukaz je zaloˇzen na postupném odhadován´ı hodnoty C(S, t + 1), tedy sledujeme, jak se zmˇen´ı hodnota v dalˇs´ı generaci. • Selekce ˇ ezec v má pravdˇepodobnost vybrán´ı: Retˇ pS (v) = F (v)/F (t)

(1)

P kde F (t) = Fu∈P (t) (u). Hodnota pS (v) je jednoduˇse pomˇer fitness jedince v a souˇctu vˇsech fitness. Tento pomˇer7 je pravdˇepodobnost´ı v´ ybˇeru jedince jednoduˇse proto, ˇze pˇresnˇe takto funguje ruletová selekce. Sch´ ema S má pravdˇepodobnost vybrán´ı: pS (S) = F (S)/F (t)

(2)

Selekce jedince prob´ıhá n-krát8 . Pˇri kaˇzdém v´ ybˇeru mám pro dané schéma S fixn´ı pravdˇepodobnost pS (S), ˇze jej vyberu. Pravdˇepodobnost vynásob´ım ˇcetnost´ı schématu S v souˇcasné populaci a dostanu ˇcetnost schématu S v následuj´ıc´ı populaci. Ve tvaru rovnice tedy: C(S, t + 1) = C(S, t) · n · pS (S)

(3)

Rovnice ˇr´ıká kolikanásobnˇe se zvˇetˇs´ı ˇcetnost schématu S. Rovnici m˚ uˇzeme pˇrepsat takto: C(S, t + 1) = C(S, t) ·

Fpr˚umˇerná (t) = 7 8

F (S) Fpr˚umˇerná (t) F (t) n

Hodnota pS (v) je normalizovaná hodnota fitness funkce. Z populace velikosti n mus´ım opˇet vybrat n jedinc˚ u.

10

(4)

(5)

• Kˇr´ıˇzen´ı • Mutace

4

Evoluˇ cn´ı algoritmy

TODO Pro jeden konkrétn´ı problém je ˇcasto moˇzné vymyslet mnoho fitness funkc´ı, mnoho zp˚ usob˚ u kˇr´ıˇzen´ı, selekce ale i mutace. Nicménˇe spoleˇcn´ y základ evoluˇcn´ıch algoritm˚ u spoˇc´ıvá v tom, ˇze v jednom kroku algoritmu provedád´ıme transformace populace a jedinci v evoluˇcn´ım procesu bojuj´ı o pˇreˇzit´ı.

4.1 4.1.1

Selekce Ruleta (Roulette Wheel)

P˚ uvodn´ı Hollandova selekce na populaci velikosti n fungovala takto: • sum = f1 + f2 + · · · + fn je souˇcet hodnot fitness funkce vˇsech jedinc˚ u v populaci. fi • pi = sum má v´ yznam oˇcekávaného poˇctu vybrán´ı jedince do populace. U jedince s pi = 0.5 tedy oˇcekáváme, ˇze ho vybereme v polovinˇe pˇr´ıpad˚ u.

11

Algoritmus: /* Rucicka rulety; nahodne cislo z intervalu [0,1] */ ptr = Rand(); for (sum = i = 0; i < N; i++) for (sum += p(i,t); sum > ptr; ptr++) Select(i); Popis v jgapu: A basic implementation of NaturalSelector that models a roulette wheel. When a Chromosome is added, it gets a number of ”slots”on the wheel equal to its fitness value. When the select method is invoked, the wheel is ”spun”and the Chromosome occupying the spot on which it lands is 12

selected. Then the wheel is spun again and again until the requested number of Chromosomes have been selected. Since Chromosomes with higher fitness values get more slots on the wheel, there’s a higher statistical probability that they’ll be chosen, but it’s not guaranteed. 4.1.2

Turnajov´ a selekce

Dva jedinci a, b jsou náhodnˇe vybráni z populace, kde f itness(a) < f itness(b). Je zvoleno náhodnˇe ˇc´ıslo r ∈ [0, 1]. Pokud r < k, kde k je nˇejaká pˇredem zvolená konstanta z intervalu [0, 1] (napˇr. 0.75), pak je puˇstˇen do nové populace jedinec a, pokud podm´ınka neplat´ı, je puˇstˇeno b. 4.1.3

Selekce nejlepˇ s´ıch

Ze souˇcasné generace vybereme n nejlepˇs´ıch do dalˇs´ı generace. V knihovnˇe jgap se operátor naz´ yvá BestChromosomesSelector. 4.1.4

Elitismus

Elitismus funguje tak, ˇze nˇekteˇr´ı jedinci maj´ı zajiˇstˇeno, ˇze budou puˇstˇeni do dalˇs´ı generace. B´ yvá to urˇcité procento nejlepˇs´ıch jedinc˚ u v populaci (typicky 5% aˇz nˇejak´ ych 15%). Tito jedinci jsou tedy automaticky zkop´ırováni do nové populace. Nejsou tam vˇsak pˇresunuti, jinak by na tˇechto jedinc´ıch nemohly pracovat operátory kˇr´ıˇzen´ı a mutace. Ukázalo se, ˇze elitismus hodnˇe pomáhá zlepˇsovat v´ ykon genetick´ ych algoritm˚ u.

4.2

Vˇ ezˇ novo dilema (The prisoner’s dilemma)

Je jednoduchá hra pro dva hráˇce. Alice a Bob jsou zatˇceni pro spáchán´ı spoleˇcného zloˇcinu a jsou drˇzeni v oddˇelen´ ych celách. Mezi celami nelze nijak komunikovat. Alici je nab´ıdnuta následuj´ıc´ı dohoda: Pokud se pˇrizná a bude svˇedˇcit proti Bobovi, pak dostatne podm´ınˇen´ y trest se zkuˇsebn´ı lh˚ utou a Bob p˚ ujde do vˇezen´ı na 5 let. Nicménˇe pokud v tu samou dobu se Bob pˇrizná 13

a bude souhlasit, ˇze bude svˇedˇcit proti Alici, jej´ı svˇedectv´ı bude zdiskreditováno a oba dostanou 4 roky za své svˇedectv´ı. Alici je ˇreˇceno, ˇze Bob dostal pˇresnˇe tu samou dohodu. Bob a Alice v´ı, ˇze pokud ani jeden z nich nebude svˇedˇcit proti tomu druhému, pak mohou b´ yt obvinˇeni pouze na základˇe ménˇe závaˇzn´ ych obvinˇen´ı a oba dostanou 2 roky vˇezen´ı. Bob/Alice Nesvˇedˇc´ı Svˇedˇc´ı Nesvˇedˇc´ı 2,2 5,0 Svˇedˇc´ı 0,5 4,4 Mˇela by Alice ”zradit”Boba a doufat v podm´ınˇen´ y trest a pˇritom riskovat ˇctyˇrlet´ y ˇzaláˇr pokud zrad´ı i Bob? Nebo by mˇela ”spolupracovat”s Bobem (pˇrestoˇze nemohou komunikovat) a doufat, ˇze bude také spolupracovat a tedy ˇze oba dostanou pouze dva roky vˇezen´ı a pˇritom riskovat, ˇze Bob ji zrad´ı a ona dostane 5 let? V tomto pˇr´ıpadˇe je lepˇs´ı zradit. Pokud by se vˇsak hra hrála iterovanˇe, pak jiˇz mohou nastoupit r˚ uzné strategie. Anatol Rapoport v soutˇeˇzi v roce 1984 vyhrál s algoritmem TIT-FOR-TAT (oplácen´ı). V prvn´ım kroku algoritmus ”spolupracuje”. V dalˇs´ıch kroc´ıch dˇelá to, co udˇelal protivn´ık v minulém kole. Tedy oplac´ı spolupraci nebo oplác´ı zradu.

5

Diferenci´ aln´ı evoluce

ˇ (Optimalizace Hejnem Castic) ˇ PSO (Particle Swarm Optimality) = OHC Turing . . . Von Neumann . . . sebereprodukovaci algoritmus; vymyslel teorii celluarnich automatu; Celulárn´ı automaty Conway’s Game of Life Zivot reprodukci Thomas Ray (biolog) - byl fascinovan tim, ze v pameti to zije...

14

- udelal smrtaka, ktery obcas nejaky program zabil - programy mutovali - bojovalo se o strojovy cas - programy zacaly parazitovat (upravoval cizi program, tak aby kopiroval tohoto parazita) - po nejake se vyvinuli jedinci, kteri se byli schopni parazitismu branit. - system, ktery postupne vyvinul se jmenuje Tierra (alternativa http://en.wikipedia.org/wiki/Avida) Brooks - hierarchicky relativni model Diferencialni evoluce Populace

x_t = (x_1, \dots, x_n) \downarrow |--- vyber kamaradu (vyberu nejlepsiho a 2 kamarady: a,b,c NEBO 3 kamarady(typic \downarrow x_{t+1} \leftarrow for i = 1 \dots n do (x_t)_i [Pokud mam krizit (dle nahodneh

6

Diferenci´ aln´ı evoluce (pokraˇ cov´ an´ı)

6.1

Evoluˇ cn´ı data-mining

Evolutionary data mining Michigan vs Pittsburgsky model - lisi se v tom, co povazuji za jedince v modelu - jedinec je jedno pravidlo (Michigan), resp. jedinec je mnozina pravidel

7

SAT a TSP

Dneˇsn´ım tématem jsou tˇeˇzké kombinatorické u ´lohy.

7.1

SAT

• Na kódován´ı problému se nám vyloˇzenˇe hod´ı binárn´ı kódován´ı, coˇz je kódován´ı, které máme rádi, protoˇze operátory se na nˇem ˇcasto vytváˇrej´ı velmi jednoduˇse - binárn´ı mutace, binárn´ı kˇr´ıˇzen´ı. 15

• U SATu je ovˇsem problém se zvolen´ım fitness funkce. Jak fitness funkci zvolit? M˚ uˇzeme poˇc´ıtat napˇr´ıklad poˇcet splnˇen´ ych klauzul´ı, coˇz je strategie, na kterou lze velmi snadno vymyslet protipˇr´ıklady, kdy EV uv´ızne v lokáln´ım maximu. Na druhou stranu problém je velmi tˇeˇzk´ y a nakonec o mnoho lepˇs´ı fitness funkce nevymysl´ıme. Problém SATu je svou povahou podobn´ y problému batohu. U tohoto problému máme informaci o naplnˇen´ı, pˇresto m˚ uˇze b´ yt nutné batoh vysypat a zaˇc´ıt znovu.

7.2

TSP (´ uloha obchodn´ıho cestuj´ıc´ıho)

Oproti SATu je zde situace obrácená: • fitness - velmi jednoduˇse, nen´ı s n´ı problém • kódován´ı - obt´ıˇzné (nejpˇrirozenˇejˇs´ı je asi kódován´ı pomoc´ı permutac´ı) Pˇ r´ıklad: TSP má mnoho reáln´ ych vyuˇzit´ı, napˇr´ıklad vrtán´ı ploˇsn´ ych spoj˚ u, kde se snaˇz´ıme, co nejv´ıce zkrátit dobu, kterou vrtaˇcka stráv´ı pˇresuny mezi dan´ ymi body. ˇ sen´ı, která jsou suboptimáln´ı, jsou ˇcasto dostateˇcná. U pˇr´ıkladu Pozn´ amka: Reˇ s vrtaˇckami m˚ uˇze b´ yt ˇreˇsen´ı, které je o deset procent horˇs´ı neˇz optimáln´ı ˇ sen´ı, které budu m´ıt za noc hotové je lepˇs´ı stále jeˇstˇe dostateˇcnˇe dobré. Reˇ neˇz ˇreˇsen´ı, které bych z´ıskal aˇz za rok, ale bylo by optimáln´ı. Pozn´ amka: K TSP se vrátil jak´ ysi nˇemeck´ y obchodn´ı cestuj´ıc´ı, kter´ y napsal pˇr´ıruˇcku pro obchodn´ı cestuj´ıc´ı, kde byly popsáno, jak se má obchodn´ı cestuj´ıc´ı chovat a také se zde zmiˇ nuje hledán´ı nejlepˇs´ı trasy. 7.2.1

K´ odov´ an´ı

Mˇesto j je na pozici i ⇔ vede hrana z i → j. 1-2-4-3-8-5-9-6-7 2 4 8 3 9 7 1 5 6

<-- cesta <-- zakodovan´ ı

16

K ˇcemu je to dobré? Souvislost se schématy. Je vˇsak nutno poznamenat, ˇze ne kaˇzd´ y kód je validn´ı. 1. Alternuj´ıc´ı kˇr´ıˇzen´ı [2] 3 [8] 7 [9] 1 [4] 5 [6] 7 [5] 1 [6] 9 [2] 8 [4] 3

<-- vybiram liche <-- vybiram sude

Vznikne: nem˚ uˇ zeme sem d´ at 2 | v 2 5 8 6 9 3 4 1 7 Podtrˇzené ˇc´ıslice jsem musel vybrat náhodnˇe, ale tak, aby nevznikl cyklus. 2. Uniformn´ı kˇr´ıˇzen´ı - to samé, co v kˇr´ıˇzen´ı v´ yˇse, jen beru pol´ıˇcka nad sebou. 3. Alternován´ı podcest • Vyberu náhodnˇe podcestu náhodné délky z jednoho jedince • Vyberu náhodnˇe podcestu náhodné délky z druhého jedince

8

Zdroje • Pˇrednáˇsky • An Introduction to Genetic Algorithms • Genetic Algorithms + Data Structures = Evolution Programs

17

Evoluční algoritmy I - poznámky

Recommend Documents