Stˇredoˇskolsk´a odborn´a ˇcinnost Obor 01 - Matematika a statistika
Metoda Monte Carlo a jej´ı aplikace
Autorka: ˇ Skola:
Studijn´ı obor: Konzultant:
Alena Harlenderov´a Slovansk´e gymn´azium Olomouc, tˇr. Jiˇr´ıho z Podˇebrad 13, Olomouc, 771 10 vˇseobecn´e 8. roˇcn´ık osmilet´eho studia RNDr. Karel Hron, Ph.D. Pˇr´ırodovˇedeck´a fakulta UP Olomouc, Katedra matematick´e anal´ yzy a aplikac´ı matematiky
Olomouc, 2012
ˇ Cestn´ e prohl´ aˇ sen´ı Prohlaˇsuj´ı t´ımto, ˇze jsem soutˇeˇzn´ı pr´aci vypracovala samostatnˇe pod veden´ım pana RNDr. Karla Hrona, Ph.D. a pouˇzila jsem pouze podklady (literaturu, www str´anky atd.) uveden´e v seznamu. Nem´am z´avaˇzn´ y d˚ uvod proti zpˇr´ıstupˇ nov´an´ı t´eto pr´ace v souladu se z´akonem ˇc. 121/2000 Sb., o pr´avu autorsk´em, o pr´avech souvisej´ıc´ıch s pr´avem autorsk´ ym a o zmˇenˇe nˇekter´ ych z´akon˚ u (autorsk´ y z´akon) v platn´em znˇen´ı. V Olomouci dne
Podpis:
Podˇ ekov´ an´ı T´ımto bych chtˇela moc podˇekovat panu doktoru Hronovi, vedouc´ımu t´eto pr´ace, kter´ y mi vˇenoval mnoho ˇcasu a trpˇelivosti, nejen pˇri vypracov´av´an´ı ˇ Uk´azal mi mnoh´a zaj´ımav´a z´akout´ı matematiky, kter´a by t´eto pr´ace SOC. urˇcitˇe st´ala za dalˇs´ı prozkoum´an´ı, a jistˇe mi pomohou pˇri dalˇs´ım studiu. Nejvˇetˇs´ı d´ık mu vˇsak patˇr´ı za to, ˇze spolu s dalˇs´ımi neust´ale utvrzuje mou v´ıru v to, ˇze na svˇetˇe existuj´ı lid´e, kteˇr´ı v´am dok´aˇzou pomoci, a to jeˇstˇe s radost´ı.
Anotace Spolu s pˇrekotn´ ym rozvojem v´ ypoˇcetn´ı techniky se zdokonaluj´ı i stochastick´e numerick´e metody. Mezi nˇe patˇr´ı tak´e metoda naz´ yvan´a Monte Carlo. Tato metoda n´am ˇcasto efektivnˇe pom´ah´a s probl´emy, jejichˇz ˇreˇsen´ı klasick´ ymi ’ analytick´ ymi metodami je bud pˇr´ıliˇs sloˇzit´e nebo dokonce nemoˇzn´e. Pr´ace se nejprve zab´ yv´a nast´ınˇen´ım podstaty metody Monte Carlo. Dalˇs´ı ˇca´st je vˇenov´ana d˚ uleˇzit´ ym pojm˚ um, zejm´ena z teorie pravdˇepodobnosti. Uvedeny jsou z´akladn´ı definice a vztahy, kter´e jsou nutn´e k pochopen´ı problematiky. N´asleduj´ıc´ı kapitola se vˇenuje vyuˇzit´ı metody Monte Carlo pˇri simulaci rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny. Poznatky z t´eto kapitoly byly n´aslednˇe aplikov´any pˇri simulaci rozdˇelen´ı pravdˇepodobnosti testovac´ı statistiky Anderson-Darlingova testu normality n´ahodn´eho v´ ybˇeru. Experiment´aln´ı ˇca´st pr´ace pˇritom ukazuje, za jak´ ych podm´ınek je moˇzn´e s dostateˇcnou pˇresnost´ı a pˇritom co nejrychleji odhadnout rozdˇelen´ı AndersonDarlingova testu, a to uˇz´ıt pˇri pˇribliˇzn´em stanoven´ı p-hodnoty odpov´ıdaj´ıc´ı dan´e realizaci t´eto testovac´ı statistiky.
Kl´ıˇ cov´ a slova Metoda Monte Carlo rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny simulace testov´an´ı statistick´ ych hypot´ez
Anotation With rapid development of the computer technology, also stochastic numerical methods are being improved. One of them is called the Monte Carlo metod. This method helps effectively with problems, where the analytical solutions are either difficult or impossible. At the first this text engages in the essence of the Monte Carlo method. The next section is devoted to the important concepts from the probability theory. Here basic definitions and properties that are necessary to understand the problems connected with the Monte Carlo method are introduced. The third section shows how the Monte Carlo method can be utilized for simulation of the probability distribution of a random variable. Finally, results of this section are applied to simulation of the probability distribution of the Anderson-Darling test of normality of a random sample. In particular, the goal is to find out how to estimate, with sufficient accuracy on one hand and numerical efficiency on the other one, the probability distribution of the Anderson-Darling test and to use it for estimation of p-value corresponding to a given realization of the test statistic. Key words Monte Carlo method probability distribution of a random variable simulation statistical hypotheses testing
5
Obsah ´ Uvod
7
1 Podstata metody Monte Carlo a jej´ı vznik
8
2 Z´ aklady teorie pravdˇ epodobnosti 2.1 Pokusy . . . . . . . . . . . . . . . . . 2.2 N´ahodn´e jevy a pravdˇepodobnost . . 2.3 R˚ uzn´e pravdˇepodobnostn´ı modely . . 2.3.1 Klasick´a pravdˇepodobnost . . 2.3.2 Geometrick´a pravdˇepodobnost
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
9 10 11 12 12 12
3 Podm´ınˇ en´ a pravdˇ epodobnost a nez´ avisl´ e n´ ahodn´ e jevy 15 3.1 Podm´ınˇen´a pravdˇepodobnost . . . . . . . . . . . . . . . . . . . 15 3.2 Nez´avisl´e n´ahodn´e jevy . . . . . . . . . . . . . . . . . . . . . . 16 4 N´ ahodn´ a veliˇ cina 4.1 Rozdˇelen´ı pravdˇepodobnosti . . . . . . . . . . . . . . . . . . . 4.1.1 Spojit´e rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . 4.2 Distribuˇcn´ı funkce n´ahodn´e veliˇciny . . . . . . . . . . . . . . .
18 18 19 20
5 Nˇ ekter´ a konkr´ etn´ı rozdˇ elen´ı pravdˇ epodobnosti spojit´ ych n´ ahodn´ ych veliˇ cin 5.1 Rovnomˇern´e rozdˇelen´ı . . . . . . . . . . . . 5.2 Exponenci´aln´ı rozdˇelen´ı . . . . . . . . . . . 5.3 Norm´aln´ı rozdˇelen´ı . . . . . . . . . . . . . . 5.4 Troj´ uheln´ıkov´e rozdˇelen´ı . . . . . . . . . . .
22 22 22 23 24
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
6 Generov´ an´ı n´ ahodn´ ych ˇ c´ısel 25 6.1 Z´akladn´ı zp˚ usoby generov´an´ı n´ahodn´ ych ˇc´ısel . . . . . . . . . 26 7 Modelov´ an´ı hodnot n´ ahodn´ e veliˇ ciny 27 7.1 Diskr´etn´ı n´ahodn´a veliˇcina . . . . . . . . . . . . . . . . . . . . 27 7.2 Spojit´a n´ahodn´a veliˇcina . . . . . . . . . . . . . . . . . . . . . 27 8 Testov´ an´ı norm´ aln´ıho rozdˇ elen´ı 29 8.1 Anderson-Darling˚ uv test normality . . . . . . . . . . . . . . . 30 8.2 Odhad p-hodnot v Anderson-Darlingovˇe testu . . . . . . . . . 31 Z´ avˇ er
35
6
´ Uvod Aˇckoli lidstvo disponuje mnoˇzstv´ım d˚ uleˇzit´ ych poznatk˚ u, st´ale nen´ı moˇzn´e nebo je pˇr´ıliˇs technicky obt´ıˇzn´e zodpovˇedˇet nˇekter´e d˚ uleˇzit´e ot´azky aplikovan´e matematiky pomoc´ı klasick´ ych analytick´ ych metod. Proto se zaˇcaly pouˇz´ıvat simulaˇcn´ı numerick´e metody, mezi nˇeˇz patˇr´ı i metoda Monte Carlo, kter´e umoˇzn ˇuj´ı obdrˇzet alespoˇ n pˇribliˇzn´e ˇreˇsen´ı. Pokud k tˇemto aspekt˚ um pˇriˇcteme i to, ˇze se v´ ypoˇcetn´ı technika ˇc´ım d´al v´ıce zdokanaluje, zaˇc´ın´a b´ yt jasn´e, proˇc se metoda Monte Carlo stala v´ yznamn´ ym pomocn´ıkem v oblasti nejen matematick´e a fyzik´aln´ı, ale tak´e napˇr. v geografii a medic´ınˇe. Prvn´ım c´ılem t´eto pr´ace je popis samotn´e metody Monte Carlo a pojm˚ u nutn´ ych k jej´ımu pochopen´ı. Proto se zv´ıdav´ y z´ajemce o tuto problematiku nejprve dozv´ı, co to vlastnˇe metoda Monte Carlo je, a n´aslednˇe jsou, ˇcasto i na pˇr´ıkladech, vysvˇetleny z´akladn´ı pojmy z teorie pravdˇepodobnosti, kter´e u ´zce souvis´ı s jiˇz zmiˇ novanou metodou. Mezi nˇe patˇr´ı hlavnˇe n´ahodn´ y pokus, jev, Kolmogorova definice pravdˇepodobnosti a r˚ uzn´e pravdˇepodobnostn´ı modely, podm´ınˇen´a pravdˇepodobnost, nez´avisl´e jevy a n´ahodn´a veliˇcina. Na nˇe navazuje rozdˇelen´ı pravdˇepodobnosti, distribuˇcn´ı funkce a v´ ypoˇcet funkce k n´ı inverzn´ı, nˇekdy naz´ yvan´e jako kvantilov´a funkce. N´aslednˇe se pr´ace zab´ yv´a generov´an´ım pseudon´ahodn´ ych ˇc´ısel a druh´ ym vytyˇcen´ ym c´ılem, vyuˇzit´ım metody Monte Carlo pˇri simulac´ıch rozdˇelen´ı pravdˇepodobnosti n´ahodn´ ych veliˇcin. To je uk´az´ano tak´e na pˇr´ıkladech s konkr´etn´ımi rozdˇelen´ımi. Nakonec pr´ace pojedn´av´a o Anderson-Darlingovˇe testu normality. Dosud se v praxi pracovalo pˇredevˇs´ım s hodnotami testovac´ı statistiky spojen´ ymi s ˇcasto uˇz´ıvan´ ymi hladinami testu. Tato pr´ace si vˇsak klade za c´ıl zjistit, jak s dostateˇcnou pˇresnost´ı a co nejrychleji odhadnout rozdˇelen´ı AndersonDarlingova testu a to uˇz´ıt pˇri pˇribliˇzn´em stanoven´ı p-hodnot odpov´ıdaj´ıc´ıch libovoln´e realizaci t´eto testovac´ı statistiky. A ted’ s chut´ı do toho.
7
1
Podstata metody Monte Carlo a jej´ı vznik
Metoda Monte Carlo je stochasticko-numerick´a metoda pouˇz´ıvan´a pˇredevˇs´ım pro simulaci dˇej˚ u souvisej´ıc´ıch s n´ahodou, kde je velmi tˇeˇzk´e nebo dokonce nemoˇzn´e pouˇz´ıt klasick´e analytick´e metody [6]. Kdyˇz se zamysl´ıme nad t´ım, kde vˇsude v re´aln´em svˇetˇe nˇeco z´avis´ı na n´ahodˇe, zˇrejmˇe dojdeme k z´avˇeru, ˇze metoda simuluj´ıc´ı tyto dˇeje je velice uˇziteˇcn´a. Z naˇseho pohledu je totiˇz ovlivnˇeno n´ahodou vˇse to, co m´a v´ ysledek, kter´ y nedok´aˇzeme s jistotou pˇredpovˇedˇet. Ten pˇritom urˇcuj´ı mnoh´e vlivy. Nejjednoduˇsˇs´ım zp˚ usobem ˇreˇsen´ı ot´azek tohoto typu se ˇcasto st´av´a simulace pomoc´ı metody Monte Carlo. Proto tato metoda nal´ez´a uplatnˇen´ı v mnoh´ ych oborech jako je ’ ekonomie, finance, pojiˇst ovnictv´ı, fyzika, medic´ına, technika, demografie a dokonce i samotn´a matematika. Typ simulace, kdy um´ıme modelovat danou situaci zp˚ usobem podobn´ ym samotn´emu dˇeji, se naz´ yv´a analogov´y model. Mezi analogov´e modely patˇr´ı pr´avˇe metoda Monte Carlo. Vymysleli ji polsk´ y vˇedec Stanislaw Marcin Ulam a jeho mad’arsk´ y kolega John von Neumann. Tehdy byla mimo jin´e vyuˇzita pˇri v´ yvoji vod´ıkov´e bomby bˇehem druh´e svˇetov´e v´alky v americk´ ych laboratoˇr´ıch v Los Alamos. Jak uv´ad´ı [1], ˇreˇsili tehdy, jak´e procento ze sprˇsky neutron˚ u projde dan´ ym materi´alem (napˇr. barelem vody). I kdyˇz disponovali takov´ ymi znalostmi jako je pravdˇepodobnost sr´aˇzky s atomem vod´ıku nebo kysl´ıku, pravdˇepodobnost pohlcen´ı neutronu pˇri sr´aˇzk´ach a pravdˇepodobnost, ˇze se po sr´aˇzce neutron bude pohybovat dan´ ym zp˚ usobem, nebyli schopni probl´em vyˇreˇsit tehdejˇs´ımi metodami. Pomohlo jim aˇz vytvoˇren´ı metody Monte Carlo. Jak je vidˇet z n´azvu, nechali se inspirovat mˇesteˇckem v Monack´em kn´ıˇzectv´ı pln´em heren. Z´akladn´ı myˇslenka metody Monte Carlo m´a totiˇz co do ˇcinˇen´ı s ruletou. Jednotliv´e ˇca´sti ˇzivota neutronu“ se daj´ı pˇredstavit na z´akladˇe toˇcen´ı ruletou. Jestliˇze zn´ame ” pravdˇepodobnost sr´aˇzky s vod´ıkem, m˚ uˇzeme si zatoˇcit odpov´ıdaj´ıc´ım kolem rulety a zjist´ıme, zda dan´ y nasimulovan´ y neutron narazil do atomu vod´ıku. Pokud v´ıme, ˇze narazil a pravdˇepodobnost jeho pohlcen´ı je v tomto pˇr´ıpadˇe jedna setina, m˚ uˇzeme si zatoˇcit ruletou se sto ˇcl´anky, z nichˇz jeden reprezentuje pohlcen´ı. Takto m˚ uˇzeme pokraˇcovat i d´ale, dokud nezjist´ıme, zda dan´ y neutron proˇsel barelem, nebo byl pohlcen. Pokud bychom chtˇeli danou situaci nasimulovat pomoc´ı kol rulety, trvalo by to pˇr´ıliˇs dlouho. Poˇc´ıtaˇce n´am mohou velice usnadnit pr´aci, stejnˇe tak, jako ji jiˇz usnadnily v mnoha dalˇs´ıch oborech. Staˇc´ı d´at dohromady spr´avn´ y algoritmus, m´ıt k dispozici pseudon´ahodn´a ˇc´ısla s dan´ ym rozdˇelen´ım pravdˇepodobnost´ı, a m˚ uˇzeme spustit pˇr´ısluˇsn´ y program. V´ ysledky anal´ yzy pak zpracujeme vhodn´ ymi statistick´ ymi metodami. Z toho je vidˇet, ˇze z´aklady metody Monte Carlo tvoˇr´ı pˇredevˇs´ım teorie pravdˇepodonosti a statis8
tika. Samotn´ y n´azev metoda Monte Carlo se datuje od roku 1949, kdy vyˇsel v americk´em matematick´em ˇcasopise stejnojmenn´ y ˇcl´anek. Kromˇe analogov´ ych model˚ u existuj´ı tak´e neanalogov´e. Jsou to ty, pˇri jejichˇz realizaci nepouˇz´ıv´ame model skuteˇcn´eho dˇeje. Mezi nˇe patˇr´ı napˇr. v´ ypoˇcet urˇcit´eho integr´alu nebo obsahu ohraniˇcen´e plochy. Mˇejme ˇctverec s obsahem S1 a v nˇem ohraniˇcenou plochu s nezn´am´ ym obsahem S2 , kter´ y chceme zjistit. Staˇc´ı nagenerovat dostateˇcn´e mnoˇzstv´ı n´ahodn´ ych“ bod˚ u do tohoto ˇctverce a jsme schopni pˇribliˇznˇe urˇcit obsah ” ohraniˇcen´eho u ´tvaru. Poˇcet nagenerovan´ ych bod˚ u oznaˇc´ıme n a poˇcet bod˚ u na ohraniˇcen´e ploˇse m, pak S2 m · S1 m ⇒ S2 ∼ . ∼ S1 n n Chceme-li urˇcit hodnotu ˇc´ısla π, staˇc´ı za ohraniˇcenou oblast povaˇzovat kruh. Na z´avˇer t´eto kapitoly je tˇreba ˇr´ıci, ˇze vzhledem k neust´al´emu zdokonalov´an´ı v´ ypoˇcetn´ı techniky, stoup´a aplikovatelnost metody Monte Carlo. Jak uv´ad´ı [1], pˇresnost samotn´eho v´ ypoˇctu pomoc´ı v´ ypoˇcetn´ı techniky je d´ana tˇemito faktory: kvalitou gener´atoru pseudon´ahodn´ych ˇc´ısel, v´ybˇerem racion´ aln´ıho algoritmu v´ypoˇctu a kontrolou pˇresnosti z´ıskan´eho v´ysledku. Podrobnˇeji se o nich zm´ın´ıme v dalˇs´ıch kapitol´ach.
2
Z´ aklady teorie pravdˇ epodobnosti
Na stˇredn´ı ˇskole jsme se nauˇcili intuitivnˇe vn´ımat mnoh´e z´akladn´ı pojmy teorie pravdˇepodobnosti. Vˇetˇsinou jsme se dovˇedˇeli o tom, ˇze existuje n´ahodn´ y pokus a mnoˇzina vˇsech jeho moˇzn´ ych v´ ysledk˚ u. Tak´e jsme se doslechli o jevech, relativn´ı ˇcetnosti i o tom, ˇze se daj´ı za urˇcit´ ych podm´ınek pravdˇepodobnosti jednotliv´ ych jev˚ u sˇc´ıtat a n´asobit. Mnoz´ı z n´as byli, aniˇz by o tom vˇedˇeli, sezn´ameni s prvn´ımi dvˇema axiomy Kolmogorovovy definice pravdˇepodobnosti. To vˇse n´am bylo vˇetˇsinou vysvˇetleno na pˇr´ıkladech a pokud jsme se o pravdˇepodobnost nezaj´ımali v´ıce, ch´apeme ji pouze intuitivnˇe. Pro potˇreby velk´e ˇca´sti lid´ı, kteˇr´ı proˇsli stˇredn´ı ˇskolou, je to nejsp´ıˇs dostaˇcuj´ıc´ı. Pokud vˇsak chceme studovat nˇekter´e ˇca´sti matematiky, je tˇreba pochopit z´akladn´ı pojmy teorie pravdˇepodobnosti ponˇekud zevrubnˇeji. Mezi takov´e oblasti matematiky patˇr´ı mimo jin´e i metoda Monte Carlo. Proto se n´asleduj´ıc´ı ˇca´st pr´ace bude vˇenovat podrobnˇejˇs´ımu vysvˇetlen´ı a definov´an´ı z´akladn´ıch pojm˚ u, kter´e jsou k hlubˇs´ımu pochopen´ı vlastnost´ı pravdˇepodobnosti potˇreba [2, 3].
9
2.1
Pokusy
Definice 1 Pokus je jednor´azov´e uskuteˇcnˇen´ı vymezen´eho souboru definiˇcn´ıch podm´ınek. Lze ho mnohon´asobnˇe opakovat. Opakov´an´ım souboru definiˇcn´ıch podm´ınek rozum´ıme opˇet pokus. Podm´ınky, kter´e nejsou definiˇcn´ı, se mohou mˇenit. Proto m˚ uˇzeme opakov´an´ım stejn´eho pokusu doj´ıt k jin´ ym v´ ysledk˚ um. Pˇ r´ıklad 1 H´az´ıme-li kostkou, vykon´av´ame pokus. Tento pokus m˚ uˇzeme zopakovat t´ım, ˇze hod´ıme kostkou se stejn´ ym tvarem, rozloˇzen´ım hmoty a ˇc´ıslicemi na odpov´ıdaj´ıch stran´ach (definiˇcn´ı podm´ınky). Specifick´a rotace, kter´a kostku donutila“ spadnout tak, jak spadla, nen´ı definiˇcn´ı podm´ınka. ” Pˇri dalˇs´ım pokusech se nemus´ı opakovat. Deterministick´ym pokusem rozum´ıme takov´ y pokus, jehoˇz definiˇcn´ı podm´ınky jsou natolik tˇesn´e“, ˇze opakov´an´ım dostaneme vˇzdy stejn´ y v´ ysledek. ” Pˇ r´ıklad 2 Pokud se nach´az´ıme na Zemi a z´aroveˇ n ne za pol´arn´ım kruhem (definiˇcn´ı podm´ınky), slunce vyjde kaˇzd´e r´ano (v´ ysledek deterministick´eho pokusu). N´ahodn´ym pokusem naz´ yv´ame takov´ y pokus, jehoˇz realizac´ı dostaneme pr´avˇe jeden z v´ıce moˇzn´ ych disjunktn´ıch (navz´ajem se vyluˇcuj´ıc´ıch) v´ ysledk˚ u. Jeden konkr´etn´ı n´ahodn´ y pokus je prezentov´an v Pˇr´ıkladu 1, dalˇs´ı je uveden n´ıˇze. Pˇ r´ıklad 3 Pˇri hodu minc´ı padne bud’ panna nebo orel. Definiˇcn´ı podm´ınky pˇri tom neurˇcuj´ı, kter´a z tˇechto dvou poloˇzek padne. Nyn´ı by bylo vhodn´e rozebrat, jak´ ym zp˚ usobem se oznaˇcuj´ı nˇekter´e d˚ uleˇzit´e pojmy, kter´e budeme v teorii pravdˇepodobnosti d´ale potˇrebovat. P´ısmenem Ω se znaˇc´ı mnoˇzina vˇsech v´ ysledk˚ u n´ahodn´eho pokusu. Napˇr. pˇri hodu kostkou je to mnoˇzina Ω = {1; 2; 3; 4; 5; 6}. Pro tuto mnoˇzinu plat´ı, ˇze Ω 6= {}. Je zˇrejm´e, ˇze hod kostkou vˇzdy skonˇc´ı t´ım, ˇze padne nˇejak´e ˇc´ıslo. A stejnˇe tak je to i s ostatn´ımi n´ahodn´ ymi pokusy. Jeden moˇzn´ y v´ ysledek n´aleˇz´ıc´ı Ω lze oznaˇcit p´ısmenem ω. Pˇri hodu kostkou se ω m˚ uˇze rovnat napˇr. 6 nebo 5.
10
2.2
N´ ahodn´ e jevy a pravdˇ epodobnost
Definice 2 Kaˇzd´a mnoˇzina A ⊆ Ω se naz´ yv´a jev. Jednoprvkov´e podmnoˇziny jsou element´ arn´ı jevy. Jev oznaˇcuje nˇejakou ud´alost, kter´a pˇri realizov´an´ı pokusu bud’ nastane, nebo ˇ ık´ame, ˇze nenastane. Jevy se znaˇc´ı zpravidla velk´ ymi p´ısmeny A, B, C,. . . R´ nastal jev A, jestliˇze byl realizac´ı n´ahodn´eho pokusu obdrˇzen v´ ysledek ω ∈ A. Pr´azdn´a mnoˇzina je tzv. nemoˇzn´y jev, protoˇze pˇri realizaci definiˇcn´ıch podm´ınek nikdy nenastane. Je tomu tak, jelikoˇz pokus m´a vˇzdy nˇejak´ y v´ ysledek. Opakem je jist´y jev Ω, kter´ y nastane vˇzdy. Pro operace s jevy plat´ı stejn´a pravidla jako pro operace s mnoˇzinami. Pˇ r´ıklad 4 Pˇri hodu kostkou se nikdy nestane, ˇze by nepadlo ˇza´dn´e ˇc´ıslo (nemoˇzn´ y jev). Naopak se vˇzdy stane, ˇze padne jedno z ˇc´ısel 1 aˇz 6 (jist´ y jev). Element´arn´ım jevem je tˇreba padnut´ı jedniˇcky. Jevem m˚ uˇze b´ yt napˇr. i to, ˇze padne sud´e ˇc´ıslo. N´asleduj´ıc´ı definice je pˇrevzata z [2]. Definice 3 Necht’ Ω 6= {} je libovoln´a mnoˇzina. Nepr´azdn´ y syst´em A podmnoˇzin mnoˇziny Ω se naz´ yv´a jevov´e pole, jestliˇze plat´ı: a) A ∈ A ⇒ Ac ∈ A S b) An ∈ A, n = 1, 2, . . . ⇒ ∞ 1 An ∈ A Prvky A ∈ A se naz´ yvaj´ı n´ ahodn´e jevy. Jevov´e pole znaˇc´ı urˇcitou ”rozumnou”mnoˇzinu podmnoˇzin Ω (pro koneˇcnou a spoˇcetnou mnoˇzinu v´ ysledk˚ u je tvoˇreno vˇsemi jej´ımi podmnoˇzinami) a jeho zaveden´ı je d˚ uleˇzit´e pro n´asleduj´ıc´ı definici pravdˇepodobnosti. Z´akladem dneˇsn´ıho pojet´ı pravdˇepodobnosti se stala definice rusk´eho matematika Kolmogorova z roku 1933. Definice 4 Necht’ je d´ana nepr´azdn´a mnoˇzina Ω a na n´ı jevov´e pole A. Pravdˇepodobnost´ı nazveme kaˇzdou re´alnou funkci P ( ) definovanou na A, kter´a vyhovuje n´asleduj´ıc´ım axiom˚ um: a1 P (Ω) = 1; a2 P (A) ≥ 0, ∀A ∈ A; a3 Pro libovolnou posloupnost An ∈ A, n = 1, 2, . . . nesluˇciteln´ ych n´ahodn´ ych jev˚ u (a tedy Ai ∩ Aj = {}, i, j = 1, 2, . . . , i 6= j) plat´ı ! ∞ ∞ X [ P (An ). P An = 1
1
Uspoˇra´dan´a trojice (Ω, A, P ) se oznaˇcuje jako pravdˇepodobnostn´ı prostor. 11
2.3
R˚ uzn´ e pravdˇ epodobnostn´ı modely
Kolmogorova definice se vyznaˇcuje jistou volnost´ı interpretace. Jej´ı axiomy netvoˇr´ı pˇr´ıliˇs pˇr´ısn´ y syst´em“. Proto je moˇzn´e ji podle potˇreby pˇrizp˚ usobovat ” r˚ uzn´ ym konkr´etn´ım pˇr´ıpad˚ um. Existuj´ı tak i dalˇs´ı, specifizuj´ıc´ı definice pravdˇepodobnosti. Ve ˇskoln´ıch lavic´ıch jsme nejsp´ıˇse slyˇseli pouze o jedn´e t´eto definici. Jmenuje se klasick´a definice pravdˇepodobnosti. Mezi dalˇs´ı definice patˇr´ı tak´e geometrick´a a neklasick´a pravdˇepodobnost. 2.3.1
Klasick´ a pravdˇ epodobnost
Klasick´a definice pravdˇepodobnosti je zaloˇzena na principu stejn´e moˇznosti nastoupen´ı libovoln´eho z element´arn´ıch jev˚ u. T´ım p´adem se st´av´a sp´ıˇse logick´ ym, vykonstruovan´ ym syst´emem neˇz n´astrojem uˇziteˇcn´ ym v praxi. Realita je ˇcasto mnohem sloˇzitˇejˇs´ı neˇz hod kostkou, kter´a m´a vˇsechny stˇeny stejn´e aˇz na poˇcet ok (tj. je pravideln´a). Staˇc´ı uvaˇzovat napˇr. nekoneˇcn´ y poˇcet v´ ysledk˚ u pokusu nebo to, ˇze vˇsechny element´arn´ı jevy nenastanou se stejnou pravdˇepodobnost´ı, a tato definice selh´av´a. Hod´ı se pouze v situac´ıch, kdy se d´a poˇcet moˇzn´ ych v´ ysledk˚ u n´ahodn´eho pokusu (a n´aslednˇe pravdˇepodobnost) urˇcit s vyuˇzit´ım kombinatorick´ ych u ´vah. Popularizovan´a definice (klasick´e) pravdˇepodobnosti, kter´a se uˇc´ı na stˇredn´ıch ˇskol´ach: n(A) P (A) = , n n(A). . . poˇcet v´ ysledk˚ u pˇr´ızniv´ ych jevu A, n. . . poˇcet vˇsech v´ ysledk˚ u n´ahodn´eho pokusu. V souladu s Kolmogorovou definic´ı pravdˇepodobnosti se definuje klasick´a pravdˇepodobnost takto: Definice 5 Necht’ Ω = {ω1 , ω2 , . . . , ωn } je koneˇcn´a mnoˇzina, A je jevov´e pole, kter´e obsahuje vˇsechny podmnoˇziny mnoˇziny Ω. Funkce P ( ) definovan´a na A vztahy P (ωj ) =
1 , n
j = 1, 2, . . . , n,
P (A) =
X
j:ωj ∈A
P ({ωj })
se naz´ yv´a klasick´a pravdˇepodobnost. 2.3.2
Geometrick´ a pravdˇ epodobnost
Geometrick´a pravdˇepodobnost se vyznaˇcuje t´ım, ˇze kv˚ uli jej´ımu v´ ypoˇctu neurˇcujeme nˇejak´ y poˇcet, ale m´ıru. Kdyˇz chceme vyj´adˇrit napˇr. d´elku 12
u ´seˇcky, tˇeˇzko tak uˇcin´ıme pomoc´ı poˇctu jej´ıch bod˚ u. Nem˚ uˇzeme vˇsak existenci jednotliv´ ych bod˚ u zanedbat. Proto je pro korektn´ı definici geometrick´e pravdˇepodobnosti tˇreba uvaˇzovat tzv. Lebesgueovu m´ıru. Jej´ı pomoc´ı dok´aˇzeme objektu tvoˇren´emu nekoneˇcn´ ym (nespoˇcetn´ ym) poˇctem bod˚ u pˇridˇelit ˇc´ıslo, kter´e tento objekt charakterizuje. N´am vˇsak postaˇc´ı zjednoduˇsen´a definice pˇrevzat´a z [2]. Definice 6 Necht’ Ω ⊂ Rn , n = 1, 2, . . . , je takov´a mnoˇzina, jej´ıˇz m´ıru µ(Ω) um´ıme urˇcit. Necht’ A je tˇr´ıda vˇsech podmnoˇzin Ω se stejnou vlastnost´ı. Je-li 0 < µ(Ω) < ∞, definujeme na A funkci P takto: P (A) =
µ(A) , µ(Ω)
A ∈ A.
Lebesqueova m´ıra v R1 reprezentuje d´elku, R2 obsah atd. Stejnˇe jako klasick´a definice pravdˇepodobnosti, je i tato pomˇernˇe omezen´a, co se t´ yˇce spektra probl´em˚ u, kter´e zahrnuje. Pˇresto je v praxi velmi uˇziteˇcn´a, a to i co se t´ yk´a metody Monte Carlo. Pˇ r´ıklad 5 (o setk´ an´ı) James Bond a agent FBI chtˇej´ı bˇehem stejn´e hodiny vtrhnout do skladu s trhavinou a zneˇskodnit ji. Jeden o druh´em vˇsak nevˇed´ı, pˇrijdou tedy v urˇcit´ y ˇcasov´ y okamˇzik bˇehem dan´e hodiny a po nalezen´ı a pˇr´ıpadn´e deaktivaci bomby, na coˇz jim staˇc´ı 20 minut, sklad neprodlenˇe opust´ı. S jako pravdˇepodobnost´ı se tam oba agenti potkaj´ı? ˇ sen´ı Pˇri ˇreˇsen´ı t´eto u Reˇ ´lohy si m˚ uˇzeme pomoci jednoduch´ ym obr´azkem. Osa x (respektive y) zn´azorˇ nuje dobu pˇr´ıchodu Jamese Bonda (agenta FBI) v minut´ach. Aby se agenti setkali, mus´ı druh´ y z nich pˇrij´ıt do dvaceti minut po pˇr´ıchodu prvn´ıho. Na obr´azku 1 je tato situace zn´azornˇena tmavˇe ˇsedou barvou. Pˇr´ıpady, kdy se nesetkaj´ı, jsou reprezentov´any svˇetle ˇsedou barvou. Ze zad´an´ı obrˇz´ıme Ω = {(x; y) : 0 ≤ x ≤ 60; 0 ≤ y ≤ 60}, A = {(x; y) ∈ Ω : |x − y| ≤ 20}, P (A) =
µ(A) 602 − 402 5 = = . 2 µ(Ω) 60 9
Pravdˇepodobnost, ˇze se agenti setkaj´ı, je rovna 59 . Dalˇs´ı u ´lohu podle [11] formuloval roku 1777 francouzsk´ y matematik Georges Louis Leclerc de Buffon. Jej´ı v´ ypoˇcet se d´a uskuteˇcnit pomoc´ı geometrick´e pravdˇepodobnosti, z´aroveˇ n ovˇsem byla jednou z motivac´ı k zaveden´ı 13
Obr´azek 1: Grafick´e zn´azornˇen´ı u ´lohy o setk´an´ı.
metody Monte Carlo. Pˇ r´ıklad 6 (Buffonova u ´ loha) Uvaˇzujme rovinu, v n´ıˇz jsou v pravideln´ ych vzd´alenostech d um´ıstˇeny rovnobˇeˇzky. Na tuto rovinu n´ahodnˇe vrh´ame jehlu jej´ıˇz d´elka l splˇ nuje podm´ınku l < d. Jak´a je pravdˇepodobnost, ˇze tato jehla protne nˇekterou z rovnobˇeˇzek? ˇ sen´ı Oznaˇc´ıme si vzd´alenost stˇredu jehly od nejbliˇzˇs´ı pˇr´ımky p´ısmenem Reˇ xau ´hel, kter´ y sv´ır´a jehla s nejbliˇzˇs´ı pˇr´ımkou ϕ. Je zˇrejm´e, ˇze jehla protne nejbliˇzˇs´ı pˇr´ımku, pokud plat´ı x≤
l · sin ϕ, 2
pˇritom x m˚ uˇze nab´ yvat hodnot od 0 do d2 , ϕ od 0 do π. To urˇcuje mnoˇzinu vˇsech moˇzn´ ych v´ ysledk˚ u, viz obr´azek 2. Pro d Ω = {(x; ϕ) : 0 ≤ x ≤ ; 0 ≤ ϕ ≤ π}, 2 A = {(x; ϕ) ∈ Ω : x ≤ tedy dostaneme P (A) =
1 dπ 2
Z
π 0
l · sin ϕ} 2
2l l sin ϕ dϕ = . 2 dπ
14
Nyn´ı je moˇzn´e pouˇz´ıt metodu Monte Carlo pro v´ ypoˇcet pˇribliˇzn´e velikosti π. Staˇc´ı experiment s jehlou uskuteˇcnit ruˇcnˇe, nebo ho nasimulovat pomoc´ı poˇc´ıtaˇce. Poˇcet pokus˚ u si oznaˇc´ıme n, z toho poˇcet pokus˚ u, kdy jehla protla pˇr´ımku, oznaˇc´ıme m. Pro velk´a n plat´ı P (A) ∼
m m 2l 2nl ⇒ ∼ ⇒π∼ , n n dπ md
kde l, d a n zn´ame, m jsme urˇcili pomoc´ı experimentu nebo simulace. Zb´ yv´a tedy pouze dosadit do vzorce a zn´ame pˇribliˇznou hodnotu π.
Obr´azek 2: Grafick´e zn´azornˇen´ı Buffonovy u ´lohy [4].
3 3.1
Podm´ınˇ en´ a pravdˇ epodobnost a nez´ avisl´ e n´ ahodn´ e jevy Podm´ınˇ en´ a pravdˇ epodobnost
Dosud jsme se v t´eto pr´aci setkali pouze s pravdˇepodobnost´ı nˇejak´eho jevu za uskuteˇcnˇen´ı definiˇcn´ıch podm´ınek. Tato pravdˇepodobnost se nˇekdy oznaˇcuje jako nepodm´ınˇen´ a pravdˇepodobnost. M˚ uˇzeme se vˇsak tak´e setkat s pˇr´ıpadem, kdy v´ıme v´ıce neˇz pouze to, ˇze nastaly definiˇcn´ı podm´ınky, tud´ıˇz se pokus zdaˇril. V´ıme, ˇze nastal nˇejak´ y jev B. Naˇs´ım u ´kolem je zkoumat, jak to ovlivˇ nuje pravdˇepodobnost nastoupen´ı dan´eho jevu A. Zjiˇst’ujeme tedy, jak´ ych hodnot nab´ yv´a pravdˇepodobnost jevu A za podm´ınky B. Hledan´a pravdˇepodobnost se znaˇc´ı P (A/B).
15
Definice 7 Necht’ je d´an n´ahodn´ y jev B ∈ A, pro kter´ y plat´ı P (B) > 0. Funkce P ( /B) definovan´a pˇredpisem P (A/B) =
P (A ∩ B) ,A ∈ A P (B)
(1)
se naz´ yv´a podm´ınˇen´a pravdˇepodobnost jevu A za podm´ınky B. ˇ e republice v roce 2005 Pˇ r´ıklad 7 Podle internetov´ ych str´anek [8] v Cesk´ onemocnˇelo rakovinou plic pˇribliˇznˇe 6000 lid´ı a v´ yskyt rakoviny plic u kuˇra´k˚ u ˇ kouˇr´ı asi ve srovn´an´ı s nekuˇra´ky je asi desetin´asobn´ y. Jak uv´ad´ı [9], v CR 26 % lid´ı. Jak´a je pravdˇepodobnost, ˇze ˇcesk´ y kuˇra´k onemocnˇel v roce 2005 ˇ ob´ rakovinou plic, jestliˇze CR yv´a pˇribliˇznˇe 10 milion˚ u lid´ı? ˇ sen´ı Jev A bude reprezentovat v´ Reˇ yskyt rakoviny. Jako jev B si oznaˇc´ıme kouˇren´ı. Nyn´ı spoˇc´ıt´ame P (A ∩ B), pravdˇepodobnost, ˇze je ˇclovˇek nemocn´ y a z´aroveˇ n kuˇra´k. Pravdˇepodobnost, ˇze se jedn´a o ˇclovˇeka, kter´ y onemocnˇel, ˇ je vyj´adˇrena pod´ılem lid´ı, kteˇr´ı onemocnˇeli ku poˇctu lid´ı v CR. Tuto pravdˇepodobnost vyn´asob´ıme pomˇerem vyjadˇruj´ıc´ım, kolik z nemocn´ ych lid´ı byli kuˇra´ci. P (B) zn´ame ze zad´an´ı, dohromady tedy dostaneme P (A ∩ B) =
6000 10 3 · = , 7 10 11 5500
P (B) = 26% =
13 . 50
Potom staˇc´ı pravdˇepdobnost, ˇze kuˇra´k onemocnˇel, vydˇelit pravdˇepodobnost´ı, ˇ kuˇra´k. ˇze byl obyvatel CR P (A/B) =
3 5500 13 50
=
15 . = 0,0105. 1430
Pravdˇepodobnost, ˇze v roce 2005 onemocnˇel urˇcit´ y ˇcesk´ y kuˇra´k rakovinou, je pˇribliˇznˇe 1%.
3.2
Nez´ avisl´ e n´ ahodn´ e jevy
Skuteˇcnost, ˇze nastoupen´ı jevu A neovlivn´ı pravdˇepodobnost, ˇze nastal jev B, lze matematicky zapsat n´asleduj´ıc´ım zp˚ usobem P (B/A) = P (B).
(2)
P (A ∩ B) = P (A) · P (B/A)
(3)
Ze vztahu (1) vypl´ yv´a
16
a ze vztah˚ u (2) a (3) pak dostaneme definici nez´avislosti n´ahodn´ ych jev˚ uA a B. ˇ Definice 8 Rekneme, ˇze dva jevy A a B jsou nez´avisl´e, jestliˇze plat´ı P (A ∩ B) = P (A) · P (B). S nez´avislost´ı n´ahodn´ ych jev˚ u se v teorii pravdˇepodobnosti a statistice setk´av´ame ˇcasto, nevyhneme se j´ı ani v t´eto pr´aci. Pˇ r´ıklad 8 V jednom skladiˇsti na mouku se rozˇs´ıˇrily dva druhy ˇsk˚ udc˚ u, roztoˇc mouˇcn´ y a obaleˇc mouˇcn´ y. Ve skladu je celkem 21 000 kg mouky. Kaˇzd´ y je zabalen zvl´aˇst’. Roztoˇc mouˇcn´ y napadl celkem 300 kg mouky zat´ımco obaleˇc mouˇcn´ y dokonce 2400 kg. Poˇcet balen´ı napaden´ ych obˇema je roven 60. Maj´ı ˇsk˚ uci v tomto skladu radˇeji bal´ıˇcky napaden´e druh´ ym druhem, vyh´ ybaj´ı se mu, nebo je jim to jedno? ˇ sen´ı Jako P (A) si oznaˇc´ıme pravdˇepodobnost napaden´ı roztoˇcem mouˇcReˇ n´ ym, P (B) reprezentuje pravdˇepodobnost poˇskozen´ı balen´ı obaleˇcem mouˇcn´ ym. P (A ∩ B) vyjadˇruje pravdˇepodobnost, ˇze bal´ıˇcek napadli oba ˇsk˚ udci. P (A) =
300 1 = , 21000 70
P (B) =
2400 8 = , 21000 70
P (A ∩ B) =
60 2 = . 21000 700
Mohou nastat 3 pˇr´ıpady: 1. Jestliˇze P (A) · P (B) = P (A ∩ B), pak je ˇsk˚ udc˚ um jedno, jak´ y bal´ıˇcek napadaj´ı. 2. Pokud P (A) · P (B) < P (A ∩ B), ˇsk˚ udci radˇeji napadaj´ı stejn´e bal´ıˇcky. 3. Kdyˇz plat´ı, ˇze P (A) · P (B) > P (A ∩ B), ˇsk˚ udci se sobˇe navz´ajem vyh´ ybaj´ı. Dosazen´ım konkr´etn´ıch hodnot dostaneme P (A) · P (B) =
1 8 8 2 14 · = < = . 70 70 4900 700 4900
ˇ udci v tomto skladu radˇeji napadaj´ı bal´ıˇcky napaden´e druh´ Sk˚ ym druhem.
17
4
N´ ahodn´ a veliˇ cina
Snad kaˇzd´ y v´ ysledek n´ahodn´eho pokusu se d´a vyj´adˇrit ˇc´ıslem. Nejv´ıce z v´as si jistˇe vzpomene na hod kostkou. V´ ysledek tohoto n´ahodn´eho pokusu oznaˇcujeme ˇc´ısly jedna aˇz ˇsest. Stejnˇe tak m˚ uˇzeme ˇc´ıslem oznaˇcit v´ yˇsku ˇclovˇeka, poˇcet aut prodan´ ych v roce 2011, poˇcet atom˚ u smolince, kter´e se rozpadly za posledn´ı minutu, a dalˇs´ı. Jednoduˇse ˇreˇceno je n´ ahodn´a veliˇcina re´aln´a funkce, kter´a v´ ysledk˚ um n´ahodn´eho pokusu pˇriˇrazuje ˇc´ısla. N´ahodn´e veliˇciny oznaˇcujeme velk´ ymi p´ısmeny z konce abecedy, X, Y, Z, . . .; jejich konkr´etn´ı realizace pak mal´ ymi p´ısmeny, x, y, z, . . .. N´asleduj´ıc´ı zjednoduˇsen´a definice n´ahodn´e veliˇciny je uvaˇzovan´a pro Ω s koneˇcnˇe a spoˇcetnˇe mnoha prvky (pro nespoˇcetn´e Ω by vypadala analogicky, bylo by ovˇsem potˇreba uvaˇzovat dalˇs´ı teoretick´e pojmy, kter´e by ne´ umˇernˇe zvˇetˇsily rozsah pr´ace). Definice 9 Libovoln´a re´aln´a funkce X : Ω → R, kter´a kaˇzd´emu moˇzn´emu v´ ysledku ω ∈ Ω pˇriˇrazuje re´aln´e ˇc´ıslo X(ω), se naz´ yv´a n´ ahodn´a veliˇcina a ˇc´ıslo x = X(ω) je ˇc´ıseln´a realizace veliˇciny X pˇr´ısluˇsn´a moˇzn´emu v´ ysledku ω. Pˇ r´ıklad 9 Pˇri hodu minc´ı si zavedeme n´ahodnou veliˇcinu, kter´a nab´ yv´a dvou hodnot. Padnut´ı panny jako v´ ysledek hodu si oznaˇc´ıme napˇr. ˇc´ıslem 0 a orla ˇc´ıslem 1. Jestliˇze padne panna, hodnota n´ahodn´e veliˇciny X(ω0 ) = 0. Jestliˇze padne orel, X(ω1 ) = 1.
4.1
Rozdˇ elen´ı pravdˇ epodobnosti
Rozdˇelen´ı pravdˇepodobnosti n´ ahodn´e veliˇciny je soubor pravidel, kter´a kaˇzd´emu v´ ysledku pˇriˇrazuj´ı urˇcitou pravdˇepodobnost, se kterou n´ahodn´a veliˇcina nabude pˇr´ısluˇsn´e realizace. Konkr´etn´ı rozdˇelen´ı je urˇceno vˇsemi hodnotami, kter´ ych m˚ uˇze n´ahodn´a veliˇcina nab´ yvat, a odpov´ıdaj´ıc´ımi pravdˇepodobnostmi. Pˇ r´ıklad 10 (dle [5], str. 37) Charakterizujte rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny oznaˇcuj´ıc´ıch poˇcet panen pˇri souˇcasn´em hodu tˇremi mincemi, tj. ˇze padnou 0 1, 2, nebo 3 panny. ˇ sen´ı Orla si oznaˇc´ıme ˇc´ıslem 1 a pannu ˇc´ıslem 0. Mnoˇzina vˇsech moˇzn´ Reˇ ych v´ ysledk˚ u obsahuje vˇsechny moˇzn´e v´ ysledky n´ahodn´eho pokusu, Ω = {ω1 , ω2 , ω3 , ω4 , ω5 , ω6 , ω7 , ω8 }. 18
V´ ysledky jsou trojice uspoˇra´dan´ ych nul a jedniˇcek, ω1 ω2 ω5 ω8
= {1, 1, 1}, = {1, 1, 0}, ω3 = {1, 0, 1}, ω4 = {0, 1, 1}, = {1, 0, 0}, ω6 = {0, 1, 0}, ω7 = {0, 0, 1}, = {0, 0, 0}.
N´ahodn´a veliˇcina X, kter´a ud´av´a poˇcet padl´ ych panen, nabude n´asleduj´ıc´ıch hodnot s tˇemito pravdˇepodobnostmi: P (X P (X P (X P (X
= 0) = P ({ω1 }) = 81 , = 1) = P ({ω2 } ∪ {ω3 } ∪ {ω4 }) = 38 , = 2) = P ({ω5 } ∪ {ω6 } ∪ {ω7 }) = 38 , = 3) = P ({ω8 }) = 81 .
Pravdˇepodobnost, ˇze nepadne panna (n´ahodn´a veliˇcina nab´ yv´a hodnoty 0) 1 yv´a je 8 . Pravdˇepodobnost, ˇze padne pr´avˇe 1 panna (n´ahodn´a veliˇcina nab´ 3 hodnoty 1) je rovna hodnotˇe 8 . Dvˇe panny (n´ahodn´a veliˇcina nab´ yv´a hodnoty 2) se na horn´ı stranˇe mince objev´ı tak´e s pravdˇepodobnost´ı 38 . 3 panny (n´ahodn´a veliˇcina nab´ yv´a hodnoty 3) padnou s pravdˇepodbnost´ı 81 . V uveden´em pˇr´ıkladu jsme se setkali s tzv. diskr´etn´ım rozdˇelen´ım. Jedn´a se o rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny, kter´a nab´ yv´a koneˇcnˇe nebo spoˇcetnˇe mnoha hodnot, tedy obecnˇe hodnot z mnoˇziny {x1 , x2 , x3 , . . .}. Pro pravdˇepodobnost diskr´etn´ı n´ahodn´e veliˇciny plat´ı tyto vlastnosti pˇrevzat´e z [1] : X pj = P (X = xj ) > 0, pj = 1. j
Mezi n´ahodn´e veliˇciny s t´ımto typem rozdˇelen´ı patˇr´ı tak´e poˇcet prodan´ ych v´ yrobk˚ u za mˇes´ıc, poˇcet narozen´ ych dˇet´ı v rodinˇe ˇci poˇcet atom˚ u slouˇcen´ ych bˇehem reakce. 4.1.1
Spojit´ e rozdˇ elen´ı
Co by se vˇsak stalo, kdybychom zkoumali rozdˇelen´ı pravdˇepodobnosti v´ yˇsky nebo v´ahy ˇclovˇeka? Hodnoty tˇechto n´ahodn´ ych veliˇcin by nenab´ yvaly pouze hodnot {2 kg, 3 kg, 4 kg, . . .} v pˇripadˇe v´ahy a hodnot {50 cm, 51 cm, 52 cm, . . .} v pˇr´ıpadˇe v´ yˇsky. V´ yˇska dospˇel´eho ˇclovˇeka je totiˇz re´aln´e ˇc´ıslo z urˇcit´eho 19
rozumn´eho“ re´aln´eho intervalu, napˇr. h150, 210i. Za takov´ ych podm´ınek se ” jedn´a o rozdˇelen´ı spojit´eho typu. N´ahodn´a veliˇcina se spojit´ ym rozdˇelen´ım nab´ yv´a hodnot z nˇejak´eho intervalu, pˇritom pravdˇepodobnost realizace n´ahodn´e veliˇciny P (X = x) je rovna nule, nenulov´ ych pravdˇepodobnost´ı m˚ uˇze nab´ yt aˇz realizace z nˇejak´eho cel´eho podintervalu. Stejnˇe tak, jako se d´a do grafu zaznaˇcit rozdˇelen´ı pravdˇepodobnosti diskr´etn´ı n´ahodn´e veliˇciny, tak to jde i u rozdˇelen´ı pravdˇepodobnosti veliˇciny spojit´eho typu. Funkce f (x), charakterizuj´ıc´ı rozdˇelen´ı pravdˇepodobnosti tohoto typu, se naz´ yv´a hustota pravdˇepodobnosti, P (x < X ≤ x + ∆x) = f (x), ∀ x ∈ R. ∆x Obdobnˇe jako pravdˇepodobnosti pj ≥ 0 u diskr´etn´ı n´ahodn´e veliˇciny, tak´e pro tuto funkci plat´ı f (x) ≥ 0. Rozd´ıl je vˇsak v tom, ˇze f (x) nemus´ı nab´ yvat pouze hodnot z intervalu h0, 1i, ale f (x) ∈ h0, ∞). Dalˇs´ı vlastnost hustoty, kter´a pˇredstavuje analogii u diskr´etn´ıho pˇr´ıpadu, lze zapsat jako Z lim
∆x→0
∞
f (x)dx = 1.
−∞
Poznamenejme, ˇze n´ahodnou veliˇcinou s t´ımto typem rozdˇelen´ı je tak´e velikost chyby fyzik´aln´ıho mˇeˇren´ı nebo doba (v ˇcasov´ ych jednotk´ach) jasn´eho poˇcas´ı bˇehem dne.
4.2
Distribuˇ cn´ı funkce n´ ahodn´ e veliˇ ciny
Distribuˇcn´ı funkce slouˇz´ı k popisu rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny a ˇr´ık´a n´am, jak´a je pravdˇepodobnost, ˇze n´ahodn´a veliˇcina X bude m´ıt hodnotu, kter´a je menˇs´ı nebo rovna stanoven´e re´aln´e hodnotˇe. Je definovan´a pro n´ahodnou veliˇcinu s diskr´etn´ım i spojit´ ym rozdˇelen´ım. Znaˇc´ı se F (x), pokud v textu nen´ı v´ıce n´ahodn´ ych veliˇcin, kter´e by se mohly pl´est. V opaˇcn´em pˇr´ıpadˇe p´ıˇseme FX (x). Jestliˇze se jedn´a o n´ahodnou veliˇcinu s diskr´etn´ım rozdˇelen´ım, m´a jej´ı distribuˇcn´ı funkce skoky“. Zp˚ usobuje to skuteˇcnost, ˇze P (X = xj ) > 0. ” Schody“ se tedy nach´azej´ı v bodech xj , kter´e pˇredstavuj´ı realizace t´eto ” veliˇciny s nenulov´ ymi pravdˇepodobnostmi. Definice 10 Necht’ X je n´ahodn´a veliˇcina. Re´aln´a funkce FX definovan´a na R pˇredpisem FX (x) = P (X ≤ x), x ∈ R,
se naz´ yv´a distribuˇcn´ı funkce n´ ahodn´e veliˇciny X.
20
Z definice vypl´ yv´a, ˇze se v pˇr´ıpadˇe distribuˇcn´ı funkce spojit´e n´ahodn´e veliˇciny F (x) se jedn´a o primitivn´ı funkci k hustotˇe f (x), Z x f (t) dt. F (x) = P (X ≤ x) = −∞
Vlastnosti vˇsech distribuˇcn´ıch funkc´ı, pˇrevzat´e z [1] a [2]: 1. 0 ≤ F (x) ≤ 1, ∀x ∈ R, 2. F (x) je neklesaj´ıc´ı, 3. limx→∞ F (x) = 1, 4. limx→−∞ F (x) = 0, 5. pro libovoln´a re´aln´a a < b plat´ı P (a < X ≤ b) = F (b) − F (a), 6. distribuˇcn´ı funkce je zprava spojit´a. Pˇ r´ıklad 11 Maloobchodn´ı ˇretˇezec potˇrebuje kaˇzd´ y t´ yden dod´avku nealkoholick´eho n´apoje, kter´ y prod´av´a spotˇrebitel˚ um. Na z´akladˇe dlouhodob´eho pozorov´an´ı lze t´ ydenn´ı poˇzadavek v tis´ıc´ıch litrech vyj´adˇrit pomoc´ı spojit´e n´ahodn´e veliˇciny X s hustotou 2(x − 1), 1 < x < 2, f (x) = 0, jinak. Najdˇete distribuˇcn´ı funkci n´ahodn´e veliˇciny. ˇ sen´ı Je jasn´e, ˇze pro x ≤ 1 je F (x) = 0 a pro x ≥ 2 je F (x) = 1. Reˇ Ot´azkou je, jak funkce vypad´a na intervalu (1, 2). Abychom to zjistili, staˇc´ı funkci vyjadˇruj´ıc´ı hustotu n´ahodn´e veliˇciny na intervalu (1, 2) zintegrovat. Distribuˇcn´ı funkce je totiˇz funkce primitivn´ı k funkci vyjadˇruj´ıc´ı hustotu, 2 x Z x t 2(t − 1) dt = 2 − t = x2 − 2x − (−1) = x2 − 2x + 1. 2 1 1 Distribuˇcn´ı funkce je tedy tato: x ≤ 1, 0, 2 x − 2x + 1, 1 < x < 2, F (x) = 1, x ≥ 2.
Stejnˇe jako ostatn´ı distribuˇcn´ı funkce, i tato splˇ nuje podm´ınky 1 aˇz 6. 21
5
Nˇ ekter´ a konkr´ etn´ı rozdˇ elen´ı pravdˇ epodobnosti spojit´ ych n´ ahodn´ ych veliˇ cin
Protoˇze v naˇsich dalˇs´ıch u ´vah´ach vyuˇzijeme pˇredevˇs´ım n´ahodn´e veliˇciny se spojit´ ym rozdˇelen´ım, zmiˇ nme se nyn´ı o nˇekter´ ych zn´am´ ych rozdˇelen´ıch (zejm´ena) tohoto typu, kter´a se v praxi zˇrejmˇe vyskytuj´ı nejˇcastˇeji.
5.1
Rovnomˇ ern´ e rozdˇ elen´ı
Toto rozdˇelen´ı patˇr´ı mezi nejjednoduˇsˇs´ı. Kaˇzd´e hodnotˇe n´ahodn´e veliˇciny je pˇriˇrazena stejn´a pravdˇepodobnost. N´ahodn´a veliˇcina s t´ımto rozdˇelen´ım m˚ uˇze b´ yt diskr´etn´ı i spojit´a. Z toho, ˇze rovnomˇern´e rozdˇelen´ı pˇriˇrazuje kaˇzd´e hodnotˇe n´ahodn´e veliˇciny stejnou pravdˇepodobnost, se d´a vyvodit, ˇze se diskr´etn´ı rovnomˇern´e rozdˇelen´ı n´ahodn´e veliˇciny X vyznaˇcuje n´asleduj´ıc´ım pˇredpisem, P (X = xj ) =
1 , j = 1, 2 . . . , n. n
Pro potˇreby t´eto pr´ace bude d˚ uleˇzit´a zejm´ena spojit´a forma rovnomˇern´eho rozdˇelen´ı. Uplatn´ıme ji pˇri generov´an´ı pseudon´ahodn´ ych ˇc´ısel (viz kapitola 6). Rovnomˇern´e rozdˇelen´ı spojit´e n´ahodn´e veliˇciny X na intervalu (a, b) m´a tuto hustotu: 1 , x ∈ (a, b), b−a f (x) = 0, x 6∈ (a, b). Distribuˇcn´ı funkce je d´ana n´asledovnˇe: R0, x 1 dt = F (x) = a b−a 1,
x−a , b−a
x ≤ a, a ≤ x < b, x ≥ b.
P´ıˇseme X ∼ Ro(a, b), kde a a b jsou parametry tohoto rozdˇelen´ı.
5.2
Exponenci´ aln´ı rozdˇ elen´ı
Toto rozdˇelen´ı se ˇcasto vyuˇz´ıv´a v pˇr´ıpadech, kdy n´as zaj´ım´a rozdˇelen´ı pravdˇepodobnosti d´elky ˇcasov´eho intervalu, neˇz nastane nˇejak´a ud´alost Jako pˇr´ıklad lze uv´est dobu, za kterou se porouch´a dan´e zaˇr´ızen´ı (uvaˇzujeme–li poruchy z n´ahodn´ ych pˇr´ıˇcin a nikoli v d˚ usledku mechanick´eho opotˇreben´ı, pˇr´ıkladem jsou r˚ uzn´a elektronick´a zaˇr´ızen´ı).
22
Exponenci´aln´ı rozdˇelen´ı n´ahodn´e veliˇciny X oznaˇcujeme X ∼ Ex(λ). Hustota a distribuˇcn´ı funkce tohoto rozdˇelen´ı vypadaj´ı n´asledovnˇe: 0, x < 0, f (x) = λe−λx , x ≥ 0; F (x) =
5.3
0, x < 0, −λx 1 − e , x ≥ 0.
Norm´ aln´ı rozdˇ elen´ı
Toto rozdˇelen´ı je snad nejzn´amˇejˇs´ım rozdˇelen´ım pravdˇepodobnosti n´ahodn´ ych veliˇcin spojit´eho typu a t´eˇz nejˇcastˇeji se vyskytuj´ıc´ım rozdˇelen´ım ve fyzik´aln´ıch mˇeˇren´ıch. Charakterizuje mnoho n´ahodn´ ych veliˇcin, na kter´e v aplikac´ıch naraz´ıme t´emˇeˇr na kaˇzd´em kroku. Mimo jin´e mezi nˇe patˇr´ı n´ahodn´e veliˇciny popisuj´ıc´ı velikost chyby mˇeˇren´ı, v´ yˇsku ˇclovˇeka, vlnovou d´elku fotonu vyz´aˇren´eho Sluncem nebo jinou hvˇezdou. Norm´aln´ı rozdˇelen´ı se dˇel´ı na dva z´akladn´ı typy, norm´ aln´ı normovan´e rozdˇelen´ı a obecn´e norm´ aln´ı rozdˇelen´ı. Norm´aln´ı normovan´e rozdˇelen´ı n´ahon´e veliˇciny X oznaˇcujeme X ∼ N (0, 1). Jeho hustota se znaˇc´ı ϕ(x) a distribuˇcn´ı funkce Φ(x). Toto rozdˇelen´ı m´a n´ahodn´a veliˇcina s hustotou x2 1 ϕ(x) = √ e− 2 , x ∈ R 2π
a distribuˇcn´ı funkc´ı 1 Φ(x) = √ 2π
Z
x
t2
−∞
e− 2 dt, x ∈ R.
Hustota normovan´eho norm´aln´ıho rozdˇelen´ı je sud´a funkce, takˇze staˇc´ı tabelovat pouze jej´ı hodnoty pro x ≥ 0. Obecn´e norm´ aln´ı rozdˇelen´ı n´ahodn´e veliˇciny X znaˇc´ıme X ∼ N (µ, σ 2 ). Pˇritom µ a σ jsou parametry (konstanty), pro kter´e plat´ı µ ∈ R a σ ∈ R+ . Obecn´e norm´aln´ı rozdˇelen´ı m´a pak hustotu (x−µ)2 1 f (x) = √ e− 2σ2 , x ∈ R σ 2π
a distribuˇcn´ı funkci 1 F (x) = √ σ 2π
Z
x
e− −∞
23
(t−µ)2 2σ 2
dt, x ∈ R.
Jak je ps´ano v [2], pro z´ısk´an´ı hodnot distribuˇcn´ı funkce rozdˇelen´ı N (µ, σ 2 ) staˇc´ı tabelovat hodnoty distribuˇcn´ı funkce Φ(x) normovan´eho norm´aln´ıho rozdˇelen´ı, protoˇze plat´ı x−µ F (x) = Φ , x ∈ R. σ Je zˇrejm´e, ˇze norm´aln´ı normovan´e rodˇelen´ı je pouze speci´aln´ım pˇr´ıpadem (obecn´eho) norm´aln´ıho rozdˇelen´ı. Pro uveden´e konstanty zde plat´ı µ = 0 a σ = 1.
5.4
Troj´ uheln´ıkov´ e rozdˇ elen´ı
Troj´ uheln´ıkov´e rozdˇelen´ı se pouˇz´ıv´a napˇr. v ekonomick´ ych aplikac´ıch. M´a tˇri re´aln´e parametry a, b a c, pro kter´e plat´ı a < c < b. Podle [10] je jeho hustota 0, x < a, 2(x−a) (b−a)(c−a) , a ≤ x < c, 2 , x = c, f (x) = b−a 2(b−x) , c < x ≤ b, (b−a)(b−c) 0, x>b a distribuˇcn´ı funkce
0, (x−a)2 (b−a)(c−a) , c−a , F (x) = b−a (b−x)2 1 − , (b−a)(b−c) 1,
x < a, a ≤ x < c, x = c, c < x ≤ b, x > b.
V kapitole 7 budeme pˇri transformaci n´ahodn´e veliˇciny X s rovnomˇern´ ym rozdˇelen´ım na (0, 1) na v´ ybˇerov´e hodnoty n´ahodn´e veliˇciny Y s pˇredepsan´ ym rozdˇelen´ım potˇrebovat v´ ypoˇcet inverzn´ı funkce k distribuˇcn´ı funkci (tzv. kvantilov´e funkce), proto je zde zaˇrazen n´asleduj´ıc´ı pˇr´ıklad. Pˇ r´ıklad 12 Vypoˇc´ıtejte inverzn´ı funkci k distribuˇcn´ı funkci troj´ uheln´ıkov´eho rozdˇelen´ı pravdˇepodobnosti na intervalu (a, b). ˇ sen´ı V´ Reˇ ypoˇcet inverzn´ı funkce pro x ∈ ha, ci: Vymˇen´ıme x a y ve vhodn´e ˇca´sti distribuˇcn´ı funkce: x=
(y − a)2 . (b − a)(c − a) 24
Jmenovatelem m˚ uˇzeme n´asobit, protoˇze a 6= b ∧ a 6= c. Po u ´pravˇe dostaneme
c−a b−a
0 = y 2 − 2ay + a2 − x(b − a)(c − a), p y1,2 = a ± x(b − a)(c − a).
a vybereme + nebo − podle toho, kdy se v´ yraz rovn´a c: r c−a y1,2 = a ± (b − a)(c − a) = a ± (c − a). b−a Z toho je jasn´e, ˇze vybereme +. V´ ysledek: p y = a + x(b − a)(c − a) Za x dosad´ıme
V´ ypoˇcet inverzn´ı funkce pro x ∈ hc, bi: Zamˇen´ıme x a y ve vhodn´e ˇca´sti distribuˇcn´ı funkce: (b − y)2 x=1− . (b − a)(b − c) Jmenovatelem m˚ uˇzeme n´asobit, protoˇze b 6= a ∧ b 6= c. Po u ´pravˇe: 0 = y 2 − 2by + b2 + (x − 1)(b − a)(b − c), p y1,2 = b ± (1 − x)(b − a)(b − c).
c−a b−a
a vybereme + nebo − podle toho, kdy se v´ yraz rovn´a c: r c−a )(b − a)(b − c) = b ± (b − c). y1,2 = b ± (1 − b−a Z toho je jasn´e, ˇze vybereme −. V´ ysledek je roven p y = b − (1 − x)(b − a)(b − c). Za x dosad´ıme
Inverzn´ı funkce k distribuˇcn´ı funkci troj´ uheln´ıkov´eho rozdˇelen´ı na (a, b) je tedy rovna p 0 ≤ x < c−a , a + x(b − a)(c − a), b−a c−a −1 c, p x = b−a , F (x) = < x ≤ 1. b − (1 − x)(b − a)(b − c), c−a b−a
6
Generov´ an´ı n´ ahodn´ ych ˇ c´ısel
Abychom mohli simulovat rozdˇelen´ı pravdˇepodobnost´ı n´ahodn´ ych veliˇcin pomoc´ı metody Monte Carlo, potˇrebujeme n´ahodn´a ˇc´ısla s k desetinn´ ymi m´ısty z intervalu (0, 1).Tato ˇc´ısla by po vygenerov´an´ı mˇela m´ıt rovnomˇern´e rozdˇelen´ı s pˇr´ısluˇsn´ ymi parametry. Realizace rovnomˇern´eho rozdˇelen´ı se pak v pˇr´ıpadˇe potˇreby daj´ı transformovat na realizace pˇredepsan´eho rozdˇelen´ı (viz d´ale). Jak ale n´ahodn´a ˇc´ısla z´ıskat? 25
6.1
Z´ akladn´ı zp˚ usoby generov´ an´ı n´ ahodn´ ych ˇ c´ısel
V minulosti se pouˇz´ıvaly r˚ uzn´e n´astroje generov´an´ı n´ahodn´ ych ˇc´ısel. T´ım nejprimitivnˇejˇs´ım se ovˇsem stala ruleta. Staˇc´ı zatoˇcit k-kr´at ruletou s deseti ˇca´stmi reprezentuj´ıc´ımi ˇc´ıslice 0 aˇz 9. Jednotliv´e ˇc´ıslice postupnˇe zapisujeme za desetinnou ˇca´rku. T´ım jsme z´ıskali jedno vyhovuj´ıc´ı ˇc´ıslo. Tak´e m˚ uˇzeme h´azet desetistˇennou kostkou nebo tahat ˇc´ısla 0 aˇz 9 z urny. D´ale bychom postupovali jako v pˇr´ıpadˇe rulety. Tento zp˚ usob generov´an´ı n´ahodn´ ych ˇc´ısel je ovˇsem neefektivn´ı a v praxi nepouˇziteln´ y. Trvalo by totiˇz celou vˇeˇcnost, 4 5 neˇz bychom vygenerovali 10 aˇz 10 potˇrebn´ ych n´ahodn´ ych ˇc´ısel v pˇr´ıpadˇe jednoduˇzˇs´ıch simulac´ı, 106 aˇz 109 v pˇr´ıpadˇe n´aroˇcnˇejˇs´ıch simulac´ı. V minulosti se tak´e pouˇz´ıvaly fyzik´ aln´ı neboli hardwarov´e metody generov´an´ı n´ahodn´ ych ˇc´ısel. Jedn´a se o vyuˇzit´ı n´ahodn´eho fyzik´aln´ıho dˇeje. K tomu se hodil napˇr. rozpad radioktivn´ı l´atky. Mˇeˇrila se doba mezi jednotliv´ ymi rozpady atom˚ u. Mezi dalˇs´ı fyzik´aln´ı gener´atory patˇr´ı tak´e sn´ım´an´ı ˇsumu elektronky. Dnes se pouˇz´ıvaj´ı v´ypoˇcetn´ı neboli softwarov´e gener´atory pseudon´ ahodn´ych ˇ ısla jiˇz nejsou opravdu n´ahodn´a, protoˇze jsou vygenerov´ana poˇc´ısel. C´ moc´ı algoritmu. U vhodn´ ych algoritm˚ u se jejich vlastnosti velice podobaj´ı vlastnostem n´ahodn´ ych ˇc´ısel, proto doch´az´ı ke st´ır´an´ı pojm˚ u n´ ahodn´e a pseudon´ahodn´e ˇc´ıslo. Tyto gener´atory funguj´ı nejˇcastˇeji na stejn´em z´akladn´ım principu. M´ame ˇc´ıslo x0 . Dalˇs´ı ˇc´ısla z´ısk´av´ame pomoc´ı rekurentn´ıho vztahu xn+1 = f (xn ). Dojde ke vzniku posloupnosti pseudon´ahodn´ ych ˇc´ısel. Mus´ıme si vˇsak d´avat pozor, protoˇze takov´e posloupnosti b´ yvaj´ı periodick´e. Po K opakov´an´ıch z´ısk´ame ˇc´ıslo, kter´e se rovn´a ˇc´ıslu xk , kde k < K. Mnoˇzina ˇc´ısel x0 , x1 , x2 , . . . , xK se naz´ yv´a u ´sek aperiodiˇcnosti. Hodnota K je pak d´elka u ´seku aperiodiˇcnosti, P = K − k se naz´ yv´a d´elka periody. K v´ ypoˇctu se obvykle nedoporuˇcuje pouˇz´ıt v´ıce neˇz K ˇc´ısel. V nˇekter´ ych pˇr´ıpadech, kdy je m´alo pravdˇepodobn´e, ˇze se ˇc´ıslo pouˇzije k simulov´an´ı stejn´eho dˇeje, se m˚ uˇze pouˇz´ıt i v´ıce ˇc´ısel. Dnes pro potˇreby metody Monte Carlo nemus´ıme zn´at syst´em generov´an´ı ˇc´ısel. Zpravidla tyto algoritmy neprogramujeme sami, ale jsou souˇca´st´ı matematick´ ych a speci´alnˇe statistick´ ych softwar˚ u. Mezi nˇe se ˇrad´ı napˇr. statistick´ y software R (www.r-project.org), ve kter´em jsou tak´e provedeny simulace v t´eto pr´aci. Pro zaj´ımavost se v z´avˇeru t´eto kapitoly zm´ın´ıme o jedn´e metodˇe generov´an´ı pseudon´ahodn´ ych ˇc´ısel. Konkr´etnˇe, historicky nejstarˇs´ı softwarovou metodou generov´an´ı pseudon´ahodn´ ych ˇc´ısel se stala metoda stˇredu kvadr´atu. Byla navrˇzena Johnem von Neumannem v roce 1951. Mˇejme 2k-m´ıstn´e ˇc´ıslo x0 . Toto ˇc´ıslo umocn´ıme na druhou a vznikne 4k26
m´ıstn´e ˇc´ıslo. Z nˇej vyjmeme prostˇredn´ıch 2k ˇc´ıslic a vznikl´e ˇc´ıslo povaˇzujeme za x1 . Postup opakujeme. Dan´a poslupnost vˇsak rychle degeneruje a rozdˇelen´ı takto vygenerovan´ ych ˇc´ısel se liˇs´ı od rovnomˇern´eho.
7
Modelov´ an´ı hodnot n´ ahodn´ e veliˇ ciny
Z hlediska metody Monte Carlo je velice uˇziteˇcn´e umˇet transformovat hodnoty n´ahodn´e veliˇciny X s rovnomˇern´ ym rozdˇelen´ım na h0, 1i na hodnoty n´ahodn´e veliˇciny Y se zadan´ ym rozdˇelen´ım pravdˇepodobnosti.
7.1
Diskr´ etn´ı n´ ahodn´ a veliˇ cina
Zde uveden´ y postup pro z´ısk´an´ı v´ ybˇerov´ ych hodnot veliˇciny Y je pˇrevzat z [5]. Pokud m´a Y pravdˇepodobnostn´ı funkci P (Y = yk ) = pk , kde k = 1, 2, . . . , n, plat´ı ! m−1 m X X pk < X ≤ pk , m = 1, . . . , n. P (Y = ym ) = pm = P k=1
k=1
Postup hled´an´ı v´ ybˇerov´ ych hodnot n´ahodn´e veliˇciny Y vych´az´ı z t´eto skuteˇcnosti. Pro kaˇzd´e xj z posloupnosti realizac´ı {xj } rovnomˇern´eho rozdˇelen´ı urˇc´ıme takov´e m, aby platilo m−1 X k=1
p k < xj ≤
m X
pk .
k=1
Potom ˇr´ık´ame, ˇze v j−t´em pokuse nastal jev A = (Y = ym ). T´ımto zp˚ usobem z´ısk´ame posloupnost v´ ybˇerov´ ych hodnot veliˇciny Y . Jinak ˇreˇceno, pravdˇepodobnosti pm si m˚ uˇzeme zobrazit pomoc´ı u ´seˇcky o d´elce 1, jej´ıˇz krajn´ı body si oznaˇc´ıme P0 a Pn . Na n´ı zv´ yrazn´ıme bod, jehoˇz vzd´alenost od P0 je rovna velikosti p1 . Oznaˇc´ıme ho P1 . D´ale si oznaˇc´ıme P2 bod, jehoˇz vzd´alenostP od P1 je rovna velikosti p2 , atd. Je zˇrejm´e, ˇze vzd´alenost m Pm od P0 je rovna ´seˇcku si tak´e m˚ uˇzeme vyznaˇcit k=1 pk . Na stejnou u jednotliv´a xj z posloupnosti {xj }. N´aleˇz´ı-li hodnota xj u ´seˇcce ohraniˇcen´e body Pm−1 a Pm ˇr´ık´ame, ˇze v j−t´em pokuse nastal jev A = (Y = ym ). Metoda vych´az´ı z toho, ˇze ˇc´ım je vˇetˇs´ı u ´seˇcka ohraniˇcen´a body Pm−1 a Pm , tedy i pravdˇepodobnost pm , t´ım sp´ıˇse hodnota xj padne na zm´ınˇenou u ´seˇcku.
7.2
Spojit´ a n´ ahodn´ a veliˇ cina
Pˇri generov´an´ı hodnot n´ahodn´e veliˇciny s rozdˇelen´ım pravdˇepodobnosti spojit´eho typu se uˇz´ıv´a n´asleduj´ıc´ı vˇeta z [5]. 27
Vˇ eta 1 Necht’ n´ahodn´a veliˇcina X m´a rovnomˇern´e rozdˇelen´ı na (0, 1) a necht’ −1 G je inverzn´ı funkce k nˇejak´e rostouc´ı spojit´e distribuˇcn´ı funkci G. Potom n´ahodn´a veliˇcina Y = G−1 (X) m´a distribuˇcn´ı funkci G. D˚ ukaz Tvrzen´ı vˇety dostaneme uˇzit´ım definice distribuˇcn´ı funkce a vlastnost´ı funkce G, P (Y ≤ ym ) = P (G−1 (X) ≤ y) = P (X ≤ G(y)) = G(y). M´ame-li tedy k dispozici posloupnost {xj } hodnot n´ahodn´e veliˇciny X s rovnomˇern´ ym rozdˇelen´ım na (0, 1), m˚ uˇzeme pomoc´ı vztah˚ u yj = G−1 (xj ),
G(yj ) = xj
z´ıskat hodnoty n´ahodn´e veliˇciny Y se spojitou a rostouc´ı distribuˇcn´ı funkc´ı G(y). Pˇ r´ıklad 13 Necht’ m´a Y troj´ uheln´ıkov´e rozdˇelen´ı s distribuˇcn´ı funkc´ı 0, x < a, 2 (x−a) a ≤ x < c, (b−a)(c−a) , c−a , x = c, F (x) = b−a (b−x)2 1 − (b−a)(b−c) , c < x ≤ b, 1, x > b.
Transformujte hodnoty n´ahodn´e veliˇciny X ∼ Ro(0, 1) na hodnoty n´ahodn´e veliˇciny Y se zadanou distribuˇcn´ı funkc´ı. ˇ sen´ı Z pˇr´ıkladu 12 v p´at´e kapitole o nˇekter´ Reˇ ych konkr´etn´ıch rozdˇelen´ıch v´ıme, ˇze inverzn´ı funkce k zadan´e distribuˇcn´ı funkci je p , 0 ≤ x < c−a a + x(b − a)(c − a), b−a c−a −1 c, x = , F (x) = b−a p c−a b − (1 − x)(b − a)(b − c), b−a < x ≤ 1.
Z vˇety 1 vypl´ yv´a, ˇze posloupnost hodnot veliˇciny Y je d´ana vztahem p 0 ≤ xj < c−a , a + xj (b − a)(c − a), b−a c−a c, x = , yj = j b−a p b − (1 − xj )(b − a)(b − c), c−a < xj ≤ 1. b−a 28
Pˇ r´ıklad 14 Transformujte hodnoty n´ahodn´e veliˇciny X ∼ Ro(0, 1) na hodnoty n´ahodn´e veliˇciny Y s hustotou 0, y ≤ 0, g(y) = −λy λe , y > 0. ˇ sen´ı Nejprve vypoˇc´ıt´ame odpov´ıdaj´ıc´ı distribuˇcn´ı funkci ke stanoven´e Reˇ hustotˇe (viz kapitola 5.2), Z y y λe−λx dx = −e−λx 0 = −e−λy + e−0λ = 1 − e−λy , 0
tedy
F (y) =
0, x ≤ 0, −λy 1 − e , y > 0.
Z toho v´ıme, ˇze 1 − e−λyj = xj . Nalezen´ı inverzn´ı funkce k t´eto distribuˇcn´ı funkci odpov´ıd´a vyj´adˇren´ı yj , kter´e hled´ame. Ze vztahu 1 − xj = e−λyj ⇒ ln(1 − xj ) = −λyj dojdeme k v´ ysledku
8
1 yj = − ln(1 − xj ). λ
Testov´ an´ı norm´ aln´ıho rozdˇ elen´ı
Jiˇz zmiˇ novan´e norm´aln´ı rozdˇelen´ı (viz kapitola 5.3) patˇr´ı mezi kl´ıˇcov´a rozdˇelen´ı matematick´e statistiky. Proto se mnohdy setk´av´ame s ot´azkou, zda m´a nˇejak´a zkouman´a n´ahodn´a veliˇcina X norm´aln´ı rozdˇelen´ı. K zodpovˇezen´ı samozˇrejmˇe potˇrebujeme dostateˇcn´ y poˇcet jej´ıch realizac´ı x1 , x2 , . . . , xn (realizace tzv. n´ ahodn´eho v´ybˇeru), se kter´ ymi m˚ uˇzeme d´ale pracovat. Pod´ıvejme se na testov´an´ı statistick´ ych hypot´ez rovnou v kontextu testov´an´ı normality n´ahodn´eho v´ ybˇeru, potaˇzmo veliˇciny X. Hypot´eze, kter´a ˇr´ık´a, ˇze m´a veliˇcina X norm´aln´ı rozdˇelen´ı, ˇr´ık´ame nulov´a hypot´eza a znaˇc´ıme ji H0 . Naopak HA znaˇc´ıme tzv. alternativn´ı hypot´ezu, kter´a tvrd´ı, ˇze n´ahodn´a veliˇcina X nem´a norm´aln´ı rozdˇelen´ı. Rozhodnut´ı o H0 , kterou zam´ıt´ame nebo ji nelze zam´ıtnout, prov´ad´ıme pomoc´ı testovac´ı statistiky T . Hodnotu T z´ısk´ame pomoc´ı vztahu T = h(X1 , X2 , . . . , Xn ), 29
kde X1 , X2 , . . . , Xn jsou navz´ajem nez´avisl´e n´ahodn´e veliˇciny se stejn´ ym rozdˇelen´ım jako m´a n´ahodn´a veliˇcina X (n´ahodn´ y v´ ybˇer o rozsahu n) veliˇcina T je tak vlastnˇe funkc´ı dan´eho n´ahodn´eho v´ ybˇeru. Za X1 , X2 , . . . , Xn dosazujeme hodnoty realizac´ı n´ahodn´e veliˇciny X, x1 , x2 , . . . , xn . T´ımto postupem z´ısk´ame konkr´etn´ı realizaci n´ahodn´e veliˇciny T , kterou znaˇc´ıme t. Zav´ad´ıme tak´e ˇc´ıslo α, kter´e naz´ yv´ame hladina testu. Rovn´a se n´ami zvolen´e hodnotˇe pravdˇepodobnosti, ˇze platnou H0 pomoc´ı realizace statistiky T (nespr´avnˇe) zam´ıtneme ve prospˇech alternativn´ı hypot´ezy HA . Pro pˇredstavu lze uv´est nejˇcastˇejˇs´ı pouˇz´ıvan´e hodnoty hladiny testu α, a to 0, 05; 0, 1 a 0, 01. Po v´ ypoˇctu hodnoty testovac´ı statistiky, t, stanov´ıme velikost α0 neboli p-hodnoty. Odpov´ıd´a pravdˇepodobnosti, ˇze bychom pˇri testov´an´ı normality n´ahodn´e veliˇciny dostali hodnotu testovac´ı statistiky, kter´a jeˇstˇe v´ıce odporuje nulov´e hypot´eze. Hladina testu α je tedy stabiln´ı p-hodnota, se kterou p-hodnoty z´ıskan´e pˇri testov´an´ı porovn´av´ame. Jestliˇze plat´ı, ˇze α0 < α, H0 zam´ıt´ ame. Jestliˇze α0 ≥ α, H0 nelze zam´ıtnout.
8.1
Anderson-Darling˚ uv test normality
V dalˇs´ım budeme uvaˇzovat jeden konkr´etn´ı test normality, kter´ y se v praxi ´ patˇr´ı k nejˇcastˇeji uˇz´ıvan´ ym. Udaje o Anderson-Darlingovu testu jsou pˇrevzaty z [7]. Pro potˇreby testu nejprve z realizace n´ahodn´eho v´ yˇeru odhadneme parametry µ a σ 2 norm´aln´ıho rozdˇelen´ı (testov´an´ı totiˇz prov´ad´ıme za pˇredpokladu platnosti nulov´e hypot´ezy). Odhad parametru µ odpov´ıd´a aritmetick´emu pr˚ umˇeru x1 , x2 , . . . , xn , n
µ∼x=
1X xi . n i=1
Odhad parametru σ z´ısk´ame pomoc´ı smˇerodatn´e odchylky s, v u n u1 X σ∼s=t (xi − x)2 . n i=1 Pomoc´ı poˇc´ıtaˇce a distribuˇcn´ı funkce norm´aln´ıho normovan´eho rozdˇelen´ı d´ale z´ısk´ame hodnoty xi − x = zi . Φ s Ty dosad´ıme do testovac´ı statistiky Anderson-Darlingova testu normality, ! n 1X 25 4 − −1 Qα = (2r − 1)[ln zi + ln(1 − zn+1−r ) + n] . n2 n n r=1 30
Konkr´etn´ı realizaci Qa , tedy qa , porovn´ame s tabulkov´ ymi hodnotami, abychom zjistili pˇribliˇznou velikost p-hodnoty α0 a mohli dospˇet k rozhodnut´ı o nulov´e hypot´eze. Porovn´an´ım α0 s n´ami urˇcenou hladinou testu α zjist´ıme, zda nulovou hypot´ezu H0 zam´ıt´ame ˇci ji nelze zam´ıtnout. Napˇr´ıklad hladinˇe testu 0,1 odpov´ıd´a realizace n´ahodn´e veliˇciny Qa hodnotˇe qa;0,1 = 0, 656, pro α = 0, 05 je urˇcena hodnota qa;0,05 = 0, 787 a pro α = 0, 01 je d´ano qa;0,01 = 1, 092. Pˇri pouˇzit´ı Anderson-Darlingova testu se obvykle pouˇz´ıv´a porovn´an´ı s tˇemito hodnotami. Je–li realizace testovac´ı statistiky vˇetˇs´ı neˇz dan´a kritick´a hodnota, nulovou hypot´ezu na pˇr´ısluˇsn´e hladinˇe zam´ıt´ame. Nev´ yhodou se vˇsak st´av´a to, ˇze nem´ame pˇr´ıliˇs velkou pˇredstavu o jiˇz zm´ınˇen´e p-hodnotˇe. K tomu, abychom tuto hodnotu znali, bychom vˇsak potˇrebovali distribuˇcn´ı funkci n´ahodn´e veliˇciny Qa , kter´a se ovˇsem v praxi pro nemoˇznost explicitn´ıho vyj´adˇren´ı neuˇz´ıv´a. Pro jej´ı pˇribliˇzn´e urˇcen´ı m˚ uˇzeme uˇz´ıt metodu Monte Carlo. Staˇc´ı nagenerovat dostateˇcn´e mnoˇzstv´ı R n´ahodn´ ych v´ ybˇer˚ u o dan´em rozsahu n z norm´aln´ıho rozdˇelen´ı (d´ıky konstrukci AndersonDarlingova testu nez´aleˇz´ı na hodnot´ach parametr˚ u tohoto rozdˇelen´ı, m˚ uˇzeme tedy bez u ´jmy na obecnosti generovat z norm´aln´ıho normovan´eho rozdˇelen´ı). Pot´e na tyto v´ ybˇery aplikujeme Anderson-Darling˚ uv test a dostaneme tak R realizac´ı testovac´ı statistiky Qa . D´ıky takto vytvoˇren´ ym hodnot´am n´ahodn´e ˇ ım v´ıce v´ veliˇciny Qa jsme schopni urˇcit pˇribliˇzn´e rozdˇelen´ı Qa . C´ ybˇer˚ u nagenerujeme, t´ım v´ıce se dost´av´ame ke skuteˇcn´emu rozdˇelen´ı Qa . To se v naˇs´ı situaci projev´ı tak, ˇze budeme schopni st´ale l´epe odhadnout skuteˇcnou phodnotu pro realizaci testovac´ı statistiky v naˇsem konkr´etn´ım pˇr´ıpadˇe. Tento odhad je pˇritom roven relativn´ı ˇcetnosti hodnot Qa vˇetˇs´ıch neˇz realizace testovan´eho n´ahodn´eho v´ ybˇeru. Jak ale urˇcit ono dostateˇcn´e mnoˇzstv´ı R nagenerovan´ ych v´ ybˇer˚ u o rozsahu n, abychom obdrˇzeli odhad hustoty Qa s velkou pˇresnost´ı, kter´a se n´aslednˇe projev´ı na vyhovuj´ıc´ı pˇresnosti odhadu p-hodnot? Nechceme totiˇz souˇcasnˇe generov´an´ı v´ ybˇer˚ u a n´asledn´ ym v´ ypoˇct˚ um hodnot testovac´ı statistiky vˇenovat pˇriliˇs mnoho ˇcasu, coˇz je bohuˇzel daˇ n jak´ekoli rozs´ahlejˇs´ı simulace.
8.2
Odhad p-hodnot v Anderson-Darlingovˇ e testu
K u ´ˇcelu z konce pˇredchoz´ı kapitoly byla zapotˇreb´ı funkce adtest z knihovny robCompositions ve statistick´em softwaru R. Byla pˇrepracovan´a tak, aby program v softwaru R po spuˇstˇen´ı nageneroval R v´ ybˇer˚ u z norm´aln´ıho normovan´eho rozdˇelen´ı o rozsahu n, pro kaˇzd´ y v´ ybˇer se spoˇc´ıtala hodnota Anderson-Darlingova testu a v´ ysledky se porovnaly s hodnotou qa;0,1 = 0, 656 (viz pˇriloˇzen´e soubory). D´ale program urˇc´ı pomˇer poˇctu hodnot xi pro i = 1, 2, . . . , n v kaˇzd´em v´ ybˇeru, kter´e jsou vˇetˇs´ı neˇz 0, 656 ku poˇctu R. Ide´alnˇe 31
ˇ ım vˇetˇs´ı je R, t´ım v´ıce by se by mˇel tento pomˇer odpov´ıdat ˇc´ıslu 0, 01. C´ pomˇer mˇel tomuto ˇc´ıslu pˇribliˇzovat. Uveden´ y postup se opakuje celkem N kr´at, aby byly dosaˇzen´e v´ ysledky simulace pokud moˇzno co nejstabilnˇejˇs´ı. Z N obdrˇzen´ ych odhad˚ u p-hodnot vypoˇc´ıt´a program pr˚ umˇer a tak´e urˇc´ı odpov´ıdaj´ıc´ı smˇerodatnou odchylka. Hodnota pr˚ umˇeru a smˇerodatn´e odchylky se pro kaˇzd´ y ze zvolen´ ych rozsah˚ u v´ ybˇer˚ u zaznaˇc´ı do grafu, viz obr´azky 3-5. Pomoc´ı nich si kaˇzd´ y m˚ uˇze udˇelat pˇredstavu o tom, jak´e R staˇc´ı pro dan´a n. Jiˇz na prvn´ı pohled vid´ıme, ˇze se p-hodnoty pro r˚ uzn´e hodnoty R st´ale pohybuj´ı kolem 0, 01, coˇz je spr´avnˇe, hodnoty smˇerodatn´ ych odchylek ovˇsem ˇ ım menˇs´ı je pˇritom smˇerodatn´a odchylka, m˚ klesaj´ı. C´ uˇzeme si b´ yt v´ıce jisti, ˇze pˇri konkr´etn´ı realizaci Anderson-Darlingova testu se zvolen´ ym poˇctem R simulac´ı dostaneme pˇresnˇejˇs´ı odhad p-hodnoty.
0.10 means 0.05 0.00
0.00
0.05
means
0.10
0.15
n=20
0.15
n=10
3
4
5
6
7
8
1
2
3
4
5
1:length(repet)
1:length(repet)
n=30
n=50
6
7
8
6
7
8
0.10 means 0.05 0.00
0.00
0.05
means
0.10
0.15
2
0.15
1
1
2
3
4
5
6
7
8
1
1:length(repet)
2
3
4
5
1:length(repet)
Obr´azek 3: V´ ysledky simulace p-hodnot (jejich pr˚ umˇery jsou oznaˇceny ◦ a smˇerodatn´e odchylky △) pˇri r˚ uzn´ ych volb´ach R pro n = 10, 20, 30, 50. Ke generov´an´ı p-hodnot testu bylo uˇzito pro kaˇzdou z voleb rozsahu v´ ybˇeru n = 10, 20, 30, 50, 100, 200, 300, 500, 1000, 2000 a stabiln´ıch hod32
0.10 means 0.05 0.00
0.00
0.05
means
0.10
0.15
n=200
0.15
n=100
3
4
5
6
7
8
1
2
3
4
5
1:length(repet)
1:length(repet)
n=300
n=500
6
7
8
6
7
8
0.10 means 0.05 0.00
0.00
0.05
means
0.10
0.15
2
0.15
1
1
2
3
4
5
6
7
8
1
1:length(repet)
2
3
4
5
1:length(repet)
Obr´azek 4: V´ ysledky simulace p-hodnot (jejich pr˚ umˇery jsou oznaˇceny ◦ a smˇerodatn´e odchylky △) pˇri r˚ uzn´ ych volb´ach R pro n = 100, 200, 300, 500. not parametr˚ u N = 1000 a R = 50, 100, 200, 300, 500, 1000, 2000, 5000 (tˇemto v grafech odpov´ıd´a k´odov´e oznaˇcen´ı 1, . . . , 8). Kaˇzd´e volbˇe R v grafu odpov´ıd´a pr˚ umˇernou hodnota odhadnut´e p-hodnoty a odpov´ıdaj´ıc´ı smˇerodatn´a odchylka. Jak je vidˇet, rozumn´e velikosti odchylek se objevuj´ı, kdyˇz je velikost R v ˇra´du tis´ıc˚ u, kdy se jiˇz setrval´ y pokles smˇerodatn´ ych odchylek v´ıcem´enˇe stabilizuje, a to bez ohledu na dan´ y rozsah v´ ybˇeru n. K urˇcov´an´ı p-hodnot lze proto jako doln´ı hranici doporuˇcit alespoˇ n R = 1000. V pˇr´ıpadˇe velk´ ych hodnot n a R (v ˇra´du tis´ıc˚ u) uˇz vˇsak v´ ypoˇcty trvaj´ı nˇekolik hodin. Ovˇsem, na druhou stranu, testujeme-li pro n = 10, trv´a v´ ypoˇcet pouze nˇekolik minut i pro R = 5000, proto nen´ı d˚ uvod pˇri niˇzˇs´ıch hodnot´ach n uˇz´ıvat hodnotu R menˇs´ı neˇz 5000. Na grafech si m˚ uˇzete povˇsimnout toho, ˇze pr˚ umˇery p-hodnot, kter´e by se mˇely bl´ıˇzit k 0,1, se u n = 10 k hodnotˇe 0,1 skuteˇcnˇe bl´ıˇz´ı. Pot´e zaˇc´ınaj´ı pro vyˇsˇs´ı n stoupat a potom zase klesat. U n = 100 se pr˚ umˇery opˇet velmi 33
0.10 means 0.05 0.00
0.00
0.05
means
0.10
0.15
n=2000
0.15
n=1000
1
2
3
4
5
6
7
8
1
1:length(repet)
2
3
4
5
6
7
8
1:length(repet)
Obr´azek 5: V´ ysledky simulace p-hodnot (jejich pr˚ umˇery jsou oznaˇceny ◦ a smˇerodatn´e odchylky △) pˇri r˚ uzn´ ych volb´ach R pro n = 1000, 2000. bl´ıˇz´ı k 0, 1 a pro vyˇsˇs´ı n klesaj´ı. Tento neˇza´douc´ı jev je zˇrejmˇe zp˚ usoben povahou gener´atoru n´ahodn´ ych ˇc´ısel v softwaru R. Pro velmi pˇresn´a urˇcen´ı p-hodnot u nˇekter´ ych n se proto zˇrejmˇe nehod´ı. Odch´ ylen´ı od 0,1 vˇsak nen´ı, se zahrnut´ım informace o smˇerodatn´e odchylce, pˇri vyˇsˇs´ıch hodnot´ach R aˇz tak dramatick´e, takˇze vˇetˇsinˇe uˇzivatel˚ u jistˇe bohatˇe postaˇc´ı k relevantn´ımu rozhodnut´ı o nulov´e hypot´eze.
34
Z´ avˇ er Na z´avˇer t´eto pr´ace zhodnot´ıme splnˇen´ı tˇr´ı z´akladn´ıch c´ıl˚ u, kter´e jsem si pˇred jej´ı tvorbou vytyˇcila. Prvn´ım c´ılem bylo popsat metodu Monte Carlo a z´akladn´ı pojmy nutn´e k jej´ımu pochopen´ı. Vˇeˇr´ım, ˇze nejen d´ıky slovn´ımu vysvˇetlen´ı, ale tak´e pomoc´ı uveden´ ych pˇr´ıklad˚ u, se toto povedlo srozumitelnou formou. Nejl´epe vˇsak tento aspekt jistˇe posoud´ı s´am ˇcten´aˇr. Tato ˇca´st pr´ace se sice z ˇcasov´eho hlediska stala tou nejn´aroˇcnˇejˇs´ı, ale jinak nebyla aˇz tak obt´ıˇzn´a jako ˇca´st n´asleduj´ıc´ı. Kromˇe toho mˇe velice bavilo pomalu pronikat do taj˚ u teorie pravdˇepodobnosti, n´aslednˇe si kvalitu sv´eho pochopen´ı problematiky ovˇeˇrovat na vysvˇetlen´ı v t´eto pr´aci a nakonec tvoˇrit i pˇr´ıklady. Dalˇs´ı c´ıle byly uk´azat vyuˇzit´ı metody Monte Carlo pˇri simulac´ıch rozdˇelen´ı pravdˇepodobnost´ı n´ahodn´ ych veliˇcin a pˇri stanoven´ı optim´aln´ıho postupu pro odhady p-hodnot pˇri testov´an´ı normality n´ahodn´eho v´ ybˇeru pomoc´ı Anderson-Darlingova testu. Tyto dva c´ıle jsem splnila na konci pr´ace. Bylo tˇreba nagenerovat obr´azky, z nich vyˇc´ıst potˇrebn´e u ´daje, zhodnotit je a nakonec si myˇslenky utˇr´ıdit tak, abych byla schopna tyto postupy co nejl´epe popsat. Tato ˇca´st pr´ace se pro mˇe stala bez pochyby tou celkovˇe nejtˇeˇzˇs´ı. Domn´ıv´am se, ˇze v´ ysledky ze z´avˇeru pr´ace mohou b´ yt v praxi uˇziteˇcn´e a snadno pˇrenositeln´e i na dalˇs´ı uˇz´ıvan´e testy normality. Konkr´etn´ım v´ ysledkem je pˇritom napˇr´ıklad skuteˇcnost, ˇze pro pˇresnost urˇcen´ı p-hodnot je zˇrejmˇe podstatn´ y pouze poˇcet proveden´ ych simulac´ı R, nikoli ovˇsem rozsah n uvaˇzovan´eho v´ ybˇeru. Pokud tedy nˇekomu pˇri testov´an´ı normality nebude staˇcit pouh´e porovn´av´an´ı kritick´e hodnoty z tabulky s realizac´ı testovac´ı statistiky odpov´ıdaj´ıc´ı dan´e hladinˇe testu, staˇc´ı vyuˇz´ıt v´ yˇse uveden´e poznatky. Pr´ace se d´a tak´e d´ale rozv´ıjet, hlavnˇe pˇri studiu dalˇs´ıch testovac´ıch statistik, jejichˇz rozdˇelen´ı nen´ı vyj´adˇreno explicitnˇe. Douf´am, ˇze tato pr´ace dobˇre poslouˇz´ı z´ajemc˚ um o tuto problematiku a pom˚ uˇze jim nejen pˇri jej´ım pochopen´ı, ale tak´e dalˇs´ım rozv´ıjen´ı nˇekter´ ych myˇslenek v n´ı uveden´ ych.
35
Reference [1] FABIAN, F., KLUIBER, Z., Metoda Monte Carlo. Praha: Prospektorum, 1998. ´ P., Z´aklady pravdˇepodobnosti a matematick´e statistiky. [2] KUNDEROVA, Olomouc: VUP, 2004. ´ M., Statistika (uˇcebn´ı text). Brno: Masarykova univerzita, [3] BUD´IKOVA, 2004. ´ ˇ EP ˇ AN, ´ [4] ZVARA, K., ST J., Pravdˇepodobnost a matematick´ a statistika. Praha: MATFYZPRESS, 2006. ´ P., Metody Monte Carlo. Olomouc: RUP, 1982. [5] KUNDEROVA, [6] VIRIUS, M., Aplikace matematick´e statistiky - Metoda Monte Carlo. ˇ Praha: CVUT, 1998. [7] PAWLOWSKY-GLAHN, V., EGOZCUE, J.J., TOLOSANADELGADO, R., Lecture notes on compositional data analysis. [Cit. 5.4.2012]. Dostupn´e z URL: http://www.sediment.unigoettingen.de/staff/tolosana/extra/CoDa.pdf [8] http://www.angis.cz/angis revue/ar clanek.php?CID=127 [Cit. 13.10.2011] [9] http://www.zdrav.cz/modules.php?op=modload&name=News &file=article&sid=8460 [Cit. 13.10.2011] [10] http://www.en.wikipedia.org/wiki/Triangular distribution [Cit. 10.1.2012] [11] http://cs.wikipedia.org/wiki/Buffonova jehla [Cit. 2.10.2011]
36