Rozdˇelen´ı pravdˇepodobnosti pro aplikace
1
Rozdˇ elen´ı pravdˇ epodobnosti pro aplikace ´ Uvodem. V kapitole vˇenovan´e n´ ahodn´ ym veliˇcin´am jsme se obecnˇe zab´ yvali funkˇcn´ımi a ˇc´ıseln´ ymi charakteristikami n´ ahodn´ ych veliˇcin a jejich vlastnostmi. Nyn´ı se budeme zaj´ımat o typick´e n´ahodn´e veliˇciny, pˇresnˇeji o typick´ a rozdˇ elen´ı pravdˇ epodobnosti n´ ahodn´ ych veliˇ cin. M´ısto rozdˇelen´ı pravdˇepodob” nosti n´ahodn´ ych veliˇcin” budeme d´ ale ˇcasto kr´atce uv´adˇet rozdˇelen´ı”. ” Pˇripomeˇ nme si, ˇze v 1. semestru studia na FSI VUT jsou v pˇredmˇetu Matematika 1 prob´ır´any re´aln´e funkce jedn´e re´ aln´e promˇenn´e a jejich vlastnosti jsou rozeb´ır´any nejen obecnˇe, ale i pro jednotliv´e skupiny element´arn´ıch funkc´ı, kter´e se pak pouˇz´ıvaj´ı v ˇradˇe inˇzen´ yrsk´ ych aplikac´ı. Podobnˇe za kapitolou vˇenovanou n´ ahodn´ ym veliˇcin´am a rozdˇelen´ım pravdˇepodobnosti z obecn´eho pohledu nyn´ı n´ asleduje kapitola, ve kter´e n´as budou zaj´ımat typick´a rozdˇelen´ı pravdˇepodobnosti, jeˇz jsou vhodn´ ymi matematick´ ymi modely ˇcast´ ych n´ahodn´ ych pokus˚ u. Rozdˇelen´ı pravdˇepodobnosti m˚ uˇzeme zjednoduˇsenˇe klasifikovat jako diskr´etn´ı, spojit´a a sm´ıˇsen´a (viz kapitola zav´adˇej´ıc´ı n´ ahodn´e veliˇciny). V t´eto kapitole se omez´ıme na nˇ ekolik z´ akladn´ıch diskr´ etn´ıch a spojit´ ych rozdˇ elen´ı pravdˇ epodobnosti v rozsahu podle sylabu pˇ redmˇ etu Matematika 4. ˇ aˇr zaj´ımaj´ıc´ı se o podrobnˇejˇs´ı Rozˇsiˇruj´ıc´ı informace o dalˇs´ıch rozdˇelen´ıch jsou odliˇ seny znaˇ cen´ım. Cten´ informace a dalˇs´ı rozdˇelen´ı pak najde v´ıce informac´ı v odborn´e literatuˇre [17] a na internetu [20].
A. Typick´ a diskr´ etn´ı rozdˇ elen´ı pravdˇ epodobnosti 1. Alternativn´ı (Bernoulliovo) rozdˇ elen´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ahodn´ a veliˇcina X m´a alternativn´ı rozdˇelen´ı pravdˇepodobnosti zapisujeme X ∼ A(p), kde p ∈ h0; 1i a z´ apis ˇcteme n´ ahodn´ a veliˇ cina X m´ a alternativn´ı rozdˇ elen´ı pravdˇ epo” dobnosti s parametrem p”. P´ısmeno A tedy znaˇc´ı n´azev rozdˇelen´ı, p´ısmeno p oznaˇcuje jeho parametr. V konkr´etn´ıch pˇr´ıkladech je oznaˇcen´ı parametru nahrazeno jeho ˇc´ıselnou hodnotou. Nˇekteˇr´ı autoˇri vyhrazuj´ı p´ısmeno p pouze pro oznaˇcen´ı pravdˇepodobnostn´ı funkce a pro odliˇsen´ı pouˇz´ıvaj´ı znaˇcen´ı A(π). My budeme pˇredpokl´ adat, ˇze ze souvislosti bude zˇrejm´e, v jak´em v´ yznamu byl pouˇzit symbol p. Obecnˇ e o znaˇ cen´ı. Poznamenejme, ˇze obdobn´e znaˇcen´ı je obvykl´e i pro ostatn´ı rozdˇelen´ı pravdˇepodobnosti. P´ısmeno oznaˇcuj´ıc´ı n´ ahodnou veliˇcinu (zde X) je n´asledov´ano symbolem ∼, kter´ y ˇcteme m´a ” rozdˇelen´ı”, a d´ ale n´ asleduje oznaˇcen´ı konkr´etn´ıho rozdˇelen´ı p´ısmenem (nebo v´ıce p´ısmeny) a symbolick´ y z´apis uzav´ır´ a seznam parametr˚ u rozdˇelen´ı pravdˇepodobnosti v kulat´ ych z´avork´ach, oddˇelen´ y ˇc´arkami nebo stˇredn´ıky, pokud by mohlo doj´ıt k z´amˇenˇe s desetinnou ˇc´arkou. Jin´ y n´ azev. V cizojazyˇcn´e literatuˇre najdeme alternativn´ı rozdˇelen´ı pod n´azvem Bernoulliovo rozdˇ elen´ı a znaˇc´ı se X ∼ Be(p). Pouˇ zit´ı. Rozdˇelen´ı je pouˇz´ıv´ ano k modelov´an´ı jednoho n´ahodn´eho pokusu, kter´ y m´a dva moˇzn´e ˇc´ıseln´e v´ ysledky: v´ ysledek 1 (´ uspˇech) s pravdˇ epodobnost´ı p a v´ ysledek 0 (ne´ uspˇech) s pravdˇ epodobnost´ı 1 − p. Vid´ıme, ˇze parametr rozdˇelen´ı p m´ a v´ yznam pravdˇepodobnosti u ´spˇechu, tj. p = p(1) = P (X = 1). Funkˇ cn´ı charakteristiky. Jak jiˇz v´ıme, kaˇzd´e rozdˇelen´ı je jednoznaˇcnˇe urˇceno funkˇcn´ı charakteristikou. Pro diskr´etn´ı rozdˇelen´ı pravdˇepodobnosti budeme uv´adˇet zejm´ena pravdˇepodobnostn´ı funkce p(x). Pˇripomeˇ nme, ˇze p(x) a F (x) byly zavedeny tak, ˇze jej´ım definiˇcn´ım oborem je mnoˇzina vˇsech re´aln´ ych ˇc´ısel R. D´ale pro pravdˇepodobnostn´ı prostor (Ω, S, P) a X : Ω −→ R takov´e, ˇze {ω | X(ω) = x} ∈ S a {ω | X(ω) < x} ∈ S plat´ı, ˇze ∀x ∈ R : p(x) = P (X = x) = P ({ω ∈ Ω | X(ω) = x}) a F (x) = P (X < x) = P ({ω ∈ Ω | X(ω) < x}). RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
2
Pravdˇ epodobnostn´ı funkce: 1 − p pro x = 0 p pro x = 1 p(x) = P (X = x) = 0 jinde
(1)
B´ yv´a pouˇz´ıv´ an i kompaktnˇejˇs´ı z´ apis pro x ∈ {0; 1} : p(x) = px (1 − p)1−x . Distribuˇ cn´ı funkce: pro x ≤ 0 0 1 − p pro x ∈ (0, 1i F (x) = P (X < x) = 1 pro x > 1
Obr´ azek 1:
p(x) pro A(0, 3)
F (x) pro A(0, 3)
(2)
Jakob Bernoulli
ˇ ıseln´ C´ e charakteristiky. Je v´ yhodou, ˇze pro jednotliv´a rozdˇelen´ı pravdˇepodobnosti lze ˇcasto odvodit vztahy pro v´ ypoˇcet ˇc´ıseln´ ych charakteristik pomoc´ı parametr˚ u rozdˇelen´ı a nemus´ıme pak pˇri konkr´etn´ıch v´ ypoˇctech opakovanˇe pouˇz´ıvat obecn´e vzorce. stˇ redn´ı hodnota: rozptyl:
E(X) D(X)
= p = p(1 − p)
(3) (4)
Degenerovan´ e rozdˇ elen´ı. V pˇr´ıpadˇe X ∼ A(0) hovoˇr´ıme o degenerovan´em rozdˇelen´ı a na obr´azku 2 vid´ıme n´aˇcrt graf˚ u pravdˇepodobnostn´ı a distribuˇcn´ı funkce.
Obr´ azek 2: Degenerovan´e rozdˇelen´ı, n´astin grafu p(x) a F (x). Zaj´ımavosti. Rozdˇelen´ı dostalo sv´e druh´e a exoticky znˇej´ıc´ı zahraniˇcn´ı jm´eno po ˇsv´ ycarsk´em matematikovi Jakobu Bernoullim (1654–1705) [21], kter´ y se zab´ yval posloupnostmi nez´avisl´ ych n´ahodn´ ych pokus˚ u modelovateln´ ych t´ımto rozdˇelen´ım. Jakob Bernoulli patˇril mezi osm zn´am´ ych matematik˚ u rodiny Bernoulliov´ ych. Studoval teologii, matematiku a astronomii. Bˇehem sv´ ych cest po Evropˇe (1676–1682) RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
3
se sezn´amil s v´ ysledky pˇredn´ıch vˇedc˚ u t´e doby. Osvojil si zejm´ena zejm´ena v´ ysledky Gottfrieda Leibnize v oblasti kalkulu (diferenci´ aln´ıho a integr´aln´ıho poˇctu). Jako vzpom´ınku na pˇredmˇet Matematika III uved’me, ˇze v roce 1690, Jakob Bernoulli vyvinul postup ˇreˇsen´ı obyˇcejn´ ych diferenci´aln´ıch rovnic se separovan´ ymi promˇenn´ ymi. Jeho nejzn´ amˇejˇs´ı prac´ı je Ars Conjectandi, publikovan´a posmrtnˇe v roce 1713, shrnuj´ıc´ı v´ ysledky v oblasti teorie pravdˇepodobnosti a uv´adˇej´ıc´ı p˚ uvodn´ı d˚ ukazy. Pˇ r´ıklady: (1) Vlastn´ım v´ ypoˇctem odvod’te vztah (3) pro E(X). p (2) Vlastn´ım v´ ypoˇctem odvod’te vztah (4) pro D(X) a smˇerodatnou odchylku D(X). (3) Modelujte n´ ahodn´ y hod symetrickou minc´ı pomoc´ı alternativn´ıho rozdˇelen´ı. Urˇcete hodnotu p. Sv˚ uj n´azor podpoˇrte 100 hody vhodnˇe zvolenou vlastn´ı minc´ı (Autor textu neodpov´ıd´a za ztr´atu mince pˇri kon´ an´ı pokusu.). (4) Pomoc´ı n´ ahodn´e veliˇciny Y a line´ arn´ı transformace n´ahodn´e veliˇciny X s alternativn´ım rozdˇelen´ım popiˇste n´ ahodn´ y pokus u kter´eho v´ ysledek 2 nastane s pravdˇepodobnost´ı 0, 3 a v´ ysledek 5 nastane s pravdˇepodobnost´ı 0, 7. Z´ avˇ erem. Jedn´ a se o znaˇcnˇe trivi´ aln´ı rozdˇelen´ı, kter´e je ale z´akladem pro sloˇzitˇejˇs´ı rozdˇelen´ı. Ot´azka poloˇzen´a u zkouˇsky na toto rozdˇelen´ı obvykle svˇedˇc´ı o naprost´em vyˇcerp´an´ı zkouˇsej´ıc´ıho a o zoufal´e snaze pomoci studentovi uspˇet. Je pak velmi smutn´e, pokud student zatvrzel´ ym mlˇcen´ım tuto pomocnou ruku odm´ıtne.
2. Klasick´ e (diskr´ etn´ı rovnomˇ ern´ e) rozdˇ elen´ı Znaˇ cen´ı.
Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a klasick´e rozdˇelen´ı, znaˇc´ıme X ∼ C(n), kde n ∈ N.
Pouˇ zit´ı. Klasick´e rozdˇelen´ı pravdˇepodobnosti z´ıskalo sv´e jm´eno, protoˇze n´am umoˇzn ˇuje modelovat u ´lohy klasick´e pravdˇepodobnosti. Pˇripomeˇ nme, ˇze se jedn´a o u ´lohy, ve kter´ ych se k v´ ypoˇctu pravdˇepodobnosti jevu A pouˇz´ıv´ a vztah |A| m poˇcet pˇr´ızniv´ ych v´ ysledk˚ u P (A) = = = |Ω| n poˇcet vˇsech moˇzn´ ych v´ ysledk˚ u a jedn´a se o modelov´ an´ı n´ ahodn´ ych pokus˚ u, kter´e maj´ı koneˇcn´ y poˇcet n stejnˇe moˇzn´ ych v´ ysledk˚ u. Funkˇ cn´ı charakteristiky. Z v´ yˇse uveden´eho vypl´ yv´a pravdˇepodobnost n1 pro element´arn´ı (zde jednoprvkov´e) jevy, a tedy i n´ asleduj´ıc´ı vztah (1) pro pravdˇepodobnostn´ı funkci. Distribuˇcn´ı funkci zde neuv´ad´ıme, pouze uk´ azku jej´ıho grafu (viz obr. 3), tak jako pro p(x).
Obr´ azek 3: p(x)
F (x)
Pravdˇ epodobnostn´ı funkce: ( p(x) =
RNDr. Pavel Popela, Ph.D.
1 n
pro x = 1, 2, . . . , n
0
jinde
(5)
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
4
ˇ ıseln´ C´ e charakteristiky. stˇ redn´ı hodnota:
E(X) =
n+1 2
(6)
rozptyl:
D(X)
n2 − 1 12
(7)
=
Zaj´ımavosti. Zaˇc´ atky klasick´e pravdˇepodobnosti b´ yvaj´ı spojov´any s komunikac´ı matematik˚ u Fermata a Pascala v 17.stolet´ı. Jejich korespondenci se pokusil dovednˇe rekonstruovat” vynikaj´ıc´ı mad’arsk´ y ” odborn´ık v oblasti teorie pravdˇepodobnosti R´enyi [5], autor Dialog˚ u o matematice”. Z´ajemc˚ um o hlubˇs´ı ” pozn´an´ı myˇslenek teorie pravdˇepodobnosti je vˇrele doporuˇcujeme (R´enyi, A.: Dialogy o matematice. Praha, Mlad´ a fronta, 1980).
Obr´azek 4: Pierre Fermat (1601-1665), Blaise Pascal (1623-1662),
Alfr´ed R´enyi (1921-1970)
Posloupnost realizac´ı hodnot diskr´etn´ıho rovnomˇern´eho rozdˇelen´ı ˇcten´aˇr obdrˇz´ı, pokud ve vˇetˇsinˇe programovac´ıch jazyk˚ u vyuˇzije z´ akladn´ı n´ahodn´ y gener´ator (pˇresnˇeji ve vˇetˇsinˇe pˇr´ıpad˚ u kongruenˇcn´ı gener´ator posloupnosti pseudon´ ahodn´ ych ˇc´ısel). Z´ajemc˚ um o problematiku n´ ahodn´ ych gener´ator˚ u doporuˇcujeme zprvu prohledat aktu´aln´ı internetov´e zdroje (viz napˇr. http://mathworld.wolfram.com/topics/RandomNumbers.html). Pˇ r´ıklady: (1) Ukaˇzte, ˇze pro vhodnou volbu p lze z´apis X ∼ A(p) interpretovat jako z´apis X + 1 ∼ C(2). (2) Vlastn´ım v´ ypoˇctem odvod’te vztah (6) pro E(X). (3) Vlastn´ım v´ ypoˇctem odvod’te vztah (7) pro D(X) a smˇerodatnou odchylku
p D(X).
(4) Modelujte n´ ahodn´ y hod pravidelnou kostkou pomoc´ı klasick´eho rozdˇelen´ı. Urˇcete hodnoty p(x). Sv˚ uj n´azor podpoˇrte 60 hody hrac´ı kostkou (Kostku neztrat’te, budete ji jeˇstˇe potˇrebovat). ˇ ste nˇekter´e u (5) Reˇ ´lohy klasick´e pravdˇepodobnosti tak, ˇze urˇc´ıte n´ahodnou veliˇcinu P X ∼ C(n) popisuj´ıc´ı n´ahodn´ y pokus a ˇz´ adanou pravdˇepodobnost P (X ∈ B) vypoˇctete pomoc´ı x∈B p(x). (6) Vyhledejte ve sv´em obl´ıben´em programovac´ım jazyce (existuje-li takov´ y) gener´ator posloupnosti n´ahodn´ ych” ˇc´ısel. Jeho opakovan´ ym pouˇzit´ım z´ıskejte vˇetˇs´ı statistick´ y soubor (v´ıce neˇz 30 hodnot) ” a pomoc´ı vhodn´eho softwaru (MS Excel, Statistica, Minitab) z´ıskejte tˇr´ıdˇen´ım tabulku relativn´ıch ˇcetnost´ı a histogram. Posud’te, zda jeho tvar splˇ nuje Vaˇse oˇcek´av´an´ı (byla-li nˇejak´a).
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
5
3. Hypergeometrick´ e rozdˇ elen´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a hypergeometrick´e rozdˇelen´ı, znaˇc´ıme X ∼ H(N, M, n), kde N, M, n ∈ N a 1 ≤ n < N, 1 ≤ M < N (ostr´e nerovnosti zajiˇst’uj´ı, ˇze se nebudeme zab´ yvat trivi´aln´ımi pˇr´ıpady). Pouˇ zit´ı. Hypergeometrick´e rozdˇelen´ı pravdˇepodobnosti se pouˇz´ıv´a k modelov´an´ı n´ahodn´ ych pokus˚ u, pˇri kter´ ych n´ ahodnˇ e vyb´ır´ ame (najednou nebo postupnˇe) a nevrac´ıme n jednotek (v´ yrobk˚ u, souˇc´astek, kuliˇcek, aj.) z koneˇcn´eho souboru N jednotek, ze kter´ ych je M s urˇcitou vlastnost´ı (zmetky, b´ıl´e kuliˇcky, aj.) a zb´ yvaj´ıc´ıch N − M tuto vlastnost nem´a (dobr´e v´ yrobky, ˇcern´e kuliˇcky, aj.). Pˇritom se pt´ame, jak´a je pravdˇepodobnost, ˇze mezi n vybran´ ymi je urˇcit´ y poˇcet jednotek (obvykle x, pokud n´as zaj´ım´a hodnota pravdˇepodobnostn´ı funkce p(x)) se zm´ınˇenou vlastnost´ı (zmetk˚ u, b´ıl´ ych kuliˇcek, aj.). N´ ahodn´ a veliˇ cina X pak oznaˇ cuje n´ ahodn´ y poˇ cet jednotek se zm´ınˇ enou vlastnost´ı mezi vybran´ ymi pˇ ri v´ ybˇ eru bez vracen´ı. Funkˇ cn´ı charakteristiky. Z v´ yˇse uveden´eho a na z´akladˇe zkuˇsenost´ı s v´ ypoˇctem pˇr´ıklad˚ u na n´ahodn´ y v´ ybˇer bez vracen´ı v klasick´e pravdˇepodobnosti vypl´ yv´a n´asleduj´ıc´ı vztah (8) pro pravdˇepodobnostn´ı funkci. Distribuˇcn´ı funkci F (x) zde neuv´ad´ıme. P Pokud ale nen´ı u diskr´etn´ıch rozdˇelen´ı F (x) uvedena, staˇc´ı dosadit do obecn´eho vztahu F (x) = y byl uveden v kapitole vˇenovan´e zaveden´ı t<x p(t), kter´ n´ahodn´ ych veliˇcin a jejich charakteristik. Pravdˇ epodobnostn´ı funkce: M N − M x n−x N p(x) = n 0
pro x = max{0, M − N + n}, . . . , min{M, n} (8) jinde
Hodnoty pravdˇepodobnostn´ı funkce H rozdˇelen´ı lze poˇc´ıtat pˇr´ımo podle (8), lze je rovnˇeˇz naj´ıt ve statistick´ ych tabulk´ ach ([13], [14]) a zejm´ena ˇrada statistick´ ych softwar˚ u nab´ız´ı jejich rychl´ y v´ ypoˇcet. Pro pravdˇepodobnostn´ı funkci (8) uv´ ad´ıme uk´azky jejich graf˚ u (viz obr. 5), kde vol´ıme N = 100, n = 10 a r˚ uzn´e hodnoty M . Poznamenejme, ˇze pˇreruˇsovan´a ˇc´ara je pouˇzita pouze pro odliˇsen´ı jednotliv´ ych pravdˇepodobnostn´ıch funkc´ı.
Obr´azek 5: p(x)
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
6
ˇ ıseln´ C´ e charakteristiky. = n
M N
stˇ redn´ı hodnota:
E(X)
rozptyl:
M D(X) = n N
modus:
x ˆ
∈
(9)
M 1− N
N −n N −1
(10)
(M + 1)(n + 1) (M + 1)(n + 1) − 1, N +2 N +2
(11)
Zaj´ımavosti. Hypergeometrick´e rozdˇelen´ı obvykle kr´aˇc´ı ruku v ruce” s rozdˇelen´ım binomick´ ym, proto” ˇze jedno se pouˇz´ıv´ a pˇri modelov´ an´ı n´ ahodn´eho v´ ybˇeru bez vracen´ı (hypergeometrick´e) a druh´e lze pouˇz´ıt pro modelov´ an´ı n´ ahodn´eho v´ ybˇeru s vracen´ım (binomick´e). Doporuˇcujeme ˇcten´aˇri, aby zaˇcal jiˇz nyn´ı prom´ yˇslet, jak´e chyby se dopust´ı, pokud m´ısto v´ ybˇeru bez vracen´ı omylem uvaˇzuje v´ ybˇer s vracen´ım. Logickou ot´azkou je, zda za urˇcit´ ych okolnost´ı nen´ı tato chyba zanedbateln´a. Budeme se student˚ u pt´at, zda a kdy pˇr´ıpadnˇe ano a kdy ne? Z´akladn´ı motivac´ı pro hled´ an´ı odpovˇedi m˚ uˇze b´ yt skuteˇcnost, ˇze v´ ypoˇcet pomoc´ı hypergeometrick´eho ypoˇcet p(x)), zat´ımco pro binomick´e rozdˇelen´ı rozdˇelen´ı je pracnˇejˇs´ı (3 kombinaˇcn´ı ˇc´ısla ve vztahu (8) pro v´ se v´ ypoˇcet jev´ı jako jednoduˇsˇs´ı (1 kombinaˇcn´ı ˇc´ıslo ve v´ ypoˇctu p(x) podle (12) – viz d´ale). Doplˇ nme praktickou motivaci: Pˇri statistick´e kontrole kvality, kontrolor n´ahodnˇe vybere z mnoha v´ yrobk˚ u ke kontrole urˇcitou skupinu, aby zjistil procento zmetk˚ u. M´a tyto v´ yrobky vyb´ırat jednotlivˇe a vˇzdy vr´atit? Nebo m´ a vybrat celou skupinu nar´az a vybran´e v´ yrobky nevracet? Jak´e vzorce m´a pouˇz´ıt? Jsou nˇekter´e nˇekdy zamˇeniteln´e? Konkr´ etnˇ ejˇ s´ı pˇ r´ıklad: V jednom z´ avodˇe pˇredstavuj´ı v´ yrobky 5% celkov´e v´ yroby. Sestavte tabulku pravdˇepodobnosti poˇct˚ u zmetk˚ u pˇri n´ ahodn´e kontrole tˇr´ı v´ yrobk˚ u. Ot´ azka: Vid´ıte nˇejak´ y probl´em v zad´an´ı? Je u ´pln´e? Pˇ r´ıklady: (1) Formulujte a ˇreˇste pomoc´ı hypergeometrick´eho rozdˇelen´ı pˇr´ıklad na n´ahodn´ y v´ ybˇer bez vracen´ı, kter´ y jste ˇreˇsili v kapitole vˇenovan´e klasick´e pravdˇepodobnosti. (2) Najdˇete v literatuˇre nebo na internetu odvozen´ı vztahu (9) pro E(X). (3) Najdˇ p ete v literatuˇre nebo na internetu odvozen´ı vztahu (10) pro D(X) a smˇerodatnou odchylku D(X). (4) Vysvˇetlete, proˇc vzorec (8) pro pravdˇepodobnostn´ı funkci p(x) hypergeometrick´eho rozdˇelen´ı nen´ı definov´ an pro x = 0, 1, . . . , n, ale je nutn´e vz´ıt do u ´vahy i M a N ? (5) Vysvˇetlete, jak se zjednoduˇs´ı v´ ypoˇcet pomoc´ı hypergeometrick´eho rozdˇelen´ı, pokud n = N nebo M = N? (6) Vyhledejte ve sv´em obl´ıben´em statistick´em programu (existuje-li takov´ y) gener´ator posloupnosti n´ahodn´ ych ˇc´ısel z´ıskan´ ych v´ ybˇerem z hypergeometrick´eho rozdˇelen´ı pravdˇepodobnosti. Jeho opakovan´ ym pouˇzit´ım z´ıskejte vˇetˇs´ı statistick´ y soubor (v´ıce neˇz 30 hodnot) a zn´azornˇete histogram rozdˇelen´ı ˇcetnost´ı v´ ysledk˚ u. Porovnejte z´ıskan´e relativn´ı ˇcetnosti s vlastn´ım v´ ypoˇctem z´ıskan´ ymi hodnotami pravdˇepodobnostn´ı funkce. Vysvˇetlete rozd´ıly. Z´ avˇ erem. Z pohledu zkouˇsky se jedn´ a o rozdˇelen´ı d˚ uleˇzit´e (viz barva nadpisu t´eto ˇc´asti). Lze rovnˇeˇz oˇcek´avat zad´ an´ı zamˇeˇren´e na n´ ahodn´ y v´ ybˇer bez vracen´ı jiˇz pˇri zkouˇsen´ı poznatk˚ u klasick´e pravdˇepodobnosti.
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
7
4. Binomick´ e rozdˇ elen´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a binomick´e rozdˇelen´ı, znaˇc´ıme X ∼ Bi(n, p), kde n ∈ N a p ∈ (0; 1) (neuvaˇzujeme trivi´ aln´ı pˇr´ıpady p ∈ {0; 1}). Pouˇ zit´ı. Pro srovn´ an´ı s hypergeometrick´ ym rozdˇelen´ım nejprve uved’me, jak se binomick´e rozdˇelen´ı pouˇz´ıv´a k modelov´ an´ı nez´ avisl´ ych n´ahodn´ ych pokus˚ u, pˇri kter´ ych postupnˇ e n´ ahodnˇ e vyb´ır´ ame n jednotek (v´ yrobk˚ u, souˇc´ astek, kuliˇcek, aj.). Zd˚ uraznˇ eme, ˇ ze vybran´ e jednotky vrac´ıme a mohou b´ yt znovu vybr´ any. Velikost souboru, ze kter´eho vyb´ır´ame, nemus´ı b´ yt zn´ama, ale mus´ı b´ yt zn´amo, jak´ y je pod´ıl p jednotek s urˇcitou vlastnost´ı (zmetky, b´ıl´e kuliˇcky, aj.). Ostatn´ı jednotky tuto vlastnost nemaj´ı a jejich pod´ıl je tedy q = 1−p. Pˇritom se pt´ame, jak´a je pravdˇepodobnost, ˇze mezi n vybran´ ymi je urˇcit´ y poˇcet jednotek (obvykle x, pokud n´ as zaj´ım´a hodnota pravdˇepodobnostn´ı funkce p(x)) se zm´ınˇenou vlastnost´ı (zmetk˚ u, b´ıl´ ych kuliˇcek, aj.). N´ ahodn´ a veliˇ cina X pak oznaˇ cuje n´ ahodn´ y poˇ cet jednotek se zm´ınˇ enou vlastnost´ı mezi vybran´ ymi pˇ ri v´ ybˇ eru s vracen´ım. Funkˇ cn´ı charakteristiky. Z v´ yˇse uveden´eho a na z´akladˇe zkuˇsenost´ı s v´ ypoˇctem pˇr´ıklad˚ u na n´ahodn´ y v´ ybˇer s vracen´ım v klasick´e pravdˇepodobnosti vypl´ yvaj´ı n´asleduj´ıc´ı vztahy (12) a (13) pro pravdˇepodobnostn´ı a distribuˇcn´ı funkci (N0 znaˇc´ı mnoˇzinu pˇrirozen´ ych ˇc´ısel vˇcetnˇe nuly). Pravdˇ epodobnostn´ı funkce: n px (1 − p)n−x x p(x) = 0
pro x = 0, . . . , n
(12)
jinde
Distribuˇ cn´ı funkce:
F (x) =
P t<x,t∈N0
n t
0 pt (1 − p)n−t 1
pro x ≤ 0 pro x ∈ (0, ni
(13)
pro x > n
Hodnoty pravdˇepodobnostn´ı funkce Bi rozdˇelen´ı lze poˇc´ıtat pˇr´ımo podle (12), lze je rovnˇeˇz naj´ıt ve statistick´ ych tabulk´ ach a t´emˇeˇr vˇsechny statistick´e softwary nab´ız´ı jejich rychl´ y v´ ypoˇcet. Pro pravdˇepodobnostn´ı funkci (12) uv´ ad´ıme uk´ azky jejich graf˚ u (viz obr. 6), kde vol´ıme n = 10 a r˚ uzn´e hodnoty p. Zd˚ uraznˇeme, ˇze pˇreruˇsovan´ a ˇc´ ara je pouˇzita pouze pro odliˇsen´ı jednotliv´ ych pravdˇepodobnostn´ıch funkc´ı. Pro p = 0, 5 je rozdˇelen´ı symetrick´e a pro p > 0, 5 (p < 0, 5) je z´apornˇe (kladnˇe) asymetrick´e.
Obr´azek 6: p(x)
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
8
ˇ ıseln´ C´ e charakteristiky. stˇ redn´ı hodnota: rozptyl: modus: koeficient ˇ sikmosti (asymetrie):
E(X) = np D(X) = np(1 − p) = npq x ˆ ∈ h(n + 1)p − 1, (n + 1)pi 1 − 2p A(X) = p np(1 − p)
(14) (15) (16) (17)
N´ azev rozdˇ elen´ı. N´ azev rozdˇelen´ı poch´aP z´ı ze skuteˇcnosti, ˇze pravdˇepodobnosti p(x) jsou ˇcleny binomick´eho rozvoje 1 = 1n = (p + (1 − p))n = p(x). Bernoulliovsk´ a posloupnost nez´ avisl´ ych pokus˚ u. Tvar pravdˇepodobnostn´ı funkce, kter´ y pro nov´eho ˇcten´aˇre m˚ uˇze vypadat nezvykle, se ˇcasto vysvˇetluje pomoc´ı posloupnosti nez´avisl´ ych pokus˚ u: 1) M´ame n nez´ avisl´ ych n´ ahodn´ ych pokus˚ u, napˇr. opakovan´ y n´ahodn´ y v´ ybˇer v´ yrobku ze skupiny dobr´ ych v´ yrobk˚ u a zmetk˚ u s vracen´ım vybran´eho v´ yrobku. 2) Pod´ıl zmetk˚ u ve skupinˇe oznaˇc´ıme p a je to tedy i pravdˇepodobnost vytaˇzen´ı zmetku v jednom tahu. 3) Pravdˇepodobnost vytaˇzen´ı nejprve pr´avˇe x zmetk˚ u, a potom pr´avˇe n − x dobr´ ych v´ yrobk˚ u je d´ıky nez´avislosti pokus˚ u px (1 − p)n−x . 4) Jenˇze v´ ybˇer s pr´ avˇe x zmetky lze z´ıskat v´ıce zp˚ usoby neˇz tak, ˇze nejprve budou vytaˇzeny zmetky. Pˇresnˇeji, poˇcet tˇechto moˇznost´ ı je d´ a n poˇ c tem rozm´ ıstˇen´ı x zmetk˚ u na n poˇrad´ı, ve kter´ ych mohou b´ yt n taˇzeny. Tˇechto moˇznost´ı je . x 5) Vyn´asoben´ım pravdˇepodobnost´ı jedn´e moˇznosti z 3) poˇctem moˇznost´ı v 4) tedy z´ısk´ame pravdˇepodobnost p(x) z (12). ˇ cnick´ Reˇ a ot´ azka: Jak´e z n´ am zn´ am´ ych rozdˇelen´ı obdrˇz´ıme, pokud zvol´ıme n = 1 u X ∼ Bi(n, p)? Odpovˇed’: Ano, plat´ı rovnˇeˇz, ˇze X ∼ A(p). Vlastnosti. Pˇredch´ azej´ıc´ı zjiˇstˇen´ı m˚ uˇzeme vyuˇz´ıt k pochopen´ı n´asleduj´ıc´ıch vlastnost´ı binomick´eho rozdˇelen´ı: 1) N´ahodn´ a veliˇcina X = X1 + . . . + Xk , kde n´ahodn´e veliˇciny Xj , j = 1, . . . , k, jsou stochasticky nez´avisl´e (viz n´ ahodn´ y vektor) a maj´ı binomick´a rozdˇelen´ı Bi(nj , p) se stejn´ ym parametrem p, m´ a opˇ et binomick´ e rozdˇ elen´ı Bi(n, p), kde n = n1 + . . . + nk . 2) Speci´alnˇe, souˇ cet n stochasticky nez´ avisl´ ych n´ ahodn´ ych veliˇ cin s alternativn´ım rozdˇ elen´ım A(p) m´ a binomick´ e rozdˇ elen´ı Bi(n, p). Obecnˇ ejˇ s´ı pouˇ zit´ı. Nyn´ı jiˇz m˚ uˇzeme shrnout, ˇze binomick´e rozdˇelen´ı pouˇz´ıv´ame v pˇr´ıpadˇe posloupnosti n nez´ avisl´ ych n´ ahodn´ ych pokus˚ u (viz A(p)), kdy rozliˇ sujeme mezi u ´ spˇ echem v jednotliv´ em pokusu, kter´ y nastane s pravdˇ epodobnost´ı p (stejnou pro kaˇ zd´ y jednotliv´ y pokus) a ne´ uspˇechem, kter´ y nastane s pravdˇepodobnost´ı 1 − p. N´ahodn´a veliˇcina X ∼ Bi(n, p) pak urˇ cuje poˇ cet u ´ spˇ ech˚ u v n pokusech. Obecnˇ eji se ˇ casto hovoˇ r´ı ne o u ´ spˇ echu, ale o v´ yskytu urˇ cit´ eho jevu. Pˇ r´ıklady: (1) Formulujte a ˇreˇste pomoc´ı binomick´eho rozdˇelen´ı pˇr´ıklad na n´ahodn´ y v´ ybˇer s vracen´ım, kter´ y jste ˇreˇsili v kapitole vˇenovan´e klasick´e pravdˇepodobnosti. (2) Najdˇete v literatuˇre nebo na internetu pˇr´ım´e odvozen´ı vztahu (14) pro E(X). (3) Najdˇ p ete v literatuˇre nebo na internetu pˇr´ım´e odvozen´ı vztahu (15) pro D(X) a smˇerodatnou odchylku D(X). (4) Zamyslete se nad zd˚ uvodnˇen´ım, kter´e vypl´ yv´a z vlastnost´ı stˇredn´ı hodnoty souˇctu n´ahodn´ ych veliˇcin a rozptylu stochasticky nez´ avisl´ ych n´ahodn´ ych veliˇcin (n´apovˇeda: viz n´ahodn´ y vektor).
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
9
Zaj´ımavosti. Mnoho poutav´ ych informac´ı najde laick´ y ˇcten´aˇr v dosud ˇctivost´ı nepˇrekonan´e knize H. Swobody [10]. Pˇr´ıkladem autorovy pˇredstavivosti m˚ uˇze b´ yt nalezen´ı souvislost´ı mezi binomick´ ym rozdˇelen´ım a ˇr´ımskou font´ anou. Francis Galton (1822-1911) byl anglick´ y vˇedec a vzd´alen´ y pˇr´ıbuzn´ y Charlese Darwina. Zab´ yval se statistick´ ym v´ yzkumem v oblasti dˇediˇcnosti. Z jeho prac´ı poch´az´ı term´ın regrese jako procesu n´avratu k pr˚ umˇeru. Realizoval rovnˇeˇz myˇslenku Galtonova stroje” (srovnejte s nˇekter´ ymi hrac´ımi automaty a ” jejich napodobeninami pro dˇeti), kter´ y ilustruje, jak n´ahodn´e odrazy ˇzlut´ ych kuliˇcek v bludiˇsti zelen´ ych kol´ıˇck˚ u vedou k jejich rozm´ıstˇen´ı pˇribliˇznˇe” podle obrys˚ u n´asobku pravdˇepodobnostn´ı funkce Bi(n; 0, 5). ” Vysvˇetlen´ı proˇc to funguje” nech´ ame laskav´emu ˇcten´aˇri k pˇrem´ yˇslen´ı a diskusi se cviˇc´ıc´ımi. ”
Obr´azek 7: Galton˚ uv stroj Pˇ r´ıklady: (5) Vysvˇetlete, jak se zjednoduˇs´ı Bi, kdyˇz n = 1? (6) Vyhledejte ve sv´em obl´ıben´em statistick´em programu gener´ator posloupnosti n´ahodn´ ych ˇc´ısel z´ıskan´ ych v´ ybˇerem z binomick´eho rozdˇelen´ı. Jeho opakovan´ ym pouˇzit´ım z´ıskejte vˇetˇs´ı statistick´ y soubor (v´ıce neˇz 30 hodnot) a zn´ azornˇete histogram rozdˇelen´ı ˇcetnost´ı v´ ysledk˚ u. Porovnejte z´ıskan´e relativn´ı ˇcetnosti s vlastn´ım v´ ypoˇctem z´ıskan´ ymi hodnotami pravdˇepodobnostn´ı funkce. Vysvˇetlete rozd´ıly. (7) Pokud v´ıte, ˇze X ∼ Bi(n, p), uved’te funkˇcn´ı a ˇc´ıseln´e charakteristiky pro rozdˇelen´ı transformovan´e n´ahodn´e veliˇciny Y = X/n. Zvolte vhodn´e p a mal´e n, v´ ysledky konkretizujte a naˇcrtnˇete grafy p(x) a F (x). (8) M˚ uˇze m´ıt binomick´e rozdˇelen´ı pr´ avˇe dvˇe r˚ uzn´e hodnoty x ˆ? (9) Typick´ e zad´ an´ı: V dod´avce 50 v´ yrobk˚ u je 5 zmetk˚ u. Z dod´avky jsou n´ahodnˇe vybr´any 3 v´ yrobky. Poˇcet zmetk˚ u mezi vybran´ ymi v´ yrobky je n´ahodn´a veliˇcina X. Urˇcete typ jej´ıho rozdˇelen´ı pravdˇepodobnosti, p jej´ı pravdˇepodobnostn´ı funkci p(x), stˇredn´ı hodnotu E(X), rozptyl D(X), smˇerodatnou ˆ a P (1 < X ≤ 3). Pˇredpokl´adejte, odchylku D(X), koeficient ˇsikmosti A(X), medi´an x0,5 , modus x ˇze kaˇzd´ y vybran´ y v´ yrobek se vr´ at´ı nazpˇet do dod´avky, takˇze jde o n´ahodn´ y v´ ybˇer s vracen´ım. (10) Tˇri rovnocenn´ı hr´ aˇci A, B, C hraj´ı spoleˇcenskou hru. Kter´ y z pˇr´ıpad˚ u, ˇze hr´aˇc A vyhraje 3 ze 4 parti´ı anebo 5 z 8 parti´ı, je pravdˇepodobnˇejˇs´ı? Zkuste nejprve uh´adnout s pomoc´ı zdrav´eho rozumu”, a ” potom ovˇeˇrte svoji u ´vahu v´ ypoˇctem. ˇ obsahuje pr´avˇe 20 ot´azek. Na kaˇzdou z nich jsou (11) Rozhoduj´ıc´ı test u pˇrij´ımac´ıch zkouˇsek na VS moˇzn´e 4 odpovˇedi, z nichˇz jedna je spr´avn´a. Student odpov´ıd´a n´ahodnˇe. Jak´a je pravdˇepodobnost, ˇze student bude pˇrijat, kdyˇz je poˇzadov´ano 13 spr´avn´ ych odpovˇed´ı? (12) Promyslete, zda u testu v pˇr´ıkladˇe (11) je v´ yhodnˇejˇs´ı strategi´ı v pˇr´ıpadˇe neznalosti mlˇcet nebo odpov´ıdat n´ ahodnˇe. (13) Domn´ıv´ ate se, ˇze u testu v pˇr´ıkladˇe (11) v pˇr´ıpadˇe neznalosti maj´ı n´ahodnˇe odpov´ıdaj´ıc´ı student a student, kter´ y neodpov´ıd´ a v˚ ubec, rovn´e podm´ınky? Navrhnˇete ˇreˇsen´ı! N´apovˇeda: zvaˇzte penalizaci ˇspatn´ ych odpovˇed´ı. Z´ avˇ erem. Z pohledu zkouˇsky se jedn´ a o rozdˇelen´ı pravdˇepodobnosti, kter´e je ale opravdu velmi d˚ uleˇ zit´ e.
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
10
5. Poissonovo rozdˇ elen´ı Znaˇ cen´ı.
Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a Poissonovo rozdˇelen´ı, znaˇc´ıme X ∼ P o(λ), kde λ > 0.
Pouˇ zit´ı. Poissonovo rozdˇelen´ı se obvykle uˇz´ıv´a pro vyj´adˇren´ı pravdˇ epodobnosti poˇ ctu nastoupen´ı sledovan´ eho jevu v urˇ cit´ em ˇ casov´ em intervalu (poˇcet poruch, nehod, katastrof, zmetk˚ u, apod.) s malou pravdˇepodobnost´ı v´ yskytu. Rada. Pˇri ˇreˇsen´ı u ´loh na typick´ a rozdˇelen´ı je pro mnoh´e studenty probl´emem spr´avnˇe zvolit typ rozdˇelen´ı. Jestliˇze pˇri volbˇe H nebo Bi b´ yv´a obvykle rozhoduj´ıc´ı, zda jde o v´ ybˇer bez vracen´ı nebo s vracen´ım, u Poissonova rozdˇelen´ı mnoz´ı studenti t´apou. Ve snaze pomoci jim nab´ız´ıme n´asleduj´ıc´ı zapamatovatelnou pom˚ ucku. Vˇsimnˇeme si typick´eho zad´ an´ı pˇr´ıkladu na P o rozdˇ elen´ı: Urˇcit´a radioaktivn´ı l´atka vyzaˇruje pr˚ umˇernˇe ” 30 ˇc´astic α za minutu. Vypoˇc´ıtejte pravdˇepodobnost, ˇze v pr˚ ubˇehu jedn´e sekundy vyz´aˇr´ı l´atka pr´avˇe 2 ˇc´astice.” A srovnejme nyn´ı se zad´ an´ım na Bi rozdˇ elen´ı: N´ahodnˇe vyb´ır´ame 10 v´ yrobk˚ u z krabice, ve kter´e je ” 100p% zmetk˚ u, vybran´e v´ yrobky vrac´ıme, vypoˇc´ıtejte pravdˇepodobnost jevu, ˇze mezi vybran´ ymi budou pr´avˇe 2 zmetky.” Pomocn´ a ot´ azka: U Bi rozdˇelen´ı zn´ı smysluplnˇe ot´azka: Jestliˇze 2 zmetky byly vybr´any, kolik jich ” nebylo vybr´ano?” U P o rozdˇelen´ı naproti tomu ot´ azka: Jestliˇ ze pˇ riletˇ ely 2 ˇ c´ astice, kolik jich nepˇ riletˇ elo?” ” zaujme svoj´ı nesmyslnost´ı, a to n´ as upozorˇ nuje, abychom pouˇzili Poissonovo rozdˇelen´ı, u kter´eho se u ´spˇech vztahuje k zanedbateln´emu ˇcasov´emu okamˇziku uvnitˇr ˇcasov´eho intervalu, zat´ımco u Bi rozdˇelen´ı u ´spˇech se vztahuje k jednomu z koneˇcnˇe mnoha pokus˚ u. Funkˇ cn´ı charakteristiky. Neˇz uvedeme p(x) pro P o(λ), zd˚ uraznˇeme, ˇze Poissonovo rozdˇelen´ı je prvn´ı n´ami uveden´e diskr´etn´ı rozdˇelen´ı pravdˇepodobnosti s nekoneˇcn´ ym nosiˇcem, tj. mnoˇzina x, pro kter´a p(x) > 0 je nekoneˇcn´ a, pˇresnˇeji spoˇcetn´ a, zapisujeme |{x | p(x) > 0}| = ℵ0 . Pravdˇ epodobnostn´ı funkce: p(x) =
x
e−λ λx! 0
pro x = 0, 1, . . . jinde
(18)
Hodnoty pravdˇepodobnostn´ı funkce P o rozdˇelen´ı lze poˇc´ıtat pˇr´ımo podle (18) a statistick´e softwary vˇetˇsinou nab´ız´ı jejich rychl´ y v´ ypoˇcet. Hodnoty distribuˇcn´ı funkce b´ yvaj´ı tabelov´any. Pro p(x) (18) uv´ad´ıme uk´ azky jejich graf˚ u (viz obr. 8), kde vol´ıme r˚ uzn´e hodnoty parametru rozdˇelen´ı λ. Zd˚ uraznˇeme, ˇze pˇreruˇsovan´ a ˇc´ ara je pouˇzita pouze pro odliˇsen´ı jednotliv´ ych pravdˇepodobnostn´ıch funkc´ı.
Obr´ azek 8: p(x)
RNDr. Pavel Popela, Ph.D.
Sim´eon-Denis Poisson
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
11
ˇ ıseln´ C´ e charakteristiky. stˇ redn´ı hodnota: rozptyl: modus: koeficient ˇ sikmosti:
E(X) = λ D(X) = λ x ˆ ∈ hλ − 1, λi √ A(X) = λ
(19) (20) (21) (22)
Pˇ r´ıklady: (1) Ovˇeˇrte, ˇze funkce (18) je pravdˇepodobnostn´ıP funkc´ı. N´apovˇeda: Vyuˇzijte sv´ ych znalost´ı nekoneˇcn´ ych ˇrad z pˇredmˇetu Matematika 3 a ukaˇzte, ˇze x∈R p(x) = 1. (2) Odvod’te vztah (19) pro E(X). (3) Odvod’te vztah (20) pro D(X) a smˇerodatnou odchylku
p D(X).
(4) Rozliˇste pˇr´ıpady, kdy λ je a nen´ı pˇrirozen´e ˇc´ıslo. N´apovˇeda: Vˇsimnˇete si poˇctu mod˚ ux ˆ. (5) Urˇcete modus x ˆ pro λ < 1. Vlastnosti. N´ ahodn´ a veliˇcina X = X1 + . . . + Xk , k ≥ 2, kde n´ahodn´e veliˇciny Xj , j = 1, . . . , k, jsou stochasticky nez´ avisl´e (viz n´ahodn´ y vektor) a maj´ı Poissonovo rozdˇelen´ı P o(λj ), m´ a opˇ et Poissonovo rozdˇ elen´ı P o(λ), kde λ = λ1 + . . . + λk . Zaj´ımavosti. Zaj´ımav´ y pˇr´ıklad aplikace Poissonova rozdˇelen´ı najde ˇcten´aˇr v jiˇz zmiˇ novan´e knize H. Swobody [10]. Autor uv´ ad´ı, ˇze Poissonovo rozdˇelen´ı mˇel poˇcet u ´mrt´ı na z´akladˇe kopnut´ı konˇem v prusk´e arm´adˇe v 19.stolet´ı. Rozdˇelen´ı bylo zavedeno Sim´eonem-Denisem Poissonem (1781–1840) a publikov´ano spoleˇcnˇe s jeho dalˇs´ımi v´ ysledky v teorii pravdˇepodobnosti v roce 1838 v jeho pr´aci s poutav´ ym n´azvem Recherches sur ” la probabilit´e des jugements en matieres criminelles et matiere civile” nebo anglicky Research on the ” Probability of Judgments in Criminal and Civil Matters” (pˇreklad alespoˇ n n´azvu ponech´av´ame laskav´emu ˇcten´aˇri). Pˇ r´ıklady: (6) Vyhledejte ve sv´em obl´ıben´em statistick´em programu gener´ator posloupnosti n´ahodn´ ych ˇc´ısel z´ıskan´ ych v´ ybˇerem z Poissonova rozdˇelen´ı. Jeho opakovan´ ym pouˇzit´ım z´ıskejte vˇetˇs´ı statistick´ y soubor (v´ıce neˇz 30 hodnot) a zn´ azornˇete histogram rozdˇelen´ı ˇcetnost´ı v´ ysledk˚ u. Porovnejte z´ıskan´e relativn´ı ˇcetnosti s vlastn´ım v´ ypoˇctem z´ıskan´ ymi hodnotami pravdˇepodobnostn´ı funkce. Vysvˇetlete rozd´ıly. (7) Zvolte vhodn´e λ a naˇcrtnˇete grafy p(x) a F (x). (8) Uved’te vztah urˇcuj´ıc´ı distribuˇcn´ı funkci F (x) pro P o rozdˇelen´ı. (9) Typick´ e zad´ an´ı: Statistick´ ym pr˚ uzkumem bylo zjiˇstˇeno, ˇze bˇehem jedn´e minuty navˇst´ıv´ı prodejnu pr˚ umˇernˇe 3 z´ akazn´ıci. Najdˇete vhodn´ y typ rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny X vyjadˇruj´ıc´ı poˇcet z´ akazn´ık˚ u, kteˇr´ı navˇst´ıv´ı prodejnu bˇehem jedn´e minuty. Urˇcete jej´ı pravdˇ pepodobnostn´ı funkci p(x), stˇredn´ı poˇcet z´ akazn´ık˚ u E(X), rozptyl D(X) a smˇerodatnou odchylku D(X) poˇctu z´akazn´ık˚ u, koeficient ˇsikmosti A(X) a nejpravdˇepodobnˇejˇs´ı poˇcet z´akazn´ık˚ u za jednu minutu. Urˇcete d´ale pravdˇepodobnost, ˇze bˇehem jedn´e minuty pˇrijde a) pr´avˇe 1 z´akazn´ık, b) alespoˇ n 1 z´akazn´ık, c) medi´ an x0,5 poˇctu z´ akazn´ık˚ u. Z´ avˇ erem. Poissonovo rozdˇelen´ı patˇr´ı z pohledu zkouˇsky mezi z´akladn´ı rozdˇelen´ı.
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
12
6. Geometrick´ e rozdˇ elen´ı a dalˇ s´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a geometrick´e rozdˇelen´ı, znaˇc´ıme X ∼ Ge(p), kde parametr p ∈ (0; 1). Pouˇ zit´ı. Pˇr´ıkladem n´ ahodn´e veliˇciny s geometrick´ ym rozdˇelen´ım je poˇcet ne´ uspˇeˇsn´ ych nez´avisl´ ych n´ahodn´ ych pokus˚ u (s pravdˇepodobnost´ı u ´spˇechu p), kter´e pˇredch´azej´ı prvn´ımu u ´spˇechu. Rada. Pom˚ uckou pro rozezn´ an´ı aplikovatelnosti Ge rozdˇelen´ı je dostateˇcnˇe drastick´a formulace zad´an´ı pomocn´eho pˇr´ıkladu: Pˇredstavme si napˇr´ıklad testov´an´ı nov´eho typu pad´aku opakovan´ ymi nez´avisl´ ymi ” seskoky. Zaj´ım´ a n´ as poˇcet u ´spˇech˚ u (opak formulace v´ yˇse), zde s pravdˇepodobnost´ı 1 − p, kter´e pˇredch´az´ı prvn´ı ne´ uspˇech.” Funkˇ cn´ı charakteristiky. Uvedeme p(x) a upozorˇ nujeme, ˇze geometrick´e rozdˇelen´ı je dalˇs´ı diskr´etn´ı rozdˇelen´ı pravdˇepodobnosti s nosiˇcem splˇ nuj´ıc´ım |{x | p(x) > 0}| = ℵ0 . Pravdˇ epodobnostn´ı funkce: p(x) =
p(1 − p)x 0
pro x = 0, 1, . . . jinde
(23)
Vid´ıme, ˇze rozdˇelen´ı se naz´ yv´ a pr´ avem geometrick´e, protoˇze pravdˇepodobnosti p(x) tvoˇr´ı geometrickou posloupnost s kvocientem q = 1 − p a prvn´ım ˇclenem p. Pravdˇepodobnostn´ı funkce tedy urˇcuje pravdˇepodobnost toho, ˇze prvn´ı u ´spˇech v s´erii nez´avisl´ ych pokus˚ u nastane pr´avˇe po x ne´ uspˇeˇs´ıch. ˇ ıseln´ C´ e charakteristiky. stˇ redn´ı hodnota: rozptyl: modus:
1−p p 1−p D(X) = p2 x ˆ ∈ 0 E(X)
=
(24) (25) (26)
Pˇ r´ıklady: (1) Ovˇeˇrte, ˇze funkce (23) je pravdˇepodobnostn´ıP funkc´ı. N´apovˇeda: Vyuˇzijte sv´ ych znalost´ı nekoneˇcn´ ych ˇrad z pˇredmˇetu Matematika 3 a ukaˇzte, ˇze x∈R p(x) = 1. (2) Odvod’te vztah (24) pro E(X). (3) Odvod’te vztah (25) pro D(X) a smˇerodatnou odchylku
p D(X).
(4) Vysvˇetlete, proˇc je v (26) vˇzdy x ˆ = 0. Z´ avˇ erem. Geometrick´e rozdˇelen´ı pout´ a pozornost zkouˇsej´ıc´ıho proto, ˇze ˇrada v´ ypoˇct˚ u je zaloˇzena na vyuˇz´ıv´an´ı studentovy znalosti (neznalosti) geometrick´e posloupnosti a ˇrady. Pozn´ amka. Dosud uveden´ y pˇrehled diskr´etn´ıch rozdˇelen´ı pravdˇepodobnosti je znaˇcnˇe ne´ upln´ y, ale dle naˇseho n´azoru d´ av´ a studentovi dostateˇcn´e z´aklady, aby se rychle dok´azal sezn´amit s dalˇs´ımi rozdˇelen´ımi a jejich aplikacemi. Proto na z´ avˇer t´eto ˇc´asti uved’me jen nˇekolik n´azv˚ u dalˇs´ıch rozdˇelen´ı s kr´atk´ ymi koment´aˇri: Negativnˇ e binomick´ e rozdˇ elen´ı jednak zahrnuje jako speci´aln´ı pˇr´ıpady dalˇs´ı rozdˇelen´ı (Pascalovo, P´ olyovo - modelov´ an´ı n´ ahodn´ ych katastrof v klimatologii). D´ale je lze pouˇz´ıt jako robustn´ı alternativu k Poissonovou, protoˇze lze prostˇrednictv´ım jeho parametru kontrolovat jejich odchylku. Rovnˇeˇz zobecˇ nuje Ge rozdˇelen´ı, protoˇze je rozdˇelen´ım poˇctu ne´ uspˇech˚ u pˇredch´azej´ıc´ıch rt´ yu ´spˇech (u Ge r = 1) v Bernoulliovsk´e posloupnosti nez´ avisl´ ych pokus˚ u s pravdˇepodobnost´ı u ´spˇech v jednotliv´em pokusu rovnou p. Zipfovo-Mandelbrotovo rozdˇelen´ı patˇr´ı mezi diskutabiln´ı empirick´a rozdˇelen´ı. Pouˇz´ıv´a se v jazykovˇedˇe a fanouˇsky frakt´ al˚ u by mohl jm´eno v n´azvu v´est k hlubˇs´ımu samostudiu. Naopak seri´oznˇe na fyziku zamˇeˇren´ı ˇcten´ aˇri jistˇe prozkoumaj´ı rozdˇ elen´ı Boltzmannovo a souvisej´ıc´ı rozdˇelen´ı Gibbsovo, Maxwellovo-Boltzmannovo, Boseho-Einsteinovo a Fermiho-Diracovo. Pro sportovn´ı fanouˇsky a specialisty na rozpozn´av´ an´ı obrazu je pˇripraveno Skellamovo rozdˇ elen´ı. RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
13
B. Typick´ a spojit´ a rozdˇ elen´ı pravdˇ epodobnosti 1. Rovnomˇ ern´ e rozdˇ elen´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a rovnomˇern´e rozdˇelen´ı, znaˇc´ıme X ∼ R(a, b), kde a, b ∈ R a a < b. V zahraniˇcn´ı literatuˇre najdeme znaˇcen´ı X ∼ U (a, b), p´ısmeno U je pouˇzito jako zkratka slova z anglick´eho n´ azvu rozdˇelen´ı uniform distribution”. ” Pouˇ zit´ı. Rovnomˇern´e rozdˇelen´ı je vhodn´ ym modelem pro ty u ´lohy klasick´e pravdˇepodobnosti, kde jsme pouˇzili v´ ypoˇcet pomoc´ı geometrick´ e pravdˇ epodobnosti (nezamˇenit s geometrick´ ym rozdˇelen´ım!). Tj. pouˇzili jsme vzorec: µ(A) P (A) = , µ(Ω) kde µ(·) urˇcuje d´elkovou, obsahovou nebo objemovou m´ıru velikosti mnoˇziny (hlubˇs´ı teoretick´e u ´vahy vynech´av´ame a odkazujeme na [5]). Funkˇ cn´ı charakteristiky. Z v´ yˇse uveden´eho vypl´ yvaj´ı n´asleduj´ıc´ı vztahy (42) a (28) pro hustotu rozdˇelen´ı pravdˇepodobnosti (d´ ale zkracujeme na hustotu”) a distribuˇcn´ı funkci. ” Hustota: 1 pro x ∈ ha, bi b−a (27) f (x) = 0 jinde Distribuˇ cn´ı funkce: F (x) =
0 x−a b−a
1
pro x ≤ a pro x ∈ (a, bi pro x > b
(28)
V´ yhodou je, ˇze hodnoty funkc´ı p(x) a F (x) pro R rozdˇelen´ı lze poˇc´ıtat pˇr´ımo podle (42) a (28). Pro hustotu a distribuˇcn´ı funkci uv´ ad´ıme vˇzdy uk´azky dvou jejich graf˚ u (viz obr. 9 a 10) a vol´ıme r˚ uzn´e meze ha, bi.
Obr´azek 9: p(x)
Obr´azek 10: F (x)
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
14
ˇ ıseln´ C´ e charakteristiky. stˇ redn´ı hodnota: rozptyl: modus: koeficient ˇ sikmosti:
a+b 2 (b − a)2 D(X) = 12 x ˆ ∈ ha, bi A(X) = 0 E(X)
=
(29) (30) (31) (32)
N´ azev rozdˇ elen´ı. N´ azev rovnomˇern´e rozdˇelen´ı se uˇz´ıv´a proto, ˇze pravdˇepodobnost toho, ˇze n´ahodn´a veliˇcina X, kter´ a m´ a R(a, b) rozdˇelen´ı, nabude hodnoty z intervalu urˇcit´e d´elky (napˇr. d), je u ´ mˇ ern´ a pouze d´ elce tohoto intervalu a nez´ avis´ı na jeho um´ıstˇen´ı uvnitˇr intervalu ha, bi. Pojem rovnomˇ ern´ e rozdˇ elen´ı se obvykle zobecˇ nuje i pro n´ ahodn´ y vektor, viz napˇr. [1]. Pˇ r´ıklady: (1) K pˇreruˇsen´ı optick´eho kabelu o d´elce 500 m m˚ uˇze doj´ıt v libovoln´e vzd´alenosti od jeho poˇc´atku, pˇriˇcemˇz pravdˇepodobnost n´ ahodn´eho jevu, ˇze dojde k pˇreruˇsen´ı v nˇejak´em u ´seku je pˇr´ımo u ´mˇern´a d´elce u ´seku a nez´ avis´ı na jeho poloze. Urˇcete rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny X vyjadˇruj´ıc´ı vzd´ alenost m´ısta pˇreruˇsen´ı od poˇc´atku, jej´ı hustotu pravdˇepodobnosti a z´akladn´ı ˇc´ıseln´e charakteristiky a pravdˇepodobnost, ˇze k pˇreruˇsen´ı kabelu dojde v u ´seku od 300 m do 400 m. (2) V rovinˇe jsou nar´ ysov´ any rovnobˇeˇzky vzd´alen´e od sebe stˇr´ıdavˇe 1, 5 a 8 cm. Na rovinu je n´ahodnˇe vrˇzen kruh o polomˇeru 2, 5 cm. Urˇcete pravdˇepodobnost toho, ˇze nebude prot’at ˇz´adnou rovnobˇeˇzkou. (3) Nˇekter´e slovn´ı u ´lohy, podle toho jak ˇcten´aˇr ch´ape slovo n´ahodnˇe”, mohou v´est k r˚ uzn´ ym v´ ysledk˚ um ” i paradox˚ um. V pˇr´ıpadˇe z´ ajmu doporuˇcujeme sezn´amit se s diskus´ı v [5]. (4) Buffonova u ´ loha o jehle (18.stolet´ı) viz obr. 11: Na rovinu rozdˇelenou na p´asy soustavou rovnobˇeˇzn´ ych pˇr´ımek o vzd´ alenosti 2a se h´az´ı n´ahodn´ ym zp˚ usobem jehla d´elky 2b < 2a. Urˇcete pravdˇepodobnost, ˇze jehla protne nˇekterou pˇr´ımku soustavy, nepˇredpokl´ad´ame, ˇze se jehla zap´ıchne. ˇ sen´ı: Poloha jehly je pops´ Reˇ ana pomoc´ı u ´hlu, kter´ y jehla sv´ır´a s pˇr´ımkou (n´ahodn´a veliˇcina X), a vzd´alenosti stˇredu jehly od nejbliˇzˇs´ı rovnobˇeˇzky (n´ahodn´a veliˇcina Y ). Tyto veliˇciny lze povaˇzovat za stochasticky nez´ avisl´e a nab´ yvaj´ı s pravdˇepodobnost´ı 1 sv´ ych hodnot z mnoˇziny Ω = h0, πi × h0, ai. H´ az´ıme-li jehlu n´ ahodnˇe, znamen´a to, ˇze ji h´az´ıme tak, ˇze vˇsechny dvojice v´ ysledk˚ u m˚ uˇzeme povaˇzovat za stejnˇe moˇzn´e, a tedy n´ahodn´ y vektor (X, Y )> m´a dvojrozmˇ ern´ e rovnomˇ ern´ e 1 rozdˇ elen´ı na obd´eln´ıku Ω. Protoˇze jeho obsah je roven aπ, je hustota vektoru f (x, y) = aπ na obd´eln´ıku a nulov´ a jinde. Nyn´ı n´ as zaj´ım´ a, kdy nastane jev A, kdy jehla protne pˇr´ımku. S pomoc´ı obr´azku 11 vid´ıme, ˇze to je tehdy, kdyˇz je splnˇena podm´ınka Y ≤ b sin X. M˚ uˇzeme tedy urˇcit, ˇze A = {(x, y) ∈ Ω | y ≤ b sin x}. Nyn´ı jiˇz zb´ yv´ a jen dosadit do vztah˚ u a vypoˇc´ıtat pravdˇepodobnost: ! Z Z π Z bsin x Z π 1 1 2b dx = b sin x = . P ((X, Y ) ∈ A) = f (x, y)dxdy = aπ aπ 0 aπ 0 0 A
Zaj´ımavosti - metody Monte Carlo. Pˇredeˇsl´ y pˇr´ıklad (Buffonova jehla) a jeho v´ ysledek vypadaj´ı ponˇekud vyumˇelkovanˇe a nepouˇzitelnˇe. Zd´an´ı ovˇsem klame, protoˇze historicky stoj´ı u z´aklad˚ u d˚ uleˇzit´e skupiny v´ ypoˇcetn´ıch metod nazvan´ ych Monte Carlo”, protoˇze jsou zaloˇzeny na generov´an´ı posloupnost´ı ” n´ahodn´ ych ˇc´ısel. M˚ uˇzeme uv´aˇzit, ˇze vypoˇcten´a pravdˇepodobnost P ((X, Y ) ∈ A) =
2b 2b . Logicky lze ps´at π = . aπ aP ((X, Y ) ∈ A)
A nyn´ı pˇrich´ az´ı pointa. V klasick´e pravdˇepodobnosti se hovoˇr´ı o tom, ˇze pravdˇepodobnost P ˇcasto odhadujeme statistick´ ym experimentem (napˇr. odhad pravdˇepodobnosti p´adu rubu pˇri h´azen´ı minc´ı pomoc´ı RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
Obr´azek 11: hody jehly,
15
poˇc´ıtaˇcov´a simulace,
Buffon na zn´amce
relativn´ı ˇcetnosti). Podobn´ y experiment m˚ uˇze nyn´ı v´est k pokusu o experiment´ aln´ı odhad ˇc´ısla π. Oznaˇc´ıme-li si n poˇcet vˇsech hod˚ u jehly a m kolikr´at prot’ala pˇr´ımku (nastal jev A), potom po dosazen´ı m av´ ame: n za P dost´ 2bn . π je pˇribliˇznˇe rovno” ” am Poznamenejme, ˇze v kapitol´ ach vˇenovan´ ych matematick´e statistice se ˇcten´aˇr dozv´ı, v jak´em smyslu je zde m´ınˇeno je pˇribliˇznˇe rovno” a co je to statistick´ y odhad”. Jiˇz nyn´ı poznamenejme, ˇze tento odhad ” ” je t´ım pˇ resnˇ ejˇ s´ı, ˇ c´ım je n vˇ etˇ s´ı a pro n −→ ∞ tento odhad konverguje k π s pravdˇepodobnost´ı ” 1” (Z´ajemce, touˇz´ıc´ı po hlubˇs´ım pochopen´ı odliˇsnost´ı v ch´ap´an´ı jemu zn´am´ ych numerick´ ych chyb a novˇe zm´ınˇen´ ych statistick´ ych chyb, se bude muset zaˇc´ıst do podstatnˇe n´aroˇcnˇejˇs´ıho textu [8], orientaˇcn´ı pohled nab´ız´ı grafick´e zn´ azornˇen´ı poˇc´ıtaˇcov´e simulace, viz obr.11). Uveden´a u ´loha je jednou z prvn´ıch u ´loh, kter´e slouˇzily jako z´aklad pro rozvoj v´ ypoˇcetn´ıch metod Monte Carlo. Principem tˇechto metod je, ˇze ˇreˇsen´ y probl´em nen´ı aproximov´an numericky, ale je nahrazen ekvivalentn´ım” probl´emem stochastick´ ym, a tedy lze hovoˇrit i o tom, ˇze ˇc´ast v´ ypoˇctu je nahrazena ” n´ahodn´ ymi pokusy. V´ yznam tˇ echto metod byl docenˇ en teprve se zaveden´ım poˇ c´ıtaˇ c˚ u, jistˇe u ´navn´e n´ahodn´e experimenty byly kon´ any i pˇredt´ım (nejen hazardn´ı hr´aˇci r˚ uzn´ ych stˇredovˇek´ ych her, ale napˇr. je citov´ ano opakovan´e h´ azen´ı minc´ı prov´adˇen´e Pearsonem). U zrodu myˇslenky vyuˇzit´ı v´ ypoˇcetn´ı techniky pro n´ahodn´e generov´an´ı (m´ısto napˇr. lidsk´e ruky) st´ali matematici Ulam a von Neumann (viz www zdroje). Z´akladn´ı ot´azka, kter´a se od t´e doby ˇreˇs´ı je, jak z´ıskat dostateˇcnˇe dlouhou a reprezentativn´ı posloupnost realizac´ı z dan´eho rozdˇelen´ı. Pˇripomeˇ nme, ˇze zm´ınˇen´e algebraick´e kongruenˇcn´ı gener´atory generuj´ı v´ ybˇer z C(n). Pokud ovˇsem zvol´ıme n velk´e a dˇel´ıme z´ıskan´e hodnoty n, z´ısk´ame rozumn´ y v´ ybˇer z R(0; 1). Pro ˇradu dalˇs´ıch rozdˇelen´ı se pak pouˇz´ıv´a obrat, kter´ y vyuˇz´ıv´a distribuˇcn´ı funkce rovnomˇern´eho rozdˇelen´ı a vlastnost´ı transformac´ı n´ ahodn´ ych veliˇcin. Umoˇzn ˇuje n´am pak pomoc´ı tzv. kvantilov´ e funkce (z´ıskan´e z inverzn´ı relace k distribuˇcn´ı funkci) transformovat rovnomˇernˇe generovan´e hodnoty na hodnoty reprezentuj´ıc´ı jin´e rozdˇelen´ı (viz napˇr. odvozen´ı v [1], str. 95). Zd˚ uraznˇeme, ˇze metody Monte Carlo se pouˇ z´ıvaj´ı v pˇ r´ıpadech, kdy z d˚ uvodu sloˇ zitosti nebo velk´ e dimenze ˇ reˇ sen´ ych u ´ loh nelze pouˇ z´ıt klasick´ e analytick´ e nebo numerick´ e postupy (napˇr. v´ ypoˇcet 10 rozmˇern´eho integr´ alu - viz aplikace ve spolehlivosti). Nelze ovˇsem oˇcek´avat, ˇze poskytnou stejnou nebo dokonce lepˇs´ı kvalitu tam, kde pˇresnˇejˇs´ı postupy selhaly. Proto je tak´e nevhodn´e Monte Carlo metody pouˇz´ıvat tam, kde se osvˇedˇcily klasick´e postupy. Mezi typick´e oblasti jejich aplikac´ı patˇr´ı v´ ypoˇcty integr´ al˚ u a hled´ an´ı extr´em˚ u. Pˇ r´ıklady: (5) Navrhnˇete postup v´ ypoˇctu dvojn´eho integr´alu (napˇr. obsah kruhu) pomoc´ı metody Monte Carlo. (6) Seznamte se s problematikou transformace n´ahodn´ ych veliˇcin a kvantilov´ ych funkc´ı (znaˇc´ıme F −1 , protoˇze pro rostouc´ı F (x) je funkc´ı inverzn´ı) a ukaˇzte, ˇze X ∼ R(0, 1) a pro rostouc´ı distribuˇcn´ı funkci F n´ ahodn´e veliˇciny Y plat´ı, ˇze transformac´ı Y = F −1 (X) hodnot generovan´ ych z rovnomˇern´eho rozdˇelen´ı z´ısk´ ame rozdˇelen´ı s distribuˇcn´ı funkc´ı F (x). Z´ avˇ erem. Z pohledu zkouˇsky se jedn´ a o rozdˇelen´ı pravdˇepodobnosti, kter´e umoˇzn ˇuje vyzkouˇset principy s pomoc´ı jednoduch´ ych v´ ypoˇct˚ u. Proto je velmi d˚ uleˇ zit´ e. Lze jen doporuˇcit prov´ est v´ ypoˇ cty i pro po ˇ c´ astech rovnomˇ ern´ e rozdˇ elen´ı (jeho hustota je po ˇc´astech konstantn´ı - graf pˇripom´ın´a histogram), kter´e zde z´ amˇernˇe nebylo zm´ınˇeno.
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
16
2. Norm´ aln´ı rozdˇ elen´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a norm´aln´ı rozdˇelen´ı, znaˇc´ıme X ∼ N (µ, σ 2 ), kde µ, σ 2 ∈ 2 R a σ > 0. V zahraniˇcn´ı literatuˇre najdeme n´azvy rozdˇelen´ı: Gaussovo (Nˇemecko), Laplaceovo (Francie to ovˇsem spr´ avnˇe vyhrazujeme pro dvojitˇe exponenci´aln´ı rozdˇelen´ı). My se pˇridrˇz´ıme ˇcesko-anglick´eho” ” n´azvu. Z´avˇerem poznamenejme, ˇze pro n´ahodn´ y vektor se zav´ad´ı v´ıcerozmˇern´e norm´aln´ı rozdˇelen´ı. Pouˇ zit´ı. Norm´ aln´ı rozdˇelen´ı je pouˇz´ıvan´ ym modelem v aplikac´ıch, kter´e interpretuj´ı n´ ahodn´ e v´ ysledky jako aditivn´ı v´ ysledek mnoha nez´ avisl´ ych vliv˚ u (napˇr. chyba mˇeˇren´ı, odchylka rozmˇeru v´ yrobku od poˇzadovan´e hodnoty, apod.). Funkˇ cn´ı charakteristiky. Jestliˇze jsme se dosud odkazovali na pˇredchoz´ı znalosti, pˇr´ıpadnˇe zdrav´ y ” rozum” ˇcten´aˇre, ted’ pouze konstatujeme, ˇze hustota norm´aln´ıho rozdˇelen´ı pravdˇepodobnosti je definov´ana n´ıˇze. Pokud na laskav´eho a neinformovan´eho ˇcten´aˇre p˚ usob´ı vzorec jako blesk z ˇcist´eho nebe a vede k reakci Kde se to vzalo?”, je to reakce spr´avn´a a odpov´ıd´a popularitˇe a jist´e tajemnosti obklopuj´ıc´ı N ” rozdˇelen´ı. My vˇsak budeme pomˇernˇe neciteln´ı a ˇc´ast tajemstv´ı kolem tohoto rozdˇelen´ı ˇcten´aˇr˚ um odhal´ıme. Hustota: (x − µ)2 2σ 2 ,
−
f (x)
1 √ e σ 2π
=
x∈R
(33)
Distribuˇ cn´ı funkce: Zx F (x)
=
−
1 √ e σ 2π
(t − µ)2 2σ 2 dt,
x∈R
(34)
−∞
Na obr. 12 jsou grafy hustot pravdˇepodobnosti a na obr. 13 grafy odpov´ıdaj´ıc´ıch distribuˇcn´ıch funkc´ı norm´aln´ıho rozdˇelen´ı pro r˚ uzn´e hodnoty parametr˚ u µ a σ2 .
Obr´azek 12: p(x)
Obr´azek 13: F (x)
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
17
ˇ ıseln´ C´ e charakteristiky. stˇ redn´ı hodnota: rozptyl: modus: medi´ an: koeficient ˇ sikmosti:
E(X) D(X) x ˆ x0,5 A(X)
= = = = =
µ σ2 µ µ 0
(35) (36) (37) (38) (39)
Vlastnosti i pˇ r´ıklady. Vlastnosti hustoty norm´aln´ıho rozdˇelen´ı lze zkoumat i z pohledu matematick´e anal´ yzy (viz Matematika I – pr˚ ubˇeh funkce). Doporuˇcujeme ˇcten´aˇri ovˇeˇrit vˇse vlastn´ım v´ ypoˇctem: 1) f (x) je spojit´ a funkce nab´ yvaj´ıc´ı vesmˇes kladn´ ych hodnot (kdo chce hlubˇs´ı rozbor a komplikace, necht’ do toho ˇsl´ apne” a otevˇre napˇr. [7]). ” 2) f (x) je symetrick´ a podle osy x = µ (viz x0,5 ). 3) f (x) je diferencovateln´ a na R (m´ a nav´ıc derivace vˇsech ˇr´ad˚ u), rostouc´ı pro x < µ, klesaj´ıc´ı pro x > µ. V bodˇe x = µ nab´ yv´ a sv´eho lok´ aln´ıho maxima, kter´e je z´aroveˇ n glob´aln´ım (viz x ˆ). 4) Asymptotick´e chov´ an´ı f (x) je pops´ ano vztahy lim f (x) = 0 a lim f (x) = 0. n−→−∞
n−→∞
5) f (x) m´a inflexn´ı body µ − σ a µ + σ. Je konk´ avn´ı na intervalu hµ − σ, µ + σi a konvexn´ı vnˇe tohoto √ intervalu. Pˇripom´ın´ ame samozˇrejmost, ˇze σ = σ 2 , kter´a pozdˇeji u jin´ ych ˇreck´ ych p´ısmen a jin´ ych rozdˇelen´ı nemus´ı b´ yt tak zˇrejm´ a. 6) Jednou z posledn´ıch ot´ azek, nikoliv vˇsak v´ yznamem, je: proˇc v z´apise F (x) vystupuje integr´al? Proˇc ” nen´ı vypoˇc´ıtan´ y?” Odpovˇed’ je prost´ a: K integr´ alu, kter´ ym je d´ ana distribuˇ cn´ı funkce F (x), neexistuje primitivn´ı funkce v koneˇ cn´ em tvaru. K v´ ypoˇctu hodnoty F (x) lze ale pouˇz´ıt napˇr. nekoneˇcn´e ˇrady. 7) V aplikac´ıch (pˇri ˇr´ızen´ı jakosti v´ yroby, apod.) se ˇcasto uˇz´ıv´a tzv. pravidlo tˇ r´ı sigma (plus/minus 3σ), zaloˇzen´e na tom, ˇze: µ+3σ Z
P (X ∈ hµ − 3σ, µ + 3σi) = F (µ + 3σ) − F (µ − 3σ) =
− 1 √ e σ 2π
(x − µ)2 2σ 2 dx = 0, 997
µ−3σ
Toto pravidlo znamen´ a, ˇze pˇri velk´em poˇctu pozorov´an´ı n´ahodn´e veliˇciny X s norm´ aln´ım rozdˇelen´ım N (µ, σ 2 ) m˚ uˇzeme oˇcek´ avat, ˇze cca 99, 7% pozorovan´ ych hodnot x bude leˇzet v intervalu hµ − 3σ, µ + 3σi. Normovan´ e (z´ akladn´ı, standardn´ı) norm´ aln´ı rozdˇ elen´ı. Velmi d˚ uleˇzit´ ym pˇr´ıpadem je situace, ˇ ık´ame, ˇze n´ kdy µ = 0 a σ 2 = 1, tedy U ∼ N (0; 1). R´ ahodn´ a veliˇ cina U m´ a normovan´ e norm´ aln´ı rozdˇ elen´ı. Znaˇcen´ı odliˇsuj´ıc´ı obecn´e a normovan´e rozdˇelen´ı je vhodn´e pˇri uv´adˇen´ı dalˇs´ıch poznatk˚ u. Funkˇ cn´ı charakteristiky. Hustotu ϕ(u) (40) i distribuˇcn´ı funkci Φ(u) (41) normovan´eho norm´aln´ıho rozdˇelen´ı N(0;1) z´ısk´ ame dosazen´ım µ = 0 a σ 2 = 1 do (33) a (34): Hustota: −
ϕ(u)
1 √ e 2π
=
u2 2 ,
u∈R
(40)
Distribuˇ cn´ı funkce: Zu Φ(u)
=
t2 − 1 √ e 2 dt, 2π
u∈R
(41)
−∞
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
18
Obr´ azek 14: software Statistica: U ∼ N (0; 1), ϕ(u), Φ(u), uP . Vlastnosti. Vlastnosti hustoty norm´ aln´ıho rozdˇelen´ı N (µ, ς 2 ) uveden´ yˇse lze pˇr´ımo aplikovat na norp e v´ movan´e norm´aln´ı rozdˇelen´ı N (0; 1): E(X) = x ˆ = x0,5 = 0, D(X) = D(X) = 1, A(X) = 0. 1) Z´akladn´ı ot´ azkou je, zda pro v´ ypoˇ cty Φ(u) a uP potˇ rebujeme poˇ c´ıtat v´ yˇ se uveden´ e integr´ aly. Pˇrekvapiv´a odpovˇed’ zn´ı, ˇze nikoliv. K v´ ypoˇctu hodnot Φ(u) a kvantil˚ u uP lze pouˇ z´ıt statistick´ e tabulky (viz www.mat.fme.vutbr.cz, kde hodnoty distribuˇcn´ı funkce Φ(u) normovan´e n´ahodn´e veliˇciny U jsou tabelov´ any v tabulce T1; dalˇs´ı zdroje jsou [2], [14], [13]). Je moˇzn´e rovnˇeˇz pouˇz´ıt vhodn´ y software (napˇr. Statistica, Statgraphics, Minitab, Excel aj.). Obvykle lze s v´ yhodou redukovat rozsah tabulek a vyuˇz´ıt symetrie zm´ınˇen´e dˇr´ıve, d´ıky kter´e plat´ı Φ(−u) = 1−Φ(u) a pro kvantily U plat´ı u1−P = −uP , 0 < P < 1. Ot´azkou tedy je, jak urˇcit obecn´e hodnoty F (x) a xP . Vˇsimnˇeme si dalˇs´ıch poznatk˚ u: 2 2) Jestliˇze n´ ahodn´ a veliˇcina X m´ a norm´aln´ı rozdˇelen´ı N (µ, σ ), pak n´ahodn´a veliˇcina Y = aX + b, kde a, b ∈ R, a 6= 0, m´ a norm´ aln´ı rozdˇelen´ı N (aµ + b, a2 σ 2 ). 3) Aplikac´ı 2) zjist´ıme, ˇze transformac´ı n´ ahodn´e veliˇciny X s norm´aln´ım rozdˇelen´ım N (µ, σ 2 ) na n´ahodnou dostaneme normovan´ e norm´aln´ı rozdˇelen´ı N (0; 1) s distribuˇcn´ı funkc´ı Φ(u). veliˇcinu U = X−µ σ 4) Pro v´ ypoˇ cty je d˚ uleˇ zit´ e, ˇze jestliˇze n´ahodn´a veliˇcina X m´a norm´aln´ı rozdˇelen´ı N (µ, σ 2 ), potom jej´ı distribuˇcn´ı funkce F (x) = Φ( x−µ ı kvantily jsou xP = µ + σuP , 0 < P < 1. σ ) a jej´ 5) Staˇc´ı tedy pˇ rev´ est probl´ em v´ ypoˇ ctu pravdˇ epodobnosti P (X ∈ B) pro X ∼ N (µ, σ 2 ) na hled´ an´ı hodnot distribuˇ cn´ı funkce F (x), po transformaci Φ(u) a nakonec hledat v tabulk´ ach. Pˇ r´ıklady: (1) Pro n´ahodnou veliˇcinu X s rozdˇelen´ım N (0; 1), urˇcete pravdˇepodobnost, ˇze nabude hodnoty: a) vˇetˇs´ı neˇz 2, 68 , b) menˇs´ı nebo rovn´e 1, 73, c) vˇetˇs´ı nebo rovn´e −0, 66, d) menˇs´ı neˇz −1, 88, e) v mez´ıch ˇ ste pomoc´ı hled´an´ı ve statistick´ od 1, 05 do 1, 65, f) v mez´ıch od −0, 05 do 1, 05. Reˇ ych tabulk´ach (viz T1). ˇ (2) Zivotnost baterie je n´ ahodnou veliˇcinou s norm´aln´ım rozdˇelen´ım s parametry µ = 300 hod. a σ = 35 hod. Urˇcete a) pravdˇepodobnost, ˇze baterie bude m´ıt ˇzivotnost vˇetˇs´ı neˇz 320 hodin, b) jakou hodnotu pˇrekroˇc´ı ˇzivotnost baterie s pravdˇepodobnost´ı vˇetˇs´ı neˇz 0, 75. Zaj´ımavosti. Vrat’me se nyn´ı k diskusi o n´azvu rozdˇelen´ı. Nejprve pˇripomeˇ nme nˇekter´e poutav´e n´azvy: Neutr´aln´ı n´ azev graf hustoty norm´ aln´ıho rozdˇelen´ı b´ yv´a v souvislosti s IQ testy anglicky p´ıˇs´ıc´ımi autory nahrazov´an n´ azvem the bell curve” (zvonovit´a kˇrivka), viz obr. 15. Francouzi pouˇz´ıvaj´ı n´azev kˇ rivka ” policejn´ıho (Napoleonsk´ eho) klobouku viz obr. 15. Vynechejme d´ale neortodoxn´ı n´azvy a sp´ıˇse se zeptejme na to, kter´ y n´ azev byl pouˇzit jako prvn´ı, zda norm´aln´ı nebo Gaussovo rozdˇelen´ı. Jestliˇze ˇcek´ame, ˇze r˚ uzn´e n´azvy prosazovaly r˚ uzn´e skupiny jejich pˇr´ıznivc˚ u, nebo dokonce Gauss s´am, hluboce se m´ yl´ıme. Zp˚ usobil to jeden ˇclovˇek, byt’ statistick´ y velik´an – Karl Pearson, ve sv´ ych prac´ıch z obdob´ı 1893-97 dospˇel od pojmenov´ an´ı norm´ aln´ı kˇrivky k norm´ aln´ımu rozdˇelen´ı, aby v roce 1905 uvedl pojem Gaussova kˇrivka. A dvojznaˇcnost byla na svˇetˇe. Nav´ıc jeˇstˇe ned´avno byla podloˇzena tvrdou mˇenou”. (Poznamenejme, ˇze ” pˇretisk sice bankovku hyzd´ı, ale dovoluje zveˇrejnˇen´ı obr´azku 15. Vˇeˇr´ım, ˇze zaj´ımaj´ıc´ı se ˇcten´aˇr najde na internetu i p˚ uvodn´ı vyobrazen´ı.) Dalˇs´ı logickou ot´azkou m˚ uˇze b´ yt, kdo si vˇsiml norm´aln´ıho rozdˇelen´ı, byt’ tehdy bez n´ azvu, jako prvn´ı. Pierre-Simon Laplace (1749-1827) francouzsk´ y matematik zab´ yvaj´ıc´ı se teori´ı pravdˇepodobnosti v´ıce neˇz 50 let je zm´ınil v Th´eorie Analytique des Probabilit´es” v roce 1812. ” RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
19
Obr´ azek 15: zvonov´ a kˇrivka, dvakr´at napoleonsk´ y klobouk, Gaussova” bankovka ” Carl Friedrich Gauss (1777-1855) jeden z nejvˇetˇs´ıch matematik˚ u vˇsech dob sice zveˇrejnil sv´e poznatky pozdˇeji, ale doloˇzitelnˇe se rozdˇelen´ım zab´ yval kolem roku 1809, kdy postavil p˚ uvodnˇe Legendreovu metodu nejmenˇ s´ıch ˇ ctverc˚ u na pevn´e z´ aklady anal´ yzy norm´aln´ıho rozdˇelen´ı chyb. Protoˇze sv´e v´ ysledky ale poskytl ve znaˇcnˇe mlhav´e podobˇe, Legendre jej obvinil z plagi´atorstv´ı. Proto se Laplace v prac´ıch obdob´ı 1810-1812 snaˇzil Gaussovy postupy upˇresnil. Nicm´enˇe pro Gausse v dneˇsn´ı dobˇe pln´e potˇreby ohlasu v m´edi´ıch hovoˇr´ı fenomen´ aln´ı u ´spˇech pˇri pˇredpovˇedi, kdy na z´akladˇe m´ala historick´ ych dat a sv´ ych znalost´ı nebesk´e mechaniky urˇ cil kde oˇ cek´ avat tehdy objevenou planetku Ceres. Dramatick´ y pˇr´ıbˇeh zaˇc´ın´ a 1.1. 1801, kdy italsk´ y astronom Piazzi spatˇril nov´ y svˇetl´ y bod. Probˇehla pozorov´an´ı, formulace pˇredpovˇed´ı kde bude ke spatˇren´ı pˇr´ıˇstˇe, ale v l´etˇe 1801 nikdo nic nenaˇsel. Aˇz v prosinci se objevil text mlad´eho Gausse, kter´ ym pˇredˇcil dalˇs´ı velk´a jm´ena (Eulera, Laplace, Lagrange, atd.) a navrhl hledat planetku u ´plnˇe jinde (6 u ´hlov´ ych stupˇ n˚ u se tak jev´ı v astronomii). 24let´ y mlad´ık uspˇel a trefil ” se”. Podle vlastn´ıho sdˇelen´ı pouˇzil pˇri v´ ypoˇctu i metodu nejmenˇs´ıch ˇctverc˚ u, kterou objevil jiˇz v 18ti letech. Sl´ava byla zaruˇcena a doˇzivotn´ı pozice profesora na universitˇe v G¨ottingenu tak´e. Takˇze jak d´ ale? Budeme se konzervativnˇe drˇzet neutr´ aln´ıho n´azvu norm´ aln´ı, protoˇze po Gaussovi je pojmenov´ana ˇrada dalˇs´ıch pojm˚ u.
Obr´ azek 16: R˚ uznˇe staˇr´ı Gaussov´e a hustota norm´aln´ıho rozdˇelen´ı pro (X, Y ).
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
20
Z´ avˇ erem. Asi se shodneme se ˇcten´ aˇrem, ˇze m˚ uˇzeme shrnout, ˇze norm´ aln´ı rozdˇ elen´ı je velmi d˚ uleˇ zit´ e, ale jeho pouˇ z´ıv´ an´ı je vlastnˇ e docela snadn´ e (potˇrebujete statistick´e tabulky a poˇc´ıtat line´arn´ı transformace). N rozdˇelen´ı pˇredevˇs´ım pˇredstavuje pˇr´ıprava na matematickou statistiku. Samozˇrejmˇe v pˇr´ıpadˇe snahy pochopit vˇsechny hlubok´e souvislosti je nutn´e kvalitn´ı matematick´e z´azem´ı.
3. Exponenci´ aln´ı rozdˇ elen´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a exponenci´aln´ı rozdˇelen´ı, znaˇc´ıme X ∼ Exp(A, δ), kde A ∈ R a δ > 0. V literatuˇre a programech se vyskytuje i jednoparametrick´a varianta rozdˇelen´ı, kdy A = 0. Pouˇ zit´ı. Exp rozdˇelen´ı je vhodn´ ym modelem, kdy n´as zaj´ım´a rozdˇelen´ı doby X do poruchy nˇejak´eho zaˇr´ızen´ı, a pˇritom pravdˇepodobnost poruchy v n´asleduj´ıc´ıch x hodin´ach nen´ı ovlivnˇena pˇredch´azej´ıc´ı histori´ı zaˇr´ızen´ı. Rozdˇelen´ı se tak´e naz´ yv´ a rozdˇelen´ım bez pamˇeti”. Exponenci´ aln´ı rozdˇ elen´ı popisuje ” dobˇ re rozdˇ elen´ı ˇ zivota zaˇ r´ızen´ı, u nichˇ z doch´ az´ı k poruˇ se z n´ ahodn´ ych pˇ r´ıˇ cin, nikoliv v d˚ usledku opotˇreben´ı nebo u ´navy materi´ alu. Funkˇ cn´ı charakteristiky. Uv´ ad´ıme pouze hustotu f (x), distribuˇcn´ı funkci F (x) doporuˇcujeme ˇcten´aˇri spoˇc´ıtat samostatnˇe. Rovnˇeˇz doporuˇcujeme, aby si ˇcten´aˇr s´am naˇcrtl grafy f (x) a F (x) pro vhodnou volbu parametr˚ u rozdˇelen´ı. Hustota: f (x) =
1 − x−A δ δe
0
pro x > A jinde
(42)
ˇ ıseln´ C´ e charakteristiky. stˇ redn´ı hodnota: rozptyl: koeficient ˇ sikmosti (asymetrie):
E(X) = A + δ D(X) = δ 2 A(X) = 2
(43) (44) (45)
Pˇ r´ıklady: (1) Kromˇe vlastn´ıho odvozen´ı f (x), F (x), E(X), D(X), A(X) doporuˇcujeme odvodit x0,5 . (2) Urˇcete rozdˇelen´ı transformovan´e n´ ahodn´e veliˇciny Y = X−A z v´ıte, ˇze X ∼ Exp(A, δ). δ , kdyˇ (3) Projdˇete si dosud probran´ a rozdˇelen´ı pravdˇepodobnosti a zamyslete se nad t´ım, jak souvis´ı parametry rozdˇelen´ı (obvykle zadan´e) s ˇc´ıseln´ ymi charakteristikami (obvykle vypoˇcten´ ymi na z´akladˇe vzorc˚ u). (4) Seznamte se s Laplaceov´ ym rozdˇ elen´ım (dvojitˇe exponenci´aln´ım, rozdˇelen´ım s tˇeˇzk´ ymi konci”) ” a po probr´ an´ı regresn´ı anal´ yzy a metody nejmenˇs´ıch ˇctverc˚ u hledejte k jak´emu krit´eriu povede situace, kdy chybov´e ˇcleny budou m´ıt Laplaceovo rozdˇelen´ı. Z´ avˇ erem. Exponenci´ aln´ı rozdˇelen´ı je vyuˇcuj´ıc´ımi velmi cenˇeno, protoˇze je vhodn´e pro zad´an´ı ke zkouˇsce.
4. Weibullovo rozdˇ elen´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a Weibullovo rozdˇelen´ı, znaˇc´ıme X ∼ W (δ, b, k), kde b ∈ R a δ, k > 0. V literatuˇre a programech se vyskytuje i dvouparametrick´a varianta rozdˇelen´ı, kdy b = 0. Pouˇ zit´ı. Weibullovo rozdˇelen´ı je vhodn´ ym modelem pro u ´lohy, kdy zkoum´ame ˇzivotnost nˇejak´eho zaˇr´ızen´ı. Jestliˇze X znaˇc´ı ˇzivotnost zaˇr´ızen´ı, pro k > 1 je vhodn´ ym modelem pro ˇ zivotnost zaˇ r´ızen´ı podl´ ehaj´ıc´ıho opotˇ reben´ı nebo u ´ navˇ e, pro k < 1 je vhodn´ ym modelem pro ˇ zivotnost zaˇ r´ızen´ı, u nˇ ehoˇ z doch´ az´ı k poruch´ am v d˚ usledku vad, pro k = 1 dostaneme exponenci´aln´ı rozdˇelen´ı (viz jeho pouˇzit´ı).
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
21
Funkˇ cn´ı charakteristiky. Uv´ ad´ıme hustotu f (x), pro ˇcten´aˇre m˚ uˇze b´ yt zaj´ımav´ ym u ´kolem naj´ıt ˇ ıseln´e chazd˚ uvodnˇen´ı jej´ıho tvaru. D´ ale uv´ ad´ıme grafy f (x) a F (x) pro b = 0, δ = 1 a k = 0, 5; 1; 3. C´ rakteristiky neuv´ ad´ıme, ˇrada z nich je vyj´adˇrena pomoc´ı Γ funkce, a proto jejich vyhled´an´ı ponech´av´ame na zaj´ımaj´ıc´ım se ˇcten´ aˇri. Hustota: f (x) =
k δ (x
− b)k−1 0
pro x ≥ b jinde
(46)
Obr´azek 17: software Statistica: Weibullovo rozdˇelen´ı b = 0, δ = 1 a br´ano zleva k = 0, 5; 1; 3. ˇ edsk´ Zaj´ımavosti. Sv´ y statistik Wallodi Weibull (1887-1979) p˚ usobil mnoho let jako n´amoˇrn´ı d˚ ustojn´ık a inˇzen´ yr zab´ yvaj´ıc´ı se zkoum´ an´ım moˇrsk´eho dna. Prvn´ı ˇcl´anek o W rozdˇelen´ı publikoval v roce 1939. Pˇres mnoh´a ocenˇen´ı, kter´ a obdrˇzel, jeden z jeho ˇz´ak˚ u v roce 2000 konstatoval, ˇze pouze 3 univerzity v USA zahrnuly do v´ yuky statistiky Weibullovo rozdˇelen´ı (na FSI VUT je vyuˇcov´ano a pouˇz´ıv´ano od osmdes´at´ ych let minul´eho stolet´ı ...). Z´ avˇ erem. Weibullovo rozdˇelen´ı je uveden´e jako d˚ uleˇzit´e v´ıce pro inˇzen´ yrskou budoucnost ˇcten´aˇre neˇz ve vztahu ke zkouˇsce.
5. Nˇ ekter´ a dalˇ s´ı spojit´ a rozdˇ elen´ı Pozn´ amka. Podobnˇe jako u diskr´etn´ıch rozdˇelen´ı i v tomto odstavci uvedeme n´azvy a aplikaˇcn´ı oblasti pro nˇekter´ a spojit´ a rozdˇelen´ı pravdˇepodobnosti. Cauchovo (Lorentzovo) rozdˇelen´ı se pouˇz´ıv´a ve fyzice, pro n´ as m´ a tu zaj´ımavou vlastnost, ˇze E(X) nen´ı definovan´a (ovˇeˇrte sami, viz [20]). Dalˇs´ı aplikace v pˇr´ırodn´ıch a technick´ ych vˇed´ ach maj´ı Maxwellovo a Rayleighovo rozdˇelen´ı. Beta rozdˇelen´ı a troj´ uheln´ıkov´ e rozdˇelen´ı se ˇcasto pouˇz´ıvaj´ı pˇri ˇr´ızen´ı projekt˚ u metodami stochastick´e optimalizace. V jin´e oblasti operaˇcn´ıho v´ yzkumu (teorie front) se pouˇz´ıv´a Erlangovo rozdˇelen´ı, kter´e je speci´aln´ım pˇr´ıpadem Gamma rozdˇelen´ı, kter´e je zobecnˇen´ım nˇekolika dalˇs´ıch rozdˇelen´ı. Zaj´ımavou konstrukc´ı jsou useknut´ a rozdˇ elen´ı (napˇr. useknut´e norm´aln´ı), kter´a se snaˇz´ı vylouˇcit odlehl´e nerealistick´e hodnoty. Paretovo (Bradfordovo) rozdˇelen´ı bylo urˇceno pro ekonomick´e aplikace a p˚ uvodnˇe popisovalo distribuci bohatstv´ı ve spoleˇcnosti.
6. Pearsonovo χ2 rozdˇ elen´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a Pearsonovo χ2 rozdˇelen´ı, znaˇc´ıme X ∼ χ2 (k), kde k ∈ N. Parametr k se naz´ yv´ a poˇcet stupˇ n˚ u volnosti a ve statistice je obvykle volen jako poˇcet nez´avisl´ ych informaˇcn´ıch jednotek (napˇr. poˇcet mˇeˇren´ı minus poˇcet odhadnut´ ych parametr˚ u). Zd˚ uraznˇeme, ˇze χ2 je jeden symbol! Pouˇ zit´ı. Toto a dalˇs´ı dvˇe rozdˇelen´ı (t a F ) jsou pˇ r´ıklady rozdˇ elen´ı pouˇ z´ıvan´ ych pozdˇ eji v matematick´ e statistice (viz intervalov´e odhady a testov´an´ı hypot´ez). Pouˇz´ıvaj´ı se zejm´ena jejich kvantily, ale jejich potˇ rebn´ e hodnoty jsou bud’ tabelov´ any (viz T3 v [2]) nebo je poskytne statistick´ y software. M˚ uˇzeme tedy ˇr´ıci, ˇze pro studenty Matematiky 4 by bylo uveden´ı hustot rozdˇelen´ı pravdˇepodobnosti pouze informativn´ı a proto uvedeme jen obr´azky hustot a jakou transformac´ı pˇr´ısluˇsn´e rozdˇelen´ı vznik´ a, z´ ajemce odkazujeme na [2]. RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
22
Obr´ azek 18: Grafy hustot χ2 rozdˇelen´ı a jeho autor. Vlastnosti. Jestliˇze U1 , ..., Uk P jsou nez´ avisl´e n´ahodn´e veliˇciny s normovan´ ym norm´aln´ım rozdˇelen´ım k N (0; 1), pak n´ ahodn´ a veliˇcina i=1 Ui2 m´a Pearsonovo rozdˇelen´ı χ2 (k). Jeho z´akladn´ı ˇc´ıseln´e charakteristiky jsou E(X) = k, D(X) = 2k. Zaj´ımavosti. Karl Pearson (1857-1936) byl anglick´ y statistik, ˇz´ak sira Francise Galtona. D˚ uleˇzit´e jsou jeho v´ ysledky v oblasti korelaˇcn´ı a regresn´ı anal´ yzy, v klasifikac´ı rozdˇelen´ı pravdˇepodobnosti vcetnˇe zaveden´ı χ2 rozdˇelen´ı pro χ2 test. Z´ avˇ erem. Pearsonovo χ2 rozdˇelen´ı je velmi d˚ uleˇzit´e pro matematickou statistiku, a proto je nutn´e si osvojit hled´ an´ı hodnot kvantil˚ u v tabulk´ach.
7. Studentovo t rozdˇ elen´ı Znaˇ cen´ı.
Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a Studentovo t rozdˇelen´ı, znaˇc´ıme X ∼ S(k), kde k ∈ N.
Pouˇ zit´ı. Studentovo t rozdˇelen´ı je pˇr´ıkladem rozdˇelen´ı pouˇz´ıvan´eho pozdˇeji v matematick´e statistice (viz intervalov´e odhady a testov´an´ı hypot´ez). Pouˇz´ıvaj´ı se zejm´ena jeho kvantily, ale potˇ rebn´ e hodnoty jsou bud’ tabelov´ any (viz T2 v [2]) nebo je poskytne statistick´ y software. Opˇet vynech´ame zaveden´ı hustoty, z´ ajemce odkazujeme na [2].
Obr´ azek 19:
Student” a grafy hustot t rozdˇelen´ı. ”
Vlastnosti. Graf hustoty t rozdˇelen´ı je symetrick´ y vzhledem k x = 0. Jeho z´akladn´ı ˇc´ıseln´e charakterisk pro k > 2, tiky jsou: E(X) = 0 pro k > 1 (pro k = 1 dostaneme Cauchyho rozdˇelen´ı), D(X) = k−2 A(X) = 0 pro k > 3, x0,5 = 0. Jestliˇze U a V jsou nez´avisl´e n´ahodn´e veliˇciny, pˇriˇcemˇz U m´a √ normovan´e norm´aln´ı rozdˇelen´ı N (0; 1) a V m´ a Pearsonovo rozdˇelen´ı χ2 (k), pak n´ahodn´a veliˇcina √UV k m´a Studentovo rozdˇelen´ı S(k). RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
23
ˇ aˇri jistˇe vrt´ Zaj´ımavosti. Cten´ a hlavou, kdo je ten vousat´ y p´an na obr´azku a zda se jmenoval Student. Odpovˇed’ je nikoliv, byl to pan William Gosset (1876-1937), kter´ y publikoval pod pseudonymem Student. Nask´ yt´a se ot´ azka proˇc, kdyˇz jm´ena v´ yznaˇcn´ ych statistik˚ u nach´az´ıme u mnoha pojm˚ u. Proˇc ta skromnost, kdyˇz jeho rozdˇelen´ı umoˇzn ˇuje efektivnˇe pracovat v r´amci matematick´e statistiky s mal´ ymi statistick´ ymi soubory (viz t-test)? Odpovˇed´ı m˚ uˇze b´ yt dnes jiˇz legend´arn´ı bonmot anonymn´ıho kolegy: V´ yzkum se dˇel´ı ” na publikovateln´ y a pouˇziteln´ y a obvykle jedno vyluˇcuje druh´e.” Pan Gosset totiˇz pracoval jako sl´ adek v pivovaru Guiness a po sv´ ych studijn´ıch cest´ ach si nepˇ r´ al, aby se vˇ edˇ elo, ˇ ze jeho pivovar pouˇ z´ıv´ a statistick´ e metod. A tak pro nˇekter´e v Anglii a Evropˇe bylo skuteˇcn´e jm´eno Studenta takov´ ym tajemstv´ım, jako pro jin´e skuteˇcn´ a totoˇznost Jacka Rozparovaˇce. Naˇstˇest´ı dnes v´ıme v´ıce alespoˇ n o panu Gossetovi a m˚ uˇzeme smeknout pˇred jeho aplikaˇcn´ımi schopnostmi nad sklenici Guinessu. Z´ avˇ erem. Studentovo t rozdˇelen´ı je velmi d˚ uleˇzit´e pro matematickou statistiku, a proto je nutn´e si osvojit hled´ an´ı hodnot kvantil˚ u v tabulk´ach.
8. Fisherovo-Snedecovorovo F rozdˇ elen´ı Znaˇ cen´ı. Skuteˇcnost, ˇze n´ ahodn´ a veliˇcina X m´a Fisher-Snedecorovo F rozdˇelen´ı, znaˇc´ıme X ∼ F (k1 , k2 ), kde k1 , k2 ∈ N. Pouˇ zit´ı. F rozdˇelen´ı je pˇr´ıkladem rozdˇelen´ı pouˇz´ıvan´eho pozdˇeji v matematick´e statistice (viz intervalov´e odhady a testov´ an´ı hypot´ez). Pouˇz´ıvaj´ı se zejm´ena jeho kvantily, ale potˇ rebn´ e hodnoty jsou bud’ tabelov´ any (viz T4 v [2]) nebo je poskytne statistick´ y software. Opˇet vynech´ame zaveden´ı hustoty, z´ajemce odkazujeme na [2].
Obr´ azek 20: Jeden z autor˚ u R.A. Fisher a grafy hustot F rozdˇelen´ı Vlastnosti. Jestliˇze V1 a V2 jsou nez´ avisl´e n´ahodn´e veliˇciny, pˇriˇcemˇz V1 m´a Pearsonovo rozdˇelen´ı χ2 (k1 ) 1 a V2 m´a Pearsonovo rozdˇelen´ı χ2 (k2 ), pak n´ahodn´a veliˇcina VV12 /k a Fisherovo-Snedecorovo rozdˇelen´ı /k2 m´ F (k1 , k2 ). Zaj´ımavosti. Angliˇcan Ronald Aylmer Fisher (1890-1962) patˇril k nejv´ yznamnˇejˇs´ım statistik˚ um 20. stolet´ı. Ze spolupracovn´ıka se stal Pearsonov´ ym rivalem. Zab´ yval se genetikou, uspoˇr´adal v´ ysledky v oblasti testov´ an´ı hypot´ez (proto F rozdˇelen´ı), st´al u zrodu metody maxim´aln´ı vˇerohodnosti, anal´ yzy rozptylu, pl´anov´ an´ı experimentu a neparametrick´ ych test˚ u. George Wad’ell Snedecor (1882-1974) byl zakladatel prvn´ıho statistick´eho u ´stavu v USA. Spolupracoval s Fisherem zejm´ena bˇehem a v n´ avaznosti na jeho n´avˇstˇevu v USA, F test patˇr´ı k jejich spoleˇcn´ ym v´ ysledk˚ um. Z´ avˇ erem. F rozdˇelen´ı je velmi d˚ uleˇzit´e pro matematickou statistiku, a proto je nutn´e si osvojit hled´an´ı hodnot kvantil˚ u v tabulk´ach.
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
24
C. Aproximace rozdˇ elen´ı ´ Uvodem. V t´eto ˇc´ asti se budeme kr´ atce zab´ yvat moˇznostmi aproximovat jedno rozdˇelen´ı pravdˇepodobnosti druh´ ym. Koneˇcnˇe uvid´ıme, proˇc hraje norm´aln´ı rozdˇelen´ı tak v´ yznamnou roli. K v´ ypoˇctu hodnot pravdˇepodobnostn´ıch funkc´ı a distribuˇcn´ıch funkc´ı binomick´eho rozdˇelen´ı Bi(n, p), hypergeometrick´eho rozdˇelen´ı H(N, M, n) a Poissonova rozdˇelen´ı P o(λ) na PC pouˇz´ıv´ame vhodn´ y software (napˇr. Statgraphics, Statistica, Minitab, Excel aj.). Tato diskr´etn´ı rozdˇ elen´ı vˇ sak m˚ uˇ zeme za jist´ ych podm´ınek tak´ e vz´ ajemnˇ e aproximovat nebo aproximovat pomoc´ı norm´aln´ıho rozdˇelen´ı. Vych´az´ıme pˇritom z vlastnost´ı uvaˇzovan´ ych rozdˇelen´ı a tzv. limitn´ıch vˇet z teorie pravdˇepodobnosti (viz [1], [8]).
1. Aproximace hypergeometrick´ eho rozdˇ elen´ı n n Postup. Pro mal´e hodnoty N (pˇribliˇznˇe N < 0, 1) lze hypergeometrick´e rozdˇelen´ı H(N, M, n) aproximovat rozdˇelen´ım binomick´ ym Bi(n, p) s parametry n a p = M N. n Pro N < 0, 1, M e rozdˇelen´ı H(N, M, n) Poissonov´ ym N < 0, 1 a n > 30 aproximujeme hypergeometrick´ rozdˇelen´ım P o(λ), kde poloˇz´ıme λ = nM . N
Pˇ r´ıklad: (1) V dod´ avce 50 v´ yrobk˚ u je 5 zmetk˚ u. Z dod´avky jsou n´ahodnˇe vybr´any 3 v´ yrobky. Poˇcet zmetk˚ u mezi vybran´ ymi v´ yrobky je n´ ahodn´ a veliˇcina X. Pˇredpokl´adejte nejprve, ˇze se vybran´ y v´ yrobek nevrac´ı nazpˇet do dod´ avky, takˇze jde o n´ ahodn´ y v´ ybˇer bez vracen´ı a urˇcete p(x). Potom v´ ypoˇcet opakujte pro pˇr´ıpad, ˇze vybran´e v´ yrobky jsou vraceny. Obˇe pravdˇepodobnostn´ı funkce porovnejte.
2. Aproximace binomick´ eho rozdˇ elen´ı Poissonov´ ym Postup. Binomick´e rozdˇelen´ı Bi(n, p), kde p < 0, 1 a n > 30, aproximujeme Poissonov´ ym rozdˇelen´ım P o(λ), kde poloˇz´ıme λ = np. Moˇzn´a se jiˇz ˇcten´ aˇr osmˇelil a je pˇripraven po tomto ryze praktick´em n´avodu na trochu teorie. Nab´ıdnˇeme ji: Vˇ eta (Poissonova): Mˇejme posloupnost X1 , . . . , Xn . . . n´ahodn´ ych veliˇcin, kter´e maj´ı rozdˇelen´ı Bi(j, pj ), j = 1, . . . , n, . . . Necht’ pn −→ 0 pro n −→ ∞ a pˇritom lim npn = λ, kde λ > 0. Potom plat´ı, n−→∞ ˇze x λ n lim pxn (1 − pn )n−x = e−λ , x = 0, 1, . . . x n−→∞ x! M˚ uˇzeme pak ˇr´ıci, ˇze za uveden´ ych podm´ınek Poissonovo rozdˇelen´ı je limitn´ım rozdˇelen´ım binomick´eho rozdˇelen´ı. Prakticky to znamen´ a, ˇze pro dostateˇcnˇe velk´e n a dostateˇcnˇe mal´e p m˚ uˇzeme binomick´e rozdˇelen´ı aproximovat rozdˇelen´ım Poissonov´ ym. Pro n > 30 a p < 0, 1 se dopouˇst´ıme chyby menˇs´ı neˇz 10−2 . Pˇ r´ıklad: (1) Opakujeme n-kr´ at nez´ avisle tent´ yˇz pokus, jehoˇz kladn´ y v´ ysledek m´a pravdˇepodobnost p. a) Uvaˇzujeme tˇri varianty hodnot n a p: (1) n = 20, p = 0,2 ; (2) n = 200, p = 0,02; (3) n = 2000, p = 0,002. Pro vˇsechny tˇri varianty vypoˇctˇete hodnotu pravdˇepodobnosti vˇzdy pro tu hodnotu x, kter´a je pˇri dan´ ych n pokusech nejpravdˇepodobnˇejˇs´ı. b) K t´emuˇz v´ ypoˇctu pouˇzijte aproximaci pomoc´ı Poissonova rozdˇelen´ı pravdˇepodobnosti a v´ ysledky porovnejte.
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
25
3. Aproximace binomick´ eho rozdˇ elen´ı norm´ aln´ım Postup. Jestliˇze np(1 − p) > 9, m˚ uˇzeme binomick´e rozdˇelen´ı Bi(n, p) n´ahodn´e veliˇciny X , aproximovat norm´aln´ım rozdˇelen´ım N (µ, σ 2 ), kde klademe m = np a σ 2 = np(1 − p). Pro cel´a nez´aporn´a ˇc´ısla a, b potom je (s ohledem na skuteˇcnost, ˇze jde o diskr´etn´ı rozdˇelen´ı) ! ! a − 0, 5 − np b + 0, 5 − np −Φ p . P (a ≤ X ≤ b) ≈ Φ p np(1 − p) np(1 − p) Nab´ıdnˇeme nyn´ı slavnou vˇetu: Vˇ eta (Moivre-Laplace): Necht’ X1 , . . . , Xn . . . je posloupnost vz´ajemnˇe nez´avisl´ ych n´ahodn´ ych veliˇcin takov´ ych, ˇze ∀i ∈ N : Xi ∼ A(p). Pak n´ ahodn´a veliˇcina ! n X 1 Yn = p Xi − np np(1 − p) i=1 m´a asymptoticky norm´ aln´ı rozdˇelen´ı N (0; 1). Pn Protoˇze Zn = i=1 Xi je n´ ahodn´ a veliˇcina s rozdˇelen´ım Bi(n, p), plyne z Moivre-Laplaceovy vˇety, ˇze lze rozdˇelen´ı Zn aproximovat rozdˇelen´ım N (np, np(1 − p)). Vhodnost aproximace je t´ım lepˇs´ı, ˇc´ım je p bl´ıˇz´ı 0, 5. Zlepˇsuje se s rostouc´ım rozptylem a rovnˇeˇz se zav´ad´ı oprava na spojitost (viz v´ yˇse). Pˇ r´ıklad: (1) Pravdˇepodobnost, ˇze v´ yrobek nebyl provˇeˇren technickou kontrolou je 0, 2. Urˇcete pravdˇepodobnost, ˇze mezi 400 n´ ahodnˇe vybran´ ymi v´ yrobky bude 70 aˇz 100 neprovˇeˇren´ ych v´ yrobk˚ u. N´apovˇeda X m´a binomick´e rozdˇelen´ı Bi(400; 0, 2), kter´e aproximujeme norm´aln´ım rozdˇelen´ım N (80; 64).
Ot´ azka: Kam to d´ ale vede? Jak asi ˇcten´aˇr tuˇs´ı, stoj´ı tˇesnˇe pˇred otevˇren´ım dveˇr´ı do komnaty s n´adhernou a n´ aroˇcnou matematikou. M˚ uˇze z˚ ustat klidn´ y, dveˇre neotevˇreme, pouze kapitolu uzavˇreme pozn´amkami, z´ ajemce si cestu ke zdroj˚ um informac´ı jistˇe najde s´am. Formulace v´ yˇse uveden´e Moivre-Laplaceovy vˇety zn´ı zaj´ımavˇe, ale pozorn´ y ˇcten´aˇr si vˇsimne, ˇze jsme neˇrekli co to je asymptoticky” norm´ aln´ı rozdˇelen´ı. Uˇcinili jsme tak z´amˇernˇe. ” Zde naznaˇcen´ a oblast souvis´ı s pojmem konvergence, ale tentokr´at n´ahodn´ ych veliˇcin. Lze opˇet zav´est ˇradu konvergenc´ı: v distribuci a podle pravdˇepodobnosti [1]. Exaktni pˇr´ıstup pak umoˇznil formulovat ˇ radu zobecnˇ en´ı Moivre-Laplaceovy vˇety. Poznamenejme, ˇze existuj´ıc´ı obecnˇejˇs´ı verze se naz´ yvaj´ı centr´aln´ı limitn´ı vˇety a dokonce se nepoˇzaduje, aby seˇc´ıtan´e n´ahodn´e veliˇcinyXi mˇ ely stejn´e rozdˇelen´ı pravdˇepoodobnosti, a pˇresto za pomˇernˇe slab´ ych pˇredpoklad˚ u P n lze n´ahodnou veliˇcinu i=1 Xi aproximovat opˇ et vhodn´ ym norm´ aln´ım rozdˇ elen´ım. A to je pˇr´ıˇcina t´e ˇcast´e frekvence, se kterou se N rozdˇelen´ı objevuje v aplikac´ıch. M˚ uˇzeme parafr´azovat Galtona: Vˇse ” spˇeje k norm´ alu.” Koneckonc˚ u i ˇrada dˇr´ıve uveden´ ych rozdˇelen´ı pˇri urˇcit´em chov´an´ı parametr˚ u opˇet konverguje k norm´aln´ımu rozdˇelen´ı. Jako pˇr´ıklad uved’me, ˇze Studentovo rozdˇelen´ı S(k) konverguje k normovan´emu norm´aln´ımu rozdˇelen´ı N(0; 1) pokud k −→ ∞. Zaj´ımavosti. Abraham de Moivre (1667-1754) uprchl do Anglie ve 20 letech. De Moivre studoval pr´aci Huygense a od roku 1711 zveˇrejˇ noval sv´e v´ ysledky, nejzn´amˇejˇs´ı je kniha The Doctrine of Chances: or, a ” Method of Calculating the Probability of Events in Play”. De Moivre z´ıskal norm´ aln´ı aproximaci k binomick´ emu rozdˇ elen´ı a byl bl´ızko k nalezen´ı Poissonova rozdˇelen´ı. Pierre-Simon Laplace (1749-1827) psal o pravdˇepodobnosti mnoho let. Prvn´ı knihou byla v roce 1774 M´emoire sur la probabilit´e des causes par les ´evenemens”. Laplace byl velice aktivn´ı (viz v´ yˇse ” uveden´a Moivre-Laplaceova vˇeta). Jak jeho n´astupci inovovali a zpˇresˇ novali pojmy, jeho odkaz zaˇcal b´ yt zapom´ın´an.
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
26
ˇ Obr´azek 21: Pierre-S. Laplace (1749-1827), Abraham de Moivre (1667-1754), P. L. Cebyˇ sev (1821-94) ˇ P. L. Cebyˇ sev (1821-94) byl jedn´ım z nejd˚ uleˇzitˇejˇs´ıch matematik˚ u 19. stolet´ı. Poloˇzil z´aklady rusk´e ˇ tradice v pravdˇepodobnosti, na kterou pak navazovali, Markov, Lyapunov, Kolmogorov, Chinˇcin, Sirjajev ˇ ˇ a dalˇs´ı. V roce 1867 Cebyˇsev zveˇrejnil pr´ aci obsahuj´ıc´ı tzv. Cebyˇ sevovu nerovnost a vyuˇzil j´ı k d˚ ukazu tzv. Z´akona velk´ ych ˇc´ısel. Zobecnil rovnˇeˇz Moivre-Laplaceovu vˇetu d´ıky jin´emu pˇr´ıstupu v d˚ ukazu.
D. Cviˇ cen´ı Z´ akladn´ı okruhy ot´ azek. N´ apovˇeda: K prohlouben´ı znalost´ı lze vyuˇz´ıt i skripta [2] str. 85-95: a) Funkˇcn´ı a ˇc´ıseln´e charakteristiky pro vybran´a diskr´etn´ı rozdˇelen´ı pravdˇepodobnosti: A, Bi, H, P o. b) Typick´a slovn´ı zad´ an´ı pro uveden´ a diskr´etn´ı rozdˇelen´ı pravdˇepodobnosti. c) Funkˇcn´ı a ˇc´ıseln´e charakteristiky pro vybran´a spojit´a rozdˇelen´ı pravdˇepodobnosti: R, N , E. d) Typick´a slovn´ı zad´ an´ı pro uveden´ a spojit´a rozdˇelen´ı pravdˇepodobnosti. e) Hled´an´ı ve statistick´ ych tabulk´ ach a transformace v´ ysledk˚ u pro N rozdˇelen´ı. f) Aproximace rozdˇelen´ı pravdˇepodobnosti. Kontroln´ı ot´ azky. 1. 2. 3. 4. 5.
Uved’te 3 pˇr´ıklady na Bi rozdˇelen´ı a popiˇste v´ yznam jejich parametr˚ u i ˇc´ıseln´ ych charakteristik. Uved’te 3 pˇr´ıklady na H rozdˇelen´ı a popiˇste v´ yznam jejich parametr˚ u i ˇc´ıseln´ ych charakteristik. Uved’te 3 pˇr´ıklady na P o rozdˇelen´ı a popiˇste v´ yznam jejich parametr˚ u i ˇc´ıseln´ ych charakteristik. Uved’te 3 pˇr´ıklady na N rozdˇelen´ı a popiˇste v´ yznam jejich parametr˚ u i ˇc´ıseln´ ych charakteristik. Proˇc se pouˇz´ıvaj´ı aproximace rozdˇelen´ı pravdˇepodobnosti?
Typick´ a zad´ an´ı. Na z´ akladˇe slovn´ıho zad´an´ı urˇcete typ rozdˇelen´ı pravdˇepodobnosti a vypoˇc´ıtejte: a) hodnoty pravdˇepodobnostn´ı funkce (pˇr´ıpadnˇe hustoty rozdˇelen´ı pravdˇepodobnosti); b) hodnoty distribuˇcn´ı funkce a naˇcrtnˇete jej´ı graf; c) vypoˇctˇete vybran´e ˇc´ıseln´e charakteristiky (napˇr. stˇredn´ı hodnotu, modus, medi´an, rozptyl, atd.); d) vypoˇctˇete pravdˇepodobnost zadan´eho n´ahodn´eho jevu. Podˇ ekov´ an´ı. Autor kapitoly dˇekuje doc.Zdeˇ nku Karp´ıˇskovi za mnoho let cenn´ ych diskus´ı a za neziˇstn´e poskytnut´ı vlastn´ıch text˚ u i rozs´ ahl´eho osobn´ıho arch´ıvu. Bez jeho pomoci by tato kapitola byla rozhodnˇe f´adnˇejˇs´ı a kratˇs´ı. Autor dˇekuje nejmenovan´ ym norsk´ ym koleg˚ um, kteˇr´ı mu pomohli obej´ıt se bez rekonstrukce cel´eho textu a zachr´ anili vˇetˇsinu dat po hav´ arii operaˇcn´ıho syst´emu poˇc´ıtaˇce na zahraniˇcn´ı cestˇe a slibuje jim, ˇze si opravdu bude pr˚ ubˇeˇznˇe z´alohovat sv´e soubory na dalˇs´ı m´edia. Autor dˇekuje sv´ ym koleg˚ um, autor˚ um dalˇs´ıch kapitol t´eto studijn´ı opory vˇenovan´e Matematice 4. Bez jejich vˇcasn´eho a inspiruj´ıc´ıho zvl´ adnut´ı zejm´ena rozvrˇzen´ı a barevnosti jejich text˚ u by tato kapitola byla rozhodnˇ e m´ enˇ e strakat´ a”. ”
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM
Rozdˇelen´ı pravdˇepodobnosti pro aplikace
27
Reference ˇ [1] Sikulov´ a, M. - Zdenˇek Karp´ıˇsek, Z.: Matematika 4. Pravdˇepodobnost a matematick´a statistika, 6. vyd., VUT Brno, 1997. [2] Karp´ıˇsek, Z.: Matematika 4. Statistika a pravdˇepodobnost. CERM, Brno, 2003. [3] Karp´ıˇsek, Z. - Popela, P. - Bedn´ aˇr, J.: Statistika a pravdˇepodobnost. Uˇcebn´ı pom˚ ucka - studijn´ı opora pro kombinovan´e studium, FSI VUT, Brno 2002. [4] Karp´ıˇsek, Z. - Popela, P. - Bedn´ aˇr, J.: Statistika a pravdˇepodobnost - pˇrehled vzorc˚ u a poznatk˚ u, Brno 2006. [5] R´enyi, A.: Teorie pravdˇepodobnosti. ACADEMIA, Praha, 1972. [6] Likeˇs J. - Machek, J.: Poˇcet pravdˇepodobnosti. SNTL Praha, 1981. [7] Andˇel J.: Matematick´ a statistika, SNTL/Alfa Praha 1978. [8] Andˇel, J.: Matematika n´ ahody, matfyzpress, Praha 2003. ˇ ep´ [9] Zv´ara, K. - Stˇ an, J.: Pravdˇepodobnost a matematick´a statistika. MAT.FYZ.press, MFF-UK, Praha, 1997. [10] Swoboda, H.: Modern´ı statistika, Svoboda, Praha, 1977. [11] Rieˇcan B. - Lamoˇs F. - Len´ art C.: Pravdepodobnost’ a matematick´a ˇstatistika, Alfa/SNTL 1984. ˇ [12] Stˇep´an ANO ˇ [13] Janko, J.: Statistick´e tabulky. Praha, Nakladatelstv´ı CSAV 1958 [14] Likeˇs, J. – Laga, J.: Z´ akladn´ı statistick´e tabulky. Praha, SNTL/Alfa 1978. [15] Montgomery, D. C. et al.: Probability and Statistics in Engineering, 4th Edition, Wiley, 2002. ´ [16] Koutkov´ a, H. - Moll,I.: Uvod do pravdˇepodobnosti a matematick´e statistiky. FAST VUT Brno, 2001. ˇ ˇ 1993. [17] Cerm´ ak, V.: Diskr´etn´ı a spojit´ a rozdˇelen´ı - vzorce, grafy, tabulky. Skripta. Praha, VSE ˇ ’ [18] Rogalewicz, V.: Pravdˇepodobnost a statistika pro inl en´ yry, skripta, Vydavatelstv´ı CVUT, 1998. [19] Briˇs R. - Litschmannov´ a M.: Statistika I. pro kombinovan´e a distanˇcn´ı studium, Ostrava 2004. [20] http://www.wikipedia.org [21] http://www-history.mcs.st-andrews.ac.uk/Biographies ˇ ete! Vˇse jiˇz bylo naps´ Anonym (It´ alie, 16.stolet´ı): Ctˇ ano Vaˇsimi pˇredch˚ udci.” ”
RNDr. Pavel Popela, Ph.D.
´ FSI v Brnˇe, 5. 11. 2006 UM