4 ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY 4.1 Rovnoměrné rozdělení R(n) - má náhodná veličina X, která může nabýt n různých hodnot, z nichž každá je stejně pravděpodobná Definice 4.1.1: Náhodná veličina X má rovnoměrné rozdělení R(n) právě tehdy, když její 1 pravděpodobnostní funkce je určena vztahem: p(x) = , kde n je počet možných výsledků. n
H ( X ) x1 , x2 ,..., xn 1 p : pk P( X xk ) ; k 1,..., n n 0, x x1 1 , x1 x x2 n F ( x ) F: 2 , x x x 3 n 2 1, xn x
… rovnoměrné rozdělení R(n) s parametrem n
Příklad 4.1.1: Náhodná veličina X udává počet bodů, které padnou při hodu jednou kostkou. Určete její pravděpodobnostní funkci p, distribuční funkci F, střední hodnotu E(X) a rozptyl D(X). Řešení: X … počet bodů, které padnou při hodu jednou kostkou, X R(6) H ( X ) 1,2,3,4,5,6 1 p : pk P( X xk ) ; k 1,...,6 6 0, x 1 1 , 1 x 2 62 , 2 x3 6 3 F: F ( x) , 3 x 4 6 4 , 4 x 5 6 5 6 , 5 x 6 1, 6 x
1
6
E ( X ) xi pi i 1
1 2 ... 6 21 3,5 6 6 2
6 6 12 2 2 ... 6 2 D( X ) E ( X 2 ) [ E ( X )]2 xi2 pi xi pi 3,52 2,916 6 i 1 i1
4.2 Alternativní rozdělení A(p) - má náhodná veličina X, která může nabýt pouze dvou hodnot: 0 a 1 - odpovídá náhodnému pokusu (NP), u kterého rozlišujeme pouze dva výsledky (např. u hodu mincí můžou nastat pouze dvě situace – padne rub, nebo padne líc). Takovýto pokus nazýváme alternativní náhodný pokus (ANP). Pokud jeden ze dvou možných výsledků (alternativ) označíme jako „zdar“ a druhý jako „nezdar“, můžeme alternativní NV X definovat jako počet zdarů při jedné realizaci alternativního náhodného pokusu. Označme: A … zdar; P( A) p , A … nezdar; P( A ) 1 p , X … počet zdarů při 1 realizaci ANP, X A( p)
… alternativní NV
Definice 4.2.1: Náhodná veličina X s pravděpodobnostní funkcí P( X 0) 1 p , P( X 1) p , p 0,1 , má alternativní rozdělení pravděpodobnosti A(p) s parametrem p.
H ( X ) 0,1 p : p1 P( X 0) 1 p p2 P( X 1) p
… alternativní rozdělení A(p) s parametrem p
0, x 0 F: F ( x) 1 p, 0 x 1 1, 1 x 2
E ( X ) xi pi 0.(1 p) 1. p p i 1
2
2 D( X ) E ( X ) [ E ( X )] x pi xi pi 0 2.(1 p) 12. p p 2 p p 2 p(1 p) i 1 i1 2
2
2
2 i
Příklad 4.2.1: Pravděpodobnost zásahu cíle je 0,7. Určete rozdělení, distribuční funkci, střední hodnotu a rozptyl náhodné veličiny X, udávající počet zásahů cíle při jednom výstřelu. Řešení: X … počet zásahů cíle při jednom výstřelu, X A(0,7) H ( X ) 0,1 p : p1 P( X 0) 0,3
p2 P( X 1) 0,7
2
0, x 0 F: F ( x) 0,3; 0 x 1 1, 1 x E ( X ) p 0,7 D( X ) p(1 p) 0,7.0,3 0,21
4.3 Binomické rozdělení Bi(n,p) - má náhodná veličina X, která udává počet zdarů při n nezávislých realizacích ANP Binomické rozdělení tedy dostáváme tehdy, když alternativní náhodný pokus opakujeme nkrát po sobě, aniž bychom měnili systém podmínek, za kterých je pokus realizován. Dále se předpokládá, že jednotlivé pokusy jsou na sobě nezávislé, to znamená, že výsledek žádného z těchto pokusů nezávisí na tom, jaké výsledky nastaly u pokusů ostatních. Takováto série pokusů bývá označována jako Bernoulliho posloupnost. Je to tedy série pokusů, z nichž u každého rozlišujeme pouze dva výsledky (zdar a nezdar), přičemž pravděpodobnost zdaru p je u všech pokusů konstantní. Označme: A … zdar; P( A) p ,
A … nezdar; P( A ) 1 p , X … počet zdarů při n nezávislých realizacích ANP, X Bi (n, p)
… binomická NV
Definice 4.3.1: Náhodná veličina X má binomické rozdělení Bi(n, p) s parametry n a p právě tehdy, když její pravděpodobnostní funkce je určena vztahem: n nk P( X k ) p k 1 p , k = 0, 1,..., n, k kde n je počet pokusů a p je pravděpodobnost zdaru v každém pokusu.
H ( X ) 0,1,..., n n nk p : pk P( X k ) p k 1 p k E ( X ) n. p D( X ) n. p.(1 p)
… binomické rozdělení Bi(n,p) s parametry n a p
Poznámka: 1) Alternativní rozdělení je speciálním případem binomického rozdělení pro n = 1. 2) Binomickým rozdělením lze popsat například: • počet chlapců mezi 1000 novorozenci, • počet vadných výrobků mezi 100 testovanými, • počet šestek při 50 hodech kostkou 3) Vliv parametrů n a 𝑝 na tvar pravděpodobnostní funkce binomické náhodné veličiny je znázorněn na Obr. 4.3.1:
3
Obr. 4.3.1:
Příklad 4.3.1: Pravděpodobnost zásahu cíle je 0,7. Určete rozdělení, distribuční funkci, střední hodnotu a rozptyl náhodné veličiny X, udávající počet zásahů cíle při třech nezávislých výstřelech. Řešení: X … počet zásahů cíle při třech nezávislých výstřelech, X Bi (3;0,7) n 3; p 0,7; H ( X ) 0,1,2,3 p: 3 p0 P( X 0) 0,7 0 0,33 0,027 0 3 p1 P( X 1) 0,710,32 0,189 1 3 p2 P( X 2) 0,7 2 0,31 0,441 2 3 p3 P( X 3) 0,7 30,30 0,343 3 F: x0 0; 0,027 ; 0 x 1 F ( x) 0,216 ; 1 x 2 0,657 ; 2 x 3 1; 3 x E( X ) n. p 3.0,7 2,1 D( X ) n. p.(1 p) 3.0,7.0,3 0,63 Příklad 4.3.2: Na základě statistických údajů byla stanovena pravděpodobnost narození dívky 0,485. Jaká je pravděpodobnost, že v rodině s 8 dětmi jsou: a) právě 3 dívky, b) více než 2 dívky, c) méně než 3 dívky.
4
Řešení: X … počet dívek v rodině s osmi dětmi, X Bi (8;0,485) n 8; p 0,485; H ( X ) 0,1,2,3,4,5,6,7,8 8 a) P( X 3) 0,48530,5155 0,231 3 b) P( X 2) 1 P( X 2) 1 {P( X 0) P( X 1) P( X 2)}
8 8 8 1 0,4850 0,5158 0,48510,5157 0,4852 0,5156 0,835 1 2 0 c) P( X 3) {P( X 0) P( X 1) P( X 2)} 1 P( X 2) 1 0,835 0,165 Příklad 4.3.3: Pravděpodobnost, že student zaspí a přijde pozdě na přednášku, je 30%. V semestru je 12 přednášek - tzn. 12 nezávislých pokusů dorazit na přednášku včas. Vypočtěte pravděpodobnost toho, že student nestihne přednášku v důsledku zaspání v polovině nebo více případech. Řešení: X … počet zaspání ve 12 případech, X Bi (12;0,3) n 12; p 0,3; H ( X ) 0,1,2,3,4,5,6,7,8,9,10,11,12 Hledaná pravděpodobnost má hodnotu: P( X 6) P( X 6) P( X 7) P( X 8) P( X 9) P( X 10) P( X 11) P( X 12) 12 12 0,3k 0,712k 0,118 k 6 k
Poznámka: 1) Ruční výpočet je v tomto případě poměrně zdlouhavý, proto si práci můžeme usnadnit použitím některého statistického programu nebo Excelu. V Excelu je implementována funkce BINOM.DIST, která umožňuje vypočítat hodnoty distribuční i pravděpodobnostní funkce binomického rozdělení. Tato funkce má 4 parametry a používá se následovně: - chceme-li vypočíst hodnotu pravděpodobnostní funkce binomického rozdělení Bi(n, p) v bodě x, voláme funkci BINOM.DIST ve tvaru BINOM.DIST( x; n; p; 0) - počítáme-li u téhož rozdělení hodnotu distribuční funkce v bodě x, volíme u posledního parametru hodnotu 1. Navíc musíme brát v potaz menší nedostatek Excelu a sice ten, že užívá pro definici distribuční funkce vztah 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥), na rozdíl od obecně užívaného vztahu 𝐹(𝑥) = 𝑃(𝑋 < 𝑥), se kterým pracujeme i my. Pro náhodnou veličinu X s rozdělením Bi(n, p) tedy vypočteme 𝑃(𝑋 ≤ 𝑥) jako BINOM.DIST( x; n; p; 1). Příklad 4.3.2 pak v Excelu vypočítáme velice jednoduše takto: a) P( X 3) BINOM.DIST(3;8;0,485;0) 0,231 b) P( X 2) 1 P( X 2) 1 BINOM.DIST(2;8;0,485;1) 0,835 c) P( X 3) P( X 2) BINOM.DIST(2;8;0,485;1) 0,165 a příklad 4.3.3 takto: P( X 6) 1 P( X 6) 1 P( X 5) BINOM.DIST(5;12;0,3;1) 0,118 2) Rozdělení pravděpodobnosti pro Příklad 4.3.3 je znázorněno graficky na Obr. 4.3.2:
5
Obr. 4.3.2: 0,3
pravděpodobnost
0,25 0,2 0,15 0,1 0,05 0 0
1
2
3
4
5
6
7
8
9
10
11
12
počet zaspání
4.4 Hypergeometrické rozdělení H(N,M,n) - má náhodná veličina X, která udává počet prvků sledované vlastnosti mezi n vybranými - odpovídá tzv. výběru bez vracení (naopak binomické rozdělení odpovídá výběru “s vracením”) Hypergeometrické rozdělení tedy dostáváme tehdy, když náhodný pokus opakujeme n-krát, přičemž jednotlivé pokusy jsou vzájemně závislé (výsledek v libovolném pokusu závisí na výsledcích v předcházejících pokusech). Předpokládejme, že v základním souboru N prvků je M prvků s danou vlastností. Náhodně vybereme n prvků, z nichž žádný nevracíme zpět. Mějme tedy následující označení:
N M n X
… počet prvků základního souboru (ZS), … počet prvků ZS majících sledovanou vlastnost, … počet prvků, které vybíráme ze ZS, … počet prvků sledované vlastnosti mezi n vybranými, X H ( N , M , n) … hypergeometrická NV
Definice 4.4.1: Náhodná veličina X má hypergeometrické rozdělení H(N, M, n) s parametry N, M a n právě tehdy, když její pravděpodobnostní funkce je určena vztahem:
M N M k n k P( X k ) . N n
H ( X ) max( 0, M N n),..., min( M , n)
6
M N M k n k p : pk P ( X k ) N n … hypergeometrické rozdělení H(N,M,n) s parametry N, M a n M E( X ) n N M M N n D( X ) n 1 N N N 1 Poznámka: 1) Pravděpodobnostní funkci hypergeometrického rozdělení lze snadno odvodit z klasické definice pravděpodobnosti, jako počet všech příznivých situací ku počtu všech možných situací. 2) Hypergeometrické rozdělení hraje významnou roli při statistické kontrole jakosti v případech, kdy zkoumáme jakost malého počtu výrobků, nebo když má kontrola ráz destrukční zkoušky (tj. výrobek je při zkoušce zničen). 3) Hypergeometrickým rozdělením lze popsat například: • počet vadných výrobků mezi 8 vybranými z dodávky 20 výrobků, mezi nimiž bylo 7 vadných, • počet dívek v náhodně vybrané skupině 4 dětí ze třídy, v níž je 13 chlapců a 15 dívek, • počet cibulí bílých tulipánu v balíčku 10 cibulí vybraných ze směsi, která obsahuje 50 cibulí žlutých a 20 cibulí bílých tulipánů 4) Hodnoty distribuční i pravděpodobnostní funkce hypergeometrického rozdělení lze vypočíst rovněž v Excelu - užitím funkce HYPGEOM.DIST. Pro náhodnou veličinu X s rozdělením H(N, M, n) pak platí: P( X x) HYPGEOM.DIST ( x; n; M ; N ;0) , P( X x) HYPGEOM.DIST ( x; n; M ; N ;1) Příklad 4.4.1: Mezi stovkou výrobků je 20 zmetků. Vybereme deset výrobků. Jaká je pravděpodobnost, že mezi nimi budou právě 3 zmetky? Řešení: X … počet zmetků mezi 10 vybranými, X H (100,20,10) N 100 ; M 20 ; n 10 ; H ( X ) 0,1,2,3,4,5,6,7,8,9,10 20 80 3 7 P( X 3) 0,209 HYPGEOM .DIST (3;10 ;20 ;100 ;0) 100 10 Poznámka: Rozdělení pravděpodobnosti pro Příklad 4.4.1 je znázorněno graficky na Obr. 4.4.1:
7
Obr. 4.4.1: 0,35
pravděpodobnost
0,3 0,25 0,2 0,15 0,1 0,05 0 0
1
2
3
4
5
6
7
8
9
10
počet zmetků
Příklad 4.4.2: Mezi 200 vajíčky určenými pro prodej v jisté maloobchodní prodejně je 5 vajíček prasklých. Jaká je pravděpodobnost, že vybereme-li náhodně 20 vajec, a) jedno z vajíček bude prasklé, b) aspoň tři vajíčka budou prasklá, c) žádné vajíčko nebude prasklé? Řešení: X … počet prasklých vajíček mezi 20 vybranými, X H (200,5,20) N 200 ; M 5 ; n 20 ; H ( X ) 0,1,2,3,4,5 5 195 1 19 a) P( X 1) 0,334 HYPGEOM .DIST (1;20 ;5 ;200 ;0) 200 20
5 195 5 195 5 195 3 17 4 16 5 15 b) P( X 3) P( X 3) P( X 4) P( X 5) 200 200 200 20 20 20
0,008 1 P( X 3) 1 P( X 2) 1 HYPGEOM.DIST (2;20 ;5 ;200 ;1) 5 195 0 20 c) P( X 0) 0,587 HYPGEOM .DIST (0;20 ;5 ;200 ;0) 200 20
4.5 Poissonovo rozdělení Po(λ) - má náhodná veličina X, která udává počet Poissonovských náhodných jevů, které se vyskytnou v daném úseku
8
Poissonovo rozdělení, pojmenované podle francouzského matematika S. D. Poissona, mají náhodné veličiny, které popisují četnosti Poissonovských náhodných jevů, což jsou jevy splňující tyto vlastnosti: - známe průměrný počet výskytů jevu v daném úseku (časovém nebo prostorovém), - to, jestli jev v daném úseku nastane, nezávisí na tom, zda nastal nebo nenastal v úseku jiném, - pravděpodobnost výskytu jevu v úseku délky l je přímo úměrná velikosti tohoto úseku a je ve všech úsecích stejné velikosti stejná, - pravděpodobnost, že by dva jevy nastaly současně přesně v jednom okamžiku nebo místě, je zanedbatelná. Označme: … průměrný počet výskytů zkoumaného jevu v daném úseku, X … počet jevů, které v daném úseku nastanou, X Po( )
… Poissonovská NV
Definice 4.5.1: Náhodná veličina X má Poissonovo rozdělení Po( ) právě tehdy, když udává počet Poissonovských náhodných jevů, které nastanou v určitém úseku. Její pravděpodobnostní funkce má tvar: P( X k )
k
e , k 1,2,3,... ,
k! kde značí průměrný počet výskytů zkoumaného jevu v daném úseku.
H ( X ) 0,1,2,... p : pk P ( X k )
E (X ) D(X )
k k!
e
… Poissonovo rozdělení Po(λ) s parametrem λ
Poznámka: 1) Hodnoty Poissonova rozdělení jsou uvedeny ve statistických tabulkách. 2) Poissonova rozdělení užíváme pro nahrazení binomického rozdělení s velkým n a malým p. Pro 𝑛 → ∞ a 𝑝 → 0 tedy platí: n k k n k p 1 p ~ e , kde n. p k! k 3) Poissonovým rozdělením lze popsat například: • počet pacientů ošetřených během dopoledních ordinačních hodin, • počet mikroorganismů v 1 litru vody, • počet kazů v daném vzorku látky 4) Hodnoty distribuční i pravděpodobnostní funkce Poissonova rozdělení vypočteme v Excelu užitím funkce POISSON.DIST. Pro náhodnou veličinu X s rozdělením Po( ) platí: P( X x) POISSON.DIST ( x; ; 0) , P( X x) POISSON.DIST ( x; ;1) 5) Vliv parametru na tvar pravděpodobnostní funkce Poissonovské náhodné veličiny je znázorněn na Obr. 4.5.1:
9
Obr. 4.5.1:
Příklad 4.5.1: Dlouhodobým pozorováním bylo zjištěno, že na dané výrobní lince dojde v průměru k 35 poruchám týdně. Zjistěte, jaká je pravděpodobnost, že počet poruch na této lince za jeden den bude větší než 4. Řešení: X … počet poruch za jeden den, X Po( ) … průměrný počet poruch za jeden den, 35 / 7 5 Úlohu nejlépe vyřešíme pomocí opačného jevu: P( X 4) 1 P( X 4) 1 {P( X 0) P( X 1) P( X 2) P( X 3) P( X 4)}
50 51 52 53 54 1 e 5 e 5 e 5 e 5 e 5 0,560 1! 2! 3! 4! 0!
1 POISSON.DIST (4;5;1)
Poznámka: Rozdělení pravděpodobnosti pro Příklad 4.5.1 je znázorněno graficky na Obr. 4.5.2: Obr. 4.5.2: 0,2 0,18 pravděpodobnost
0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15
počet poruch za 1 den
10
Příklad 4.5.2: Pracovník obsluhuje 800 vřeten, na které se navíjí příze. Pravděpodobnost přetržení příze v case t je na každém vřeteni 0,005, přičemž přetržení přízí na jednotlivých vřetenech jsou navzájem nezávislé jevy. Jaká je pravděpodobnost, že se za čas t příze roztrhne právě na čtyřech vřetenech? Řešení: X … počet přízí, které se přetrhnou v čase t, X Bi (800;0,005) n 800; p 0,005; H ( X ) 0,1,2,...,800 800 0,0054 0,995796 0,1959 BINOM.DIST(4;800 ;0,005 ;0) P( X 4) 4 Pro velká n a malá p můžeme binomické rozdělení nahradit rozdělením Poissonovým (viz Poznámka 2, str.9), kde n. p . Můžeme tedy uvažovat náhodnou veličinu: X … počet přízí, které se přetrhnou v čase t, X Po( ) , … průměrný počet přízí, které se přetrhnou v čase t, n. p 800.0,005 4 , a hledanou pravděpodobnost vypočítat jako 4 4 4 P( X 4) e 0,1954 POISSON.DIST (4 ;4; 0) . 4! Vidíme, že výsledky se liší až ve 4. desetinném místě.
11
Příklady k procvičení: 1. Závodní střelec zasáhne cíl při každém výstřelu s pravděpodobností 0,8. Určete pravděpodobnost toho, že při pěti výstřelech budou v cíli a) právě 3 zásahy, b) aspoň 2 zásahy. 2. Mnohaletým pozorováním stavu vody v horské řece byla určena pravděpodobnost jarní povodně 4/15. Určete střední hodnotu a rozptyl počtu jarních povodní v nejbližších 100 letech. 3. V urně je 8 koulí, z toho 5 bílých a 3 černé. Najednou vytáhneme 4 koule. Jaká je pravděpodobnost, že a) 3 z vytažených koulí budou bílé, b) nejvýš 2 vytažené koule budou bílé? 4. Z radioaktivního materiálu vyzařuje průměrně 30 alfa částic za minutu. Určete pravděpodobnost, že během 1 sekundy vyzáří a) právě 1 alfa částice, b) žádná alfa částice, c) více než 2 alfa částice, d) maximálně 2 alfa částice. 5. Telefonní ústředna obsluhuje 3000 účastníků. Pravděpodobnost, že libovolný účastník bude v průběhu 1 hodiny volat, je 0,002. Určete pravděpodobnost toho, že v průběhu 1 hodiny budou volat 4 účastníci. 6. Pravděpodobnost, že výrobek splňuje všechny technické parametry, je 0,9. Určete pravděpodobnost toho, že mezi 5 náhodně vybranými výrobky budou a) 3 vyhovující, b) aspoň 3 vyhovující. 7. V dodávce 80 polotovarů je 8 vadných. Náhodně vybereme 5 polotovarů, jaká je pravděpodobnost, že mezi nimi bude maximálně 1 vadný? 8. Za jasné letní noci můžeme v průměru každých 10 minut vidět padat hvězdu. Jaká je pravděpodobnost, že během 15 minut uvidíme 2 padající hvězdy?
12