5 ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI SPOJITÉ NÁHODNÉ VELIČINY 5.1 Rovnoměrné rozdělení R(a,b) - má náhodná veličina X, která má stejnou možnost nabýt kterékoliv hodnoty z intervalu < 𝑎, 𝑏 >; 𝑎, 𝑏 ∈ R Definice 5.1.1: Náhodná veličina X má rovnoměrné rozdělení R(a,b) právě tehdy, když její 1 pro x a, b hustota pravděpodobnosti je určena vztahem: f x b a . 0 pro x a, b
H ( X ) a, b 1 pro x a, b f x b a 0 pro x a, b
pro x , a 0 xa F x pro x a, b b a 1 pro x b,
ab 2 b a 2 D( X ) 12
E( X )
Poznámka: 1) Rovnoměrné rozdělení je tedy rozdělení, jehož hustota pravděpodobnosti je konstantní na nějakém intervalu a, b a všude jinde je nulová. 2) Rovnoměrným rozdělením lze popsat například: • dobu čekání na autobus, který přijíždí v pravidelných intervalech.
1
Příklad 5.1.1: Tramvajová linka číslo 8 odjíždí ze zastávky každých 10 minut. Cestující může přijít na zastávku v libovolném okamžiku. Určete střední hodnotu a rozptyl doby čekání na tramvaj a pravděpodobnost, že cestující bude čekat déle než 7 minut. Řešení: X … doba čekání na tramvaj, X R(0,10) H (X ) 0,10 a b 0 10 E( X ) 5 2 2 2 2 b a 10 0 D( X ) 8,3 12 12 0, x 0 x F ( x) , 0 x 10 10 1, 10 x P( X 7) P(7 X ) F () F (7) 1
7 3 0,3 10 10
5.2 Exponenciální rozdělení E() - má náhodná veličina X, která udává délku čekání na Poissonovský náhodný jev, případně délku intervalu mezi dvěma Poissonovskými náhodnými jevy Definice 5.2.1: Náhodná veličina X má exponenciální rozdělení E() právě tehdy, když její x0 0, hustota pravděpodobnosti je určena vztahem: f ( x) x . .e , x 0
H ( X ) 0,)
0, f ( x ) x .e ,
0, F ( x) x 1 e ,
x0 x0
x0 x0
2
E( X ) D( X )
1
1
2
Poznámka: 1) Exponenciální rozdělení úzce souvisí s rozdělením Poissonovým. Jestliže například počet dopravních nehod na Martinovské křižovatce v určitém časovém intervalu popisuje rozdělení Poissonovo, pak dobu od jedné nehody do druhé lze popsat rozdělením exponenciálním. 2) Obě tato rozdělení hrají důležitou roli v teorii spolehlivosti. Časté aplikace jsou též v teorii hromadné obsluhy (teorii front), kde se pomocí exponenciálního rozdělení modeluje doba čekání ve frontě. Exponenciální rozdělení rovněž dobře popisuje rozdělení doby života u systémů, u kterých dochází k poruše ze zcela náhodných příčin (nikoliv v důsledku opotřebení, jako jsou např. mechanické opotřebení, únava materiálu apod.), tj. u systémů nacházejících se v období stabilního života. 3) Všimněte si, že parametr u exponenciálního rozdělení není roven střední hodnotě tohoto rozdělení, jak je tomu u rozdělení Poissonova, ale její převrácené hodnotě ( 1 / E ( X ) ). 4) Exponenciálním rozdělením lze popsat například: • dobu čekání na obsluhu v restauraci, • vzdálenost mezi dvěma poškozenými místy na silnici, • dobu mezi dvěma poruchami elektronického systému. 5) Hodnoty distribuční funkce exponenciálního rozdělení vypočteme v Excelu užitím funkce EXPON.DIST. Pro náhodnou veličinu X s rozdělením E ( ) platí: F ( x) P( X x) P( X x) EXPON.DIST( x; ;1) Příklad 5.2.1: Mějme náhodnou veličinu X s exponenciálním rozdělením pravděpodobnosti E(3). Určete pravděpodobnost toho, že nabude hodnoty z intervalu a) (1,2) , b) (8,) , c) 3,1 . Řešení: X E (3) x0 0, F ( x) 3x 1 e , x 0 a) P( X (1,2)) P(1 X 2) F (2) F (1) 1 e 3.2 1 e 3.1 e 3 e 6 0,047 EXPON.DIST(2;3;1) EXPON.DIST(1;3;1) , b) P( X (8,)) P(8 X ) F () F (8) 1 1 e 3.8 e 24 3,8.1011 1 P( X 8) 1 EXPON.DIST(8;3;1) , c) P( X 3,1 ) P(3 X 1) F (1) F (3) 1 e 3.1 0 1 e 3 0,950 F (1) 0 EXPON.DIST(1;3;1) . Příklad 5.2.2: Doba čekání na výrobek u výrobní linky trvá průměrně 8 minut. Určete: a) pravděpodobnost, že budeme čekat na výrobek déle než 12 minut, b) dobu čekání, během které bude výrobek vyroben s pravděpodobností 0,9.
3
Řešení: X … doba čekání na výrobek, X E ( ) 1 1 E( X ) 8 8 x0 0, x F ( x) 8 1 e , x 0 12 a) P( X 12) P(12 X ) F () F (12) 1 1 e 8 0,223 1 P( X 12) 1 F (12) 1 EXPON.DIST(12;1 / 8;1) b) tentokrát hledáme x takové, že P X x 0,9 , tedy F ( x) 0,9
1 e e
x 8
x 8
0,9
0,1
x ln 0,1 x 8 ln 0,1 x 18,5 minuty 8
5.3 Normální rozdělení N(,2) - má náhodná veličina X popisující jev, který je výsledkem působení velkého počtu nepatrných, na sobě nezávislých vlivů Definice 5.3.1: Náhodná veličina X má normální rozdělení N(,2) právě tehdy, když její 1 x
1 hustota pravděpodobnosti je určena vztahem: f x .e 2 . 2
2
pro x , .
Normální rozdělení má dva parametry: střední hodnotu μ, která určuje střed, kolem kterého se pohybují hodnoty náhodné veličiny, a rozptyl 2, charakterizující rozptýlení hodnot náhodné veličiny kolem její střední hodnoty.
H ( X ) (,) 1 x -
1 f ( x) e 2 . 2
2
, xR
Grafem hustoty pravděpodobnosti normálního rozdělení N(,2) je tzv. Gaussova křivka, která má typický zvonovitý tvar (angl. „bell curve“). Je to symetrická křivka (koeficient šikmosti je u normálního rozdělení roven nule), dosahující maxima v bodě 𝑥 = 𝜇. Parametr 𝜎 udává „horizontální“ vzdálenost inflexních bodů od 𝜇 a tím i šířku Gaussovy křivky.
4
1 t -
x
2
1 F ( x) e 2 dt , x R . 2
Distribuční funkce normálního rozdělení má typický “S-tvar” (“S shape curve”) a má inflexi v bodě 𝑥 = 𝜇.
E (X )
D( X ) 2 Normální rozdělení je jedním z nejdůležitějších pravděpodobnostních rozdělení. Je to nejčastěji používané rozdělení, které nachází uplatnění v nejrůznějších oblastech lidské činnosti, jako jsou přírodní vědy, medicína, ekonomie i technika. Z hlediska aplikací bývá vhodné k popisu náhodných veličin, které lze interpretovat jako výsledek mnoha nepatrných, vzájemně nezávislých vlivů, kam patří např. chyba měření nebo odchylka rozměru výrobku od požadované hodnoty, proto bývá toto rozdělení také označováno jako zákon chyb. Značný význam normálního rozdělení spočívá rovněž v tom, že za určitých podmínek lze pomocí něj aproximovat řadu jiných spojitých i nespojitých rozdělení. Normované normální rozdělení N(0,1) Vztahy pro hustotu pravděpodobnosti a distribuční funkci obecného normálního rozdělení N(,2) jsou poměrně složité a výpočet funkčních hodnot pomocí těchto vztahů velmi pracný. Proto bylo zavedeno normované normální rozdělení N(0,1), což je speciální případ obecného normálního rozložení pro 0 a 2 1 . U tohoto rozdělení najdeme vybrané hodnoty distribuční funkce v tabulkách. Hustota pravděpodobnosti normovaného normálního rozdělení se značí a je určena vztahem:
x
1 x2 1 .e 2 pro x , 2
Distribuční funkce normovaného normálního rozdělení se značí a je určena vztahem:
x
1 t2 1 x e 2 dt pro x , 2
5
Vztah mezi normovaným normálním rozdělením N(0,1) a obecným normálním rozdělením N() vyjadřuje následující věta: Věta 5.3.1: Nechť náhodná veličina X má normální rozdělení s parametry μ a 2 X N (; 2 ). Pak náhodná veličina Z X má normované normální rozdělení Z N (0;1) . Poznámka: 1) V tabulkách nalezneme pouze hodnoty distribuční funkce pro x 0 . Hodnoty pro x < 0 není nutno uvádět, neboť ze symetrie Gaussovy křivky plyne: ( x) 1 ( x) . 2) Hodnoty distribuční funkce normálního rozdělení lze vypočíst také v Excelu užitím funkce NORM.DIST. Pro náhodnou veličinu X s rozdělením N(,2) platí: F ( x) P( X x) P( X x) NORM.DIST( x; ; ;1) . 3) U normálního rozdělení umožňuje Excel vypočítat i hodnotu funkce inverzní k funkci distribuční, a to pomocí funkce NORM.INV. Tuto funkci používáme k výpočtu kvantilů normálního rozdělení (viz poznámka pod Definicí 3.4.4). Pro náhodnou veličinu X s rozdělením N(,2) vypočteme p-kvantil pomocí funkce NORM.INV takto: x p NORM.INV( p ; ; ) . Příklad 5.3.1: Inteligenční kvocient má v populaci normální rozdělení se střední hodnotou 100 a rozptylem 225. Vypočtěte, jaká je pravděpodobnost, že IQ náhodně vybraného jedince bude a) menší než 90, b) větší než 130, c) v mezích od 105 do 125. Řešení: Označme X … IQ náhodně vybraného jedince, X N (100 ; 225) Máme-li k dispozici program Excel, můžeme příklad vyřešit pomocí funkce NORM.DIST. V našem případě je 2 225 15 a výpočet vypadá následovně: a) P( X 90) P( X 90) F (90) F () F (90) 0 F (90) NORM.DIST(90 ;100 ;15 ;1) 0,252 b) P( X 130) P(130 X ) F () F (130) 1 F (130) 1 NORM.DIST(130 ;100 ;15 ;1) 0,023 c) P(105 X 125) F (125) F (105) NORM.DIST(125 ;100 ;15 ;1) NORM.DIST(105 ;100 ;15 ;1) 0,322 Bez použití počítače bychom příklad řešili pomocí normované náhodné veličiny, jejíž distribuční funkce má hodnoty uvedeny v tabulkách. Jelikož při řešení tímto postupem musíme při výpočtu mezí zaokrouhlovat na dvě desetinná místa, může se takto získaný výsledek od toho předchozího, přesnějšího, mírně lišit: 10 100 X 100 90 100 a) P( X 90) P( X 90) P P Z 15 15 15 15 (0,67) () 1 (0,67) 0 0,251 130 100 X 100 100 b) P( X 130) P(130 X ) P P2 Z 15 15 15 6
() (2) 1 (2) 0,023 25 105 100 X 100 125 100 5 c) P(105 X 125) P P Z 15 15 15 15 15 (1,67) (0,33) 0,323 Příklad 5.3.2: Nechť náhodná veličina 𝑋 modelující odchylku šířky výrobku od požadované hodnoty má normální rozdělení se střední hodnotou 10 mm a směrodatnou odchylkou 5 mm. Určete: a) pravděpodobnost, že odchylka bude nejvýš 7 mm, b) 𝑥0,75. Řešení: Tento příklad vyřešíme rovněž dvěma způsoby – pomocí Excelu a pomocí tabulek. a) P( X 7) NORM.DIST(7 ;10 ;5 ;1) 0,274
3 10 X 10 7 10 P( X 7) P( X 7) P P Z 5 5 5 5 (0,6) () 1 (0,6) 0 0,274 Pravděpodobnost toho, že odchylka šířky výrobku od požadované hodnoty bude maximálně 7 mm, je tedy 27,4%. b) Potřebujeme určit hodnotu horního kvartilu 𝑥0,75, což je hodnota, pro kterou platí F(x0,75) = 0,75 (viz Definice 3.4.4), tudíž x0,75 = F-1(0,75) a užitím excelovské funkce NORM.INV dostáváme: x0,75 NORM.INV(0,75 ;10 ;5 ) 13,37 10 X 10 x0,75 10 0,75 F x0,75 P( X x0,75 ) P( X x0,75 ) P 5 5 5 x 10 x 10 x 10 x 10 0,75 0,75 0 0,75 P Z 0,75 5 5 5 5 x 10 0,75 0,67 x0,75 0,67 5 10 13,35 5 S pravděpodobností 75% tedy odchylka šířky výrobku od požadované hodnoty nepřekročí 13,37 mm. Příklad 5.3.3: Město nechalo nainstalovat 2000 lamp veřejného osvětlení. Životnost (doba svícení) těchto lamp má normální rozdělení se střední hodnotou 1000 hodin a standardní odchylkou 200 hodin. Určete: a) jaká je pravděpodobnost, že životnost libovolné lampy bude menší než 700 hodin, b) jaká je pravděpodobnost, že životnost libovolné lampy bude přesně 700 hodin, c) jaká je pravděpodobnost, že životnost libovolné lampy bude mezi 700 a 750 hodinami, d) u kolika lamp se dá očekávat, že jejich životnost bude mezi 700 a 750 hodinami, e) po kolika hodinách se dá očekávat, že zůstane svítit jen 10% lamp. Řešení: Řešení tohoto příkladu ukážeme pouze pomocí excelovských funkcí. Označme X … životnost lampy, X N (1000 ; 2002 ) a) P( X 700) NORM.DIST(700 ;1000 ;200 ;1) 0,067
7
Pravděpodobnost, že životnost libovolné lampy bude menší než 700 hodin, je 6,7%. b) P( X 700) 0 (viz poznámka pod Obrázkem 3.3.1 v Kapitole 3) Pravděpodobnost, že životnost libovolné lampy bude přesně 700 hodin, je 0%. c) P(700 X 750) F (750) F (700) NORM.DIST(750 ;1000 ;200 ;1) NORM.DIST(700 ;1000 ;200 ;1) 0,039 Pravděpodobnost, že životnost libovolné lampy bude mezi 700 a 750 hodinami, je 3,9%. d) 2000 .P(700 X 750) 2000. 0,039 = 78 Očekávaný počet lamp s životností mezi 700 a 750 hodinami je 78 (3,9% všech lamp). e) P( x X ) 0,10 P( X x) P( X x) F ( x) 0,90
F ( x) 0,90 x F 1 (0,90) NORM.INV(0,90 ;1000 ;200) 1256 Očekávaná doba, po které zůstane svítit jen 10% všech lamp, je 1256 hodin. Příklad 5.3.4: Určete pravděpodobnost toho, že náhodná veličina X s normálním rozdělením N(,2) nabude hodnoty z intervalu ( 3 , 3 ) . Řešení: 3 X 3 P( 3 X 3 ) P P 3 Z 3 (3) (3) (3) 1 (3) 2.(3) 1 0,997
Výsledek Příkladu 5.3.3 je znám pod názvem pravidlo 3. Toto pravidlo říká, že máme-li data pocházející z normálního rozdělení o parametrech 𝜇, 𝜎2, pak téměř všechna (99,7% z nich) leží v intervalu (𝜇 ± 3𝜎).
8
Příklady k procvičení: 1. Určete pravděpodobnost toho, že náhodná veličina X s exponenciálním rozdělením pravděpodobnosti s parametrem 5 nabude a) hodnoty z intervalu <2,3), b) hodnoty menší než 1, c) hodnoty aspoň 1. 2. Výrobní zařízení má poruchu v průměru jednou za 2000 hodin. Předpokládejme, že "doba čekání" na poruchu je náhodná veličina s exponenciálním rozdělením. Určete hodnotu t tak, aby pravděpodobnost, že přístroj bude pracovat delší dobu než t, byla 0,99. 3. Určete pravděpodobnost toho, že náhodná veličina X s normálním rozdělením N(6,9) nabude hodnoty z intervalu (-3,3). 4. Norma připouští délku hřídele v rozmezí 25-26 mm. Při použití standardní technologie se vyrobí hřídel, jejíž délka má normální rozdělení se střední hodnotou 25,4 mm a rozptylem 0,09 mm2. Stanovte pravděpodobnost toho, že náhodně vybraná hřídel bude odpovídat normě. 5. Dálkoměr má systematickou chybu +3cm, náhodné chyby mají normální rozdělení se směrodatnou odchylkou 5 promile měřené délky. Určete pravděpodobnost toho, že při měření délky 20 m bude chyba měření v absolutní hodnotě menší než 10 cm. 6. Trolejbusy MHD odjíždějí ze zastávky v desetiminutových intervalech. Cestující může přijít na zastávku v libovolném okamžiku. Určete střední hodnotu a rozptyl doby čekání na odjezd trolejbusu. 7. Pekárna dodává čerstvé pečivo každé ráno mezi pátou a šestou hodinou. Jaká je pravděpodobnost, že pečivo bude dodáno mezi půl šestou a tři čtvrtě na šest? 8. Každá tramvaj DPMO je jednou za měsíc podrobena technické kontrole, přičemž doba prohlídky silně závisí na typu závady. Předpokládejme, že doba prohlídky má exponenciální rozdělení se střední hodnotou 3 hodiny. Určete pravděpodobnost, že doba prohlídky bude: a) kratší než dvě hodiny, b) delší než čtyři hodiny. 9. Měření nadmořské výšky je zatíženo náhodnými chybami, které jsou rozděleny normálně se střední hodnotou 0 cm a rozptylem 100 cm2. Určete pravděpodobnost toho, že chyba měření nepřesáhne v absolutní hodnotě 20 cm. 10. Tloušťky tyčí vyráběných určitým výrobním postupem mají normální rozdělení se střední hodnotou 28,4 mm a standardní odchylkou 2,95 mm. Kvůli zajištění bezpečnosti zákazník požaduje, aby alespoň 95% tyčí mělo tloušťku větší než 24 mm. Splňují tyto tyče zákazníkův požadavek?
9