UNIVERZITA OBRANY • KATEDRA EKONOMETRIE S ....
UČEBNÍ TEXT PRO DISTANČNÍ STUDIUM
PREPRINT PRAVDĚPODOBNOST A NÁHODNÁ VELIČINA
RNDr. Oldřich KŘÍŽ Mgr. Jiří NEUBAUER, Ph.D. Mgr. Marek SEDLAČÍK, Ph.D.
Brno 2007
2
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Anotace: Skriptum „Pravděpodobnost a náhodná veličinaÿ je učební text pro distanční studium předmětu Statistika I v kombinovaném studijním programu na Fakultě ekonomiky a managementu Univerzity obrany v Brně. Obsahuje základy teorie pravděpodobnosti a náhodné veličiny v rozsahu, který odpovídá kurzu statistiky schválenému akreditačním řízením. Způsob zpracování textu respektuje skutečnost, že student bude pracovat s textem samostatně bez pomoci vyučujícího. Klíčová slova: Náhodný jev, pravděpodobnost náhodného jevu, klasická definice pravděpodobnosti, geometrická definice pravděpodobnosti, podmíněná pravděpodobnost, nezávislé jevy, formule úplnépravděpodobnosti, Bayesův vzorec, náhodná veličina, distribuční funkce, pravděpodobnostní funkce, funkce hustoty pravděpodobnosti, charakteristiky náhodné veličiny, modely disktrétní a spojité náhodné veličiny, limitní věty, Moivre-Laplaceova věta, Lévy-Lindebergova věta, věta o normálním rozdělení.
Skriptum neprošlo redakční ani jazykovou úpravou.
c Oldřich KŘÍŽ, Jiří NEUBAUER, Marek SEDLAČÍK, 2007
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
3
Obsah Úvod 1 PRAVDĚPODOBNOST 1.1 Základy kombinatoriky . . . . . . . . . . . 1.2 Náhodný pokus a náhodný jev . . . . . . . 1.3 Pravděpodobnost náhodného jevu . . . . . 1.4 Klasická definice pravděpodobnosti . . . . 1.5 Geometrická definice pravděpodobnosti . . 1.6 Podmíněná pravděpodobnost . . . . . . . . 1.7 Pravidlo o násobení pravděpodobností . . 1.8 Pravidlo o sčítání pravděpodobností . . . . 1.9 Úplná pravděpodobnost a Bayesův vzorec 1.10 Shrnutí 1. kapitoly . . . . . . . . . . . . . 1.11 Test ke kapitole 1 . . . . . . . . . . . . . .
5
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
2 NÁHODNÁ VELIČINA 2.1 Náhodná veličina . . . . . . . . . . . . . . . . . 2.2 Distribuční funkce náhodné veličiny . . . . . . . 2.3 Pravděpodobnostní funkce náhodné veličiny . . 2.4 Funkce hustoty pravděpobnosti náhodné veličiny 2.5 Charakteristiky polohy . . . . . . . . . . . . . . 2.6 Charakteristiky variability . . . . . . . . . . . . 2.7 Charakteristiky koncentrace . . . . . . . . . . . 2.8 Shrnutí 2. kapitoly . . . . . . . . . . . . . . . . 2.9 Test ke kapitole 2 . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . .
7 7 12 17 19 24 27 29 32 36 41 41
. . . . . . . . .
43 43 45 46 50 53 58 61 67 67 70 70 73 74 77 81 81
3 MODELY DISKRÉTNÍ NÁHODNÉ VELIČINY 3.1 Poissonovo rozdělení . . . . . . . . . . . . . . . . . 3.2 Alternativní rozdělení . . . . . . . . . . . . . . . . . 3.3 Binomické rozdělení . . . . . . . . . . . . . . . . . . 3.4 Hypergeometrické rozdělení . . . . . . . . . . . . . 3.5 Shrnutí 3. kapitoly . . . . . . . . . . . . . . . . . . 3.6 Test ke kapitole 3 . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
4 MODELY SPOJITÉ NÁHODNÉ VELIČINY 4.1 Rovnoměrné rozdělení . . . . . . . . . . . . . 4.2 Exponenciální rozdělení . . . . . . . . . . . . 4.3 Normální rozdělení . . . . . . . . . . . . . . . 4.4 Normované normální rozdělení . . . . . . . . . 4.5 Logaritmicko-normální rozdělení . . . . . . . . 4.6 Rozdělení některých funkcí náhodných veličin 4.7 Shrnutí 4. kapitoly . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
83 . 83 . 86 . 89 . 92 . 96 . 99 . 105
. . . . . . .
. . . . . . .
. . . . . . .
4
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík 4.8
Test ke kapitole 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5 TEORETICKÉ ZÁKLADY STATISTIKY 5.1 Zákon velkých čísel . . . . . . . . . . . . . 5.2 Součet nezávislých náhodných veličin . . . 5.3 Centrální limitní věta . . . . . . . . . . . . 5.4 Věta o normálním rozdělení . . . . . . . . 5.5 Shrnutí 5. kapitoly . . . . . . . . . . . . . 5.6 Test ke kapitole 5 . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
107 107 109 113 119 124 124
Seznam literatury
127
Statistické tabulky
129
Rejstřík
143
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
5
Úvod Učební text, který dostáváte do rukou, je prvním titulem v řadě speciálních studijních textů, které jsou určené jako studijní podpora pro výuku předmětu Statistika u distanční formy vzdělávání. Zároveň se jedná o titul, který navazuje na studijní texty vytvořené na Katedře ekonometrie Fakulty ekonomiky a managementu Univerzity obrany v Brně pro distanční studium matematiky. Návaznost tohoto textu na řadu materiálů pro výuku matematiky je možné vnímat především v tom smyslu, že prezentovaná učební látka je členěná a uspořádaná stejným nebo velmi podobným způsobem, což vám umožní využít svoje vlastní návyky a stejný styl práce při studiu nového předmětu. Statistika je vědní disciplína, která je vybudovaná na třech pilířích: pravděpodobnosti, teorii náhodné veličiny a popisné statistice. Titul pojednává o dvou těchto pilířích, obsahuje základy teorie pravděpodobnosti a náhodné veličiny. Abychom dobře porozuměli smyslu statistiky a jejímu fungování, musíme nejprve pochopit podstatu pravděpodobnosti, neboť všechny závěry, ke kterým statistika svými metodami a prostředky dojde, neplatí s exaktní matematickou přesností, ale mají vždy platnost pouze s jistou pravděpodobností – hovoří se o spolehlivosti. Slovo pouze nepředurčuje statistice význam menší než matematice, ale jiný než matematice. Statistika je totiž disciplína velmi praktická a zabývá se všemi takovými reálnými situacemi, ve kterých se potřebujeme opřít o dosud neznámé informace. Ty jsou zjednodušeně řečeno zatím skryté v tzv. teoretických modelech, pojednávajících o tzv. náhodných veličinách. Právě teorie těchto náhodných veličin tvoří druhou část našeho učebního textu. Odkrývání neznámých informací v nejrůznějších reálných situacích nám umožní třetí pilíř statistiky, a tím je popisná statistika pracující s empirickými naměřenými nebo zjištěnými daty. Této části statistiky se budeme věnovat v dalším titulu, kterým završíme seznamování se s filozofií statistiky, s jejím fungováním a hlavně praktickým využitím jejich závěrů. Výklad naší problematiky je založen na vybudování základních pojmů a vztahů, a je protkán řadou řešených příkladů, poznámek a vysvětlivek, tak, abyste problematiku co nejsnadněji a správně pochopili. Neustále je v textu připomínaná nejdůležitější skutečnost tohoto předmětu, a tou je praktická a reálná podoba řešených problémů. Učební text je rozdělen do pěti kapitol, které jsou děleny stejně jako předchozí matematické texty na moduly a dále na odstavce. Na závěr každého modulu jsou zařazené příklady k procvičení probrané látky, v závěru kapitoly je uvedeno její shrnutí, další doporučená literatura a autotest. Na konci celého textu je uvedena studijní literatura, statistické tabulky a rejstřík použitých pojmů. V závěru bychom rádi poděkovali všem, kteří nám nějakým dílem pomohli při přípravě tohoto textu. Poděkování patří zejména oběma recenzentům, doc. RNDr. Bohumilu Marošovi, CSc. a RNDr. Michalu Šmerkovi, zejména za pečlivé přečtení textu a užitečné připomínky. V Brně 15. 12. 2007
Autoři
6
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
1
7
PRAVDĚPODOBNOST
Statistika jako vědní disciplína je postavena na třech nosných pilířích: pravděpodobnost, náhodná veličina a popisná statistika. Jako první se tedy seznámíme se základními poznatky teorie pravděpodobnosti. Zavedeme pojmy náhodný pokus, náhodný jev a pravděpodobnost náhodného jevu. Dále uvedeme základní vlastnosti a pravidla počtu pravděpodobnosti. Cílem kapitoly je: • zavést pojem náhodný pokus a náhodný jev, • definovat pravděpodobnost náhodného jevu, • vysvětlit základní metody a pravidla pro počítání pravděpodobnosti náhodného jevu.
Řešení některých úloh z počtu pravděpodobnosti je založeno na vztazích z kombinatoriky. Proto si nejdříve připomeňme některé základní poznatky středoškolské matematiky.
1.1
Základy kombinatoriky
Kombinatorika je nauka o skupinách, zabývající se tvorbou určitých skupin a určením počtu těchto skupin. Nejdůležitější druhy těchto skupin jsou permutace, variace a kombinace. Při počítání s těmito skupinami budeme mimo jiné využívat faktoriály a kombinační čísla. • Faktoriál: pro n ∈ N : n! = n · (n − 1) · (n − 2) · · · 2 · 1 a 0! = 1. 1.1.1 Příklad. Vypočtěte: 5!. Řešení. 5! = 5 · 4! = 5 · 4 · 3 · 2 · 1 = 120.
• Kombinační číslo: pro n, k ∈ N a k ≤ n : n n! n · (n − 1) · · · (n − k + 1) = = . k (n − k)!k! k! Při výpočtu kombinačních čísel využíváme vlastností: n n n 0 n n = , = =1 a = = n. k n−k 0 0 1 n−1
8
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
1.1.2 Příklad. Vypočtěte: Řešení.
7 4
.
7 7! 7 7 · 6 · 5 · 4! 7·6·5 = = = = = 35. 4 3 (7 − 3)!3! 4! · 3! 3!
• Binomická věta n
(x + y) =
n X n
xk y n−k =
k n 0 n n 1 n−1 n 2 n−2 n n 0 = xy + xy + xy + ... + x y 0 1 2 n k=0
1.1.3 Příklad. Užitím binomické věty odvoďte vzorec pro třetí mocninu dvojčlenu. Řešení. 3 0 3 3 1 2 3 2 1 3 3 0 (a + b) = ab + ab + ab + a b = b3 + 3ab2 + 3a2 b + a3 . 0 1 2 3 3
• Pascalův trojúhelník n 0 1 2 3 4 .. .
1 1 1 1 1
3 4
1
4 0
3 0
2 0
4 1
1 2
0 3 1
1 3
6 .. . 0 0
2 1
4 2
.. .
1 4
1 1
3 2
1
2 2
4 3
3 3
4 4
V řádcích Pascalova trojúhelníka jsou kombinační čísla n0 , n1 , n2 , . . . , nn pro n = = 0, 1, 2, . . . . Z vlastností kombinačních čísel vyplývá, že každý řádek začíná a končí 1,
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
9
v každém řádku čísla stejně vzdálená od začátku a konce řádku jsou si rovna, libovolné číslo uvnitř Pascalova trojúhelníku lze získat sečtením dvojice čísel ležících bezprostředně nad ním. Z binomické věty také plyne, že součet čísel v n-tém řádku trojúhelníku je roven 2n . • Utvoříme-li z n různých prvků uspořádané skupiny po k prvcích (k ≤ n), přičemž prvky se nemohou opakovat, nazýváme takové skupiny variace k-té třídy z n prvků bez opakování (záleží na pořadí!). Jejich počet je Vk (n) =
n! = n · (n − 1) · (n − 2) · · · (n − k + 1). (n − k)!
1.1.4 Příklad. Turnaje se účastní 8 družstev. Kolika způsoby mohou být obsazena první tři místa? Řešení. V3 (8) =
8! (8−3)!
=
8·7·6·5! 5!
= 8 · 7 · 6 = 336.
• Utvoříme-li z n různých prvků uspořádané skupiny po k prvcích, přičemž kterékoliv prvky se mohou až k-krát opakovat, nazýváme takové skupiny variace k-té třídy z n prvků s opakováním (záleží na pořadí!). Jejich počet je Vk0 (n) = nk . 1.1.5 Příklad. Kolika způsoby lze vyplnit sloupec Sazky (13 zápasů, typy 0, 1, 2)? Řešení. V130 (3) = 313 = 1594393. • Permutace bez opakování z n prvků jsou n-prvkové variace bez opakování z n prvků (skupiny o n prvcích, v nichž záleží na pořadí!). Jejich počet je P (n) = Vn (n) = n!. 1.1.6 Příklad. V osudí je 6 lístků s čísly 1, 2, . . . , 6. Kolika různými způsoby je lze postupně vytáhnout, když se lístky do osudí nevrací a záleží na pořadí? Řešení. P (6) = 6! = 720. • Vyskytují-li se v permutacích z n prvků některé prvky vícekrát, mluvíme o permutacích s opakováním. Jestliže se mezi n prvky vyskytne 1. prvek n1 -krát, 2. prvek n2 -krát, atd. až k-tý prvek nk -krát, přičemž n1 + n2 + · · · + nk = n, je počet permutací n! Pn0 1 ,n2 ,...,nk (n) = . n1 !n2 ! . . . nk !
10
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
1.1.7 Příklad. Kolik různých šesticiferných čísel lze vytvořit z číslic 1, 1, 1, 2, 2, 3? Řešení. P3,2,1 (6) =
6! 3!·2!·1!
=
720 12
= 60.
• Utvoříme-li z n různých prvků neuspořádané skupiny po k prvcích (k ≤ n), přičemž prvky se nemohou opakovat, nazýváme takové skupiny kombinace k-té třídy z n prvků bez opakování (nezáleží na pořadí!). Jejich počet je n Ck (n) = . k 1.1.8 Příklad. 8 závodníků má sehrát turnaj systémem každý s každým. Kolik zápasů se odehraje? 8·7 Řešení. C2 (8) = 82 = 2·1 = 28. • Mohou-li se v neuspořádaných skupinách po k prvcích, vybraných z n prvků, jednotlivé prvky opakovat, nazýváme tyto skupiny kombinace k-té třídy z n prvků s opakováním (nezáleží na pořadí!). Jejich počet je n+k−1 0 Ck (n) = . k 1.1.9 Příklad. V prodejně mají 5 různých druhů pohlednic. Kolika způsoby je možné si koupit 8 pohlednic? 12 12 Řešení. C80 (5) = 5+8−1 = = = 495. 8 8 4 1.1.10 Úkoly a problémy k modulu 1.1 1. Zjistěte, čemu je rovno 4 5 6 7 8 + + + + . 4 4 4 4 4 2. Řešte rovnici:
x x+1 − = 4. x−2 x
3. Sečtěte vybraný řádek Pascalova trojúhelníka. 4. Kolik podmnožin lze utvořit z n-prvkové množiny? 5. Ukažte, že platí: n n 2 n 3 n n n +2 +2 +2 + ··· + 2 = 3n . 0 1 2 3 n 6. V urně je pět koulí téhož tvaru, ale různé barvy. Kolika různými způsoby je lze postupně vytáhnout, jestliže se tažená koule do urny nevrací a přihlíží se k pořadí, v jakém byly koule taženy?
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
11
7. Kolik různých pěticiferných čísel lze napsat číslicemi 0, 1, 4, 7, 9, nemá-li se žádná číslice opakovat. Kolik z nich je sudých? 8. Kolik permutací lze utvořit z písmen slova MISSISSIPPI? 9. Kolika způsoby lze rozesadit 5 žen a 5 mužů kolem kulatého stolu tak, aby žádné dvě osoby téhož pohlaví neseděly vedle sebe? 10. Společnost má 36 členů. Kolika způsoby lze zvolit předsedu, místopředsedu, jednatele a pokladníka, jestliže každý člen společnosti může zastávat pouze jednu funkci? 11. V sérii 12 výrobků jsou 3 vadné. Kolika způsoby lze ze série vybrat a) 6 výrobků, b) 6 bezvadných výrobků, c) 6 výrobků, z nichž právě 2 jsou vadné. 12. V urně je 6 koulí bílých a 5 červených. Kolika způsoby lze z ní vytáhnout 4 koule, mají-li mezi nimi být alespoň 2 bílé? 13. V prodejně mají výběr 12 různých pohledů. Určete, kolika způsoby lze si z nich koupit a) 15 pohledů, b) 7 různých pohledů? 14. Určete součet všech čtyřciferných čísel sestavených z číslic 1, 3, 5, 7 (bez opakování číslic). 15. Kolika způsoby lze rozmístnit do 9 přihrádek 7 bílých a 2 černé koule (tj. není nutné, aby v každé přihrádce byla nějaká koule)? 16. Kolika způsoby si mohou 4 děti rozdělit mezi sebou 10 modrých, 15 červených a 8 zelených kuliček, jestliže každé dítě musí dostat alespoň jednu kuličku každého druhu? Řešení. 1. 95 ; 2. 5; 3. 2n ; 4. 2n ; 6. P (5) = 5! = 120; 7. 96; 42; 0 8. P4,4,2,1 (11) = 34650; 9. 2 · 5! · 5!; 10. V4 (36) = 1413720; 11. a) C6 (12) = 924; b) C6 (9) = 84; c) C2 (3) · C4 (9) = 378; 12. 265; 0 13. a) C15 (12) = 7726160; b) C7 (12) = 792; 14. 106656; 15. C70 (9) · C20 (9) = 289575; 16. 1070160.
12
1.2
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Náhodný pokus a náhodný jev
Základní pojem, z něhož budeme vycházet, je pojem pokus. Pokusem budeme rozumět každé uskutečnění určitého pevného systému podmínek. Zabývat se budeme jen takovými pokusy, které jsou opakovatelné. Rozlišujeme dva typy pokusů. Jsou to pokusy deterministické a pokusy náhodné. U deterministického pokusu vede uskutečnění systému podmínek, které pokus vymezují, vždy ke stejnému výsledku (např. zahřejeme-li za normálních podmínek vodu na 100 ◦ C, vždy dojde k varu vody). Naopak pokusy, jejichž výsledek se od jednoho provedení k druhému mění, i když systém podmínek přísně dodržujeme a neměníme, nazýváme náhodné pokusy (např. hod kostkou, měření délky, běh na 100 metrů, losování v loterii apod.). Výsledkem náhodného pokusu je náhodný jev (např. padlo 5 ok, délka je 25,7 cm, dosažený čas je 13,8 s, vylosovaný los je B265430 apod.). Každému pokusu přísluší množina všech možných výsledků (jevů) tohoto pokusu, o nichž předpokládáme, že žádné dva nemohou nastat současně a jeden z nich nastává vždy. Množinu všech těchto jevů nazveme základním prostorem a značíme jej Ω. Příslušné jevy (prvky množiny Ω) nazveme elementárními jevy a označíme je ω1 , ω2 , . . . . Prostor elementárních jevů může být buď konečný Ω = {ω1 , ω2 , . . . , ωn } nebo nekonečný Ω = {ω1 , ω2 , . . . , ωn , . . . }. Jev, který nastane při každém provedení daného pokusu, nazýváme jevem jistým a můžeme jej, stejně jako základní prostor, chápat jako souhrn všech možných výsledků daného pokusu. Značíme jej tedy stejně jako základní prostor Ω. Naopak jev, který při daném pokusu nikdy nenastane, nazýváme jevem nemožným a značíme jej Ø. Vzhledem k tomu, že náhodný jev je množinou výsledků náhodného pokusu, jsou vztahy mezi náhodnými jevy totožné se vztahy mezi množinami. Libovolný náhodný jev A (dále jen jev A) lze tedy považovat za podmnožinu základního prostoru Ω, tj. A ⊆ Ω. 1.2.1 Příklad. Uvažujeme hod homogenní hrací kostkou. Pak zřejmě Ω = {1, 2, . . . , 6}. Základní prostor Ω je jevem jistým, neboť je mu příznivý každý z možných výsledků pokusu. Naopak jev „padne číslo 7ÿ je v daném pokusu jevem nemožným. Označíme-li např. jev A „padne sudé čísloÿ, je A = {2, 4, 6}. 1.2.2 Poznámky. Vztahy mezi jevy vyjadřujeme pomocí množinových relací: 1. jev A je částí jevu B (A ⊂ B), tzn. pokud nastane jev A, nastane i jev B;
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
13
2. jevy A a B jsou rovnocenné (A = B), tzn. jev A nastane právě když nastane jev B;
3. průnik (společné nastoupení) jevů A a B (A ∩ B), tzn. současně nastane jev A i B;
4. sjednocení jevů A a B (A ∪ B), tzn. nastane alespoň jeden z jevů A a B;
5. jevy A a B se nazývají neslučitelné, jestliže při jednom náhodném pokusu nemohou současně oba nastat (tzn. A ∩ B = Ø);
14
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
6. rozdíl jevů A − B nastane, jestliže nastane jev A a nenastane jev B;
7. opačný jev k jevu A je ten, který znamená, že jev A nenastal, označuje se A (tzn. A = Ω − A);
8. A ∩ B = A ∪ B;
9. A ∪ B = A ∩ B.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
15
1.2.3 Poznámka. Zobecněním předchozích dvou vlastností jsou tzv. de Morganova pravidla. Pro k ≥ 2 platí: k k \ [ Ai = Ai , i=1
i=1
k [
k \
i=1
Ai =
Ai .
i=1
1.2.4 Poznámka. Vlastnosti operací s jevy jsou totožné s vlastnostmi operací s množinami. Připomeňme některé z nich: 1. A ∩ B = B ∩ A, A ∪ B = B ∪ A, 2. A ∩ (B ∩ C) = (A ∩ B) ∩ C, A ∪ (B ∪ C) = (A ∪ B) ∪ C, 3. A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C), 4. A ∩ A = A, A ∪ A = A, 5. A ∩ Ø = Ø, A ∪ Ø = A, 6. A ∩ Ω = A, A ∪ Ω = Ω, 7. (A) = A, 8. A ∩ A = Ø, A ∪ A = Ω, 9. A − B = A ∩ B, A − B 6= B − A. 1.2.5 Příklad. Náhodný pokus spočívá v hodu šestistěnnou hrací kostkou. Jev A nastoupí, jestliže padne sudé číslo a jev B nastoupí, jestliže padne číslo větší než 4. Určete základní prostor Ω, dále jevy A, B, A ∪ B, A ∩ B, A − B a B − A. Řešení. Základní prostor Ω = {1, 2, 3, 4, 5, 6} je konečný, tedy ω1 = {1}, . . . , ω6 = {6}. Dále je zřejmě A = {2, 4, 6} a B = {5, 6}, proto A = {1, 3, 5} . . . padne liché číslo, B = {1, 2, 3, 4} . . . padne číslo menší než 5, A ∪ B = {2, 4, 6} ∪ {5, 6} = {2, 4, 5, 6} . . . nepadne číslo 1 a 3, A ∩ B = {2, 4, 6} ∩ {5, 6}={6} . . . padne číslo 6, A − B = {2, 4, 6} − {5, 6}={2, 4} . . . padne číslo 2 nebo 4, B − A = {5, 6} − {2, 4, 6}={5} . . . padne číslo 5. 1.2.6 Příklad. Náhodný pokus spočívá ve třech hodech jednou mincí (v každém hodu jsou pouze dva možné výsledky: buď rub (R) nebo líc (L)). Uvažujme jevy: A . . . alespoň dvakrát padne líc, B . . . ve druhém hodu padne rub, C . . . líc padne právě dvakrát, D . . . rub padne aspoň dvakrát nebo nepadne vůbec. Určete prostor elementárních jevů Ω, dále jevy D, A ∪ B, A ∩ B, C ∪ D, C ∩ D a A − C.
16
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Řešení. Základní prostor Ω = {ω1 , ω2 , . . . , ω8 } je konečný, kde ω1 = {L, L, L}, ω2 = {L, L, R}, ω3 = {L, R, L}, ω4 = {R, L, L}, ω5 = {L, R, R}, ω6 = {R, L, R}, ω7 = {R, R, L}, ω8 = {R, R, R}. Dále je zřejmě A = {ω1 , ω2 , ω3 , ω4 }, B = {ω3 , ω5 , ω7 , ω8 }, C = {ω2 , ω3 , ω4 }, D = = {ω1 , ω5 , ω6 , ω7 , ω8 }, proto D = C, A ∪ B = ω6 , A ∩ B = ω3 , C ∪ D = Ω, C ∩ D = Ø a A − C = ω1 . 1.2.7 Úkoly a problémy k modulu 1.2 1. Házíme kostkou tak dlouho, dokud nepadne šestka. a) Určete základní prostor Ω. b) Vypište všechny možné výsledky příznivé jevu: „pokus skončí při druhém hoduÿ. c) Kolik možných výsledků je příznivých nastoupení jevu: „pokus skončí při třetím hoduÿ? 2. Průmyslově vyráběný filtr je podroben třem různým zkouškám. Jev Ai spočívá v tom, že filtr obstojí v i-té zkoušce, i = 1, 2, 3. Pomocí jevů Ai vyjádřete, že filtr obstojí a) jen v 1. zkoušce, b) jen v 1. a 2. zkoušce, c) ve všech třech zkouškách, d) alespoň v jedné zkoušce, e) alespoň ve dvou zkouškách, f) právě v jedné zkoušce, g) právě ve dvou zkouškách, h) nejvýše v jedné zkoušce. 3. Určete prostor elementárních jevů vyjadřujících a) počet vadných výrobků mezi 50 kontrolovanými výrobky, b) počet vozidel, která tankují u benzinové pumpy během dne, c) dobu, po kterou bankovní automat vyřizuje váš příkaz. 4. Zjednodušte následující výrazy: a) (A ∪ B) ∩ A ∪ B , b) A ∪ B ∪ A ∪ B , c) A ∩ B ∪ A ∩ B ∪ A ∩ B . 5. Jev A spočívá v tom, že náhodně vybrané přirozené číslo je dělitelné pěti, a jev B v tom, že toto číslo má na posledním místě nulu. Určete význam následujících jevů: a) A ∩ B, b) A ∪ B, c) A ∩ B, d) A ∪ B,
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
17
e) A ∩ B. 6. Zařízení kotelny se skládá ze strojovny a dvou kotlů. Nechť A a B1 , B2 znamená, že strojovna a první či druhý kotel jsou v pořádku. Pomocí těchto jevů vyjádřete jev C resp. C, kde C znamená, že kotelna je schopná provozu, je-li v pořádku a) strojovna a alespoň jeden kotel, b) strojovna a první kotel. Řešení. 1. a) Ω = {[6], [1, 6], [2, 6], [3, 6], . . . , [5, 6], [1, 1, 6], [1, 2, 6], [1, 3, 6], . . . , [1, 5, 6], [2, 1, 6], [2, 2, 6], . . . , [5, 5, 6], [1, 1, 1, 6], . . . }; b) [1, 6], [2, 6], [3, 6], [4, 6], [5, 6]; c) [x, y, 6], kde x, y ∈ {1, 2, . . . , 5}, celkem 52 možných výsledků; 2. a) A1 ∩ A2 ∩ A3 ; b) A1 ∩ A2 ∩ A3 ; c) A1 ∩ A2 ∩ A3 ; d) A1 ∪ A2 ∪ A3 ; e) A1 ∩ A2 ∩ A3 ∪ A1 ∩ A2 ∩ A3 ∪ A1 ∩ A2 ∩ A3 ∪ (A1 ∩ A2 ∩ A3 ); f) A1 ∩ A2 ∩ A3 ∪ A1 ∩ A2 ∩ A3 ∪ A1 ∩ A2 ∩ A3 ; g) A1 ∩ A2 ∩ A3 ∪ A1 ∩ A2 ∩ A3 ∪ A1 ∩ A2 ∩ A3 ; h) A1 ∩ A2 ∩ A3 ∪ A1 ∩ A2 ∩ A3 ∪ A1 ∩ A2 ∩ A3 ∪ A1 ∩ A2 ∩ A3 ; 3. a) Ω = {0, 1, 2, . . . , 50}; b) Ω = {0, 1, 2, . . . }; c) Ω = {x; x ∈ R+ }; 4. a) A; b) A; c) A ∪ B; 5. a) číslo má na posledním místě nulu; b) číslo je dělitelné pěti; c) nemožný jev; d) jistý jev; e) všechna čísla mimo čísla končící pětkou; 6. a) C = A ∩ (B1 ∪ B2 ); C = A ∪ (B1 ∩ B2 ); b) C = A ∩ B1 , C = A ∪ B1 . Další úlohy na procvičování: [Budíková]: [Hebák]: [Kříž 1]:
1.3
str. 5–8, str. 9–12, odstavec 1.1, str. 21–23, odstavec 2.1.
Pravděpodobnost náhodného jevu
Jevy můžeme hodnotit podle toho, jak velkou mají naději, že při náhodném pokusu nastanou. Jinak řečeno posuzujeme je podle toho, jak velkou mají pravděpodobnost nastoupení. Můžeme tedy pravděpodobnost považovat za objektivní vlastnost jevu, nezávislou na pozorovateli, která existuje bez ohledu na to, zda ji umíme či neumíme zjistit nebo určit. Její význam je v tom, že udává míru možnosti nastoupení daného jevu. Uvažujme například pokus spočívající v posloupnosti hodu mincí. Na začátku minulého století obdržel Pearson z 24000 hodů poměrnou četnost líců 0,5005. V kontextu lze pravděpodobnost také interpretovat jako číslo, které udává, s jakou poměrnou četností nastane příslušný jev v dlouhé posloupnosti pokusů. Pravděpodobnost jevu A formálně zavedeme pomocí axiomů.
18
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
1.3.1 Definice. (Axiomatická definice pravděpodobnosti) Každému jevu A, který je podmnožinou základního prostoru Ω, přiřazujeme reálné číslo P (A), které nazýváme pravděpodobností jevu A, přičemž platí: Axiom 1: Pravděpodobnost jevu A je nezáporné číslo, tzn. P (A) ≥ 0. Axiom 2: Pravděpodobnost jistého jevu Ω je rovna 1, tzn. P (Ω) = 1. Axiom 3: Jsou-li jevy A1 , . . . , An vzájemně neslučitelné (tzn. Ai ∩ Ak = Ø pro i 6= k, i, k = 1, 2, . . . , n), potom pravděpodobnost sjednocení jevů A1 , . . . , An je rovna součtu pravděpodobností jednotlivých jevů, tzn. P (A1 ∪ A2 ∪ . . . ∪ An ) = P (A1 ) + P (A2 ) + · · · + P (An ).
1.3.2 Poznámky. 1. Axiom 3 platí také pro spočetnou množinu (jevy lze uspořádat do posloupnosti) vzájemně neslučitelných jevů, tzn. P (A1 ∪ . . . ∪ An ∪ An+1 ∪ . . . ) = P (A1 ) + · · · + P (An ) + P (An+1 ) + . . . . 2. Definice 1.3.1 stanoví tři základní pravidla, které musí pravděpodobnost splňovat, avšak neříká nic o tom, jak se pravděpodobnost určuje. Toto je otázkou konkrétní úlohy. 1.3.3 Poznámka. Pomocí těchto tří axiomů lze odvodit základní vlastnosti pravděpodobnosti : 1. 0 ≤ P (A) ≤ 1, 2. P (Ø) = 0, 3. P (A) = 1 − P (A). 4. Je-li A ⊂ B, pak 0 ≤ P (A) ≤ P (B) a P (B − A) = P (B) − P (A). 5. Jestliže základní prostor Ω obsahuje konečný nebo spočetný počet elementárních jevů ω1 , . . . , ωn , potom pro pravděpodobnost P (A) libovolného jevu A platí X P (ωi ). P (A) = ωi ∈A
1.3.4 Příklad. Mějme 4 možné výsledky pokusu, označme je ω1 , ω2 , ω3 , ω4 . Odpovídající pravděpodobnosti jsou P (ω1 ) = 0,2, P (ω2 ) = 0,4, P (ω3 ) = 0,35 a P (ω4 ) = 0,05. Nechť jev A spočívá v nastoupení alespoň jednoho z jevů ω1 , ω2 , ω4 . Určete s jakou pravděpodobností nastane jev A při provedení pokusu. Řešení. Zřejmě Ω = ω1 ∪ ω2 ∪ ω3 ∪ ω4 a A = ω1 ∪ ω2 ∪ ω4 . Podle axiomu 3 definice 1.3.1 platí P (A) = P (ω1 ∪ ω2 ∪ ω4 ) = P (ω1 ) + P (ω2 ) + P (ω4 ) a s využitím 3. vlastnosti
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
19
pravděpodobnosti dostáváme P (A) =
X
P (ωi ) = P (ω1 ) + P (ω2 ) + P (ω4 ) = 0,2 + 0,4 + 0,05 = 0,65.
ωi ∈A
1.4
Klasická definice pravděpodobnosti
1.4.1 Definice. (Klasická definice pravděpodobnosti) Uvažujme nyní konečný základní prostor elementárních jevů Ω = {ω1 , ω2 , . . . , ωn } a předpokládejme, že nastoupení každého z elementárních jevů je stejně možné, tzn. P (ωi ) = n1 pro i = 1, 2, . . . , n. Klasická pravděpodobnost jevu A je potom P (A) =
m , n
(1.1)
kde m udává počet elementárních jevů příznivých jevu A (tzn. počet prvků množiny A). Tedy uvedená pravděpodobnost je pro daný jev A rovna podílu počtu všech výsledků příznivých jevu A a počtu všech možných výsledků daného pokusu. Hovoříme potom o tzv. klasické definici pravděpodobnosti jevu A. 1.4.2 Poznámky. 1. Lze ukázat, že klasická pravděpodobnost splňuje axiomy teorie pravděpodobnosti (viz definice 1.3.1). 2. Z historického hlediska je zajímavé, že se teorie pravděpodobnosti dlouho opírala o klasickou pravděpodobnost. Typickým příkladem jsou úlohy o hazardních hrách (házení mincí, kostkou, ruleta, karetní hry apod.). V současné době je okruh problémů, které lze řešit pomocí klasické pravděpodobnosti, poměrně úzký, ovšem nikoliv bezvýznamný. Výpočet pravděpodobnosti se většinou redukuje na kombinatorickou úlohu, což si ukážeme na několika typických příkladech. 1.4.3 a) při b) při c) při d) při
Příklad. Házíme homogenní hrací kostkou. Jaká je pravděpodobnost, že jednom hodu padne číslo 1 nebo 2 (jev A), jednom hodu padne sudé číslo (jev B), jednom hodu nepadne číslo 5 (jev C), hodu dvěma kostkami padne součet 7 (jev D)?
Řešení. a) Počet možných výsledků je 6 a z nich jsou dva příznivé jevu A. Proto pravděpodobnost, že při jednom hodu padne číslo 1 nebo 2 je rovna P (A) =
2 1 = . 6 3
20
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
b) Padnutí sudého čísla je sjednocení tří neslučitelných jevů, a to padnutí dvojky, čtyřky a šestky. Všechny tyto jevy mají stejnou pravděpodobnost 16 , proto pravděpodobnost padnutí sudého čísla je P (B) =
1 1 1 3 1 + + = = . 6 6 6 6 2
Přímým použitím klasické definice pravděpodobnosti, při kterém 3 příznivé výsledky dělíme 6 možnými výsledky, dostáváme snadno rovnou výsledek. c) Počet příznivých výsledků je 5, tedy 5 P (C) = . 6 Stejného výsledku dosáhneme, přejdeme-li k opačnému jevu C (padne pětka), neboť P (C) = 1 − P (C) = 1 − 61 = 56 . d) Danému pokusu příslušejí elementární jevy „padnutí dvojice [i, j]ÿ, kde i, j = = 1, 2, . . . , 6. Jejich počet je 62 = 36. Jevu D jsou příznivé elementární jevy: „padne jedna z dvojic [1, 6], [2, 5], [3, 4], [4, 3], [5, 2], [6, 1]ÿ. Tedy pravděpodobnost P (D) =
6 1 = . 36 6
1.4.4 Příklad. V zásilce je 18 dobrých výrobků a 2 vadné. Náhodně vybereme bez vracení 5 výrobků. Určete pravděpodobnost, že: a) všech pět výrobků je dobrých (jev A), b) čtyři výrobky jsou dobré a jeden vadný (jev B), c) alespoň jeden výrobek je vadný (jev C). Řešení. Počet všech způsobů, jak vybrat 5 výrobků z celkového počtu 20 výrobků je 20 roven počtu pětiprvkových kombinací bez opakování z 20 prvků, což dává 5 možných výsledků. a) Jevu A je příznivých celkem 18 případů a hledaná pravděpodobnost je tedy rovna 5 18 18 · 17 · 16 · 15 · 14 21 . 5 P (A) = 20 = = = 0,553. 20 · 19 · 18 · 17 · 16 38 5 2 b) Jevu B je příznivých celkem 18 · 1 případů, platí tedy 4 2 18 · 1 18 · 17 · 16 · 15 · 2 · 5 15 . 4 = P (B) = = = 0,395. 20 20 · 19 · 18 · 17 · 16 38 5 c) Neboť C = A, platí pro jev C P (C) = P (A) = 1 − P (A) = 1 −
21 17 . = 0,447. = 38 38
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
21
1.4.5 Příklad. Předpokládejme, že se 3 lidé setkali zcela náhodně. Určete pravděpodobnost, že: a) každý z nich má narozeniny v jiný den v roce (jev A), b) právě 2 osoby z těchto 3 mají narozeniny společně v 1 den (jev B), c) alespoň 2 osoby z těchto 3 mají narozeniny společně v 1 den (jev C). Přestupný rok neuvažujeme a předpokládáme, že narození dítěte je v dané oblasti stejně možné v kterýkoli den v roce. Řešení. Počet všech možností je zřejmě V30 (365) = 3653 . Počet příznivých výsledků jevu A je V3 (365) = 365 · 364 · 363. Proto pravděpodobnost, že každý z nich má narozeniny v jiný den v roce je rovna P (A) = Podobně P (B) =
365 · 364 · 363 . = 0,992. 3653
3 · V2 (365) 3 · 365 · 364 . = = 8,197 · 10−3 0 V3 (365) 3653
a P (C) = P (B) +
365 V30 (365)
=
3 · 365 · 364 + 365 . = 8,204 · 10−3 . 3 365
1.4.6 Příklad. V urně je 6 koulí bílých a 8 červených. Je pravděpodobnější, že při tahu 3 koulí budou všechny bílé (jev A), nebo že při tahu 4 koulí budou všechny černé (jev B)? 14 Řešení. Počet všech způsobů, jak vybrat 3 koule z celkového počtu 14 koulí je . 3 8 6 Jevu A je příznivých 3 · 0 případů a pravděpodobnost jevu A je tedy rovna 8 6 · 5 . 6·5·4 P (A) = 3 140 = = = 0,055. 14 · 13 · 12 91 3 Podobně pravděpodobnost jevu B je rovna 8 6 · 8·7·6·5 10 . P (B) = 0 144 = = = 0,070. 14 · 13 · 12 · 11 143 4 1.4.7 Příklad. Určete, kolikrát je třeba hodit hrací kostkou, aby pravděpodobnost, že alespoň jednou padne šestka, byla větší než 0,7 (jev A)? Řešení. Nejdříve vypočteme pravděpodobnost opačného jevu A, tj. že při n hodech ani jednou nepadne šestka. Možných případů je zřejmě 6n . Příznivých případů je 5n , protože na každé kostce jsou příznivé pouze hody 1, . . . , 5. Proto pravděpodobnost 5 n opačného jevu P (A) = 6 a hledaná pravděpodobnost n 5 . P (A) = 1 − P (A) = 1 − 6
22
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
n Úkolem je tedy stanovit nejmenší přirozené číslo vyhovující podmínce 1 − 56 > 0, 7. Po úpravě dostáváme n 6 10 > . 5 3 . má kořen n = 6,6, proto nejmenší přirozené číslo Exponenciální rovnice 1,2n = 10 3 vyhovující úloze je n = 7. 1.4.8 Úkoly a problémy k modulu 1.4 1. Vypočtěte pravděpodobnosti P (A), P (B), P (A), P (B), P (A ∪ B), P (A ∩ B), P (A − B), P (B − A) náhodných jevů z příkladu 1.2.5 pro homogenní hrací kostku. 2. Při hodu červenou a modrou kostkou padlo na červené kostce větší číslo. Jaká je pravděpodobnost, že na červené kostce padlo číslo 5? 3. V loterii je 10000 losů, z nichž 100 losů vyhrává 1000 Kč, 100 losů vyhrává 500 Kč a 1000 losů vyhrává 10 Kč. Jaká je pravděpodobnost, že při zakoupení jednoho losu a) vyhrajeme, b) vyhrajeme 500 Kč, c) vyhrajeme nejvýše 500 Kč, d) vyhrajeme nejméně 500 Kč. 4. Z karetní hry o 32 kartách vybereme náhodně bez vracení 4 karty. Jaká je pravděpodobnost, že alespoň jedna z nich je eso? 5. Jaká je pravděpodobnost, že při současném hodu šesti kostkami padne a) na každé kostce jiné číslo, b) samé šestky, c) právě pět šestek, d) právě čtyři šestky, e) alespoň čtyři šestky, f) samá sudá čísla, g) všechna čísla stejná. 6. Je pravděpodobnější, že při hodu třemi kostkami padne součet 11 (jev A) nebo 12 (jev B)? 7. Určete pravděpodobnost toho, že lze sestrojit trojúhelník ze třech úseček, které náhodně vybereme a) ze 4 úseček o délkách 4, 6, 8 a 10, b) z 5 úseček o délkách 5, 8, 10, 13 a 15. 8. Pokud se naučíte ke zkoušce z 50 otázek pouze 25, jakou máte pravděpodobnost, že ze tří vytažených otázek budete znát a) všechny 3, b) právě 2?
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
23
9. Vojenský prostor je střežen ze 6 pozorovatelen z celkového počtu 9 pozorovatelen. Nepřítel ostřeluje 3 pozorovatelny. Jaká je pravděpodobnost, že ostřeluje a) 3 obsazené pozorovatelny, b) 2 obsazené a 1 neobsazenou pozorovatelnu, c) alespoň 1 neobsazenou pozorovatelnu? 10. Mezi 100 šrouby je 5 zmetků. Jaká je pravděpodobnost, že ve skupině 10 bez kontroly zakoupených šroubů a) je právě jeden zmetek, b) jsou nejvýše dva zmetky? 11. V urně je 6 červených, 3 modré a 3 bílé koule. Vytáhneme 4 koule. Určete pravděpodobnost, že a) všechny 4 koule budou červené, b) 3 koule budou červené a 1 modrá, c) 2 koule budou červené, 1 modrá a 1 bílá. 12. V dodávce 50 kusů hodin je jich 46 v pořádku. Ke kontrole této dodávky vybereme náhodně 4 kusy. Jaká je pravděpodobnost, že mezi kontrolovanými hodinami budou a) všechny kusy dobré, b) nejvýše 3 kusy dobré, c) 2 kusy dobré a 2 vadné, d) všechny kusy vadné? 13. Deset aut zaparkovalo na parkovišti náhodně v jedné řadě. Jaká je pravděpodobnost, že tři určitá auta budou zaparkovaná vedle sebe? 14. Pravděpodobnost, že dva určití vojáci z čety budou vybráni do 4-členné stráže je 1/20. Kolik vojáků má tato četa? Řešení. 1. P (A) = 12 ; P (B) = 13 ; P (A) = 12 ; P (B) = 23 ; P (A ∪ B) = 23 ; P (A ∩ B) = 61 ; P (A − B) = 13 ; P (B − A) = 16 ; 4 2. 15 ; 3. a) 0,12; b) 0,01; c) 0,11; d) 0,02; 4. 0,4306; 5. a) 0,01543; b) 2,143 · 10−5 ; c) 0,000643; d) 0,008037; e) 0,0087; f) 0,015625; g) 1,286 · 10−4 ; 6. P (A) = 0,125; P (B) = 0,1157; 7 7. a) 34 ; b) 10 ; 8. a) 0,117; b) 0,383; 9. a) 0,238; b) 0,536; c) 0,762; 10. a) 0,3394; b) 0,9934; 11. a) 0,030; b) 0,121; c) 0,273; 12. a) 0,709; b) 0,291; c) 0,027; d) 4,34 · 10−6 ; 1 13. 15 ; 14. 16.
24
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Další úlohy na procvičování:
[Budíková]: [Hebák]: [Kříž 1]: [Marek]:
1.5
str. str. str. str.
6–12, 15–37, 25–29, odstavec 2.3, 45–57.
Geometrická definice pravděpodobnosti
Geometrickou pravděpodobnost lze považovat za zobecnění klasické pravděpodobnosti v tom smyslu, že základní prostor elementárních jevů je nespočetný. Používáme ji tehdy, můžeme-li jevy zobrazit geometricky na přímce, v rovině nebo v prostoru.
1.5.1 Definice. (Geometrická definice pravděpodobnosti) Množina elementárních jevů Ω má nekonečný počet prvků vytvářejících určitou oblast, která je omezená, uzavřená a má velikost V (Ω) (vyjádřenou délkou, obsahem případně objemem). Podobně jev A ⊂ Ω tvoří oblast o velikosti V (A). Potom geometrická pravděpodobnost jevu A je dána V (A) . (1.2) P (A) = V (Ω)
1.5.2 Poznámka. Oblast Ω lze interpretovat jako množinu všech možných výsledků pokusu, který spočívá v náhodném výběru bodu. Výběr každého bodu této oblasti považujeme za stejně možný. Opět lze ukázat, že geometrická pravděpodobnost splňuje axiomy teorie pravděpodobnosti (viz definice 1.3.1).
1.5.3 Příklad. Hodiny, které nebyly včas nataženy, se po určité době zastaví. Jaká je pravděpodobnost, že se velká ručička zastaví mezi šestkou a devítkou? Řešení. Označme A jev, který spočívá v tom, že se velká ručička zastaví mezi šestkou a devítkou. Pravděpodobnost jevu A je úměrná délce oblouku mezi šestkou a devítkou (ozn. V (A)), takže hledaná pravděpodobnost se rovná podílu délky oblouku V (A) a délky obvodu celého číselníku Ω (viz obrázek 1.1), což je v našem případě
P (A) =
V (A) π/2 1 = = . V (Ω) 2π 4
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
25
Obr. 1.1 Situace popsaná v příkladu 1.5.3
Všimněme si ještě jednoho případu v souvislosti s úlohou 1.5.3. Uvažujme jev B který spočívá v tom, že se velká ručička zastaví např. přesně na šestce. Délka příslušného oblouku je však v tomto případě nulová, neboť ji tvoří pouze jediný bod. Platí tedy P (B) =
0 V (B) = = 0. V (Ω) 2π
Z tohoto závěru však neplyne, že uvažovaný jev je nemožný. Analogicky nelze tvrdit, že opačný jev B („ručička se nezastaví na šestceÿ) je jev jistý, i když platí P (B) = 1 − P (B) = 1. Je-li pravděpodobnost nějakého jevu rovna 0, resp. 1, neplyne odtud, že uvažovaný jev je nemožný, resp. jistý. Opačné tvrzení neplatí! 1.5.4 Příklad. Dva lidé se dohodli, že se setkají na stanoveném místě mezi 18,00 a 18,45 hodin. Každý z nich volí čas příchodu nezávisle na druhém a jejich příchody v daném časovém intervalu jsou v každém okamžiku stejně možné. Určete pravděpodobnost, že se setkají, zdrží-li se každý 15 minut od svého příchodu, nejdéle však do 18,45 a potom odejde. Řešení. Označme okamžiky příchodů obou osob x a y, přičemž platí 0 ≤ x ≤ 45, 0 ≤ y ≤ 45 (časy příchodů x, y měříme v minutách po 18. hodině). Oblast Ω všech možných hodnot příchodů x, y je čtverec o straně 45, tj. Ω = {[x, y] ∈ R2 : 0 ≤ x ≤ 45, 0 ≤ y ≤ 45}. Jevu A, který spočívá v tom, že se obě osoby setkají, jsou příznivé ty případy x, y, které leží v oblasti určené nerovností |x − y| ≤ 15, resp. −15 ≤ x − y ≤ 15. Množinu A lze tedy zapsat jako A = {[x, y] ∈ Ω : |x − y| ≤ 15}.
26
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Obr. 1.2 Situace popsaná v příkladu 1.5.4
Z obrázku je patrno, že oblast A je ohraničená přímkami x = 0, x = 45, y = 0, y = = 45, y = x + 15, y = x − 15. Obsahy oblastí Ω a A jsou tedy V (Ω) = 452 , V (A) = = 452 − 302 . Dosazením do vzorce (1.2) dostáváme V (A) 452 − 302 P (A) = = =1− V (Ω) 452
2 2 5 = . 3 9
Obě osoby se tedy setkají v uvedené době s pravděpodobností 59 . 1.5.5 Úkoly a problémy k modulu 1.5 1. Ve vojenském prostoru je natažený telefonní kabel o délce 600 m mezi velitelským stanovištěm a mostem. V bodě K, jehož poloha je na kabelu všude stejně možná, došlo k přerušení linky. Určete pravděpodobnost, že vzdálenost bodu K od velitelského stanoviště je a) větší než 75 metrů, b) nejvýše 10 metrů? 2. Jsou dány 4 soustředné kružnice o poloměrech 2, 3, 4 a 5. V kruhu o poloměru 5 zvolme náhodně bod K. Jaká je pravděpodobnost, že bod K padne a) do vnitřního kruhu, b) do kruhu o poloměru 3, c) do prostředního mezikruží? 3. Na zastávku přijíždí autobus linky A každých 15 minut a autobus linky B každých 20 minut. Určete pravděpodobnost, že od okamžiku, kdy cestující přijde na tuto zastávku, přijede a) autobus A dříve než autobus B, b) autobus A nebo autobus B do 5 minut.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
27
4. Každý ze dvou parníků může doplout do přístaviště vždy jednou za den, a to se stejnou šancí v kterýkoliv jeho okamžik a nezávisle na druhém parníku. První se v přístavišti zdrží jednu hodinu, druhý dvě hodiny. Jaká je pravděpodobnost, že jeden bude muset čekat, až druhý opustí přístaviště? 5. Jaká je pravděpodobnost, že součet dvou náhodně zvolených kladných čísel, z nichž žádné není větší než jedna, bude menší než jedna a jejich součin bude větší než 29 . 6. Úsečka dlouhá 200 mm je náhodně rozdělena na 3 díly. Určete pravděpodobnost, že prostřední díl bude nejvýše 10 mm dlouhý.
Řešení. 1. a) 0,875; b) 0,167; 2. a) 0,16; b) 0,36; c) 0,28; 3. a) 5/8; b) 1/2; 4. 0,121; 5. 0,013; 6. 0,0975. Další úlohy na procvičování: [Budíková]: [Kříž 1]:
1.6
str. 24, 25, odstavce 5.1, 5.2, str. 29–32, odstavec 2.4.
Podmíněná pravděpodobnost
V modulu 1.3 jsme zavedli pravděpodobnost náhodného jevu jako numerické ohodnocení možnosti nastoupení jevu při provádění určitého pokusu. Ovšem máme-li po provedení pokusu nějakou doplňující informaci o výsledku sledovaného pokusu, lze tuto informaci využít a pomocí ní přehodnotit toto numerické ohodnocení možnosti nastoupení sledovaného jevu za této doplňující informace. 1.6.1 Definice. (Podmíněná pravděpodobnost) Nechť P (A) je pravděpodobnost jevu A při daném systému podmínek. Připojíme-li k tomuto systému další podmínku, tj. nastoupení jevu B, hovoříme o podmíněné pravděpodobnosti jevu A za předpokladu, že nastal jev B. Tato podmíněná pravděpodobnost P (A|B) je dána vztahem P (A ∩ B) P (A|B) = , P (B) > 0. (1.3) P (B)
28
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Podobně podmíněná pravděpodobnost jevu B za podmínky jevu A je P (B|A) =
P (A ∩ B) , P (A)
P (A) > 0.
1.6.2 Poznámka. S využitím klasické definice pravděpodobnosti 1.4.1 lze podmíněnou pravděpodobnost vyjádřit ve tvaru P (A|B) =
k = m
k n m n
=
P (A ∩ B) , P (B)
kde k udává počet případů příznivých jevu A ∩ B, m udává počet případů příznivých jevu B a n udává počet všech možných případů (viz obrázek 1.3).
Obr. 1.3 Podmíněná pravděpodobnost P (A|B) vyjádřená pomocí klasické definice pravděpodobnosti
1.6.3 Příklad. Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li známo, že součet ok je dělitelný pěti? Řešení. Označme: A jev . . . „padly dvě pětkyÿ, B jev . . . „součet ok je dělitelný pětiÿ. Počet všech možných výsledků daného pokusu je V20 (6) = 62 = 36. Vyjádříme-li jevy B a A ∩ B pomocí elementárních jevů, tj. B = {[2, 3], [3, 2], [1, 4], [4, 1], [4, 6], [6, 4], [5, 5]}, 7 1 A ∩ B = {[5, 5]}, je zřejmé, že P (B) = 36 a P (A ∩ B) = 36 . Dosazením do (1.3) dostáváme hledanou pravděpodobnost P (A|B) =
P (A ∩ B) = P (B)
1 36 7 36
1 = . 7
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
1.7
29
Pravidlo o násobení pravděpodobností
V tomto modulu se budeme zabývat výpočtem pravděpodobnosti společného nastoupení (průniku) daných jevů. 1.7.1 Věta. (Věta o násobení pravděpodobností) a) Pro libovolné dva jevy A, B platí, že pravděpodobnost jejich společného nastoupení je rovna P (A ∩ B) = P (A) · P (B|A) = P (B) · P (A|B). b) Obecně pro s libovolných jevů A1 , A2 , . . . , As platí P (A1 ∩ A2 ∩ . . . ∩ As ) = P (A1 )P (A2 |A1 ) · · · P (As |A1 ∩ A2 ∩ . . . ∩ As−1 ). (1.4)
Důkaz. a) Plyne přímo z (1.3). b) Pro s libovolných jevů Ai ∈ Ω, i = 1, . . . , s lze tvrzení dokázat pomocí matematické indukce.
1.7.2 Příklad. Mezi 5 výrobky jsou 2 vadné. Náhodně vybereme (bez vracení) postupně 2 výrobky. Jaká je pravděpodobnost, že a) první vybraný výrobek je zmetek, b) oba vybrané výrobky jsou zmetky? Řešení. Nechť jev A1 resp. A2 značí vytažení zmetku v prvním resp. v druhém tahu. a) Užitím klasické definice pravděpodobnosti dostáváme přímo P (A1 ) =
2 = 0,4. 5
b) Protože jev A1 ∩A2 značí, že oba vytažené výrobky jsou zmetky, pak pomocí vztahu 1.3 obdržíme 2 1 P (A1 ∩ A2 ) = P (A1 )P (A2 |A1 ) = · = 0,1, 5 4 neboť po vytažení jednoho zmetku zůstanou 4 výrobky, z nichž je jeden zmetek, tedy P (A2 |A1 ) = 41 . 1.7.3 Poznámky. 1. Pokud nastoupení jevu A neovlivňuje pravděpodobnost nastoupení jevu B, tzn. P (B|A) = P (B), neovlivňuje ani nastoupení jevu B pravděpodobnost jevu A. O jevech A, B potom říkáme, že jsou nezávislé.
30
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2. Pro nezávislé jevy A, B se pravidlo pro výpočet pravděpodobnosti průniku zjednoduší P (A ∩ B) = P (A) · P (B). Daný vztah je zároveň také nutnou i postačující podmínkou nezávislosti jevů A, B. 1.7.4 Definice. Mějme množinu n ≥ 2 jevů Ai , i = 1, 2, . . . , n. U této množiny rozlišujeme nezávislost podvojnou (tzn. nezávislost každé dvojice jevů) a nezávislost vzájemnou. Jevy nazýváme vzájemně nezávislé (dále jen nezávislé), právě když pro libovolnou r prvkovou podmnožinu {Ai1 , . . . , Air } množiny {A1 , . . . , An } jevů, 2 ≤ ≤ r ≤ n, platí P (Ai1 ∩ . . . ∩ Air ) = P (Ai1 ) · · · P (Air ). (1.5) Jinak řečeno, vztah 1.5 musí platit pro všechny dvojice, trojice, atd. až samotnou n-tici náhodných jevů A1 , . . . , An . 1.7.5 Poznámka. V případě vzájemné nezávislosti jevů A1 , . . . , As se pravidlo o násobení pravděpodobností zjednoduší P (A1 ∩ A2 ∩ . . . ∩ As ) = P (A1 )P (A2 ) · · · P (As ).
(1.6)
1.7.6 Příklad. Z 8 koulí je 5 červených a 3 jsou modré. Určete pravděpodobnost, že 3 po sobě náhodně vybrané koule jsou červené (koule nevracíme zpět). Řešení. Označme jev Ai „vytažení červené koule v i-tém tahuÿ pro i = 1, 2, 3. Dále označme A jev „3 po sobě náhodně vybrané koule jsou červenéÿ. Zřejmě A = = A1 ∩ A2 ∩ A3 . Jevy Ai jsou závislé, platí tedy podle 1.4 P (A) = P (A1 ∩ A2 ∩ A3 ) = P (A1 )P (A2 |A1 )P (A3 |A1 ∩ A2 ). Ze zadání úlohy je zřejmé, že P (A1 ) = 85 . Jev A2 |A1 značí výběr červené koule v 2. tahu, za podmínky, že koule vybraná v 1. tahu byla také červená. Proto P (A2 |A1 ) = 74 . Jev A3 |A1 ∩ A2 značí výběr červené koule v 3. tahu, za podmínky, že koule vybraná v 1. a 2. tahu byla červená. Je tedy P (A3 |A1 ∩ A2 ) = 36 . Hledaná pravděpodobnost je potom 5 4 3 . P (A) = · · = 0,179. 8 7 6 1.7.7 Příklad. Dělník obsluhuje 3 stroje, které pracují nezávisle na sobě a mají různou poruchovost. Pravděpodobnost, že dojde během jedné hodiny k poruše na 1. stroji je 0,1; na 2. stroji 0,2; na 3. stroji 0,05. Jaká je pravděpodobnost, že během jedné hodiny nebude ani jeden stroj vyžadovat dělníkova zásahu? Řešení. Nechť jev Ai značí „během jedné hodiny dojde k poruše na i-tém strojiÿ pro i = 1, 2, 3. Dále označme A jev „během jedné hodiny nedojde k poruše na žádném strojiÿ. Zřejmě A = A1 ∩ A2 ∩ A3 . Pravděpodobnosti jevů Ai jsou P (A1 ) = 0,9; P (A2 ) = 0,8; P (A3 ) = 0,95.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
31
Z úlohy je zřejmé, že jevy A1 , A2 , A3 jsou nezávislé, a proto hledanou pravděpodobnost určíme dle (1.6) P (A) = P (A1 ∩ A2 ∩ A3 ) = P (A1 )P (A2 )P (A3 ) = 0,9 · 0,8 · 0,95 = 0,684.
1.7.8 Úkoly a problémy k modulu 1.6 a 1.7 1. V krabici je 21 zabalených skleniček, 15 má barevný potisk a 6 je bez potisku. Z krabice náhodně vybereme několik skleniček. Určete pravděpodobnost, že druhá vybraná sklenička má potisk, když první sklenička byla také s potiskem, za předpokladu, že jsme jí do krabice a) nevrátili, b) vrátili zpět. 2. Střelec má střílet do dvou částečně maskovaných cílů, do druhého však pouze tehdy, pokud zasáhne cíl první. Pravděpodobnost zásahu prvního cíle je 35 . Pravděpodobnost zásahu obou cílů při obou výstřelech je 52 . Jaká je pravděpodobnost zásahu druhého cíle? 3. První dělník vyrobí denně 60 výrobků, z toho 10 % zmetků. Druhý dělník vyrobí denně 40 výrobků, z toho 5 % zmetků. Jaká je pravděpodobnost, že náhodně vybraný výrobek z denní produkce je zmetek a pochází a) od prvního dělníka, b) od druhého dělníka? 4. Z urny v níž je a bílých a b černých koulí, vybereme postupně bez vracení dvě koule. Jaká je pravděpodobnost, že druhá koule je bílá za předpokladu, že první byla bílá? 5. Z pěti výrobků, mezi nimiž jsou 3 zmetky, vybíráme třikrát bez vracení po jednom výrobku. Označme A1 jev: „1. vybraný výrobek je kvalitníÿ, A2 jev: „2. vybraný výrobek je zmetekÿ, A3 jev: „3. vybraný výrobek je zmetekÿ. Vypočtěte pravděpodobnost společného nastoupení jevů A1 , A2 , A3 . 6. Z karetní hry o 32 kartách taháme postupně 11 krát po sobě bez vracení po jedné kartě. Jaká je pravděpodobnost, že eso bude taženo až v posledním tahu? 7. V urně jsou 4 černé a 4 bílé kuličky. Náhodně vybereme čtyřikrát po dvou kuličkách tak, že vybrané kuličky nebudeme vracet zpět do urny. Jaká je pravděpodobnost, že ve všech výběrech vytáhneme 1 černou a 1 bílou kuličku? 8. Řada v kinosále obsahuje 2n míst. Za předpokladu, že tuto řadu obsadí n mužů a n žen, jaká je pravděpodobnost, že žádné dvě osoby stejného pohlaví nebudou sedět vedle sebe? 9. Hodíme dvě hrací kostky. Značí-li A, B a C postupně jevy, že součet ok na obou kostkách je dělitelný dvěma, třemi a čtyřmi, prověřte párové nezávislosti těchto jevů a zjistěte, zda A, B, C jsou vzájemně nezávislé.
32
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
10. Hodíme dvě hrací kostky. Určete pravděpodobnosti v jednotlivých úlohách a rozhodněte, zda formulované jevy jsou nezávislé: a) na druhé kostce bude počet ok větší než 2, když na první kostce padla 2 oka, b) na obou kostkách bude součet větší než 6, když na první kostce padla 2 oka, c) na druhé kostce bude počet ok menší než 4, když na první kostce padl lichý počet ok, d) na obou kostkách bude součet větší než 9, když na první kostce padl sudý počet ok. 11. Máme dvě urny, ve kterých je po jedné bílé a jedné černé kuličce. Z každé urny náhodně vybereme jednu kuličku. Značí-li A jev ”z 1. urny vybereme bílou kuličku”, B jev ”ze 2. urny vybereme černou kuličku” a C jev ”z obou uren vybereme 2 kuličky stejné barvy”. Prověřte párové nezávislosti těchto jevů a zjistěte, zda A, B, C jsou vzájemně nezávislé. Řešení. 7 1. a) 10 ; b) 57 ; 2. 23 ; 3. a) 0,06; b) 0,02; a−1 ; 4. a+b−1 5. 0,2; 6. 0,03698; 7. 0,229; (n!)2 8. 2 · (2n)! ; 9. A, B jsou nezávislé; A, C a B, C nejsou nezávislé; A, B, C nejsou vzájemně nezávislé; 10. a) 2/3; ano b) 1/3; ne c) 1/2; ano d) 2/9; ne; 11. párově nezávislé ano; vzájemně nezávislé ne. Další úlohy na procvičování: [Budíková]: [Hebák]: [Kříž 1]: [Marek]:
1.8
str. str. str. str.
13–19, 15–37, 32–38, 45–57.
Pravidlo o sčítání pravděpodobností
Nyní se zaměříme na výpočet pravděpodobnosti nastoupení alespoň jednoho z daných jevů. 1.8.1 Věta. (Věta o sčítání pravděpodobností) a) Pro libovolné dva jevy A, B platí, že pravděpodobnost jejich sjednocení se rovná součtu pravděpodobností těchto jevů zmenšenému o pravděpodobnost jejich průniku, tj. P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
33
b) Obecně pro s libovolných jevů A1 , A2 , . . . , As platí P (A1 ∪ A2 ∪ . . . ∪ As ) =
s X
P (Ai ) −
i=1
+
s−1 X s X
P (Ai ∩ Aj ) +
i=1 j=i+1
s−2 X s−1 X s X
P (Ai ∩ Aj ∩ Ak ) + · · · +
(1.7)
i=1 j=i+1 k=j+1
+ (−1)s−1 P (A1 ∩ A2 ∩ . . . ∩ As ).
Důkaz. a) Uvažujme dva libovolné jevy A ∈ Ω a B ∈ Ω, potom jev A ∪ B lze vyjádřit jako sjednocení dvou neslučitelných jevů A a A ∩ B, tj. A ∪ B = A ∪ (A ∩ B). Podle axiomu 3 definice 1.3.1 platí P (A ∪ B) = P (A) + P (A ∩ B). Současně platí B = (A ∩ B) ∪ (A ∩ B) a (A ∩ B) ∩ (A ∩ B) = Ø, tedy P (B) = P (A ∩ B) + + P (A ∩ B). Protože P (A ∩ B) = P (B) − P (A ∩ B), dostaneme po úpravě P (A ∪ B) = P (A) + P (B) − P (A ∩ B). b) Pro s libovolných jevů Ai ∈ Ω, i = 1, . . . , s, postupujeme analogicky.
1.8.2 Poznámky. 1. Například pro s = 3 dostáváme podle (1.7) P (A1 ∪ A2 ∪ A3 ) = P (A1 ) + P (A2 ) + P (A3 ) − P (A1 ∩ A2 ) − P (A1 ∩ A3 ) − − P (A2 ∩ A3 ) + P (A1 ∩ A2 ∩ A3 ). 2. Výpočet pravděpodobnosti nastoupení alespoň jednoho z daných jevů lze zjednodušit v případě, že jevy A, B, resp. A1 , A2 , . . . , As , jsou neslučitelné: P (A ∪ B) = P (A) + P (B) resp. P (A1 ∪ A2 ∪ . . . ∪ As ) = P (A1 ) + P (A2 ) + · · · + P (As ).
(1.8)
1.8.3 Příklad. Jsou vrženy dvě hrací kostky. Jaká je pravděpodobnost, že alespoň na jedné z nich padne číslo 5? Řešení. Označme jevy: A . . . „na 1. kostce padne číslo 5ÿ, B . . . „na 2. kostce padne číslo 5ÿ.
34
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Za daného označení vyjádříme jev „alespoň na jedné z nich padne číslo 5ÿ jako A ∪ B. Podobně A ∩ B značí jev „na obou kostkách padne číslo 5ÿ. Dále víme, že P (A) = 16 , P (B) = 16 a protože jevy A a B jsou nezávislé, je P (A ∩ B) = P (A) · P (B) =
1 . 1 1 · = = 0,028. 6 6 36
Vzhledem k tomu, že jevy A, B jsou slučitelné, platí podle věty 1.8.1 P (A ∪ B) = P (A) + P (B) − P (A ∩ B) =
1 1 1 11 . + − = = 0, 305. 6 6 36 36
1.8.4 Příklad. Čtyři osoby si na věšák odložily 4 klobouky. Při odchodu si klobouky vybrali náhodně. Jaká je pravděpodobnost, že alespoň jedna osoba si vzala svůj klobouk? Řešení. Označme Ai jev „i-tá osoba si vzala svůj kloboukÿ pro i = 1, 2, 3, 4. Dále označme A jev „alespoň jedna osoba si vzala svůj kloboukÿ. Zřejmě A = A 1 ∪ A 2 ∪ A 3 ∪ A4 =
4 [
Ai .
i=1
Jevy Ai nejsou nezávislé, a proto využijeme vztahu (1.7). Užitím klasické definice pravděpodobnosti 1.4.1 určíme nejprve pravděpodobnost P (Ai ). Je zřejmé, že počet všech možností, kterými lze rozdělit 4 klobouky mezi 4 osoby je n = P (4) = 4!. Podobně počet možností příznivých jevu Ai (tj. i-tá osoba si vzala svůj klobouk a ostatní 3 osoby si klobouky rozeberou náhodně) je m = P (3) = 3!. Dosazením do (1.1) dostáváme P (Ai ) =
3! m = . n 4!
Analogicky určíme pravděpodobnosti 2! , 4! 1! P (Ai ∩ Aj ∪ Ak ) = , 4! 1 P (A1 ∩ A2 ∩ A3 ∩ A4 ) = . 4! P (Ai ∩ Aj ) =
Dosazením do (1.7) dostáváme hledanou pravděpodobnost P (A) =
4 X i=1
P (Ai ) −
3 4 X X i=1 j=i+1
P (Ai ∩ Aj ) +
2 3 4 X X X
P (Ai ∩ Aj ∩ Ak ) −
i=1 j=i+1 k=j+1
4 3! 4 2! 4 1 4 1 − P (A1 ∩ A2 ∩ A3 ∩ A4 ) = − + − = 1 4! 2 4! 3 4! 4 4! 15 = = 0,625. 24
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
35
1.8.5 Poznámka. Při výpočtu pravděpodobnosti nastoupení alespoň jednoho z jevů A1 , A2 , . . . , As jsme používali pravidlo o sčítání pravděpodobností (viz (1.7)). Ovšem v případě nezávislosti těchto jevů se situace výrazně zjednoduší, neboť pro nezávislé jevy A, B lze užitím de Morganova pravidla psát P (A ∪ B) = 1 − P (A ∪ B) = 1 − P (A ∩ B) = 1 − P (A)P (B). Podobně pro s nezávislých jevů A1 , A2 , . . . , As platí P (A1 ∪ A2 ∪ . . . ∪ As ) = 1 − P (A1 )P (A2 ) · · · P (As ).
(1.9)
1.8.6 Příklad. Střelec střílí třikrát nezávisle na sobě do terče. Pravděpodobnosti zásahu při prvním, druhém a třetím výstřelu jsou postupně 0,4, 0,5 a 0,7. Jaká je pravděpodobnost, že střelec zasáhne cíl a) právě jedenkrát, b) alespoň jedenkrát? Řešení. Označme uvedené jevy takto: Ai . . . „střelec zasáhne pří i-tém výstřelu cílÿ, i = 1, 2, 3, A . . . „střelec zasáhne cíl právě jedenkrátÿ, B . . . „střelec zasáhne cíl alespoň jedenkrátÿ. Jevy Ai jsou zřejmě nezávislé (skutečnost, že se střelec „zastřelujeÿ, je vyjádřena rostoucí pravděpodobností zásahu při dalších výstřelech). a) Jev A lze vyjádřit jako A = (A1 ∩ A2 ∩ A3 ) ∪ (A1 ∩ A2 ∩ A3 ) ∪ (A1 ∩ A2 ∩ A3 ), přičemž hledaná pravděpodobnost je vzhledem k nezávislosti jevů rovna P (A) = 0,4 · 0,5 · 0,3 + 0,6 · 0,5 · 0,3 + 0,6 · 0,5 · 0,7 = 0,36. b) Podobně jev B vyjádříme jako B = A1 ∪ A2 ∪ A 3 . Hledanou pravděpodobnost určíme vzhledem k nezávislosti užitím vztahu (1.9) P (B) = P (A1 ∪ A2 ∪ A3 ) = 1 − P A1 P A2 P A3 = 1 − 0,6 · 0,5 · 0,3 = 0,91.
1.8.7 Úkoly a problémy k modulu 1.8 1. V urně je 6 koulí s čísly 1, 2, . . . , 6. Koule vybíráme náhodně bez vracení. Jaká je pravděpodobnost, že alespoň při jednom tahu bude číslo koule shodné s pořadím tahu?
36
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2. Hodíme najednou 6 kostek. Jaká je pravděpodobnost, že každé z čísel 1, 2, . . . , 6 padne alespoň jedenkrát? 3. Pravděpodobnost, že investice přinese firmě zisk je 0,3. Jaká je pravděpodobnost, že se z šesti nezávislých investic firmě vyplatí alespoň jedna? 4. Pravděpodobnost, že semínko vyklíčí, je 32 . Zasejeme-li 6 semínek, jaká je pravděpodobnost, že alespoň jedno vyklíčí? 5. Při zásahu cíle se rozsvítí žárovka. Na cíl střílejí nezávisle na sobě 4 střelci, kteří zasáhnou cíl s pravděpodobnostmi 0,55, 0,42, 0,36 a 0,22. Každý střelec vystřelí jedenkrát. Jaká je pravděpodobnost, že se žárovka a) rozsvítí, b) nerozsvítí? 6. V dílně pracuje nezávisle na sobě 8 strojů. Pravděpodobnosti, že první, druhý, . . . , osmý stroj nebude potřebovat během směny opravu, jsou 0,80, 0,89, 0,84, 0,90, 0,85, 0,92, 0,86 a 0,95. Jaká je pravděpodobnost, že během směny a) ani jeden stroj nebude potřebovat opravu, b) alespoň jeden stroj bude potřebovat opravu, c) 1., 3. a 5. stroj budou potřebovat opravu, ostatní ne? Řešení. 1. 0,6319; 2. 0,0154; 3. 0,8824; 4. 728 ; 729 5. a) 0,870; b) 0,130; 6. a) 0,344; b) 0,656; c) 0,003. Další úlohy na procvičování: [Budíková]: [Kříž 1]:
1.9
str. 6–12, str. 32–38.
Úplná pravděpodobnost a Bayesův vzorec
V následujícím modulu se budeme nejprve zajímat o pravděpodobnost jevu A ⊆ Ω za předpokladu, že základní prostor Ω je specificky rozdělen na n podmnožin H1 , H2 , . . . , Hn (viz definice 1.9.1). V další části soustředíme za daných podmínek pozornost na výpočet podmíněných pravděpodobností P (Hi |A), i = 1, 2, . . . , n (viz věta 1.9.5). 1.9.1 Definice. Jevy H1 , H2 , . . . , Hn tvoří úplný systém neslučitelných jevů, jestliže jsou vzájemně neslučitelné a jejich sjednocení dává základní prostor elementárních jevů Ω.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
37
Obr. 1.4 Úplný systém neslučitelných jevů
1.9.2 Poznámky. 1. Pro jevy Hi tedy platí Hi ∩ Hj = Ø, i 6= j a
n S
Hi = H1 ∪ H2 ∪ . . . ∪ Hn = Ω.
i=1
2. Podle axiomu 3 definice 1.3.1 platí ! n n [ X P Hi = P (H1 ∪ H2 ∪ . . . ∪ Hn ) = P (H1 ) + P (H2 ) + · · · + P (Hn ) = P (Hi ) = 1. i=1
i=1
3. Dále se budeme zajímat o pravděpodobnost jevu A, když známe podmíněné pravděpodobnosti P (A|Hi ) a pravděpodobnosti P (Hi ), i = 1, 2, . . . , n. Vzhledem k tomu, že jevy H1 , H2 , . . . , Hn jsou neslučitelné, jsou neslučitelné také jevy A∩H1 , A∩H2 , . . . , A∩Hn a můžeme psát A = A ∩ Ω = (A ∩ H1 ) ∪ (A ∩ H2 ) ∪ . . . ∪ (A ∩ Hn ). Pravděpodobnost jevu A je potom ! n n n [ X X P (A) = P (A ∩ Hi ) = P (A ∩ Hi ) = P (Hi )P (A|Hi ). i=1
i=1
1.9.3 Věta. Vztah P (A) =
n X
P (Hi )P (A|Hi )
i=1
(1.10)
i=1
nazýváme formulí úplné pravděpodobnosti jevu A. Důkaz. Plyne přímo z věty 1.7.1 a předchozí poznámky 3.
1.9.4 Poznámka. Vztah (1.10) uplatníme tehdy, jestliže nastoupení jevu A je spojeno s nastoupením právě jednoho z jevů H1 , H2 , . . . , Hn , přičemž známe nepodmíněné
38
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
pravděpodobnosti P (Hi ) těchto jevů a podmíněné pravděpodobnosti P (A|Hi ) jevu A vzhledem k těmto jevům. 1.9.5 Věta. Víme-li, že výsledkem náhodného pokusu je jev A, můžeme stanovit také podmíněné pravděpodobnosti P (Hi |A) hypotéz Hi vzhledem k jevu A pomocí Bayesova vzorce P (Hi )P (A|Hi ) , P (Hi |A) = P n P (Hj )P (A|Hj )
i = 1, 2, . . . , n.
(1.11)
j=1
Důkaz. Vzorec (1.11) plyne přímo z 1.4 a 1.10.
1.9.6 Poznámka. Náhodné jevy Hi , které vystupují v Bayesově vzorci, se nazývají hypotézami jevu A a o jevech H1 , H2 , . . . , Hn říkáme, že tvoří úplný systém hypotéz jevu A. Na základě pokusu, jehož výsledkem je jev A, se má rozhodnout, která z hypotéz H1 , H2 , . . . , Hn platí. Rozhodnutí se provádí pomocí hodnot pravděpodobností P (Hi |A), které se nazývají aposteriorní pravděpodobnosti, protože se stanovují až po provedení pokusu a to pomocí (1.11). Proti tomu pravděpodobnosti P (Hi ) se nazývají apriorní, neboť se počítají ještě před provedením pokusu, jehož výsledkem je jev A. Bayesův vzorec tedy umožňuje výpočet aposteriorních pravděpodobností pomocí apriorních. 1.9.7 Příklad. Potřebu smrkových sazenic kryje lesní závod produkcí dvou školek. První školka kryje 75 % výsadby, přičemž ze 100 sazenic je 80 první jakosti. Druhá školka kryje výsadbu z 25 %, přičemž na 100 sazenic připadá 60 první jakosti. Jaká je pravděpodobnost, že náhodně vybraná sazenice je první jakosti? Řešení. Označme: A . . . „náhodně vybraná sazenice je první jakostiÿ, H1 . . . „náhodně vybraná sazenice je z produkce první školkyÿ, H2 . . . „náhodně vybraná sazenice je z produkce druhé školkyÿ. Potom P (H1 ) = 0,75,
P (A|H1 ) = 0,80,
P (H2 ) = 0,25,
P (A|H2 ) = 0,60,
z čehož plyne dle (1.10) P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = 0,75 · 0,80 + 0,25 · 0,60 = 0,75.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
39
1.9.8 Příklad. Součástka zapojená v televizoru může být od tří výrobců s pravděpodobnostmi 0,3, 0,5, 0,2. Pravděpodobnosti, že součástka od jednotlivých výrobců vydrží předepsaný počet hodin, jsou 0,2, 0,4, 0,3. a) Vypočtěte pravděpodobnost, že náhodně vybraná součástka vydrží předepsaný počet hodin. b) Za předpokladu, že součástka vydržela předepsaný počet hodin, vypočtěte, s jakými pravděpodobnostmi byla od jednotlivých výrobců. Řešení. A ... Hi ... A|Hi . . .
Označme jevy takto: „vybraná součástka vydrží předepsaný počet hodinÿ, „vybraná součástka je od i-tého výrobceÿ, i = 1, 2, 3, „vybraná součástka vydrží předepsaný počet hodin za podmínky, že je od i-tého výrobceÿ.
Ze zadání úlohy plyne P (H1 ) = 0,3,
P (H2 ) = 0,5,
P (H3 ) = 0,2.
Jevy Hi tvoří úplný systém neslučitelných jevů, neboť vybraná součástka je určitě od některého ze tří výrobců a to pouze od jednoho. Dále jsou známé pravděpodobnosti P (A|H1 ) = 0,2,
P (A|H2 ) = 0,4,
P (A|H3 ) = 0,3.
a) Pravděpodobnost jevu A určíme dle formule pro úplnou pravděpodobnost (viz (1.10)) P (A) =
3 X
P (Hi )P (A|Hi ) = 0,3 · 0,2 + 0,5 · 0,4 + 0,2 · 0,3 = 0,32.
i=1
b) Podmíněné pravděpodobnosti P (Hi |A), tj. že daná součástka je od i-tého výrobce za podmínky, že vydržela předepsaný počet hodin, určíme podle Bayesova vzorce (viz (1.11)) P (Hi )P (A|Hi ) P (Hi |A) = , i = 1, 2, 3. P (A) Tedy P (H1 |A) =
0,3 · 0,2 = 0,1875, 0,32
P (H2 |A) =
0,5 · 0,4 = 0,625, 0,32
P (H3 |A) =
0,2 · 0,3 = 0,1875. 0,32
Odtud tedy plyne, že součástka, která vydržela předepsaný počet hodin je s největší pravděpodobností od 2. výrobce.
40
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
1.9.9 Úkoly a problémy k modulu 1.9 1. V osudí je 5 černých a 15 bílých koulí. Z osudí se vytáhne jedna koule, vrátí se zpět, přidá se 20 koulí téže barvy, jakou měla vytažená koule, a tah se opakuje. Jaká je pravděpodobnost, že druhá vytažená koule bude černá? 2. Ve studijní skupině je 23 posluchačů. Pravděpodobnost složení zkoušky je pro 8 posluchačů 0,9, pro 12 posluchačů 0,6 a pro 3 posluchače 0,4. Určete pravděpodobnost, že náhodně zvolený posluchač tuto zkoušku složí. 3. Velkoobchod odebírá počítače od dvou dodavatelů. První dodavatel pokrývá odběr velkoobchodu z 80 %, přičemž 75 % dodávky tvoří počítače osazené procesorem Intel. Druhý dodavatel pokrývá odběr velkoobchodu ze zbývajících 20 %, přičemž 60 % dodávky tvoří počítače osazené procesorem Intel. Jaká je pravděpodobnost, že náhodně vybraný počítač a) bude osazen procesorem Intel, b) s procesorem Intel pochází od prvního, resp. druhého dodavatele? 4. Pojišťovací společnost rozlišuje při pojišťování tři skupiny řidičů, ozn. A, B, C. Pravděpodobnost toho, že řidič patřící do A bude mít během roku nehodu, je 0,03, zatímco u řidiče skupiny B je to 0,06 a u řidiče skupiny C 0,10. Podle dlouhodobých záznamů společnosti je 70 % pojistných smluv uzavřeno s řidiči skupiny A, 20 % s řidiči skupiny B a 10 % s řidiči skupiny C. Jestliže došlo k nehodě pojištěného řidiče, jaká je pravděpodobnost, že patří do skupiny a) A, b) B, c) C? 5. V četě je 25 vojáků, kteří jsou různě kvalitní střelci, 5 je výtečných, 11 je dobrých, 7 je průměrných a 2 jsou špatní střelci. Pravděpodobnosti zásahu cíle u těchto 4 skupin vojáků jsou 0,9, 0,7, 0,5 a 0,3. a) Jaká je pravděpodobnost, že náhodně vybraný voják zasáhne jedním výstřelem cíl? b) Vybraný voják cíl nezasáhl. Mezi jaké vojáky s největší pravděpodobností patří? Řešení. 1. 0,25; 2. 0,6783; 3. a) 0,72; b) 0,833 resp. 0,167; 4. a) 0,488; b) 0,279; c) 0,233; 5. a) 0,652; b) mezi průměrné. Další úlohy na procvičování: [Budíková]: [Hebák]: [Kříž 1]: [Marek]:
str. str. str. str.
13–19, 29–37, 38–41, 51–57.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
41
1.10 Shrnutí 1. kapitoly Klíčová slova: pokus, náhodný pokus, náhodný jev, pojem pravděpodobnosti, vlastnosti pravděpodobnosti, klasická a geometrická pravděpodobnost, podmíněná pravděpodobnost, pravidlo o násobení pravděpodobností, pravidlo o sčítání pravděpodobností, nezávislost jevů, úplný systém neslučitelných jevů, formule úplné pravděpodobnosti, Bayesův vzorec Základní úlohy: • Popis náhodných jevů pomocí množinových operací. • Výpočet pravděpopodobnosti pomocí klasické a geometrické definice pravděpodobnosti. • Výpočet pravděpopodobnosti nastoupení alespoň jednoho z jevů a pravděpodobnosti společného nastoupení jevů. • Ověření nezávislosti a výpočet pravděpodobnosti za předpokladu nezávislosti daných jevů. • Výpočet úplné a podmíněné pravděpodobnosti. Doporučená literatura pro hlubší studium: [Budíková]: [Cyhelský]: [Hindls]: [Karpíšek]:
str. str. str. str.
5–25, odstavce 2.1–2.3, 3.1, 3.2, 4.1, 4.2, 5.1, 5.2, 83–103, odstavce 5.1–5.4, 55–62, odstavce 3.1, 3.2, 30–50, odstavce 2.1–2.6.
1.11 Test ke kapitole 1 A. Teoretická část a) b) c) d) e) f) g)
Rozhodněte, která tvrzení jsou pravdivá: Jev nemožný Ø je elementárním jevem každého náhodného pokusu. Pro libovolné dva jevy A, B platí: A ∩ B = A ∩ B. Pro libovolné dva jevy A, B platí: A ∪ B = A ∩ B. Je-li pravděpodobnost daného jevu rovna 1, jedná se o jev jistý. Jsou-li jevy A, B neslučitelné, platí P (A ∪ B) = P (A) + P (B). Jsou-li jevy A, B nezávislé, platí P (A) · P (B) = P (B ∩ A). V případě, že jsou jevy A, B nezávislé, platí P (A|B) = P (B).
h) Tvoří-li jevy H1 , H2 , . . . , Hn úplný systém neslučitelných jevů, platí P ( i) Tvoří-li jevy H1 , H2 , . . . , Hn úplný systém neslučitelných jevů, platí
n P i=1
n T
Hi ) = 1.
i=1
P (Hi ) = 1.
42
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
B. Praktická část 1. Uvažujme následující jevy při hodu hrací kostkou: A . . . „padne sudé čísloÿ, B . . . „padne číslo větší než 2ÿ, C . . . „padne číslo dělitelné třemiÿ, D . . . „padne číslo 2 nebo 3ÿ. Určete význam následujících jevů: a) A ∪ B, C ∪ D, A ∪ C, B ∪ C, b) A ∩ D, B ∩ C, A ∩ B, C ∩ D, c) A − C, B − D. 2. V krabici je 10 šroubů s pravotočivým závitem a 5 s levotočivým závitem. Náhodně vybereme 3 šrouby. Jaká je pravděpodobnost, že a) všechny 3 šrouby budou mít pravotočivý závit, b) 1 šroub bude mít levotočivý závit, c) alespoň 1 šroub bude mít levotočivý závit? 3. Z osudí, ve kterém je 6 bílých a 4 černé koule, vybereme třikrát bez vracení po jedné kouli. Označme A1 jev: „1. vybraná koule je černáÿ, A2 jev: „2. vybraná koule je bíláÿ, A3 jev: „3. vybraná koule je černáÿ. Vypočtěte pravděpodobnost společného nastoupení jevů A1 , A2 , A3 . 4. Jevy A1 , A2 , A3 jsou nezávislé, P (A1 ) = 0,4, P (A2 ) = 0,4, P (A3 ) = 0,25. Vypočtěte pravděpodobnost nastoupení alespoň jednoho z jevů A1 , A2 , A3 . 5. Do obchodu s potravinami dodávají rohlíky stejného druhu 3 pekárny v počtech 500, 1000 a 1500 kusů denně. Zmetkovitost jejich dodávek je postupně 5%, 4% a 3%. Jejich dodávky jsou v obchodě smíchány do celkové zásoby. Určete pravděpodobnost, že a) náhodně vybraný rohlík z celkové zásoby je zmetek, b) tento rohlík (zmetek) byl dodán první pekárnou, c) tento rohlík (zmetek) byl dodán druhou pekárnou, d) tento rohlík (zmetek) byl dodán třetí pekárnou. Řešení. A. a) nepravda; b) nepravda; c) pravda; d) nepravda; e) pravda; f) pravda; g) nepravda; h) nepravda; i) pravda. B. 1. a) padne číslo větší než 1; padnou čísla 2 nebo 3 nebo 6; padne číslo menší než 6; nepadne číslo dělitelné třemi; b) padne číslo 2; padne číslo dělitelné třemi; padne číslo 3 nebo 5; padne číslo 1 nebo 4 nebo 5; c) padne sudé číslo menší než 5; padne číslo větší než 3; 2. a) 0,264; b) 0,495; c) 0,736; 3. 0,1; 4. 0,73; 5. a) 0,03667; b) 0,22727; c) 0,36364; d) 0,40909.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2
43
NÁHODNÁ VELIČINA
V předchozí kapitole jsem se seznámili s pojmy náhodný pokus, náhodný jev a pravděpodobnost náhodného jevu. Při řešení úloh z oblasti pravděpodobnosti nahrazujeme původní náhodné jevy určitými hodnotami proměnlivé veličiny, kterou nazveme náhodná veličina. V této kapitole se zaměříme právě na otázky spojené s náhodnými veličinami, na jejich popis pomocí funkcí (distribuční funkce, pravděpodobnostní funkce, funkce hustoty pravděpodobnosti) a číselných charakteristik (např. střední hodnota a rozptyl). Cílem kapitoly je: • zavést pojem náhodná veličina, • ukázat popis náhodné veličiny pomocí distribuční funkce, pravděpodobnostní funkce a funkce hustoty pravděpodobnosti, • definovat číselné charakteristiky náhodné veličiny.
2.1
Náhodná veličina
Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6, při zvážení zjistíme hmotnost bochníku chleba 805 g, při měření maximální rychlosti automobilu Škoda Fábia zjistíme hodnotu 181,3 km/h). Náhodnou veličinou budeme rozumět číselné ohodnocení výsledku náhodného pokusu.
2.1.1 Definice. Náhodná veličina je reálná funkce X(ω) definovaná na množině elementárních jevů Ω. Každému elementárnímu jevu ω z množiny elementárních jevů Ω přiřazuje právě jedno reálné číslo X(ω) = x. Obor hodnot veličiny X je množina M = {x; X(ω) = x}. Náhodné veličiny značíme velkými písmeny z konce abecedy X, Y, . . . (příp. X1 , X2 , . . . ) a jejich konkrétní realizace malými písmeny x, y, . . . . Pomocí náhodných veličin můžeme zavést náhodné jevy např. X = x0 , což znamená, že náhodná večina X nabývá hodnoty x0 , X ≤ x0 , znamenajicí, že náhodná veličina X nabývá hodnoty menší nebo rovné hodnotě x0 , zápisem x1 < X < x2 pak rozumíme jev, kdy náhodná veličina X nabývá hodnot z intervalu (x1 , x2 ) a podobně. Náhodnou veličinou je např. životnost výrobku, která může teoreticky nabýt jakékoli nezáporné hodnoty, doba čekání na obsluhu, u níž je rovněž M = {x; x > 0}, počet poruch na zařízení během 100 hodin provozu, kde M = {x; x = 0, 1, 2, 3, . . . }.
44
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Podle oboru hodnot M rozdělujeme náhodné veličiny na • nespojité (diskrétní) . . . M je konečná nebo spočetná množina, • spojité . . . M je uzavřený nebo otevřený interval.
2.1.2 Příklad. Diskrétní náhodná veličina: počet členů domácnosti (M = {1, 2, . . . }), počet poruch stroje během jedné pracovní směny (M = {0, 1, 2, . . . }), počet rozbitých lahví v zásilce 1000 lahví (M = {0, 1, 2, . . . , 1000}), počet narozených chlapců mezi 500 novorozeňaty (M = {0, 1, 2, . . . , 500}), apod. Spojitá náhodná veličina: hmotnost rohlíku (M = (0, ∞)), množství alkoholu v destilátu měřené v procentech (M = (0, 100)), hodnota elektrického napětí v rozvodné síti (M = h0, ∞)), doba čekání na vlak metra, který jezdí v pravidelných 10minutových intervalech (M = h0, 10)) apod. 2.1.3 Úkoly a problémy k modulu 2.1 1. Rozhodněte, zda se jedná o spojitou nebo diskrétní náhodnou veličinu a určete její obor hodnot. a) součet ok při hodu 3 hracími kostkami, b) čekání na tramvaj, která jezdí v pravidelných 5minutových intervalech, c) počet vyklíčených semen z 50 zasazených, d) počet zákazníků u benzínového čerpadla za den, e) výkon v běhu na 400 metrů, f) koncentrace prachu v ovzduší (v procentech). 2. Z oblasti vlastní profesní nebo zájmové činnosti stanovte diskrétní, případně spojité náhodné veličiny, jejichž obory jsou a) (0, ∞), b) 1, 2, . . . , c) h0, 30), d) 0, 1, 2, . . . , n, kde n je přirozené číslo. Řešení. 1. a) diskrétní M = {3, 4, 5, . . . , 18}; b) spojitá M = h0, 5); c) diskrétní M = = {0, 1, 2, . . . , 50}; d) diskrétní M = {0, 1, 2, . . . , }; e) spojitá M = (0, ∞); f) spojitá M = (0, 100). 2. a) např. výkon ve vrhu koulí; b) např. počet hodů kostkou, které je třeba provést, dokud nepadne šestka; c) např. doba čekání na autobus, který jezdí v pravidelných intervalech délky 30 minut; d) např. počet hodů, v nichž na minci padne líc, opakujeme-li hod n-krát.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2.2
45
Distribuční funkce náhodné veličiny
Pro úplný popis náhodné veličiny je nutné znát nejen množinu hodnot M , ale i pravděpodobnosti výskytu těchto hodnot (zákon rozdělení pravděpodobností náhodné veličiny). Zákon rozdělení pravděpodobností – pravidlo, které každé množině B hodnot náhodné veličiny přiřazuje pravděpodobnost, že náhodná veličina nabude hodnoty z množiny B. Popis náhodné veličiny provádíme nejčastěji pomocí funkcí a pomocí charakteristik. Budeme definovat • distribuční funkci F (x), • pravděpodobnostní funkci p(x), • funkci hustoty pravděpodobnosti f (x). Dále zavedeme • charakteristiky polohy, • charakteristiky variability, • charakteristiky koncentrace.
2.2.1 Definice. Distribuční funkce F (x) náhodné veličiny X přiřazuje každému reálnému číslu x pravděpodobnost, že náhodná veličina X nabude hodnoty menší nebo rovné číslu x, tedy F (x) = P (X ≤ x). Uvedeme některé důležité vlastnosti distribuční funkce F (x): 1. pro každé reálné číslo x platí 0 ≤ F (x) ≤ 1, 2. F (x) je neklesající, zprava spojitá funkce, 3. pro každou distribuční funkci platí lim F (x) = 0, lim F (x) = 1,
x→−∞
x→∞
pokud je obor možných hodnot M = {x; x ∈ (a, bi}, potom F (a) = 0 a F (b) = 1, 4. pro každá reálná čísla x1 a x2 platí P (x1 < X ≤ x2 ) = F (x2 ) − F (x1 ). Pomocí distribuční funkce se popisují diskrétní i spojité náhodné veličiny.
46
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2.3
Pravděpodobnostní funkce náhodné veličiny
Pro popis diskrétní (nespojité) náhodné veličiny se používá pravděpodobnostní funkce. 2.3.1 Definice. Pravděpodobnostní funkce p(x) náhodné veličiny X přiřazuje každému reálnému číslu x pravděpodobnost, že náhodná veličina nabude této hodnoty, tedy p(x) = P (X = x).
Zmíníme některé důležité vlastnosti pravděpodobnostní funkce p(x): 1. pro každé reálné číslo x platí 0 ≤ p(x) ≤ 1, 2. součet pravděpodobností přes celý obor hodnot náhodné veličiny je roven 1, tedy X
p(x) = 1,
x∈M
3. pro každé reálné číslo x platí F (x) = P (X ≤ x) =
X
p(xi ),
(2.1)
xi ≤x
4. pro každá 2 reálná čísla x1 a x2 (x1 ≤ x2 ) platí P (x1 ≤ X ≤ x2 ) =
x2 X
p(xi ).
xi =x1
Pravděpodobnostní funkci p(x) můžeme vyjádřit • tabulkou, x p(x)
x1 p(x1 )
x2 p(x2 )
... ...
xi p(xi )
... ...
P 1
• grafem [x, p(x)] (viz obr. 2.1), • matematickým vzorcem, např. p(x) =
π(1 − π)x pro x = 0, 1, 2, . . . , 0 jinak,
kde π je daná pravděpodobnost.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
47
Obr. 2.1 Graf pravděpodobnostní funkce
2.3.2 Příklad. Střelec má celkem 3 náboje a střílí na cíl až do prvního zásahu nebo dokud nevystřílí všechny náboje. Pravděpodobnost zásahu cíle při jednom výstřelu je 0,6. Náhodná veličina X představuje počet vystřelených nábojů. Popište tuto náhodnou veličinu pomocí pravděpodobnostní a distribuční funkce. Jaká je pravděpodobnost, že počet vystřelených nábojů nebude větší než 2? Řešení. Jedná se o diskrétní náhodnou veličinu, která může nabývat pouze hodnot 1, 2 nebo 3. Obor hodnot této náhodné veličiny je tedy M = {1, 2, 3}. Určíme nyní hodnoty pravděpodobnostní funkce: p(1) = P (X = 1) = 0,6, p(2) = P (X = 2) = 0,4 · 0,6 = 0,24, p(3) = P (X = 3) = 0,4 · 0,4 · 0,6 + 0,4 · 0,4 · 0,4 = 0,4 · 0,4 = 0,16. Hodnota pravděpodobnostní funkce v bodě 1 odpovídá tomu, že cíl je zasažen při 1. výstřelu, hodnota pravděpodobnostní funkce v bodě 2 odpovídá možnosti, že 1. střela je mimo, 2. výstřelem zasáhne cíl, hodnota v bodě 3 (byly použity všechny 3 náboje) odpovídá tomu, že cíl byl buď zasažen až 3. výstřelem, nebo nebyl zasažen vůbec. Výsledky shrneme do tabulky. P x 1 2 3 p(x) 0,6 0,24 0,16 1 Pravděpodobnostní funkci můžeme pomocí vzorce vyjádřit 0,6 · 0,4x−1 pro x = 1, 2, 0,42 x = 3, p(x) = 0 jinak. V případě diskrétní náhodné veličiny získáme hodnoty distribuční funkce pomocí vzorce (2.1). Určíme nyní některé hodnoty funkce F (x): F (0) = P (X ≤ 0) = 0, F (1) = P (X ≤ 1) = p(1) = 0,6,
48
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
F (1,5) = P (X ≤ 1,5) = P (X ≤ 1) = p(1) = 0,6, F (2) = P (X ≤ 2) = p(1) + p(2) = 0,84, F (3) = P (X ≤ 3) = p(1) + p(2) + p(3) = 1, F (4) = P (X ≤ 4) = p(1) + p(2) + p(3) = 1. Tyto výsledky můžeme shrnout do vzorce
0 pro x < 1, 0,6 1 ≤ x < 2, F (x) = 0,84 2 ≤ x < 3, 1 x ≥ 3. Lze je také vyjádřit tabulkou. x p(x) F (x)
1 0,6 0,6
2 0,24 0,84
3 0,16 1
P 1 —
Grafy pravděpodobnostní a distribuční funkce jsou zobrazeny na obr. 2.2.
Obr. 2.2 Pravděpodobnostní a distribuční funkce
Vypočítáme nyní pravděpodobnost, že počet vystřelených nábojů nebude větší než 2: P (X ≤ 2) = F (2) = P (X = 1) + P (X = 2) = p(1) + p(2) = 0,6 + 0,24 = 0,84.
2.3.3 Úkoly a problémy k modulu 2.3 1. Pravděpodobnostní funkce náhodné veličiny X nabývá hodnoty p(x) = 0,02 0,07 0,18 0,25 0,30 0,18 pro x = −1, 0, 1, 2, 3, 4 a p(x) = 0 jinak. a) Určete distribuční funkci. Nakreslete graf pravděpodobnostní a distribuční funkce. b) Vypočítejte pravděpodobnosti P (X < 3), P (X ≥ 0) a P (0 ≤ X < 4).
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
49
2. Pro distribuční funkci náhodné veličiny X platí 0 pro x < 0, 0 ≤ x < 1, 0,125 0,5 1 ≤ x < 2, F (x) = 0,875 2 ≤ x < 3, 1 x ≥ 3. a) Určete pravděpodobnostní funkci. Nakreslete graf pravděpodobnostní a distribuční funkce. b) Vypočítejte pravděpodobnosti P (X < 2), P (X ≥ 1) a P (1 ≤ X < 3). 3. Hráč hází třikrát kostkou. Nechť náhodná veličina X představuje počet hodů, při nichž padne šestka. a) Popište tuto náhodnou veličinu pomocí pravděpodobnostní a distribuční funkce, nakreslete jejich graf. b) Jaká je pravděpodobnost, že při 3 hodech kostkou padne šestka alespoň jedenkrát? 4. Střelec střílí 5krát na terč. Za každý zásah získá 3 body, nezasáhne-li cíl, ztrácí 1 bod. Pravděpodobnost zásahu při jednom výstřelu je 2/3. Určete zákon rozdělení počtu bodů, které může střelec získat (pravděpodobnostní funkci). 5. Je dána funkce
p(x) =
k · 0,4x pro x = 1, 2, 3, . . . , 0 jinak.
a) Stanovte konstantu k ∈ R tak, aby p(x) byla pravděpodobnostní funkcí diskrétní náhodné veličiny X. b) Vypočtěte pravděpodobnosti P (X < 4), P (X ≥ 5), P (−1 < X ≤ 2). Řešení. 1. a) 0 pro x < −1; 0,02 pro −1 ≤ x < 0; 0,09 pro 0 ≤ x < 1; 0,27 pro 1 ≤ x < 2; 0,52 pro 2 ≤ x < 3; 0,82 pro 3 ≤ x < 4; 1 pro x ≥ 4; b) 0,52; 0,98; 0,80; 2. a) 0,125 pro x = 0; 0,375 pro x = 1; 0,375 pro x = 2; 0,125 pro x = 3; 0 jinak; b) 0,5; 0,875; 0,75; 3. a) p(x): 125/216 pro x = 0, 25/72 pro x = 1, 5/72 pro x = 2 a 1/216 pro x = 3, 0 jinak; F (x): 0 pro x < 0, 125/216 pro 0 ≤ x < 1, 25/27 pro 1 ≤ x < 2, 215/216 pro 2 ≤ x < 3 a 1 pro x ≥ 3; b) 91/216; 4. p(x): 1/243 pro x = −5, 10/243 pro x = −1, 40/243 pro x = 3, 80/243 pro x = 7, 80/243 pro x = 11, 32/243 pro x = 15; 5. a) 3/2; b) 0,936; 0,0256; 0,84. Další úlohy na procvičování: [Kříž 1]:
str. 42–48, části úloh týkající se pravděpodobnostní a distribuční funkce a výpočtu pravděpodobností.
50
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2.4
Funkce hustoty pravděpobnosti náhodné veličiny
Vedle distribuční funkce je pro popis spojité náhodné veličiny používána funkce hustoty pravděpobnosti. 2.4.1 Definice. Funkce hustoty pravděpodobnosti spojité náhodné veličiny X je nezáporná funkce f (x) taková, že Zx f (t)dt, x ∈ R.
F (x) =
(2.2)
−∞
Funkce hustoty pravděpodobnosti f (x) má tyto vlastnosti: 1.
R∞
f (x)dx =
−∞
2. f (x) =
R
f (x)dx = 1,
M dF (x) dx
= F 0 (x), pro všechna x, kde derivace existuje,
3. P (x1 ≤ X ≤ x2 ) = P (x1 < X < x2 ) = P (x1 < X ≤ x2 ) = P (x1 ≤ X < x2 ) = Rx2 = F (x2 ) − F (x1 ) = f (x)dx. x1
Odtud plyne, že pro spojitou náhodnou veličinu je vždy P (X = x) = 0. Funkci f (x) můžeme například vyjádřit vzorcem 1 − x−2 e 5 pro x > 2, 5 f (x) = 0 x ≤ 2, jejíž graf je zachycen na obr. 2.3.
Obr. 2.3 Graf funkce hustoty pravděpodobnosti
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
51
2.4.2 Příklad. Náhodná veličina X má rozdělení popsané funkcí hustoty pravděpodobnosti 2 cx (1 − x) pro 0 < x < 1, f (x) = 0 jinak. Určete konstantu c tak, aby funkce f (x) byla funkcí hustoty pravděpodobnosti. Stanovte příslušnou distribuční funkci. Určete pravděpodobnost P (0,2 < X < 0,8). R Řešení. Pro funkci hustoty musí platit, že f (x)dx = 1. Určíme tedy integrál M
Z1
Z1
2
cx (1 − x)dx = c 0
x3 x4 − (x − x )dx = c 3 4 2
3
0
1 0
c 1 1 − = = 1, =c 3 4 12
odkud dostáváme c = 12. Vztah mezi distribuční funkcí a funkcí hustoty je dán rovnicí (2.2). Pro 0 < x < 1 platí Zx
2
Zx
12t (1 − t)dt = 12
F (x) = 0
t3 t4 (t − t ) = 12 − 3 4 2
0
F (x) =
3
x 0
x3 x4 = 12 − = 4x3 − 3x4 . 3 4
0 pro x ≤ 0, x3 (4 − 3x) 0 < x < 1, 1 jinak.
Obr. 2.4 Funkce hustoty pravděpodobnosti a distribuční funkce
Nejprve určíme pravděpodobnost P (0,2 < X < 0,8) pomocí funkce hustoty pravděpodobnosti Z0,8 0,8 P (0,2 < X < 0,8) = 12x2 (1 − x)dx = 4x3 − 3x4 0,2 = 0,792. 0,2
52
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Známe-li distribuční funkci, je výpočet snadnější P (0,2 < X < 0,8) = F (0,8) − F (0,2) = 0,83 (4 − 3 · 0,8) − 0,23 (4 − 3 · 0,2) = 0,792. 2.4.3 Příklad. Náhodná veličina X má rozdělení popsané distribuční funkcí 0 pro x ≤ 0, F (x) = −x 1−e x > 0. Určete funkci hustoty pravděpodobnosti. Řešení. Pro funkci hustoty pravděpodobnosti platí f (x) = d (1 − e−x ) = e−x dostáváme dx f (x) =
0 −x
e
dF (x) . dx
Pomocí derivací
pro x ≤ 0, x > 0.
2.4.4 Úkoly a problémy k modulu 2.4 1. Náhodná veličina X má distribuční funkci x ≤ 1, 0 pro x−1 1 < x < 5, F (x) = 4 1 x ≥ 5. a) Určete funkci hustoty pravděpodobnosti a obě funkce zobrazte graficky. b) Určete pravděpodobnosti P (X < 3), P (2 ≤ X < 4), P (0 < X < 2) a P (X = 3). 2. Rozdělení náhodné veličiny X je dáno funkcí hustoty pravděpodobnosti c − 2x pro 0 < x < 1, f (x) = 0 jinak. a) Určete konstantu c a nakreslete graf funkce f (x). b) Určete distribuční funkci a nakresle její graf. c) Spočítejte pravděpodobnosti P (X ≥ 0,5) a P (0 < X ≤ 0,75). 3. Je dána funkce hustoty f (x) =
c x4
0
pro x > 1, jinak.
a) Určete konstantu c a nakreslete graf funkce f (x). b) Určete distribuční funkci a nakresle její graf. c) Spočítejte pravděpodobnosti P (X ≥ 2), P (X > 1,5) a P (2 < X ≤ 3).
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
53
4. Distribuční funkce Rayleighova rozdělení spojité náhodné veličiny má tvar ( F (x) =
x2
C − e− 2σ2 0
pro x > 0, x ≤ 0.
Určete konstantu C ∈ R a funkci hustoty pravděpodobnosti f (x). 5. Náhodná veličina X má rozdělení popsané distribuční funkcí F (x) =
1 − e− 0
x−1 2
pro x > 1, x ≤ 1.
a) Určete funkci hustoty této náhodné veličiny a zobrazte ji graficky. b) Vypočítejte pravděpodobnosti P (X < 2), P (1 < X < 3), P (x > 4).
Řešení. 1. a) f (x): 1/4 pro 1 < x < 5, 0 jinak; b) 0,5; 0,5; 0,25; 0; 2. a) c = 2; b) F (x): 0 pro x ≤ 0, 2x − x2 pro 0 < x < 1, 1 pro x ≥ 1; c) 0,25; 0,9375; 3. a) c = 3; b) F (x): 0 pro x ≤ 1, 1 − 1/x3 pro x > 1; c) 0,125; 0,296; 0,088; x2
4. C = 1, f (x): 0 pro x ≤ 0, σx2 e− 2σ2 pro x > 0; x−1 5. a) f (x): 12 e− 2 pro x > 1, 0 pro x ≤ 1; b) 0,393; 0,632; 0,223. Další úlohy na procvičování: [Kříž 1]:
2.5
str. 50–56, části úloh týkající se funkce hustoty pravděpodobnosti, distribuční funkce a výpočtu pravděpodobností.
Charakteristiky polohy
Distribuční funkce (resp. pravděpodobnostní funkce nebo funkce hustoty pravděpodobnosti) podává o náhodné veličině úplnou informaci. Známe-li tuto funkci, víme, jakých hodnot může tato náhodná veličina nabývat a jaké jsou pravděpodobnosti odpovídající těmto hodnotám. V praxi je užitečné znát nějaké koncentrovanější a přehlednější vyjádření této informace. K takovému popisu se používají číselné hodnoty označované jako číselné charakteristiky. Budeme mluvit o charakteristikách polohy, variability a koncentrace. Nejdůležitějšími charakteristikami polohy jsou střední hodnota, kvantily (medián, horní a dolní kvartil, . . . ) a modus.
54
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2.5.1 Definice. Střední hodnota E(X) náhodné veličiny X (někdy označována jako µ) představuje číslo, které charakterizuje polohu hodnot náhodné veličiny na číselné ose s ohledem na jejich pravděpodobnosti. V případě diskrétní náhodné veličiny je definována vztahem X E(X) = xi p(xi ), (2.3) M
pro spojitou náhodnou veličinu vztahem Z E(X) =
xf (x)dx
(2.4)
M
za předpokladu, že uvedená řada resp. integrál konverguje absolutně. Střední hodnota je také v literatuře označována jako očekávaná hodnota. Uvedeme nyní stručně některé vlastnosti střední hodnoty: 1. střední hodnota konstanty k je rovna této konstantě E(k) = k, 2. střední hodnota součinu konstanty k a náhodné veličiny X je rovna součinu konstanty k a střední hodnoty náhodné veličiny X E(kX) = kE(X),
(2.5)
3. střední hodnota součtu náhodných veličin X1 , X2 , . . . , Xn je rovna součtu středních hodnot těchto veličin E(X1 + X2 + · · · + Xn ) = E(X1 ) + E(X2 ) + · · · + E(Xn ),
(2.6)
4. jsou-li náhodné veličiny X1 , X2 , . . . , Xn nezávislé (viz poznámka 2.5.2), pak střední hodnota jejich součinu je rovna součinu jejich středních hodnot E(X1 X2 · · · Xn ) = E(X1 ) · E(X2 ) · · · E(Xn ). 2.5.2 Poznámka k nezávislosti náhodých veličin. Náhodné veličiny X1 , X2 , . . . , Xn jsou nezávislé právě tehdy, když pro libovolná čísla x1 , x2 , . . . , xn ∈ R platí P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn ) = P (X1 ≤ x1 ) · P (X2 ≤ x2 ) · · · P (Xn ≤ xn ). Mějme náhodný vektor X = (X1 , X2 , . . . , Xn ), jehož složky X1 , X2 , . . . , Xn jsou náhodné veličiny. Nechť F (x) = F (x1 , x2 , . . . , xn ) = P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn ) je sdružená distribuční funkce a F (x1 ), F (x2 ), . . . , F (xn ) jsou distribuční funkce náhodných veličin X1 , X2 , . . . , Xn . Náhodné veličiny X1 , X2 , . . . , Xn jsou nezávislé právě tehdy, když F (x1 , x2 , . . . , xn ) = F (x1 ) · F (x2 ) · · · F (xn ).
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
55
Je-li X náhodný vektor, jehož složky jsou diskrétní náhodné veličiny, funkce p(x) = = p(x1 , x2 , . . . , xn ) = P (X1 = x1 , X2 = x2 , . . . , Xn = xn ) je sdružená pravděpodobnostní funkce a p(x1 ), p(x2 ), . . . , p(xn ) jsou pravděpodobnostní funkce náhodných veličin X1 , X2 , . . . , Xn , pak platí: Náhodné veličiny X1 , X2 , . . . , Xn jsou nezávislé právě tehdy, když p(x1 , x2 , . . . , xn ) = p(x1 ) · p(x2 ) · · · p(xn ). Je-li X náhodný vektor, jehož složky jsou spojité náhodné veličiny, funkce f (x) = = f (x1 , x2 , . . . , xn ) je sdružená funkce hustoty pravděpodobnosti a f (x1 ), f (x2 ), . . . , f (xn ) jsou funkce hustoty pravděpodobnosti náhodných veličin X1 , X2 , . . . , Xn , pak platí: Náhodné veličiny X1 , X2 , . . . , Xn jsou nezávislé právě tehdy, když f (x1 , x2 , . . . , xn ) = f (x1 ) · f (x2 ) · · · f (xn ).
2.5.3 Definice. 100P% kvantil xP náhodné veličiny s rostoucí distribuční funkcí F (x) je taková hodnota náhodné veličiny, pro kterou platí P (X ≤ xP ) = F (xP ) = P,
0 < P < 1.
Obr. 2.5 Kvantil xP
Kvantil x0,50 se nazývá medián Me(X), platí tedy P (X ≤ Me(X)) = P (X ≥ ≥ Me(X)) = 0,50. Kvantil x0,25 se nazývá dolní kvartil, kvantil x0,75 je horní kvartil. Vybrané kvantily důležitých rozdělení jsou tabelovány. 2.5.4 Definice. Modus Mo(X) náhodné veličiny X je hodnota této veličiny s největší pravděpodobností (pro diskrétní náh. veličinu), resp. hodnota, ve které má funkce f (x) maximum (pro spojitou náh. veličinu). Náhodná veličina může mít 2 i více modů.
56
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2.5.5 Příklad. Určete střední hodnotu a modus vystřelených nábojů (viz příklad 2.3.2), je-li 0,6 · 0,4x−1 pro 0,42 p(x) = 0
náhodné veličiny udávající počet x = 1, 2, x = 3, jinak.
Řešení. Střední hodnota je pro diskréní náhodnou veličinu dána vztahem (2.3), můžeme tedy psát E(X) =
3 X
xi p(xi ) = 1 · 0,6 · 0,40 + 2 · 0,6 · 0,41 + 3 · 0,42 = 1,56.
i=1
Modus určuje hodnotu náhodné veličiny s největší pravděpodobností, což je v našem případě Mo(X) = 1, neboť největší hodnota pravděpodobnostní funkce je p(1) = 0,6. Prakticky lze výsledky interpretovat takto: střední hodnota 1,56 představuje „průměrnýÿ počet vystřelených nábojů, pokud budeme daný pokus neustále opakovat; modus 1 vyjadřuje skutečnost, že nejčastěji bude vystřelen 1 náboj. 2.5.6 Příklad. Náhodná veličina X má rozdělení popsané funkcí hustoty pravděpodobnosti (viz příklad 2.4.2) 12x2 (1 − x) pro 0 < x < 1, f (x) = 0 jinak. Určete střední hodnotu a modus této náhodné veličiny. Řešení. Střední hodnota je pro spojitou náhodnou veličinu dána vztahem (2.4), můžeme tedy psát Z1 E(X) =
Z1 xf (x)dx =
0
x4 x5 x · 12x (1 − x)dx = 12 − 4 5
2
0
1 = 0
3 = 0,6. 5
Modus u spojité náhodné veličiny určuje maximum funkce hustoty pravděpodobnosti. d [12x2 (1 − x)] = Budeme hledat maximum funkce f (x) na intervalu (0, 1), řešíme dx 2 = 12(2x − 3x ) = 0, odkud x(2 − 3x) = 0, tedy x = 0 nebo x = 2/3. Funkce hustoty pravděpodobnosti nabývá svého maxima v bodě x = 2/3 (viz graf f (x) na obr. 2.4), proto má modus hodnotu Mo(X) = 2/3. 2.5.7 Příklad. Určete medián, horní a dolní kvartil náhodné veličiny X s distribuční funkcí 1 − x13 pro x > 1, F (x) = 0 x ≤ 1. Řešení. Pro kvantil náhodné veličiny X platí F (xP ) = P . V našem případě 1−
1 = P, x3P
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
57
odkud dostáváme
1 . 1−P Dosazováním do daného vzorce získáme kvantily: 1 . medián x0,50 = √ = 1,260, 3 1 − 0,50 1 . dolní kvartil x0,25 = √ = 1,101, 3 1 − 0,25 1 . = 1,587. horní kvartil x0,75 = √ 3 1 − 0,75 xP = √ 3
Tomu lze rozumět takto: x0,50 = 1,260 je hodnota náhodné veličiny X, pro kterou platí P (X ≤ 1,260) = 0,50, tedy že náhodná veličina X s 50% pravděpodobností nepřekročí hodnotu 1,260; analogicky x0,25 nebo x0,75 . 2.5.8 Úkoly a problémy k modulu 2.5 1. Určete střední hodnotu a modus náhodné veličiny X s pravděpodobnostní funkcí danou tabulkou: x p(x)
−1 0,02
0 0,07
1 0,18
2 0,25
3 0,30
4 0,18
2. Vypočítejte střední hodnotu náhodné veličiny udávající počet ok padnutých při 1 hodu hrací kostkou. 3. Pravděpodobnost zásahu cíle při každém ze 4 výstřelů je 0,8. Určete střední hodnotu a modus náhodné veličiny udávající počet zásahů cíle. 4. Určete střední hodnotu, medián, a horní decil (kvantil x0,90 ) náhodné veličiny s funkcí hustoty pravděpodobnosti 2 3x pro 0 < x < 1, f (x) = 0 jinak. 5. Vypočítejte střední hodnotu, medián, a horní kvartil (kvantil x0,75 ) náhodné veličiny s distribuční funkcí x ≤ 0, 0 pro 2 x 0 < x < 1, F (x) = 1 x ≥ 1. 6. Určete střední hodnotu, medián a modus náhodné veličiny s funkcí hustoty pravděpodobnosti 3 (1 − x2 ) pro −1 < x < 1, 4 f (x) = 0 jinak.
58
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Řešení. 1. 2,28; 3; 2. 3,5; 3. 3,2; 3 a 4; 4. 0,75; 0,794; 0,965; 5. 0,667; 0,707; 0,866; 6. 0; 0; 0. Další úlohy na procvičování: [Kříž 1]: [Kříž 1]:
2.6
str. 42–48, části úloh týkající se výpočtu charakteristik polohy, str. 50–56, části úloh týkající se výpočtu charakteristik polohy.
Charakteristiky variability
Základní a nejpoužívanější charakteristiky variability jsou rozptyl a směrodatná odchylka. 2.6.1 Definice. Rozptyl D(X) náhodné veličiny X (někdy označovaný jako σ 2 ) je obecně definován vztahem D(X) = E [X − E(X)]2 . V případě disktrétní náhodné veličiny určíme rozptyl ze vztahu X D(X) = [xi − E(X)]2 p(xi ), M
pro spojitou náhodnou veličinu Z D(X) =
[x − E(X)]2 f (x)dx.
M
Rozptyl je číslo, které charakterizuje proměnlivost hodnot náhodné veličiny kolem její střední hodnoty s přihlédnutím k jejich pravděpodobnostem. Uveďme nejdůležitější vlastnosti rozptylu: 1. rozptyl konstanty k je roven nule D(k) = 0, 2. rozptyl součinu konstanty a náhodné veličiny X je roven součinu konstanty k 2 a rozptylu náhodné veličiny X D(kX) = k 2 D(X),
(2.7)
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
59
3. rozptyl součtu nezávislých náhodných veličin X1 , X2 , . . . , Xn je roven součtu rozptylů těchto náhodných veličin D(X1 + X2 + · · · + Xn ) = D(X1 ) + D(X2 ) + · · · + D(Xn ),
(2.8)
4. D(X) ≥ 0 pro každou náhodnou veličinu, 5. rozptyl náhodné veličiny X je možné spočítat pomocí tzv. výpočetního tvaru D(X) = E(X 2 ) − E(X)2 , neboť D(X) = E[X − E(X)]2 = E[X 2 − 2XE(X) + E(X)2 ] = E(X 2 ) − − E[2XE(X)] + E[E(X)2 ] = E(X 2 ) − 2E(X)E(X) + E(X)2 = E(X 2 ) − E(X)2 . Výpočetní tvar rozptylu pro diskrétní náhodnou veličinu je potom X D(X) = x2i p(xi ) − E(X)2 , M
pro spojitou náhodnou veličinu užijeme Z D(X) = x2 f (x)dx − E(X)2 . M
2.6.2 Definice. Směrodatná odchylka σ(X) náhodné veličiny X (někdy označovaná jako σ) je definována jako odmocnina z rozptylu p σ(X) = D(X).
Čím větší je rozptyl (směrodatná odchylka), tím horší vypovídající schopnost o vlastnostech náhodné veličiny má její střední hodnota. Směrodatná odchylka je vyjádřena ve stejných jednotkách jako náhodná veličina X, rozptyl je ve čtvercích jednotek.
Obr. 2.6 Vzájemný vztah mezi střední hodnotou a rozptylem
60
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2.6.3 Příklad. Určete rozptyl a směrodatnou odchylku náhodné veličiny udávající počet vystřelených nábojů (viz příklad 2.3.2). Řešení. Střední hodnotu této náhodné veličiny jsme spočítali v příkladě 2.5.5, má hodnotu E(X) = 1,56. Pro výpočet rozptylu použijeme výpočetní tvar D(X) = E(X 2 ) − − E(X)2 , musíme nejprve určit hodnotu E(X 2 ) =
X
x2i p(xi ) =
3 X
x2i p(xi ) = 12 · 0,6 + 22 · 0,24 + 32 · 0,16 = 3,
i=1
M
potom D(X) = E(X 2 ) − E(X)2 = 3 − 1,562 = 0,5664. Směrodatná odchylka je odmocnina z rozptylu p . σ(X) = D(X) = 0,753. 2.6.4 Příklad. Určete rozptyl a směrodatnou odchylku náhodné veličiny X z příkladu 2.4.2). Řešení. Střední hodnota této náhodné veličiny byla určena v příkladě 2.5.6, má hodnotu E(X) = 3/5. Podobně jako v předcházejícím příkladě použijeme výpočetní tvar rozptylu D(X) = E(X 2 ) − E(X)2 , tedy 2
Z
E(X ) =
Z1
2
x f (x)dx =
x5 x6 − x · 12x (1 − x)dx = 12 5 6 2
2
1
0
M
= 0
2 = 0,4, 5
potom 2 3 1 = = 0,04. 5 25
2 D(X) = − 5 Směrodatná odchylka je rovna σ(X) =
p
D(X) =
1 = 0,2. 5
2.6.5 Úkoly a problémy k modulu 2.6 Při řešení následujících úloh využijte výsledky odpovídajících úloh z 2.5.8. 1. Určete rozptyl a směrodatnou odchylku náhodné veličiny X s pravděpodobnostní funkcí danou tabulkou (viz 2.3.3 příklad 1): x p(x)
−1 0,02
0 0,07
1 0,18
2 0,25
3 0,30
4 0,18
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
61
2. Vypočítejte rozptyl a směrodatnou odchylku náhodné veličiny udávající počet ok padnutých při 1 hodu hrací kostkou. 3. Pravděpodobnost zásahu cíle při každém ze 4 výstřelů je 0,8. Určete rozptyl a směrodatnou odchylku náhodné veličiny udávající počet zásahů cíle. 4. Určete rozptyl a směrodatnou odchylku náhodné veličiny s funkcí hustoty pravděpodobnosti 2 3x pro 0 < x < 1, f (x) = 0 jinak. 5. Vypočítejte rozptyl a směrodatnou odchylku náhodné veličiny s distribuční funkcí x ≤ 0, 0 pro x2 0 < x < 1, F (x) = 1 x ≥ 1. 6. Určete rozptyl a směrodatnou odchylku náhodné veličiny s funkcí hustoty pravděpodobnosti 3 (1 − x2 ) pro −1 < x < 1, 4 f (x) = 0 jinak.
Řešení. 1. 1,582; 1,258; 2. 2,917; 1,708; 3. 0,64; 0,8; 4. 0,038; 0,194; 5. 0,056; 0,236; 6. 0,2; 0,447. Další úlohy na procvičování:
[Kříž 1]: [Kříž 1]:
2.7
str. 42–48, části úloh týkající se výpočtu charakteristik variablity, str. 50–56, části úloh týkající se výpočtu charakteristik variablity.
Charakteristiky koncentrace
Nyní se budeme zabývat charakteristikami popisujícími tvar rozdělení, především symetrii a špičatost. Tyto charakteristiky jsou definovány pomocí momentů.
62
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2.7.1 Definice. Obecný moment r-tého stupně µ0r (X) náhodné veličiny X je definován vztahem µ0r (X) = E(X r ) pro r = 1, 2, . . . . V případě disktrétní náhodné veličiny jej určíme ze vztahu X µ0r (X) = xri p(xi ), M
pro spojitou náhodnou veličinu potom platí Z 0 µr (X) = xr f (x)dx. M
2.7.2 Definice. Centrální moment r-tého stupně µr (X) náhodné veličiny X je definován vztahem µr (X) = E[X − E(X)]r
pro r = 1, 2, . . . .
V případě disktrétní náhodné veličiny jej určíme ze vztahu X µr (X) = [xi − E(X)]r p(xi ), M
pro spojitou náhodnou veličinu potom platí Z µr (X) = [x − E(X)]r f (x)dx. M
Z daných definic je zřejmé, že střední hodnota je 1. obecný moment, rozptyl je 2. centrální moment. Při výpočtu centrálních momentů 3. a 4. stupně je často výhodnější použít vzorce (viz [Anděl]) µ3 (X) = E(X 3 ) − 3E(X 2 )E(X) + 2E(X)3 , µ4 (X) = E(X 4 ) − 4E(X 3 )E(X) + 6E(X 2 )E(X)2 − 3E(X)4 .
2.7.3 Definice. Koeficient šikmosti α3 (X) je definován vztahem α3 (X) =
µ3 (X) . σ(X)3
(2.9) (2.10)
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
63
Podle hodnot koeficientu šikmosti můžeme poznat, zda je rozdělení symetrické nebo je zešikmené. Je-li • α3 (X) = 0, je rozdělení symetrické, • α3 (X) < 0, je rozdělení zešikmené doprava, tj. protáhlejší směrem nalevo, • α3 (X) > 0, je rozdělení zešikmené doleva, tj. protáhlejší směrem napravo.
2.7.4 Definice. Koeficient špičatosti α4 (X) je definován vztahem α4 (X) =
µ4 (X) − 3. σ(X)4
Podle hodnot koeficientu špičatosti můžeme poznat, zda je rozdělení ploché nebo špičaté. Má-li veličina X symetrické rozdělení a je-li α4 (X) > 0 (resp. α4 (X) < 0), znamená to, že na svých koncích je pravděpodobnostní funkce p(x) nebo hustota pravděpodobnosti f (x) této veličiny X větší (resp. menší) než hustota pravděpodobnosti normálního rozdělení (viz 4.3) se stejnou střední hodnotou a rozptylem. Pro normální rozdělení je α4 (X) rovno nule. Koeficient špičatosti se používá i pro nesymetrická rozdělení. 2.7.5 Poznámka. Pro zjednodušení zápisu budeme dále místo σ(X), µ3 (X), µ4 (X), α3 (X) a α4 (X) psát σ, µ3 , µ4 , α3 a α4 .
Obr. 2.7 Význam koeficientů šikmosti a špičatosti
2.7.6 Příklad. Vypočitejte koeficient šikmosti a špičatosti náhodné veličiny udávající počet vystřelených nábojů (viz příklad 2.3.2). Řešení. K výpočtu koeficientu šikmosti a špičatosti je třeba nejprve určit 3. a 4. centrální moment. Střední hodnotu této náhodné veličiny jsme spočítali v příkladě
64
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2.5.5, má hodnotu E(X) = 1,56, směrodatná odchylka je σ = 0,753 (viz příklad 2.6.3). µ3 =
3 X
. [xi −E(X)]3 p(xi ) = (1−1,56)3 ·0,6+(2−1,56)3 ·0,24+(3−1,56)3 ·0,16 = 0,393
i=1
µ4 =
3 X
. [xi −E(X)]4 p(xi ) = (1−1,56)4 ·0,6+(2−1,56)4 ·0,24+(3−1,56)4 ·0,16 = 0,756
i=1
Je možné pro výpočet také použít vztahů (2.9) a (2.10). Koeficient šikmosti je potom roven µ3 . α3 = 3 = 0,922, σ Koeficient špičatosti µ4 . α4 = 4 − 3 = −0,644. σ Můžeme tedy říci, že rozdělení náhodné veličiny je zešikmeno doleva a je plošší než normální rozdělení. Uvedené výpočty jsou provedené s plnou přesností, nepoužívá se zaokrouhlení. Použité hodnoty jsou µ3 = 0,392832, µ4 = 0,75597312 a σ = 0,7525955 . . . . 2.7.7 Příklad. Určete koeficient šikmosti a špičatosti náhodné veličiny X z příkladu 2.4.2. Řešení. Střední hodnota této náhodné veličiny byla určena v příkladě 2.5.6, má hodnotu E(X) = 3/5. Směrodatnou odchylku jsme spočítali v příkladu 2.6.4 a je rovna 1/5. Určíme nejprve potřebné centrální momenty. Z1 µ3 =
[x − 0,6]3 12x2 (1 − x)dx = · · · = −
2 , 875
0
Z1 µ4 =
[x − 0,6]4 12x2 (1 − x)dx = · · · =
33 . 8750
0
Pro výpočet momentů můžeme použít vzorce (2.9) a (2.10). Z dřívějších výpočtů víme, že E(X 2 ) = 52 . Určíme tedy obecné momenty E(X 3 ) a E(X 4 ): 3
Z1
2
x · 12x (1 − x)dx = 12
E(X ) =
4
3
Z1
0
0
Z1
Z1
4
2
x · 12x (1 − x)dx = 12
E(X ) = 0
0
x6 x7 (x − x )dx = 12 − 6 7 5
6
x7 x8 (x − x )dx = 12 − 7 8 6
7
1 0
2 = , 7
1 = 0
3 . 14
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
65
Pomocí zmiňovaných vzorců obdržíme 2 2 3 µ3 = − 3 · · + 2 · 7 5 5 2 3 2 3 −4· · +6· · µ4 = 14 7 5 5
3 3 2 =− , 5 875
2 4 3 3 33 −3· = . 5 5 8750
Koeficient šikmosti je potom roven α3 =
µ3 2 . = − = −0,286, 3 σ 7
koeficient špičatosti µ4 9 . − 3 = − = −0,643. 4 σ 14 Rozdělení náhodné veličiny je zešikmeno doprava, na svých koncích je hustota pravděpodobnosti menší než hustota pravděpodobnosti náhodné veličiny s normálním rozdělením se stejnou střední hodnotou a směrodatnou odchylkou jako má veličina X (funkce hustoty pravděpodobnosti náhodné veličiny X je nulová pro x 6∈ (0, 1)). α4 =
2.7.8 Úkoly a problémy k modulu 2.7 Pří řešení následujících úloh využijte výsledky odpovídajících úloh z 2.5.8 a 2.6.5. 1. Určete koeficient šikmosti a špičatosti náhodné veličiny X s pravděpodobnostní funkcí danou tabulkou: x p(x)
−1 0,02
0 0,07
1 0,18
2 0,25
3 0,30
4 0,18
2. Vypočítejte koeficient šikmosti a špičatosti náhodné veličiny udávající počet ok padnutých při 1 hodu hrací kostkou. 3. Pravděpodobnost zásahu cíle při každém ze 4 výstřelů je 0,8. Určete koeficient šikmosti a špičatosti náhodné veličiny udávající počet zásahů cíle. 4. Určete koeficient šikmosti a špičatosti náhodné veličiny s funkcí hustoty pravděpodobnosti 2 3x pro 0 < x < 1, f (x) = 0 jinak. 5. Vypočítejte koeficient šikmosti a špičatosti náhodné veličiny s distribuční funkcí x ≤ 0, 0 pro x2 0 < x < 1, F (x) = 1 x ≥ 1.
66
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
6. Určete koeficient šikmosti a špičatosti náhodné veličiny s funkcí hustoty pravděpodobnosti 3 (1 − x2 ) pro −1 < x < 1, 4 f (x) = 0 jinak. Řešení. 1. −0,448; −0,463; 2. 0; −1,960; 3. 0,75; 0,0625; 4. −0,861; 0,095; 5. −0,566; −0,6; 6. 0; −0,857. Další úlohy na procvičování: [Kříž 1]: [Kříž 1]:
str. 42–48, části úloh týkající se výpočtu charakteristik koncentrace, str. 50–56, části úloh týkající se výpočtu charakteristik koncentrace.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
67
2.8 Shrnutí 2. kapitoly Klíčová slova: náhodná veličina, diskrétní a spojitá náhodná veličina, obor hodnot náhodné veličiny, zákon rozdělení pravděpodobností, distribuční funkce, pravděpodobnostní funkce, funkce hustoty pravděpodobnosti, charakteristiky polohy (střední hodnota, modus, kvantil), variability (rozptyl, směrodatná odchylka) a koncentrace (koeficient šikmosti a špičatosti) Základní úlohy: • Popis rozložení náhodné veličiny pomocí funkcí. • Výpočet pravděpopodobností pomocí distibuční funkce, pravděpodobnostní funkce a funkce hustoty pravděpodobnosti. • Výpočet číselných charakteristik náhodných veličin. Doporučená literatura pro hlubší studium: [Kříž 2]: [Cyhelský]: [Hindls]:
str. 14–19, str. 104–130, odstavce 6.1, 6.2, 7.1, 7.2, str. 62–73, odstavce 3.3–3.5.
2.9 Test ke kapitole 2 A. Teoretická část 1. Rozhodněte, která z náhodných veličin je spojitá a která diskrétní: počet dětí v domácnosti, počet překlepů na 100 stranách strojopisu, hmotnost jablka, věk maturantů, výška smrku, doba čekání na číšníka v restauraci, počet zásahů cíle při 10 výstřelech, životnost autobaterie. 2. Rozhodněte, která tvrzení jsou pravdivá: a) Distribuční funkce je rostoucí funkce. b) Distribuční funkce je neklesající funkce. c) Hodnota pravděpodobnostní funkce může být větší než 1. d) Hodnota funkce hustoty pravděpodobnosti může být větší než 1. e) Hodnota distribuční funkce může být větší než 1. f) Je-li rozdělení náhodné veličiny symetrické, pak α3 = 0. g) Je-li rozdělení náhodné veličiny symetrické, pak E(X) = x0,50 . h) Má-li náhodná veličina symetrické rozdělení a jedním modem, pak je její střední hodnota rovna mediánu a zároveň modu.
68
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
B. Praktická část 1. Pravěpodobnostní funkce náhodné veličiny X je dána tabulkou P x 0 1 2 3 4 5 p(x) 0,10 0,15 0,2 0,15 0,25 0,15 1 a) Určete distribuční funkci této náhodné veličiny a obě funkce zobrazte graficky. b) Vypočítejte pravděpodobnosti P (X ≤ 3), P (X > 4), P (1 < X ≤ 4). c) Určete střední hodnotu, rozptyl, směrodatnou odchylku, modus, koeficienty šikmosti a špičatosti dané náhodné veličiny. 2. Při hodu dvěma hracími kostkami budeme sledovat náhodnou veličinu součet ok na obou kostkách. a) Popište tuto náhodnou veličinu pomocí pravděpodobnostní a distribuční funkce. b) Jaká je pravděpodobnost, že součet ok na obou kostkách bude 6 až 9, nebude větší než 8, bude větší než 10? c) Určete střední hodnotu, rozptyl, směrodatnou odchylku, modus, koeficienty šikmosti a špičatosti dané náhodné veličiny. 3. Je dána hustota pravděpodobnosti náhodné veličiny X ve tvaru 2−x e pro x > 2, f (x) = 0 jinak. a) b) c) d)
Určete distribuční funkci náhodné veličiny X a obě funkce zobrazte graficky. Vypočítejte pravděpodobnosti P (X < 5), P (0 < X < 5), P (X ≥ 4). Určete střední hodnotu a rozptyl této náhodné veličiny. Odvoďte obecný vztah pro výpočet kvantilů a určete medián a 95% kvantil.
4. Je dána distribuční funkce spojité náhodné veličiny X 0 pro x ≤ 0, C(1 − cos x) 0 < x < π, F (x) = 1 x ≥ π. a) b) c) d)
Určete konstantu C ∈ R. Určete funkci hustoty pravděpodobnosti. Vypočítejte pravděpodobnosti P (0 < X < π4 ), P ( π4 < X < π2 ), P ( π2 < X < π). Určete střední hodnotu, medián, modus, rozptyl, směrodatnou odchylku, koeficienty šikmosti a špičatosti této náhodné veličiny.
Řešení. A. 1. spojitá: hmotnost jablka, výška smrku, doba čekání na číšníka v restauraci, životnost autobaterie; diskrétní: počet dětí v domácnosti, počet překlepů na 100 stranách strojopisu, věk maturantů, počet zásahů cíle při 10 výstřelech; 2. a) nepravda; b) pravda; c) nepravda; d) pravda; e) nepravda; f) pravda; g) pravda; h) pravda.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
69
B. 1. a) F (x): 0 pro x < 0; 0,10 pro 0 ≤ x < 1; 0,25 pro 1 ≤ x < 2; 0,45 pro 2 ≤ x < 3; 0,60 pro 3 ≤ x < 4; 0,85 pro 4 ≤ x < 5; 1 pro x ≥ 5; b) 0,6; 0,15; 0,6; c) 2,75; 2,488; 1,577; 4; −0,196; −1,118; 2. a) p(x): 1/36 pro x = 2, 1/18 pro x = 3, 1/12 pro x = 4, 1/9 pro x = 5, 5/36 pro x = 6, 1/6 pro x = 7, 5/36 pro x = 8, 1/9 pro x = 9, 1/12 pro x = 10, 1/18 pro x = 11, 1/36 pro x = 12; F (x): 0 pro x < 2, 1/36 pro 2 ≤ x < 3, 1/12 pro 3 ≤ x < 4, 1/6 pro 4 ≤ x < 5, 5/18 pro 5 ≤ x < 6, 5/12 pro 6 ≤ x < 7, 7/12 pro 7 ≤ x < 8, 13/18 pro 8 ≤ x < 9, 5/6 pro 9 ≤ x < 10, 11/12 pro 10 ≤ x < 11, 35/36 pro 11 ≤ x < 12, 1 pro x ≥ 12; b) 5/9; 13/18; 1/12; c) 7; 5,833; 2,415; 7; 0; −0,634; 3. a) F (x): 1 − e2−x pro x > 2, 0 jinak; b) 0,950; 0,950; 0,135; c) 3; 1; d) xP = 2 − − ln(1 − P ); 2,693; 4,996; 4. a) 0,5; b) f (x): 12 sin x pro 0 < x < π, 0 jinak; c) 0,146; 0,354; 0,5; d) π2 ; π2 ; π2 ; 0,467; 0,684; 0; −0,806.
70
3
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
MODELY DISKRÉTNÍ NÁHODNÉ VELIČINY
Následující kapitola je věnována čtyřem základním modelům disktrétní náhodné veličiny. Jedná se Poissonovo, alternativní, binomické a hypergeometrické rozdělení. Cílem kapitoly je: • seznámit se se základními modely diskrétní náhodné veličiny, • popsat dané modely pomocí pravděpodobnostních a distribučních funkcí a číselných charakteristik, • naučit se řešit pravděpodobnostní úlohy pomocí zmíněných modelů.
3.1
Poissonovo rozdělení
Poissovovo rozdělení Po(λ) je možné použít jako model náhodné veličiny, která nabývá hodnot 0, 1, 2, . . . a udává buď počet událostí, k nimž dojde v časovém intervalu délky t nebo počet výskytů daných prvků v geometrické oblasti o pevné velikosti, jestliže k událostem či výskytům dochází jednotlivě a nezávisle na sobě. Parametr rozdělení λ > 0 udává střední počet událostí resp. výskytů. 3.1.1 Definice. Náhodná veličina X má Poissonovo rozdělení Po(λ), právě když má pravděpodobnostní funkce tvar λx −λ e pro x = 0, 1, 2, . . . , x! p(x) = 0 jinak. Skutečnost, že náhodná veličina X má Poissonovo rozdělení s patrametrem λ zapíšeme X ∼ Po(λ). Následující tabulka uvádí hodnoty některých číselných charakteristik Poisssonova rozdělení. E(X)
D(X)
α3 (X)
α4 (X)
Mo(X)
λ
λ
√1 λ
1 λ
λ − 1 ≤ Mo(X) ≤ λ
Příklady náhodných veličin s Poissonovým rozdělením: počet poruch stroje za směnu, počet nehod na jistém místě za rok, počet zákazníků v obchodě během 1 hodiny, počet vad na povrchu výrobku, počet vad v balíku látky, počet bublin na tabuli skla apod. Hodnoty pravděpodobnostní funkce Poissonova rozdělení jsou pro některé hodnoty λ tabelovány (viz Tabulka I v příloze). 3.1.2 Příklad. Během 1 hodiny spojí sekretářka řediteli v průměru 6 hovorů. Potřebujeme sledovat zatížení sekretářky ve 20-ti minutových intervalech. Popište náhodnou
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
71
veličinu udávající počet spojených telefonních hovorů během 20 minut pomocí pravděpodobností a distribuční funkce. Dále určete pravděpodobnost, že během 20 minut sekretářka spojí a) alespoň 1 hovor, b) nejvýše 2 hovory, c) jeden nebo 2 hovory. Určete střední hodnotu, rozptyl, směrodatnou odchylku, modus, koeficient šikmosti a špičatosti sledované náhodné veličiny. Řešení. Náhodná veličina X udává počet spojených telefonních hovorů za 20 minut. Může nabývat hodnot 0, 1, 2, . . . . Předpokládejme, že je možné ji modelovat pomocí Poissonova rozdělení. Parametr λ udává střední hodnotu náhodné veličiny s Poissonovým rozdělením, tedy střední počet telefonátů během 20 minut, což je 2 (za 1 hodinu je jich průměrně 6). Náhodná veličina X má Poissonovo rozdělení X ∼ Po(2). Pravděpodobnostní funkce má tvar 2x −2 e pro x = 0, 1, 2, . . . , x! p(x) = 0 jinak. 3 . Například hodnotu p(x) v bodě x = 3 určíme jako p(3) = 23! e−2 = 0,1804. Hodnoty pravděpodobnostní funkce (pro x = 0, 1, . . . , 7) jsou spolu s hodnotami distibuční funkce uvedeny v tabulce: x 0 1 2 3 4 5 6 7 ∞ p(x) 0,1353 0,2707 0,2707 0,1804 0,0902 0,0361 0,0120 0,0034 → 0 F (x) 0,1353 0,4060 0,6767 0,8571 0,9473 0,9834 0,9955 0,9989 → 1
Grafy pravděpodobnostní funkce a distribuční funkce jsou zobrazeny na obrázku 3.1.
Obr. 3.1 Pravděpodobnostní a distribuční funkce rozdělení Po(2)
Nyní spočítáme pravděpodobnosti, že během 20 minut sekretářka spojí a) alespoň 1 hovor . P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − p(0) = 1 − 0,1353 = 0,865, b) nejvýše 2 hovory P (X ≤ 2) = F (2) = P (X = 0) + P (X = 1) + P (X = 2) = p(0) + p(1) + p(2) = . = 0,1253 + 0,2707 + 0,2707 = 0,677,
72
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
c) jeden nebo 2 hovory . P (X = 1∨X = 2) = P (X = 1)+P (X = 2) = p(1)+p(2) = 0,2707+0,2707 = 0,541. • • • • • •
Dále určíme některé číselné charakteristiky: střední hodnota Poissonova rozdělení je rovna E(X) = λ = 2, rozptyl má hodnotu D(X) = λp= 2, √ √ . směrodatná odchylka σ(X) = D(X) = λ = 2 = 1,414, pro modus platí λ − 1 ≤ Mo(X) ≤ λ, tedy 2 − 1 ≤ Mo(X) ≤ 2, Mo(X) = 1 a 2 (viz tabulka pravděpodobnostní funkce), . koeficient šikmosti α3 = √1λ = √12 = 0,707, koeficient špičatosti α4 = λ1 = 12 = 0,5.
3.1.3 Poznámka. Hodnoty pravděpodobnostní a distribuční funkce Poissonova rozdělení je možné v Excelu získat pomocí funkce POISSON, která má 3 parametry: první parametr je hodnota náhodné veličiny X, druhý parametr je střední hodnota (tedy λ) a poslední parametr je logická proměnná (pravda–nepravda nebo 0–1) určující, zda bude spočtena pravděpodobnostní funkce (parametr je 0) nebo distribuční funkce (parametr je 1). Hodnotu pravděpodobnostní funkce náhodné veličiny s Poissonovým rozdělením . s parametrem λ = 2 v bodě x = 1 získáme příkazem POISSON(1;2;0) = 0,27067, . hodnotu distribuční funkce pak příkazem POISSON(1;2;1) = 0,40601. 3.1.4 Úkoly a problémy k modulu 3.1 1. Při provozu balicího automatu vznikají během směny náhodné poruchy. Ze zkušenosti víme, že během jedné směny dojde v průměru ke 2 poruchám. Jaká je pravděpodobnost, že během 24 hodin (třísměnného provozu) nedojde ani jednou k poruše? 2. Informační kancelář navštíví v průměru 20 osob za hodinu. Jaká je pravděpodobnost, že během 15 minut nepřijde do kanceláře nikdo? Předpokládejte, že počet osob, které navštíví kancelář, se řídí Poissonovým rozdělením. 3. Na telefonní ústřednu přijde během 8 hodin v průměru 360 žádostí o spojení. Jaká je pravděpodobnost, že během příštích 10 minut přijdou a) 4 žádosti o spojení, b) nejvýše 4 žádosti o spojení? 4. Semena určité rostliny jsou znečištěna malým množstvím plevele. Je známo, že na 1 m2 vyrostou v průměru 4 rostlinky plevele. a) Popište náhodnou veličinu udávající počet rostlinek plevele na 1 m2 pomocí pravděpodobnostní a distribuční funkce a zobrazte je graficky. b) Určete pravděpodobnost, že na náhodně vybrané ploše 1 m2 nebude žádný plevel, vyrostou nejvýše 3 rostlinky plevele, budou více než 3 rostlinky plevele. c) Určete střední hodnotu, rozptyl, směrodatnou odchylku, modus, koeficient šikmosti a špičatosti sledované náhodné veličiny.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
73
5. Při korekruře nové knihy se nalezne v průměru 40 chyb na 100 stran. a) Jaká je pravděpodobnost, že na náhodně vybraných 20 stranách knihy bude více než 5 chyb, nepřekročí počet chyb 10, bude 5 až 10 chyb? b) Určete střední hodnotu počtu chyb a nejpravděpodobnější počet chyb na těchto 20 stranách. Řešení. 1. 0,00248; 2. 0,00674; 3. a) 0,073; b) 0,132; x 4. a) p(x): 4x! e−4 pro x = 0, 1, 2, . . . ; 0 jinak; b) 0,018; 0,433; 0,567; c) 4; 4; 2; 3 a 4; 0,5; 0,25; 5. a) 0,809; 0,816; 0,716; b) 8; 7 a 8. Další úlohy na procvičování: [Kříž 1]:
3.2
str. 56–59.
Alternativní rozdělení
Některé náhodné pokusy mohou mít jen 2 různé výsledky: pokus je úspěšný a pokus je neúspěšný. Náhodná veličina udávající počet úspěchů v jednom pokusu se nazývá alternativní. Tato veličina nabývá hodnot 0 a 1. Pravděpodobnost úspěchu je dána parametrem π (0 < π < 1). 3.2.1 Definice. Náhodná veličina X má alternativní rozdělení A(π), právě když má pravděpodobnostní funkce tvar x π (1 − π)1−x pro x = 0, 1, p(x) = 0 jinak.
Následující tabulka uvádí hodnoty některých číselných charakteristik alternativního rozdělení. E(X)
D(X)
π
π(1 − π)
α3 (X) √1−2π π(1−π)
α4 (X) 1−6π(1−π) π(1−π)
Příklady: počet zmetků při náhodném výběru 1 výrobku, počet zásahů při jednom výstřelu, počet spojení při 1 telefoním volání, indikuje nastoupení či nenastoupení náhodného jevu. 3.2.2 Příklad. Určete střední hodnotu a rozptyl náhodné veličiny s alternativním rozdělením X ∼ A(π).
74
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Řešení. K odvození použijeme definiční vztahy pro střední hodnotu a rozptyl diskrétní náhodné veličiny. Pro střední hodnotu diskrétní náhodné veličiny s alternativním rozdělením platí X E(X) = xi p(xi ) = 0 · (1 − π) + 1 · π = π. M
Rozptyl nespojité náhodné veličiny daného rozdělení získáme ze vztahu P D(X) = [xi − E(X)]2 p(xi ) = (0 − π)2 (1 − π) + (1 − π)2 π = M
= π 2 (1 − π) + (1 − π)2 π = π(1 − π)(π + 1 − π) = π(1 − π).
3.3
Binomické rozdělení
Náhodná veličina, kterou je možné modelovat pomocí binomického rozdělení, udává počet úspěchů v posloupnosti n nezávislých alternativních pokusů, přičemž úspěch v každém pokusu nastává s pravděpodobností π (0 < π < 1). 3.3.1 Definice. Náhodná veličina X má binomické rozdělení B(n, π), právě když má pravděpodobnostní funkce tvar n x π (1 − π)n−x pro x = 0, 1, . . . , n, x p(x) = 0 jinak.
Následující tabulka uvádí hodnoty některých číselných charakteristik binomického rozdělení. E(X)
D(X)
nπ
nπ(1 − π)
α3 (X) √ 1−2π nπ(1−π)
α4 (X)
Mo(X)
1−6π(1−π) nπ(1−π)
(n + 1)π − 1 ≤ Mo(X) ≤ (n + 1)π
Mají-li veličiny X1 , . . . , Xn stejné alternativní rozdělení s parametrem π a jsou nezávislé, potom veličina X = X1 + X2 + · · · + Xn má binomické rozdělení B(n, π), s parametry n a π. Alternativní rozdělení je tedy speciálním případem binomického rozdělení pro n = 1. Příklady náhodných veličin s binomickým rozdělením: počet padnutých šestek v pěti hodech hrací kostkou, počet vadných výrobků z celkového počtu 100 výrobků, je-li pravděpodobnost výskytu vadného výrobku 0,005, počet spojení při n telefonních voláních, počet zásahů při n výstřelech apod. 3.3.2 Poznámka. Poissonovo rozdělení je limitním případem binomického rozdělení. Jestliže n → ∞ a π → 0, pak nπ → λ. Hodnoty pravděpodobnostní funkce binomického rozdělení je možné aproximovat pomocí hodnot pravděpodobnostní funkce Poissonova rozdělení. Při řešení úloh je pak dostačující, aby n > 30, π < 0,1, pak platí n x λx π (1 − π)n−x ≈ e−λ . x! x
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
75
3.3.3 Příklad. Pravděpodobnost, že narozené dítě je chlapec je 0,51. Jaká je pravděpodobnost, že mezi pěti po sobě narozenými dětmi budou a) právě 3 děvčata, b) nejvýše 3 chlapci? Určete pravděpodobnostní a distribuční funkci náhodné veličiny udávající počet chlapců mezi pěti po sobě narozenými dětmi. Jaký je nejpravděpodobnější počet narozených chlapců? Určete střední hodnotu, rozptyl a směrodatnou odchylku dané náhodné veličiny. Řešení. Náhodná veličina X udává počet chlapců mezi pěti po sobě narozenými dětmi. Tato náhodná veličina může nabývat hodnot 0, 1, 2, . . . , 5. Považujme narození dítěte za nezávislý náhodný pokus, ve kterém se narodí chlapec s pravděpodobností 0,51. Náhodnou veličinu lze popsat pomocí binomického rozdělení X ∼ B(5; 0,51). Pravděpodobnostní funkci můžeme zapsat ve tvaru 5 · 0,51x · 0,495−x pro x = 0, 1, . . . , 5, x p(x) = 0 jinak, její hodnoty jsou uvedeny v tabulce. x 0 1 p(x) 0,0282 0,1470 F (x) 0,0282 0,1752
2 0,3060 0,4813
3 0,3185 0,7998
4 0,1657 0,9655
5 0,0345 1,0000
Grafy pravděpodobnostní funkce a distribuční funkce jsou zobrazeny na obrázku 3.2.
Obr. 3.2 Pravděpodobnostní a distribuční funkce rozdělení B(5; 0,51)
Nyní určíme pravděpodobnost, že mezi pěti po sobě narozenými dětmi budou a) právě 3 děvčata, tzn. právě 2 chlapci . P (X = 2) = p(2) = 0,306, b) nejvýše 3 chlapci P (X ≤ 3) = F (3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) = p(0) + . + p(1) + p(2) + p(3) = 0,0282 + 0,1470 + 0,3060 + 0,3185 = 0,800.
76
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Nejpravděpodobnější počet narozených chlapců určuje modus a ten můžeme určit ze vztahu (n+1)π −1 ≤ Mo(X) ≤ (n+1)π, tedy (5+1)·0,51−1 ≤ Mo(X) ≤ (5+1)·0,51, což je 2,06 ≤ Mo(X) ≤ 3,06 odkud dostáváme Mo(X) = 3. Nejpravděpodobnější hodnotu můžeme samozřejmě najít přímo v tabulce pravděpodobnostní funkce. Střední hodnota je pro binomické rozdělení rovna E(X) = nπ = 5 · 0,51 = 2,55, lze tedy při dlouhodobém sledování porodnosti očekávat „v průměruÿ 2,55 chlapce z 5 narozených . dětí. Rozptyl je = nπ(1 − π) = 5 · 0,51 · (1 − 0,51) = 1,250 a směrodatná proven D(X) . odchylka σ = D(X) = 1,118. 3.3.4 Poznámka. Hodnoty pravděpodobnostní a distribuční funkce binomického rozdělení je možné v Excelu získat pomocí funkce BINOMDIST, která má 4 parametry: první parametr je hodnota náhodné veličiny X, druhý parametr počet pokusů (tedy parametr n), třetí parametr udává pravděpodobnost úspěchu v 1 pokuse (parametr π) a poslední parametr je logická proměnná (pravda–nepravda nebo 0–1) určující, zda bude spočtena pravděpodobnostní funkce (parametr je 0) nebo distribuční funkce (parametr je 1). Hodnotu pravděpodobnostní funkce náhodné veličiny s binomickým rozdělením s parametry n = 5 a π = 0,51 v bodě x = 2 získáme příka. zem BINOMDIST(2;5;0,51;0) = 0,30601, hodnotu distribuční funkce pak příkazem . BINOMDIST(2;5;0,51;1) = 0,48125. 3.3.5 Úkoly a problémy k modulu 3.2 a 3.3 1. Házíme třikrát hrací kostkou. Nechť náhodná veličina X udává počet padnutých šestek. a) Popište náhodnou veličinu pomocí pravděpodobnostní a distribuční funkce a zobrazte je graficky. b) Určete pravděpodobnost, že šestka padne jedenkrát nebo dvakrát, alespoň jednou, nejvýše dvakrát. c) Určete střední hodnotu, modus, rozptyl, směrodatnou odchylku, koeficient šikmosti a špičatosti sledované náhodné veličiny. 2. Zasadíme 10 semen určité rostliny a předpokládáme, že z každého semene je možné vypěstovat zdravou rostlinu s pravděpodobností 80 %. a) Jaký je nejpravděpodobnější počet zdravých rostlin a jaká je pravděpodobnost, že tento počet vypěstujeme? b) Určete pravděpodobnost, že počet zdravých rostlin bude alespoň 5, nejvýše 9, od 4 do 8. 3. Pracovnice obsluhuje 800 vřeten, na které se navíjí příze. Pravděpodobnost přetržení příze na každém z vřeten během směny je 0,005. Jaká je pravděpodobnost, že se během směny roztrhne příze na více než 2 vřetenech? Ověřte, zda je možné pravděpodobnostní funkci aproximovat Poissonovým rozdělením. Pokud ano, proveďte výpočet pomocí Poissova rozdělení. 4. Letecká společnost provozuje na určité lince letadlo pro 120 cestujících. I když je na každý let všech 120 míst rezervováno, průměrně se 3 % cestujících k letu nedostaví
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
77
a letadlo létá často s prázdnými místy. Společnost proto rozhodla přijímat rezervaci od 122 cestujících na týž let. Jaká je pravděpodobnost, že nebudou uspokojeni všichni cestující, kteří se dostaví k letu? 5. Student má psát test, na který se nepřipravoval, takže odpovědi (formou ano–ne) bude volit náhodně. Test se skládá z 20 otázek a pro úspěšné absolvování je třeba alespoň 15 správných odpovědí. Jaká je pravděpodobnost, že student test splní? Řešení. x 5 3−x 1. a) p(x): x3 16 pro x = 0, 1, 2, 3; 0 jinak; b) 0,417; 0,421; 0, 995; c) 0,5; 0; 6 0,417; 0,645; 1,033; 0,4; 2. a) 8; 0,302; b) 0,994; 0,893; 0,623; 3. 0,76263; Po(4); 0,76190; 4. 0,116; 5. 0,021. Další úlohy na procvičování: [Kříž 1]:
3.4
str. 59–62.
Hypergeometrické rozdělení
Máme N objektů, mezi nimiž je M se sledovanou vlastností (např. 4 vadné výrobky v sérii 200 kusů, 6 čísel ze 49, na která sázející Sportky vsadil, . . . ). Vybereme náhodně bez vracení n objektů. Náhodná veličina X, která udává počet vybraných objektů se sledovanou vlastností, má hypergeometrické rozdělení. 3.4.1 Definice. Náhodná veličina X má hypergeometrické rozdělení Hg(N, M, n), právě když má pravděpodobnostní funkce tvar ( M N −M ( x )( n−x ) max{0, n − N + M } ≤ x ≤ min{n, M }, x ∈ N0 , (Nn ) p(x) = 0 jinak.
Následující tabulka uvádí hodnoty některých číselných charakteristik hypergeometrického rozdělení. E(X)
D(X)
α3 (X)
Mo(X)
nπ
−n nπ(1 − π) N N −1
(1−2π)(N −2n) (N −2)σ
a − 1 ≤ Mo(X) ≤ a
pozn. π=
M , N
a=
(M +1)(n+1) N +2
Příklady: počet vadných výrobků mezi n náhodně vybranými výrobky z dodávky, číselné loterie, Sportka, 5 ze 40, 10 šťastných čísel, apod.
78
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
3.4.2 Poznámka. Zlomek Nn vyjadřuje tzv. výběrový podíl. Je-li tento podíl menší než 0,05, lze hypergeometrické rozdělení aproximovat binomickým rozdělením s parametry naπ=M , tedy N M N −M n x x n−x ≈ π (1 − π)n−x . N x n Je-li rozsah N velký a n relativně malé, potom rozdíl mezi výběrem bez vracení (rozdělení Hg(N, M, n)) a s vracením (rozdělení B(n, π)) je zanedbatelný. Je-li navíc π = = M < 0,1 a n > 30, je možné hypergeometrické rozdělení aproximovat Poissonovým N , tedy rozdělením, kde λ = n M N M x
N −M n−x N n
≈
λx −λ e . x!
3.4.3 Příklad. Výrobky jsou dodávány v sériích po 100 kusech. Výstupní kontrola prohlíží z každé série 5 různých náhodně vybraných výrobků a přijímá ji, jestliže mezi nimi není žádný zmetek. Očekáváme, že série obsahuje 4 % zmetků. Určete pravděpodobnostní a distribuční funkci náhodné veličiny udávající počet zmetků ve výběru. S jakou pravděpodobnostní nebude série přijata? Spočítejte střední hodnotu a směrodatnou odchylku této náhodné veličiny. Zjistěte, zda jsou splněny podmínky aproximace binomickým rozdělením. Řešení. V sériích po 100 kusech se očekává 4 % zmetků, což je 4. Náhodnou veličinu udávající počet zmetků mezi 5 vybranými výrobky můžeme popsat pomocí hypergeometrického rozdělení X ∼ Hg(100, 4, 5). Tato náhodná veličina může nabývat hodnot 0, 1, 2, 3 a 4. Pravděpodobnostní funkce má tvar ( p(x) =
96 (x4)(5−x ) pro x = 0, 1, 2, 3, 4, (100 5 ) 0 jinak,
její hodnoty jsou uvedeny v tabulce. x p(x) F (x)
0 0,8119 0,8119
1 0,1765 0,9884
2 0,0114 0,9998
3 2,4 · 10−4 0,999999
4 1,3 · 10−6 1
Grafy pravděpodobnostní funkce a distribuční funkce jsou zobrazeny na obrázku 3.3. Určíme pravděpodobnost, se kterou nebude série přijata, tzn. že bude obsahovat . alespoň 1 zmetek, tedy P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − p(0) = 0,188. Střední hodnota hypergeometrického rozdělení je E(X) = n M = 0,2, což znamená, že N lze dlouhodobě očekávat q „průměrněÿ 0,2 zmetku v 1 sérii. Směrodatná odchylka má p . hodnotu σ = D(X) = n M (1 − M ) N −n = 0,429. N N N −1
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
79
Obr. 3.3 Pravděpodobnostní a distribuční funkce rozdělení Hg(100, 4, 5)
Jelikož je výběrový podíl Nn = 0,05 (viz poznámka 3.4.2, π = M = 0,04), můN žeme hypegeometrické rozdělení aproximovat binomickým rozdělením B(5; 0,04). Pomocí aproximace tímto rozdělením by série nebyla přijata s pravděpodobností . P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − 50 · 0,040 · 0,965 = 0,185. 3.4.4 Poznámka. Hodnotu pravděpodobnostní funkce hypergeometrického rozdělení je možné v Excelu získat pomocí funkce HYPERGEOMDIST, která má 4 parametrů: první parametr je hodnota náhodné veličiny X, druhý parametr určuje velikost výběru (tedy parametr n), třetí parametr udává počet prvků se sledovanou vlastností (parametr M ) a poslední parametr udává celkový rozsah souboru (parametr N ). Hodnotu pravděpodobnostní funkce náhodné veličiny s hypergeometrickým rozdělením s parametry N = 100, M = 4 a n = 5 v bodě x = 0 získáme příkazem . HYPERGEOMDIST(0;5;4;100) = 0,81188. 3.4.5 Úkoly a problémy k modulu 3.4 1. Ve Sportce se z osudí obsahujícího 49 čísel losuje bez vracení 6 čísel. Sázející označí na sázence 6 čísel. Označme jako náhodnou veličinu počet těch čísel mezi vytaženými, na která si hráč vsadil. a) Popište náhodnou veličinu pomocí pravděpodobnostní a distribuční funkce a zobrazte je graficky. b) Určete pravděpodobnost, že hráč uhodne všech 6 čísel. c) S jakou pravděpodobností hráč nevyhraje (uhodne nejvýše 2 čísla)? d) Určete střední hodnotu a modus sledované náhodné veličiny. 2. Určitý typ součástek je dodáván v sériích po 200 kusech. Při přejímací kontrole je z každě série náhodně vybráno 5 výrobků, které se zkouškou znehodnotí. Série je přijata, jestliže mezi kontrolovanými výrobky není žádný vadný. Předpokládejme, že v sérii je 10 vadných výrobků.
80
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík a) Popište náhodnou veličinu udávající počet vadných vybraných výrobků pomocí pravděpodobnostní a distribuční funkce a zobrazte je graficky. b) S jakou pravděpodobností bude série přijata? c) Určete střední hodnotu, rozptyl, směrodatnou odchylku a modus počtu zmetků ve výběru. d) Prověřte, zda jsou splněny podmínky pro aproximaci rozdělení náhodné veličiny jiným typem rozdělení.
3. V dodávce 80 polotovarů je 8 kusů vadných. Náhodně vybereme najednou 5 polotovarů k další kompletaci. Jaká je pravděpodobnost, že mezi vybranými polotovary bude nejvýše jeden vadný? 4. Ze skupiny 30 studentů, kteří se přihlásili do kurzu, má 6 výborný prospěch. Do kurzu má být náhodně vylosováno 20 studentů. Jaká je pravděpodobnost, že do kurzu budou zařazeni a) všichni výborní studenti, b) alespoň 3 výborní studenti? 5. V osudí je 20 červených a 30 modrých míčků. Náhodně vybereme 8 míčků. Jaká je pravděpodobnost, že mezi vybranými míčky budou 4 modré, když provádíme a) výběry bez vracení, b) výběry s vracením? Řešení. 43 49 1. a) p(x): x6 6−x / 6 pro x = 0, 1, . . . , 6; jinak 0; b) 7,151 · 10−8 ; c) 0,981; d) 0,735; 0; 190 200 2. a) p(x): 10 / 5 pro x = 0, 1, . . . , 5; jinak 0; b) 0,772; c) 0,25; 0,233; 0,482; x 5−x 0; d) B(5; 0,05); 3. 0,924; 4. a) 0,065; b) 0,924; 5. a) 0,247; b) 0,232. Další úlohy na procvičování: [Kříž 1]:
str. 62–65.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
81
3.5 Shrnutí 3. kapitoly Klíčová slova: diskrétní náhodná veličina, Poissonovo rozdělení, alternativní rozdělení, binomické rozdělení, hypergeometrické rozdělení Základní úlohy: • Řešení pravděpodobnostních úloh. • Určování charakteristik daných rozdělení. • Rozpoznání vhodného modelu náhodné veličiny. Doporučená literatura pro hlubší studium: [Kříž 2]: [Cyhelský]: [Hindls]:
str. 19–22, str. 149–161, odstavce 8.1, 8.2, 8.4, str. 77–83.
3.6 Test ke kapitole 3 A. Teoretická část 1. Rozhodněte, která tvrzení jsou pravdivá: a) Alternativní rozdělení je speciálním případem binomického rozdělení. b) Binomické rozdělení je vždy možné aproximovat Poissonovým rozdělením. c) Náhodná veličina s Poissonovým rozdělením má střední hodnotu rovnu rozptylu. d) Náhodná veličina udávající počet úspěchů v n závislých pokusech má binomické rozdělení. e) Hypergeometrické rozdělení je možné, při splnění jistých podmínek, aproximovat rozdělením binomickým. f) Hypergeometrické rozdělení je možné, při splnění jistých podmínek, aproximovat rozdělením Poissovovým. g) Každá náhodná veličina s binomickým rozdělením má vždy pouze 1 modus.
B. Praktická část 1. K automatu na prodej nápojů přijde v průměru 30 zákazníků za 1/2 hodiny. Jaká je pravděpodobnost, že během příštích 5 minut a) přijde k automatu právě 1 zákazník? b) přijdou k automatu nejvýše 2 zákazníci? c) přijdou k automatu alespoň 3 zákazníci?
82
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík d) Určete střední hodnotu, modus, rozptyl, směrodatnou odchylku počtu zákazníků, kteří přijdou k automatu během 5 minut.
2. Střelec střílí 10 krát na terč. Pravděpodobnost zásahu terče při 1 výstřelu je 80 %. Předpokládejte, že výstřely jsou navzájem nezávislé. Jaká je pravděpodobnost, a) že střelec mine terč nejvýše 1 krát? b) že střelec mine terč alespoň 2 krát? c) že střelec nemine ani jednou? d) Určete střední hodnotu, modus, rozptyl, směrodatnou odchylku, koeficient šikmosti a špičatosti počtu výstřelů mimo terč. 3. Statisticky bylo zjištěno, že v závodě vyrobí v průměru na každých 100 výrobků 5 zmetků. Nechť náhodná veličina udává počet zmetků v dodávce 10 kusů. Jaká je pravděpodobnost, že a) v dodávce bude nejvýše 1 zmetek? b) bude více než 1 zmetek? c) bude právě 1 zmetek? d) Určete střední hodnotu, modus, rozptyl, směrodatnou odchylku sledované náhodné veličiny. Řešení. A. 1. a) pravda; b) nepravda; c) pravda; d) nepravda; e) pravda; f) pravda; g) nepravda. B. √ . 1. a) 0,034; b) 0,125; c) 0,875; d) 5; 4 a 5; 5; 5 = 2,236; 2. a) 0,376; b) 0,624; c) 0,107; d) 2; 2; 1,6; 1,265; 0,474; 0,025; 3. a) 0,923; b) 0,077; c) 0,339; d) 0,5; 0; 0,432; 0,657.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
4
83
MODELY SPOJITÉ NÁHODNÉ VELIČINY
V této kapitole probereme čtyři nejčastěji se vyskytující modely spojité náhodné veličiny. Věnovat se budeme rovnoměrnému, exponenciálnímu, normálnímu a logaritmicko-normálnímu rozdělení. Na závěr se seznámíme se třemi speciálními modely, které mají zcela výsadní postavení ve statistice. Cílem kapitoly je: • seznámit se se základními modely spojité náhodné veličiny, • popsat dané modely pomocí funkcí hustoty, distribučních funkcí a číselných charakteristik, • ukázat si, jak se řeší pravděpodobnostní úlohy pomocí těchto modelů.
4.1
Rovnoměrné rozdělení
Rovnoměrné rozdělení R(α, β) se používá jako model náhodné veličiny tehdy, když má náhodná veličina konstantní hustotu pravděpodobnosti na intervalu (α, β), kde α i β jsou reálná čísla. To znamená, že pro libovolné intervaly shodné délky má náhodná veličina stejnou pravděpodobnost – porovnejte s geometrickou definicí pravděpodobnosti (viz modul 1.5). 4.1.1 Definice. Spojitá náhodná veličina X má rovnoměrné rozdělení R(α, β), právě když funkce hustoty pravděpodobnosti má tvar 1 pro α < x < β, f (x) = β−α 0 jinak. Potom distribuční funkce je popsaná rovnicemi 0 pro x ≤ α, x−α α < x < β, F (x) = β−α 1 x ≥ β.
Grafy obou funkcí jsou na obrázku 4.1. Následující tabulka uvádí hodnoty některých číselných charakteristik rozdělení R(α, β). E(X) α+β 2
D(X) 1 (β 12
− α)2
α3 (X)
α4 (X)
kvantily xP
Me(X)
0
−1,2
α + P (β − α)
α+β 2
84
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Obr. 4.1 Funkce hustoty a distribuční funkce rovnoměrného rozdělení R(α, β)
4.1.2 Poznámka. Příklady náhodných veličin s rovnoměrným rozdělením: tímto rozdělením se zpravidla řídí doba čekání na uskutečnění jevu, který se opakuje v pravidelných intervalech (např. doba čekání na vlak metra, doba čekání na dodávku zboží, pokud se pravidelně opakuje, . . . ), chyby při zaokrouhlování čísel, chyby při odečítání údajů z měřících přístrojů (s lineární stupnicí) apod. 4.1.3 Příklad. Pro x ∈ (α, β) odvoďte rovnici distribuční funkce rozdělení R(α, β). Řešení. K odvození F (x) použijeme obecnou definici distribuční funkce podle vztahu 1 , potom pro dis(2.2). Funkce hustoty je na intervalu (α, β) dána rovnicí f (x) = β−α tribuční funkci platí Zx F (x) =
Zx f (t)dt =
−∞
x−α 1 1 dt = [t]xα = . β−α β−α β−α
α
4.1.4 Příklad. Při zaokrouhlování čísla na 2 desetinná místa se dopouštíme chyby, která je náhodnou veličinou s funkcí hustoty pravděpodobosti f (x) = 1/0,01 a prostorem hodnot M = (−0,005; 0,005). Jaká je pravděpodobnost, že absolutní chyba nepřekročí hodnotu 0,002? Určete střední hodnotu a směrodatnou odchylku sledované chyby. Řešení. Hledanou pravděpodobnost lze vypočítat pomocí distribuční funkce i pomocí funkce hustoty. Hledanou pravděpodobnost vyjádříme pomocí distribuční funkce: − P (|X| < 0,002) = P (−0,002 < X < 0,002) = F (0,002) − F (−0,002) = 0,002−(−0,005) 0,01 −
−0,002−(−0,005) R 0,0020,01 1 dx −0,002 0,01 −0,005+0,005 = 2
= 0,4. Pomocí funkce hustoty dostaneme: P (−0,002 < X < 0,002) =
α+β 1 = = 0,01 [x]0,002 = −0,002 = 0,4. Pro střední hodnotu platí E(X) = 2 = 0. Tomu lze rozumět tak, že při zaokrouhlování se vzniklé chyby „vyrovnávajíÿ. Pro výpočet směrodatné odchylky musíme nejprve znát rozptyl: D(X) = p . 0,012 1 2 = 12 (β − α) = 12 . Odtud dostaneme σ(X) = D(X) = 2, 887 · 10−3 .
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
85
4.1.5 Úkoly a problémy k modulu 4.1 1. Dokažte, že pro rovnoměrné rozdělení R(α, β) platí , a) E(X) = α+β 2 1 b) D(X) = 12 (β − α)2 , c) xP = α + P (β − α), d) Me(X) = α+β . 2 2. Náhodná veličina X má distribuční funkci pro x ≤ −4, 0 x+4 F (x) = −4 < x < 2, 6 1 x ≥ 2. a) Určete funkci hustoty pravděpodobnosti, střední hodnotu, rozptyl, medián a 30% kvantil této náhodné veličiny. b) Určete pravděpodobnost, že náhodná veličina bude nabývat hodnot větších než −3, menších než 0, od −1 do 1. 3. Autobusy MHD jezdí v pravidelných intervalech po 15 minutách. Cestující přijde na zastávku v libovolném okamžiku. Sledujme náhodnou veličinu představující dobu čekání na příjezd autobusu. a) Popište tuto náhodnou veličinu pomocí funkce hustoty a distribuční funkce, funkce vyjádřete matematicky i graficky. b) Určete pravděpodobnost, že cestující bude čekat na spoj nejvýše 5 minut, právě 10 minut, nejméně 3 minuty, 3 až 10 minut. c) Určete střední hodnotu, medián, rozptyl, směrodatnou odchylku a 90% kvantil doby čekání na autobus. 4. Prodejna očekává dodávku zboží v době od 7 do 9 hodin. Uskutečnění dodávky je stejně možné kdykoliv během tohoto intervalu. Označme jako náhodnou veličinu dobu čekání na dodávku. a) Popište náhodnou veličinu dobu čekání pomocí funkce hustoty a distribuční funkce, funkce vyjádřete matematicky i graficky. b) Určete pravděpodobnost, že prodejna bude čekat na dodávku nejvýše 40 minut, právě 1 hodinu, minimálně 1/2 hodiny, minimálně 20 minut, nejvýše ale 80 minut. c) Určete střední hodnotu, medián, rozptyl, směrodatnou odchylku a 20% kvantil doby čekání na dodávku. 5. Při vážení nemáme závaží menší než 1 gram. Jestliže výsledek vážení ukáže hmotnost mezi 15 a 16 gramy, odhadneme hmotnost na 15,5 gramu. Tento odhad je zatížen chybou, která je náhodnou veličinou s konstantní hustotou pravděpodobnosti v intervalu od −0,5 do 0,5 gramu.
86
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík a) Určete hustotu pravděpodobnosti, distribuční funkci, střední hodnotu a rozptyl chyby odhadu. b) Jaká je pravděpodobnost, že absolutní chyba tohoto odhadu nepřekročí hodnotu 0,3 gramu?
Řešení. 2. a) f (x): 1/6 pro −4 < x < 2; 0 jinak; −1; 3; −1; −2,2; b) 0,833; 0,667; 0,333; 3. a) f (x): 1/15 pro 0 < x < 15; 0 jinak; F (x): 0 pro x ≤ 0; x/15 pro 0 < x < 15; 1 pro x ≥ 15; b) 0,333; 0; 0,8; 0,467; c) 7,5; 7,5; 18,75; 4,330; 13,5; 4. a) f (x): 1/2 pro 0 < x < 2; 0 jinak; F (x): 0 pro x ≤ 0; x/2 pro 0 < x < 2; 1 pro x ≥ 2; b) 0,333; 0; 0,75; 0,5; c) 1; 1; 0,333; 0,577; 0,4; 5. a) f (x): 1 pro −0,5 < x < 0,5; 0 jinak; F (x): 0 pro x ≤ −0,5; x + 0,5 pro −0,5 < x < 0,5; 1 pro x ≥ 0,5; 0; 0,083; b) 0,6. Další úlohy na procvičování: [Kříž 1]:
4.2
str. 65–67.
Exponenciální rozdělení
Exponenciální jednoparametrické rozdělení E(λ) je duální rozdělení k Poissonovu rozdělení Po(λ), se kterým jsme se seznámili v minulé kapitole. Toto rozdělení má náhodná veličina X, která vyjadřuje dobu čekání mezi dvěma realizacemi jevu, jehož četnost výskytu má Poissonovo rozdělení. Popisuje tedy chování kladné náhodné veličiny pro x > 0. My si zavedeme obecnější dvouparametrické exponenciální rozdělení E(α, δ), které popisuje chování kladné náhodné veličiny, která může nabývat hodnot x > α. Parametr α > 0 představuje počáteční dobu, během níž sledovaný jev nastat nemůže, parametr δ > 0 je nositelem informace o variabilitě sledované veličiny. 4.2.1 Definice. Spojitá náhodná veličina X má exponenciální rozdělení E(α, δ), právě když má funkce hustoty pravděpodobnosti tvar ( 1 x−α e− δ pro x > α, f (x) = δ 0 x ≤ α. Potom distribuční funkce je popsaná rovnicemi x−α 1 − e− δ pro x > α, F (x) = 0 x ≤ α.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
87
Obr. 4.2 Funkce hustoty a distribuční funkce exponenciálního rozdělení Ex(α, δ)
Grafy obou funkcí jsou na obrázku 4.2. Následující tabulka uvádí hodnoty některých číselných charakteristik rozdělení E(α, δ): E(X)
D(X)
α3 (X)
α4 (X)
kvantily xP
Me(X)
α+δ
δ2
2
6
α − δ ln(1 − P )
α + δ ln 2
4.2.2 Poznámka. Příklady náhodných veličin s exponenciálním rozdělením: toto rozdělení zpravidla dobře popisuje životnost zařízení, u něhož dochází k poruše z náhodných příčin (rozdělení „bez pamětiÿ, životnost je vlastně doba „čekání na poruchuÿ). Dále se často používá v teorii spolehlivosti, v teorii hromadné obsluhy, v teorii obnovy apod. 4.2.3 Příklad. Pro x > α odvoďte obecný vztah pro střední hodnotu E(X). Řešení. K odvození E(X) použijeme obecnou definici střední hodnoty podle vztahu (2.4): 0 h i∞ − x−α δ u = e v = x − x−α δ E(X) = xf (x)dx = x · 1δ e dx = = −x · e + x−α u = −δ · e− δ v 0 = 1 α α M h x−α i∞ R∞ x−α x + e− δ dx = − lim − x−α = − α − δ · e− δ R∞
R
α
− x−α δ
x→∞ e
δ
α
= −(0 − α) − δ · (0 − 1) = α + δ 4.2.4 Příklad. Střední doba čekání zákazníka na obsluhu v určité prodejně je 2 minuty. Předpokládejme, že náhodná veličina X doba čekání na obsluhu má exponenciální rozdělení. Jaká je pravděpodobnost, že náhodný zákazník bude obsloužen v době kratší než 1,5 minuty? Jaký podíl zákazníků bude čekat déle než 2 minuty? Určete medián sledované veličiny.
88
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Řešení. Protože α = 0 (minimální doba čekání na obsluhu) a δ = 2, je hledaná i h 1,5 . − x−α = 1 − e− 2 = 0,528. pravděpodobnost P (X < 1,5) = F (1,5) = 1 − e δ x=1,5
Zákazník bude obsloužen v době kratší než 1,5 minuty s pravděpodobností 0,528. Určit podíl zákazníků čekajících déle než 2 minuty htaké znamená i určit pravděpodobnost . − x−α = e−1 = 0,368. Téměř P (X > 2) = 1 − P (X ≤ 2) = 1 − F (2) = 1 − 1 − e δ x=2
37 % zákazníků bude čekat déle než 2 minuty. Medián je 50% kvantil a určíme jej ze . vztahu Me(X) = α + δ ln 2 = 2 · ln 2 = 1,386. To tedy znamená, že 50 % zákazníků bude obslouženo přibližně do 1 minuty a 23 vteřin.
4.2.5 Úkoly a problémy k modulu 4.2 1. Dokažte, že pro exponenciální rozdělení E(α, δ) platí x−α a) F (x) = 1 − e− δ pro x > α, b) D(X) = δ 2 , c) xP = α − δ ln(1 − P ). 2. Náhodná veličina X má funkci hustoty pravděpodobnosti ( f (x) =
1 −x e 100 pro x > 0, 100 0 x ≤ 0.
a) Určete distribuční funkci, střední hodnotu, směrodatnou odchylku, medián a 95% kvantil této náhodné veličiny. b) Určete pravděpodobnost, že náhodná veličina X bude nabývat hodnot větších než 120, menších než 75, hodnot od 75 do 120. 3. Žárovky mají průměrnou životnost 2 tisíce hodin. Předpokládejme, že doba, po kterou žárovka svítí, je náhodná veličina, která má exponenciální rozdělení. a) Popište tuto náhodnou veličinu pomocí funkce hustoty a distribuční funkce. b) Určete pravděpodobnost, že žárovka vydrží v provozu nejvýše 1 tisíc hodin, více než 2,5 tisíce hodin, 1–2,5 tisíce hodin. c) Určete střední hodnotu, směrodatnou odchylku, medián a 90% kvantil životnosti žárovek. 4. Předpokládejme, že doba mezi příjezdy nákladních automobilů s betonovou směsí na stavbu je náhodnou veličinou, která má exponenciální rozdělení. Minimální doba mezi příjezdy jednotlivých vozidel na stavbu je 5 minut, průměrná doba je 10 minut. a) Popište tuto náhodnou veličinu pomocí funkce hustoty a distribuční funkce. b) Jaká je pravděpodobnost, že doba mezi příjezdy jednotlivých vozidel bude menší než 7 minut, větší než 11 minut, 7 až 11 minut? c) Určete střední hodnotu, směrodatnou odchylku, medián a 20% kvantil doby mezi příjezdy automobilů.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
89
5. Pravděpodobnost, že v bance budeme obslouženi v době kratší než 7 minut, je 0,4682. Předpokládejme, že doba, za kterou je zákazník v této bance obsloužený, se řídí exponenciálním rozdělením s parametrem α = 1 minuta. Jaká je střední doba obsluhy v této bance? Řešení. 2. a) F (x): 1 − e−x/100 pro x > 0; 0 pro x ≤ 0; 100; 100; 69,315; 299,573; b) 0,301; 0,528; 0,171; 3. a) f (x): 12 e−x/2 pro x > 0; 0 pro x ≤ 0; F (x): 1 − e−x/2 pro x > 0; 0 pro x ≤ 0; b) 0,393; 0,287; 0,320; c) 2; 2; 1,386; 4,605; 4. a) f (x): 15 e−(x−5)/5 pro x > 5; 0 pro x ≤ 5; F (x): 1 − e−(x−5)/5 pro x > 5; 0 pro x ≤ 5; b) 0,330; 0,301; 0,369; c) 10; 5; 8,466; 6,116; 5. 10,5 min. Další úlohy na procvičování: [Kříž 1]:
4.3
str. 68–70.
Normální rozdělení
Normální rozdělení – také Gaussovo rozdělení – má mimořádný význam v teorii pravděpodobnosti i v matematické statistice. Je použitelné všude tam, kde kolísání náhodné veličiny je způsobeno součtem velkého počtu nepatrných a vzájemně nezávislých vlivů. Uvažuje se tedy v situacích, kdy se ke konstantě µ ∈ R, vyjadřující správnou polohu náhodné veličiny, přičítá velké množství náhodných veličin (vlivů) nepatrně kolísajících kolem nuly. Vzniká tak proměnlivost náhodné veličiny charakterizovaná číslem σ ∈ (0, ∞). Klasickým typem veličin, které se řídí tímto rozdělením, jsou náhodné chyby. Proto se toto rozdělení někdy označuje jako zákon chyb. Významnost normálního rozdělení spočívá také v tom, že je limitním rozdělením. To znamená, že za určitých podmínek formulovaných centrální limitní větou (viz 5.3) se k němu blíží řada jiných (spojitých i diskrétních) rozdělení. 4.3.1 Definice. Spojitá náhodná veličina X má normální rozdělení N (µ, σ 2 ), právě když funkce hustoty má tvar (x−µ)2 1 f (x) = √ e− 2σ2 σ 2π
pro x ∈ R.
(4.1)
(t−µ)2 2σ 2
(4.2)
Distribuční funkce je definovaná rovnicí Zx F (x) = −∞
1 f (t)dt = √ σ 2π
Zx −∞
e−
dt pro x ∈ R.
90
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Grafy obou funkcí jsou na obrázku 4.3.
Obr. 4.3 Funkce hustoty a distribuční funkce normálního rozdělení N (µ, σ 2 )
O grafu funkce hustoty se hovoří jako o Gaussově křivce. Gaussova křivka s inflexními body x = µ ± σ je symetrická kolem bodu x = µ, v němž také dosahuje svého maxima σ√12π . Tvar obou funkcí závisí na parametru σ 2 . Následující tabulka uvádí hodnoty některých číselných charakteristik rozdělení N (µ, σ 2 ): E(X)
D(X)
α3 (X)
α4 (X)
kvantily xP
Me(X)
Mo(X)
Poznámka
µ
σ2
0
0
µ + σuP
µ
µ
uP je kvantil rozdělení N (0, 1)
4.3.2 Poznámky. 1. Např. pro rozdělení náhodné veličiny X ∼ N (50, 25) z obr. 4.4 to znamená, že střední hodnota E(X) = µ = 50, rozptyl D(X) = σ 2 = 25, medián Me(X) a modus Mo(X) jsou také rovny parametru µ = 50. Z obrázku je také zřejmé, že parametr µ . určuje, kde má křivka funkce hustoty maximum, jeho hodnota je σ√12π = 5√12π = 0,08. Parametr σ naproti tomu určuje, jak jsou po obou stranách od µ vzdálené inflexní body x = µ ± σ = 50 ± 5, tedy jak je křivka roztažena do šířky. 2. Příklady náhodných veličin s normálním rozdělením: už bylo zmíněno, že normální rozdělení mají náhodné chyby při fyzikálních (ale obecně jakýchkoliv) měřeních. Dále je možné normální rozdělení zpravidla očekávat u veličin vznikajících pod vlivem balistických zákonů (výsledky střeleb). Na normální rozdělení je možné narazit v řadě technických, ekonomických, biologických, společenských a dalších situací. Za určitých podmínek mají obecně normální rozdělení také náhodné veličiny vznikající jako součty resp. průměry jiných náhodných veličin (spojitých i diskrétních) s libovolným rozdělením. 3. Výpočet hodnot distribuční funkce F (x) je problematický, Gaussův pravděpodobnostní integrál není analyticky vyjádřitelný (neexistuje k němu primitivní funkce), vy-
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
91
jadřuje se nekonečným rozvojem řady. Pomocí vhodného počítačového programu lze tedy numerickou metodou hodnoty distribuční funkce získat. Ukážeme si, jak je možné k tomu využít známý program MS Excel. 4.3.3 Příklad. Mějme náhodnou veličinu X ∼ N (50, 25). Jaká je pravděpodobnost, že tato veličina nabude hodnoty a) menší než 41, b) větší než 59, c) v mezích od 42 do 56? Řešení. a) Máme určit P (X < 41) = F (41). Hodnotu distribuční funkce v bodě 41 určíme v programu MS Excel pomocí funkce NORMDIST: P (X < 41) = F (41) = . = NORMDIST(41; 50; 5; 1) = 0,03593; b) P (X > 59) = 1 − P (X < 59) = 1 − F (59) = 1 − NORMDIST(59; 50; 5; 1) = 1 − . − 0,96407 = 0,03593; c) P (42 < X < 56) = F (56) − F (42) = NORMDIST(56; 50; 5; 1) − . − NORMDIST(42; 50; 5; 1) = 0,88493 − 0,05480 = 0,83013.
Obr. 4.4 Funkce hustoty normálního rozdělení N (50, 25)
4.3.4 Poznámky k užití Excelu. 1. Funkce NORMDIST (Vložit / Funkce / Statistické) má 4 parametry: první parametr je hodnota náhodné veličiny X, pro kterou počítáme distribuční funkci, druhý je střední hodnota daného rozdělení, třetí je směrodatná odchylka daného rozdělení a čtvrtý je pravdivostní hodnota 1, kterou vložíme vždy, když chceme určit hodnotu distribuční funkce F (x). Pokud zde vložíme pravdivostní hodnotu 0, funkce vrátí hodnotu funkce hustoty f (x). 2. Obráceně je možné určit k dané pravděpodobnosti hodnotu náhodné veličiny, tj. P % kvantil, pomocí funkce NORMINV, která má tři parametry: první parametr je pravděpodobnost P , se kterou náhodná veličina nepřekročí hledanou hodnotu kvantilu, druhý je střední hodnota daného rozdělení a třetí je směrodatná odchylka daného rozdělení.
92
4.4
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Normované normální rozdělení
S potřebou stanovit hodnotu distribuční funkce nebo konkrétní kvantil normálního rozdělení s parametry µ a σ 2 se v praktické statistice setkáváme neobyčejně často. Proto je nutné se vypořádat i se situací, kdy počítačové stanovení distribuční funkce resp. kvantilu k dispozici nemáme. V tom případě pro stanovení hodnot distribuční funkce či kvantilu používáme statistické tabulky (viz tabulky II a III). Tyto tabulky jsou však sestavené pro hodnoty distribuční funkce normované náhodné veličiny U . 4.4.1 Poznámka. Normováním náhodné veličiny (libovolné) se rozumí odečtení střední hodnoty od každé její hodnoty a vydělení tohoto rozdílu směrodatnou odchylkou. Vznikne tak nová náhodná veličina ve tvaru U=
X − E(X) , σ(X)
která se označuje jako normovaná náhodná veličina. Pro normovanou náhodnou veličinu platí následující tvrzení: 4.4.2 Věta. Má-li náhodná veličina X rozdělení se střední hodnotou E(X) = µ a rozptylem D(X) = σ 2 , potom normovaná náhodná veličina U = X−µ má rozdělení σ se střední hodnotou E(U ) = 0 a rozptylem D(U ) = 1. Důkaz. Z vlastností střední hodnoty a rozptylu plyne pro U = E(U ) = E
D(U ) = D
X−µ = E(X)−µ σ σ D(X)−0 X−µ = σ2 σ
=
µ−µ σ
=
σ2 σ2
X−µ σ
= 0,
= 1.
Toto tvrzení platí pro jakékoliv libovolné rozdělení. Pro normální rozdělení platí navíc další důležité tvrzení: 4.4.3 Věta. Má-li spojitá náhodná veličina X normální rozdělení N (µ, σ 2 ) s funkcí hustoty (4.1) a distribuční funkcí (4.2), potom normovaná náhodná veličina U = X−µ σ má normované normální rozdělení N (0, 1) s funkcí hustoty pravděpodobnosti u2 1 φ(u) = √ e− 2 2π
pro u ∈ R
a s distribuční funkcí Zu Φ(u) = −∞
1 φ(t)dt = √ 2π
Zu −∞
t2
e− 2 dt pro u ∈ R.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Důkaz. Do rovnice distribuční funkce F (x) = =
√1 σ 2π
93 Rx
e−
(t−µ)2 2σ 2
dt zavedeme substituci u =
−∞
x−µ σ ,
kterou se hodnota určitého integrálu nemění. Potom dostaneme rovnici distribuční Ru − t2 e 2 dt, ze které je zřejmé, že funkce je funkcí hustoty náhodné velifunkce Φ(u) = √12π −∞
činy U .
Následující tabulka uvádí hodnoty některých číselných charakteristik rozdělení N (0, 1): E(U )
D(U )
α3 (U )
α4 (U )
kvantily uP
M e(U )
M o(U )
0
1
0
0
tabelované
0
0
Grafy funkce hustoty φ(u) a distribuční funkce Φ(u) jsou na obrázku 4.5. Normované normální rozdělení má parametry µ = 0 a σ 2 = 1, Gaussova křivka s inflexními body u = µ ± σ = 0 ± 1 je symetrická kolem bodu u = µ = 0, v němž také dosahuje svého . maxima √12π = 0,40.
Obr. 4.5 Funkce hustoty a distribuční funkce normovaného normálního rozdělení N (0, 1)
4.4.4 Poznámky. 1. Vybrané hodnoty distribuční funkce Φ(u) jsou tabelované v tabulce II. Hodnotě u je vždy přiřazená hodnota Φ(u). V tabulkách nalezneme pouze hodnoty distribuční funkce pro nezáporné u. Chceme-li určit distribuční funkci pro záporné u, využijeme vztah Φ(−u) = 1 − Φ(u). V Excelu lze hodnotu distribuční funkce určit pomocí funkce NORMSDIST(u), která má pouze jeden parametr u. Ověřte si určení distribuční funkce Φ(−0,63) • pomocí tabulek: Φ(−0,63) = 1 − Φ(0,63) = 1 − 0,73565 = 0,26435; . • v Excelu: NORMSDIST(−0,63) = 0,26435.
94
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
2. Vybrané hodnoty kvantilů uP jsou tabelované v tabulce III. Hodnotě P je vždy přiřazená hodnota uP . V tabulkách nalezneme pouze hodnoty kvantilů pro P ≥ 0,5. Potřebujeme-li kvantil pro P < 0,5, využijeme základní vlastnost kvantilů N (0, 1) vyjádřenou vztahem uP = −u1−P . V Excelu určíme hodnotu kvantilu uP pomocí funkce NORMSINV(P ), která má pouze jeden parametr P . Ověřte si určení 4% kvantilu u0,04 • pomocí tabulek: u0,04 = −u1−0,04 = −u0,96 = −1,751; . • v Excelu: u0,04 = NORMSINV(0,04) = −1,751. 3. Z tabulek hodnot distribuční funkce Φ(u) rozdělení N (0, 1) určíme také hodnoty distribuční funkce F (x) rozdělení N (µ, σ 2 ) pomocí vztahu x−µ F (x) = Φ(u) = Φ . (4.3) σ Pomocí tohoto vztahu je možné stanovit hodnotu distribuční funkce pro libovolné x a libovolné parametry µ a σ 2 . 4.4.5 Příklad. Předpokládejme, že hmotnost vejce je náhodná veličina, která má přibližně normální rozdělení se střední hodnotou 50 g a směrodatnou odchylkou 5 g. Vejce patří do třídy A, jestliže jeho hmotnost je v mezích 55 až 60 g. Kolik vajec třídy A můžeme očekávat v dodávce 1000 vajec? Jistý odběratel má zájem o 30 % vajec s nejnižší hmotností. Jakou nejvyšší hmotnost vajec bude v dodávce očekávat? Výsledky konfrontujte s obr. 4.4. Řešení. Budeme vycházet z toho, že náhodně vybrané vejce bude třídy A, tedy potřebujeme určit pravděpodobnost P (55 < X < 60). Předpokládáme X ∼ N (50, 25) a užijeme vztah (4.3): 55−50 P (55 < X < 60) = F (60) − F (55) = Φ 60−50 − Φ = Φ(2) − Φ(1) = 0,97725 − 5 5 − 0,84134 = 0,13591. Při výpočtu v Excelu dostaneme: . P (55 < X < 60) = NORMDIST(60; 50; 5; 1) − NORMDIST(55; 50; 5; 1) = 0,97725 − − 0,84134 = 0,13591. . Očekávaný počet vajec třídy A v dodávce je tedy 1000 · 0,13591 = 136. Dále se zajímáme o hodnotu náhodné veličiny, která nebude s 30% pravděpodobností překročena, tedy o 30% kvantil. K jeho určení užijeme vztah x0,30 = µ + σ · u0,30 = µ + σ · (−u0,70 ) = . = 50 − 5 · 0,524 = 47,380. . Při výpočtu v Excelu dostaneme: x0,30 = NORMINV(0,30; 50; 5) = 47,378. Rozdílné výsledky (o 0,002) lze vysvětlit tím, že Excel počítal s hodnotou kvantilu s plnou přesností, kdežto hodnota kvantilu z tabulek je zaokrouhlená. Odběratel může v dodávce očekávat vejce s hmotností přibližně do 47,4 g. 4.4.6 Příklad. Určete pravděpodobnost, že náhodná veličina X s normálním rozdělením N (µ, σ 2 ) nabude hodnot z intervalu (µ − 3σ, µ + 3σ). Řešení. P (µ−3σ < X < µ+3σ) = F (µ+3σ)−F (µ−3σ) = Φ µ+3σ−µ −Φ µ−3σ−µ = σ σ . = Φ(3) − Φ(−3) = Φ(3) − [1 − Φ(3)] = 2 · Φ(3) − 1 = 2 · 0,99865 − 1 = 0,997.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
95
Tento výsledek je pro statistiku významnější, než se na první pohled zdá. Říká nám, že pokud má náhodná veličina normální rozdělení (bez ohledu na parametry), potom s pravděpodobností 0,997 se budou hodnoty této veličiny nacházet v intervalu µ ± 3σ. Trochu konkrétněji: pokud provedeme reálně 1000 měření sledované náhodné veličiny, lze očekávat, že mimo tento interval budou průměrně 3 naměřené hodnoty. 4.4.7 Úkoly a problémy k modulu 4.3 a 4.4 1. Odvoďte vztah pro určení kvantilu xP = µ + σ · uP . 2. Určete pro N (0, 1) z tabulek Φ(1,57), Φ(−2,25), u0,975 , u0,10 . 3. Určete pravděpodobnost, že náhodná veličina X s normálním rozdělením N (µ, σ 2 ) nabude hodnot z intervalu a) (µ − σ, µ + σ), b) (µ − 2σ, µ + 2σ). Výsledky prakticky interpretujte. 4. Měření je doprovázeno systematickými a náhodnými chybami. Měřící přístroj je zatížen systematickou chybou 0,5 m a náhodné chyby mají normální rozdělení se směrodatnou odchylkou 0,3 m. a) Určete pravděpodobnost, že chyba měření nepřekročí v absolutní hodnotě 1 m. b) Určete hodnotu měřené veličiny, která nebude s pravděpodobností 0,90 překročena. 5. Doba, kterou potřebují studenti na vypracování zkouškového testu, má normální rozdělení se střední hodnotou 50 min. a směrodatnou odchylkou 10 min. a) Kolik procent studentů dokončí test do hodiny? b) Jaká doba je nutná k tomu, aby test dokončilo alespoň 90 % studentů? 6. Firma poskytuje na své výrobky záruční dobu 2 roky. Na každém výrobku, který prodá, má firma zisk 520 Kč. Pokud zákazník vrátí vadný výrobek v záruční době, firma vymění výrobek za nový, čímž ztratí 1000 Kč. Předpokládejme, že životnost výrobku se řídí normálním rozdělením se střední hodnotou 5,6 roku a směrodatnou odchylkou 1,7 roku a víc než 1 výměna nepřichází v úvahu. a) Vypočítejte pravděpodobnost, s jakou se výrobek během záruční doby porouchá, a určete průměrný zisk za prodaný kus. b) Určete, jak by se musela změnit záruční doba, aby průměrný zisk z prodaného výrobku činil alespoň 508 Kč. Řešení. 2. 0,94179; 0,01222; 1,960; −1,282; 3. a) 0,683; b) 0,954; 4. a) 0,953; b) 0,884; 5. a) 84,1; b) 63; 6. a) 0,017; 503; b) 21 měsíců. Další úlohy na procvičování: [Kříž 1]:
str. 70–73.
96
4.5
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Logaritmicko-normální rozdělení
Logaritmicko-normální rozdělení je důležité rozdělení pro jednostranně ohraničená data. Úzce je spjato s logaritmickou transformací normálního rozdělení. Nechť X je nezáporná náhodná veličina. Má-li náhodná veličina ln X normální rozdělení N (µ, σ 2 ), potom náhodná veličina X má logaritmicko-normální rozdělení LN (µ, σ 2 ) (viz odstavec 4.5.2 poznámka 1). 4.5.1 Definice. Spojitá náhodná veličina X má logaritmicko-normální rozdělení LN (µ, σ 2 ), právě když funkce hustoty pravděpodobnosti má tvar (ln x−µ)2 1 √ e− 2σ2 pro x > 0, f (x) = xσ 2π 0 x ≤ 0. Distribuční funkce je definovaná rovnicí x Z f (t)dt pro x > 0, F (x) = 0 0 x ≤ 0.
Grafy funkce hustoty a distribuční funkce tohoto rozdělení jsou na obrázku 4.6. Zobrazené rozdělení má parametry µ = 0 a σ 2 = 1.
Obr. 4.6 Funkce hustoty a distribuční funkce logaritmicko-normálního rozdělení LN (0, 1)
Následující tabulka uvádí hodnoty některých číselných charakteristik rozdělení 2 LN (µ, σ 2 ) – ozn. ω = eσ : E(X) eµ+σ
2 /2
D(X) 2
e2µ+σ (ω − 1)
α3 (X) √
ω − 1(ω + 2)
α4 (X)
kvantily xP
Mo(X)
ω 4 + 2ω 3 + 3ω 2 − 6
eµ+σuP
eµ−σ
2
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
97
4.5.2 Poznámky. 1. Uvažujme náhodnou veličinu X = eY , která je rostoucí funkcí náhodné veličiny Y s normálním rozdělením N (µ, σ 2 ). Použitím jednoduché transformace y(x) = ln x pro x > 0 potom dostaneme funkci hustoty f (x) z definice 4.5.1 logaritmicko-normálního rozdělení. Parametry tohoto rozdělení µ = E(ln X) a σ 2 = D(ln X) jsou shodné s parametry rozdělení náhodné veličiny Y = ln X ∼ N (µ, σ 2 ). 2. Při popisu náhodné veličiny X ∼ LN (µ, σ 2 ) postupujeme tak, že ji transformujeme na náhodnou veličinu ln X ∼ N (µ, σ 2 ); potom pro normovanou náhodnou veličinu U platí ln X − µ ∼ N (0, 1). U= σ Platí tedy F (x) = Φ(u) = Φ ln x−µ , kde Φ(u) je distribuční funkce rozdělení N (0, 1) σ ln x−µ au= σ . 3. Logaritmicko-normální rozdělení se v praxi uplatňuje jako model příjmových a mzdových rozdělení, v oblasti normování práce, doby obnovy, opravy, výměny zařízení, velikosti částic sypkých materiálů, v teorii spolehlivosti a v dalších situacích. Toto rozdělení je často vhodné pro popis nízkých koncentrací, malých hmotností, krátkých délek apod. 4. V Excelu lze hodnotu distribuční funkce určit pomocí funkce LOGNORMDIST, která má 3 parametry: první parametr je hodnota náhodné veličiny X, pro kterou počítáme distribuční funkci F (x), druhý je střední hodnota rozdělení ln X (tedy parametr µ) a třetí je směrodatná odchylka rozdělení ln X (tedy parametr σ). Ověřte si určení distribuční funkce pro rozdělení LN (2; 0,49) F (4) . ln 4−2 • pomocí tabulek: F (4) = Φ 0,7 = Φ(−0,88) = 1 − Φ(0,88) = 1 − 0,81057 = = 0,18943; . • v Excelu: F (4) = LOGNORMDIST(4; 2; 0,7) = 0,19032. Tento výpočet je proveden s úplnou přesností. 5. P % kvantil pro logaritmicko-normální rozdělení je možné určit v Excelu pomocí funkce LOGINV(P ; µ; σ). Ověřte si určení 30% kvantilu x0,30 pro rozdělení LN (2; 0,49) . • pomocí výpočtu: x0,30 = eµ+σ·u0,30 = e2−0,7·0,524 = 5,12023; . • v Excelu: x0,30 = LOGINV(0,3; 2; 0,7) = 5,11880. Tento výpočet je proveden s úplnou přesností. 4.5.3 Příklad. Na základě dlouhodobého pozorování víme, že hmotnost balíku zasílaného poštou je náhodná veličina s logaritmicko-normálním rozdělením LN (1,6; 0,16). Jaký je podíl balíků o hmotnosti nad 10 kg? Určete střední hodnotu, směrodatnou odchylku a medián hmotnosti balíků. Řešení. Parametry rozdělení naší náhodné veličiny jsou µ = 1,6 a σ 2 = 0,16, tedy σ= 0,40. Hledaná pravděpodobnost je P (X > 10) = 1−P (X ≤ 10) = 1−F (10) = 1− . . ln 10−1,6 −Φ = 1 − Φ(1,76) = 1 − 0,98080 = 0,039. Při přepravě balíků se vyskytují 0,40
98
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
necelé 4 % balíků o hmotnosti nad 10 kg. Prověřte si tento výsledek také výpočtem v Excelu. 2 Střední hodnotu naší veličiny určíme ze vztahu E(X) = eµ+σ /2 = e1,6+0,16/2 = . = e1,68 = 5,366. Prakticky to znamená, že dlouhodobě je průměrná hmotnost balíků přibližně 5,40 kg. 2 . Dále určíme pomocný parametr ω = eσ = e0,16 = 1,1735. Pro rozptyl platí D(X) = 2 . = e2µ+σ p (ω − 1) = e3,2+0,16 · 0,1735 = 4,995. Odtud dostaneme směrodatnou odchylku . σ(X) = D(X) = 2,235. . Medián je 50% kvantil, který dostaneme ze vztahu Me(X) = eµ = e1,6 = 4,953. To znamená, že 50 % balíků dosahuje hmotnosti těsně pod 5 kg. Prověřte si i tento výsledek výpočtem v Excelu. 4.5.4 Úkoly a problémy k modulu 4.5 1. Odvoďte vztah pro určení kvantilu xP = eµ+σuP . 2. Náhodná veličina X má logaritmicko-normální rozdělení LN (3,5; 0,36). a) Vypočítejte hodnotu distribuční funkce F (x) v bodě x = 16, střední hodnotu, směrodatnou odchylku, modus, 5% kvantil a koeficient šikmosti této náhodné veličiny. b) Určete pravděpodobnost, že náhodná veličina nabude hodnoty menší než 20, větší než 30, od 20 do 30. Co platí pro součet těchto pravděpodobností a proč? 3. Bylo zjištěno, že velikost částic štěrku (v mm) určitého typu je náhodná veličina, která má logaritmicko-normální rozdělení s parametry µ = 2,5 a σ 2 = 0,16. a) Určete podíl štěrku o velikosti 10–15 mm v jedné dodávce. b) Vypočítejte střední hodnotu, směrodatnou odchylku, medián, koeficient šikmosti a špičatosti velikosti částic štěrku. 4. Bylo zjištěno, že doba potřebná k provedení opravy přístroje (v hod.) má logaritmicko-normální rozdělení s parametry µ = 2,3 a σ 2 = 0,64. a) Určete pravděpodobnost, že oprava určitého přístroje bude trvat minimálně 15 hod. b) Vypočítejte střední hodnotu, rozptyl, směrodatnou odchylku, medián a modus doby trvání opravy. 5. Předpokládejme, že odstupy mezi jedoucími vozidly na dálnici (ve vteřinách) představují náhodnou veličinu, která má logaritmicko-normální rozdělení s parametry µ = 1,27 a σ 2 = 0,49. a) Určete podíl vozidel, jejichž odstupy budou 4 až 5 vteřin. b) Vypočítejte střední hodnotu, rozptyl, směrodatnou odchylku, medián, modus a koeficient šikmosti odstupu jedoucích vozidel. Řešení. 2. a) 0,113; 39,646; 26,098; 23,104; 12,343; 2,260; b) 0,200; 0,564; 0,236;
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
99
3. a) 38,6 %; b) 13,197; 5,497; 12,182; 1,322; 3,260; 4. a) 0,305; b) 13,736; 169,139; 13,005; 9,974; 5,259; 5. a) 11,7 %; b) 4,549; 13,087; 3,618; 3,561; 2,181; 2,888. Další úlohy na procvičování: [Kříž 1]:
4.6
str. 73–74.
Rozdělení některých funkcí náhodných veličin
Pro řešení řady praktických statistických úloh mají zvláštní význam rozdělení určitých funkcí normálně rozdělených náhodných veličin. Jedná se o rozdělení χ2 (Pearsonovo1 ), t (Studentovo) a F (Fisherovo-Snedecorovo2 ). U všech těchto rozdělení budeme značit náhodné veličiny i jejich hodnoty stejně, a to symboly používanými právě pro jednotlivá rozdělení, tj. χ2 , t a F . 4.6.1 Definice. Uvažujme nezávislé náhodné veličiny U1 , U2 , . . . , Uν , z nichž každá má rozdělení normované normální rozdělení N (0, 1), potom součet čtverců těchto veličin, tj. veličina ν X 2 2 2 2 χ = U1 + U2 + · · · + Uν = Ui2 i=1
má rozdělení χ2 – Pearsonovo rozdělení – s ν stupni volnosti.
Obr. 4.7 Funkce hustoty a distribuční funkce Pearsovova χ2 rozdělení pro stupně volnosti ν = 5 a 16 1 2
čti „chí kvadrátÿ rozdělení, resp. „Pírsnovoÿ rozdělení čti „Fišerovo-Snedekorovoÿ rozdělení
100
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
4.6.2 Poznámky. 1. Počtem stupňů volnosti ν se rozumí počet nezávislých sčítanců v součtu. Rozdělení χ2 závisí na tomto jediném parametru ν. Pearsonovo rozdělení o ν stupních volnosti značíme χ2 (ν), má-li veličina χ2 rozdělení χ2 (ν), zapíšeme χ2 ∼ χ2 (ν). Funkci hustoty pravděpodobnosti χ2 rozdělení uvádět pro jeho složitost nebudeme. Pro střední hodnotu a rozptyl veličiny χ2 platí E(χ2 ) = ν a D(χ2 ) = 2ν. S rostoucím počtem stupňů volnosti se rozdělení χ2 blíží k rozdělení normálnímu. Porovnejte funkce hustoty rozdělení χ2 pro ν = 5 a ν = 16 na obr. 4.7. 2. Distribuční funkce tohoto rozdělení F (χ2 ) bývá tabelována pro různé stupně volnosti a různé hodnoty χ2 . Zejména z praktických důvodů jsou však důležitější kvantily tohoto rozdělení, tj. hodnoty χ2P , které splňují pro daný počet stupňů volnosti vztah P (χ2 ≤ χ2P ) = P . V tabulce V jsou uvedené kvantily χ2P (ν) pro ν = 1, 2, . . . , 30 a pro vybrané pravděpodobnosti P . Pro určení kvantilů je možné v Excelu použít funkci CHIINV(1 − P ; ν). Ověřte si určení kvantilů χ20,05 (16) a χ20,95 (5) • v tabulkách: χ20,05 (16) = 7,96 a χ20,95 (5) = 11,1; . • v Excelu: χ20,05 (16) = CHIINV(0,95; 16) = 7,962 . a χ20,95 (5) = CHIINV(0,05; 14) = 11,070. p √ 3. S rostoucím ν se rozdělení veličiny 2χ2 − 2ν − 1 blíží k normovanému normálnímu p √ rozdělení N (0, 1). Jestliže n > 30, potom lze tedy ze vztahu 2χ2P − 2ν − 1 ≈ uP odvodit vztah pro stanovení přibližné hodnoty P % kvantilu s ν stupni volnosti ve tvaru
χ2P (ν) ≈
2 1 √ 2ν − 1 + uP , 2
kde uP je kvantil rozdělení N (0, 1). Porovnejte hodnotu kvantilu χ20,975 (60) určenou √ 2 2 . √ • výpočtem: χ20,975 (60) ≈ 12 2 · 60 − 1 + u0,975 = 12 119 + 1,96 = 82,802; . • v Excelu: χ20,975 (60) = CHIINV(0,025; 60) = 83,298.
4.6.3 Definice. Uvažujme dvě nezávislé náhodné veličiny U a χ2 , přičemž veličina U má normované normální rozdělení N (0, 1) a veličina χ2 má Pearsonovo rozdělení χ2 (ν) s ν stupni volnosti, potom veličina U t= q
χ2 ν
má t – Studentovo rozdělení – s ν stupni volnosti.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
101
Obr. 4.8 Funkce hustoty a distribuční funkce Studentova t rozdělení pro stupně volnosti ν = 2 a 20
4.6.4 Poznámky. 1. Počet stupňů volnosti je jediný parametr tohoto rozdělení. Studentovo rozdělení o ν stupních volnosti značíme t(ν), má-li veličina t rozdělení t(ν), zapíšeme t ∼ t(ν). Funkci hustoty pravděpodobnosti t-rozdělení uvádět pro jeho složitost nebudeme. Důležitou vlastností tohoto rozdělení je, že funkce hustoty je symetrická podle nuly. Pro střední ν pro ν > 2. hodnotu a rozptyl veličiny t platí E(t) = 0 pro ν > 1 a D(t) = ν−2 S rostoucím počtem stupňů volnosti se rozdělení t blíží k normovanému normálnímu rozdělení. V praktických situacích lze už pro ν > 30 považovat rozdělení N (0, 1) za dostatečnou aproximaci rozdělení Studentova. Porovnejte funkce hustoty rozdělení t(ν) pro ν = 2 a ν = 20 na obr. 4.8. 2. Pro různé pravděpodobnosti P a různé stupně volnosti ν jsou tabelované kvantily tP tohoto rozdělení, tj. hodnoty tP , které splňují pro daný počet stupňů volnosti vztah P (t ≤ tP ) = P . V tabulce IV jsou uvedené kvantily tP (ν) pro ν = 1, 2, . . . , 30 a pro vybrané pravděpodobnosti P > 0,5. Kvantily tP pro P < 0,5 dostaneme s využitím symetrie rozdělení podle bodu t = 0 ze vztahu tP (ν) = −t1−P (ν). Pro určení kvantilů tP (ν) je možné v Excelu použít funkci TINV(2 · (1 − P ); ν). Ověřte si určení kvantilů t0,95 (20) a t0,05 (20) • v tabulkách: t0,95 (20) = 1,725 a t0,05 (20) = −t0,95 (20) = −1,725; . • v Excelu: t0,95 (20) = TINV(0,10; 20) = 1,725 . a t0,05 (20) = −t0,95 (20) = −TINV(0,10; 20) = −1,725. 3. Už víme, že s rostoucím ν se Studentovo rozdělení blíží k normovanému normálnímu rozdělení N (0, 1). Jestliže je tedy ν > 30, potom lze kvantily tP nahradit kvantily uP rozdělení N (0, 1), tj. platí tP (ν) ≈ uP . Porovnejte hodnotu kvantilu t0,99 (120) určenou
102
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
• výpočtem: t0,99 (120) ≈ u0,99 = 2,326; . • v Excelu: t0,99 (120) = TINV(0,02; 120) = 2,358. 4.6.5 Definice. Uvažujme dvě nezávislé náhodné veličiny χ21 a χ22 , z nichž první má rozdělení χ2 s ν1 stupni volnosti a druhá má rozdělení χ2 s ν2 stupni volnosti, potom veličina χ2 χ2 F = 1 : 2 ν1 ν2 má rozdělení F – Fisherovo-Snedecorovo rozdělení – s ν1 a ν2 stupni volnosti.
Obr. 4.9 Funkce hustoty a distribuční funkce Fisherova-Snedecorova F rozdělení pro stupně volnosti ν1 = 3 a ν2 = 50 resp. ν1 = 30 a ν2 = 20
4.6.6 Poznámky. 1. Toto rozdělení má dva parametry, stupně volnosti. Fisherovo rozdělení s ν1 a ν2 stupni volnosti značíme F (ν1 , ν2 ), má-li veličina F rozdělení F (ν1 , ν2 ), zapíšeme F ∼ F (ν1 , ν2 ). Funkci hustoty pravděpodobnosti F -rozdělení uvádět pro jeho složitost 2 pro ν2 > 2. Fischerovo nebudeme. Pro střední hodnotu veličiny F platí E(F ) = ν2ν−2 rozdělení je asymetrické. Na obr. 4.9 jsou zobrazené funkce hustoty pro stupně volnosti ν1 = 3 a ν2 = 50 resp. ν1 = 30 a ν2 = 20. 2. Pro dané pravděpodobnosti P > 0,5 a stupně volnosti ν1 a ν2 jsou tabelované kvantily FP tohoto rozdělení, tj. hodnoty FP , které splňují pro dané stupně volnosti vztah P (F ≤ FP ) = P . V tabulkách VI/1 a VI/2 jsou uvedené kvantily FP (ν1 , ν2 ) pro pravděpodobnosti P = 0,95 a P = 0,975. Kvantily FP pro P < 0,5 dostaneme s využitím vztahu 1 FP (ν1 , ν2 ) = . F1−P (ν2 , ν1 ) Pro určení kvantilů FP (ν1 , ν2 ) je možné v Excelu použít funkci FINV(1 − P ; ν1 ; ν2 ). Ověřte si určení kvantilů F0,95 (20, 15) a F0,025 (14, 24) . 1 • v tabulkách: F0,95 (20, 15) = 2,328 a F0,025 (14, 24) = F0,9751(24;14) = 2,789 = 0,359;
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
103
. • v Excelu: F0,95 (20, 15) = FINV(0,05; 20; 15) = 2,328 . a F0,025 (14, 24) = FINV(0,975; 14; 24) = 0,359. 3. Problém při určování kvantilů může nastat v případě, kdy máme k dispozici pouze tabulky hodnot kvantilů, ve kterých budou naše stupně volnosti ν1 resp. ν2 ležet mezi hodnotami uvedenými v záhlaví nebo legendě tabulky. V praktických situacích bude často možné se spokojit s určením intervalu, ve kterém hledaný kvantil bude ležet. V tabulkách nalezneme maximální a minimální hodnotu kvantilu odpovídající tabelovaným stupňům volnosti; tyto dvě hodnoty potom tvoří hranice intervalu, ve kterém hledaný kvantil bude ležet. Ověřte si, že např. pro kvantil F0,975 (42, 38) platí F0,975 (42, 38) ∈ (1,803; 2,009). Přesnou hodnotu lze však získat v Excelu: F0,975 (42, 38) = FINV(0,025; 42; 38) = 1,886. 4.6.7 Úkoly a problémy k modulu 4.6 1. Náhodná veličina t má Studentovo rozdělení t(ν). a) Určete 99% kvantily pro ν = 4 a 23. b) Určete 2,5% kvantily pro ν = 5 a 27. c) Určete přibližně hodnoty kvantilů t0,10 (45) a t0,95 (126). 2. Náhodná veličina t má Studentovo rozdělení t(24). a) Určete 2,5% a 97,5% kvantily náhodné veličiny t. b) Určete pravděpodobnost P (t > −2,064). 3. Náhodná veličina χ2 má Pearsonovo rozdělení χ2 (ν). a) Určete 95% kvantily pro ν = 3 a 26. b) Určete 10% kvantily pro ν = 6 a 24. c) Určete přibližně hodnoty kvantilů χ20,975 (80) a χ20,05 (120). 4. Náhodná veličina χ2 má Pearsonovo rozdělení χ2 (15). a) Určete 5% a 95% kvantily náhodné veličiny χ2 . b) Určete pravděpodobnost P (χ2 < 7,26). 5. Náhodná veličina F má Fisherovo rozdělení F (ν1 , ν2 ). a) Určete F0,95 (8, 15) a F0,975 (9, 4). b) Určete F0,05 (22, 4) a F0,025 (10, 20). c) Určete F0,95 (55, 40) a F0,975 (30, 34). 6. Náhodná veličina F má Fisherovo rozdělení F (12, 7). a) Určete 5% a 95% kvantily náhodné veličiny F . b) Určete pravděpodobnost P (F < 4,666). Řešení. 1. a) 3,747; 2,500; b) −2,571; −2,052; c) −1,282; 1,645; 2. a) −2,064; 2,064; b) 0,975; 3. a) 7,81; 38,9; b) 2,20; 15,7; c) 106,14; 95,42; 4. a) 7,26; 25,0; b) 0,05;
104
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
5. a) 2,641; 8,905; b) 0,355; 0,292; c) (1,637; 1,693); (1,943; 2,074); 6. a) 0,343; 3,575; b) 0,975. Další úlohy na procvičování: [Kříž 1]:
str. 75–76.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
105
4.7 Shrnutí 4. kapitoly Klíčová slova: spojitá náhodná veličina, rovnoměrné rozdělení, exponenciální rozdělení, normální rozdělení, normované normální rozdělení, logaritmicko-normální rozdělení, kvantily v tabulkách, Pearsonovo rozdělení, Studentovo rozdělení, Fisherovo-Snedecorovo rozdělení Základní úlohy: • • • • •
Popis spojité náhodné veličiny pomocí funkce hustoty a distribuční funkce. Určování číselných charakteristik a jejich interpretace. Řešení pravděpodobnostních úloh. Pochopení vztahu mezi normálním a normovaným normálním rozdělením. Určování kvantilů z tabulek a v Excelu.
Doporučená literatura pro hlubší studium: [Kříž 2]: [Cyhelský]: [Hindls]:
str. 22–31, str. 166–185, odstavce 9.1, 9.2, 9.4, 9.5 a 9.6, str. 84–95.
4.8 Test ke kapitole 4 A. Teoretická část 1. Rozhodněte, která tvrzení jsou pravdivá: a) Pro spojitou náhodnou veličinu je P (X = 0) > 0. b) Rovnoměrné rozdělení je symetrické podle střední hodnoty. c) Distribuční funkce exponenciálního rozdělní je pro x > α konvexní. d) Střední hodnota náhodné veličiny s normálním rozdělením je vždy rovna nule. e) Pravděpodobnost, že náhodná veličina X s normálním rozdělením N (7, 4) nabude hodnoty z intervalu (5, 9) je 0,683. f) Studentovo rozdělení se při rostoucím počtu stupňů volnosti blíží k rozdělení N (0, 1). g) Logaritmicko-normální rozdělení je vždy zešikmené doleva.
B. Praktická část 1. Při zaokrouhlování čísla na 1 desetinné místo se dopouštíme chyby, která je náhodnou veličinou s rovnoměrným rozdělením.
106
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
a) Určete parametry α a β tohoto rozdělení a popište náhodnou veličinu pomocí funkce hustoty. b) Jaká je pravděpodobnost, že absolutní chyba při zaokrouhlování nepřekročí hodnotu 0,03? 2. Dlouhodobým pozorováním jsme zjistili, že v určité prodejně je podíl zákazníků, kteří jsou obslouženi do 3 minut, 40 %. Předpokládejme, že doba čekání na obsluhu je náhodná veličina s exponenciálním rozdělením. a) Určete parametry α a δ tohoto rozdělení a popište náhodnou veličinu pomocí distribuční funkce. b) Jaká je střední doba čekání na obsluhu a jaká bude doba čekání, kterou polovina zákazníků nepřekročí. c) Jaký podíl zákazníků bude čekat na obsluhu déle než 6 minut. 3. Máslo se strojově porcuje a balí na automatu. Dlouhodobým pozorováním bylo zjištěno, že linka produkuje balíčky másla s průměrnou hmotností 246 gramů a směrodatnou odchylkou 8 gramů. Předpokládejme, že hmotnost másla je náhodná veličina s normálním rozdělením. a) Jaká je pravděpodobnost, že náhodně vybraná kostka másla bude mít hmotnost menší než 250 gramů? b) Určete pravděpodobnost, že náhodně vybraná kostka másla bude mít hmotnost větší než 240 gramů. c) Jaký je v celé produkci másla podíl balení, která projdou výstupní kontrolou, pokud je povolená tolerance od stanovené hmotnosti 250 gramů ± 10 gramů? 4. Odhadujeme, že průměrná mzda v jistém odvětví je 25,305 tisíce Kč se směrodatnou odchylkou 3,774 tisíce Kč. Předpokládejme, že rozdělení mezd se řídí logaritmickonormálním rozdělením. a) Určete oba parametry rozdělení LN (µ, σ 2 ). b) Jaká je pravděpodobnost, že mzda náhodně vybraného pracovníka tohoto odvětví překročí 30 tisíc Kč? c) Jaký je podíl pracovníků tohoto odvětví, jejichž mzda je 20–26 tisíc Kč? Řešení. A. 1. a) nepravda; b) pravda; c) nepravda; d) nepravda; e) pravda; f) pravda; g) pravda. B. 1. a) −0,05; 0,05; f (x): 1/10−1 pro x ∈ (0,05; 0,05); 0 jinak; b) 0,6; 2. a) 0; 5,87; F (x): 1 − e−x/5,87 pro x > 0, 0 jinak; b) 5,87 (5:52:12); 4,0688; c) 40; 3. a) 0,691; b) 0,773; c) 0,733; 4. a) 3,22; 0,022; b) 0,111; c) 53,7 %.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
5
107
TEORETICKÉ ZÁKLADY STATISTIKY
V předcházejících dvou kapitolách (3. a 4. kapitola) jsme se zabývali teoretickými modely rozdělení náhodných veličin. Každou náhodnou veličinu jsme popisovali speciálně definovanými funkcemi a teoretickými charakteristikami (viz 2. kapitola). V praktické statistice se setkáváme se situacemi, kdy náhodné pokusy (viz 1. kapitola) opakujeme nezávisle na sobě a dostáváme tak nezávislé výsledky těchto pokusů. Z takto napozorovaných – naměřených hodnot lze sestavit rozdělení relativních četností a informaci o tomto rozdělení shrnout do číselných charakteristik. Takové rozdělení a jemu odpovídající charakteristiky budeme označovat jako empirický model rozdělení relativních četností. Při dodržování jistých podmínek bude možné očekávat, že empirický model (rozdělení četností a empirické charakteristiky) se bude blížit teoretickému modelu (rozdělení pravděpodobností a teoretické charakteristiky), a to tím více, čím větší bude počet realizovaných pokusů. Tato ústřední myšlenka se nejčastěji vyslovuje v podobě tzv. zákona velkých čísel a v podobě limitních vět. Skutečnost, že ze všech teoretických modelů rozdělení náhodných veličin má zvláštní postavení normální rozdělení, se odrazí také v tom, že mezi teoretickými základy statistiky si uvedeme i větu o normálním rozdělení. Cílem kapitoly je: • seznámit se se zákonem velkých čísel, • seznámit se s centrální limitní větou, která tvoří teoretické základy statistiky v situacích, kdy u náhodné veličiny nelze předpokládat normalitu, • vytvořit teoretické základy fungování statistiky za předpokladu, že normální rozdělení sledované veličiny je opodstatněné.
5.1
Zákon velkých čísel
Už bylo naznačeno, že v praktické statistice půjde o to, abychom prostřednictvím empirického modelu odhadli model teoretický, nebo alespoň některou jeho důležitou část. O kvalitě takového odhadu bude za jistých podmínek rozhodovat i počet provedených pokusů. Jinak řečeno, při dodržování jistých podmínek bude možné očekávat, že se empirický model bude blížit teoretickému modelu tím více, čím větší bude počet realizovaných pokusů. Toto je obecné vyjádření zákona velkých čísel. Je nutné si však uvědomit, že přibližování empirických vlastností modelu vlastnostem teoretickým nemá charakter matematické konvergence, ale konvergence pravděpodobnostní.
108
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
5.1.1 Definice. Uvažujme posloupnost náhodných veličin X1 , X2 , . . . , Xn a reálné číslo c. Tato posloupnost konverguje podle pravděpodobnosti ke konstantě c, jestliže pro každé > 0 platí lim P (|Xn − c| < ) = 1. n→∞
5.1.2 Poznámky. 1. Pravděpodobnostní konvergencí rozumíme tedy skutečnost, že při vzrůstajícím počtu pokusů se pravděpodobnost větších odchylek empirických hodnot od teoretických stále P zmenšuje. Pro pravděpodobnostní konvergenci budeme používat označení Xn → c. 2. Budeme-li tedy hodnoty náhodných veličin X1 , X2 , . . . , Xn chápat jako výsledky nezávislých náhodných pokusů – empirických (naměřených či zjištěných) hodnot, a náhodnou veličinu X jako jejich teoretický protějšek, můžeme pravděpodobnostní konvergenci také rozumět tak, že empirické charakteristiky se s rostoucím počtem hodnot blíží svým teoretickým protějškům. Zákon velkých čísel se uvádí v různých podobách, podle toho, o které charakteristice pojednává. Nejjednodušší formou je Bernoulliova věta3 , která uvádí vztah mezi relativní četností a pravděpodobností. 5.1.3 Věta. (Bernoulliova) Mějme posloupnost vzájemně nezávislých náhodných veličin X1 , X2 , . . . , Xn , které mají stejné alternativní rozdělení A(π), 0 < π < 1. Potom pro náhodnou veličinu počet nastoupení sledovaného jevu A v n nezávislých P pokusech X = ni=1 Xi platí X lim P − π < = 1 pro každé > 0. n→∞ n
5.1.4 Poznámka. Bernoulliovu větu je možné jednoduše vyslovit takto: Pokud roste počet provedených pokusů, potom relativní četnost jevu A v posloupnosti nezávislých pokusů pravděpodobnostně konverguje k pravděpodobnosti π, tj. X P → π. n Praktický význam této věty tedy spočívá v tom, že při velkém počtu pokusů můžeme odhadovat pravděpodobnost nastoupení jevu A jeho relativní četností. To lze také vnímat jako důležitou souvislost pojmů relativní četnost na straně empirické a pravděpodobnost na straně teoretické. 5.1.5 Příklad. Při předvolebním průzkumu se z celkového počtu 2360 respondentů vyslovilo ve prospěch politické strany A 194 respondentů. Interpretujte relativní četnost hlasů pro stranu A. 3
čti „bernuliovaÿ věta
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
109
194 . Řešení. Relativní četnost hlasů pro stranu A je podíl 2360 = 0,0822. Je blízký číslu π, které představuje neznámou pravděpodobnost – neznámý skutečný podíl voličů volících stranu A. Pokud by se konaly volby v době průzkumu, bylo by možné očekávat přibližně 8,22 % hlasů pro stranu A.
5.2
Součet nezávislých náhodných veličin
Při popisu teoretických modelů jsme zatím uvažovali pouze jedinou náhodnou veličinu a tu jsme popisovali pomocí funkcí a číselných charakteristik. V různých praktických situacích však narazíme na posloupnosti náhodných veličin, u kterých nás bude zajímat rozdělení součtu nebo průměru n nezávislých náhodných veličin. V některých případech se přesné rozdělení tohoto součtu stanoví snadno (např. pro veličiny mající Poissonovo rozdělení), častěji je však stanovení tohoto přesného rozdělení obtížné. Pro dostatečně velká n lze však za dosti obecných podmínek aproximovat toto rozdělení rozdělením normálním. 5.2.1 Věta. Uvažujme posloupnost nezávislých náhodných veličin X1 , X2 , . . . , Xn . Jestliže n → ∞, potom náhodné veličiny X = X1 + X2 + · · · + Xn =
n X
Xi ,
(5.1)
i=1 n
X=
1X X = Xi n n i=1
(5.2)
mají za velmi obecných podmínek přibližně normální rozdělení. Říkáme, že normální rozdělení je limitním zákonem rozdělení a že náhodné veličiny X resp. X mají tzv. asymptoticky normální rozdělení.
5.2.2 Poznámky. 1. Veličinu X definovanou vztahem (5.1) budeme nazývat součet n nezávislých náhodných veličin (nebo také úhrn), a veličinu X definovanou vztahem (5.2) budeme nazývat průměr n nezávislých náhodných veličin. V některých praktických situacích bude vhodnější použít stejnou veličinu (5.2), avšak ve tvaru X/n, kterou budeme označovat jako podíl (ve smyslu relativní četnosti). 2. Předpoklad n → ∞ ve větě 5.2.1 představuje v reálných situacích požadavek na dostatečně velké n. Tomu je možné rozumět takto: Čím větší bude n, tím více se bude rozdělení obou veličin (5.1) a (5.2) blížit normálnímu rozdělení. To, zda bude odchylka skutečného rozdělení od normálního rozdělení přijatelná, bude vždy záležet na praktické situaci. Bude proto vhodné v konkrétních případech také určit n, pro které aproximaci budeme akceptovat.
110
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
5.2.3 Věta. Mějme nezávislé náhodné veličiny X1 , X2 , . . . , Xn , z nichž každá má střední hodnotu rovnou číslu µ a rozptyl rovný číslu σ 2 . Potom a) E(X) = nµ a D(X) = nσ 2 , (5.3) b) E(X) = E
X n
= µ a D(X) = D
X n
=
σ2 . n
(5.4)
Důkaz. Podle předpokladu pro nezávislé náhodné veličiny Xi platí E(Xi ) = µ a D(Xi ) = σ 2 pro i = 1, 2, . . . , n. Potom a) pro veličinu (5.1), tj. X = X1 + X2 + · · · + Xn , podle (2.6) platí E(X) = E(X1 ) + E(X2 ) + · · · + E(Xn ) = µ + µ + · · · + µ = nµ, podle (2.8) platí D(X) = D(X1 ) +PD(X2 ) + · · · + D(Xn ) = σ 2 + σ 2 + · · · + σ 2 = nσ 2 , n 1 b) pro veličinu (5.2), tj. X = X i=1 Xi , n =n X 1 podle (2.5) platí E(X) = E n = n E(X) = n1 nµ = µ, 1 1 σ2 2 podle (2.7) platí D(X) = D X n = n2 D(X) = n2 nσ = n .
5.2.4 Příklad. a) Uvažujme dodávku 500 kusů výrobků stejného typu. Podíl vadných výrobků tohoto typu na výrobě jsou 3 %. Pravděpodobnost vadného výrobku v dodávce je tedy π = 0,03. Nechť alternativní náhodné veličiny Xi představují počet vadných kusů u každého výrobku v dodávce – hodnota 0 znamená dobrý výrobek a hodnota 1 znamená vadný výrobek. Tyto náhodné veličiny jsou nezávislé. Potom náhodná veličina X = X1 +X2 +· · ·+X500 představuje celkový počet vadných výrobků v celé dodávce. Tato veličina má binomické rozdělení B(500; 0,03) se střední hodnotou E(X) = nπ = 500 · 0,03 = 15 a rozptylem D(X) = nπ(1 − π) = 500 · 0,03 · 0,97 = = 14,55. b) Mezi studenty přijímanými ke studiu na fakultě je dlouhodobě 10 % takových, kteří jsou přijímáni bez přijímacích testů. Letos bude přijato 300 uchazečů. Nechť náhodné veličiny Xi představují přijetí resp. nepřijetí uchazeče bez testů – z povahy věci vyplývá, že Xi mají alternativní rozdělení a jejich hodnoty 0 a 1 znamenají uchazeč nepřijat resp. přijat bez testů. Tyto veličiny jsou rozhodně nezávislé. Potom náhodná veličina X = X1 + X2 + · · · + X300 představuje celkový počet uchazečů přijatých bez testů. Tato veličina má binomické rozdělení B(300; 0,10) se střední hodnotou E(X) = nπ = 300 · 0,10 = 30 a rozptylem D(X) = nπ(1 − π) = = 300 · 0,10 · 0,90 = 27. Potom náhodná veličina X/n představuje podíl uchazečů přijatých testů. Tato veličina má střední hodnotu bez X 1 E n = n E(X) = n1 nπ = π = 0,1 a rozptyl D Xn = n12 D(X) = n12 nπ(1 − π) = π(1−π) = 0,1·0,9 = 0, 0003. n 300
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
111
c) Cesta z domu do školy trvá studentovi v průměru 40 minut, odhad směrodatné odchylky je 6 minut. Během semestru musí student tuto cestu absolvovat 75krát. Dobu denně strávenou cestou do školy můžeme považovat za náhodnou veličinu Xi pro i = 1, 2, . . . , 75 se střední hodnotou E(Xi ) = 40 a směrodatnou odchylkou σ(Xi ) = 6. Předpokládejme, že všechny tyto náhodné veličiny mají stejné rozdělení (vzhledem k dalším úvahám není vůbec důležité, jaké rozdělení tyto veličiny skutečně mají). Potom náhodná veličina X = X1 + X2 + · · · + X75 představuje celkovou dobu strávenou cestou do školy. Tato veličina má rozdělení se střední hodnotou E(X) = nµ = 75 · 40 = 3000 a rozptylem D(X) = nσ 2 = 75 · 62 = 2700 (střední hodnota je v minutách, rozptyl je ve čtvercích minut). Potom náhodná veličina X představuje průměrnou dobu strávenou denně cestou do školy. Tato veličina má 2 36 = 0,48. střední hodnotu E(X) = µ = 40 a rozptyl D(X) = σn = 75 5.2.5 Příklad. S využitím Excelu budeme demonstrovat rozdělení náhodné veličiny X s rovnoměrným rozdělením R(0, 10) a rozdělení součtu náhodných veličin X1 , X2 , . . . , Xn pro n = 3 a 10, které pocházejí ze stejného rozdělení. Řešení. Po otevření prázdného excelovského listu otevřeme okno s generátorem pseudonáhodných čísel (Nástroje / Analýza dat / Generátor pseudonáhodných čísel4 ). V tomto okně nastavíme Počet proměnných: 10, Počet náhodných čísel: 150, Typ rozdělení: Rovnoměrné, Parametry Od: 0, Do: 10, Základ generátoru: 121, Výstupní oblast: $A$1. Po potvrzení nastavení se v prvních 150 řádcích a 10 sloupcích vygeneruje 1500 čísel (v oblasti A1:J150), která lze považovat za náhodný výběr z rovnoměrného rozdělení R(0, 10).
Obr. 5.1 Nastavení parametrů v okně Generátor pseudonáhodných čísel 4
náhodná čísla vytvořená uměle
112
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Vygenerované hodnoty rozdělíme do 10 intervalů 0–1, 1–2, . . . , 9–10. Hranice intervalů 1, 2, . . . , 10 vložíme do 1 sloupce (např. L1:L10). Rozdělení čísel do našich intervalů provedeme pomocí funkce ČETNOSTI(Data; Hodnoty), kde Data je datová oblast (A1:J150) a Hodnoty je vektor hranic (L1:L10). Protože funkce vrací matici, musí být zadaná jako maticový vzorec, tj. stiskem kláves CTRL+SHIFT+ENTER. Výsledné četnosti zobrazíme do 1 sloupce (např. M1:M10). Tyto četnosti zobrazíme graficky pomocí sloupcového grafu, viz obr. 5.2.
Obr. 5.2 Rozdělení četností dat z rovnoměrného rozdělení R(0, 10)
Dále na pozici sloupce D vložíme prázdný sloupec (Vložit / Sloupec). Data v každém jednom řádku sloupců A, B a C nyní sečteme pomocí funkce SUMA, jedná se vždy o součet 3 hodnot. Součty umístíme např. do nového sloupce D (oblast D1:D150) a rozdělíme je pomocí funkce ČETNOSTI do 10 intervalů 0–3, 3–6, . . . , 27–30. Hranice intervalů 3, 6, . . . , 30 vložíme do 1 sloupce (např. M11:M20). Výsledné četnosti zobrazíme do 1 sloupce (např. N11:N20). Tyto četnosti také zobrazíme graficky pomocí sloupcového grafu, viz obr. 5.3.
Obr. 5.3 Rozdělení četností součtů dat z rovnoměrného rozdělení R(0, 10) pro n = 3
A konečně pro původně vygenerovaná data provedeme v každém jednom řádku součet hodnot pomocí funkce SUMA, jedná se vždy o součet 10 hodnot. Tyto součty
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
113
umístíme do sloupce L (oblast L1:L150) a rozdělíme je pomocí funkce ČETNOSTI do 10 intervalů 25–30, 30–35, . . . , 70–75. Hranice intervalů 30, 35, . . . , 75 vložíme do 1 sloupce (např. M1:M10). Výsledné četnosti zobrazíme do 1 sloupce (např. N1:N10). Tyto četnosti také zobrazíme graficky pomocí sloupcového grafu, viz obr. 5.4.
Obr. 5.4 Rozdělení četností součtů dat z rovnoměrného rozdělení R(0, 10) pro n = 10
Na obr. 5.2 je zřetelně vidět, že vygenerovaná data pocházejí z rovnoměrného rozdělení na intervalu 0–10. Na obrázcích 5.3 a 5.4 jsou zobrazené součty sestrojené z původního rovnoměrného rozdělení pro n = 3 a n = 10; pro tyto výběry je vidět, že rozdělení četností je pro větší n poměrně blízké rozdělení normálnímu. A to je východisko pro úvahy o centrální limitní větě.
5.3
Centrální limitní věta
Normálním rozdělením jako limitním rozdělením, k němuž se za určitých podmínek blíží řada jiných rozdělení, se zabývá centrální limitní věta. Podstatou centrální limitní věty je tvrzení, že náhodná veličina X, která vznikla jako součet velkého počtu vzájemně nezávislých veličin X1 , X2 , . . . , Xn , má za velmi obecných podmínek přibližně normální rozdělení. Dále se budeme věnovat z praktických důvodů dvěma formulacím centrální limitní věty, které se liší podmínkami, jejichž splnění se požaduje. Nejjednodušším tvarem centrální limitní věty je Moivre-Laplaceova5 věta, jistým zobecněním je Lévy-Lindebergova věta. 5.3.1 Věta. (Moivre-Laplaceova) Nechť náhodná veličina X (viz (5.1)) je součet n nezávislých náhodných veličin X1 , X2 , . . . , Xn , z nichž každá má alternativní rozdělení A(π) se stejným parametrem π, 0 < π < 1. Náhodná veličina X má binomické rozdělení B(n, π) se střední hodnotou E(X) = nπ a rozptylem D(X) = nπ(1 − π).
5
čti „moávr-laplasovaÿ
114
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Potom pro normovanou náhodnou veličinu X − nπ U=p nπ(1 − π)
(5.5)
platí limitní vztah lim P (U ≤ u) = Φ(u),
n→∞
kde Φ(u) je distibuční funkce normovaného normálního rozdělení N (0, 1). 5.3.2 Poznámky. 1. Moivre-Laplaceova věta tedy říká, že při dostatečně velkém počtu nezávislých pokusů konverguje binomické rozdělení k rozdělení normálnímu. Řekneme, že veličina X s binomickým rozdělením má asymptoticky normální rozdělení, nebo také že veličina (5.5) má přibližně rozdělení N (0, 1). A zapíšeme X − nπ U=p ≈ N (0, 1). nπ(1 − π) Pro určení pravděpodobnosti P (X ≤ x) potom užijeme distribuční funkci rozdělení N (0, 1): ! x − nπ P (X ≤ x) = F (x) ≈ Φ p . nπ(1 − π) 2. Aproximace binomického rozdělení normálním rozdělením je zpravidla vhodná, když pro rozptyl platí D(X) > 9, tj. nπ(1 − π) > 9. (5.6) Odtud lze určit n, pro které lze aproximaci akceptovat. Např. pro π = 0,4 dostaneme n ≥ 38, pro π = 0,03 dostaneme n ≥ 310. 5.3.3 Věta. (Moivre-Laplaceova věta pro podíl) Nechť náhodná veličina X (viz (5.1)) je součet n nezávislých alternativních veličin X1 , X2 , . . . , Xn , které mají stejný X X parametr π, 0 < π < 1, a náhodná veličina n má střední hodnotu E n = π a rozptyl D Xn = π(1−π) . Potom pro normovanou náhodnou veličinu n X −π √ U = pn n π(1 − π)
platí limitní vztah lim P (U ≤ u) = Φ(u),
n→∞
kde Φ(u) je distribuční funkce normovaného normálního rozdělení N (0, 1).
(5.7)
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
115
5.3.4 Poznámka. Tato věta říká, že při dostatečně velkém počtu nezávislých pokusů konverguje rozdělení veličiny Xn k normálnímu rozdělení, tedy že má asymptoticky normální rozdělení. Také lze říci, že veličina (5.7) má přibližně normální rozdělení N (0, 1). A zapíšeme X −π √ U = pn n ≈ N (0, 1). π(1 − π) Pravděpodobnost P Xn ≤ p lze potom přibližně vyjádřit pomocí rozdělení N (0, 1): P
X ≤p n
= F (p) ≈ Φ
p−π p
π(1 − π)
√
! n .
Zobecněním věty Moivre-Laplaceovy je věta Lévy-Lindebergova. Náhodnou veličinou X je v tomto případě součet n nezávislých náhodných veličin, které mají libovolný identický zákon rozdělení pravděpodobností. Věta neklade žádné předpoklady na typ rozdělení pravděpodobností, sledovaná náhodná veličina může být diskrétní i spojitá. Větu uvedeme ve dvou tvarech, které se od sebe liší možnostmi praktického uplatnění, a to pro součet a pro průměr. 5.3.5 Věta. (Lévy-Lindebergova věta pro součet) Nechť náhodná veličina X (viz (5.1)) je součet n nezávislých náhodných veličin X1 , X2 , . . . , Xn , které mají libovolný identický zákon rozdělení s konečnou střední hodnotou E(Xi ) = µ a konečným rozptylem D(Xi ) = σ 2 . Potom pro střední hodnotu a rozptyl náhodné veličiny X platí E(X) = nµ a D(X) = nσ 2 a pro normovanou náhodnou veličinu X − nµ U= √ nσ 2
(5.8)
platí limitní vztah lim P (U ≤ u) = Φ(u),
n→∞
kde Φ(u) je distribuční funkce normovaného normálního rozdělení N (0, 1).
5.3.6 Poznámky. 1. Lévy-Lindebergova věta pro součet P říká, že pro dostatečně velký počet nezávislých pokusů konverguje veličina X = ni=1 Xi k normálnímu rozdělení, má tedy asymptoticky normální rozdělení. Odtud také plyne, že veličina (5.8) má přibližně normální rozdělení N (0, 1); zapíšeme X − nµ U= √ ≈ N (0, 1). nσ 2
116
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Pro výpočet pravděpodobnosti P (X ≤ x) potom užijeme distribuční funkci rozdělení N(0, 1): x − nµ P (X ≤ x) = F (x) ≈ Φ √ . nσ 2 2. Aproximace součtu n nezávislých náhodných veličin normálním rozdělením platí pro dostatečně velké n; v praktických situacích se nejčastěji doporučuje n > 30. Totéž platí také pro průměr n nezávislých náhodných veličin. 5.3.7 Věta. (Lévy-Lindebergova věta pro průměr) Nechť náhodná veličina X (viz (5.2)) je průměr n nezávislých náhodných veličin X1 , X2 , . . . , Xn , které mají libovolný identický zákon rozdělení s konečnou střední hodnotou E(Xi ) = µ a konečným rozptylem D(Xi ) = σ 2 . Potom pro střední hodnotu a rozptyl náhodné veličiny X platí σ2 E(X) = µ a D(X) = n a pro normovanou náhodnou veličinu U=
X − µ√ n σ
(5.9)
platí limitní vztah lim P (U ≤ u) = Φ(u),
n→∞
kde Φ(u) je distribuční funkce normovaného normálního rozdělení N (0, 1).
5.3.8 Poznámka. Také Lévy-Lindebergova věta pro průměr hovoří o tom, že veličina Pn 1 X = n i=1 Xi má asymptoticky normální rozdělení a veličina (5.9) má přibližně normální rozdělení N (0, 1), což zapíšeme U=
X − µ√ n ≈ N (0, 1). σ
Pravděpodobnost P (X ≤ x) přibližně určíme pomocí distribuční funkce rozdělení N (0, 1): x − µ√ P (X ≤ x) = F (x) ≈ Φ n . σ 5.3.9 Poznámka k opravě na spojitost. Používáme-li normální rozdělení jako aproximaci pro rozdělení diskrétní náhodné veličiny, doporučuje se, zejména u silněji asymetrických rozdělení, provést tzv. opravu na spojitost, která tuto aproximaci zlepšuje. Při výpočtu pravděpodobností P (X ≤ x) resp. P (X ≥ x) pomocí normální
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
117
aproximace jsou totiž výsledky podhodnocené. Naopak při výpočtu pravděpodobností P (X < x) resp. P (X > x) pomocí normální aproximace jsou výsledky nadhodnocené. Podstata výpočtů pravděpodobností pomocí opravy na spojitost spočívá v tom, že výpočet pravděpodobnosti pro argument x provedeme přibližně pomocí argumentu x + 0,5 resp. x − 0,5. Příklady provedených korekcí ukazuje tabulka: před opravou po opravě
X<3 X < 2,5
X≤3 X < 3,5
X=5 4,5 < X < 5,5
X≥7 X > 6,5
X>7 X > 7,5
5.3.10 Příklad. Uvažujme dodávku 500 kusů výrobků stejného typu. Podíl vadných výrobků tohoto typu na výrobě jsou 3 % (srovnej příklad 5.2.4a). Určete pravděpodobnost, že v dodávce bude počet vadných výrobků od 10 do 20 kusů. Řešení. Náhodná veličina počet vadných výrobků v dodávce má binomické rozdělení s parametry n = 500 a π = 0,03. Určení hledané pravděpodobnosti pomocí pravděpodobnostní funkce binomického rozdělení P . 500 P (10 ≤ X ≤ 20) = 20 · 0, 03i · 0, 97500−i = p(10) + p(11) + · · · + p(20) = 0,853 i=10 i je však pro ruční výpočet příliš náročný. Protože nπ(1 − π) = 500 · 0,03 · 0,97 = 14,55 > 9, nahradíme binomické rozdělení rozdělením normálním s parametry µ = nπ = 500 · 0,03 = 15 a σ 2 = nπ(1 − π) = 14,55 a podle Moivre-Laplaceovy věty (viz 1. poznámka přibližně 5.3.2) vypočítáme . 20−15 10−15 P (10 ≤ X ≤ 20) = F (20) − F (10) ≈ Φ √14,55 − Φ √14,55 = Φ(1,31) − Φ(−1,31) = . = 2 · Φ(1,31) − 1 = 2 · 0,90490 − 1 = 0,810. Výpočet pravděpodobnosti je možné provést také s opravou na spojitost: 20,5−15 √ − P (10 ≤ X ≤ 20) ≈ P (9,5 < X < 20,5) = F (20,5) − F (9,5) ≈ Φ 14,55 . . 9,5−15 −Φ √ = Φ(1,44) − Φ(−1,44) = 2 · Φ(1,44) − 1 = 2 · 0,92507 − 1 = 0,850. 14,55 5.3.11 Příklad. Mezi studenty přijímanými ke studiu na fakultě je dlouhodobě 10 % takových, kteří jsou přijímáni bez přijímacích testů. Letos bude přijato 300 uchazečů (srovnej příklad 5.2.4b). Jaká je pravděpodobnost, že podíl studentů, kteří budou letos přijati bez přijímacích testů, bude mezi 9 a 13 %? Řešení. Tato veličina má binomické rozdělení B(300; 0,10) se střední hodnotou E(X) = 30 a rozptylem D(X) = 27. Potom náhodná veličina X/n představuje podíl uchazečů přijatých bez testů. Tato veličina má střední hodnotu E(X/n) = 0,10 a rozptyl D(X/n) = 0,0003. Protože D(X) > 9, je možné rozdělení veličiny X/n aproximovat normálním rozdělením a pro určení hledané pravděpodobnosti použít veličinu (5.7): √ √ 0,09−0,10 √ P (0,09 < Xn < 0,13) = F (0,13) − F (0,09) ≈ Φ √0,13−0,10 300 − Φ 300 = 0,10·0,90 0,10·0,90 . = Φ(1,73) − Φ(−0,58) = Φ(1,73) − [1 − Φ(0,58)] = 0,95818 + 0,71904 − 1 = 0,677.
118
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
5.3.12 Příklad. Cesta z domu do školy trvá studentovi v průměru 40 minut, odhad směrodatné odchylky je 6 minut. Během semestru musí student tuto cestu absolvovat 75krát (srovnej příklad 5.2.4c). Jaká je pravděpodobnost, že doba strávená cestou do školy během celého semestru nepřekročí 49 hodin? Řešení. Náhodná veličina doba potřebná na cestu do školy je spojitá veličina se střední hodnotou E(X) = 40 a směrodatnou odchylkou σ(X) = 6. Protože počet opakování náhodné veličiny X je n = 75 > 30, není rozdělení náhodné veličiny důležité. Sledovaná veličina celková doba potřebná na cestu do školy, označme ji M = X1 + + X2 + · · · + X75 , je součtem n náhodných veličin X. Tato veličina má rozdělení se střední hodnotou E(M ) = nµ = 75 · 40 = 3000 a rozptylem D(M ) = nσ 2 = 75 · 62 = = 2700. Protože n > 30, je možné rozdělení veličiny M podle Lévy-Lindebergovy věty 5.3.5 aproximovat normálním rozdělením. Nejprve ještě převedeme 49 hodin na 2940 minut a pro určení hledané pravděpodobnosti použijeme veličinu (5.8): . 2940−3000 √ P (M ≤ 2940) = F (2940) ≈ Φ = Φ(−1,15) = 1 − Φ(1,15) = 1 − 2700 . − 0,87493 = 0,125. Přesvědčte se sami, že ke stejnému výsledku dospějete, když parametry vyjádříte v hodinách. 5.3.13 Příklad. Na základě dlouhodobého pozorování lze předpokládat, že životnost zářivky je náhodná veličina, která má exponenciální rozdělení s parametry α = 0 a δ = 12 tisíc hodin. Určete pravděpodobnost, že průměrná životnost zářivek v dodávce 100 kusů překročí 13 tisíc hodin. Řešení. Náhodná veličina životnost zářivky je spojitá veličina se střední hodnotou E(X) = α + δ = 0 + 12 = 12 a rozptylem D(X) = δ 2 = 122 = 144. Potom podle Lévy-Lindebergovy věty 5.3.7 pro dostatečně velké n platí, že průměrná životnost má asymptoticky normální rozdělení se střední hodnotou E(X) = µ = 12 a rozptylem 2 D(X) = σn = 144 = 1,44. Protože n > 100, lze pro určení pravděpodobnosti použít 100 veličinu (5.9): √ . P (X > 13) = 1 − P (X ≤ 13) = 1 − F (13) ≈ 1 − Φ 13−12 100 = 1 − Φ(0,83) = 1 − 12 . − 0,79673 = 0,203. 5.3.14 Úkoly a problémy k modulu 5.3 1. Náhodné veličiny Xi , i = 1, 2, . . . , n, jsou nezávislé a stejně rozdělené veličiny se střední hodnotou µ = 5 a směrodatnou odchylkou σ = 2. Je-li n = 400, určete a) x tak, aby se v intervalu (µ−x; µ+x) nacházel jejich průměr s pravděpodobností 0,995, b) pravděpodobnost, že jejich průměr padne do intervalu (4,719; 5,281), c) x tak, aby se v intervalu (nµ − x; nµ + x) nacházel jejich součet s pravděpodobností 0,975, d) pravděpodobnost, že jejich součet padne do intervalu (1910,4; 2089,6).
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
119
2. Pravděpodobnost zásahu cíle při jednom výstřelu je 0,8. Jaká je pravděpodobnost, že se počet zásahů při 200 výstřelech nebude lišit od střední hodnoty počtu zásahů o více než 10 zásahů? Výpočet proveďte a) bez opravy na spojitost, b) s opravou na spojitost. 3. Pravděpodobnost, že na určitém stroji bude vyroben vadný výrobek, je 0,08. Jaká je pravděpodobnost, že z 500 nezávisle vyrobených kusů za směnu bude vadných a) maximálně 6 %, b) minimálně 4,5 %? 4. Průměrná spotřeba studené vody v jedné domácnosti je 92 m3 za rok, směrodatná odchylka je 24 m3 . Jaká je pravděpodobnost, že v 750 domácnostech bude a) celková spotřeba 68 až 71 tisíc m3 , b) průměrná spotřeba vyšší než 90 m3 ? 5. Počet chyb na jedné straně skripta je náhodná veličina se střední hodnotou 1,2 a směrodatnou odchylkou 0,75. Jaká je pravděpodobnost, že ve skriptu o 165 stranách bude více než 200 chyb? Řešení. 1. a) 0,281; 2. a) 0,923; 3. a) 0,049; 4. a) 0,935; 5. 0,417.
b) b) b) b)
0,995; c) 89,60; d) 0,975; 0,937; 0,998; 0,989;
Další úlohy na procvičování: [Kříž 1]:
5.4
str. 76–81.
Věta o normálním rozdělení
Centrální limitní věta se obecně zabývá případy, kdy se sledované náhodné veličiny neřídí normálním rozdělením. Nečiní dokonce ani žádnou podmínku, že teoretický model musíme znát. Pouze je potřebné, aby náhodné veličiny X1 , X2 , . . . , Xn byly nezávislé a rozdělení těchto veličin byla shodná. V praktických situacích ale často bude normální rozdělení sledované náhodné veličiny přijatelným modelem. Proto nebude účelné pro popis součtu a průměru náhodných veličin X1 , X2 , . . . , Xn použít centrální limitní větu. V těchto případech budeme využívat jako metodu nebo jako teoretické východisko použitých metod tzv. větu o normálním rozdělení.
120
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
5.4.1 Pn Věta. (O normálním rozdělení pro součet) Nechť náhodná veličina X = = i=1 Xi je součet n nezávislých náhodných veličin X1 , X2 , . . . , Xn , které mají shodné normální rozdělení s parametry µ a σ 2 . Potom pro střední hodnotu a rozptyl náhodné veličiny X platí E(X) = nµ a D(X) = nσ 2 a pro normovanou náhodnou veličinu X − nµ U= √ nσ 2
(5.10)
platí P (U ≤ u) = Φ(u), kde Φ(u) je distribuční funkce normovaného normálního rozdělení N (0, 1).
5.4.2 Poznámka. Věta o normálním pro součet říká, že pro jakýkoliv počet Prozdělení n nezávislých pokusů má veličina X = i=1 Xi normální rozdělení s parametry nµ a nσ 2 . √ Odtud také plyne, že veličina U = X−nµ ∼ N (0, 1). Pro výpočet pravděpodobnosti nσ 2 P (X ≤ x) potom užijeme distribuční funkci rozdělení N (0, 1): P (X ≤ x) = F (x) = Φ
x − nµ √ nσ 2
.
5.4.3 Věta. P (O normálním rozdělení pro průměr) Nechť náhodná veličina X = = Xn = n1 ni=1 Xi je průměr n nezávislých náhodných veličin X1 , X2 , . . . , Xn , které mají shodné normální rozdělení s parametry µ a σ 2 . Potom pro střední hodnotu a rozptyl náhodné veličiny X platí E(X) = µ a D(X) =
σ2 n
a pro normovanou náhodnou veličinu U=
X − µ√ n σ
platí P (U ≤ u) = Φ(u), kde Φ(u) je distribuční funkce normovaného normálního rozdělení N (0, 1).
(5.11)
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
121
5.4.4 Poznámka. Věta o normálním rozdělení pro Pnprůměr říká, že pro jakýkoliv X 1 počet nezávislých pokusů má veličina X = n = n i=1 Xi normální rozdělení s pa√ 2 rametry µ a σn . Odtud také plyne, že veličina U = X−µ n ∼ N (0, 1). Pro výpočet σ pravděpodobnosti P (X ≤ x) potom užijeme distribuční funkci rozdělení N (0, 1): x − µ√ P (X ≤ x) = F (x) = Φ n . σ 5.4.5 Příklad. Na jistém typu obráběcích strojů se sleduje délka konkrétní pracovní operace, která má normální rozdělení se střední hodnotou 21 minut a směrodatnou odchylkou 1,3 minuty. a) Jaká je pravděpodobnost, že na náhodně vybraném stroji nepřekročí pracovní operace 20 minut? b) S jakou pravděpodobností bude při obrábění 10 kusů obrobků stačit celková doba 200 minut? Řešení. a) U náhodné veličiny délka pracovní operace předpokládáme normální rozdělení se střední hodnotou µ = 21 min. a směrodatnou odchylkou σ = 1,3 min. Pro hledanou pravděpodobnost platí: . . = Φ(−0,77) = 1 − Φ(0,77) = 1 − 0,77935 = 0,221. P (X ≤ 20) = Φ 20−21 1,3 b) Při obrábění 10 kusů nás zajímá náhodná veličina celková doba obrábění – označíme ji M – která má normální√rozdělení se střední hodnotou nµ = 10 · 21 = 210 min. a . směrodatnou odchylkou σ n = 4,111 min. K určení naší pravděpodobnosti užijeme veličinu (5.10): . 200−210 = Φ(−2,43) = 1 − Φ(2,43) = 1 − 0,99245 = 0,00755. P (M ≤ 200) = Φ √ 10·1,69 Porovnejte oba výsledky a vysvětlete, co prakticky znamenají. 5.4.6 Příklad. Výška postavy u dívek ve věku 10 let má normální rozdělení se střední hodnotou 141 cm a směrodatnou odchylkou 4 cm. Uvažujme 5. ročník na ZŠ, ve kterém je 14 dívek. a) Jaký je podíl dívek větších než 140 cm? b) S jakou pravděpodobností překročí průměrná výška dívek v 5. ročnících 140 cm? Řešení. a) O náhodné veličině výška postavy 10letých dívek je známo, že má normální rozdělení s parametry µ = 141 a směrodatnou odchylkou σ = 4. Určit podíl dívek větších než 140 cm znamená určit pravděpodobnost toho, že náhodná veličina X >. 140: P (X > 140) = 1−P (X ≤ 140) = 1−Φ 140−141 = 1−Φ(−0,25) = Φ(0,25) = 0,599. 4 b) K určení pravděpodobnosti, s jakou průměrná výška překročí 140 cm, užijeme veličinu (5.11): √ . P (X > 140) = 1 − P (X ≤ 140) = 1 − Φ 140−141 14 = 1 − Φ(−0,94) = 4 . = Φ(0,94) = 0,826. Porovnejte oba výsledky a vysvětlete, co prakticky znamenají. Při praktickém užívání statistiky budeme potřebovat ještě dvě speciální funkce náhodných veličin, o kterých pojednává následující věta o normálním rozdělení.
122
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
5.4.7 Věta. Mějme posloupnost normálně rozdělených nezávislých náhodných veličin X1 , X2 , . . . , Xn s parametry µ a σ 2 . Nechť n
1X Xi X= n i=1
n
1 X a S = (Xi − X)2 n − 1 i=1 2
jsou funkce těchto náhodných veličin, potom veličina t=
X − µ√ n S
(5.12)
má Studentovo t-rozdělení s n − 1 stupni volnosti a veličina χ2 =
(n − 1)S 2 σ2
(5.13)
má Pearsonovo χ2 rozdělení s n − 1 stupni volnosti.
5.4.8 Poznámka. Obě veličiny – Studentova i Pearsonova – se užijí v praktické statistice při konstrukci intervalových odhadů a při odvozování kritérií pro testování parametrů µ a σ 2 normálního rozdělení. Této problematice se budeme věnovat v navazujícím dílu této učební pomůcky. 5.4.9 Příklad. a) Určete pravděpodobnost toho, že Studentova náhodná veličina t(18) nepřekročí hodnotu 1,734. b) Jakou hodnotu bude s touto pravděpodobností nabývat parametr µ veličiny t (viz (5.12)), když X = 12,4 a S = 1,8? Řešení. a) Ze zadání úlohy je zřejmé, že určit máme jednostrannou pravděpodobnost pro Studentovu veličinu s 18 stupni volnosti a že hodnota 1,734 je kvantilem této veličiny. Máme tedy určit P (t < 1,734) = F (1,734). K tomu využijeme • tabulky hodnot kvantilů Studentova rozdělení: v řádku ν = 18 nalezneme hodnotu 1,734 a v záhlaví tabulky odečteme příslušnou pravděpodobnost 0,950. Platí tedy P (t < 1,734) = 0,950 a kvantil t0,95 (18) = 1,734; . • funkci TDIST v Excelu: P (t < 1,734) = F (1,734) = 1−TDIST(1,734; 18; 1) = 0,950, protože funkce TDIST(tP ; ν; 1) dává P (t > tP ). b) Je-li P (t < 1,734) = 0,950, potom s touto pravděpodobností platí 12,4 − µ √ 19 < 1,734; 1,8 řešením této nerovnice je µ > 11,684.
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
123
5.4.10 Úkoly a problémy k modulu 5.4 1. Měření výrobku je doprovázeno náhodnými chybami, které mají normální rozdělení se směrodatnou odchylkou 4 mm. Určete a) pravděpodobnost, že chyba měření nepřekročí v absolutní hodnotě 2 mm, b) pravděpodobnost, že průměrná chyba 32 měření nepřekročí v absolutní hodnotě 2 mm, c) počet měření, aby se jejich aritmetický průměr neodchyloval od správné hodnoty o více než ±1 mm s pravděpodobností minimálně 0,95. 2. Při zjišťování sklizňových ztrát se zjišťuje hmotnost nesklizených zrn na ploše 1 m2 , u které se předpokládá normální rozdělení s parametry µ = 11 a σ = 1,6 gramů. Určete a) podíl metrových ploch, na kterých ztráty nepřekročí 10 gramů, b) pravděpodobnost toho, že na ploše 5 × 5 m nepřekročí ztráty 270 gramů. 3. Doba ošetření pacienta u lékaře je náhodná veličina, u které lze předpokládat normální rozdělení se střední hodnotou 14 minut a směrodatnou odchylkou 5 minut. Jaká je pravděpodobnost, že a) náhodně vybraný pacient stráví na vyšetření více než 20 minut, b) celková doba vyšetření u 24 objednaných pacientů překročí 6 hodin? 4. Určete pravděpodobnost toho, že Pearsonova náhodná veličina χ2 (18) překročí hodnotu 9,39. Jakou hodnotu bude s touto pravděpodobností nabývat parametr σ 2 veličiny χ2 (viz (5.13)), když S 2 = 2,56? Řešení. 1. a) 0,383; b) 0,995; c) 62; pomůcka µ = 0; 2. a) 0,264; b) 0,264; 3. a) 0,115; b) 0,164; 4. 0,95; 4,907.
124
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
5.5 Shrnutí 5. kapitoly Klíčová slova: zákon velkých čísel, pravděpodobnostní konvergence, Bernoulliova věta, součet nezávislých náhodných veličin, centrální limitní věty, Moivre-Laplaceova věta, LévyLindebergova věta pro součet a průměr, oprava na spojitost, věta o normálním rozdělení pro součet, pro průměr, pro Studentovu a Pearsonovu veličinu Základní úlohy: • Pochopení významu zákona velkých čísel. • Pochopení významu součtu nezávislých náhodných veličin pro statistiku. • Řešení pravděpodobnostních úloh s využitím centrálních limitních vět a věty o normálním rozdělení. • Pochopení rozdílů mezi centrálními limitními větami a větou o normálním rozdělení. Doporučená literatura pro hlubší studium: [Kříž 2]: [Cyhelský]: [Hindls]:
str. 31–35, str. 188–193, str. 96–99.
5.6 Test ke kapitole 5 A. Teoretická část 1. Rozhodněte, která tvrzení jsou pravdivá: a) Relativní četnost jevu A v posloupnosti nezávislých pokusů je rovna pravděpodobnosti nastoupení jevu A. b) Binomické rozdělení nelze vždy aproximovat normálním rozdělením. c) Součet n nezávislých náhodných veličin s identickým rozdělením a střední hodnotou µ a rozptylem σ 2 má střední hodnotu nµ a rozptyl nσ 2 . d) Součet n nezávislých náhodných veličin s identickým rozdělením a střední hodnotou µ a rozptylem σ 2 má asymptoticky normální rozdělení. e) Průměr n nezávislých náhodných veličin s identickým rozdělením a střední hodnotou µ a rozptylem σ 2 má střední hodnotu µ/n a rozptyl σ 2 /n. 2. a) Vysvětlete základní rozdíl mezi Moivre-Laplaceovou větou a Lévy-Lindebergovou větou pro součet. b) Vysvětlete základní rozdíl mezi Lévy-Lindebergovou větou pro průměr a větou o normálním rozdělení pro průměr. c) O jakých veličinách pojednává věta o normálním rozdělení pro t a χ2 ? Jaký je její význam?
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
125
B. Praktická část 1. Nechť náhodná veličina X je součet n nezávislých náhodných veličin X1 , X2 , . . . , Xn , s alternativním rozdělením, které mají stejný parametr π, 0 < π < 1. Dokažte, že náhodná veličina P = X/n má střední hodnotu E(P ) = π a rozptyl D(P ) = π(1−π) . n 2. Ve volbách dalo 52 % voličů hlas koaličním stranám. Jaká je pravděpodobnost, že při průzkumu veřejného mínění o rozsahu 2600 respondentů získala převahu opozice? 3. Životnost tužkové baterie má exponenciální rozdělení s parametry α = 0 a δ = 45 hodin. Určete pravděpodobnost, že a) náhodně vybraná baterie bude fungovat déle než 50 hodin, b) průměrná životnost 100 baterií v zásilce bude větší než 50 hodin. 4. Jistý člověk jezdí do zaměstnání i zpět metrem v době, kdy vlaky metra jezdí v pravidelných 6minutových intervalech. Jaká je pravděpodobnost, že celková doba čekání na metro při cestách do zaměstnání a zpět během 1 měsíce (21 pracovních dní) bude a) delší než 100 minut, b) 1,5 až 2 hodiny? 5. Dlouhodobým pozorováním bylo zjištěno, že doba potřebná k nalezení a odstranění poruchy stroje má střední hodnotu 30 minut a směrodatnou odchylku 12 minut. Určete a) dobu, kterou si vyžádá nalezení a odstranění poruchy u 40 strojů, požadujeme-li, aby tato doba nebyla s pravděpodobností 0,95 překročena, b) pravděpodobnost, že průměrná doba nalezení a odstranění poruchy u 40 strojů nepřekročí 32 minut. 6. Z chovného rybníka bylo vyloveno 15 kaprů a po zvážení byli puštěni zpět. Na základě naměřených hmotností byla odhadnuta střední hodnota 2,2 kg a směrodatná odchylka 0,6 kg. Předpokládejme, že hmotnost kaprů se řídí normálním rozdělením. Do rybníka bylo vysazeno 1500 ks kapřího plůdku a počítá se s 10% úmrtností. Jaká je pravděpodobnost, že a) náhodně vylovený kapr bude vážit méně než 2 kg, b) při výlovu celého rybníka získáme alespoň 3000 kg kaprů? Řešení. A. 1. a) nepravda; b) pravda; c) pravda; d) pravda; e) nepravda. B. 2. 0,021; 3. a) 0,329; b) 0,133; 4. a) 0,990; b) 0,297; 5. a) 1324; b) 0,853; 6. a) 0,371; b) 0,087.
126
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
127
Seznam literatury [Anděl]
ANDĚL, J. Základy matematické statistiky. 1. vyd. Praha : Matfyzpress, 2005. 358 s. ISBN 80-86732-40-1.
[Budíková]
BUDÍKOVÁ, M., MIKOLÁŠ, Š., OSECKÝ, P. Teorie pravděpodobnosti a matematická statistika. 2. vyd. Brno : PřF MU, 1998. 127 s. ISBN 80-210-1832-1.
[Cyhelský]
CYHELSKÝ, L., HINDLS, R., KAHOUNOVÁ, J. Elementární statistická analýza. 2. vyd. Praha : Management Press, 1999. 319 s. ISBN 80-7261-003-1.
[Hebák]
HEBÁK, P., KAHOUNOVÁ, J. Počet pravděpodobnosti v příkladech 5. vyd. Praha : Informatorium, 2005. 310 s. ISBN 80-733-040-7.
[Hindls]
HINDLS, R., SEGER, J. Statistické metody v tržním hospodářství. 1. vyd. Praha : Victoria Publishing, 1995. 435 s. ISBN 80-7187-058-7.
[Kahounová] KAHOUNOVÁ, J., BÍLKOVÁ, D. Počet pravděpodobnosti 2. vyd. Praha : Oeconomica, 2007. 153 s. ISBN 80-245-0714-9. [Karpíšek]
KARPÍŠEK, Z. Matematika IV – Statistika a pravděpodobnost. 1. vyd. Brno : FSI VUT, 2002. 169 s. ISBN 80-214-2055-3.
[Kříž 1]
KŘÍŽ, O. Sbírka úloh ze statistiky I. 1. vyd. Vyškov : VVŠ PV, 1999. 117 s. ISBN 80-7231-033-X.
[Kříž 2]
KŘÍŽ, O., NEUBAUER, J. Sylaby přednášek ze statistiky. 1. vyd. Vyškov : VVŠ PV, 2003. 104 s.
[Marek]
MAREK, L. Statistika pro ekonomy – aplikace. 1. vyd. Praha : Professional Publishing, 2005. 420 s. ISBN 80-8619-68-1.
[Otipka]
OTIPKA, P., ŠMAJSTRLA, V. Pravděpodobnost a statistika. 1. vyd. Ostrava : VŠB, 2006. 266 s. ISBN 80-248-1194-4.
[Pavlík]
PAVLÍK, J. Aplikovaná statistika. 1. vyd. Praha : VŠCHT, 2005. 172 s. ISBN 80-7080-569-2.
128
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
STATISTICKÉ TABULKY I. Hodnoty pravděpodobnostní funkce Poissonova rozdělení II. Hodnoty distribuční funkce rozdělení N (0, 1) III. Kvantily normálního rozdělení N (0, 1) IV. Kvantily tP Studentova rozdělení t s ν stupni volnosti V. Kvantily χ2P Pearsonova rozdělení χ2 s ν stupni volnosti VI. Kvantily FP Fisher-Snedecorova rozdělení F s ν1 a ν2 stupni volnosti
129
130
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Tabulka I
Hodnoty pravděpodobnostní funkce Poissonova rozdělení x 0 1 2 3 4 5 6 x 0 1 2 3 4 5 6 7 8 9 x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
0,1 0,90484 0,09048 0,00452 0,00015
0,8 0,44933 0,35946 0,14379 0,03834 0,00767 0,00123 0,00016 0,00001
1,5 0,22313 0,33469 0,25102 0,12551 0,04707 0,01412 0,00353 0,00075 0,00014 0,00002
0,2 0,81873 0,16375 0,01637 0,00109 0,00005
0,9 0,40657 0,36591 0,16466 0,04940 0,01111 0,00200 0,00030 0,00003
2,0 0,13533 0,27067 0,27067 0,18045 0,09022 0,03609 0,01203 0,00343 0,00086 0,00019 0,00004 0,00001
0,3 0,74082 0,22224 0,03334 0,00333 0,00025 0,00001
λ 0,4 0,67032 0,26813 0,05362 0,00715 0,00071 0,00005
1,0 0,36788 0,36788 0,18394 0,06131 0,01533 0,00307 0,00051 0,00007
λ 1,1 0,33287 0,36616 0,20139 0,07384 0,02030 0,00446 0,00082 0,00013 0,00002
2,5 0,08208 0,20521 0,25652 0,21376 0,13360 0,06680 0,02783 0,00994 0,00311 0,00086 0,00021 0,00005 0,00001
λ 3,0 0,04979 0,14936 0,22404 0,22404 0,16803 0,10082 0,05041 0,02160 0,00810 0,00270 0,00081 0,00022 0,00005 0,00001
0,5 0,60653 0,30327 0,07581 0,01263 0,00158 0,00016 0,00001
0,6 0,54881 0,32929 0,09878 0,01976 0,00296 0,00035 0,00003
0,7 0,49659 0,34761 0,12166 0,02839 0,00497 0,00069 0,00008
1,2 0,30119 0,36143 0,21686 0,08674 0,02602 0,00625 0,00125 0,00021 0,00003
1,3 0,27253 0,35429 0,23029 0,09979 0,03243 0,00843 0,00183 0,00034 0,00005 0,00001
1,4 0,24660 0,34523 0,24166 0,11278 0,03947 0,01105 0,00258 0,00051 0,00009 0,00001
3,5 0,03020 0,10569 0,18496 0,21578 0,18881 0,13217 0,07710 0,03855 0,01686 0,00656 0,00230 0,00073 0,00021 0,00006 0,00001
4,0 0,01831 0,07326 0,14652 0,19537 0,19537 0,15629 0,10420 0,05954 0,02977 0,01323 0,00529 0,00192 0,00064 0,00020 0,00006 0,00001
4,5 0,01111 0,04999 0,11248 0,16872 0,18981 0,17083 0,12812 0,08236 0,04633 0,02316 0,01042 0,00426 0,00160 0,00055 0,00018 0,00005 0,00002
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
131
Tabulka I – dokončení
x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
5,0 0,00674 0,03369 0,08422 0,14037 0,17547 0,17547 0,14622 0,10444 0,06528 0,03627 0,01813 0,00824 0,00343 0,00132 0,00047 0,00016 0,00005 0,00001
6,0 0,00248 0,01487 0,04462 0,08923 0,13385 0,16062 0,16062 0,13768 0,10326 0,06884 0,04130 0,02253 0,01126 0,00520 0,00223 0,00089 0,00033 0,00012 0,00004 0,00001
7,0 0,00091 0,00638 0,02234 0,05213 0,09123 0,12772 0,14900 0,14900 0,13038 0,10140 0,07098 0,04517 0,02635 0,01419 0,00709 0,00331 0,00145 0,00060 0,00023 0,00008 0,00003 0,00001
λ 8,0 0,00033 0,00268 0,01073 0,02863 0,05725 0,09160 0,12214 0,13959 0,13959 0,12408 0,09926 0,07219 0,04813 0,02962 0,01692 0,00902 0,00451 0,00212 0,00094 0,00040 0,00016 0,00006 0,00002 0,00001
9,0 0,00012 0,00111 0,00500 0,01499 0,03374 0,06073 0,09109 0,11712 0,13176 0,13176 0,11858 0,09702 0,07276 0,05037 0,03238 0,01943 0,01093 0,00578 0,00289 0,00137 0,00062 0,00026 0,00011 0,00004 0,00001
10,0 0,00004 0,00045 0,00227 0,00756 0,01891 0,03783 0,06305 0,09008 0,11260 0,12511 0,12511 0,11374 0,09478 0,07291 0,05208 0,03472 0,02170 0,01276 0,00709 0,00373 0,00186 0,00089 0,00040 0,00017 0,00007 0,00003 0,00001
12,0 0,00001 0,00007 0,00044 0,00177 0,00531 0,01274 0,02548 0,04368 0,06552 0,08736 0,10484 0,11437 0,11437 0,10557 0,09049 0,07239 0,05429 0,03832 0,02555 0,01613 0,00968 0,00553 0,00302 0,00157 0,00079 0,00038 0,00017 0,00008 0,00003 0,00001
132
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Tabulka II
Hodnoty distribuční funkce normálního rozdělení N (0, 1) u 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39
φ(u) 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
u 0,40 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79
φ(u) 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490 0,75804 0,76115 0,76424 0,76730 0,77035 0,77377 0,77637 0,77935 0,78230 0,78524
u 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19
φ(u) 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891 0,84134 0,84375 0,84614 0,84850 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
u 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58 1,59
φ(u) 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92786 0,92922 0,93056 0,93189 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
133
Tabulka II – dokončení
u 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67 1,68 1,69 1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,81 1,82 1,83 1,84 1,85 1,86 1,87 1,88 1,89 1,90 1,91 1,92 1,93 1,94 1,95 1,96 1,97 1,98 1,99
φ(u) 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
u 2,00 2,01 2,02 2,03 2,04 2,05 2,06 2,07 2,08 2,09 2,10 2,11 2,12 2,13 2,14 2,15 2,16 2,17 2,18 2,19 2,20 2,21 2,22 2,23 2,24 2,25 2,26 2,27 2,28 2,29 2,30 2,31 2,32 2,33 2,34 2,35 2,36 2,37 2,38 2,39
φ(u) 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
u 2,40 2,41 2,42 2,43 2,44 2,45 2,46 2,47 2,48 2,49 2,50 2,52 2,54 2,56 2,58 2,60 2,62 2,64 2,66 2,68 2,70 2,72 2,74 2,76 2,78 2,80 2,82 2,84 2,86 2,88 2,90 2,92 2,94 2,96 2,98 3,00 3,02 3,04 3,06 3,08
φ(u) 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361 0,99379 0,99413 0,99446 0,99477 0,99506 0,99534 0,99560 0,99585 0,99609 0,99632 0,99653 0,99674 0,99693 0,99711 0,99728 0,99744 0,99760 0,99774 0,99788 0,99801 0,99813 0,99825 0,99836 0,99846 0,99856 0,99865 0,99874 0,99882 0,99889 0,99897
u 3,10 3,12 3,14 3,16 3,18 3,20 3,22 3,24 3,26 3,28 3,30 3,32 3,34 3,36 3,38 3,40 3,42 3,44 3,46 3,48 3,50 3,55 3,60 3,65 3,70 3,75 3,80 3,85 3,90 3,95 4,00 4,05 4,10 4,15 4,20 4,25 4,30 4,35 4,40 4,45
φ(u) 0,99903 0,99910 0,99916 0,99921 0,99926 0,99931 0,99936 0,99940 0,99944 0,99948 0,99952 0,99955 0,99958 0,99961 0,99964 0,99966 0,99969 0,99971 0,99973 0,99975 0,99977 0,99981 0,99984 0,99987 0,99989 0,99991 0,99993 0,99994 0,99995 0,99996 0,99997 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 0,99999 1,00000
Pro u < 0 jsou hodnoty distribuční funkce dány vztahem Φ(−u) = 1 − Φ(u).
134
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Tabulka III
Kvantily uP normálního rozdělení N (0, 1) P 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74
uP 0,000 0,025 0,050 0,075 0,100 0,126 0,151 0,176 0,202 0,228 0,253 0,279 0,305 0,332 0,358 0,385 0,412 0,440 0,468 0,496 0,524 0,553 0,583 0,613 0,643
P 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,900 0,905 0,910 0,915 0,920 0,925 0,930 0,935 0,940 0,945
uP 0,674 0,706 0,739 0,772 0,806 0,842 0,878 0,915 0,954 0,994 1,036 1,080 1,126 1,175 1,227 1,282 1,311 1,341 1,372 1,405 1,440 1,476 1,514 1,555 1,598
P 0,950 0,951 0,952 0,953 0,954 0,955 0,956 0,957 0,958 0,959 0,960 0,961 0,962 0,963 0,964 0,965 0,966 0,967 0,968 0,969 0,970 0,971 0,972 0,973 0,974
uP 1,645 1,655 1,665 1,675 1,685 1,695 1,706 1,717 1,728 1,739 1,751 1,762 1,774 1,787 1,799 1,812 1,825 1,838 1,852 1,866 1,881 1,896 1,911 1,927 1,943
P uP 0,975 1,960 0,976 1,977 0,977 1,995 0,978 2,014 0,979 2,034 0,980 2,054 0,981 2,075 0,982 2,097 0,983 2,120 0,984 2,144 0,985 2,170 0,986 2,197 0,987 2,226 0,988 2,257 0,989 2,290 0,990 2,326 0,991 2,366 0,992 2,409 0,993 2,457 0,994 2,512 0,995 2,576 0,996 2,652 0,997 2,748 0,998 2,878 0,999 3,090
Pro P < 0,5 jsou hodnoty kvantilů dány vztahem uP = −u1−P .
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
135
Tabulka IV
Kvantily tP (ν) Studentova rozdělení ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
P 0,900 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310
0,950 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697
0,975 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042
0,990 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457
0,995 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750
0,999 318,3 22,33 10,21 7,173 5,893 5,208 4,785 4,501 4,297 4,144 4,025 3,930 3,852 3,787 3,733 3,686 3,646 3,610 3,579 3,552 3,527 3,505 3,485 3,467 3,450 3,435 3,421 3,408 3,396 3,385
Pro P < 0,5 jsou hodnoty kvantilů dány vztahem tP = −t1−P .
136
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Tabulka V
Kvantily Pearsonova χ2 (ν) rozdělení ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
P 0,001 1,571 · 10−6 0,0020 0,0243 0,0908 0,210 0,381 0,598 0,857 1,15 1,48 1,83 2,21 2,62 3,04 3,48 3,94 4,42 4,90 5,41 5,92 6,45 6,98 7,53 8,08 8,65 9,22 9,80 10,4 11,0 11,6
0,005 3,927 · 10−5 0,0100 0,0717 0,207 0,412 0,676 0,989 1,34 1,73 2,16 2,60 3,07 3,57 4,07 4,60 5,14 5,70 6,26 6,84 7,43 8,03 8,64 9,26 9,89 10,5 11,2 11,8 12,5 13,1 13,8
0,010 1,571 · 10−4 0,0201 0,115 0,297 0,554 0,872 1,24 1,65 2,09 2,56 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,63 8,26 8,90 9,54 10,2 10,9 11,5 12,2 12,9 13,6 14,3 15,0
0,025 9,821 · 10−4 0,0506 0,216 0,484 0,831 1,24 1,69 2,18 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59 10,3 11,0 11,7 12,4 13,1 13,8 14,6 15,3 16,0 16,8
0,050 3,932 · 10−3 0,103 0,352 0,711 1,15 1,64 2,17 2,73 3,33 3,94 4,57 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,1 10,9 11,6 12,3 13,1 13,8 14,6 15,4 16,2 16,9 17,7 18,5
0,100 1,579 · 10−2 0,211 0,584 1,06 1,61 2,20 2,83 3,49 4,17 4,87 5,58 6,30 7,04 7,79 8,55 9,31 10,1 10,9 11,7 12,4 13,2 14,0 14,8 15,7 16,5 17,3 18,1 18,9 19,8 20,6
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
137
Tabulka V – dokončení
ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
P 0,900 2,71 4,61 6,25 7,78 9,24 10,6 12,0 13,4 14,7 16,0 17,3 18,5 19,8 21,1 22,3 23,5 24,8 26,0 27,2 28,4 29,6 30,8 32,0 33,2 34,4 35,6 36,7 37,9 39,1 40,3
0,950 3,84 5,99 7,81 9,49 11,1 12,6 14,1 15,5 16,9 18,3 19,7 21,0 22,4 23,7 25,0 26,3 27,6 28,9 30,1 31,4 32,7 33,9 35,2 36,4 37,7 38,9 40,1 41,3 42,6 43,8
0,975 5,02 7,38 9,35 11,1 12,8 14,4 16,0 17,5 19,0 20,5 21,9 23,3 24,7 26,1 27,5 28,8 30,2 31,5 32,9 34,2 35,5 36,8 38,1 39,4 40,6 41,9 43,2 44,5 45,7 47,0
0,990 6,63 9,21 11,3 13,3 15,1 16,8 18,5 20,1 21,7 23,2 24,7 26,2 27,7 29,1 30,6 32,0 33,4 34,8 36,2 37,6 38,9 40,3 41,6 43,0 44,3 45,6 47,0 48,3 49,6 50,9
0,995 7,88 10,6 12,8 14,9 16,7 18,5 20,3 22,0 23,6 25,2 26,8 28,3 29,8 31,3 32,8 34,3 35,7 37,2 38,6 40,0 41,4 42,8 44,2 45,6 46,9 48,3 49,6 51,0 52,3 53,7
0,999 10,8 13,8 16,3 18,5 20,5 22,5 24,3 26,1 27,9 29,6 31,3 32,9 34,5 36,1 37,7 39,3 40,8 42,3 43,8 45,3 46,8 48,3 49,7 51,2 52,6 54,1 55,5 56,9 58,3 59,7
138
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Tabulka VI/1
Kvantily F0,95 (ν1 , ν2 ) Fisher-Snedecorova rozdělení ν2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞
1 161,45 18,513 10,128 7,709 6,608 5,987 5,591 5,318 5,117 4,965 4,844 4,747 4,667 4,600 4,543 4,494 4,451 4,414 4,381 4,351 4,325 4,301 4,279 4,260 4,242 4,225 4,210 4,196 4,183 4,171 4,085 4,001 3,920 3,842
2 199,50 19,000 9,552 6,944 5,786 5,143 4,737 4,459 4,257 4,103 3,982 3,885 3,806 3,739 3,682 3,634 3,592 3,555 3,522 3,493 3,467 3,443 3,422 3,403 3,385 3,369 3,354 3,340 3,328 3,316 3,232 3,150 3,072 2,996
3 215,71 19,164 9,277 6,591 5,410 4,757 4,347 4,066 3,863 3,708 3,587 3,490 3,411 3,344 3,287 3,239 3,197 3,160 3,127 3,098 3,073 3,049 3,028 3,009 2,991 2,975 2,960 2,947 2,934 2,922 2,839 2,758 2,680 2,605
4 224,58 19,247 9,117 6,388 5,192 4,534 4,120 3,838 3,633 3,478 3,357 3,259 3,179 3,112 3,056 3,007 2,965 2,928 2,895 2,866 2,840 2,817 2,796 2,776 2,759 2,743 2,728 2,714 2,701 2,690 2,606 2,525 2,447 2,372
ν1 5 230,16 19,296 9,014 6,256 5,050 4,387 3,972 3,688 3,482 3,326 3,204 3,106 3,025 2,958 2,901 2,852 2,810 2,773 2,740 2,711 2,685 2,661 2,640 2,621 2,603 2,587 2,572 2,558 2,545 2,534 2,450 2,368 2,290 2,214
6 233,99 19,330 8,941 6,163 4,950 4,284 3,866 3,581 3,374 3,217 3,095 2,996 2,915 2,848 2,791 2,741 2,699 2,661 2,628 2,599 2,573 2,549 2,528 2,508 2,490 2,275 2,459 2,445 2,432 2,421 2,336 2,254 2,175 2,099
7 236,77 19,353 8,887 6,094 4,876 4,207 3,787 3,501 3,293 3,136 3,012 2,913 2,832 2,764 2,707 2,657 2,614 2,577 2,544 2,514 2,488 2,464 2,442 2,423 2,405 2,388 2,373 2,359 2,346 2,334 2,249 2,167 2,087 2,010
8 238,88 19,371 8,845 6,041 4,818 4,147 3,726 3,438 3,230 3,072 2,948 2,849 2,767 2,699 2,641 2,591 2,548 2,510 2,477 2,447 2,421 2,397 2,375 2,355 2,337 2,321 2,305 2,291 2,278 2,266 2,180 2,097 2,016 1,938
Pro P = 0,05 jsou hodnoty kvantilů dány vztahem F0,05 (ν1 , ν2 ) =
9 240,54 19,385 8,812 5,999 4,773 4,099 3,677 3,388 3,179 3,020 2,896 2,796 2,714 2,646 2,588 2,538 2,494 2,456 2,423 2,393 2,366 2,342 2,320 2,300 2,282 2,266 2,250 2,236 2,223 2,211 2,124 2,040 1,959 1,880
1 . F0,95 (ν2 ,ν1 )
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
139
Tabulka VI/1 – dokončení
ν2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞
ν1 10 241,9 19,40 8,786 5,964 4,735 4,060 3,637 3,347 3,137 2,978 2,854 2,753 2,671 2,602 2,544 2,494 2,450 2,412 2,378 2,348 2,321 2,297 2,275 2,255 2,237 2,220 2,204 2,190 2,177 2,165 2,077 1,993 1,911 1,831
12 243,9 19,41 8,745 5,912 4,678 4,000 3,575 3,284 3,073 2,913 2,788 2,687 2,604 2,534 2,475 2,425 2,381 2,342 2,308 2,278 2,250 2,226 2,204 2,183 2,165 2,148 2,132 2,118 2,105 2,092 2,004 1,917 1,834 1,752
15 245,9 19,43 8,703 5,858 4,619 3,938 3,511 3,218 3,006 2,845 2,719 2,617 2,533 2,463 2,404 2,352 2,308 2,269 2,234 2,203 2,176 2,151 2,128 2,108 2,089 2,072 2,056 2,041 2,028 2,015 1,925 1,836 1,751 1,666
20 248,0 19,44 8,660 5,803 4,558 3,874 3,445 3,150 2,937 2,774 2,646 2,544 2,459 2,388 2,328 2,276 2,230 2,191 2,156 2,124 2,096 2,071 2,048 2,027 2,008 1,990 1,974 1,959 1,945 1,932 1,839 1,748 1,659 1,571
24 249,0 19,45 8,639 5,774 4,527 3,842 3,411 3,115 2,901 2,737 2,609 2,506 2,420 2,349 2,288 2,235 2,190 2,150 2,114 2,083 2,054 2,028 2,005 1,984 1,964 1,946 1,930 1,915 1,901 1,887 1,793 1,700 1,608 1,517
30 250,1 19,46 8,617 5,746 4,496 3,808 3,376 3,079 2,864 2,700 2,571 2,466 2,380 2,308 2,247 2,194 2,148 2,107 2,071 2,039 2,010 1,984 1,961 1,939 1,919 1,901 1,884 1,869 1,854 1,841 1,744 1,649 1,554 1,459
40 251,1 19,47 8,594 5,717 4,464 3,774 3,340 3,043 2,826 2,661 2,531 2,426 2,339 2,266 2,204 2,151 2,104 2,063 2,026 1,994 1,965 1,938 1,914 1,892 1,872 1,853 1,836 1,820 1,806 1,792 1,693 1,594 1,495 1,394
60 252,2 19,48 8,572 5,688 4,431 3,740 3,304 3,005 2,787 2,621 2,490 2,384 2,297 2,223 2,160 2,106 2,058 2,017 1,980 1,946 1,917 1,890 1,865 1,842 1,822 1,803 1,785 1,769 1,754 1,740 1,637 1,534 1,429 1,318
120 253,2 19,49 8,549 5,658 4,398 3,705 3,267 2,967 2,748 2,580 2,448 2,341 2,252 2,178 2,114 2,059 2,011 1,968 1,930 1,896 1,866 1,838 1,813 1,790 1,768 1,749 1,731 1,714 1,698 1,684 1,577 1,467 1,352 1,221
∞ 254,3 19,50 8,527 5,628 4,365 3,669 3,230 2,928 2,707 2,538 2,405 2,296 2,206 2,131 2,066 2,010 1,960 1,917 1,878 1,843 1,812 1,783 1,757 1,733 1,711 1,691 1,672 1,654 1,638 1,622 1,509 1,389 1,254 1,000
140
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
Tabulka VI/2
Kvantily F0,975 (ν1 , ν2 ) Fisher-Snedecorova rozdělení ν2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞
1 647,79 38,506 17,443 12,218 10,007 8,813 8,073 7,571 7,209 6,937 6,724 6,554 6,414 6,298 6,200 6,115 6,042 5,978 5,922 5,872 5,827 5,786 5,750 5,717 5,686 5,659 5,633 5,610 5,588 5,568 5,424 5,286 5,152 5,024
2 799,50 39,000 16,044 10,649 8,434 7,260 6,542 6,060 5,715 5,456 5,256 5,096 4,965 4,857 4,765 4,687 4,619 4,560 4,508 4,461 4,420 4,383 4,349 4,319 4,291 4,266 4,242 4,221 4,201 4,182 4,051 3,925 3,805 3,689
3 864,16 39,165 15,439 9,979 7,764 6,599 5,890 5,416 5,078 4,826 4,630 4,474 4,347 4,242 4,153 4,077 4,011 3,954 3,903 3,859 3,819 3,783 3,751 3,721 3,694 3,670 3,647 3,626 3,607 3,589 3,463 3,343 3,227 3,116
4 899,58 39,248 15,101 9,605 7,388 6,227 5,523 5,053 4,718 4,468 4,275 4,121 3,996 3,892 3,804 3,729 3,665 3,608 3,559 3,515 3,475 3,440 3,408 3,379 3,353 3,329 3,307 3,286 3,267 3,250 3,126 3,008 2,894 2,786
ν1 5 921,85 39,298 14,885 9,365 7,146 5,988 5,285 4,817 4,484 4,236 4,044 3,891 3,767 3,663 3,576 3,502 3,438 3,382 3,333 3,289 3,250 3,215 3,184 3,155 3,129 3,105 3,083 3,063 3,044 3,027 2,904 2,786 2,674 2,567
6 937,11 39,331 14,735 9,197 6,978 5,820 5,119 4,652 4,320 4,072 3,881 3,728 3,604 3,501 3,415 3,341 3,277 3,221 3,172 3,128 3,090 3,055 3,023 2,995 2,969 2,945 2,923 2,903 2,884 2,867 2,744 2,627 2,515 2,408
7 948,22 39,355 14,624 9,074 6,853 5,696 4,995 4,529 4,197 3,950 3,759 3,607 3,483 3,380 3,293 3,219 3,156 3,100 3,051 3,007 2,969 2,934 2,902 2,874 2,848 2,824 2,802 2,782 2,763 2,746 2,624 2,507 2,395 2,288
8 956,66 39,373 14,540 8,980 6,757 5,600 4,899 4,433 4,102 3,855 3,664 3,512 3,388 3,285 3,199 3,125 3,061 3,005 2,956 2,913 2,874 2,839 2,808 2,779 2,753 2,729 2,707 2,687 2,669 2,651 2,529 2,412 2,299 2,192
Pro P = 0,025 jsou hodnoty kvantilů dány vztahem F0,025 (ν1 , ν2 ) =
9 963,28 39,387 14,473 8,905 6,681 5,523 4,823 4,357 4,026 3,779 3,588 3,436 3,312 3,209 3,123 3,049 2,985 2,929 2,880 2,837 2,798 2,763 2,731 2,703 2,677 2,653 2,631 2,611 2,592 2,575 2,452 2,334 2,222 2,114
1 . F0,975 (ν2 ,ν1 )
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
141
Tabulka VI/2 – dokončení
ν2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞
10 968,6 39,40 14,42 8,844 6,619 5,461 4,761 4,295 3,964 3,717 3,526 3,374 3,250 3,147 3,060 2,986 2,922 2,866 2,817 2,774 2,735 2,700 2,668 2,640 2,614 2,590 2,568 2,547 2,529 2,511 2,388 2,270 2,157 2,048
12 976,7 39,41 14,34 8,751 6,525 5,366 4,666 4,200 3,868 3,621 3,430 3,277 3,153 3,050 2,963 2,889 2,825 2,769 2,720 2,676 2,637 2,602 2,570 2,541 2,515 2,491 2,469 2,448 2,430 2,412 2,288 2,169 2,055 1,945
15 984,9 39,43 14,25 8,657 6,428 5,269 4,568 4,101 3,769 3,522 3,330 3,177 3,053 2,949 2,862 2,788 2,723 2,667 2,617 2,573 2,534 2,498 2,467 2,437 2,411 2,387 2,364 2,344 2,325 2,307 2,182 2,061 1,945 1,833
20 993,1 39,44 14,17 8,560 6,329 5,168 4,467 4,000 3,667 3,419 3,226 3,073 2,948 2,844 2,756 2,681 2,616 2,559 2,509 2,465 2,425 2,389 2,357 2,327 2,301 2,276 2,253 2,232 2,213 2,195 2,068 1,945 1,825 1,709
24 997,2 39,45 14,12 8,511 6,278 5,117 4,415 3,947 3,614 3,365 3,173 3,019 2,893 2,789 2,701 2,625 2,560 2,503 2,452 2,408 2,368 2,332 2,299 2,269 2,242 2,217 2,195 2,174 2,154 2,136 2,007 1,882 1,760 1,640
ν1 30 1001,4 39,46 14,08 8,461 6,227 5,065 4,362 3,894 3,560 3,311 3,118 2,963 2,837 2,732 2,644 2,568 2,502 2,445 2,394 2,349 2,308 2,272 2,239 2,209 2,182 2,157 2,133 2,112 2,092 2,074 1,943 1,815 1,690 1,566
40 1005,6 39,47 14,04 8,411 6,175 5,015 4,309 3,840 3,506 3,255 3,061 2,906 2,780 2,674 2,585 2,509 2,442 2,384 2,333 2,287 2,247 2,210 2,176 2,146 2,118 2,093 2,069 2,048 2,028 2,009 1,875 1,744 1,614 1,484
60 1009,8 39,48 13,99 8,360 6,123 4,959 4,254 3,784 3,449 3,198 3,004 2,848 2,720 2,614 2,524 2,447 2,380 2,321 2,270 2,223 2,182 2,145 2,111 2,080 2,052 2,026 2,002 1,980 1,959 1,940 1,803 1,667 1,530 1,388
120 1014,0 39,49 13,95 8,309 6,069 4,905 4,199 3,728 3,392 3,140 2,944 2,787 2,659 2,552 2,461 2,383 2,315 2,256 2,203 2,156 2,114 2,076 2,042 2,010 1,981 1,955 1,930 1,907 1,886 1,866 1,724 1,581 1,433 1,268
∞ 1018,3 39,50 13,90 8,257 6,015 4,849 4,142 3,670 3,333 3,080 2,883 2,725 2,596 2,487 2,395 2,316 2,247 2,187 2,133 2,085 2,042 2,003 1,968 1,935 1,906 1,878 1,853 1,829 1,807 1,787 1,637 1,482 1,310 1,000
142
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
PREPRINT O. Kříž, J. Neubauer, M. Sedlačík
143
Rejstřík B Bayesův vzorec, 38 C charakteristiky koncentrace, 61 polohy, 53 variability, 58 D de Morganova pravidla, 15 F faktoriál, 7 formule úplné pravděpodobnosti, 37 funkce distribuční, 45 hustoty pravděpodobnosti, 50 pravděpodobnostní, 46 J jev elementární, 12 jistý, 12 nemožný, 12 jevy nezávislé, 30 K koeficient šikmosti, 62 špičatosti, 63 kombinace bez opakování, 10 s opakováním, 10 kombinatorika, 7 kombinační číslo, 7 konvergence podle pravděpodobnosti, 108 kvantil, 55 M medián, 55
modus, 55 moment centrální, 62 obecný, 62 N nezávislé jevy, 30 náhodné veličiny, 54 náhodná veličina, 43 nespojitá (diskrétní), 44 obor hodnot, 43 spojitá, 44 náhodný jev, 12 pokus, 12 O oprava na spojitost, 116 P permutace bez opakování, 9 s opakováním, 9 pravděpodobnost axiomatická definice, 18 geometrická definice, 24 klasická definice, 19 náhodného jevu, 18 podmíněná, 27 pravidlo o násobení pravděpodobností, 29 o sčítání pravděpodobností, 32 R rozdělení alternativní, 73, 74 binomické, 74, 78 exponenciální, 86 Fisherovo-Snedecorovo, 102 hypergeometrické, 77 logaritmicko-normální, 96
144 normované normální, 92 normální, 89 Pearsonovo, 99 Poissonovo, 70, 74, 78 rovnoměrné, 83 Studentovo, 100 rozptyl, 58 S směrodatná odchylka, 59 součet nezávislých náhodných veličin, 109 střední hodnota, 54 V variace bez opakování, 9 s opakováním, 9
REJSTŘÍK věta Bernoulliova, 108 centrální limitní, 113 Lévy-Lindebergova pro průměr, 116 pro součet, 115 Moivre-Laplaceova, 113 pro podíl, 114 o normálním rozdělení pro průměr, 120 pro součet, 120 pro veličiny t a χ2 , 122 Z základní prostor, 12 zákon rozdělení pravděpodobností, 45 velkých čísel, 107