ˇ ´ VYSOKE ´ UCEN ˇ ´I TECHNICKE ´ V PRAZE CESK E Fakulta dopravn´ı
Pravdˇ epodobnost a matematick´ a statistika
RNDr. Jana Novoviˇcov´a, CSc.
1999 ˇ Vydavatelstv´ı CVUT
Lektor : Doc. Ing. Miloslav Voˇsvrda, CSc. (c) RNDr. Jana Novoviˇcov´a, CSc., 1999
Obsah Pˇ redmluva
3
Oznaˇ cen´ı
4
1 Podstata statistiky 1.1 Dva z´akladn´ı typy statistiky . 1.2 V´ ybˇer a z´akladn´ı soubor . . . 1.2.1 Prost´ y n´ahodn´ y v´ ybˇer 1.2.2 Jin´e metody v´ ybˇeru . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
2 Popisn´ a statistika 2.1 Veliˇciny a data . . . . . . . . . . . . . . . . . . . 2.2 Element´arn´ı zpracov´an´ı statistick´ ych dat . . . . . 2.2.1 Tˇr´ıdˇen´ı dat . . . . . . . . . . . . . . . . . 2.2.2 Statistick´e grafy . . . . . . . . . . . . . . . 2.2.3 Tvar rozdˇelen´ı ˇcetnost´ı; symetrie a ˇsikmost 2.3 Popisn´e m´ıry statistick´ ych soubor˚ u . . . . . . . . 2.3.1 Kvantily . . . . . . . . . . . . . . . . . . . 2.3.2 M´ıry polohy . . . . . . . . . . . . . . . . . 2.3.3 M´ıry rozpt´ ylenosti . . . . . . . . . . . . . 2.3.4 M´ıry ˇsikmosti a ˇspiˇcatosti . . . . . . . . .
. . . .
. . . . . . . . . .
. . . .
. . . . . . . . . .
. . . .
. . . . . . . . . .
. . . .
. . . . . . . . . .
. . . .
. . . . . . . . . .
. . . .
. . . . . . . . . .
. . . .
. . . . . . . . . .
. . . .
. . . . . . . . . .
. . . .
. . . . . . . . . .
3 Poˇ cet pravdˇ epodobnosti 3.1 Pojem pravdˇepodobnosti . . . . . . . . . . . . . . . . . . . . . . . 3.2 N´ahodn´e jevy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Vztahy mezi jevy . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Vz´ajemnˇe nesluˇciteln´e jevy . . . . . . . . . . . . . . . . . . 3.3 Axiomatick´a definice pravdˇepodobnosti . . . . . . . . . . . . . . . 3.4 Pravidla pro poˇc´ıt´an´ı s pravdˇepodobnostmi . . . . . . . . . . . . . 3.4.1 Pravidlo o sˇc´ıt´an´ı pravdˇepodobnost´ı . . . . . . . . . . . . . 3.4.2 Pravidlo pro pravdˇepodobnost opaˇcn´eho jevu . . . . . . . 3.4.3 Pravidlo o podm´ınˇen´e pravdˇepodobnosti . . . . . . . . . . 3.4.4 Pravidlo pro n´asoben´ı pravdˇepodobnost´ı; nez´avislost jev˚ u. 3.4.5 Vzorec u ´pln´e pravdˇepodobnosti a Bayes˚ uv vzorec . . . . . 3.5 Jin´e pohledy na pravdˇepodobnost . . . . . . . . . . . . . . . . . . 3
. . . .
. . . . . . . . . .
. . . . . . . . . . . .
. . . .
. . . . . . . . . .
. . . . . . . . . . . .
. . . .
. . . . . . . . . .
. . . . . . . . . . . .
. . . .
. . . . . . . . . .
. . . . . . . . . . . .
. . . .
. . . . . . . . . .
. . . . . . . . . . . .
. . . .
9 9 10 11 12
. . . . . . . . . .
13 13 14 14 18 21 22 23 24 27 30
. . . . . . . . . . . .
31 31 33 34 35 36 37 37 37 38 39 42 43
OBSAH Obsah
Index
Tabulky:
N
t
chi
Back
Forward
4 N´ ahodn´ a veliˇ cina 4.1 N´ahodn´a veliˇcina a jej´ı rozdˇelen´ı . . . . . . . . . . . 4.1.1 Distribuˇcn´ı funkce a hustota . . . . . . . . . 4.1.2 V´ıcerozmˇern´a rozdˇelen´ı pravdˇepodobnost´ı . 4.1.3 Nez´avislost n´ahodn´ ych veliˇcin . . . . . . . . 4.2 Charakteristiky n´ahodn´ ych veliˇcin . . . . . . . . . . 4.2.1 Stˇredn´ı hodnota . . . . . . . . . . . . . . . . 4.2.2 Rozptyl . . . . . . . . . . . . . . . . . . . . 4.2.3 Kvantily . . . . . . . . . . . . . . . . . . . . 4.2.4 Kovariance a korelace . . . . . . . . . . . . . 4.2.5 Vektor stˇredn´ıch hodnot, kovarianˇcn´ı matice 4.3 Nˇekter´a rozdˇelen´ı pravdˇepodobnost´ı . . . . . . . . . 4.3.1 Diskr´etn´ı rozdˇelen´ı . . . . . . . . . . . . . . 4.3.2 Spojit´a rozdˇelen´ı . . . . . . . . . . . . . . . 4.4 Nˇekter´e limitn´ı vˇety . . . . . . . . . . . . . . . . . . 4.4.1 Z´akon velk´ ych ˇc´ısel . . . . . . . . . . . . . . 4.4.2 Centr´aln´ı limitn´ı vˇety . . . . . . . . . . . . .
Next
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
5 N´ ahodn´ y v´ ybˇ er 5.1 Pojem n´ahodn´eho v´ ybˇeru . . . . . . . . . . . . . . . . . 5.2 V´ ybˇerov´e charakteristiky . . . . . . . . . . . . . . . . . . 5.3 Rozdˇelen´ı v´ ybˇerov´ ych charakteristik . . . . . . . . . . . . 5.3.1 Rozdˇelen´ı v´ ybˇerov´eho pr˚ umˇeru . . . . . . . . . . 5.3.2 Rozdˇelen´ı v´ ybˇerov´eho rozptylu . . . . . . . . . . . 5.3.3 Rozdˇelen´ı v´ ybˇerov´eho pod´ılu . . . . . . . . . . . . 5.4 Nez´avisl´e n´ahodn´e v´ ybˇery . . . . . . . . . . . . . . . . . 5.4.1 Dva nez´avisl´e v´ ybˇery z norm´aln´ıho rozdˇelen´ı nebo 5.4.2 Dva nez´avisl´e v´ ybˇery z alternativn´ıho rozdˇelen´ı . 5.5 P´arov´e n´ahodn´e v´ ybˇery . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
Goto
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
44 44 45 49 50 51 51 53 53 54 55 56 56 59 64 64 66
68 . . . . . . . . . . . 68 . . . . . . . . . . . 69 . . . . . . . . . . . 69 . . . . . . . . . . . 70 . . . . . . . . . . . 71 . . . . . . . . . . . 72 . . . . . . . . . . . 73 velk´e rozsahy v´ ybˇer˚ u 73 . . . . . . . . . . . 75 . . . . . . . . . . . 75
6 Z´ aklady teorie odhadu parametr˚ u 6.1 Bodov´e a intervalov´e odhady . . . . . . . . . . . . . . . . . . . . 6.2 Vlastnosti bodov´ ych odhad˚ u . . . . . . . . . . . . . . . . . . . . 6.2.1 Nestrann´e odhady . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Konzistentn´ı odhady . . . . . . . . . . . . . . . . . . . . 6.2.3 Vydatnost odhad˚ u . . . . . . . . . . . . . . . . . . . . . 6.3 Nˇekter´e metody bodov´ ych odhad˚ u. . . . . . . . . . . . . . . . . 6.3.1 Metoda moment˚ u . . . . . . . . . . . . . . . . . . . . . . 6.3.2 Metoda maxim´aln´ı vˇerohodnosti . . . . . . . . . . . . . . 6.4 Intervaly spolehlivosti . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Sestrojen´ı intervalu spolehlivosti . . . . . . . . . . . . . . 6.5 Intervaly spolehlivosti pro stˇredn´ı hodnotu . . . . . . . . . . . . 6.5.1 Intervaly spolehlivosti pro stˇredn´ı hodnotu pˇri zn´am´em rozptylu . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5.2 Intervaly spolehlivosti pro stˇredn´ı hodnotu pˇri nezn´am´e odchylce . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6 Intervaly spolehlivosti pro rozptyl . . . . . . . . . . . . . . . . . 4
. . . . . . . . . . . . . . . .
Previous
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . smˇerodatn´e . . . . . . . . . . . . . .
77 77 78 78 79 80 81 82 82 85 85 86 86 89 90
OBSAH Obsah
6.7
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Intervaly spolehlivosti pro pod´ıl . . . . . . . . . . . . . . . . . . . . . . . . .
92
7 Z´ aklady testov´ an´ı statistick´ ych hypot´ ez 7.1 Podstata testov´an´ı hypot´ez . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Formulace hypot´ez . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.2 Volba testov´eho kriteria . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Z´akladn´ı pojmy a terminologie . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Testov´a statistika, obor pˇrijet´ı, obor zam´ıtnut´ı, kritick´e hodnoty . . 7.2.2 Chyba prvn´ıho a druh´eho druhu . . . . . . . . . . . . . . . . . . . . 7.2.3 Z´avˇery pˇri testov´an´ı hypot´ez a jejich interpretace . . . . . . . . . . 7.2.4 Kritick´ y obor pro zadanou hladinu v´ yznamnosti . . . . . . . . . . . 7.2.5 Formulace procesu testov´an´ı hypot´ez . . . . . . . . . . . . . . . . . 7.2.6 Klasick´ y pˇr´ıstup k testov´an´ı hypot´ez . . . . . . . . . . . . . . . . . 7.3 P -hodnoty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 Pˇr´ıstup k testov´an´ı hypot´ez zaloˇzen´ y na P -hodnotˇe . . . . . . . . . 7.4 Nˇekter´e testy parametrick´ ych hypot´ez . . . . . . . . . . . . . . . . . . . . . 7.4.1 Test hypot´ezy o stˇredn´ı hodnotˇe µ . . . . . . . . . . . . . . . . . . 7.4.2 Test hypot´ezy o rozptylu . . . . . . . . . . . . . . . . . . . . . . . . 7.4.3 Testy hypot´ezy o pod´ılu p . . . . . . . . . . . . . . . . . . . . . . . 7.5 Testy hypot´ez o shodˇe dvou stˇredn´ıch hodnot . . . . . . . . . . . . . . . . 7.5.1 Testy hypot´ezy o shodˇe dvou stˇredn´ıch hodnot pro nez´avisl´e v´ ybˇery 7.5.2 Testy hypot´ezy pro dvˇe stˇredn´ı hodnoty uˇzit´ım p´arov´ ych v´ ybˇer˚ u . . 7.6 Test hypot´ezy o shodˇe dvou pod´ıl˚ u pˇri nez´avisl´ ych v´ ybˇerech . . . . . . . . 7.7 Ch´ı-kvadr´at test dobr´e shody . . . . . . . . . . . . . . . . . . . . . . . . . 7.8 Ch´ı-kvadr´at test nez´avislosti . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
95 95 96 97 97 97 97 99 99 100 101 101 102 103 103 106 107 108 109 112 113 115 118
8 Regresn´ı a korelaˇ cn´ı anal´ yza 8.1 Line´arn´ı rovnice s jednou nez´avislou promˇennou . . . . . . 8.2 Regresn´ı rovnice . . . . . . . . . . . . . . . . . . . . . . . . 8.2.1 Extrapolace . . . . . . . . . . . . . . . . . . . . . . 8.2.2 Odlehl´a a vlivn´a pozorov´an´ı . . . . . . . . . . . . . 8.3 Koeficient determinace . . . . . . . . . . . . . . . . . . . . 8.4 Line´arn´ı korelace . . . . . . . . . . . . . . . . . . . . . . . 8.5 Line´arn´ı regresn´ı model . . . . . . . . . . . . . . . . . . . . 8.5.1 Bodov´ y odhad rozptylu σ 2 . . . . . . . . . . . . . . 8.5.2 Testy hypot´ez a intervaly spolehlivosti pro parametr 8.5.3 Odhad a predikce . . . . . . . . . . . . . . . . . . . 8.6 Testy hypot´ez o korelaˇcn´ım koeficientu . . . . . . . . . . . 8.7 Obecn´ y regresn´ı model . . . . . . . . . . . . . . . . . . . . 8.7.1 Maticov´e vyj´adˇren´ı modelu line´arn´ı regrese . . . . .
. . . . . . . . . . . . .
120 121 121 125 125 127 129 131 133 134 137 140 141 144
Statistisk´ e tabulky
. . . . . . . . . . . . . . . . β1 . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
146
Pˇ r´ıloha
i
5
6
Kapitola 4 N´ ahodn´ a veliˇ cina Dosud jsme se zab´ yvali v podstatˇe jen ot´azkou, zda uvaˇzovan´e n´ahodn´e jevy nastanou nebo nenastanou. V mnoha pˇr´ıpadech je vˇsak takov´ y kvalitativn´ı v´ yrok nepostaˇcuj´ıc´ı, a je nutn´e i kvantitativn´ı vyˇsetˇren´ı. Jin´ ymi slovy, k popisu hromadn´ ych n´ahodn´ ych jev˚ u budeme obecnˇe potˇrebovat tak´e ˇc´ıseln´e u ´daje; pˇritom tyto ˇc´ıseln´e u ´daje nejsou konstantn´ı, ale vykazuj´ı n´ahodn´e v´ ychylky. Takovou n´ahodnou ˇc´ıselnou hodnotou je napˇr´ıklad poˇcet aut, kter´e vlastn´ı n´ahodnˇe vybran´a praˇzsk´a dom´acnost, zrovna tak jako mnoˇzstv´ı spotˇrebovan´e elektˇriny za mˇes´ıc ve vybran´e dom´acnosti. Obˇe tyto veliˇciny jsou numerick´e a jejich hodnota z´avis´ı na tom, kter´a dom´acnost byla vybran´a. M˚ uˇzeme ˇr´ıci, ˇze v´ ysledek n´ahodn´eho pokusu, dan´ y re´aln´ ym ˇc´ıslem, je hodnotou veliˇciny, kterou nazveme n´ ahodn´ a veliˇ cina. Jinak ˇreˇceno, n´ahodn´a veliˇcina je veliˇcina, jej´ıˇz hodnota je jednoznaˇcnˇe urˇcena v´ ysledkem n´ahodn´eho pokusu. Rozliˇsujeme dva z´akladn´ı typy n´ahodn´ ych veliˇcin: diskr´etn´ı a spojit´e. Diskr´ etn´ı (ˇcili nespojit´ a) n´ahodn´a veliˇcina m˚ uˇze nab´ yvat pouze koneˇcnˇe nebo spoˇcetnˇe nekoneˇcnˇe mnoha hodnot. Poˇcet aut, kter´e vlastn´ı dom´acnost, je pˇr´ıklad diskr´etn´ı veliˇciny. Spojit´ a n´ahodn´a veliˇcina m˚ uˇze nab´ yvat vˇsech hodnot z nˇejak´eho koneˇcn´eho nebo nekoneˇcn´eho intervalu. Mnoˇzstv´ı elektˇriny spotˇrebovan´e za mˇes´ıc je pˇr´ıklad spojit´e n´ahodn´e veliˇciny.
4.1
N´ ahodn´ a veliˇ cina a jej´ı rozdˇ elen´ı
Nyn´ı uvedeme matematickou definici n´ahodn´e veliˇciny. Definice 4.1
´ ´ VELI CINA ˇ N AHODN A
Nahodn a´ veliˇcina ´
je kaˇzd´e zobrazen´ı X : Ω → R takov´e, ˇze pro kaˇzd´e x ∈ R je A = {ω|X(ω) ≤ x} ∈ A.
Jestliˇze A je syst´em vˇsech podmnoˇzin Ω, pak kaˇzd´a re´aln´a funkce X definovan´a na Ω je n´ahodn´a veliˇcina. N´ahodn´e veliˇciny budeme oznaˇcovat velk´ ymi p´ısmeny z konce abecedy, napˇr. X, Y, Z nebo X1 , X2 , · · · . Jejich konkr´etn´ı hodnoty pak mal´ ymi p´ısmeny x, y, z nebo x1 , x2 , · · · . Poˇcet ˇclen˚ u dom´acnosti v souboru praˇzsk´ ych dom´acnost´ı je n´ahodn´a veliˇcina napˇr. X, zat´ımco v urˇcit´e n´ahodnˇe vybran´e tˇreba ˇctyˇrˇclenn´e dom´acnosti jde uˇz o konkr´etn´ı hodnotu t´eto n´ahodn´e veliˇciny, o konkr´etn´ı poˇcet ˇclen˚ u t´eto dom´acnosti, tud´ıˇz X = 4. Oznaˇcen´ı [X = 4] 44
´ ´ VELI Cˇ INA A JEJ´I ROZD Eˇ LEN´I 4.1 N AHODN A Obsah
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
bude vyjadˇrovat jev, ˇze vybran´a dom´acnost m´a 4 ˇcleny, zat´ımco oznaˇcen´ı P (X = 4) je zjednoduˇsen´e oznaˇcen´ı pro pravdˇepodobnost tohoto jevu. N´ahodnou veliˇcinu povaˇzujeme za danou, zn´ame-li vˇsechny jej´ı moˇzn´e hodnoty a pravdˇepodobnosti v´ yskytu kaˇzd´e z nich. Pravidlo, kter´e kaˇzd´e hodnotˇe nebo mnoˇzinˇe hodnot z kaˇzd´eho intervalu pˇriˇrazuje pravdˇepodobnost, ˇze n´ahodn´a veliˇcina nabude t´eto hodnoty nebo hodnoty z urˇcit´eho intervalu, se naz´ yv´a z´ akon rozdˇ elen´ı n´ ahodn´ e veliˇ ciny nebo kr´atce rozdˇ elen´ı n´ ahodn´ e veliˇ ciny.
4.1.1
Distribuˇ cn´ı funkce a hustota
Z´akladn´ı formou popisu z´akona rozdˇelen´ı je distribuˇcn´ı funkce. Distribuˇ cn´ı funkce n´ahodn´e veliˇciny ud´av´a pravdˇepodobnost, ˇze n´ahodn´a veliˇcina X nabude hodnoty menˇs´ı nebo rovn´e neˇz zvolen´e x. Znaˇc´ıme ji F (x). Definice 4.2
ˇ ´I FUNKCE D ISTRIBU CN
Distribuˇcn´ı funkce
n´ahodn´e veliˇciny X je funkce F : R → h0, 1i definovan´a vztahem F (x) = P (X ≤ x).
Z´ akladn´ı vlastnosti distribuˇ cn´ıch funkc´ı 1. F (x) je neklesaj´ıc´ı funkce, tj. pro kaˇzdou dvojici x1 < x2 plat´ı F (x1 ) ≤ F (x2 ). 2. F (x) je zprava spojit´a, tj. pro libovolnou distribuˇcn´ı funkci plat´ı lim F (x + h) = F (x).
h→0+
3. Pro kaˇzdou distribuˇcn´ı funkci plat´ı lim F (x) = 0 a
x→−∞
lim F (x) = 1,
x→∞
zkr´acenˇe F (−∞) = 0 a F (∞) = 1. Jestliˇze moˇzn´e hodnoty n´ahodn´e veliˇciny X patˇr´ı do intervalu (a, b) pak F (a) = 0, F (b) = 1. Kaˇzdou funkci, kter´a m´a vˇsechny vlastnosti 1.–3. m˚ uˇzeme pokl´adat za distribuˇcn´ı funkci. Pozn´ amka: Definujeme-li distribuˇcn´ı funkci vztahem F (x) = P (X < x) (tj. vynech´ame znam´enko (=)), pak F je zleva spojit´a. ˇ Casto se pouˇz´ıv´a i dalˇs´ı vlastnost distribuˇcn´ıch funkc´ı: necht’ x1 < x2 , potom plat´ı P (x1 < X ≤ x2 ) = P ([X ≤ x2 ] ∩ [X > x1 ]) = P ([X ≤ x2 ]) − P ([X ≤ x1 ]) = F (x2 ) − F (x1 ). 45
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
N
Tabulky:
t
chi
Back
Forward
Next
Goto
Previous
Distribuˇcn´ı funkce nemus´ı b´ yt spojit´a, ale bod˚ u nespojitosti m˚ uˇze m´ıt nanejv´ yˇs spoˇcetnˇe mnoho. Dva nejd˚ uleˇzitˇejˇs´ı typy distribuˇcn´ıch funkc´ı, kter´e maj´ı nejvˇetˇs´ı uplatnˇen´ı v matematick´e statistice, jsou diskr´etn´ı distribuˇcn´ı funkce a absolutnˇe spojit´e distribuˇcn´ı funkce. Diskr´ etn´ı distribuˇ cn´ı funkce Distribuˇcn´ı funkce F (x) se naz´ yv´a diskr´ etn´ı, existuje-li koneˇcn´a nebo spoˇcetn´a posloupnost P bod˚ u {xn } a posloupnost nez´aporn´ ych ˇc´ısel {pn } splˇ nuj´ıc´ıch podm´ınku n pn = 1 takov´a, ˇze F (x) =
X
pn , pro x ∈ R.
(4.1)
{n:xn ≤x}
Diskr´etn´ı distribuˇcn´ı funkce m´a schodovit´ y tvar se skoky velikosti pn v bodech xn . M´a-li n´ahodn´a veliˇcina X diskr´etn´ı distribuˇcn´ı funkci (??), tj. pn = P (X = xn ), ˇr´ık´ame, ˇze X m´a diskr´ etn´ı rozdˇ elen´ı pravdˇ epodobnost´ı, struˇcnˇe diskr´ etn´ı rozdˇ elen´ı. Grafu diskr´etn´ı distribuˇcn´ı funkce odpov´ıd´a v popisn´e statistice graf kumulativn´ıch ˇcetnost´ı. Diskr´etn´ı z´akon rozdˇelen´ı lze vedle distribuˇcn´ı funkce popsat i tzv. pravdˇ epodobnostn´ı funkc´ı P (x) = P (X = x), (4.2) kter´a kaˇzd´emu x pˇriˇrazuje jeho pravdˇepodobnost P (x). Tyto pravdˇepodobnosti P (x) splˇ nuj´ı P podm´ınku x P (x) = 1. Pomoc´ı pravdˇepodobnostn´ı funkce P (x) m˚ uˇzeme stanovit s pouˇzit´ım pravidla o sˇc´ıt´an´ı pravdˇepodobnost´ı pro nesluˇciteln´e jevy pravdˇepodobnost, ˇze n´ahodn´a veliˇcina nabude hodnoty z intervalu hx1 , x2 i. Tato pravdˇepodobnost je rovna souˇctu pravdˇepodobnost´ı hodnot z tohoto intervalu x P (x1 ≤ X ≤ x2 ) =
2 X
P (x).
(4.3)
x=x1
Specifikace diskr´etn´ıho rozdˇelen´ı n´ahodn´e veliˇciny X pomoc´ı pravdˇepodobnost´ı P (x) a pomoc´ı distribuˇcn´ı funkce je rovnocenn´a. Ze zn´am´ ych pravdˇepodobnost´ı P (x) je moˇzno odvodit distribuˇcn´ı funkci F (x) a naopak, jak vypl´ yv´a z definice ??. Pravdˇepodobnostn´ı funkci odpov´ıdaj´ı v popisn´e statistice relativn´ı ˇcetnosti. Pˇ r´ıklad 4.1 Diskretn´ a´ veliˇcina, distribuˇcn´ı funkce ´ ı nahodn ´ ´ ıme-li tˇrikrat ´ po sobˇe minc´ı, dostaneme osm stejnˇe moˇzn´ych v´ysledku ˚ jak ukazuje nasleduj´ ´ Haz´ ıc´ı tabulka ??
Tabulka 4.1 Moˇzn´e v´ysledky pˇri tˇrech hodech minc´ı Pokus Moˇzn´e v´ysledky
ω
LLL
´ ´ jednou minc´ı Hazen´ ı 3krat LLR LRL RLL LRR RRL RLR
´ a´ celkovy´ poˇcet l´ıcu ˚ pˇri tˇrech hodech jednou minc´ı. Pak Necht’ X udav ˚ ze nabyvat ´ ktera´ muˇ hodnot 0, 1, 2 a 3.
RRR
´ X je nahodn a´ veliˇcina,
´ rete pomoc´ı nahodn´ ´ ´ e dva l´ıce. Urˇcete P (X = 2), tj. a ) Vyjadˇ e veliˇciny jev, zˇe padly pravˇ ´ e dva l´ıce. pravdˇepodobnost, zˇe padnou pravˇ ´ b ) Najdˇete rozdˇelen´ı nahodn´ e veliˇciny X . ´ rete pomoc´ı nahodn´ ´ ´ se dva l´ıce. Vypoˇc´ıtejte P (X ≤ 2), tj. c ) Vyjadˇ e veliˇciny jev, zˇe padnou nejvyˇ ´ se dva l´ıce. pravdˇepodobnost, zˇe padnou nejvyˇ ´ d ) Urˇcete distribuˇcn´ı funkci nahodn´ e veliˇciny X .
46
´ ´ VELI Cˇ INA A JEJ´I ROZD Eˇ LEN´I 4.1 N AHODN A Obsah
Index
N
Tabulky:
t
chi
Back
Forward
Next
Goto
Previous
´ rete pomoc´ı nahodn´ ´ ˚ kter´e padnou, je nejvy´ sˇ e roven tˇrem e ) Vyjadˇ e veliˇciny jev, zˇe poˇcet l´ıcu, a vˇetˇs´ı neˇz jedna. Vypoˇc´ıtejte P (1 < X ≤ 3).
ˇ sen´ı: Reˇ ´ e dva l´ıce lze vyjadˇ ´ rit [X = 2]. P (X = 2) je pravdˇepodobnost, zˇe padnou a ) Jev, zˇe padnou pravˇ ´ e dva l´ıce. Z tabulky ?? vid´ıme, zˇe jsou tˇri zpusoby ˚ pravˇ jak dostat celkovˇe dva l´ıce a zˇe je ´ ´ ˚ Tud´ızˇ podle klasick´eho pravidla v´ypoˇctu pravdˇepodobnost´ı celkem osm moˇznych vysledk u. dostaneme
P (X = 2) =
3 = 0.375. 8
´ ˚ b ) Zby´ vaj´ıc´ı pravdˇepodobnosti pro X jsou vypoˇc´ıtany stejny´ m zpusobem a jsou uvedeny ´ v nasleduj´ ıc´ı tabulce ??.
Tabulka 4.2 Rozdˇelen´ı veliˇciny X ud´ avaj´ıc´ı poˇcet l´ıc˚ u pˇri tˇrech hodech minc´ı. Poˇcet l´ıcu˚ x Pravdˇepodobnost
0
P (X = x) 0.125
1 0.375
2 0.375
3 0.125
´ se dva l´ıce lze vyjadˇ ´ rit jako c ) Jev [X ≤ 2], zˇe padnou nejvyˇ
[X ≤ 2] = ([X = 0] ∪ [X = 1] ∪ [X = 2]). ´ Protoˇze tˇri jevy na prav´e stranˇe rovnice jsou vzajemnˇ e nesluˇciteln´e, dostaneme aplikac´ı ´ ı pravdˇepodobnost´ı a z tabulky ?? pravidla pro sˇc´ıtan´
P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 0.125 + 0.375 + 0.375 = 0.875 Tud´ızˇ pravdˇepodobnost, zˇe padnou nejv´ysˇ e dva l´ıce je rovna 0.875.
d ) Distribuˇcn´ı funkci F (x) vypoˇcteme podle vzorce F (x) =
x X
P (X = n) pro x = 0, 1, 2, 3.
n=0
Hodnoty
´ F (x) jsou uvedeny v tabulce ??. a jej´ı graf na obrazku ??
Tabulka 4.3 Distribuˇcn´ı funkce rozdˇelen´ı poˇctu l´ıc˚ u pˇri 3 hodech minc´ı ˚ x Poˇcet l´ıcu Distribuˇcn´ı funfce
F (x)
0 0.125
1 0.500
2 0.875
3 1.000
Obr´ azek 4.1 Graf distribuˇcn´ı funkce 1.000 0.875
F (x)
Distribuˇcn´ı funkce ma´ schodovity´ tvar se skoky velikosti 0.375 v bodech x = 1 a x = 2 a se skoky velikosti 0.125 v bodech x = 0 a x = 3.
0.500 0.125
0
1
2
3
x
47
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
´ se tˇri l´ıce a v´ıce neˇz 1 l´ıc muˇ ˚ ze byt ´ vyjadˇ ´ ren jako e ) Jev, zˇe padnou nejvyˇ
[1 < X ≤ 3] = ([X ≤ 3] ∩ [X > 1]) = ([X ≤ 3] − [X ≤ 1]). Protoˇze, plat´ı [X ≤ 1] ⊂ [X ´ ctu P (1 < X ≤ 3): k vypoˇ
≤ 3] pouˇzijeme vlastnost 2. pravdˇepodobnosti (viz kapitola ??)
P (1 < X ≤ 3) = P (X ≤ 3) − P (X ≤ 1) = 1.000 − 0.500 = 0.500. ´ se tˇri l´ıce a v´ıce neˇz jeden l´ıc je rovna 0.5. Tud´ızˇ pravdˇepodopbnost, zˇe padnou nejvyˇ
Absolutnˇ e spojit´ a distribuˇ cn´ı funkce Zvl´aˇstn´ı pozornost zasluhuj´ı distribuˇcn´ı funkce, kter´e jsou nejen spojit´e, ale dokonce absolutnˇe spojit´e. Distribuˇcn´ı funkce F se naz´ yv´a absolutnˇ e spojit´ a, jestliˇze existuje nez´aporn´a funkce f (x) takov´a, ˇze plat´ı F (x) =
Z x
f (u) du
−∞
pro kaˇzd´e x ∈ R.
(4.4)
Funkce f (x) se naz´ yv´a hustota rozdˇ elen´ı pravdˇ epodobnost´ı, definovan´eho distribuˇcn´ı funkc´ı F (x), struˇcnˇe hustota pravdˇepodobnosti nebo jen hustota. M´a-li n´ahodn´a veliˇcina X absolutnˇe spojitou distribuˇcn´ı funkci, ˇr´ık´ame, ˇze m´a spojit´ e rozdˇ elen´ı pravdˇ epodobnost´ı, zkr´acenˇe spojit´ e rozdˇ elen´ı. Hustota f (x) splˇ nuje rovnost Z ∞
f (x) dx = 1.
(4.5)
−∞
Existuje-li derivace F 0 distribuˇcn´ı funkce v bodˇe x, je F 0 (x) = f (x). Tato hustota pravdˇepodobnosti je definov´ana jako P (x < X ≤ x + ∆x) F (x + ∆x) − F (x) = lim , ∆x→0 ∆x→0 ∆x ∆x
f (x) = lim
tj. jako limita pravdˇepodobnosti, ˇze veliˇcina X padne do velmi mal´eho intervalu (x, x + ∆x), vydˇelen´a d´elkou tohoto intervalu v pˇr´ıpadˇe, ˇze se tato d´elka ∆x bl´ıˇz´ı nule. Souˇcin ∆xf (x) pak pˇribliˇznˇe vyjadˇruje pravdˇepodobnost, ˇze n´ahodn´a veliˇcina X padne do velmi mal´eho intervalu (x, x + ∆x), a to t´ım pˇresnˇeji, ˇc´ım je ∆x menˇs´ı. Pro a, b ∈ R, a < b plat´ı P (a < X ≤ b) =
Z b a
f (x) dx = F (b) − F (a).
Pravdˇepodobnost je tedy plocha pod kˇrivkou hustoty. Odtud plyne, ˇze pro n´ahodnou veliˇcinu se spojit´ ym rozdˇelen´ım je P (X = a) = 0 pro libovoln´e a ∈ R. Pˇ r´ıklad 4.2 Distribuˇcn´ı funkce a hustota pravdˇepodobnosti spojiteho rozdˇelen´ı ´ −λx ˇ Funkce F (x) = 1 − e pro x > 0 a F (x) = 0 pro x ≤ 0, kde λ > 0 je konstanta, splnuje ´ ´ zakladn´ ı vlastnosti 1. – 3. distribuˇcn´ı funkce a je distribuˇcn´ı funkc´ı nˇejak´e nahodn´ e veliˇciny X ´ rozdˇelen´ım. Odpov´ıdaj´ıc´ı hustota je f (x) = λe−λx pro x > 0 a f (x) = 0 pro x ≤ 0. se spojitym R P (1 < X ≤ 2) = λ 12 e−λx dx = 1 − e−2λ − 1 + e−λ = e−λ (1 − e−λ ).
48
´ ´ VELI Cˇ INA A JEJ´I ROZD Eˇ LEN´I 4.1 N AHODN A Obsah
4.1.2
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
V´ıcerozmˇ ern´ a rozdˇ elen´ı pravdˇ epodobnost´ı
ˇ Casto se neomezujeme pouze na jednu n´ahodnou veliˇcinu, ale zkoum´ame cel´ y syst´em n´ahodn´ ych veliˇcin, tak zvanou v´ıcerozmˇernou pˇresnˇeji n-rozmˇernou n´ ahodnou veliˇcinu. V´ıcerozmˇ ernou n´ ahodnou veliˇ cinou X = (X1 , X2 , · · · , Xn ) budeme naz´ yvat n-rozmˇern´ y vektor, jehoˇz vˇsechny sloˇzky Xi jsou n´ahodn´e veliˇciny. Pro v´ıcerozmˇernou n´ahodnou veliˇcinu se tak´e pouˇz´ıv´a n´azev n´ ahodn´ y vektor. Nad´ale budeme podle potˇreby pouˇz´ıvat obou n´azv˚ u. Vˇsimneme si podrobnˇeji dvourozmˇern´e n´ahodn´e veliˇciny (X, Y ). Z´akon rozdˇelen´ı t´eto n´ahodn´e veliˇciny m˚ uˇze b´ yt d´an ve formˇe sdruˇ zen´ e (simult´ ann´ı) distribuˇ cn´ı funkce F (x, y), kter´a je definovan´a jako pravdˇepodobnost, ˇze n´ahodn´a veliˇcina X, nabude hodnoty menˇs´ı neˇz x a souˇcasnˇe n´ahodn´a veliˇcina Y nabude hodnoty menˇs´ı neˇz y. Definice 4.3
ˇ A´ DISTRIBU CN ˇ ´I FUNKCE N AHODN ´ ´ HO VEKTORU (X, Y ) S DRU ZEN E
Sdruˇzena´ distribuˇcn´ı funkce
n´ahodn´eho vektoru (X, Y ) je funkce definovan´a vztahem F (x, y) = P (X ≤ x, Y ≤ y)
pro kaˇzd´e x ∈ R, y ∈ R. Z´ akladn´ı vlastnosti distribuˇ cn´ı funkce F (x, y) 1. F (x, y) je neklesaj´ıc´ı v kaˇzd´e sv´e promˇenn´e. 2. limx,y→∞ F (x, y) = 1. 3. limx→−∞ F (x, y) = 0, limy→−∞ F (x, y) = 0. 4. F (x, y) je zprava spojit´a v kaˇzd´e promˇenn´e. Kromˇe tˇechto trivi´aln´ıch vlastnost´ı m´a kaˇzd´a dvourozmˇern´a distribuˇcn´ı funkce jednu dalˇs´ı charakterizuj´ıc´ı vlastnost, kterou je moˇzn´e vyj´adˇrit ve tvaru P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) = F (x1 , y1 ) − F (x1 , y2 ) − F (x2 , y1 ) + F (x2 , y2 ) pro kaˇzd´e x1 < x2 , y1 < y2 . Sdruˇzen´a distribuˇcn´ı funkce F (x, y) se naz´ yv´a diskr´ etn´ı, jestliˇze F (x, y) =
X X
P (X = xi , Y = yj ),
(4.6)
xi ≤x yj ≤y
kde {xi } respektive {yj } jsou koneˇcn´e nebo spoˇcetn´e posloupnosti vˇsech hodnot, kter´ ych nab´ yv´a X respektive Y . Pravdˇepodobnosti P (X = xi , Y = yj ) se naz´ yvaj´ı sdruˇ zen´ e pravdˇ epodobnosti a plat´ı XX P (X = xi , Y = yj ) = 1. xi
yj
N´ahodn´ y vektor (X, Y ) s diskr´etn´ı distribuˇcn´ı funkc´ı m´a diskr´ etn´ı sdruˇ zen´ e rozdˇ elen´ı (diskr´etn´ı rozdˇelen´ı). Souˇcty sdruˇzen´ ych pravdˇepodobnost´ı PX (xi ) =
X
P (X = xi , Y = yj ) resp. PY (yj ) =
yj
X xi
49
P (X = xi , Y = yj )
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
se naz´ yvaj´ı margin´ aln´ı pravdˇ epodobnosti n´ahodn´e veliˇciny X respektive Y a vyjadˇruj´ı pravdˇepodobnosti r˚ uzn´ ych hodnot jedn´e z veliˇcin bez ohledu na hodnotu veliˇciny druh´e. Z´akon rozdˇelen´ı, kter´ y popisuj´ı, se naz´ yv´a margin´ aln´ı z´ akon rozdˇ elen´ı. Omez´ıme-li se na dvˇe diskr´etn´ı n´ahodn´e veliˇciny X a Y , m˚ uˇzeme pravdˇepodobnosti souˇcasn´eho v´ yskytu r˚ uzn´ ych kombinac´ı dvojic hodnot (xi , yj ), i = 1, 2, · · · , r, j = 1, 2, · · · , s obou veliˇcin uspoˇra´dat do dvourozmˇern´e kombinaˇ cn´ı tabulky??. Tabulka 4.4 Kombinaˇcn´ı tabulka X \Y x1 · xi · xr PY (yj )
y1 · · · yj · · · ys PX (xi ) P (x1 , y1 ) · · · P (x1 , yj ) · · · P (x1 , ys ) PX (x1 ) P (xi , y1 ) · · · P (xi , yj ) · · · P (xi , ys )
PX (xi )
P (xr , y1 ) · · · P (xr , yj ) · · · P (xr , ys ) PX (xr ) PY (y1 ) · · · PY (yj ) · · · PY (ys ) 1
Distribuˇcn´ı funkce F (x, y) se naz´ yv´a absolutnˇ e spojit´ a, jestliˇze existuje nez´aporn´a funkce f (x, y) naz´ yvan´a sdruˇ zen´ a hustota pravdˇ epodobnosti takov´a, ˇze F (x, y) =
Z x Z y −∞
f (u, v) dudv.
(4.7)
−∞
Hustota sdruˇzen´eho rozdˇelen´ı m´a tyto z´akladn´ı vlastnosti: 1.
Z ∞ Z ∞ −∞
2.
f (x, y) dx dy = 1.
−∞
∂ 2 F (x, y) = f (x, y) pokud derivace funkce F existuje. ∂x∂y
3. P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) =
Z x2 Z y 2 x1
f (x, y) dx dy
y1
pro x1 < x2 , y1 < y2 .
N´ahodn´ y vektor (X, Y ) s absolutnˇe spojitou distribuˇcn´ı funkc´ı m´a spojit´ e sdruˇ zen´ e rozdˇ elen´ı. Z distribuˇcn´ı funkce F (x, y) m˚ uˇzeme odvodit margin´ aln´ı distribuˇ cn´ı funkce n´ahodn´e veliˇciny X respektive Y FX (x) = P (X ≤ x) = y→∞ lim F (x, y), resp. FY (y) = P (Y ≤ y) = x→∞ lim F (x, y).
(4.8)
Podobnˇe z hustoty pravdˇepodobnosti f (x, y) m˚ uˇzeme odvodit margin´ aln´ı hustoty rozdˇ elen´ı pravdˇ epodobnost´ı n´ahodn´e veliˇciny X respektive Y fX (x) =
4.1.3
Z ∞
−∞
f (x, y) dy, resp. fY (y) =
Z ∞
f (x, y) dx.
(4.9)
−∞
Nez´ avislost n´ ahodn´ ych veliˇ cin
Budeme ˇr´ıkat, ˇze n´ahodn´e veliˇciny X a Y jsou nez´ avisl´ e, jestliˇze pro vˇsechna x,y ∈ R plat´ı P (X ≤ x, Y ≤ y) = P (X ≤ x)P (Y ≤ y), 50
´ ´ ˇ IN 4.2 C HARAKTERISTIKY N AHODN YCH VELI C Obsah
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
tj. jestliˇze se dvourozmˇern´a distribuˇcn´ı funkce n´ahodn´ ych veliˇcin X a Y rovn´a souˇcinu distribuˇcn´ıch funkc´ı n´ahodn´e veliˇciny X a n´ahodn´e veliˇciny Y. Pro diskr´etn´ı rozdˇelen´ı to znamen´a tot´eˇz jako P (X = xi , Y = yj ) = PX (xi )PY (yj ),
i = 1, 2, · · · , r,
j = 1, 2, · · · , s
a pro rozdˇelen´ı s hustotou f (x, y) f (x, y) = fX (x)fY (y) pro vˇsechna x, y ∈ R. Nez´avislost v´ıce n´ahodn´ ych veliˇcin je moˇzno definovat obdobnˇe. N´ahodn´e veliˇciny X1 , X2 , · · · , Xn jsou nez´ avisl´ e, jestliˇze pro kaˇzdou n-tici x1 , x2 , · · · , xn re´aln´ ych ˇc´ısel plat´ı P (X1 ≤ x1 , · · · , Xn ≤ xn ) =
n Y
P (Xi ≤ xi ).
i=1
Pro nez´avisl´e n´ahodn´e veliˇciny plat´ı: 1. Jestliˇze X1 , X2 , · · · , Xn jsou nez´avisl´e n´ahodn´e veliˇciny, a hk (x), k = 1, 2, · · · , n funkce re´aln´e promˇenn´e, pak n´ahodn´e veliˇciny Yk = hk (X), k = 1, 2, · · · , n jsou tak´e nez´avisl´e. 2. Jestliˇze n´ahodn´e veliˇciny X1 , X2 , · · · , Xn jsou nez´avisl´e, a kaˇzd´a z nich m´a hustotu, pak plat´ı f (x1 , · · · , xn ) =
n Y
fi (xi ),
(4.10)
i=1
kde fi (xi ) je hustota n´ahodn´e veliˇciny Xi , i = 1, 2, · · · , n a f (x1 , · · · , xn ) je hustota nrozmˇern´e n´ahodn´e veliˇciny (X1 , X2 , · · · , Xn ). Ze vztahu (??) plyne naopak nez´avislost n´ahodn´ ych veliˇcin X1 , X2 , · · · , Xn .
4.2
Charakteristiky n´ ahodn´ ych veliˇ cin
Distribuˇcn´ı funkce pod´av´a o n´ahodn´e veliˇcinˇe u ´plnou informaci. Zn´ame-li tuto funkci, v´ıme jak´ ych hodnot m˚ uˇze uvaˇzovan´a n´ahodn´a veliˇcina nab´ yvat a jak´e jsou pravdˇepodobnosti jednotliv´ ych hodnot. V praxi ˇcasto potˇrebujeme koncentrovanˇejˇs´ı a pˇrehlednˇejˇs´ı vyj´adˇren´ı t´eto informace. K tomu pouˇz´ıv´ame podobnˇe jako v popisn´e statistice, ˇc´ıseln´e hodnoty, kter´e naz´ yv´ame charakteristiky n´ ahodn´ ych veliˇ cin. Nejˇcastˇeji pouˇz´ıvan´ ymi charakteristikami jsou stˇredn´ı hodnota, kter´a popisuje polohu (´ uroveˇ n) n´ahodn´e veliˇciny, a rozptyl kter´ y popisuje variabilitu (rozpt´ ylenost) n´ahodn´e veliˇciny. Struˇcnˇe se zm´ın´ıme i o dalˇs´ıch charakteristik´ach.
4.2.1
Stˇ redn´ı hodnota
Necht’ X je n´ahodn´a veliˇcina s distribuˇcn´ı funkc´ı F (x). Pak m´ame n´asleduj´ıc´ı definice stˇredn´ı hodnoty n´ahodn´e veliˇciny X s diskr´etn´ım respektive spojit´ ym rozdˇelen´ım. Budeme ji znaˇcit E(X). 51
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
Definice 4.4
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
ˇ ´I HODNOTA N AHODN ´ ´ VELI CINY ˇ S T REDN E
X s diskretn´ ym pravdˇepodobnostn´ı ´ ım rozdˇelen´ım dan´ funkc´ı P (x) je definov´ana vztahem Stˇredn´ı hodnota nahodn e´ veliˇciny ´
E(X) =
X
xP (x).
x
Stˇredn´ı hodnota nahodn e´ veliˇciny se spojitym ´ ´ rozdˇelen´ım hem Z ∞
s hustotou f (x) je definov´ana vzta-
xf (x) dx.
E(X) =
−∞
V diskr´etn´ım pˇr´ıpadˇe jde v podstatˇe o jak´ ysi v´aˇzen´ y pr˚ umˇer moˇzn´ ych hodnot veliˇciny X s vahami odpov´ıdaj´ıc´ımi jednotliv´ ym pravdˇepodobnostem. Ve spojit´em pˇr´ıpadˇe je stˇredn´ı hodnota n´ahodn´e veliˇciny X definov´ana obdobnˇe (souˇcet je nahrazen integr´alem). Pozn´ amka: V dalˇs´ım textu budeme oznaˇcovat stˇredn´ı hodnotu n´ahodn´e veliˇciny X tak´e symbolem µx . Stˇredn´ı hodnota se nˇekdy naz´ yv´a prvn´ı obecn´ y moment. Obecnˇe, k-t´ y obecn´ y moment E(X k ) n´ahodn´e veliˇciny X je definov´an jako X xk P (x) x
E(X k ) = Z
∞
pro diskr´etn´ı rozdˇelen´ı
xk f (x) dx pro spojit´e rozdˇelen´ı.
−∞
Pro pr´aci se stˇredn´ımi hodnotami jsou d˚ uleˇzit´e nˇekter´e jej´ı matematick´e vlastnosti, kter´e uvedeme. Z´ akladn´ı vlastnosti stˇ redn´ı hodnoty 1. Stˇredn´ı hodnota konstanty je rovna konstantˇe, E(c) = c. 2. Stˇredn´ı hodnota souˇcinu konstanty a n´ahodn´e veliˇciny je rovna souˇcinu t´eto konstanty a stˇredn´ı hodnoty dan´e veliˇciny, E(cX) = cE(X). 3. Stˇredn´ı hodnota souˇctu n n´ahodn´ ych veliˇcin je rovna souˇctu jejich stˇredn´ıch hodnot, n X
E(
Xi ) =
i=1
n X
E(Xi ).
i=1
Pojem stˇredn´ı hodnoty zobecn´ıme na nˇejakou funkci h(X) n´ahodn´e veliˇciny X E(h(X)) =
X
h(xj )P (xj ),
resp.
E(h(X)) =
Z ∞
−∞
j
52
h(x)f (x) dx.
´ ´ ˇ IN 4.2 C HARAKTERISTIKY N AHODN YCH VELI C Obsah
4.2.2
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Rozptyl
Rozptyl je m´ırou variability n´ahodn´e veliˇciny. Definice 4.5
´ ´ VELI CINY ˇ ROZPTYL N AHODN E
Rozptyl nahodn e´ veliˇciny s diskretn´ ´ ´ ım rozdˇelen´ım
s pravdˇepodobnostn´ı funkc´ı P (x) je defi-
nov´an vztahem D(X) =
(x − E(X))2 P (x).
X x
Rozptyl nahodn e´ veliˇciny se spojitym ´ ´ rozdˇelen´ım
D(X) =
Z ∞
−∞
s hustotou f (x) je definov´an vztahem
(x − E(X))2 f (x) dx.
Rozptyl se tak´e naz´ yv´a druh´ y centr´aln´ı moment. Obecnˇe, k-t´ y centr´ aln´ı moment E(X − µx )k n´ahodn´e veliˇciny X je definov´an jako X (x − µx )k P (x) x
E((X − µx )k ) = Z
∞
−∞
pro diskr´etn´ı rozdˇelen´ı
(x − µx )k f (x) dx pro spojit´e rozdˇelen´ı.
Rozptyl lze poˇc´ıtat podle vzorce D(X) = E(X − E(X))2 = E(X 2 − 2XE(X) + (E(X))2 ) = E(X 2 ) − [E(X)]2 .
(4.11)
Pozn´ amka: V dalˇs´ım textu budeme oznaˇcovat rozptyl n´ahodn´e veliˇciny X tak´e symbolem σx . Mˇern´e jednotky, ve kter´ ych je vyj´adˇren rozptyl D(X) jsou ˇctverce jednotek n´ahodn´e veliˇciny X. V p˚ uvodn´ıch jednotk´ach mˇeˇr´ı variabilitu odmocnina rozptylu, kterou naz´ yv´ame q smˇ erodatnou odchylkou a znaˇc´ıme σx = D(X). Z´ akladn´ı vlastnosti rozptylu 1. Rozptyl konstanty je rovna nule, D(c) = 0. 2. Rozptyl souˇcinu konstanty a n´ahodn´e veliˇciny je roven souˇcinu ˇctverce t´eto konstanty a rozptylu dan´e veliˇciny, D(cX) = c2 D(X). 3. Rozptyl souˇctu nez´avisl´ych n´ahodn´ ych veliˇcin je roven souˇctu rozptyl˚ u tˇechto n´ahodn´ ych veliˇcin, n X
D(
Xi ) =
i=1
4.2.3
n X
D(Xi ).
i=1
Kvantily
Vedle uveden´ ych charakteristik n´ahodn´e veliˇciny se pˇri popisu spojit´e n´ahodn´e veliˇciny velmi ˇcasto pouˇz´ıvaj´ı kvantily. S t´ımto pojmem jsme se jiˇz sezn´amili v popisn´e statistice v ˇc´asti ??. Nyn´ı tuto charakteristiku uvedeme do souvislosti se spojitou n´ahodnou veliˇcinou. 53
´ ´ VELI CINA ˇ N AHODN A
K APITOLA 4 Obsah
Index
Definice 4.6
N
Tabulky:
t
chi
Back
Forward
Next
Goto
Previous
K VANTIL
Necht’ X je n´ahodn´a veliˇcina s distribuˇcn´ı funkc´ı F (x) a hustotou pravdˇepodobnosti f (x). p-kvantilem nahodn e´ veliˇciny X nebo 100p procentn´ım kvantilem je ˇ c´ıslo Qp , pro kter´e plat´ı ´ P (X ≤ Qp ) = F (Qp ) =
Z Qp
f (x) dx = p, 0 < p < 1.
−∞
50% kvantil naz´ yv´ame medi´ an. Medi´an Q0.5 n´ahodn´e veliˇciny je jednoznaˇcnˇe urˇcen podm´ınkou F (Q0.5 ) = 21 . Pˇ r´ıklad 4.3 Stˇredn´ı hodnota a rozptyl diskretn´ ´ ıho rozdˇelen´ı ´ Urˇcete E (X ) a D (X ) nahodn´ e veliˇciny, ktera´ nab´yva´ hodnot z mnoˇziny {0, 1} s pravdˇepodobnostn´ı funkc´ı P (X = 1) = p, P (X = 0) = 1 − p, 0 < p < 1. ˇ sen´ı: E (X ) = 1p + 0(1 − p) = p a D (X ) = (1 − p)2 p + (0 − p)2 (1 − p) = p(1 − p) Reˇ Pˇ r´ıklad 4.4 Stˇredn´ı hodnota, rozptyl a median rozdˇelen´ı ´ spojiteho ´ ´ ´ t´eto Uvaˇzujme nahodnou veliˇcinu z pˇr´ıkladu ??. Urˇcete stˇredn´ı hodnotu, rozptyl a median veliˇciny. ˇ sen´ı: K v´ypoˇctu pouˇzijeme gama funkci : Reˇ Z ∞
Γ(a) =
0
E (X ) = λ
xa−1 e−x dx, a > 0, Γ(a + 1) = aΓ(a), Γ(1) = 1.
Z ∞ 0
xe−λx dx =
1
λ
Z ∞
ue−u du =
0
Γ(2)
λ
=
1
λ
.
´ Rozptyl vypoˇc´ıtame pomoc´ı vzorce (??), tud´ızˇ mus´ıme spoˇc´ıtat E (X 2 ). Z ∞ Z Γ(3) 2 1 ∞ 2 −u 2 2 −λx E (X ) = λ x e dx = 2 u e du = 2 = 2 . D(X ) = λ22 λ 0 λ λ 0 ´ Median
4.2.4
− ( λ1 )2 =
1 . λ2
Q0.5 se nalezne rˇeˇsen´ım rovnice 1 − e−λQ0.5 = 0.5, z n´ızˇ dostaneme Q0.5 =
1 λ
ln 2.
Kovariance a korelace
Kovariance a korelaˇcn´ı koeficient (koeficient korelace) patˇr´ı mezi nejˇcastˇeji pouˇz´ıvan´e charakteristiky sdruˇzen´eho rozdˇelen´ı dvou n´ahodn´ ych veliˇcin. Kovariance je stˇredn´ı hodnota souˇcinu odchylek obou n´ahodn´ ych veliˇcin X a Y od jejich stˇredn´ıch hodnot. Definice 4.7
KOVARIANCE
σxy dvou n´ahodn´ ych veliˇcin X a Y se stˇredn´ımi hodnotami µx a µy je definov´ana vztahem σxy = E(X − µx )(Y − µy ).
Kovariance
K v´ ypoˇctu kovariance veliˇcin X a Y lze pouˇz´ıt stˇredn´ı hodnotu E(XY ) naz´ yvanou sm´ıˇ sen´ y obecn´ y moment a definovou vztahem : X xyP (X x,y
E(XY ) = Z
∞
−∞
Z ∞
= x, Y = y)
pro diskr´etn´ı rozdˇelen´ı (4.12)
xyf (x, y) dxdy pro spojit´a rozdˇelen´ı.
−∞
54
´ ´ ˇ IN 4.2 C HARAKTERISTIKY N AHODN YCH VELI C Obsah
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Z definice ?? a z (??) plyne, ˇze σxy = E(XY ) − µx µy .
(4.13)
Z definice nez´avisl´ ych n´ahodn´ ych veliˇcin a ze vztahu (??) plyne, ˇze pro nez´avisl´e n´ahodn´e veliˇciny plat´ı E(XY ) = E(X)E(Y ). Kovariance dvou nez´avisl´ ych n´ahodn´ ych veliˇcin je tud´ıˇz rovna nule. Pomoc´ı kovariance m˚ uˇzeme v´ yj´adˇrit rozptyl souˇctu dvou n´ahodn´ ych veliˇcin X a Y . Je roven souˇctu rozptyl˚ u obou n´ahodn´ ych veliˇcin a dvojn´asobku kovariance obou veliˇcin. D(X + Y ) = E(X + Y − µx − µy )2 = E(X − µx )2 + E(Y − µy )2 + 2E(X − µx )(Y − µy ) = D(X) + D(Y ) + 2σxy . (4.14) Korelaˇcn´ı koeficient d´av´a urˇcitou informaci o stupni z´avislosti dvou n´ahodn´ ych veliˇcin. Je definov´an jako pomˇer kovariance k souˇcinu smˇerodatn´ ych odchylek obou n´ahodn´ ych veliˇcin. Definice 4.8
ˇ ´I KOEFICIENT KORELA CN
Korelaˇcn´ı koeficient
ρxy dvou n´ahodn´ ych veliˇcin X a Y s rozptyly σx2 > 0 a σy2 > 0 je
definov´an vztahem ρxy =
σxy . σ x σy
Je-li σx2 = 0 nebo σy2 = 0 pokl´ad´ame ρxy = 0. Pro korelaˇcn´ı koeficient plat´ı: 1. Hodnota korelaˇcn´ıho koeficientu je ˇc´ıslo z intervalu h−1, 1i, tj. −1 ≤ ρxy ≤ 1. 2. Jsou-li X a Y nez´avisl´e, je ρxy = 0. Pozn´amka: Opaˇcn´e tvrzen´ı neplat´ı. Ze vztahu ρxy = 0 obecnˇe nevypl´ yv´a, ˇze veliˇciny X a Y jsou nez´avisl´e. Je-li ρxy = 0, ˇr´ık´ame, ˇze n´ahodn´e veliˇciny X a Y jsou nekorelovan´ e. 3. |ρxy | = 1 pr´avˇe tehdy, kdyˇz s pravdˇepodobnost´ı 1 plat´ı Y = a + bX, kde a, b, b 6= 0 jsou re´aln´e konstanty. Pˇritom je ρxy = 1 nebo −1 podle toho, je-li b > 0 nebo b < 0. S interpretac´ı a v´ ypoˇctem korelaˇcn´ıho koeficientu se podrobnˇeji sezn´am´ıme v kapitole o regresi a korelaci.
4.2.5
Vektor stˇ redn´ıch hodnot, kovarianˇ cn´ı matice
Z charakteristik n-rozmˇern´eho n´ahodn´eho vektoru X = (X1 , X2 , · · · , Xn ) jsou nejd˚ uleˇzitˇejˇs´ı stˇredn´ı hodnoty jednotliv´ ych veliˇcin Xi µi = E(Xi ), i = 1, 2, · · · , n, d´ale jejich rozptyly σi2 = D(Xi ), i = 1, 2, · · · , n a koneˇcnˇe kovariance dvojic veliˇcin σij = E(Xi − µi )(Xj − µj ), 55
i = 1, 2, · · · , n; i 6= j.
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Stˇredn´ı hodnoty zapisujeme ˇcasto ve formˇe vektoru stˇ redn´ıch hodnot µ = (µ1 , µ2 , · · · , µn )T a kovariance spolu s rozptyly ve formˇe kovarianˇ cn´ı matice σ12 . . . σ1n . . . . .. Σ= . . .. 2 σn1 . . . σn
Kovarianˇcn´ı matice je symetrick´a a positivnˇe definitn´ı.
4.3
Nˇ ekter´ a rozdˇ elen´ı pravdˇ epodobnost´ı
Rozdˇelen´ı jednorozmˇern´ ych i v´ıcerozmˇern´ ych n´ahodn´ ych veliˇcin se pouˇz´ıvaj´ı jako pravdˇepodobnostn´ı modely pˇri popisu konkr´etn´ıch praktick´ ych probl´em˚ u. V t´eto ˇc´asti se sezn´am´ıme s nejˇcastˇeji pouˇz´ıvan´ ymi pravdˇepodobnostn´ımi rozdˇelen´ımi.
4.3.1
Diskr´ etn´ı rozdˇ elen´ı
Alternativn´ı rozdˇ elen´ı A(p) Rozdˇelen´ı pravdˇepodobnost´ı na Ω = {0, 1} s pravdˇepodobnostn´ı funkc´ı P (x) = px (1 − p)1−x ,
(4.15)
kde p ∈ (0, 1) se naz´yv´ a alternativn´ı rozdˇelen´ı s parametrem p. Stˇredn´ı hodnota tohoto rozdˇelen´ı je E(X) = p a rozptyl D(X) = p(1 − p). Interpretace: Uvaˇzujme n´ahodn´ y pokus. Nastane-li sledovan´ y n´ahodn´ y jev A, nabude n´ahodn´a veliˇcina X hodnoty x = 1, nenastane-li tento jev A, nabude n´ahodn´a veliˇcina X hodnoty x = 0. N´ahodn´a veliˇcina X tedy vyjadˇruje, kolikr´at jev A v pokusu nastane. Binomick´ e rozdˇ elen´ı B(n, p) Rozdˇelen´ı pravdˇepodobnost´ı na Ω = {0, 1, ..., n} s pravdˇepodobnostn´ı funkc´ı P (x) =
n x
!
px (1 − p)n−x
(4.16)
pro p ∈ (0, 1) a n ∈ N+ se naz´yv´a binomick´e rozdˇelen´ı s parametry n a p. Stˇredn´ı hodnota je E(X) = np a rozptyl D(X) = np(1 − p). Binomick´e rozdˇelen´ı je obecnˇe nesymetrick´e. S r˚ ustem n (n → ∞) nebo pˇribliˇzov´an´ım p k hodnotˇe 0.5 se st´av´a postupnˇe symetriˇctˇejˇs´ım. Pro p = 0.5 je symetrick´e. Pro n = 1 dostaneme A(p)-rozdˇelen´ı. Interpretace: Pˇredpokl´adejme, ˇze prov´ad´ıme n nez´avisl´ ych pokus˚ u, pˇri nichˇz m˚ uˇze nastat jev A s pravdˇepodobnost´ı p a nenastat s pravdˇepodobnost´ı q = 1 − p. Pravdˇepodobnost, ˇze se v takov´e s´erii pokus˚ u objev´ı jev A pr´avˇe x-kr´at, je d´ana v´ yrazem (??). 56
4.3 N Eˇ KTER A´ ROZD Eˇ LEN´I PRAVD Eˇ PODOBNOST´I Obsah
Index
N
Tabulky:
t
chi
Back
Forward
Next
Goto
Previous
Pravdˇepodobnosti jednotliv´ ych hodnot n´ahodn´e veliˇciny s binomick´ ym rozdˇelen´ım jsou obecn´ ym ˇclenem binomick´eho rozvoje n
(p + q) =
n X
x=1
n x
!
px (1 − p)n−x .
Hypergeometrick´ e rozdˇ elen´ı Hg(N, M, n) Rozdˇelen´ı pravdˇepodobnost´ı s Ω = {0, 1, ..., min{M, n}} a pravdˇepodobnostn´ı funkc´ı
P (x) =
M x
!
N −M n−x N n
!
!
, max(n − N + M, 0) ≤ x ≤ min(M, n)
(4.17)
se naz´yv´ a hypergeometrick´e rozdˇelen´ı s parametry N, M, n. M M N −n Stˇredn´ı hodnota je E(X) = n M , a rozptyl D(X) = n 1 − . N N N N −1 Interpretace: Uvaˇzujme situaci, kdy v souboru N prvk˚ u je jich M (N ≥ M ) s urˇcitou vlastnost´ı a zbyl´ ych N − M tuto vlastnost nem´a. Postupnˇe vybereme ze souboru n prvk˚ u, z nichˇz ˇz´adn´ y nevrac´ıme zpˇet. Poˇcet prvk˚ u se sledovanou vlastnost´ı mezi n vybran´ ymi prvky je n´ahodn´a veliˇcina X maj´ıc´ı hypergeometrick´e rozdˇelen´ı. Jestliˇze N je velk´e a n a M se nemˇen´ı, bl´ıˇz´ı se hypergeometrick´e rozdˇelen´ı binomick´emu. To N znamen´a, ˇze m˚ uˇzeme pro velk´a N zanedbat rozd´ıl mezi v´ ybˇerem bez vracen´ı a s vracen´ım. Prakticky postupujeme tak, ˇze vypoˇc´ıt´ame pomˇer Nn a je-li tento pomˇer vˇetˇs´ı neˇz 0.05, lze hypergeometrick´e rozdˇelen´ı nahradit rozdˇelen´ım binomick´ ym s parametry n a M . N Aplikace: Hypergeometrick´e rozdˇelen´ı se vyskytuje napˇr´ıklad ve statistick´e kontrole jakosti v pˇr´ıpadech, kdy zkoum´ame jakost mal´eho poˇctu v´ yrobk˚ u nebo kdyˇz kontrola m´a charakter destrukˇcn´ı zkouˇsky, tj. v´ yrobek je pˇri zkouˇsce zniˇcen. D´ale jako pravdˇepodobnostn´ı model nˇekter´ ych her jako Sportky. Geometrick´ e rozdˇ elen´ı G(p) Rozdˇelen´ı pravdˇepodobnost´ı na N+ s pravdˇepodobnostn´ı funkc´ı P (x) = p(1 − p)x−1 = pq x−1
(4.18)
pro p ∈ (0, 1) se naz´yv´ a geometrick´e rozdˇelen´ı s parametrem p. Stˇredn´ı hodnotu vypoˇc´ıt´ame: E(X) =
∞ X
x=1
xpq
x−1
=p
∞ X
x=1
xq
x−1
∞ X
∞ dq x d X d 1 p p 1 =p =p qx = p = = 2 = . 2 dq x=0 dq 1 − q (1 − q) p p x=1 dq
Rozptyl tohoto rozdˇelen´ı je D(X) = 1−p . Medi´an leˇz´ı mezi 0 a 1 pro p < 0.5 a je roven nule p pro p ≥ 0.5. Interpretace: Prov´adˇejme pokus se dvˇema moˇzn´ ymi v´ ysledky, kter´e nazveme u ´spˇech“ ” a ne´ uspˇech“. Pravdˇepodobnost u ´spˇechu necht’ je p. Poˇcet nez´avisl´ ych opakov´an´ı pokus˚ u ” do prvn´ıho u ´spˇechu je n´ahodn´a veliˇcina, kter´a m´a geometrick´e rozdˇelen´ı. P (x) ud´av´a pravdˇepodobnost, ˇze prvn´ıch x pokus˚ u bude ne´ uspˇeˇsn´ ych a ˇze k u ´spˇechu dojde teprve v (x + 1)-n´ım pokusu. 57
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Pˇ r´ıklad 4.5 Geometricke´ rozdˇelen´ı ´ ´ ´ ıme vybˇ ´ er s vracen´ım. Necht’ X znaˇc´ı nahodnou ´ Mezi N vyrobky je M vadnych. Provad´ ´ veliˇcinu, zˇe prvn´ıch x v´yrobku˚ bude dobry´ ch a v (x + 1)-n´ım tahu jsme vytahli vadny´ ´ ´ vyrobek. Pak ma´ nahodn a´ veliˇcina X geometrick´e rozdˇelen´ı s parametrem p = M . N Poissonovo rozdˇ elen´ı P(λ) Rozdˇelen´ı pravdˇepodobnost´ı na N s pravdˇepodobnostn´ı funkc´ı λx p(x) = e−λ , x! kde λ > 0 je konstanta, se naz´yv´a Poissonovo rozdˇelen´ı s parametrem λ.
(4.19)
Stˇredn´ı hodnotu vypoˇc´ıt´ame n´asleduj´ıc´ım zp˚ usobem: E(X) =
∞ X
x=0
xe−λ
∞ X λx λx = λe−λ x = λe−λ eλ = λ x! (x − 1)! x=1
Rozptyl D(X) = λ. Jestliˇze je poˇcet pokus˚ u n dosti velk´ y (prakticky staˇc´ı n > 30) a p → 0 (prakticky p ≤ 0.01), pak lze binomick´e rozdˇelen´ı aproximovat Poissonov´ ym rozdˇelen´ım s parametrem λ = np. Aplikace: Toto rozdˇelen´ı pravdˇepodobnost´ı se ˇcasto uˇz´ıv´a k modelov´an´ı ˇcetnost´ı s jakou urˇcit´a ud´alost nastane bˇehem urˇcit´eho ˇcasov´eho u ´seku. Na pˇr´ıklad poˇcet telefonn´ıch vol´an´ı v urˇcit´em ˇcasov´em intervalu, poˇcet z´akazn´ık˚ u obslouˇzen´ ych za jednotku ˇcasu u pokladny v obchodˇe, poˇcet poruch nˇejak´eho zaˇr´ızen´ı za ˇcasovou jednotku, poˇcet vad na v´ yrobku. Pˇ r´ıklad 4.6 Poissonovo rozdˇelen´ı ´ ´ ˚ doˇsl´ych bˇehem 1 hodiny na ustˇ ´ rednu v jedn´e mal´e Pˇredpokladejte, zˇ e poˇcet telefonickych hovoru firmˇe, ma´ Poissonovo rozdˇelen´ı s parametrem λ = 5.2. Vypoˇc´ıtejte pravdˇepodobnost, zˇe bˇehem ´ rednu a ) pravˇ ´ e dva hovory; b ) nejvy´ sˇ e sˇ est a nejm´enˇe 4 hovory; jedn´e hodiny pˇrijdou na ustˇ ˇ jeden hovor. d ) Jaky´ je prumˇ ˚ erny´ poˇcet hovoru ˚ za jednu hodinu? c ) aspon ˇ Reˇsen´ı: (5.2)2 a ) Protoˇze λ = 5.2 je podle (??) P (X = 2) = e−5.2 2! = 0.0746. b ) P (4 < X ≤ 6) = P (X ≤ 6) − P (X ≤ 4) = 0.7323 − 0.4060 = 0.3263. c ) P (X ≥ 1) = 1 − P (X = 0) = 1 − e−5.2 = 0.994. ˚ erny´ poˇcet hovoru ˚ za jednu hodinu je roven stˇredn´ı hodnotˇe Poissonova rozdˇelen´ı d ) Prumˇ s parametrem λ = 5.2, tud´ızˇ je roven 5.2.
Diskr´ etn´ı rovnomˇ ern´ e rozdˇ elen´ı DU(m) Rozdˇelen´ı pravdˇepodobnost´ı na Nm , kde m ∈ N+ , s pravdˇepodobnostn´ı funkc´ı 1 p(x) = , m se naz´yv´ a diskr´etn´ı rovnomˇern´e rozdˇelen´ı nebo DU(m)-rozdˇelen´ı. Distribuˇcn´ı funkce 0 pro x < 1 x pro 1 ≤ x < m F (x) = m 1 pro x ≥ m. Stˇredn´ı hodnota E(X) = m+1 , rozptyl D(X) = 2 a Q0.5 = [ m+1 ] pro m sud´ e . 2 58
m2 −1 , 12
(4.20)
medi´an Q0.5 = [ m2 ] + 1 pro m lich´e
4.3 N Eˇ KTER A´ ROZD Eˇ LEN´I PRAVD Eˇ PODOBNOST´I Obsah
4.3.2
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Spojit´ a rozdˇ elen´ı
V dalˇs´ım v´ ykladu se zamˇeˇr´ıme na nˇekter´a spojit´a rozdˇelen´ı. Rovnomˇ ern´ e rozdˇ elen´ı U(a, b) Rovnomˇern´e rozdˇelen´ı na re´aln´em intervalu (a, b) m´ a hustotu f (x) =
(
0 1 b−a
pro x < a a pro b < x pro a < x < b.
(4.21)
Pro pˇr´ısluˇsnou distribuˇcn´ı funkci plat´ı
F (x) =
0
1
pro x < a pro a ≤ x < b pro x ≥ b.
x−a b−a
(4.22)
Z´akladn´ı charakteristiky U(a, b)-rozdˇelen´ı jsou stˇredn´ı hodnota E(X) = 1 (b − a)2 a medi´an Q0.5 = b+a . 12 2
a+b , 2
rozptyl D(X) =
Obr´ azek 4.2 Hustota a distribuˇcn´ı funkce U(a, b)-rozdˇelen´ı f (x)
F (x)
1 1 b−a
0
a
b
x
a
0
(a) hustota
b
x
(b) distribuˇcn´ı funkce
Interpretace: Rovnomˇern´ ym rozdˇelen´ım se ˇr´ıd´ı takov´e n´ahodn´e veliˇciny, kter´e maj´ı stejnou moˇznost nab´ yt kter´ekoliv hodnoty z nˇejak´eho intervalu. Jsou to napˇr. chyby pˇri zaokrouhlov´an´ı ˇc´ısel, chyby pˇri odeˇc´ıt´an´ı u ´daj˚ u z line´arn´ıch stupnic mˇeˇr´ıc´ıch pˇr´ıstroj˚ u, doby ˇcek´an´ı na uskuteˇcnˇen´ı jevu opakuj´ıc´ıho se v pravideln´ ych ˇcasov´ ych intervalech. Pˇ r´ıklad 4.7 Rovnomˇerne´ rozdˇelen´ı ´ m´ıstem vyrobn´ ´ ´ ı kaˇzd´ych 5 minut polotovar. Pracovn´ık technick´e kontroly Urˇcitym ı linky prochaz´ ´ za den jeden polotovar, aby ho vyzkouˇsel. Pravdˇepodobnost pˇr´ıchodu praodeb´ıra´ nˇekolikrat ´ Jaka´ je pravdˇepodobnost, zˇe bude cˇ ekat na covn´ıka k lince je pro kaˇzd´y cˇ asovy´ okamˇzik stejna. ´ se jednu minutu? polotovar nejvyˇ ˇ sen´ı: Poˇzadovanou pravdˇepodobnost udav ´ a´ distribuˇcn´ı funkce (??), pˇriˇcemˇz a = 0, b = 5. Reˇ
P (X ≤ 1) = F (1) = 51 . Normovan´ e norm´ aln´ı rozdˇ elen´ı N (0, 1) Rozdˇelen´ı pravdˇepodobnost´ı na R s hustotou 1 1 ϕ(z) = √ exp − z 2 , 2 2π
59
(4.23)
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
se naz´yv´ a normovan´e norm´aln´ı (Gaussovo) rozdˇelen´ı nebo N (0, 1)-rozdˇelen´ı. N´ahodn´a veliˇcina s N (0, 1)-rozdˇelen´ım se naz´ yv´a normovan´a norm´aln´ı n´ahodn´a veliˇcina. Hustota N (0, 1)-rozdˇelen´ı m´a tvar zvonovit´e kˇrivky a naz´ yv´a se normovan´ a norm´ aln´ı (Gaussova, gaussovsk´ a) kˇrivka. Z´ akladn´ı vlastnosti N (0, 1)-rozdˇ elen´ı 1. Plat´ı limz→±∞ ϕ(z) = 0. To znamen´a, ˇze pro z → ±∞ se normovan´a norm´aln´ı kˇrivka asymptoticky pˇribliˇzuje k nule. 2. Hustota ϕ(z) je sud´a funkce: ϕ(−z) = ϕ(z). Tud´ıˇz normovan´a norm´aln´ı kˇrivka je symetrick´a kolem 0. Hustota N (0, 1)-rozdˇelen´ı nab´ yv´a sv´eho maxima pro z = 0. 3. E(Z) = 0, D(Z) = 1, Q0.5 = 0. Stˇredn´ı hodnota tohoto rozdˇelen´ı charakterizuj´ıc´ı polohu rozdˇelen´ı je rovna nule, a rozptyl charakterizuj´ıc´ı rozpt´ ylen´ı hodnot kolem nuly je roven jedn´e. 4. P (−3 < Z ≤ 3) ≈ 0.997. To znamen´a, ˇze vˇetˇsina plochy pod normovanou norm´aln´ı kˇrivkou leˇz´ı mezi −3 a +3. Distribuˇcn´ı funkce N (0, 1)-rozdˇelen´ı se obvykle znaˇc´ı Φ Φ(z) =
Z z
ϕ(u) du,
−∞
z∈R
(4.24)
a b´ yv´a tabelov´ana pouze pro hodnoty z > 0. Protoˇze vˇsak hustota ϕ je sud´a, plat´ı Φ(−z) = 1 − Φ(z).
(4.25)
Obr´ azek 4.3 Hustota a distribuˇcn´ı funkce N (0, 1)-rozdˇelen´ı f (x)
F (x) 1
√1 2π
1 2
x
0
-3
(a) hustota
-2
-1
0
1
2
3
x
(b) distribuˇcn´ı funkce
Z´aroveˇ n lze dok´azat, ˇze pro kvantily Qp normovan´eho norm´aln´ıho rozdˇelen´ı plat´ı: Qp = −Q1−p
(4.26)
Symbolem zα budeme znaˇcit hodnotu pro kterou plat´ı: α=
Z ∞
ϕ(z) dz.
zα
60
(4.27)
4.3 N Eˇ KTER A´ ROZD Eˇ LEN´I PRAVD Eˇ PODOBNOST´I Obsah
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Norm´ aln´ı rozdˇ elen´ı N (µ, σ 2 ) Rozdˇelen´ı pravdˇepodobnost´ı na R se naz´yv´ a norm´ aln´ı (Gaussovo) rozdˇelen´ı se stˇredn´ı hod2 2 notou µ a rozptylem σ nebo N (µ, σ )-rozdˇelen´ı, jestliˇze m´ a hustotu 1 (x − µ)2 f (x) = √ exp − , 2σ 2 2πσ !
µ ∈ R, σ 2 ∈ R+ .
(4.28)
Norm´aln´ı rozdˇelen´ı m´a tvar zvonovit´e kˇrivky, kter´a nab´ yv´a maxima v bodˇe x = µ a pˇri n → ±∞ se pˇribliˇzuje k ose x. V´ ypoˇcet distribuˇcn´ı funkce tohoto rozdˇelen´ı je obt´ıˇzn´ y. Proto transformujeme n´ahodnou veliˇcinu X na normovanou norm´ aln´ı veliˇ cinu Z, kde Z=
X −µ . σ
(4.29)
Veliˇcina Z m´a pak N (0, 1)-rozdˇelen´ı. Distribuˇcn´ı funkci F (x) lze vyj´adˇrit pomoc´ı distribuˇcn´ı funkce N (0, 1)-rozdˇelen´ı x−µ F (x) = Φ . σ Obr´ azek 4.4 Hustota a distribuˇcn´ı funkce N (µ, σ 2 )-rozdˇelen´ı f (x)
F (x) 1
√ 1 2πσ 2
1 2
0
µ
x
0
(a) hustota
µ
x
(b) distribuˇcn´ı funkce
Empirick´ e pravidlo pro norm´ alnˇ e rozdˇ elen´ e n´ ahodn´ e veliˇ ciny Pro kaˇzdou norm´alnˇe rozdˇelenou n´ahodnou veliˇcinu X plat´ı: (a) P (µ − σ < X < µ + σ) = 0.6826, (b) P (µ − 2σ < X < µ + 2σ) = 0.9544, (c) P (µ − 3σ < X < µ + 3σ) = 0.9974. Tyto vlastnosti jsou graficky zn´azornˇeny na obr. ??. Obr´ azek 4.5 Empirick´a pravidla pro norm´ alnˇe rozdˇelenou n´ ahodnou veliˇcinu 0.9544
0.6826 µ−σ
µ
µ+σ
µ − 2σ
µ
0.9974 µ + 2σ
µ − 3σ
µ
µ + 3σ
Aplikace: Norm´aln´ı rozdˇelen´ı m´a v teorii pravdˇepodobnosti mimoˇr´adn´ y v´ yznam. Slouˇz´ı jako pravdˇepodobnostn´ı model chov´an´ı velk´eho mnoˇzstv´ı n´ahodn´ ych jev˚ u v technice, pˇr´ırodn´ıch 61
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
vˇed´ach a v ekonomii. Mnoho n´ahodn´ ych veliˇcin vyskytuj´ıc´ıch se v praktick´ ych aplikac´ıch m´a alespoˇ n pˇribliˇznˇe norm´aln´ı rozdˇelen´ı. Norm´aln´ı rozdˇelen´ı b´ yv´a nˇekdy naz´ yv´ano z´akonem ” chyb“. Pˇri opakovan´em mˇeˇren´ı t´eˇze veliˇciny za stejn´ ych podm´ınek zp˚ usobuj´ı n´ahodn´e vlivy odchylky od skuteˇcn´e hodnoty mˇeˇren´e veliˇciny. Tyto n´ahodn´e chyby maj´ı ˇcasto norm´aln´ı rozdˇelen´ı. Velk´ y v´ yznam norm´aln´ıho rozdˇelen´ı spoˇc´ıv´a tak´e v tom, ˇze za urˇcit´ ych podm´ınek lze pomoc´ı nˇej aproximovat ˇradu diskr´etn´ıch i spojit´ ych rozdˇelen´ı. Pˇ r´ıklad 4.8 Normaln´ ´ ı rozdˇelen´ı ´ ı testu na vysok´e sˇ kole ma´ normaln´ ´ ı rozdˇelen´ı se stˇredn´ı hodnotou Doba potˇrebna´ na vypracovan´ 110 minut a smˇerodatnou odchylkou 20 minut. ˚ dokonˇc´ı test do dvou hodin? b ) Jak dlouho by mˇel test trvat, aby ho a ) Kolik procent studentu ´ e 90% studentu? ˚ dokonˇcilo pravˇ ˇ sen´ı: Necht’ X znaˇc´ı dobu potˇrebnou na vypracovan´ ´ ı testu. Pak X ∼ N (110, 400). Reˇ 120−110 10 ˚ a ) P (X ≤ 120) = F (120) = Φ( 20 ) = Φ( 20 ) = Φ(0.5) = 0.6915. Pouze 69.15% studentu 110 ´ dokonˇc´ı test do dvou hodin. b ) P (X ≤ t) = F (t) = Φ( t−20 ) = 0.90. V tabulkach najdeme, 110 zˇe pro z = 1.28 je P (X ≤ 1.28) = 0.90. Tud´ızˇ t−20 = 1.28 a z toho dostaneme t = 135.6. ´ e 90% studentu˚ je 2hodiny a 15 minut. Doba potˇrebna´ k tomu, aby test dokonˇcilo pravˇ
Exponenci´ aln´ı rozdˇ elen´ı E(λ) Rozdˇelen´ı pravdˇepodobnost´ı na R+ se naz´yv´ a exponenci´ aln´ı rozdˇelen´ı s parametrem λ > 0 nebo E(λ)-rozdˇelen´ı, jestliˇze m´a hustotu f (x) =
(
λe−λx pro x > 0 0 pro x ≤ 0.
(4.30)
1 − e−λx pro x > 0 0 pro x ≤ 0.
(4.31)
Distribuˇcn´ı funkce je F (x) =
(
Stˇredn´ı hodnota tohoto rozdˇelen´ı E(X) = 1/λ, rozptyl E(X) = 1/λ2 a medi´an Q0.5 = ln 2/λ. Obr´ azek 4.6 Hustota a distribuˇcn´ı funkce E(λ)-rozdˇelen´ı f (x)
F (x) 1
λ
λe−λx
x
0 (a) hustota
0
x
(b) distribuˇcn´ı funkce
Aplikace: Toto rozdˇelen´ı m´a uplatnˇen´ı v teorii spolehlivosti a v teorii hromadn´e obsluhy, zejm´ena pˇri v´ ypoˇctu pravdˇepodobnosti ˇzivotnosti v´ yrobk˚ u a zaˇr´ızen´ı. Typick´ y pˇr´ıklad n´ahodn´e veliˇciny s E(λ)-rozdˇelen´ım je doba mezi v´ yskytem dvou po sobˇe n´asleduj´ıc´ıch n´ahodn´ ych jev˚ u. Ve fyzice je hodnota medi´anu Q0.5 = 1/λ ln 2 zn´am´a jako poloˇcas rozpadu radioaktivn´ıho prvku. 62
4.3 N Eˇ KTER A´ ROZD Eˇ LEN´I PRAVD Eˇ PODOBNOST´I Obsah
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Pˇ r´ıklad 4.9 Exponencialn´ ´ ı rozdˇelen´ı ˚ erna´ doba cˇ ekan´ ´ ı zakazn´ ´ Prumˇ ıka na obsluhu v urˇcit´e prodejnˇe je 50 sekund, pˇriˇcemˇz doba ´ ı se rˇ´ıd´ı exponencialn´ ´ ım rozdˇelen´ım. Jaka´ je pravdˇepodobnost, zˇe nahodn ´ ´ cˇ ekan´ y´ zakazn´ ık bude obslouˇzen za dobu ne delˇs´ı neˇz 30 sekund? ˇ sen´ı: Protoˇze λ = 1/50 = 0.02 je P (X ≤ 30) = 1 − e−(0.02).30 = 1 − e−0.6 ≈ 0.451. Reˇ
S norm´aln´ım rozdˇelen´ım jsou spjata nˇekter´a dalˇs´ı d˚ uleˇzit´a rozdˇelen´ı, kter´a budeme pouˇz´ıvat v dalˇs´ıch kapitol´ach. Jejich hustotu zde nebudeme uv´adˇet. ch´ı-kvadr´ at rozdˇ elen´ı χ2 (n) Jestliˇze Z1 , Z2 , · · · , Zn je posloupnost nez´avisl´ ych n´ahodn´ ych veliˇcin, z nichˇz kaˇzd´a m´a N (0, 1)-rozdˇelen´ı, pak souˇcet ˇctverc˚ u tˇechto veliˇcin, tj. veliˇcina χ2 =
n X
Zi2 ,
i=1
m´a ch´ı–kvadr´ at rozdˇ elen´ı s n stupni volnosti. Poˇctem stupˇ n˚ u volnosti se rozum´ı poˇcet nez´avisl´ ych sˇc´ıtanc˚ u. Je jedin´ ym parametrem rozdˇelen´ı. Stˇredn´ı hodnota tohoto rozdˇelen´ı je E(χ2 ) = n a rozptyl D(χ2 ) = 2n. Pro r˚ uzn´e poˇcty stupˇ n˚ u 2 2 2 volnosti ν jsou tabelov´any hodnoty χα , splˇ nuj´ıc´ı vztah P (χ > χα ) = α, 0 < α < 1. Se vzr˚ ustaj´ıc´ım poˇctem stupˇ n˚ u volnosti se χ2 -rozdˇelen´ı bl´ıˇz´ı norm´aln´ımu rozdˇelen´ı. Obr´ azek 4.7 Hustota χ2 -rozdˇelen´ı a t-rozdˇelen´ı
ν=5 ν = 10 ν = 19
χ2 (a) χ2 -rozdˇelen´ı
(b) t-rozdˇelen´ı
Studentovo t-rozdˇ elen´ı t(n) 2 Jestliˇze Z a χ jsou dvˇe nez´avisl´e n´ahodn´e veliˇciny takov´e, ˇze Z m´a N (0, 1)-rozdˇelen´ı a χ2 m´a χ2 (n)-rozdˇelen´ı, pak veliˇcina Z √ T =√ 2 n χ m´a Studentovo t-rozdˇ elen´ı s n stupni volnosti. Poˇcet stupˇ n˚ u volnosti je jedin´ y parametr tohoto rozdˇelen´ı. Pro n → ∞ se t-rozdˇelen´ı bl´ıˇz´ı normovan´emu norm´aln´ımu rozdˇelen´ı. Pˇri praktick´ ych aplikac´ıch pro n > 30 povaˇzujeme rozdˇelen´ı jiˇz za norm´aln´ı.
63
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Z´ akladn´ı vlastnosti t-rozdˇ elen´ı s n stupni volnosti 1. Hustota gn (t) je sud´a funkce: gn (t) = gn (−t). 2. Distribuˇcn´ı funkce splˇ nuje podm´ınku Gn (t) = 1 − Gn (−t). 3. Pro kvantily plat´ı Qp (n) = −Q1−p (n), n = 1, 2, · · · , 0 < p < 1. Dvourozmˇ ern´ e norm´ aln´ı rozdˇ elen´ı N´ahodn´ y vektor (X, Y ) m´a dvourozmˇern´e norm´aln´ı rozdˇelen´ı s vektorem stˇredn´ıch hodnot µ, a kovarianˇcn´ı matic´ı Σ T
µ = (µx , µy ) ,
Σ=
σx2 σxy σxy σy2
!
,
jestliˇze jeho hustota f (x, y) m´a tvar (
1 1 √ f (x, y) = exp − 2 2(1 − ρ2 ) 2πσx σy 1 − ρ
(x − µx )2 (x − µx )(y − µy ) (y − µy )2 − 2ρ + σx2 σx σy σy2
!)
kde (x, y) ∈ R2 , a ρ = σxy /σx σy je korelaˇcn´ı koeficient sloˇzek X a Y n´ahodn´eho vektoru (X, Y ). Pro |ρ| = 1 nen´ı hustota definov´ana. Jestliˇze ρ = 0, pak veliˇciny X a Y jsou nekorelovan´e, ale v tomto pˇr´ıpadˇe tak´e i nez´avisl´e.
4.4
Nˇ ekter´ e limitn´ı vˇ ety
Limitn´ı vˇety teorie pravdˇepodobnosti se zab´ yvaj´ı chov´an´ım posloupnost´ı n´ahodn´ ych veliˇcin. Jsou d˚ uleˇzit´e pro popis pravdˇepodobnostn´ıch model˚ u v pˇr´ıpadˇe rostouc´ıho poˇctu n´ahodn´ ych pokus˚ u. V tomto odstavci zformulujeme z´akon velk´ ych ˇc´ısel a centr´aln´ı limitn´ı vˇety jen v jejich nejjednoduˇsˇs´ı podobˇe bez form´aln´ıho d˚ ukazu, pouze s ohledem na jejich vˇecn´ y obsah.
4.4.1
Z´ akon velk´ ych ˇ c´ısel
Obecn´e znˇen´ı z´akona velk´ ych ˇc´ısel je moˇzn´e zformulovat takto: Jestliˇze zvˇetˇsujeme poˇcet nez´avisl´ ych pokus˚ u, pˇribliˇzuje se empiricky zjiˇstˇen´a charakteristika, popisuj´ıc´ı v´ ysledky tˇechto pokus˚ u, charakteristice teoretick´e. Podm´ınky p˚ usoben´ı tohoto z´akona specifikuj´ı ˇ d´ılˇc´ı vˇety, z nichˇz nejd˚ uleˇzitˇejˇs´ı uvedeme. D´ılˇc´ı vˇety se dokazuj´ı pomoc´ı tzv. Cebyˇ sevovy nerovnosti. ˇ Cebyˇ sevova nerovnost. Necht’ X je n´ahodn´a veliˇcina se stˇredn´ı hodnotou E(X) a rozptylem D(X). Pak pro kaˇzd´e re´aln´e ˇc´ıslo > 0 plat´ı D(X) . (4.32) P (| X − E(X) |≥ ) ≤ 2 ˇ Pˇ r´ıklad 4.10 Ilustrace Cebyˇ sevovy nerovnosti ’ ´ Necht nahodn a´ veliˇcina X ma´ libovoln´e rozdˇelen´ı se stˇredn´ı hodnotou µ = 2 a rozptylem ´ σ 2 = 1. Urˇcete pravdˇepodobnost, zˇe nahodn a´ veliˇcina nabude hodnoty, ktera´ se bude liˇsit od
64
,
4.4 N Eˇ KTER E´ LIMITN´I V Eˇ TY Obsah
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
µ o m´enˇe neˇz ±2. ˇ sen´ı: V tomto pˇr´ıpadˇe je Reˇ
= 2. Poˇzadovana´ pravdˇepodobnost je
P (| X − 2 |< 2) = 1 − P (| X − 2 |≥ 2) ≥ 1 − 1/4 = 0.75. Pˇristoup´ıme nyn´ı k jedn´e z d´ılˇc´ıch vˇet z´akona velk´ ych ˇc´ısel, a sice k Bernoulliho vˇetˇe. Bernoulliho vˇ eta (Bernoulliho z´ akon velk´ ych ˇ c´ısel). Necht’ X1 , X2 , · · · je posloupnost nez´avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin s alternativn´ım rozdˇelen´ım A(p). Oznaˇcme P Sn = ni=1 Xi . Pak pro kaˇzd´e > 0 plat´ı:
lim P | n→∞
Sn − p |> = 0. n
ˇ Bernoulliho vˇeta je jednoduch´ ym d˚ usledkem Cebyˇ sevovy nerovnosti. V´ yraz Sn /n v pˇredchoz´ı vˇetˇe je relativn´ı ˇcetnost jevu A = [Xi = 1] v n nez´avisl´ ych opakov´an´ıch pokusu. Z´akon velk´ ych ˇc´ısel potvrzuje, ˇze pro n → ∞ konverguje relativn´ı ˇcetnost ke konstantˇe a sice k pravdˇepodobnosti p jevu A. Pojem konvergence posloupnosti n´ahodn´ ych veliˇcin lze definovat r˚ uzn´ ym zp˚ usobem, v Bernoulliho vˇetˇe jde o konvergenci podle pravdˇepodobnosti. ˇ Rekneme, ˇze posloupnost X1 , X2 , · · · n´ahodn´ ych veliˇcin konverguje podle pravdˇ epodobnosti ke konstantˇe c, jestliˇze pro kaˇzd´e > 0 plat´ı lim P (| Xn − c |> ) = 0.
n→∞
Bernoulliho vˇetu m˚ uˇzeme nyn´ı pomoc´ı pojmu konvergence podle pravdˇepodobnosti formulovat takto: Relativn´ı ˇcetnost sledovan´eho jevu v posloupnosti nez´ avisl´ych pokus˚ u konverguje podle pravdˇepodobnosti k pravdˇepodobnosti sledovan´eho jevu, roste-li poˇcet pokus˚ u nade vˇsechny meze. Jinak ˇreˇceno, pˇri dostateˇcnˇe velk´em poˇctu nez´avisl´ ych pokus˚ u velk´e odchylky relativn´ı ˇcetnosti od pravdˇepodobnosti jsou velmi nepravdˇepodobn´e. Praktick´ y v´ yznam t´eto vˇety spoˇc´ıv´a mimo jin´e v moˇznosti experiment´alnˇe odhadovat nezn´amou pravdˇepodobnost pomoc´ı napozorovan´e relativn´ı ˇcetnosti. Pˇ r´ıklad 4.11 Ilustrace Bernoulliho vˇety ´ ´ ˚ pˇri urˇcit´em procesu vyroby ´ ´ Z 2500 nezavisle vyrobeny´ ch vyrobk u jich bylo 100 vadnych. Pod´ıl ´ 100/2500 = 0.04 je bl´ızky´ cˇ´ıslu p, kter´e vyjadˇruje neznamou pravdˇepodobnost vyroben´ı vadn´eho ´ ´ vyrobku pˇri dan´em procesu vyroby.
N´asleduj´ıc´ı vˇeta ˇr´ık´a, ˇze aritmetick´ y pr˚ umˇer konverguje ke stˇredn´ı hodnotˇe. To je zobecnˇen´ı Bernoulliho vˇety, nebot’ relativn´ı ˇcetnost je pr˚ umˇerem veliˇcin s alternativn´ım rozdˇelen´ım a pravdˇepodobnost jevu A je jejich stˇredn´ı hodnotou. Chinˇ cinova vˇ eta Necht’ X1 , X2 , · · · je posloupnost nez´avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin se stˇredn´ı hodnotou µ. Pak pro kaˇzd´e > 0 plat´ı n 1X lim P | Xi − µ |> = 0. n→∞ n i=1
!
65
K APITOLA 4 Obsah
´ ´ VELI CINA ˇ N AHODN A
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Podle z´akona velk´ ych ˇc´ısel m˚ uˇzeme vypoˇcten´ım relativn´ı ˇcetnosti respektive aritmetick´eho pr˚ umˇeru (pokud se vztahuj´ı k dostateˇcnˇe velk´emu poˇctu pozorov´an´ı) z´ıskat velmi pˇresnou informaci o pravdˇepodobnosti nˇejak´eho jevu respektive o stˇredn´ı hodnotˇe nˇejak´e n´ahodn´e veliˇciny. Pˇ r´ıklad 4.12 Ilustrace Chinˇcinovy vˇety ˚ erna´ doba zˇivotnosti Necht’ doba zˇivotnosti X urˇcit´eho v´yrobku ma´ P (λ)-rozdˇelen´ı. Potom prumˇ Pn ´ ´ ´ ˚ se jen velmi malo ´ ´ e doby X = vyrobenych vyrobk u liˇs´ı od neznam´ i=1 Xi nezavisle zˇivotnosti 1/λ.
4.4.2
Centr´ aln´ı limitn´ı vˇ ety
Centr´aln´ı limitn´ı vˇety tvrd´ı, ˇze souˇcty a tedy i pr˚ umˇery velk´eho poˇctu nez´avisl´ ych n´ahodn´ ych veliˇcin maj´ı za velmi obecn´ ych podm´ınek pˇribliˇznˇe norm´aln´ı rozdˇelen´ı. Tyto vˇety vysvˇetluj´ı, proˇc se v r˚ uzn´ ych oborech setk´av´ame tak ˇcasto s norm´aln´ım nebo pˇribliˇznˇe norm´aln´ım rozdˇelen´ım. Typick´ ym pˇr´ıkladem jsou nepˇresnosti pˇri mˇeˇren´ı; v´ ysledn´a chyba mˇeˇren´ı je sloˇzena z mnoha r˚ uzn´ ych mal´ ych chyb. Centr´aln´ı limitn´ı vˇety n´am umoˇzn ˇuj´ı pˇredpokl´adat, ˇze rozdˇelen´ı chyb mˇeˇren´ı je norm´aln´ı. Proto se norm´aln´ımu z´akonu rozdˇelen´ı ˇr´ık´a z´akon chyb. Zm´ınili jsme se o tom jiˇz v odstavci ??, kde jsme uv´adˇeli definici a vlastnosti norm´aln´ıho rozdˇelen´ı. Pozn´ amka: O n´ahodn´ ych veliˇcin´ach, jejichˇz limitn´ım z´akonem je norm´aln´ı rozdˇelen´ı ˇr´ık´ame, ˇze maj´ı asymptoticky norm´ aln´ı rozdˇ elen´ı. Nejjednoduˇsˇs´ı pˇr´ıpad centr´aln´ı limitn´ı vˇety je tzv. Moivreova-Laplaceova vˇeta, kter´a vyjadˇruje konvergenci binomick´eho rozdˇelen´ı k rozdˇelen´ı norm´aln´ımu a d´av´a tak moˇznost aproximovat binomick´e rozdˇelen´ı rozdˇelen´ım norm´aln´ım. Moivreova-Laplaceova vˇ eta. Necht’ X1 , X2 , · · · je posloupnost nez´avisl´ ych stejnˇe rozdˇeP len´ ych n´ahodn´ cin s alternativn´ım rozdˇelen´ım A(p). Poloˇzme Sn = ni=1 Xi a Zn = q ych veliˇ (Sn − np)/ np(1 − p). Potom plat´ı lim P (Zn ≤ x) = Φ(x), x ∈ R.
n→∞
Pˇ r´ıklad 4.13 Aproximace binomickeho rozdˇelen´ı normaln´ ´ ´ ım rozdˇelen´ım ´ Student se podrob´ı zkouˇsce ve formˇe testu s 10 otazkami, na kter´e odpov´ıda´ ano nebo ne. ´ a´ odpovˇedi na vˇsechny otazky. ´ Student had Uˇzijte binomick´e rozdˇelen´ı ke stanoven´ı pˇresn´e ´ ´ e. Pak pouˇzijte aproximaci bipravdˇepodobnosti, zˇe student odpov´ı na 7 nebo 8 otazek spravnˇ ´ ım rozdˇelen´ım. nomick´eho rozdˇelen´ı normaln´ ˇ sen´ı: Necht’ S10 je poˇcet spravn ´ y´ ch odpovˇed´ı na 10 otazek. ´ ´ a´ odpovˇedi, je Reˇ Protoˇze student had ´ e odpovˇedi p = 0.5, S10 ∼ B (10, 0.5). Z tabulky binomick´eho rozdˇelen´ı pravdˇepodobnost spravn´ ´ v´ypoˇctem dostaneme nebo pˇr´ımym
P (S10 = 7 ∨ 8) = P (7) + P (8) = 0.1172 + 0.0439 = 0.1611. ∨ 8 oznaˇcuje v´yrok X se rovna´ 7 nebo 8). E (S10 ) = np = 10 · 0.5 = 5 a D(Sn ) = √ ´ ı aproximace prov´est np(1 − p) = 1.58. Protoˇze n nen´ı pˇr´ıliˇs vysok´e, je tˇreba pˇri pouˇzit´ı normaln´
(X = 7
66
4.4 N Eˇ KTER E´ LIMITN´I V Eˇ TY Obsah
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
´ korekci pro nahrazen´ı diskr´etn´ıho rozdˇelen´ı spojity´ m, tzv. korekci na spojitost. Ulohu lze totiˇz ’ formulovat jako urˇcen´ı P (6.5 ≤ S10 ≤ 8.5), nebot plat´ı
P (6.5 ≤ S10 ≤ 8.5) = P (S10 ≤ 8.5) − P (S10 < 6.5) = P (S10 ≤ 8) − P (S10 ≤ 6) = P (S10 = 8) + P (S10 = 7). Pouˇzit´ım Moivreova-Laplaceovy vˇety dostaneme
P
6.5 − 5 8.5 − 5 ≤ Z10 ≤ 1.58 1.58
= P (0.95 ≤ Z10 ≤ 2.22) = Φ(2.22) − Φ(0.95) = 0.9868 − 0.8289 = 0.1579.
´ ım t´eto hodnoty s hodnotou P (S10 = 7 Porovnan´ dobrou aproximac´ı binomick´eho rozdˇelen´ı.
´ ı aproximace je velice ∨ 8) vid´ıme, zˇe normaln´
Centr´aln´ı limitn´ı vˇetu, kter´a je pˇr´ım´ ym zobecnˇen´ım Moivreovy-Laplaceovy vˇety, lze vyslovit takto: Linderbergova-L´ evyho vˇ eta Necht’ X1 , X2 , · · · jsou nez´avisl´e n´ahodn´e veliˇciny se stejn´ ym rozdˇelen´ım, kter´e maj´ √ ı Pn 2 koneˇcnou stˇredn´ı hodnotu µ a rozptyl σ . Poloˇzme Yn = i=1 Xi a Zn = (Yn − nµ)/σ n. Potom plat´ı lim P (Zn ≤ x) = Φ(x), x ∈ R. n→∞ Podle t´eto vˇety konverguje distribuˇcn´ı funkce normovan´ ych souˇct˚ u k distribuˇcn´ı funkci N (0, 1)-rozdˇelen´ı pro libovoln´e v´ ychoz´ı rozdˇelen´ı s koneˇcnou stˇredn´ı hodnotou a koneˇcn´ ym rozptylem. Jinak ˇreˇceno souˇcet a t´ım i pr˚ umˇer n nez´avisl´ ych n´ahodn´ ych veliˇcin, kter´e maj´ı stejn´e (libovoln´e) rozdˇelen´ı s koneˇcnou stˇredn´ı hodnotou a koneˇcn´ ym rozptylem m´a pro dosti velk´e n pˇribliˇznˇe norm´aln´ı rozdˇelen´ı. Pˇ r´ıklad 4.14 Ilustrace Linderbergovy-Levyho vˇety ´ ’ ´ ˚ eru Necht doba zˇivotnosti X urˇcit´eho vyrobku ma´ P (λ)-rozdˇelen´ı. Potom normovany´ tvar prumˇ P ´ ´ enych ´ ˚ je X = n1 ni=1 Xi dob zˇivotnosti X1 , X2 , · · · , Xn nezavisle vyrabˇ v´yrobku Zn =
X − 1/λ √ . 1/λ n
Zn se da´ pro dostateˇcnˇe velk´e n aproximovat rozdˇelen´ım N (0, 1).
67
Kapitola 5 N´ ahodn´ y v´ ybˇ er V pˇredch´azej´ıc´ıch kapitol´ach jsme se zab´ yvali popisnou statistikou, pravdˇepodobnost´ı, n´ahodn´ ymi veliˇcinami, nˇekter´ ymi rozdˇelen´ımi pravdˇepodobnost´ı a limitn´ımi vˇetami. Nyn´ı si uk´aˇzeme, ˇze tyto zd´anlivˇe r˚ uzn´e pojmy jsou z´akladem inferenˇcn´ı statistiky. Zavedeme pojem n´ahodn´ y v´ ybˇer z rozdˇelen´ı, kter´ y m´a v matematick´e statistice u ´stˇredn´ı postaven´ı a spojuje vˇetˇsinu teoretick´ ych v´ ysledk˚ u s praktick´ ymi situacemi.
5.1
Pojem n´ ahodn´ eho v´ ybˇ eru
Uvaˇzujme n´ahodn´ y pokus, jehoˇz v´ ysledkem je hodnota x jednorozmˇern´e n´ahodn´e veliˇciny X, kter´a m´a distribuˇcn´ı funkci F (x). Opakujeme-li n´ahodn´ y pokus nez´avisle n kr´at, dostaneme hodnoty x1 , x2 , · · · , xn . Pˇritom xi , i = 1, 2, · · · , n lze povaˇzovat za hodnotu n´ahodn´e veliˇciny Xi . Protoˇze n uvaˇzovan´ ych pokus˚ u je n nez´avisl´ ych opakov´an´ı t´ehoˇz pokusu, jsou n´ahodn´e veliˇciny X1 , X2 , · · · , Xn vz´ajemnˇe nez´avisl´e a vˇsechny maj´ı stejn´e rozdˇelen´ı, jak´e m´a n´ahodn´a veliˇcina X (tj. vˇsechny maj´ı tut´eˇz distribuˇcn´ı funkci F (x), jakou m´a n´ahodn´a veliˇcina X). Posloupnost nez´avisl´ ych a stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin X1 , X2 , · · · , Xn naz´ yv´ame n´ ahodn´ ym v´ ybˇ erem o rozsahu n z rozdˇelen´ı, kter´e m´a kaˇzd´a uvaˇzovan´a n´ahodn´a veliˇcina X1 , X2 , · · · , Xn (tj. z rozdˇelen´ı maj´ıc´ıho distribuˇcn´ı funkci F (x); m´ısto distribuˇcn´ı funkc´ı F (x) m˚ uˇzeme ovˇsem diskr´etn´ı rozdˇelen´ı popsat pravdˇepodobnostmi P (x) a spojit´a rozdˇelen´ı hustotou pravdˇepodobnosti f (x)). N´ahodn´ y v´ ybˇer budeme znaˇcit X = (X1 , X2 , · · · , Xn ). Posloupnost hodnot x1 , x2 , · · · , xn , kter´e nab´ yvaj´ı n´ahodn´e veliˇciny X1 , X2 , · · · , Xn nazveme v´ ybˇ erov´ ymi hodnotami nebo realizac´ı n´ ahodn´ eho v´ ybˇ eru. Mnoˇzina V hodnot, kter´e nab´ yvaj´ı n´ahodn´e veliˇciny X1 , X2 , · · · , Xn , se naz´ yv´a v´ ybˇ erov´ ym prostorem. V´ ybˇerov´ y n prostor V je podmnoˇzinou R . Protoˇze n´ahodn´e veliˇciny X1 , X2 , · · · , Xn jsou vz´ajemnˇe nez´avisl´e a maj´ı stejn´e rozdˇelen´ı, plat´ı pro distribuˇcn´ı funkci H(x) n´ahodn´eho v´ ybˇeru H(x) = F (x1 )F (x2 )...F (xn ),
xi ∈ R.
Pˇ r´ıklad 5.1 Distribuˇcn´ı funkce nahodn eho vybˇ ´ ´ ´ eru ’ ´ Necht X = (X1 , X2 , · · · , Xn ) je nahodn y´ v´ybˇer ze spojit´eho rovnomˇern´eho rozdˇelen´ı na intervalu ´ ´ eru X. (0,1). Urˇcete distribuˇcn´ı funkci H (x) nahodn´ eho vybˇ ˇ Reˇsen´ı: Xi ∼ U (0, 1) H (x) = H (x1 , x2 , · · · , xn ) = x1 · x2 · · · xn . 68
´ Eˇ ROV E´ CHARAKTERISTIKY 5.2 V YB Obsah
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Pravdˇepodobnostn´ı funkce q(x) n´ahodn´eho v´ ybˇeru v pˇr´ıpadˇe diskr´etn´ıho rozdˇelen´ı n´ahodn´ ych veliˇcin X1 , X2 , · · · , Xn je q(x) = P (X1 = x1 , X2 = x2 , · · · , Xn = xn ) = p(x1 )p(x2 ) · · · p(xn ) Pˇ r´ıklad 5.2 Pravdˇepodobnostn´ı funkce nahodn eho vybˇ ´ ´ ´ eru ´ Necht’ X = (X1 , X2 , · · · , Xn ) je nahodn y´ vy´ bˇer z Poissonova rozdˇelen´ı s parametrem λ. Urˇcete pravdˇepodobnostn´ı funkci q (x). x ˇ sen´ı: Xi ∼ P (λ), f (xi ) = λ i e−λ , xi = 0, 1 · · · , i = 1, 2, · · · , n Reˇ xi ! Pn
q (x) = λ
i=1
xi −nλ
e
1 . x1 !x2 !...xn !
Hustota rozdˇelen´ı h(x) n´ahodn´eho v´ ybˇeru z rozdˇelen´ı s hustotou f (x) je h(x) = h(x1 , x2 , · · · , xn ) = f (x1 )f (x2 ) · f (xn ), xi ∈ R, i = 1, 2, · · · , n. Pˇ r´ıklad 5.3 Hustota rozdˇelen´ı nahodn eho vybˇ ´ ´ ´ eru ’ ´ ´ ıho rozdˇelen´ı N (µ, σ 2 ). Najdˇete hustotu Necht X = (X1 , X2 , · · · , Xn ) je nahodn y´ v´ybˇer z normaln´ h(x). ˇ sen´ı: Xi ∼ N (µ, σ 2 ) Reˇ h(x) =
n Y
i=1
5.2
n 1 xi − µ 2 1 1 X exp{− ( ) }= exp {− (xi − µ)2 }, n/ 2 n 2 2 σ (2π ) σ 2σ i=1 2πσ
√
1
xi ∈ R.
V´ ybˇ erov´ e charakteristiky
Jak jiˇz v´ıme, statistick´ y soubor lze popsat pomoc´ı r˚ uzn´ ych popisn´ ych charakteristik. Mezi nejd˚ uleˇzitˇejˇs´ı charakteristiky patˇr´ı aritmetick´ y pr˚ umˇer, rozptyl a relativn´ı ˇcetnost. U spoˇcetn´ ych statistick´ ych soubor˚ u bychom mˇeli sp´ıˇse hovoˇrit o parametrech rozdˇelen´ı sledovan´eho znaku. K tˇemto charakteristik´am a parametr˚ um m˚ uˇzeme naj´ıt ve v´ ybˇerov´em souboru pˇr´ısluˇsn´e protˇejˇsky, tj. v´ ybˇ erov´ e charakteristiky neboli statistiky. Zat´ımco charakteristiky z´akladn´ıho souboru a parametry rozdˇelen´ı sledovan´eho znaku jsou pevn´e hodnoty, statistiky se mˇen´ı od jednoho n´ahodn´eho v´ ybˇeru ke druh´emu. Z pravdˇepodobnostn´ıho hlediska maj´ı charakter n´ahodn´ ych veliˇcin, nebot’ jsou vypoˇcteny z hodnot n´ahodn´eho v´ ybˇeru, kter´e jsou samy hodnotami n´ahodn´ ych veliˇcin. Tyto n´ahodn´e veliˇciny neobsahuj´ı parametry rozdˇelen´ı. Pˇr´ıklady v´ ybˇerov´ ych charakteristik jsou: v´ybˇerov´y pr˚ umˇer, v´ybˇerov´y rozptyl a v´ybˇerov´y pod´ıl.
5.3
Rozdˇ elen´ı v´ ybˇ erov´ ych charakteristik
Chceme-li na z´akladˇe v´ ybˇerov´e charakteristiky dˇelat z´avˇery o charakteristice z´akladn´ıho souboru nebo o parametru rozdˇelen´ı, je nutn´e vˇzdy zn´at pravdˇepodobnostn´ı rozdˇelen´ı v´ ybˇerov´e charakteristiky, kter´e se naz´ yv´a v´ ybˇ erov´ e rozdˇ elen´ı. V´ ybˇerov´a rozdˇelen´ı jsou teoretick´ ym z´akladem pro zpracov´an´ı v´ ysledk˚ u v´ ybˇerov´ ych ˇsetˇren´ı, jejich pozn´an´ı je rozhoduj´ıc´ım krokem, kter´ y teprve umoˇzn ˇuje aplikovat z´akonitosti poˇctu pravdˇepodobnosti na hodnocen´ı kvality u ´sudk˚ u op´ıraj´ıc´ıch se o n´ahodn´ y v´ ybˇer. 69
K APITOLA 5 Obsah
´ ´ V YB ´ Eˇ R N AHODN Y
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
V t´eto ˇc´asti uvedeme v´ ybˇerov´a rozdˇelen´ı statistik, na jejichˇz z´akladˇe budeme v kapitole 6 odhadovat nezn´am´e parametry rozdˇelen´ı pravdˇepodobnost´ı a v kapitole ?? testovat hypot´ezy o tˇechto parametrech.
5.3.1
Rozdˇ elen´ı v´ ybˇ erov´ eho pr˚ umˇ eru
Je-li (X1 , X2 , · · · , Xn ) n´ahodn´ y v´ ybˇer o rozsahu n, pak v´ ybˇ erov´ y pr˚ umˇ er (nebo tak´e v´ ybˇerov´ y 1. obecn´ y moment) je statistika definovan´a jako X=
n 1X Xi . n i=1
(5.1)
Obecnˇe, v´ ybˇ erov´ y k-t´ y obecn´ y moment je statistika n 1X Mk = Xik . n i=1 0
(5.2)
Necht’ (X1 , X2 , · · · , Xn ) je n´ahodn´ y v´ ybˇer o rozsahu n z rozdˇelen´ı se stˇredn´ı hodnotou µ 2 a rozptylem σ , pak pro stˇredn´ı hodnotu µx¯ a rozptyl σx2¯ v´ ybˇerov´eho pr˚ umˇeru X plat´ı n n 1X 1X Xi ) = E(Xi ) = µ n i=1 n i=1
(5.3)
n n 1 X 1 1X Xi ) = 2 D(Xi ) = σ 2 . n i=1 n i=1 n
(5.4)
µx¯ = E( σx2¯ = D(
Zn´ame-li rozdˇelen´ı, z nˇehoˇz n´ahodn´ y v´ ybˇer poch´az´ı, m˚ uˇzeme stanovit rozdˇelen´ı v´ ybˇerov´eho pr˚ umˇeru jako rozdˇelen´ı line´arn´ı funkce n´ahodn´ ych veliˇcin. Je-li napˇr. (X1 , X2 , · · · , Xn ) n´ahodn´ y v´ ybˇer z N (µ, σ 2 )-rozdˇelen´ı, pak X ∼ N (µ, σ 2 /n). Pokud n´ahodn´ y v´ ybˇer nepoch´az´ı z norm´aln´ıho rozdˇelen´ı, pak z centr´aln´ı limitn´ı vˇety (viz odst. ??) vypl´ yv´a, ˇze n´ahodn´a veliˇcina X m´a pˇribliˇznˇe norm´aln´ı rozdˇelen´ı za pˇredpokladu, ˇze rozsah v´ ybˇeru je relativnˇe velk´ y. Vˇseobecnˇe vzato, ˇc´ım v´ıce se rozdˇelen´ı, z nˇehoˇz v´ ybˇer poch´az´ı, liˇs´ı od norm´aln´ıho, t´ım vˇetˇs´ı rozsah v´ ybˇeru potˇrebujeme pro adekv´atn´ı aproximaci rozdˇelen´ı v´ ybˇerov´eho pr˚ umˇeru. Na z´akladˇe experiment´aln´ıch v´ ysledk˚ u se doporuˇcuje, aby rozsah v´ ybˇeru n byl alespoˇ n 30. Tud´ıˇz m´ame n´asleduj´ıc´ı poznatek. Tvrzen´ı 5.1
ˇ ´I V YB ´ EROV ˇ ´ ˚ ERU ˇ ROZD ELEN EHO PR UM
Pˇredpokl´adejme, ˇze m´ame n´ahodn´ y v´ ybˇer o rozsahu n ≥ 30 z rozdˇelen´ı se stˇredn´ı 2 hodnotou µ, a rozptylem σ . Pak bez ohledu na rozdˇelen´ı, z nˇehoˇz v´ ybˇer poch´az´ı, m´a n´ahodn´a veliˇcina X pˇribliˇznˇe norm´aln´ı rozdˇelen´ı se stˇredn´ı hodnotou µx¯ = µ a rozptylem σx2¯ = σ 2 /n. V kapitol´ach 6 a ?? budeme pouˇz´ıvat normovan´ y tvar n´ahodn´e veliˇciny X, to je veliˇcinu Z=
X − µx¯ X −µ √ , = σx¯ σ/ n
(5.5)
kter´a m´a v d˚ usledku centr´aln´ı limitn´ı vˇety rozdˇelen´ı specifikovan´e pˇri r˚ uzn´ ych podm´ınk´ach ve n´asleduj´ıc´ım tvrzen´ı. 70
´ Eˇ ROV YCH ´ 5.3 ROZD Eˇ LEN´I V YB CHARAKTERISTIK Obsah
Index
Tvrzen´ı 5.2
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
ˇ ´I NORMOVAN EHO ´ ´ EROV ˇ ´ ˚ Eˇ RU ROZD ELEN TVARU V YB EHO PR UM
Pˇredpokl´adejme, ˇze m´ame n´ahodn´ y v´ ybˇer o rozsahu n z rozdˇelen´ı se stˇredn´ı hodnotou µ a smˇerodatnou odchylkou σ 2 . Pak normovan´y tvar v´ybˇerov´eho pr˚ umˇeru X Z=
X −µ √ σ/ n
1. m´a bez ohledu na rozsah v´ ybˇeru normovan´e norm´aln´ı rozdˇelen´ı, pokud v´ ybˇer poch´az´ı z norm´aln´ıho rozdˇelen´ı; 2. m´a pro n ≥ 30 pˇribliˇznˇe normovan´e norm´aln´ı rozdˇelen´ı bez ohledu na rozdˇelen´ı, z nˇehoˇz v´ ybˇer poch´az´ı.
5.3.2
Rozdˇ elen´ı v´ ybˇ erov´ eho rozptylu
Je-li (X1 , X2 , · · · , Xn ) n´ahodn´ y v´ ybˇer o rozsahu n, pak v´ ybˇ erov´ y rozptyl je statistika definovan´a jako n 1 X S2 = (Xi − X)2 . (5.6) n − 1 i=1 Pozn´ amka : V´ ybˇ erov´ y k-t´ y centr´ aln´ı moment je statistika Mk =
n 1X (Xi − X)k . n i=1
(5.7)
Podobnˇe jako v pˇr´ıpadˇe v´ ybˇerov´eho pr˚ umˇeru, chceme-li z´ıskat informaci o rozptylu rozdˇelen´ı prostˇrednictv´ım v´ ybˇerov´eho rozptylu, mus´ıme zn´at jeho rozdˇelen´ı. Tvrzen´ı 5.3
ˇ ´I V YB ´ EROV ˇ ´ ROZD ELEN EHO ROZPTYLU
Pˇredpokl´adejme, ˇze m´ame n´ahodn´ y v´ ybˇer o rozsahu n z norm´aln´ıho rozdˇelen´ı s rozptylem σ 2 . Pak n´ahodn´a veliˇcina n−1 2 χ2 = S σ2 m´a χ2 -rozdˇelen´ı s n − 1 stupni volnosti. Nyn´ı pˇredpokl´adejme, ˇze m´ame n´ahodn´ y v´ ybˇer o rozsahu n z norm´aln´ıho rozdˇelen´ı se X−µ √ ∼ N (0, 1) stˇredn´ı hodnotou µ a s nezn´am´ ym rozptylem. Jelikoˇz n´ahodn´a veliˇcina Z = σ/ n 2
a veliˇ cina χ2 = n−1 S 2 ∼ χ2 (n − 1), pak z definice t-rozdˇelen´ı vypl´ yv´a ˇze n´ahodn´a veliˇcina σ q Z/ χ2/n − 1 m´a t-rozdˇelen´ı s n − 1 stupni volnosti. Vzhledem k tomu, ˇze plat´ı relace √ X −µ n−1 X −µ σ X −µ q √ ·q √ · = √ = = n−1 σ/ n σ/ n S S/ n S2 χ2 /n − 1 σ2 Z
dost´av´ame pro statistiku T =
X −µ √ , S/ n
kterou budeme naz´ yvat t-statistikou, n´asleduj´ıc´ı tvrzen´ı. 71
K APITOLA 5 Obsah
´ ´ V YB ´ Eˇ R N AHODN Y
Index
Tvrzen´ı 5.4
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
ˇ ´I t- STATISTIKY ROZD ELEN
Mˇejme n´ahodn´ y v´ ybˇer o rozsahu n z norm´aln´ıho rozdˇelen´ı se stˇredn´ı hodnotou µ. Pak m´a n´ahodn´a veliˇcina X −µ √ T = S/ n t-rozdˇelen´ı s n − 1 stupni volnosti.
5.3.3
Rozdˇ elen´ı v´ ybˇ erov´ eho pod´ılu
Uvaˇzujme n´ahodn´ y v´ ybˇer ze z´akladn´ıho souboru, v nˇemˇz sledovan´ y statistick´ y znak nebo sledovan´a n´ahodn´a veliˇcina nab´ yv´a pouze hodnot nula a jedna. V tomto pˇr´ıpadˇe mluv´ıme o v´ ybˇeru z alternativn´ıho rozdˇelen´ı. T´ımto rozdˇelen´ım kvantifikujeme napˇr´ıklad takov´e situace, kdy hodnotˇe statistick´eho znaku, kter´ y n´as zaj´ım´a, pˇriˇrad´ıme ˇc´ıselnou hodnotu 1 a vˇsem dalˇs´ım ˇc´ıselnou hodnotu 0 a zaj´ım´a n´as, jak´e procento statistick´ ych jednotek ze z´akladn´ıho souboru m´a urˇcitou sledovanou vlastnost. Jde o tzv. dvoukategori´ aln´ı z´akladn´ı soubor. Napˇr´ıklad, jestliˇze z´akladn´ı soubor o rozsahu N , kter´ y uvaˇzujeme, tvoˇr´ı vˇsechny dom´acnosti ˇ v CR, sledovan´a vlastnost je vlastnictv´ı osobn´ıho poˇc´ıtaˇce“, (1 – dom´acnost m´a osobn´ı ” poˇc´ıtaˇc, 0 – dom´acnost nem´a osobn´ı poˇc´ıtaˇc), poˇcet dom´acnost´ı vlastn´ıc´ıch osobn´ı poˇc´ıtaˇc je ˇ kter´e vlastn´ı osobn´ı Nv , pak pod´ıl z´ akladn´ıho souboru je pod´ıl vˇsech dom´acnost´ı v CR, poˇc´ıtaˇc, tj. Nv /N . Pˇredpokl´adejme, ˇze rozdˇelen´ı v z´akladn´ım souboru je alternativn´ı a ˇze p znaˇc´ı bud’ relativn´ı ˇcetnost hodnoty 1 (pod´ıl statistick´ ych jednotek s hodnotou sledovan´eho znaku 1) v koneˇcn´em z´akladn´ım souboru, nebo pravdˇepodobnost hodnoty 1, uvaˇzujeme-li nekoneˇcn´ y z´akladn´ı soubor. M˚ uˇze-li sledovan´ y znak nebo sledovan´a n´ahodn´a veliˇcina nab´ yvat pouze hodnot 0 a 1, pak tak´e v´ ybˇerov´ ymi hodnotami x1 , x2 , · · · , xn mohou b´ yt bud’ jedniˇcky nebo nuly. Protoˇze v´ ybˇer je n´ahodn´ y, je poˇcet jedniˇcek x ve v´ ybˇeru hodnotou n´ahodn´e veliˇciny X, kter´a se naz´ yv´a v´ ybˇ erovou absolutn´ı ˇ cetnost´ı. Pod´ıl pˆ = x/n, kde x znaˇc´ı poˇcet jednotek v´ ybˇeru maj´ıc´ıch specifikovanou vlastnost (naz´ yvan´ y ˇcasto poˇcet u ´spˇech˚ u“ a n − x poˇcet ” ” ne´ uspˇech˚ u“) a n je rozsah v´ ybˇeru, je pak hodnotou n´ahodn´e veliˇciny X Pˆ = , n kter´a se naz´ yv´a v´ ybˇ erovou relativn´ı ˇ cetnost´ı nebo ˇcastˇeji v´ ybˇ erov´ ym pod´ılem. Z toho, co bylo ˇreˇceno je zˇrejm´e, ˇze v´ ybˇerov´ y pod´ıl je roven v´ ybˇerov´emu pr˚ umˇeru n´ahodn´eho v´ ybˇeru z alternativn´ıho rozdˇelen´ı. Pozn´ amka: V dalˇs´ım textu budeme pouˇz´ıvat stejn´e oznaˇcen´ı pˆ pro n´ahodnou veliˇcinu Pˆ i jej´ı hodnotu pˆ . Podobnˇe jako v pˇr´ıpadˇe stˇredn´ı hodnoty, mus´ıme zn´at v´ ybˇ erov´ e rozdˇ elen´ı pod´ılu, (pravdˇepodobnostn´ı rozdˇelen´ı n´ahodn´e veliˇciny pˆ) , abychom mohli dˇelat z´avˇery o pod´ılu p. Z Moivreovy-Laplaceovy limitn´ı vˇety (viz odst. ??) vypl´ yv´a n´asleduj´ıc´ı tvrzen´ı. Tvrzen´ı 5.5
ˇ ´I V YB ´ EROV ˇ ´ ROZD ELEN EHO POD ´I LU
Pˇredpokl´adejme, ˇze m´ame n´ahodn´ y v´ ybˇer velk´eho rozsahu n z alternativn´ıho rozdˇelen´ı s pod´ılem p. Pak n´ahodn´a veliˇcina pˆ m´aqpˇribliˇznˇe norm´aln´ı rozdˇelen´ı se stˇredn´ı hodnotou µpˆ = p a smˇerodatnou odchylkou σpˆ = p(1 − p)/n.
72
´ ´ N AHODN ´ ´ V YB ´ Eˇ RY 5.4 N EZ AVISL E E Obsah
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Z tvrzen´ı 5.4 lze odvodit, ˇze normovan´a n´ahodn´a veliˇcina Z=q
pˆ − p p(1 − p)/n
(5.8)
m´a pro velk´a n pˇribliˇznˇe normovan´e norm´aln´ı rozdˇelen´ı. Pˇresnost norm´aln´ı aproximace z´avis´ı na n a p. Pro p bl´ızk´e 0.5 je aproximace dostateˇcnˇe ˇ ım se p v´ıce liˇs´ı od 0.5, t´ım vˇetˇs´ı n potˇrebujeme k tomu, aby pˇresn´a pro rozumn´e n. C´ aproximace byla pˇresn´a. B´ yv´a zvykem pouˇz´ıvat aproximaci norm´aln´ım rozdˇelen´ım, pokud np ≥ 5 a z´aroveˇ n n(1 − p) ≥ 5, neboli min(np, n(1 − p)) ≥ 5.
5.4
Nez´ avisl´ e n´ ahodn´ e v´ ybˇ ery
Nˇekter´e metody, kter´ ymi se budeme v kapitole ?? zab´ yvat, nevyˇzaduj´ı pouze, aby v´ ybˇery byly n´ahodn´e, ale tak´e aby byly nez´ avisl´e, zhruba ˇreˇceno, aby v´ ybˇer z jednoho rozdˇelen´ı nemˇel ˇz´adn´ y vliv na v´ ybˇer z jin´eho rozdˇelen´ı. Necht’ X1 = (X11 , X12 , · · · , X1n1 ) je n´ahodn´ y v´ ybˇer rozsahu n1 z rozdˇelen´ı s distribuˇcn´ı funkc´ı F1 (x) a X2 = (X21 , X22 , · · · , X2n2 ) je n´ahodn´ y v´ ybˇer rozsahu n2 z rozdˇelen´ı s distribuˇcn´ı funkc´ı F2 (x). N´ahodn´e v´ ybˇery X1 a X2 jsou nez´ avisl´ e, jestliˇze n´ahodn´e veliˇciny X11 , X12 , · · · , X1n1 , X21 , X22 , · · · , X2n2 jsou nez´avisl´e, pˇriˇcemˇz veliˇciny X11 , X12 , · · · , X1n maj´ı distribuˇcn´ı funkc´ı F1 (x) a X21 ,X22 ,· · · , X2n maj´ı distribuˇcn´ı funkc´ı F2 (x) (viz odst. ??). Jsou-li distribuˇcn´ı funkce F1 (x) a F2 (x) identick´e, jedn´a se o dva nez´avisl´e v´ ybˇery z t´ehoˇz rozdˇelen´ı.
5.4.1
Dva nez´ avisl´ e v´ ybˇ ery z norm´ aln´ıho rozdˇ elen´ı nebo velk´ e rozsahy v´ ybˇ er˚ u
Mˇejme n´ahodn´ y v´ ybˇer X1 = (X11 , X12 , · · · , X1n1 ) rozsahu n1 z rozdˇelen´ı N (µ1 , σ12 ) a n´ahodn´ y 2 ’ v´ ybˇer X2 = (X21 , X22 , · · · , X2n2 ) rozsahu n2 z rozdˇelen´ı N (µ2 , σ2 ). Necht v´ ybˇery X1 a X2 jsou nez´avisl´e. Potom statistiky X1 a X2 jsou nez´avisl´e (viz odstavec ??), X1 ∼ N (µ1 , σ12 /n1 ), X2 ∼ N (µ2 , σ22 /n2 ) a statistika X 1 −X 2 m´a rozdˇelen´ı N (µ1 −µ2 , σ12 /n1 +σ22 /n2 ) (viz odstavec 5.3.1). Bezprostˇredn´ım d˚ usledkem je n´asleduj´ıc´ı tvrzen´ı. Tvrzen´ı 5.6
ˇ ´I ROZD ´I LU V YB ´ EROV ˇ ´ ˚ ER ˇ U˚ ( NEZ AVISL ´ ´ V YB ´ Eˇ RY ) ROZD ELEN YCH PR UM E
Pˇredpokl´adejme, ˇze m´ame dva nez´avisl´e n´ahodn´e v´ ybˇery o rozsaz´ıch n1 a n2 z rozdˇelen´ı se stˇredn´ımi hodnotami µ1 a µ2 a smˇerodatn´ ymi odchylkami σ1 a σ2 . D´ale pˇredpokl´adejme, ˇze bud’ obˇe rozdˇelen´ı jsou norm´aln´ı nebo oba v´ ybˇery maj´ı velk´ y rozsah. Pak n´ahodn´a aln´ı rozdˇelen´ı se stˇredn´ı hodnotou µ(¯x1 −¯x2 ) = µ1 − µ2 veliˇcina X 1 − X 2 m´a (pˇribliˇznˇe) norm´ q a smˇerodatnou odchylkou σ(¯x1 −¯x2 ) = σ1 /n1 + σ2 /n2 . Tud´ıˇz normovan´a n´ahodn´a veliˇcina Z=
(X 1 − X 2 ) − (µ1 − µ2 ) q
(σ12 /n1 ) + (σ22 /n2 )
(5.9)
m´a alespoˇ n pˇribliˇznˇe normovan´e norm´aln´ı rozdˇelen´ı. Toto tvrzen´ı tvoˇr´ı teoretick´ y z´aklad pro odvozen´ı statistick´ ych indukˇcn´ıch metod pro porovn´an´ı stˇredn´ıch hodnot dvou z´akladn´ıch soubor˚ u. 73
K APITOLA 5 Obsah
´ ´ V YB ´ Eˇ R N AHODN Y
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Dva nez´ avisl´ e v´ ybˇ ery z rozdˇ elen´ı se shodn´ ymi rozptyly Nyn´ı pˇredpokl´adejme, ˇze σ12 = σ22 = σ 2 a rozptyl σ 2 nen´ı zn´am, coˇz je obvykl´e v praktick´ ych 2 2 2 pˇr´ıpadech. Dosazen´ım hodnoty σ za σ1 a σ2 do definice n´ahodn´e veliˇciny Z ve vztahu (5.9) dostaneme n´ahodnou veliˇcinu Z=
(X 1 − X 2 ) − (µ1 − µ2 ) q
.
(5.10)
σ (1/n1 ) + (1/n2 ) V´ ybˇerov´e rozptyly S12 a S22 pouˇzijeme k sestrojen´ı tzv. sdruˇ zen´ eho v´ ybˇ erov´ eho rozptylu SP2 SP2 =
(n1 − 1)S12 + (n2 − 1)S22 . n1 + n2 − 2
(5.11)
Sdruˇzen´ y v´ ybˇerov´ y rozptyl m˚ uˇzeme ch´apat jako v´aˇzen´ y rozptyl, ve kter´em jednotliv´e v´ ybˇerov´e 2 2 rozptyly S1 a S2 jsou v´aˇzeny odpov´ıdaj´ıc´ımi stupni volnosti. (Index P“ poch´az´ı z anglick´eho ” term´ınu pooled sample variance“, kter´ y znamen´a sdruˇzen´ y v´ ybˇerov´ y rozptyl). Nahrazen´ım ” nezn´am´eho rozptylu σ 2 v rovnici (5.10) sdruˇzen´ ym v´ ybˇerov´ ym rozptylem SP2 , dostaneme n´ahodnou veliˇcinu (X 1 − X 2 ) − (µ1 − µ2 ) q , (5.12) SP (1/n1 ) + (1/n2 ) kter´a na rozd´ıl od n´ahodn´e veliˇciny definovan´e v (5.10), nem´a normovan´e norm´aln´ı rozdˇelen´ı, ale t-rozdˇelen´ı. N´ahodnou veliˇcinu definovanou v (5.12) budeme naz´ yvat sdruˇ zen´ a t-statistika. Jej´ı rozdˇelen´ı specifikuje n´asleduj´ıc´ı tvrzen´ı. Tvrzen´ı 5.7
ˇ ´I SDRU Zˇ EN E´ t- STATISTIKY ROZD ELEN
Pˇredpokl´adejme, ˇze m´ame dva nez´avisl´e n´ahodn´e v´ ybˇery o rozsaz´ıch n1 a n2 z rozdˇelen´ı se stˇredn´ımi hodnotami µ1 a µ2 . D´ale pˇredpokl´adejme, ˇze smˇerodatn´e odchylky obou rozdˇelen´ı jsou shodn´e. Pak n´ahodn´a veliˇcina T =
X 1 − X 2 − (µ1 − µ2 ) q
,
SP 1/n1 + 1/n2 kde SP je definov´ano v (5.11), m´a t-rozdˇelen´ı s n1 + n2 − 2 stupni volnosti. Dva nez´ avisl´ e v´ ybˇ ery z rozdˇ elen´ı s r˚ uzn´ ymi rozptyly Podobnˇe jako v pˇr´ıpadˇe diskutovan´em v´ yˇse budeme pˇredpokl´adat, ˇze standardn´ı odchylky v obou v´ ybˇerech jsou nezn´am´e. Nahrad´ıme σ1 a σ2 v´ ybˇerov´ ymi smˇerodatn´ ymi odchylkami S1 a S2 a dostaneme n´ahodnou veliˇcinu, (X 1 − X 2 ) − (µ1 − µ2 ) q
(S12 /n1 ) + (S22 /n2 )
,
(5.13)
kter´a jiˇz nem´a normovan´e norm´aln´ı rozdˇelen´ı, ale m´a pˇribliˇznˇe t-rozdˇelen´ı. Tuto statistiku budeme naz´ yvat nesdruˇ zen´ a t-statistika . 74
´ ´ N AHODN ´ ´ V YB ´ Eˇ RY 5.5 P AROV E E Obsah
Index
Tvrzen´ı 5.8
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
ˇ ´I NESDRU ZEN ˇ E´ t- STATISTIKY ROZD ELEN
Pˇredpokl´adejme, ˇze m´ame dva nez´avisl´e v´ ybˇery o rozsahu n1 a n2 z norm´aln´ıch rozdˇelen´ı se stˇredn´ımi hodnotami µ1 a µ2 . Pak m´a n´ahodn´a veliˇcina (X 1 − X 2 ) − (µ1 − µ2 ) T = q (S12 /n1 ) + (S22 /n2 ) pˇribliˇznˇe t-rozdˇelen´ı s poˇctem stupˇ n˚ u volnosti δ, kde δ=
[(s21 /n1 ) + (s22 /n2 )]2 (s21 /n1 )2 n1 −1
+
(s22 /n2 )2 n2 −1
,
zaokrouhleno dol˚ u na nejbliˇzˇs´ı cel´e ˇc´ıslo.
5.4.2
Dva nez´ avisl´ e v´ ybˇ ery z alternativn´ıho rozdˇ elen´ı
M´ame-li dva nez´avisl´e n´ahodn´e v´ ybˇery o rozsahu n1 a n2 z alternativn´ıch rozdˇelen´ı s parametry (pod´ıly) p1 a p2 , pak je v´ ybˇerov´ y pod´ıl pˆi , i = 1, 2 roven v´ ybˇerov´emu pr˚ umˇeru Xi . Z tvrzen´ı 5.5 a 5.6 plyne n´asleduj´ıc´ı tvrzen´ı 5.9, kter´e tvoˇr´ı teoretick´ y z´aklad nutn´ y pro odvozen´ı statistick´ ych indukˇcn´ıch metod pro porovn´an´ı dvou dvoukategori´aln´ıch z´akladn´ıch soubor˚ u. Tvrzen´ı 5.9
ˇ ´I ROZD ´I LU DVOU V YB ´ Eˇ ROV YCH ´ ˚ ( NEZ AVISL ´ ´ V YB ´ Eˇ RY ) ROZD ELEN POD ´I L U E
Pˇredpokl´adejme, ˇze m´ame dva nez´avisl´e n´ahodn´e v´ ybˇery o rozsaz´ıch n1 a n2 z alternativn´ıch rozdˇelen´ı s pod´ıly p1 a p2 . Pak pro velk´e v´ ybˇery m´a n´ahodn´a veliˇcina pˆ1 − pˆ2 pˇribliˇznˇe norm´aln´ı q rozdˇelen´ı se stˇredn´ı hodnotou µ(ˆp1 −ˆp2 ) = p1 − p2 a smˇerodatnou odchylkou σ(ˆp1 −ˆp2 ) = p1 (1 − p1 )/n1 + p2 (1 − p2 )/n2 , kde pˆi = xi /ni je v´ ybˇerov´ y pod´ıl i-t´e populace, xi je poˇcet u ´spˇech˚ u v i-t´e populaci, i = 1, 2. Tud´ıˇz normovan´a n´ahodn´a veliˇcina (ˆ p1 − pˆ2 ) − (p1 − p2 )
Z=q
p1 (1 − p1 )/n1 + p2 (1 − p2 )/n2
m´a pˇribliˇznˇe normovan´e norm´aln´ı rozdˇelen´ı.
5.5
P´ arov´ e n´ ahodn´ e v´ ybˇ ery
Necht’ X1 = (X11 , X12 , · · · , X1n ) je n´ahodn´ y v´ ybˇer rozsahu n z rozdˇelen´ı se stˇredn´ı hodno2 y v´ ybˇer stejn´eho rozsahu n tou µ1 a rozptylem σ1 , a X2 = (X21 , X22 , · · · , X2n ) je n´ahodn´ 2 z rozdˇelen´ı se stˇredn´ı hodnotou µ2 a rozptylem σ2 . Z tˇechto dvou v´ ybˇer˚ u utvoˇr´ıme v´ ybˇer n dvojic (X11 , X21 ), (X12 , X22 ), ..., (X1n , X2n ). Kaˇzd´e dvojici veliˇcin (X1j , X2j ), j = 1, 2, · · · , n pˇriˇrad´ıme n´ahodnou veliˇcinu Dj = X1j − X2j , j = 1, 2, · · · , n, tzv. p´ arovou diferenci, kterou z´ısk´ame odeˇcten´ım pˇr´ısluˇsn´e p´arov´e hodnoty v druh´em v´ ybˇeru od p´arov´e hodnoty v prvn´ım v´ ybˇeru. Na posloupnost p´arov´ ych diferenc´ı D1 , D2 , · · · , Dn n´ahodnˇe vybran´ ych n dvojic se m˚ uˇzeme d´ıvat jako na n´ahodn´ y v´ ybˇer z rozdˇelen´ı vˇsech moˇzn´ ych p´arov´ ych diferenc´ı. Oznaˇcme stˇredn´ı hodnotu takov´eho rozdˇelen´ı p´arov´ ych diferenc´ı µd . 75
K APITOLA 5 Obsah
´ ´ V YB ´ Eˇ R N AHODN Y
Index
Tabulky:
N
t
chi
Back
Forward
Next
Goto
Previous
Pak lze uk´azat, ˇze µd = µ1 − µ2 .
(5.14)
O vztahu rozptylu σd2 rozdˇelen´ı p´arov´ ych diferenc´ı k rozptyl˚ um σ12 a σ22 nem˚ uˇzeme vzhledem k moˇzn´e z´avislosti veliˇcin nic pˇredpokl´adat. Oznaˇcme D v´ ybˇerov´ y pr˚ umˇer p´arov´ ych diferenc´ı, tud´ıˇz D = X 1 −X 2 , kde X i je v´ ybˇerov´ y pr˚ umˇer n´ahodn´eho v´ ybˇeru z i-t´eho rozdˇelen´ı, i = 1, 2. D´ale oznaˇcme Sd v´ ybˇerovou smˇerodatnou odchylku p´arov´ ych diferenc´ı pro kterou plat´ı Sd =
v u u t
n 1 X (Dj − D)2 . n − 1 j=1
(5.15)
Je-li rozdˇelen´ı p´arov´ ych diferenc´ı norm´aln´ı, pak m˚ uˇzeme aplikovat tvrzen´ı 5.3, pouˇz´ıt rovnost (5.14) a dostaneme n´asleduj´ıc´ı v´ ysledek. Tvrzen´ı 5.10
´ ´ t- STATISTIKY ROZD Eˇ LEN ´I P AROV E
Pˇredpokl´adejme, ˇze m´ame n´ahodn´ y v´ ybˇer n dvojic z rozdˇelen´ı se stˇredn´ımi hodnotami µ1 a µ2 . D´ale pˇredpokl´adejme, ˇze rozdˇelen´ı vˇsech p´arov´ ych dvojic je norm´aln´ı. Pak n´ahodn´a veliˇcina D − (µ1 − µ2 ) √ T = Sd / n m´a t-rozdˇelen´ı s n − 1 stupni volnosti.
76
Tabulka I: Distribuˇcn´ı funkce normovan´eho norm´ aln´ıho rozdˇelen´ı N (0, 1)
z
0
Pro z < 0.0 pouˇzijte vztah Φ(z) = 1 − Φ(−z). z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9
0.000 0.500 0.540 0.579 0.618 0.655 0.691 0.726 0.758 0.788 0.816 0.841 0.864 0.885 0.903 0.919 0.933 0.945 0.955 0.964 0.971 0.977 0.982 0.986 0.989 0.992 0.994 0.995 0.997 0.997 0.998
0.010 0.504 0.544 0.583 0.622 0.659 0.695 0.729 0.761 0.791 0.819 0.844 0.867 0.887 0.905 0.921 0.934 0.946 0.956 0.965 0.972 0.978 0.983 0.986 0.990 0.992 0.994 0.995 0.997 0.998 0.998
0.020 0.508 0.548 0.587 0.626 0.663 0.698 0.732 0.764 0.794 0.821 0.846 0.869 0.889 0.907 0.922 0.936 0.947 0.957 0.966 0.973 0.978 0.983 0.987 0.990 0.992 0.994 0.996 0.997 0.998 0.998
0.030 0.512 0.552 0.591 0.629 0.666 0.702 0.736 0.767 0.797 0.824 0.848 0.871 0.891 0.908 0.924 0.937 0.948 0.958 0.966 0.973 0.979 0.983 0.987 0.990 0.992 0.994 0.996 0.997 0.998 0.998
0.040 0.516 0.556 0.595 0.633 0.670 0.705 0.739 0.770 0.800 0.826 0.851 0.873 0.893 0.910 0.925 0.938 0.949 0.959 0.967 0.974 0.979 0.984 0.987 0.990 0.993 0.994 0.996 0.997 0.998 0.998
0.050 0.520 0.560 0.599 0.637 0.674 0.709 0.742 0.773 0.802 0.829 0.853 0.875 0.894 0.911 0.926 0.939 0.951 0.960 0.968 0.974 0.980 0.984 0.988 0.991 0.993 0.995 0.996 0.997 0.998 0.998
0.060 0.524 0.564 0.603 0.641 0.677 0.712 0.745 0.776 0.805 0.831 0.855 0.877 0.896 0.913 0.928 0.941 0.952 0.961 0.969 0.975 0.980 0.985 0.988 0.991 0.993 0.995 0.996 0.997 0.998 0.998
0.070 0.528 0.567 0.606 0.644 0.681 0.716 0.749 0.779 0.808 0.834 0.858 0.879 0.898 0.915 0.929 0.942 0.953 0.962 0.969 0.976 0.981 0.985 0.988 0.991 0.993 0.995 0.996 0.997 0.998 0.999
0.080 0.532 0.571 0.610 0.648 0.684 0.719 0.752 0.782 0.811 0.836 0.860 0.881 0.900 0.916 0.931 0.943 0.954 0.962 0.970 0.976 0.981 0.985 0.989 0.991 0.993 0.995 0.996 0.997 0.998 0.999
Tabulka II: Kritick´e hodnoty normovan´eho norm´ aln´ıho rozdˇelen´ı N (0, 1) α zα
0.2 0.842
0.1 1.282
0.05 1.645
0.025 1.960
0.01 2.326
0.005 2.576
77
0.0025 2.807
0.001 3.090
0.090 0.536 0.575 0.614 0.652 0.688 0.722 0.755 0.785 0.813 0.839 0.862 0.883 0.901 0.918 0.932 0.944 0.954 0.963 0.971 0.977 0.982 0.986 0.989 0.992 0.994 0.995 0.996 0.997 0.998 0.999
z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9
Tabulka III: Kritick´e hodnoty t-rozdˇelen´ı α
0
ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100
t0.2 1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 0.873 0.870 0.868 0.866 0.865 0.863 0.862 0.861 0.860 0.859 0.858 0.858 0.857 0.856 0.856 0.855 0.855 0.854 0.854 0.851 0.849 0.848 0.847 0.846 0.846 0.845
t0.1 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.303 1.299 1.296 1.294 1.292 1.291 1.290
t0.05 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.684 1.676 1.671 1.667 1.664 1.662 1.660
t0.025 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.021 2.009 2.000 1.994 1.990 1.987 1.984
t0.01 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.403 2.390 2.381 2.374 2.368 2.364
78
tα
t0.005 63.656 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.704 2.678 2.660 2.648 2.639 2.632 2.626
t0.0025 127.321 14.089 7.453 5.598 4.773 4.317 4.029 3.833 3.690 3.581 3.497 3.428 3.372 3.326 3.286 3.252 3.222 3.197 3.174 3.153 3.135 3.119 3.104 3.091 3.078 3.067 3.057 3.047 3.038 3.030 2.971 2.937 2.915 2.899 2.887 2.878 2.871
t0.001 318.289 22.328 10.214 7.173 5.894 5.208 4.785 4.501 4.297 4.144 4.025 3.930 3.852 3.787 3.733 3.686 3.646 3.610 3.579 3.552 3.527 3.505 3.485 3.467 3.450 3.435 3.421 3.408 3.396 3.385 3.307 3.261 3.232 3.211 3.195 3.183 3.174
ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100
Tabulka IV: Kritick´e hodnoty χ2 -rozdˇelen´ı
α 0
ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100
χ20.995 0.000 0.010 0.072 0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886 10.520 11.160 11.808 12.461 13.121 13.787 20.707 27.991 35.534 43.275 51.172 59.196 67.328
χ2α
χ20.99 0.000 0.020 0.115 0.297 0.554 0.872 1.239 1.647 2.088 2.558 3.053 3.571 4.107 4.660 5.229 5.812 6.408 7.015 7.633 8.260 8.897 9.542 10.196 10.856 11.524 12.198 12.878 13.565 14.256 14.953 22.164 29.707 37.485 45.442 53.540 61.754 70.065
χ20.975 0.001 0.051 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791 24.433 32.357 40.482 48.758 57.153 65.647 74.222
79
χ20.95 0.004 0.103 0.352 0.711 1.145 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.892 6.571 7.261 7.962 8.672 9.390 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493 26.509 34.764 43.188 51.739 60.391 69.126 77.929
χ20.9 0.016 0.211 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865 5.578 6.304 7.041 7.790 8.547 9.312 10.085 10.865 11.651 12.443 13.240 14.041 14.848 15.659 16.473 17.292 18.114 18.939 19.768 20.599 29.051 37.689 46.459 55.329 64.278 73.291 82.358
ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100
Tabulka IV: Kritick´e hodnoty χ2 -rozdˇelen´ı (pokraˇcov´ an´ı)
ν χ20.1 1 2.706 2 4.605 3 6.251 4 7.779 5 9.236 6 10.645 7 12.017 8 13.362 9 14.684 10 15.987 11 17.275 12 18.549 13 19.812 14 21.064 15 22.307 16 23.542 17 24.769 18 25.989 19 27.204 20 28.412 21 29.615 22 30.813 23 32.007 24 33.196 25 34.382 26 35.563 27 36.741 28 37.916 29 39.087 30 40.256 40 51.805 60 74.397 50 63.167 70 85.527 80 96.578 90 107.565 100 118.498
χ20.05 3.841 5.991 7.815 9.488 11.070 12.592 14.067 15.507 16.919 18.307 19.675 21.026 22.362 23.685 24.996 26.296 27.587 28.869 30.144 31.410 32.671 33.924 35.172 36.415 37.652 38.885 40.113 41.337 42.557 43.773 55.758 79.082 67.505 90.531 101.879 113.145 124.342
χ20.025 5.024 7.378 9.348 11.143 12.832 14.449 16.013 17.535 19.023 20.483 21.920 23.337 24.736 26.119 27.488 28.845 30.191 31.526 32.852 34.170 35.479 36.781 38.076 39.364 40.646 41.923 43.195 44.461 45.722 46.979 59.342 83.298 71.420 95.023 106.629 118.136 129.561
80
χ20.01 6.635 9.210 11.345 13.277 15.086 16.812 18.475 20.090 21.666 23.209 24.725 26.217 27.688 29.141 30.578 32.000 33.409 34.805 36.191 37.566 38.932 40.289 41.638 42.980 44.314 45.642 46.963 48.278 49.588 50.892 63.691 88.379 76.154 100.425 112.329 124.116 135.807
χ20.005 7.879 10.597 12.838 14.860 16.750 18.548 20.278 21.955 23.589 25.188 26.757 28.300 29.819 31.319 32.801 34.267 35.718 37.156 38.582 39.997 41.401 42.796 44.181 45.558 46.928 48.290 49.645 50.994 52.335 53.672 66.766 91.952 79.490 104.215 116.321 128.299 140.170
ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 50 70 80 90 100
Literatura [1] M. Aldrin (1995). A statistical approach to the modelling of daily car traffic. Traffic Engineering and Control, Vol. 36, Nb. 3, pp. 489–493. [2] J.Andˇel (1985). Matematick´a statistika. SNTL, Alfa. [3] V. Beneˇs, G. Dohnal (1993). Pravdˇepodobnost a matematick´a statistika. Vydavatelstv´ı ˇ CVUT. [4] P. Br´emaud (1994). An Introduction to Probabilistic Modeling. Springer Verlag, New York. [5] J.H´atle, J. Likeˇs (1972). Z´aklady poˇctu pravdˇepodobnosti a matematick´e statistiky. SNTL/Alfa, Praha [6] A.R´enyi (1972). Teorie pravdˇepodobnosti. Academia, Praha. [7] J. Seger, R. Hindls (1995). Statistick´e metody v trˇzn´ım hospod´aˇrstv´ı. Victoria Publishing, Praha. ˇ ep´an (1987). Teorie pravdˇepodobnosti. Matematick´e z´aklady. Akademia, Praha. [8] J.Stˇ [9] N.A. Weiss (1996). Elementary Statistics, Addison-Wesley Publishing Company. [10] T.H. Wonnacott, R.J. Wonnacott (1995). Statistika pro obchod a hospod´aˇrstv´ı. (pˇreklad z americk´eho origin´alu Introductory Statistics for Business and Economics), J. Wiley & Sons, New York.
81