Matematická statistika Přednáška pro PřF
Michal Kulich léto 2011∗
Katedra pravděpodobnosti a matematické statistiky Matematicko-fysikální fakulta University Karlovy
∗
Naposledy upraveno dne 14. května 2011.
Obsah 1
Úvod 1.1
2
Základy teorie pravděpodobnosti 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12
3
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
7 7 8 11 12 14 18 25 28 37 49 62
68
Úvod . . . . . . . . . . . . . . . . . . . . Odhady charakteristik rozdělení . . . . . Grafické metody průzkumové statistiky Testování hypotéz . . . . . . . . . . . . Jednovýběrový t-test . . . . . . . . . . . Stanovení kritického oboru testu . . . . Párový t-test . . . . . . . . . . . . . . . Dvouvýběrový t-test . . . . . . . . . . . Interval spolehlivosti . . . . . . . . . . . Závěrečné poznámky . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Dodatky 4.1 4.2 4.3 4.4
4
6
Intuice . . . . . . . . . . . . . . . . . . Náhodné jevy . . . . . . . . . . . . . . Pravděpodobnost . . . . . . . . . . . . Podmíněná pravděpodobnost . . . . . Nezávislé jevy . . . . . . . . . . . . . . Náhodná veličina a její rozdělení . . . Distribuční funkce a hustoty . . . . . . Příklady diskrétních rozdělení . . . . . Příklady spojitých rozdělení . . . . . . Charakteristiky náhodných veličin . . Náhodné vektory, nezávislost, korelace Náhodný výběr . . . . . . . . . . . . .
Statistika 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10
4
3
Co budeme dělat? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69 70 83 85 90 93 97 100 106 114
117
Geometrická definice pravděpodobnosti Kombinatorika . . . . . . . . . . . . . . Dodatky k podmíněné pravděpodobnosti Dodatky k náhodným veličinám . . . . .
2
118 119 123 125
Část 1
Úvod
3
1.1 Co budeme dělat? Co je statistika? • Statistika nuda je . . . • Statistika je přesný součet nepřesných čísel . . . • Lež, nestoudná lež, statistika . . . Tak co je opravdu statistika? Statistika je věda o získávání a zpracování informace obsažené v empirických pozorováních skutečného světa Kde se používá statistika? Zkoumáme složitý systém, • jehož funkci nelze jednoduše pochopit nebo popsat • jenž se za stejných nebo podobných podmínek může projevovat odlišným způsobem • (lidská společnost, ekonomika státu, tělo lidské, ekosystém, sportovní soutěž, vědecký experiment, . . . ) Statistický přístup k řešení problémů • Získáme pozorování (data); vyjádříme je jako matematické objekty (čísla, vektory, funkce, . . . ) • Pozorování považujeme za náhodná • Stanovíme pravděpodobnostní model pro tato pozorování • V rámci modelu přesně zformulujeme problém, který chceme řešit • Data a model použijeme k vyřešení daného problému Druhy statistických úloh Odhady parametrů Výpočet číselných charakteristik sledovaného systému Testování hypotéz Ověřování pravdivostní hodnoty výroků o chování systému Predikce Předpovědi chování systému ve specifických podmínkách Optimalizace Hledání optimálních rozhodnutí pro řízení systému Oblasti aplikace statistiky • Přírodní vědy: medicína, biologie, genetika, farmakologie, chemie, . . . • Technické vědy: telekomunikace, doprava, počítače, strojírenství, kontrola jakosti, řízení a organizace výroby, . . . • Ekonomie: makro & mikroekonomie, bankovnictví, pojišťovnictví, . . . • Společenské vědy: sociologie, behaviorální vědy, archeologie, lingvistika, . . .
4
Cíl přednášky: Porozumět základním principům statistických metod, pochopit řešení vybraných jednoduchých problémů.
5
Část 2
Základy teorie pravděpodobnosti
6
2.1 Intuice Statistické metody jsou založeny na teorii pravděpodobnosti. Teorie pravděpodobnosti Pravděpodobnost: matematický model náhody Filosofické otázky: • Co to je náhoda? Nedostatek informace • Existuje náhoda? Ano (kvantová fysika) Pravděpodobnost zkoumá náhodné jevy, tj. jevy, které mohou, ale nemusí nastat. Intuitivní povědomí o pravděpodobnosti Každý člověk má zkušenosti s náhodnými jevy. • Jevům, které nastávají velmi často (i když ne vždy) říkáme jevy pravděpodobné. „Zítra ráno mi ujede tramvaj.ÿ • Jevům, které nastávají velmi zřídka (i když nejsou nemožné) říkáme jevy nepravděpodobné. „Zítra vyhraji první cenu ve Sportce.ÿ
2.2 Náhodné jevy Elementární jevy Uvažujme všechny možné výsledky/stavy nějakého experimentu (aktivního či pasívního). Označme množinu těchto výsledků Ω. Jejím prvkům říkáme elementární jevy. Definice 2.1. Elementární jevy jsou nejjemnější stavy, které potřebujeme rozlišovat. Prostor elementárních jevů Ω jest množina všech možných elementárních jevů. Poznámka. Elementární jevy pro daný problém volíme my. Elementární jevy Příklad (Hod mincí). Ω = {panna, orel } Příklad (Hod kostkou). Ω = {1, 2, 3, 4, 5, 6} Příklad (Pohlaví 2 sourozenců). Ω = {KK, DK, KD, DD} Náhodné jevy Definice 2.2. Náhodným jevem rozumíme libovolnou podmnožinu A množiny Ω. Nemožným jevem rozumíme prázdnou podmnožinu ∅ množiny Ω. Jistým jevem rozumíme celou množinu Ω. Poznámka. Náhodné jevy jsou složeny z elementárních jevů (s výjimkou jevu nemožného).
7
Operace s náhodnými jevy Uvažujme náhodné jevy A, B ∈ Ω. Doplněk Ac jevu A je jev, který nastane právě když A nenastane. Průnik A ∩ B je náhodný jev, který nastane právě když zároveň nastanou A i B. Je-li A ∩ B = ∅, jevy A a B nazýváme disjunktní (neslučitelné). Sjednocení A ∪ B je jev, který nastane právě když nastane alespoň jeden z jevů A a B. Podobně chápeme průnik a sjednocení více jevů A1 , . . . , Ak :
k \
i=1
(všechny musí nastat);
k [
i=1
Ai = A1 ∩ A2 ∩ · · · ∩ Ak
Ai = A1 ∪ A2 ∪ · · · ∪ Ak (alespoň jeden musí nastat).
Operace s náhodnými jevy Příklad (Pohlaví 2 sourozenců). Elementární jevy Ω = {KK, DK, KD, DD} (pořadí dětí dle věku). Jev A = {KK, DK, KD} (rodina má alespoň jednoho kluka). Jev B = {KD, DD} (mladší dítě je dívka). Doplněk jevu A je Ac = {DD} (rodina má dvě dívky). Průnik A ∩ B = {KD} (starší je kluk, mladší je dívka). Sjednocení A ∪ B = Ω (rodina má dvě děti).
2.3 Pravděpodobnost Základní vlastnosti pravděpodobnosti Pravděpodobnost P přiřazuje náhodnému jevu reálné číslo mezi 0 a 1. Matematicky vzato je to funkce P : exp(Ω) → h0, 1i (exp(Ω) je množina všech podmnožin množiny Ω). Aby měla pravděpodobnost očekávaný význam, musí mít následující vlastnosti: 1. P (Ω) = 1 (jistý jev má pravděpodobnost 1); 2. P (∅) = 0 (nemožný jev má pravděpodobnost 0); 3. Je-li A∩B = ∅, pak P (A∪B) = P (A)+P (B) (pravděpodobnost, že nastane aspoň jeden ze dvou neslučitelných jevů je rovna součtu jejich pravděpodobností). Vlastnosti pravděpodobnosti 2 Ze tří základních vlastností lze odvodit řadu dalších: 1. Jsou-li A1 , . . . , Ak neslučitelné jevy (Ai ∩ Aj = ∅ pro každé i 6= j), pak ! k k [ X Ai = P (Ai ) P i=1
i=1
(čili P (A1 ∪ · · · ∪ Ak ) = P (A1 ) + · · · + P (Ak ) čili pravděpodobnost, že nastane aspoň jeden z k neslučitelných jevů je rovna součtu jejich pravděpodobností);
2. P (Ac ) = 1 − P (A);
3. Je-li B ⊆ A (B je podjev jevu A), pak P (B) ≤ P (A) a P (A − B) = P (A) − P (B) (pravděpodobnost, že nastane jev A, ale nikoli jev B, je rovna rozdílu pravděpodobností obou jevů).
8
Vlastnosti pravděpodobnosti 3 Princip inkluze a exkluze 1. Pro jakékoli jevy A, B platí P (A ∪ B) = P (A) + P (B) − P (A ∩ B); 2. Pro jakékoli jevy A, B, C platí
P (A ∪ B ∪ C) = P (A) + P (B) + P (C)
− P (A ∩ B) − P (A ∩ C) − P (B ∩ C)
+ P (A ∩ B ∩ C); 3. Stejný princip lze rozšířit na k jevů. Klasická definice pravděpodobnosti
Klasická definice pravděpodobnosti předpokládá, že Ω je konečná a všechny elementární jevy ω ∈ Ω jsou stejně pravděpodobné. Pravděpodobnost jevu A ⊆ Ω je pak definována jako P (A) =
|A| , |Ω|
kde |A| značí počet prvků množiny A ⊆ Ω.
Klasická pravděpodobnost má evidentně všechny požadované vlastnosti. Příklad - skořápky Dám na stůl 3 skořápky, pod jednou z nich je žeton. Uhodnete-li, kde je žeton, vyhráváte, jinak prohráváte. Postup: Ukážete na jednu ze skořápek, já odkryji jednu ze dvou zbývajících skořápek. Vy můžete buď trvat na odkrytí původně vybrané skořápky, nebo své rozhodnutí změnit. Co je nejlepší strategie? Skořápky 2 Očíslujeme položené skořápky zleva doprava čísly 1, 2, 3. Elementární jevy: ω = (z, u), kde z je číslo skořápky, pod níž se nachází žeton a u je číslo skořápky, kterou jste původně vybrali. Tyto jevy považujeme za stejně pravděpodobné. Prostor elementárních jevů Ω = {(1, 1), (1, 2), . . . , (3, 3)}, |Ω| = 9.
Rozbor: Skořápka, kterou po vašem prvním výběru odhalím, jistě neobsahuje žeton. Tj. v situaci ω = (1, 1) odhalím skořápku 2 nebo 3, v situaci ω = (1, 2) odhalím skořápku 3. Skořápky – řešení Jev A: vyhrajete po změně rozhodnutí. Toto nastane právě když původně ukázaná skořápka neobsahuje žeton. A = {ω = (z, u) : z 6= u} = {(1, 2), (1, 3), (2, 1), . . .},
9
|A| = 6.
P (A) = 6/9 = 2/3 Jev B: vyhrajete po trvání na svém. Toto nastane právě když původně ukázaná skořápka obsahuje žeton. B = {ω = (z, u) : z = u} = {(1, 1), (2, 2), (3, 3)},
|B| = 3.
P (B) = 3/9 = 1/3 Závěr: Je daleko lepší změnit původní rozhodnutí. Nevýhody klasické pravděpodobnosti Klasická pravděpodobnost má dva velmi omezující předpoklady: 1. konečný počet elementárních jevů 2. elementární jevy musí být stejně pravděpodobné Obou těchto předpokladů se potřebujeme zbavit.
Zde končí přednáška 1, 1. 3.
Axiomatická definice pravděpodobnosti Obecná (axiomatická) definice pravděpodobnosti: • Je dána libovolná množina elementárních jevů Ω • Je dána funkce P : exp(Ω) → h0, 1i, která splňuje
1. P (Ω) = 1 (jistý jev má pravděpodobnost 1); S 2. P Pro všechny A1 , A2 , . . . ⊂ Ω takové, že Ai ∩Aj = ∅ ∀i 6= j, platí P ( ∞ i=1 Ai ) = ∞ i=1 P (Ai ).
Definice 2.3. Libovolná funkce P , která má tyto vlastnosti, se nazývá pravděpodobnost. Poznámky k axiomatické definici Axiomatická definice pravděpodobnosti: • připouští konečné, spočetné i nespočetné množiny elementárních jevů • připouští elementární jevy, které nejsou stejně pravděpodobné
• vyžaduje, aby P (Ω) = 1 a aby se pravděpodobnosti sčítaly přes sjednocení spočetně mnoha navzájem se vylučujících jevů (nikoli pouze konečně mnoha) • pro danou Ω lze zavést mnoho různých pravděpodobností – mezi nimi si musíme nějakou sami zvolit Poznámky k axiomatické definici Poznámka pro šťouraly: Ve skutečnosti se pravděpodobnost zavádí jen pro tzv. měřitelné množiny, ne nutně pro všechny podmnožiny Ω (neměřitelnou množinu nepovažujeme za náhodný jev); při nespočetné Ω (třeba Ω = R) nelze totiž rozumně zavést pravděpodobnost, která funguje pro všechny podmnožiny Ω.
10
2.4 Podmíněná pravděpodobnost Ve zbytku přednášky budeme pracovat s obecnou axiomatickou definicí pravděpodobnosti, ale klasickou pravděpodobnost budeme někdy používat v příkladech. Kapitolu o podmíněné pravděpodobnosti začneme ilustrativním příkladem. Příklad – kostka Příklad. Třikrát jsme hodili kostkou a padla tři různá čísla. Jaká je pravděpodobnost, že byla všechna lichá? Zvolme model pro tři hody kostkou: elementární jev (x1 , x2 , x3 ) jest posloupnost 3 prvků z D6 , Ω = D63 . Máme jevy A = {padla tři lichá čísla} a B = {padla tři různá čísla}. Nejprve spočítejme jejich pravděpodobnosti. Příklad – kostka 2 Máme |Ω| = 63 = 216,
A = {(x1 , x2 , x3 ) : xi je liché ∀i} = D33 a |A| = 33 = 27. B = {(x1 , x2 , x3 ) : xi 6= xj ∀i 6= j} = V (6, 3), |B| =
6! 3!
= 120,
Nám jde ale o pravděpodobnost, že všechna čísla jsou lichá, víme-li, že jsou různá. Proto ještě spočítáme |A ∩ B| = |{padla 3 různá lichá čísla}| = |V (3, 3)| = |P3 | = 3! = 6.
Příklad – kostka 3 Existuje 120 možností, jak mohou padnout tři různá čísla, ale jen v 6 z nich se jedná o samá lichá čísla. Pokud tedy padla různá čísla, pravděpodobnost, že jsou všechna lichá bude 6 1 = = 0.05 120 20 Této pravděpodobnosti říkáme podmíněná pravděpodobnost jevu A = {padla tři lichá čísla} za podmínky, že nastal jev B = {padla tři různá čísla}. Pro srovnání, nepodmíněná pravděpodobnost je P (A) =
27 216
=
1 8
= 0.125.
Vyslovme nyní obecnou definici podmíněné pravděpodobnosti a naučme se s ní pracovat. Podmíněná pravděpodobnost Máme zadaný prostor elementárních jevů Ω a pravděpodobnost P . Definice 2.4. Nechť jev B má kladnou pravděpodobnost, P (B) > 0. Podmíněnou pravděpodobnost jevu A za podmínky, že nastal jev B definujeme vztahem P (A | B) =
P (A ∩ B) . P (B)
11
Podmíněná pravděpodobnost Poznámka. Nepodmíněná pravděpodobnost P (A) vypovídá o četnosti výskytu jevu A v situaci, kdy nemáme žádné dílčí informace o průběhu nebo výsledku experimentu. Podmíněná pravděpodobnost P (A | B) vypovídá o četnosti výskytu jevu A v situaci, kdy víme, že nějaký jiný jev B určitě nastal. Poznámka. Jevy A a B nelze prohazovat. Je-li P (A) > 0, pak platí P (B | A) = P (A | P (B) B) . Rovnost P (B | A) = P (A | B) tedy platí pouze tehdy, pokud jsou jevy A a B P (A) stejně pravděpodobné. Příklad – dostihy Příklad. Favority dostihu jsou koně Lívanec a Škobrťák. Kursy bookmakerů naznačují, že pravděpodobnost vítězství Lívance je 0.2 a Škobrťáka 0.25. Škobrťák však před startem spolkl hřebík a nepoběží. Jaká je pravděpodobnost, že vyhraje Lívanec? Řešení: Jevy: L = {vyhraje Lívanec}, Sˇ = {vyhraje Škobrťák}. Máme P (L) = 0.2, ˇ = 0.25, L ∩ Sˇ = ∅. Odtud P (S) 4 P (L) 1/5 P (L ∩ Sˇc ) = . = = P (L | Sˇc ) = c c ˇ ˇ 3/4 15 P (S ) P (S )
Pravděpodobnost, že vyhraje Lívanec, je 4/15 = 0.2667. Příklad – mariáš Příklad. 32 promíchaných karet bylo rozdáno tak, že já mám 12 karet a moji dva protihráči každý 10. V ruce držím čtyři trumfy. Jaká je pravděpodobnost, že zbylé čtyři trumfy drží všechny v ruce jeden z protihráčů? Řešení: viz Dodatky, kap. 4.3, str. 124.
2.5 Nezávislé jevy Nezávislost dvou jevů Máme prostor elementárních jevů Ω a pravděpodobnost P . Definice 2.5. Náhodné jevy A, B ⊆ Ω nazýváme nezávislé právě když platí P (A ∩ B) = P (A)P (B). Poznámka. Nechť jsou jevy A, B nezávislé a P (A) > 0, P (B) > 0. Pak P (A | B) =
P (A ∩ B) P (A)P (B) = = P (A) P (B) P (B)
a podobně P (B | A) = P (B). Jevy jsou nezávislé, když pravděpodobnost každého z jevů není nikterak ovlivněna tím, zdali druhý jev nastal nebo ne.
12
Nezávislost více jevů Definice 2.6. Náhodné jevy A1 , A2 , . . . , An ⊆ Ω nazýváme nezávislé právě když platí P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 )P (A2 ) · · · P (An ). Definice 2.7. Náhodné jevy A1 , A2 , . . . , An ⊆ Ω nazýváme po dvou nezávislé právě když pro každou dvojici jevů Ai , Aj (1 ≤ i, j ≤ n) platí P (Ai ∩ Aj ) = P (Ai )P (Aj ). Vlastnosti nezávislých jevů Poznámka. Jsou-li jevy A1 , A2 , . . . , An po dvou nezávislé, nemusí být nutně nezávislé. Věta 2.8. Nechť A, B jsou nezávislé. Pak 1. (A, B c ), (Ac , B), (Ac , B c ) jsou též dvojice nezávislých jevů. 2. Platí P (A ∪ B) = 1 − [1 − P (A)][1 − P (B)]. Důkaz Důkaz: 1. Stačí ukázat, že A, B c jsou nezávislé. Máme P (A ∩ B c ) = P (A − A ∩ B) = P (A) − P (A ∩ B) = = P (A)[1 − P (B)] = P (A)P (B c )
2. Zde máme P (A ∪ B) = 1 − P (Ac ∩ B c ) = 1 − P (Ac )P (B c ) = = 1 − [1 − P (A)][1 − P (B)]
Příklad – urna Příklad. V urně je a černých a b bílých koulí. Náhodně vytáhneme dvě koule. Uvažujme jevy B1 = {první koule je bílá} a B2 = {druhá koule je bílá}. Zjistěte, zda B1 a B2 jsou nezávislé jevy, pokud 1. vytažené koule do urny ihned vracíme 2. vytažené koule do urny nevracíme Elementární jevy Koule očíslujeme čísly 1, . . . , a + b. Elementární jevy jsou čísla první a druhé tažené koule.
13
Příklad – urna Řešení: (1) 2 , |Ω| = (a + b)2 . Nyní Máme variace 2. třídy s opakováním: Ω = Da+b
b(a + b) b b = , P (B2 ) = 2 (a + b) a+b a+b 2 b P (B1 ∩ B2 ) = = P (B1 )P (B2 ) (a + b)2
P (B1 ) =
Jevy B1 , B2 jsou nezávislé. Příklad – urna Řešení: (2) Máme variace 2. třídy bez opakování: Ω = V (a + b, 2), |Ω| = b − 1). Nyní
(a + b)! = (a + b)(a + (a + b − 2)!
b b(a + b − 1) = , (a + b)(a + b − 1) a+b P (B2 ) = P (B2 ∩ B1 ) + P (B2 ∩ B1c ) b(b − 1) P (B2 ∩ B1 ) = (a + b)(a + b − 1) ab P (B2 ∩ B1c ) = (a + b)(a + b − 1) b(b − 1) + ab b P (B2 ) = = = P (B1 ) (a + b)(a + b − 1) a+b P (B1 ) =
Příklad – urna Máme P (B1 )P (B2 ) = ale P (B2 ∩ B1 ) = Takže jevy B1 , B2 nejsou nezávislé.
b2 (a + b)2
b(b − 1) b2 6= (a + b)(a + b − 1) (a + b)2
2.6 Náhodná veličina a její rozdělení Náhodná veličina Definice 2.9. Funkci X, která zobrazuje elementární jevy ω ∈ Ω na reálná čísla, nazýváme náhodná veličina.
14
Poznámka. Náhodná veličina je funkce; její hodnota X(ω) je reálné číslo, které se liší podle toho, který elementární jev ω ∈ Ω nastal.
Poznámka. Náhodná veličina převádí elementární jevy (které mohou být zcela abstraktními objekty) na čísla. Náhodná veličina
Poznámka. Náhodnou veličinu můžeme chápat jako číselnou charakteristiku náhodného jevu, který nastal. Příklad (Urna). Z urny, v níž je 6 bílých a 8 černých koulí, náhodně vytahujeme koule (a hned zase vracíme) tak dlouho, dokud jsme nevytáhli celkem 14 bílých koulí. Máme Ω = {všechny nekonečné posloupnosti čísel tažených koulí} Náhodná veličina Příklad (Urna - pokračování). Můžeme zavést například náhodné veličiny: X(ω) = celkový počet tažených koulí Y (ω) = počet tažených bílých koulí ( 1 pokud je bílých koulí taženo více než černých Z(ω) = 0 pokud tomu tak není Dozvíme-li se, které ω nastalo, tj. jaká byla posloupnost tažených koulí, spočítáme hbitě hodnoty X, Y i Z. Náhodná veličina Značení. Mějme náhodnou veličinu X : Ω → R. Pak můžeme uvažovat pravděpodobnost náhodného jevu, že náhodná veličina nabude určité hodnoty, padne do určitého rozmezí atd. Např. P [X = x] ≡ P ({ω ∈ Ω : X(ω) = x}) pro x ∈ R, P [X ≤ x] ≡ P ({ω ∈ Ω : X(ω) ≤ x}) pro x ∈ R,
P [X ∈ B] ≡ P ({ω ∈ Ω : X(ω) ∈ B}) pro B ⊆ R a tak podobně. Náhodná veličina: příklad 1 Příklad (Děti). Uvažujme rodinu, která má tři děti. Zaveďme náhodnou veličinu X, která určuje počet dcer, a náhodnou veličinu Y , která říká, kolik má nejmladší sourozenec starších bratrů. Prozkoumejme obě náhodné veličiny jakožto zobrazení z Ω do R. Prostor elementárních jevů Ω je dán výčtem pohlaví dětí od nejstaršího do nejmladšího. Ω = {SSS, SSD, SDS, DSS, DDS, DSD, SDD, DDD} (S je syn, D je dcera).
15
Náhodná veličina: příklad 1 Máme:
ω X(ω) Y (ω) SSS 0 2 1 2 SSD SDS 1 1 DSS 1 1 DDS 2 0 DSD 2 1 SDD 2 1 DDD 3 0
Předpokládejme, že všechny elementární jevy jsou stejně pravděpodobné. Náhodná veličina: příklad 1 Náhodná veličina X může nabývat hodnot 0, 1, 2, 3. Náhodná veličina Y může nabývat hodnot 0, 1, 2. Můžeme počítat pravděpodobnosti, že X a Y nabudou daných hodnot či padnou do určitých množin hodnot. Například: |{SSS}| 1 |{SDD, DDS, DSD}| 3 = , P [X = 2] = = 8 8 8 8 |{SDS, DSS, DSD, SDD}| 4 1 P [Y = 1] = = = 8 8 2 |{SSS, SSD, SDS, DSS}| 4 1 P [X ≤ 1] = = = 8 8 2 |Ω| 8 P [Y < 4] = = = 1. 8 8 P [X = 0] =
Zde končí přednáška 2, 8. 3.
Diskrétní náhodná veličina Náhodné veličiny uvedené v předchozím příkladě nazýváme diskrétní. Terminologie. Diskrétní náhodná veličina je taková náhodná veličina, která může nabývat jen konečně nebo spočetně mnoha různých hodnot. Poznámka. Diskrétní náhodné veličiny jsou většinou počty (četnosti) nějakých událostí (počet gólů v zápase, počet narozených dívek, počet dopravních nehod,. . . ), nebo indikátory nějakého jevu (ano/ne, nastal/nenastal, pravda/lež), nebo indikátory členství v jedné z předem daných skupin (muž/žena, vzdělání základní/středoškolské/vysokoškolské, bydliště Praha/Ústecko/Pardubicko/. . . )
Náhodná veličina: příklad 2 Příklad (Výška). Uvažujme náhodnou veličinu X, která udává výšku náhodně vybraného člověka. Jak si ji máme představit jako zobrazení Ω → R?
16
Prostor elementárních jevů Ω je dán všemi faktory, které mohly ovlivnit výšku všech lidí, kteří mohli být vybráni (výšky jejich rodičů, zděděné geny, prodělané nemoci a úrazy,. . . ), plus všechny faktory, které mohly ovlivnit měření výšky (jak se kdo nahrbil, jak poctivě ho změřili,. . . ) plus všechny faktory, které mohly vést k tomu, že právě onen člověk byl „náhodně vybránÿ. Elementární jevy jsou stanoveny tak, abychom z elementárního jevu mohli určit změřenou výšku. Klidně se můžeme smířit s tím, že elementárních jevů je nespočetně mnoho. Náhodná veličina: příklad 2 Na prostoru Ω použijeme obecnou definici pravděpodobnosti, jež říká, že je dána nějaká (nám neznámá) funkce P , která udává pravděpodobnosti P (A) všech jevů A ⊆ Ω. Náhodnou veličinu X jakožto zobrazení z Ω do R nedokážeme popsat (neboť nedokážeme popsat Ω), ale to nám nevadí, neboť dokážeme pozorovat změřenou výšku.
Jakých hodnot může nabývat změřená výška? Jistě se nijak neomezíme, připustíme-li, že výška může být kterékoli kladné reálné číslo. To, že výšky větší než 250 cm prakticky nikdy nepozorujeme, nejlépe ošetříme tak, že jejich pravděpodobnosti považujeme za zanedbatelné. Spojitá náhodná veličina Náhodnou veličinu uvažovanou v předchozím příkladě nazýváme veličinou spojitou. Terminologie. Spojitá náhodná veličina je taková náhodná veličina, která může nabývat nespočetně mnoha různých hodnot (většinou interval reálných čísel, nebo jakékoli reálné číslo), přičemž každá konkrétní hodnota má nulovou pravděpodobnost. Poznámka. Spojité náhodné veličiny jsou většinou výsledky nějakého měření, které mohou nabývat velkého počtu hodnot uvnitř nějakého konečného či nekonečného intervalu (výška, váha, hladina cholesterolu v krvi, věk v okamžiku smrti, doba do vyhoření žárovky, rychlost molekuly plynu atd.)
Náhodné veličiny a obecná pravděpodobnost Podstatný rozdíl mezi příkladem s dětmi a příkladem s výškou je v tom, že u počtu dětí jsme mohli použít klasickou definici pravděpodobnosti, zatímco u výšky nikoli. Klasickou definici lze použít jen u diskrétních veličin, a to ještě zřídkakdy. Většinou pracujeme s obecnou axiomatickou definicí pravděpodobnosti, kdy pravděpodobnosti jevů jsou určeny nějakou danou ale neznámou funkcí P . Takže teoreticky pracujeme s prostorem elementárních jevů Ω na němž je zavedena nějaká pravděpodobnost P . V praxi prostor Ω ale nemusíme znát, protože nám ho náhodná veličina převádí na reálná čísla. Rozdělení náhodné veličiny
17
Pravděpodobnost P na neznámém prostoru Ω dokážeme převést na funkci PX , která přiřazuje podmnožinám reálných čísel pravděpodobnost, že náhodná veličina X do nich padne (třeba že náhodně vybraný člověk bude mít výšku mezi 165 a 175 cm). Pro každou B ⊂ R totiž máme PX (B) = P [X ∈ B] = P {ω ∈ Ω : X(ω) ∈ B}. Funkci PX nazýváme indukovaná pravděpodobnost (pro veličinu X) anebo také rozdělení náhodné veličiny X. Například můžeme uvažovat PX (−∞, 180 cmi = P [X ∈ (−∞, 180 cmi] = P [X ≤ 180 cm].
Rozdělení náhodné veličiny Definice 2.10. Rozdělením náhodné veličiny X definované na prostoru Ω s pravděpodobností P rozumíme předpis, který jednoznačně určuje všechny pravděpodobnosti typu PX (B) = P [X ∈ B] = P {ω ∈ Ω : X(ω) ∈ B}
pro kteroukoli podmnožinu B ⊂ R. Rozdělení náhodné veličiny
Poznámka. Rozdělení náhodné veličiny lze popsat několika různými způsoby („předpisyÿ), například pomocí hustoty nebo distribuční funkce. Těmi se budeme zabývat v příští kapitole. Poznámka. Rozdělení náhodné veličiny plně určuje, jak se náhodná veličina chová, tj. jakých hodnot může nabývat a s jakými pravděpodobnostmi (jak často). Význam náhodných veličin Náhodné veličiny převádějí abstraktní a většinou neznámou množinu elementárních jevů Ω na čísla. Daleko lépe se nám pracuje s náhodnými veličinami, než s původním pravděpodobnostním prostorem. Náhodné veličiny slouží jako model pro naše empirická pozorování. V teorii pravděpodobnosti s nimi pracujeme teoreticky; jejich rozdělení považujeme za dané a zkoumáme jejich vlastnosti. Ve statistice se snažíme cosi usoudit o jejich neznámém rozdělení na základě zpravidla opakovaných pozorování. Teď ale pokračujeme výkladem teorie pravděpodobnosti.
2.7 Distribuční funkce a hustoty Distribuční funkce a hustoty různým způsobem charakterizují rozdělení náhodné veličiny.
18
Distribuční funkce Definice 2.11. Distribuční funkce FX náhodné veličiny X jest funkce zobrazující reálná čísla na interval h0, 1i definovaná předpisem FX (x) = P [X ≤ x] pro x ∈ (−∞, ∞). Poznámka. Distribuční funkce plně popisuje rozdělení X. To jest, známe-li hodnoty FX (x) pro každé x, dokážeme spočítat P [X ∈ B] pro jakoukoli podmnožinu B ⊂ R. Vlastnosti distribuční funkce Věta 2.12. Distribuční funkce FX náhodné veličiny X 1. je neklesající; 2. je zprava spojitá; 3. FX (x) se blíží k 0 pro x → −∞; 4. FX (x) se blíží k 1 pro x → ∞;
5. FX (x) je konstantní na intervalu (a, b) právě když P [X ∈ (a, b)] = 0. Distribuční funkce diskrétní veličiny Nechť X je diskrétní náhodná veličina nabývající Pk hodnot t1 < t2 < · · · < tk s pravděpodobnostmi po řadě p1 , p2 , . . . , pk (musí platit j=1 pj = 1). Věta 2.13. Distribuční funkci FX diskrétní náhodné veličiny X lze vyjádřit ve tvaru X FX (x) = pk k:tk ≤x
a platí pro ni: 1. má skoky o velikosti pj v bodech tj , j = 1, . . . , k; 2. je konstantní v intervalech (tj , tj+1 ), j = 1, . . . , k − 1; 3. má hodnotu 0 pro x < t1 ;
4. má hodnotu 1 pro x ≥ tk . Podobné tvrzení jako 2.13 platí pro veličiny nabývající nekonečně (leč spočetně) mnoha hodnot. Příklad – děti Příklad (Děti). Uvažujme znovu rodinu s třemi dětmi a náhodnou veličinu X (počet dcer). Zkonstruujme distribuční funkci pro X. X je diskrétní, nabývá hodnot 0, 1, 2, 3 s pravděpodobnostmi po řadě 81 , 38 , 38 , 18 . Distribuční funkce má skoky v bodech 0, 1, 2, 3 o velikostech x < 0 a jednotková pro x ≥ 3.
19
1 3 3 1 8, 8, 8, 8,
je nulová pro
0.0
0.2
0.4
F(x)
0.6
0.8
1.0
Obrázek 2.1: Distribuční funkce počtu dcer
−2
−1
0
1
2
3
4
5
x
Příklad – děti Viz obrázek 2.1 Příklad – spojitá n. veličina Příklad (Spojitá náhodná veličina). Ukažme si, jak může vypadat distribuční funkce pro spojitou náhodnou veličinu nabývající hodnot z intervalu (0, 1). Příklad – spojitá n. veličina Na obrázku 2.2 vidíme distribuční funkci spojité náhodné veličiny, která nabývá hodnot z intervalu h0, 1i. Příklad – Maxwellovo rozdělení Příklad (Maxwellovo rozdělení). Maxwellovo rozdělení udává rozdělení rychlosti V částic ideálního plynu (rychlost = spojitá náhodná veličina) v třírozměrném prostoru. Jeho distribuční funkce má tvar 1 FV (v) ≡ P [V ≤ v] = √ 2π kde a = [kg].
r
Z
v2 /a2
√ −z/2 ze dz,
0
kT , k je Boltzmannova konstanta, T je teplota [K] a m je hmotnost částice m
20
0.0
0.2
0.4
F(x)
0.6
0.8
1.0
Obrázek 2.2: Příklad distribuční funkce spojité náhodné veličiny
−1.0
−0.5
0.0
0.5
1.0
1.5
2.0
x
Příklad – Maxwellovo rozdělení Obrázek 2.3 ukazuje distribuční funkci rychlosti molekuly kyslíku při teplotě 25℃. Použití distribuční funkce Tvrzení 2.14. Nechť FX je distribuční funkce náhodné veličiny X. Pak platí 1. P [X ∈ (a, bi] = P [X ≤ b] − P [X ≤ a] = FX (b) − FX (a), neboli pravděpodobnost, že X padne do určitého intervalu, je rovna rozdílu hodnot distribuční funkce v krajních bodech tohoto intervalu. 2. P [X = b] je dána velikostí skoku funkce FX v bodě b, to jest P [X = b] = lim P [X ∈ (b − h, bi] = FX (b) − lim FX (b − h) hց0
hց0
Příklad – Maxwellovo rozdělení Viz obrázek 2.4. Délka červené úsečky (zhruba 0.36) je rovna pravděpodobnosti, že molekula kyslíku se při teplotě 25℃ bude pohybovat rychlostí od 400 do 600 m/s. Hustota Uvažujme nějakou spojitou náhodnou veličinu X. Její distribuční funkce je spojitá a také diferencovatelná.
21
Obrázek 2.3: Maxwellovo rozdělení: distribuční funkce rychlosti molekuly kyslíku při 25℃ 1.0
F(v) [s/m]
0.8
0.6
0.4
0.2
0.0 0
200
400
600
800
1000
v [m/s]
Definice 2.15. Pro spojitou náhodnou veličinu X s distribuční funkcí FX existuje funkce fX taková, že Z x
FX (x) =
fX (t) dt.
−∞
Funkci fX nazýváme hustota náhodné veličiny X.
Hustota Tvrzení 2.16. Platí
d FX (x) = FX′ (x), dx tj. hustota je derivací distribuční funkce (a naopak, distribuční funkce jest primitivní funkcí k hustotě). fX (x) =
Vlastnosti hustoty Máme náhodnou veličinu X s hustotou fX . Věta 2.17. Platí 1. fX (x) ≥ 0 pro každé x ∈ R;
22
Obrázek 2.4: Určení pravděpodobnosti daného rozmezí rychlostí molekuly z distribuční funkce Maxwellova rozdělení (O2 , 25℃) 1.0
F(v) [s/m]
0.8
P[400
0.6
0.4
0.2
0.0 0
200
400
600
800
1000
v [m/s]
2. Je-li dán interval (a, b), pak P [X ∈ (a, b)] = P [a < X < b] =
Z
b
fX (x) dx; a
3. fX (x) = 0 pro všechna x ∈ (a, b) právě když P [X ∈ (a, b)] = 0; Z ∞ 4. fX (x) dx = 1. −∞
Vlastnosti hustoty Poznámka. Předchozí věta říká: 1. hustota je nezáporná; 2. pravděpodobnost, že X padne do určitého intervalu, je dána plochou pod hustotou mezi krajními body intervalu; 3. hustota je na daném intervalu nulová právě když X do tohoto intervalu nemůže padnout; 4. celková plocha pod hustotou je rovna jedné. Hustota má velké hodnoty v oblastech, kam X padá častěji, malé hodnoty v oblastech, kam X padá méně často, a nulové hodnoty v oblastech, kam X nepadá nikdy.
23
Interpretace hustoty Spočítejme pravděpodobnost, že spojitá náhodná veličina X padne do úzkého intervalu o délce h kolem bodu x. Máme P [x − h/2 < X < x + h/2] = FX (x + h/2) − FX (x − h/2) ≈ hfX (x) Tato aproximace funguje, pokud je h natolik malé, že se hustota fX na intervalu hx − h/2, x + h/2i příliš nemění. Poznámka. Je-li h malé, pak hfX (x) aproximuje pravděpodobnost, že X padne do intervalu x ± h/2. Hodnota hustoty v bodě x tedy ukazuje, jak často náhodná veličina padá do úzkého okolí bodu x. Příklad – Maxwellovo rozdělení Příklad (Hustota Maxwellova rozdělení). Hustota náhodné veličiny V s Maxwellovým rozdělením (rychlost molekuly ideálního plynu) je dána vzorcem fV (v) =
2 √
v2
v 2 e− 2a2
a3 2π r kT pro v > 0 (fV (v) = 0 pro v < 0), kde a = , k je Boltzmannova konstanta, T je m teplota [K] a m je hmotnost molekuly [kg]. Distribuční funkce a hustota Maxwellova rozdělení Viz obrázek 2.5. Na horním panelu vidíme distribuční funkci rychlosti molekuly O2 při teplotě 25℃ s vyznačením hodnoty pravděpodobnosti, že rychlost nepřekročí 400 m/s. Na dolním panelu je hustota rychlosti. Velikost šedé plochy určuje tutéž pravděpodobnost, jež je vyznačena nahoře. Příklad – Maxwellovo rozdělení Viz obrázek 2.6. Plocha šedé oblasti (zhruba 0.46) je rovna pravděpodobnosti, že molekula kyslíku se při teplotě 25℃ bude pohybovat rychlostí od 400 do 700 m/s. Rozdělení diskrétní veličiny U diskrétní veličiny X nemůžeme definovat hustotu jakožto derivaci distribuční funkce, ale místo toho specifikujeme: 1. Množinu navzájem různých hodnot {tk , k = 1, 2, . . .} jichž X může nabývat (nejvýše spočetná, může být konečná); 2. Pravděpodobnosti p1 , p2 , . . . s nimiž X tyto hodnoty nabývá, tj. pk = P [X = tk ], Musí platit
P∞
j=1 pk
= 1.
24
k = 1, 2, . . .
Obrázek 2.5: Distribuční funkce a hustota rychlosti molekuly O2 (25℃).
Distr. funkce
1.00
F(v)
0.86
0.50
0.25
0.00 0
300
650
900
650
900
v [m/s]
Hustota 0.0020
f(v)
0.0015
Plocha = 0.86
0.0005 0.0000 0
300 v [m/s]
Příklad – rozdělení diskrétní veličiny Viz obrázek 2.7. Součet délek všech svislých úseček (představujících pravděpodobnosti) je roven jedné.
2.8 Příklady diskrétních rozdělení Konstanta Konstanta je náhodná veličina, která nabývá pouze jediné hodnoty s pravděpodobností 1. Tedy P [X = c] = 1 pro nějaké c ∈ R.
25
Obrázek 2.6: Určení pravděpodobnosti daného rozmezí rychlostí molekuly z hustoty Maxwellova rozdělení (O2 , 25℃) 0.0020
f(v)
0.0015
Plocha = 0.46
0.0005
0.0000 0
200
400
700
900
v [m/s]
0.15 0.10 0.05 0.00
P[X=k]
0.20
0.25
Obrázek 2.7: Rozdělení diskrétní veličiny
0
2
4
6 k
26
8
10
Alternativní rozdělení Definice 2.18. Náhodná veličina X má alternativní rozdělení s parametrem p (značení X ∼ Alt(p)), právě když nabývá hodnot 0 a 1 s pravděpodobnostmi P [X = 1] = p
a
P [X = 0] = 1 − p
pro nějaké p ∈ (0, 1).
Poznámka. Alternativním rozdělením modelujeme indikátor náhodného jevu, pravdivostní hodnotu výroku (pravda/lež), dichotomický výsledek experimentu (úspěch/neúspěch). Parametr p často nazýváme pravděpodobnost úspěchu. Binomické rozdělení Definice 2.19. Náhodná veličina X má binomické rozdělení s parametry n a p (značení X ∼ Bi(n, p)), právě když nabývá hodnot 0, . . . , n s pravděpodobnostmi n k P [X = k] = p (1 − p)n−k , k = 0, . . . , n k pro nějaké n ≥ 1 a p ∈ (0, 1).
Poznámka. Z binomické věty víme, že n n X X n k P [X = k] = p (1 − p)n−k = [p + (1 − p)]n = 1. k k=0
k=0
Binomické rozdělení Poznámka. Binomickým rozdělením modelujeme počet úspěchů, které nastanou při provedení n nezávislých dichotomických pokusů. Parametr p představuje pravděpodobnost úspěchu v jednom pokusu. Pravděpodobnosti binomického rozdělení Viz obrázek 2.8. Poissonovo rozdělení Definice 2.20. Náhodná veličina X má Poissonovo rozdělení s parametrem λ (značení X ∼ Po(λ)), právě když nabývá hodnot 0, 1, 2, . . . s pravděpodobnostmi P [X = k] =
λk −λ e , k!
k = 0, 1, 2, . . . ,
pro nějaké λ > 0. Poznámka. Jelikož
musí platit
P∞
k=0 P [X = k] = 1.
∞ X λk k=0
k!
= eλ ,
Poznámka: Poisson čteme puas¸o
27
Obrázek 2.8: Grafické znázornění binomického rozdělení
0.5 0.4 0.3 0.2 0.1 0.0 0
1
2
0.5 0.4 0.3 0.2 0.1 0.0
3
0
1
2
3
k
k
Bi(5,0.8)
Bi(10,0.3)
0.5 0.4 0.3 0.2 0.1 0.0
4
5
8
10
0.3 P[X=k]
P[X=k]
Bi(5,0.2)
P[X=k]
P[X=k]
Bi(3,0.5)
0.2 0.1 0.0
0
1
2
3
4
5
0
k
2
4
6 k
Poissonovo rozdělení Poznámka. Poissonovým rozdělením modelujeme počet událostí, které nastanou při provedení velkého počtu nezávislých dichotomických pokusů, nichž je pravděpodobnost vzniku události velmi malá. Parametr λ představuje intenzitu výskytu událostí. Poznámka. Poissonovým rozdělením se řídí počet částic emitovaných za jednotku času radioaktivní látkou určité hmotnosti. Poznámka. Uvažujme X ∼ Bi(n, nλ ) a pošleme n → ∞. Pak se rozdělení X přibližuje rozdělení Po(λ). Pravděpodobnosti Poissonova rozdělení Viz obrázek 2.9.
Zde končí
2.9 Příklady spojitých rozdělení Spojitá rozdělení specifikujeme pomocí jejich distribuční funkce anebo hustoty. Rovnoměrné rozdělení Definice 2.21. Náhodná veličina X má rovnoměrné rozdělení na intervalu (a, b) (zna-
28
přednáška 3, 15. 3.
Obrázek 2.9: Grafické znázornění Poissonova rozdělení
P[X=k]
Po(0.5) 0.6 0.4 0.2 0 0
1
2
3
4
5
k
P[X=k]
Po(10) 0.15 0.10 0.05 0.00 0
5
10
15
20
k
čení X ∼ R(a, b)), právě když její hustota jest ( 1 pro x ∈ (a, b), fX (x) = b−a 0 jinak pro −∞ < a < b < ∞. Poznámka. Rovnoměrně rozdělená veličina X nabývá pouze hodnot z intervalu (a, b), její hustota je na tomto intervalu konstantní. Rovnoměrné rozdělení Poznámka. Evidentně platí
R∞
−∞ fX (x) dx
=
Rb
a (b
− a)−1 dx = (b − a)−1 (b − a) = 1.
Tvrzení 2.22. Distribuční funkce rovnoměrného rozdělení jest FX (x) =
x−a b−a
pro x ∈ (a, b),
FX (x) = 0 pro x ≤ a a FX (x) = 1 pro x ≥ b. Rovnoměrné rozdělení Poznámka. Rovnoměrné rozdělení R(0, d) se používá např. při modelování doby čekání na událost, která nastává v pravidelných intervalech délky d (ovšem jen v případě, že čekání na událost zahajujeme v okamžiku, který nikterak nesouvisí s minulým ani budoucím výskytem události).
29
Obrázek 2.10: Hustota a distribuční funkce rovnoměrného rozdělení
f(x)
Hustota R(−1,1) 1.0 0.8 0.6 0.4 0.2 0.0 −2
−1
0
1
2
1
2
x
F(x)
Distr. funkce R(−1,1) 1.0 0.8 0.6 0.4 0.2 0.0 −2
−1
0 x
Hustota rovnoměrného rozdělení Viz obrázek 2.10. Exponenciální rozdělení Definice 2.23. Náhodná veličina X má exponenciální rozdělení s parametrem λ > 0 (značení X ∼ Exp(λ)), právě když její hustota jest ( λe−λx pro x > 0, fX (x) = 0 jinak. Poznámka. Exponenciálně rozdělená veličina X nabývá pouze kladných hodnot, její hustota exponenciálně klesá. Exponenciální rozdělení Poznámka. Evidentně platí
R∞
−∞ fX (x) dx
=
R∞ 0
∞ λe−λx dx = λ − λ1 e−λx 0 = 1.
Tvrzení 2.24. Distribuční funkce exponenciálního rozdělení jest Z x x FX (x) = fX (t) dt = − e−λt 0 = 1 − e−λx pro x > 0, −∞
FX (x) = 0 pro x ≤ 0.
30
Obrázek 2.11: Hustota a distribuční funkce exponenciálního rozdělení Distr. funkce Exp(0.5)
0.5
1.0
0.4
0.8
0.3
0.6
F(x)
f(x)
Hustota Exp(0.5)
0.2
0.4
0.1
0.2
0.0
0.0 0
2
4
6
8
10
0
4
6
8
x
x
Hustota Exp(2)
Distr. funkce Exp(2)
10
1.0
2.0
0.8 F(x)
1.5 f(x)
2
1.0
0.6 0.4
0.5
0.2
0.0
0.0 0
2
4
6
8
10
0
x
2
4
6
8
10
x
Exponenciální rozdělení Poznámka. Exponenciální rozdělení se používá např. při modelování doby čekání na událost, která nemá paměť, tj. zbývající doba čekání nezávisí na tom, jak dlouho už čekáme (délka telefonního hovoru, doba obsluhy u pokladny, apod.). Rozdělení kinetické energie molekuly ideálního plynu ve dvourozměrném prostoru je taktéž exponenciální. Hustota exponenciálního rozdělení Viz obrázek 2.11. Maxwellovo rozdělení Definice 2.25. Náhodná veličina X má Maxwellovo rozdělení s parametrem a > 0,
31
právě když její hustota jest fX (x) =
a3
0
2 √
x2
x2 e− 2a2 2π
pro x > 0, jinak.
Poznámka. Maxwellova veličina X nabývá pouze kladných hodnot, její √ hustota je mírně asymetrická. Hustota fX (x) nabývá maximální hodnoty v bodě x = 2a. Maxwellovo rozdělení Tvrzení 2.26. Distribuční funkce Maxwellova rozdělení nemá explicitní vyjádření. Lze ji psát pomocí integrálu z hustoty ve tvaru 1 FX (x) = √ 2π
Z
x2 /a2
√ −z/2 ze dz
pro x > 0,
0
FX (x) = 0 pro x ≤ 0. Maxwellovo rozdělení Poznámka. Maxwellovo rozdělení se používá pro modelování rychlosti molekul ideálního plynu. V tom případě je jeho parametr roven r kT , a= m kde k je Boltzmannova konstanta, T je teplota [K] a m je hmotnost částice [kg]. Hustota Maxwellova rozdělení Obrázek 2.12 ukazuje pravděpodobnostní hustoty rychlostí molekul vodíku, helia, kyslíku a chloru při teplotě 25℃. Hustota Maxwellova rozdělení Obrázek 2.13 ukazuje pravděpodobnostní hustoty rychlostí molekul kyslíku při teplotách 100, 300 a 500 K. Normální rozdělení Definice 2.27. Náhodná veličina X má normální rozdělení s parametry µ ∈ R a σ 2 > 0 (značení X ∼ N(µ, σ 2 )), právě když její hustota jest fX (x) = √
(x−µ)2 1 e− 2σ2 2πσ
pro x ∈ R.
32
Obrázek 2.12: Hustoty rychlosti molekul různých plynů při teplotě 25℃ 0.0030 H2 He O2 Cl2
0.0025
0.0020
0.0015
0.0010
0.0005
0.0000 0
1000
2000
3000
4000
v [m/s]
Obrázek 2.13: Hustoty rychlosti molekul kyslíku při různých teplotách 0.0035 0.0030 100 K 300 K 500 K
0.0025 0.0020 0.0015 0.0010 0.0005 0.0000 0
200
400
600 v [m/s]
33
800
1000
1200
Obrázek 2.14: Hustota normálního rozdělení
Hustoty N(0,1) a N(0,1/4) 0.8 N(0,1) N(0,1/4)
f(x)
0.6 0.4 0.2 0.0 −3
−2
−1
0
1
2
3
x
Hustoty N(−1,1) a N(1,2) 0.4
f(x)
0.3
N(−1,1) N(1,2)
0.2 0.1 0.0 −4
−2
0
2
4
x
Hustota normálního rozdělení Poznámka. Normálně rozdělená veličina X může nabývat jakýchkoli reálných hodnot. Poznámka. Hustota rozdělení N(µ, σ 2 ) je symetrická kolem µ (tj. pro každé t ∈ R platí fX (µ + t) = fX (µ − t)) a nabývá maxima v bodě µ (tj. pro každé t 6= µ platí fX (t) < fX (µ)). Hustota normálního rozdělení Viz obrázek 2.14. Normované normální rozdělení Poznámka. Normální rozdělení s parametry µ = 0 a σ 2 = 1 nazýváme normované.
34
Tabulka 2.1: Hodnoty distribuční funkce N(0, 1) x Φ(x)
0 0.5
0.5 0.691
1 0.841
1.5 0.933
2 0.977
2.5 0.994
3 0.999
Hustotu normovaného normálního rozdělení často značíme ϕ: 1 2 ϕ(x) = √ e−x /2 . 2π Poznámka. Platí
Tudíž
R∞
−∞ ϕ(x) dx
Z
∞
e−x
2 /2
dx =
√
2π
−∞
= 1 a substitucí dostaneme totéž pro obecnou hustotu N(µ, σ 2 ).
Distribuční funkce normálního rozdělení Poznámka. Distribuční funkce normovaného normálního rozdělení se značí Φ(x) a je definována vztahem Z x Z x 1 2 e−t /2 dt. Φ(x) = ϕ(t) dt = √ 2π −∞ −∞ Tuto funkci nelze vyjádřit pomocí jednodušších matematických funkcí, ale její hodnoty lze najít v tabulkách. (Viz tabulka 2.1.) Distribuční funkce normálního rozdělení Poznámka. Φ(x) je středově symetrická kolem bodu (0, 1/2), tj. Φ(−x) = 1 − Φ(x). Distribuční funkce normálního rozdělení Tvrzení 2.28. Pokud X ∼ N(0, 1), pak σX + µ ∼ N(µ, σ 2 ). Pokud X ∼ N(µ, σ 2 ), pak X−µ σ ∼ N(0, 1). Tvrzení 2.29. Distribuční funkci N(µ, σ 2 ) lze obecně napsat jako x−µ FX (x) = Φ σ Distribuční funkce normálního rozdělení Viz obrázek 2.15.
35
Obrázek 2.15: Distribuční funkce normálního rozdělení
Distr. funkce N(0,1) a N(0,1/4) 1.0 N(0,1) N(0,1/4)
F(x)
0.8 0.6 0.4 0.2 0.0 −3
−2
−1
0
1
2
3
x
Distr. funkce N(−1,1) a N(1,2) 1.0 N(−1,1) N(1,2)
F(x)
0.8 0.6 0.4 0.2 0.0
−4
−2
0
2
4
x
Normální rozdělení Poznámka. Z tvrzení 2.29 a tabelovaných hodnot Φ(x) (srv. Tabulka 2.1) plyne, že pro náhodnou veličinu X ∼ N(µ, σ 2 ) platí P [µ − 1.64σ ≤ X ≤ µ + 1.64σ] ≈ 0.90 P [µ − 1.96σ ≤ X ≤ µ + 1.96σ] ≈ 0.95 P [µ − 2.58σ ≤ X ≤ µ + 2.58σ] ≈ 0.99 Náhodná veličina X tedy zřídka padá dále než 2σ–3σ od středu µ její hustoty. Ilustrace k poznámce: Viz obrázek 2.16.
36
f(x)
Obrázek 2.16: Chvosty normálního rozdělení
P = 0.95 P = 0.025
P = 0.025
µ − 1.96σ
µ
µ + 1.96σ
x
Normální rozdělení Poznámka. Normální rozdělení má výsadní postavení ve statistice, neboť součty a průměry většího počtu veličin mají často rozdělení blízké normálnímu (přesněji viz Centrální limitní věta, která bude zmíněna později).
2.10 Charakteristiky náhodných veličin Charakteristiky náhodných veličin • Hustota a distribuční funkce popisují celé rozdělení náhodné veličiny se vším všudy. • To je často příliš mnoho podrobností • Někdy nás zajímá jen nějaký aspekt rozdělení náhodné veličiny, který se dá popsat jedním číslem • Existuje řada charakteristik rozdělení, které popisují jejich různé vlastnosti. Střední hodnota náhodné veličiny Definice 2.30. 1. Střední hodnotou spojité náhodné veličiny X s hustotou fX (x) rozumíme integrál Z ∞ EX = x fX (x) dx, pokud existuje.
−∞
37
Zde končí přednáška 4, 22. 3.
2. Střední hodnotou diskrétní náhodné veličiny X, která nabývá hodnot t1 , t2 , . . . s pravděpodobnostmi p1 , p2 , . . ., rozumíme součet EX =
∞ X
p i ti ,
i=1
pokud existuje. Chápání střední hodnoty
Vezměme si diskrétní náhodnou veličinu nabývající hodnot t1 , . . . , tK s pravděpodobnostmi p1 , . . . , pK . • Představme si, že chceme popsat jedním číslem, jakých hodnot veličina nabývá (je velká/malá?) • Jak to udělat? Zajisté musíme pracovat s čísly t1 , . . . , tK . • Co třeba vzít jejich průměr: K K X 1 X 1 ti = ti K K i=1
i=1
To by nebylo spravedlivé. Některé hodnoty ti mohou mít velmi malou pravděpodobnost, jiné daleko větší. • Tak vezmeme v úvahu jejich rozdílné pravděpodobnosti: Místo abychom dávali všem hodnotám ti stejnou váhu 1/K, dáme hodnotě ti váhu rovnou pravděpodobnosti P [X = ti ] = pi . Chápání střední hodnoty • Došli jsme k výrazu K X
p i ti
i=1
a to je přesně E X pro diskrétní veličinu. • U spojité veličiny děláme přesně totéž, ale místo pravděpodobností P [X = x] vážíme hodnotu x hustotou fX (x) a vše místo sčítání vyintegrujeme. Máme: Z ∞ EX = x fX (x) dx −∞
• Střední hodnotu E X můžeme chápat jako „průměrnouÿ hodnotu náhodné veličiny X. Existence a konečnost střední hodnoty Poznámka. Existují náhodné veličiny, jejichž střední hodnota není konečná anebo vůbec neexistuje. My předpokládáme, že všechny veličiny, s nimiž pracujeme, mají konečnou střední hodnotu.
38
Příklad – děti Příklad (Děti). Uvažujme znovu rodinu s třemi dětmi a náhodnou veličinu X (počet dcer). Spočítejme střední počet dcer EX. X je diskrétní, nabývá hodnot 0, 1, 2, 3 (ti ) s pravděpodobnostmi po řadě 81 , 38 , 38 , 18 (pi ). EX =
K X i=1
p i ti = 0 ·
1 3 3 1 3+6+3 +1· +2· +3· = = 1.5 8 8 8 8 8
Střední počet dcer v rodině se třemi dětmi je 1.5. Příklad – doba čekání Příklad (Doba čekání). Předpokládejme, že doba čekání u přepážky na obecním úřadě (měřeno v minutách) X má exponenciální rozdělení s parametrem λ = 0.012. Jaká je střední doba čekání EX? X ∼ Exp(λ) má hustotu fX (x) = λe−λx . Máme Z ∞ Z ∞ EX = x fX (x) dx = λx e−λx dx (per partes) −∞ Z ∞0 ∞ 1 ∞ 1 = − xe−λx 0 + e−λx dx = 0 + − e−λx 0 = . λ λ 0
Střední doba čekání u přepážky je E X =
1 λ
=
1 0.012
= 83.3 minut.
Příklad – doba čekání Viz obrázek 2.17. Příklad: Maxwellovo rozdělení Příklad (Střední hodnota Maxwellova rozdělení). Rychlost V molekuly ideálního plynu se řídí Maxwellovým rozdělením s hustotou 2 √
fV (v) =
v2
v 2 e− 2a2
a3 2π r kT pro v > 0 (fV (v) = 0 pro v < 0), kde a = , k je Boltzmannova konstanta, T je m teplota [K] a m je hmotnost molekuly [kg]. Jaká je střední rychlost molekuly E V ? Příklad: Maxwellovo rozdělení Spočítáme EV =
Z
∞ 0
v fV (v) dv =
a3
2 √
2π
39
Z
0
∞
2
v 3 − 2a 2
v e
dv =
r
8 a. π
Obrázek 2.17: Hustota exponenciálního rozdělení Exp(λ) se zobrazením střední hodnoty 1/λ.
f(x)
λ
0
1 λ x
Pro a =
p
kT /m dostaneme
r
8 kT · , π m tedy střední rychlost molekul je přímo úměrná odmocnině z teploty a nepřímo úměrná odmocnině z hmotnosti molekul. EV =
Příklad: Maxwellovo rozdělení Obrázek 2.18 ukazuje hustotu rychlosti molekuly kyslíku při 25℃ se zakreslenou střední hodnotou rychlosti, EV = 444.15 m/s. Vlastnosti střední hodnoty Tvrzení 2.31. Mějme nějakou náhodnou veličinu X s konečnou střední hodnotou. Pak platí: 1. Pokud X je konstanta, tj. P [X = a] = 1, pak E X = E a = a. 2. Pokud X má symetrické rozdělení kolem bodu µ, tj. pro všechna t ∈ R buď fX (µ − t) = fX (µ + t) anebo P [X = µ − t] = P [X = µ + t], a E X existuje, pak E X = µ.
3. Platí E (a + bX) = a + bE X pro libovolné a, b ∈ R.
40
Obrázek 2.18: Hustota Maxwellova rozdělení (O2 , 25℃) se zakreslením střední hodnoty. fV(v)
0.0018
0.0012
0.0006
0.0000 0
200
E V = 444.15
600
800
1000
v [m/s]
Vlastnosti střední hodnoty Poznámka. Překlad předchozího tvrzení do běžné řeči: 1. Střední hodnotou konstanty je ona konstanta. 2. Symetricky rozdělená náhodná veličina má střední hodnotu v bodě symetrie. 3. Když náhodnou veličinu posuneme o konstantu nebo vynásobíme konstantou, stejným způsobem se posune a vynásobí její střední hodnota. (Např. střední hodnota výšky v cm je rovna stonásobku střední hodnoty výšky v m). Vlastnosti střední hodnoty Poznámka. Náhodná veličina nemusí nikdy nabývat své střední hodnoty. Příklad. Nechť náhodná veličina X nabývá hodnot −100 a 100 s pravděpodobností 1/2. Její střední hodnota E X je 0. Střední hodnota transformace Transformace náhodných veličin Je-li X náhodná veličina a g nějaká ne příliš divoká reálná funkce definovaná na množině čísel, jichž X nabývá, pak g(X) je také náhodná veličina. Můžeme ji označit Y . Množina hodnot, jichž Y nabývá, je dána oborem hodnot funkce g.
41
Střední hodnota transformace Tvrzení 2.32. 1. Nechť X je spojitá s hustotou fX (x). Pak střední hodnota náhodné veličiny Y = g(X) je Z ∞ E Y ≡ E g(X) = g(x) fX (x) dx. −∞
2. Nechť X je diskrétní a nabývá hodnot t1 , t2 , . . . s pravděpodobnostmi p1 , p2 , . . .. Pak střední hodnota náhodné veličiny Y = g(X) je E Y ≡ E g(X) =
∞ X
g(ti ) pi .
i=1
Střední hodnota transformace Příklad. Vezměme X ∼ Exp(λ) a volme Y = X 2 (tj. g(x) = x2 ). Máme Z ∞ Z ∞ 2 2 2 EY = EX = x fX (x) dx = λx2 e−λx dx = · · · = 2 λ −∞ 0 (použije se 2 × per partes).
Poznámka. Obecně není pravda, že E g(X) = g(E X). Střední hodnota ztransformované veličiny je většinou jiná, než ztransformovaná střední hodnota původní veličiny (rovnost zde platí pouze pro funkci g(x) = a + bx). Střední hodnota transformace Příklad (Střední kvadratická rychlost). Vezměme V z Maxwellova rozdělení s parametrem a a počítejme střední hodnotu náhodné veličiny Z = V 2 . Dostaneme Z ∞ Z ∞ v2 2 2 2 EZ = EV = v fV (v) dv = √ v 4 e− 2a2 dv = 3a2 . a3 2π 0 0 Střední hodnota transformace
√ Poznámka (Střední kvadratická rychlost). Hodnota E V 2 se v chemii nazývá střední kvadratická rychlost částice (ačkoli doslova by ten pojem měl spíše znamenat E V 2 ). Pro r kT a= dostaneme m r r √ √ kT 8 kT 2 EV = 3· > EV = · m π m Medián náhodné veličiny Další charakteristikou náhodné veličiny je medián. Definice 2.33. Mediánem náhodné veličiny X rozumíme kterékoli reálné číslo mX , které splňuje 1 1 P [X ≤ mX ] ≥ a zároveň P [X ≥ mX ] ≥ . 2 2 Poznámka. Definici mediánu může vyhovovat celý interval reálných čísel. V takovém případě za medián většinou bereme střed tohoto intervalu.
42
Chápání mediánu Poznámka. Zhruba řečeno, medián je bod, který náhodná veličina v polovině případů nedosáhne a v polovině případů přesáhne. Chápání mediánu Poznámka. Je-li X spojitá náhodná veličina s ostře rostoucí distribuční funkcí FX (x), pak existuje právě jeden medián: bod mX , pro nějž platí FX (mX ) = 12 . Jinými slovy, medián je bod, v němž distribuční funkce dosáhne hodnoty 12 . Ještě jinými slovy, existujeli inversní funkce FX−1 k FX , pak mX = FX−1
1 . 2
Příklad – doba čekání Příklad (Doba čekání). Spočítejme medián doby čekání X u přepážky na obecním úřadě, která má mít exponenciální rozdělení s parametrem λ = 0.012. Distribuční funkce rozdělení Exp(λ) jest FX (x) = 1 − e−λx pro x > 0. Řešíme rovnici 0.693 = 57.8. FX (mX ) = 12 , tj. e−λmX = 12 . Odtud mX = lnλ2 = 0.012 V polovině případů budeme čekat méně než cca 58 minut, v polovině případů více. (Střední doba čekání byla E X = 83.3 minut.) Příklad – doba čekání Viz obrázek 2.19. Příklad: Maxwellovo rozdělení Pro medián Maxwellova rozdělení nelze napsat jednoduchý vzorec, neboť pro distribuční funkci máme jen výraz ve tvaru integrálu. Můžeme jej však spočítat numericky. Obrázek 2.20 ukazuje hustotu rychlosti molekuly kyslíku při 25℃ se zakresleným mediánem rychlosti mV = 428.12, střední hodnotou rychlosti EV = 444.15 m/s a „střední √ 2 kvadratickou rychlostíÿ EV = 482.08. Vlastnosti mediánu Tvrzení 2.34. Mějme nějakou náhodnou veličinu X. Pak platí: 1. Pokud X má symetrické rozdělení kolem bodu µ, tj. pro všechna t ∈ R buď fX (µ − t) = fX (µ + t) anebo (v případě diskrétní veličiny) P [X = µ − t] = P [X = µ + t], pak mX = µ. 2. ma+bX = a + bmX pro libovolné a, b ∈ R.
3. Je-li g ostře monotónní funkce a Y = g(X), pak mY = g(mX ).
43
Obrázek 2.19: Hustota exponenciálního rozdělení Exp(λ) se zobrazením střední hodnoty 1/λ a mediánu ln 2/λ.
λ
f(x)
P = 0.5
0
mX EX x
Vlastnosti mediánu Poznámka. Překlad předchozího tvrzení do běžné řeči: 1. Symetricky rozdělená náhodná veličina má medián v bodě symetrie (stejně jako střední hodnotu). 2. Když náhodnou veličinu posuneme o konstantu nebo vynásobíme konstantou, stejným způsobem se posune a vynásobí její medián. 3. Když náhodnou veličinu zobrazíme libovolnou rostoucí nebo klesající funkcí, stejným způsobem se zobrazí i její medián. (Toto neplatí u střední hodnoty.) Porovnání mediánu a střední hodnoty Uvědomme si jeden podstatný rozdíl mezi mediánem a střední hodnotou. Příklad. Uvažujme náhodnou veličinu X, která má diskrétní rozdělení s hodnotami 0, . . . , 10, které mají stejné pravděpodobnosti, tj. P [X = j] =
1 , 11
j = 0, . . . , 10.
Střední hodnota X je EX =
10 X j=0
tj P [X = tj ] =
10 X j 1 10(10 + 1) = · = 5. 11 11 2 j=0
44
Obrázek 2.20: Hustota Maxwellova rozdělení (O2 , 25℃) se zakresleným mediánem rychlosti, střední hodnoty rychlosti a střední kvadratické rychlosti. fV(v) mV = 428.12 E V = 444.15 E V2 = 482.08
0.0018
0.0012
0.0006
0.0000 0
200
400
600
800
1000
v [m/s]
Porovnání mediánu a střední hodnoty Medián X je mX = 5 (viz obrázek 2.21). Porovnání mediánu a střední hodnoty Nyní náhodnou veličinu X trochu pozměníme. Uvažujme veličinu Y , která nabývá hod1 not 0, . . . , 9 a 1000, každou s pravděpodobností 11 . Platí: E Y = (0+· · · +9+1000)/11 = 1045/11 = 95, ale mY = mX = 5 neboť distribuční funkce Y a X je totožná na hodnotách menších než 10. Závěr: Střední hodnota je citlivá na změnu ve velmi velkých či velmi malých hodnotách náhodné veličiny; medián nikoli. Kvantil náhodné veličiny Kvantil je zobecnění mediánu. Definice 2.35. Nechť je dáno číslo α ∈ (0, 1). α-kvantilem náhodné veličiny X rozumíme kterékoli reálné číslo qX (α), které splňuje P [X ≤ qX (α)] ≥ α
a zároveň
P [X ≥ qX (α)] ≥ 1 − α.
Poznámka. Medián mX je totéž jako α-kvantil pro α = podobné vlastnostem mediánu.
45
1 2.
Vlastnosti kvantilů jsou
Obrázek 2.21: Ilustrace k příkladu: Medián X je mX = 5.
1.0 0.8
F(x)
0.6 0.4 0.2 0.0 0
2
4
6
8
10
x Tabulka 2.2: Vybrané kvantily rozdělení N(0, 1) α zα
0.5 0
0.8 0.842
0.9 1.282
0.95 1.645
0.975 1.960
0.99 2.326
0.995 2.576
Chápání kvantilů Poznámka. Zhruba řečeno, α-kvantil je bod, který náhodná veličina ve 100α % případů nedosáhne a v 100(1 − α) % případů přesáhne. Poznámka. α-kvantilů je obecně celý interval, ale je-li X spojitá náhodná veličina s ostře rostoucí distribuční funkcí FX (x), pak existuje právě jeden α-kvantil definovaný jako qX (α) = FX−1 (α), kde FX−1 je inversní funkce k FX . Kvantily normovaného normálního rozdělení α-kvantily normovaného normálního rozdělení lze psát jako Φ−1 (α), ale budeme používat i speciální označení zα . (Viz tabulka 2.2.) Poznámka. Jelikož platí Φ(−x) = 1 − Φ(x), máme z1−α = −zα .
46
Obrázek 2.22: Kvantily normovaného normálního rozdělení
1.0
Φ(x)
0.8 0.6 0.4 0.2 0.0 −3
−2
0
−1
z0.8
z0.95
3
x
0.4
φ(x)
0.3 0.2
P = 0.8 0.1
P = 0.15 P = 0.05
0.0 −3
−2
0
−1
z0.8
z0.95
3
x
Kvantily normálního rozdělení Viz obrázek 2.22 – nahoře jsou 0.8- a 0.95-kvantily normovaného normálního rozdělení zobrazené na distribuční funkci, dole tytéž kvantily na hustotě.
Zde končí přednáška 5, 29. 3.
Rozptyl náhodné veličiny Definice 2.36. Rozptylem náhodné veličiny X rozumíme hodnotu výrazu var X = E (X − E X)2 . Poznámka. Rozptyl náhodné veličiny X, Y značíme var X, var Y atp. Chápání rozptylu var X = E (X − E X)2
47
Obrázek 2.23: Hustota normálního rozdělení s nulovou střední hodnotou a různými rozptyly. 0.8 var X = 1/2 var X = 1 var X = 2
f(x)
0.6
0.4
0.2
0.0 −4
−2
0
2
4
x
• Rozptyl je střední hodnota, ale nikoli původní náhodné veličiny, ale její čtvercové odchylky (X − E X)2 . • Rozptyl je vždy nezáporný, neboť (X − E X)2 ≥ 0 a proto i E (X − E X)2 ≥ 0.
• Rozptyl může být nulový jen tehdy, pokud X − E X = 0 s pravděpodobností 1, tj. veličina X nabývá vždy pouze jediné hodnoty (konstanta).
Chápání rozptylu var X = E (X − E X)2 • Rozptyl je malý, pokud náhodná veličina padá s velkou pravděpodobností blízko své střední hodnoty. • Rozptyl je velký, pokud náhodná veličina často padá daleko od své střední hodnoty. • Rozptyl vždy existuje, ale může být nekonečný. Ilustrace rozptylu Viz obrázek 2.23. Vlastnosti rozptylu
48
Tvrzení 2.37. Mějme nějakou náhodnou veličinu X. Pak platí: 1. Pokud X je konstanta, tj. P [X = a] = 1, pak var X = 0. 2. Platí var X = E X 2 − (E X)2 .
3. Pro libovolné a, b ∈ R platí var (a + bX) = b2 var X. Vlastnosti rozptylu Poznámka. Překlad předchozího tvrzení do běžné řeči: 1. Rozptyl konstanty je nulový. 2. Rozptyl je roven rozdílu střední hodnoty čtverce X a čtverce střední hodnoty X. 3. Když náhodnou veličinu posuneme o konstantu, rozptyl se nemění. Když ji vynásobíme konstantou, rozptyl se vynásobí čtvercem konstanty. Vlastnosti rozptylu Důkaz: 1. Je-li P [X = a] = 1, pak E X = a a tudíž (X − E X)2 je 0 s pstí 1. 2. var X = E (X −E X)2 = E [X 2 −2X(E X)+(E X)2 ] = E X 2 −2(E X)(E X)+(E X)2 = E X 2 − (E X)2 . 3. var (a + bX) = E [a + bX − E (a + bX)]2 = E [bX − bE X]2 = b2 E [X − E X]2 = b2 var X. Směrodatná odchylka náhodné veličiny Definice 2.38.√Směrodatnou odchylkou σX náhodné veličiny X rozumíme odmocninu z rozptylu, t.j. var X. Poznámka. Směrodatná odchylka má stejný fyzikální rozměr jako veličina X. 2 . Poznámka. Rozptyl X se někdy značí symbolem σX
Charakteristiky vybraných diskrétních rozdělení (Viz tabulka 2.3.) Charakteristiky vybraných spojitých rozdělení (Viz tabulka 2.4.)
2.11 Náhodné vektory, nezávislost, korelace Náhodný vektor Definice 2.39. Uspořádanou n-tici X náhodných veličin X1 , X2 , . . . , Xn nazýváme náhodný vektor.
49
Tabulka 2.3: Charakteristiky vybraných diskrétních rozdělení. Rozdělení X
EX
mX
Konstanta c
c
c
Alt(p)
p
0
0 (p < 1 2
var X
(p =
1 (p >
1 2) 1 2) 1 2)
Bi(n, p)
np
neuv.
Po(λ)
λ
neuv.
σX
p(1 − p)
p
np(1 − p)
p
λ
0 p(1 − p)
np(1 − p) √ λ
Tabulka 2.4: Charakteristiky vybraných spojitých rozdělení. Rozdělení X R(a, b) Exp(λ) N(µ, σ 2 ) Maxwell(a)
EX a+b 2 1 λ
µ q
8 πa
mX
var X
σX
a+b 2 ln 2 λ
(b−a)2 12 1 λ2 σ2
b−a √ 12 1 λ
µ neuv.
3 − π8 a2
q
σ 3 − π8 a
Značení. Náhodný vektor budeme značit velkým tlustým písmenem (např. X) anebo výčtem jeho složek, např. X1 .. X = . nebo X = (X1 , . . . , Xn )T Xn Značení T v (X1 , . . . , Xn )T znamená překlopení ze řádku na sloupec. Vektory je zvykem chápat jako sloupce. Náhodný vektor Náhodný vektor vzniká tím, že u nastalého elementárního jevu pozorujeme více číselných charakteristik najednou. 1 Většinou se omezíme na náhodné vektory délky 2, tj. budeme uvažovat X = X anebo X 2 X X= Y . Náhodný vektor: příklad
Náhodná veličina X může nabývat hodnot 0, 1, 2, 3. Náhodná veličina Y může nabývat hodnot 0, 1, 2. Můžeme počítat pravděpodobnosti, že X a Y nabudou daných hodnot či padnou do
50
určitých množin hodnot. Například: 1 |{SSS}| = , 8 8 |{SDD, DSD}| 1 P [X = 2, Y = 1] = = 8 4 P [X = 3, Y = 1] = 0 |{SSS, SSD}| 1 P [X ≤ 1, Y ≥ 2] = = 8 4 P [X = 0, Y = 2] =
Distribuční funkce náhodného vektoru Jak definovat rozdělení náhodného vektoru? Rozšíříme definici distribuční funkce a hustoty na dva rozměry. Definice 2.40. Distribuční funkce náhodného vektoru X = X je Y FX (x, y) = P [X ≤ x, Y ≤ y]
Poznámka. Distribuční funkce náhodného vektoru je funkce R2 → h0, 1i, tj. zobrazuje dvojici reálných čísel na číslo z intervalu h0, 1i. Distribuční funkce náhodného vektoru Poznámka. Distribuční funkce náhodného vektoru určuje celé jeho rozdělení, tj. všechny pravděpodobnosti typu P [X ∈ A]
pro (skoro) libovolné A ⊂ R2 .
Příklad. Známe-li FX (x, y) a chceme-li určit pravděpodobnost, že X padne do zadaného obdélníka, máme P [x1 < X ≤ x2 , y1 < Y ≤ y2 ] =
= FX (x2 , y2 ) − FX (x1 , y2 ) − FX (x2 , y1 ) + FX (x1 , y1 )
Distribuční funkce dvourozměrného rozdělení Viz obrázek 2.24. Distribuční funkce dvourozměrného rozdělení Viz obrázek 2.25.
51
Obrázek 2.24: Příklad distribuční funkce spojitého dvourozměrného rozdělení.
y
F(x,y) x
Obrázek 2.25: Distribuční funkce z obrázku 2.24 nakreslená ve formě vrstevnic. 3
2
1
0
−1
−2
−3 −3
−2
−1
0
1
2
3
Hustota náhodného vektoru Definice 2.41. Hustota náhodného vektoru X = fX (x, y) =
X Y
∂ 2 FX (x, y) , ∂x∂y
pokud existuje.
52
je funkce definovaná vztahem
Poznámka. Hustota náhodného vektoru je funkce R2 → h0, ∞), tj. zobrazuje dvojici reálných čísel na nezáporné reálné číslo. Hodnota hustoty udává, jak často náhodný vektor padá kolem daného bodu. Hustota náhodného vektoru Poznámka. Hustota náhodného vektoru určuje celé jeho rozdělení. Máme totiž, pro (skoro) libovolné A ⊂ R2 , Z P [X ∈ A] = fX (x, y)dx dy. (x,y)∈A
Příklad. Známe-li fX (x, y) a chceme-li určit pravděpodobnost, že X padne do zadaného obdélníka A = {(x, y) : x1 < x < x2 , y1 < y < y2 }, dostaneme Z x 2 Z y2 P [X ∈ A] = fX (x, y) dx dy. x1
y1
Hustota náhodného vektoru Tvrzení 2.42. Pokud existuje hustota fX (x, y), pak platí Z x Z y FX (x, y) = fX (s, t) ds dt. −∞
−∞
Tvrzení 2.43. Pokud existuje hustota fX (x, y), pak platí Z ∞Z ∞ fX (s, t) ds dt = FX (∞, ∞) = 1. −∞
−∞
Hustota dvourozměrného rozdělení Viz obrázek 2.26. Hustota dvourozměrného rozdělení Viz obrázek 2.27. Rozdělení diskrétního náhodného vektoru Definice 2.44. Nechť X nabývá hodnot {x1 , x2 , . . .} a Y nabývá hodnot {y1 , y2 , . . .}. Potom X = X je diskrétní náhodný vektor a jeho rozdělení určujeme specifikací všech Y možných pravděpodobností pij ≡ P [X = xi , Y = yj ] pro i = 1, 2, . . . a j = 1, 2, . . . . Poznámka. Musí platit FX (x, y) =
X
X
pij
i:xi ≤x j:yj ≤y
53
a
∞ X ∞ X i=1 j=1
pij = 1.
Obrázek 2.26: Příklad hustoty spojitého dvourozměrného rozdělení.
Obrázek 2.27: Hustota z obrázku 2.26 nakreslená pomocí vrstevnic. 3
2
1
0
−1
−2
−3 −3
−2
−1
0
1
2
3
Diskrétní náhodný vektor: příklad Příklad (Děti – viz dříve). Uvažovali jsme rodinu, která má tři děti a zavedli náhodnou veličinu X, která určuje počet dcer, a náhodnou veličinu Y , která říká, kolik má nejmladší sourozenec starších bratrů.
54
Dostali jsme diskrétní náhodný vektor X =
X Y
:
ω X(ω) Y (ω) SSS 0 2 1 2 SSD SDS 1 1 DSS 1 1 DDS 2 0 DSD 2 1 SDD 2 1 DDD 3 0
Diskrétní náhodný vektor: příklad X nabývá hodnot {x1 = 0, x2 = 1, x3 = 2, x4 = 3}, Y nabývá hodnot {y1 = 0, y2 = 1, y2 = 2}. Rozdělení X = X je dáno pravděpodobnostmi pij = P [X = xi , Y = yj ], které jsou Y xi 0 1 1 2 2 3
yj 2 1 2 0 1 0
pij 1/8 1/4 1/8 1/8 1/4 1/8
Ostatní pij , např. P [X = 2, Y = 2], jsou nulové.
Zde končí přednáška 6, 5. 4.
Sdružené a marginální rozdělení
Rozdělení náhodného vektoru X = X obsahuje něco víc, než kdybychom znali jen Y rozdělení samotné náhodné veličiny X a samotné náhodné veličiny Y . Co je tam navíc, je informace o vzájemném vztahu obou veličin. Terminologie. Rozdělení náhodného vektoru X = X nazýváme sdružené rozdělení Y náhodných veličin X a Y . Rozdělení samotného X a samotného Y nazýváme marginální rozdělení náhodných veličin X a Y .
Sdružené a marginální rozdělení Ze sdruženého rozdělení lze tedy určit marginální rozdělení. Jak? Věta 2.45. Nechť X = X Y je náhodný vektor se sdruženou distribuční funkcí FX (x, y). Marginální distribuční funkce veličin X a Y pak jsou FX (x) = FX (x, ∞) = lim FX (x, y), y→∞
FY (y) = FX (∞, y) = lim FX (x, y). x→∞
55
Sdružené a marginální rozdělení Věta 2.46. Nechť X = X je náhodný vektor se spojitými složkami a sdruženou Y hustotou fX (x, y). Marginální hustoty veličin X a Y pak jsou Z ∞ fX (x) = fX (x, y) dy, −∞ Z ∞ fY (y) = fX (x, y) dx. −∞
Sdružené a marginální rozdělení Věta 2.47. Nechť X = X je náhodný vektor s diskrétními složkami a rozdělením Y určeným pravděpodobnostmi pij = P [X = xi , Y = yj ]. Marginální rozdělení veličin X a Y pak jsou P [X = xi ] = P P [Y = yj ] = P
[ ∞
X ∞ {ω : X(ω) = xi , Y (ω) = yj } = pij ,
j=1
j=1
i=1
i=1
[ ∞
X ∞ {ω : X(ω) = xi , Y (ω) = yj } = pij .
Příklad děti X nabývá hodnot {x1 = 0, x2 = 1, x3 = 2, x4 = 3}, Y nabývá hodnot {y1 = 0, y2 = 1, y2 = 2}. je dáno pravděpodobnostmi pij = P [X = xi , Y = yj ], které jsou Rozdělení X = X Y xi 0 1 1 2 2 3
yj 2 1 2 0 1 0
pij 1/8 1/4 1/8 1/8 1/4 1/8
Ostatní pij , např. P [X = 2, Y = 2], jsou nulové. Příklad děti
56
Máme P [X = 0] = P [X = 0, Y = 0] + P [X = 0, Y = 1]+ 1 1 + P [X = 0, Y = 2] = 0 + 0 + = 8 8 P [X = 1] = P [X = 1, Y = 0] + P [X = 1, Y = 1]+ 1 1 3 + P [X = 1, Y = 2] = 0 + + = 4 8 8 P [X = 2] = P [X = 2, Y = 0] + P [X = 2, Y = 1]+ 1 1 3 + P [X = 2, Y = 2] = + + 0 = 8 4 8 P [X = 3] = P [X = 3, Y = 0] + P [X = 3, Y = 1]+ 1 1 + P [X = 3, Y = 2] = + 0 + 0 = 8 8
Sdružené a marginální rozdělení
Z marginálních rozdělení X a Y nelze jednoznačně určit sdružené rozdělení vektoru X Y . K dané dvojici marginálních rozdělení dokonce existuje nekonečně mnoho odpovídajících sdružených rozdělení. Chceme-li přesně určit sdružené rozdělení, musíme k marginálním rozdělením přidat dostatečně přesnou specifikaci vzájemného vztahu X a Y – například říci, že mezi nimi žádný vztah není, tj. že jsou nezávislé. Nezávislost náhodných veličin Definice 2.48. Náhodné veličiny X a Y nazveme nezávislé, pokud pro (skoro) každé dvě množiny A, B ∈ R platí P [X ∈ A, Y ∈ B] = P [X ∈ A] · P [Y ∈ B]. Poznámka. Nezávislost náhodných veličin znamená, že náhodné jevy [X ∈ A] a [Y ∈ B] jsou vždy nezávislé. Jinak řečeno, P [X ∈ A | Y ∈ B] = P [X ∈ A] a P [Y ∈ B | X ∈ A] = P [Y ∈ B], to jest hodnoty jedné náhodné veličiny nejsou ovlivněny hodnotami druhé. Charakterizace nezávislosti Věta 2.49.
1. Náhodné veličiny X a Y jsou nezávislé, právě když platí FX (x, y) = FX (x) · FY (y) pro každé x, y ∈ R.
2. Spojité náhodné veličiny X a Y jsou nezávislé, právě když platí fX (x, y) = fX (x) · fY (y) pro každé x, y ∈ R.
57
3. Diskrétní náhodné veličiny X a Y jsou nezávislé, právě když platí P [X = xi , Y = yj ] = P [X = xi ] · P [Y = yj ] pro každé xi , yj , kterých X a Y nabývají. Charakterizace nezávislosti Poznámka (Vysvětlení věty). 1. Sdružená distribuční funkce nezávislých náhodných veličin jest součinem marginálních distribučních funkcí. 2. Sdružená hustota nezávislých náhodných veličin jest součinem marginálních hustot. 3. Sdružená pravděpodobnost nezávislých diskrétních veličin jest součinem marginálních pravděpodobností. Příklad děti Příklad (Děti). Uvažovali jsme rodinu, která má tři děti a zavedli náhodnou veličinu X, která určuje počet dcer, a náhodnou veličinu Y , která říká, kolik má nejmladší sourozenec starších bratrů. X a Y nejsou nezávislé, neboť např. P [X = 3, Y = 2] = 0 a P [X = 3] = 18 , P [Y = 2] = 38 . Takže 3 0 = P [X = 3, Y = 2] 6= P [X = 3] · P [Y = 2] = . 64 Tudíž počet dcer a počet starších bratrů nejmladšího sourozence jsou závislé veličiny. Nezávislost více než dvou veličin Poznámka. Definici a charakterizaci nezávislosti lze snadno rozšířit na více náhodných veličin. Pořád platí, že tyto náhodné veličiny jsou nezávislé právě když je jejich sdružená distribuční funkce součinem marginálních distribučních funkcí, resp. právě když je jejich sdružená hustota součinem marginálních hustot. Střední hodnota součtu a součinu Věta 2.50. Nechť X = X Y , kde X, Y jsou libovolné náhodné veličiny. 1. Platí
E (X + Y ) = E X + E Y.
2. Pokud jsou X a Y nezávislé, pak platí E XY = (E X)(E Y ). Střední hodnota součtu a součinu Poznámka. Vždy platí, že střední hodnota součtu dvou (nebo více) náhodných veličin je rovna součtu jejich středních hodnot. Pro nezávislé náhodné veličiny (dvě nebo více) platí, že střední hodnota jejich součinu je rovna součinu jejich středních hodnot. Toto ovšem platí i pro některé náhodné veličiny, které nejsou nezávislé, takže z platnosti tohoto vztahu nelze vyvozovat nezávislost.
58
Kovariance Jak popsat závislost mezi veličinami? Potřebujeme nějakou charakteristiku dvourozměrného rozdělení, která by pochytila aspoň určitý druh závislosti. Takovou charakteristikou je kovariance. Definice 2.51. Uvažujme náhodný vektor X = X Y . Kovariancí náhodných veličin X a Y rozumíme hodnotu cov (X, Y ) = E [(X − E X)(Y − E Y )]
Poznámka. Evidentně platí cov (X, Y ) = cov (Y, X) a cov (X, X) = var X. Vlastnosti kovariance Věta 2.52. 1. Kovariance může nabývat jakýchkoli reálných hodnot, ale pro dvě konkrétní veličiny musí platit cov 2 (X, Y ) ≤ var X · var Y. 2. Platí cov (X, Y ) = E XY − E X · E Y. 3. Pokud jsou X a Y nezávislé, pak cov (X, Y ) = 0. Poznámka. 3 plyne z 2, neboť pro nezávislé náhodné veličiny platí E XY = E XE Y . Interpretace kovariance Poznámka. Je-li kovariance kladná, znamená to, že náhodné veličiny X a Y jsou závislé a že vyšší hodnoty jedné veličiny jsou svázány s vyššími hodnotami druhé veličiny (a nižší hodnoty jedné s nižšími hodnotami druhé). Příklad: výška a váha člověka. Je-li kovariance záporná, znamená to, že náhodné veličiny X a Y jsou závislé a že vyšší hodnoty jedné veličiny jsou svázány s nižšími hodnotami druhé veličiny. Příklad: hloubka dezénu pneumatiky a brzdná dráha. Kovariance: příklad Příklad (Děti). Uvažovali jsme rodinu, která má tři děti, a zavedli náhodnou veličinu X, která určuje počet dcer, a náhodnou veličinu Y , která říká, kolik má nejmladší sourozenec starších bratrů. Dostali jsme náhodný vektor X = X Y : ω X(ω) Y (ω) SSS 0 2 SSD 1 2 SDS 1 1 DSS 1 1 DDS 2 0 DSD 2 1 SDD 2 1 DDD 3 0
59
Příklad: Děti Spočítáme kovarianci náhodných veličin X (počet dcer) a Y (počet starších bratrů nejmladšího sourozence). K výpočtu použijeme tvrzení 2 z věty 2.52. Víme: X je diskrétní, nabývá hodnot 0, 1, 2, 3 s pravděpodobnostmi po řadě 81 , 38 , 38 , 18 . Y je diskrétní, nabývá hodnot 0, 1, 2 s pravděpodobnostmi po řadě 14 , 12 , 14 . Máme (viz str. 39): 1 3 3 1 3+6+3 +1· +2· +3· = = 1.5, 8 8 8 8 8 1 1 1 2+2 EY = 0· +1 · + 2 · = = 1. 4 2 4 4
EX = 0·
Příklad: Děti Nakonec spočítáme E XY . Náhodná veličina XY nabývá hodnot 0, 1, 2 a její střední hodnotu dostaneme určením pravděpodobností všech kombinací hodnot X a Y , které vedou k dané hodnotě XY : E XY = 0 · P [X = 0 ∪ Y = 0] + 1 · P [X = 1, Y = 1] +
+ 2 · (P [X = 1, Y = 2] + P [X = 2, Y = 1]) = 1 3 1 3 = 1 · + 2 · = + = 1. 4 8 4 4
Odtud cov (X, Y ) = E XY − (E X)(E Y ) = 1 − 1.5 · 1 = −0.5
Příklad: Děti Takže cov (X, Y ) = −0.5 < 0, tj. počet dcer a počet starších bratrů nejmladšího sourozence nejsou nezávislé. Čím více je dcer, tím méně je starších bratrů. Vlastnosti kovariance Věta 2.53.
1. Platí cov (X + Y, Z) = cov (X, Z) + cov (Y, Z).
2. Platí var (X + Y ) = var X + 2 cov (X, Y ) + var Y. 3. Pokud cov (X, Y ) = 0, tj. například pokud X a Y jsou nezávislé, pak var (X +Y ) = var X + var Y . Poznámka. Rozptyl součtu není obecně roven součtu rozptylů, ledaže sčítáme nezávislé náhodné veličiny nebo aspoň veličiny s nulovou kovariancí.
60
Vlastnosti kovariance Důkaz bodu 2 ve větě 2.53: Máme var (X + Y ) = E (X + Y )2 − [E (X + Y )]2 = = E (X 2 + 2XY + Y 2 )−
− [(E X)2 + 2E XE Y + (E Y )2 ] =
= E X 2 − (E X)2 + E Y 2 − (E Y )2 + + 2[E XY − E XE Y ] =
= var X + var Y + 2 cov (X, Y ).
Korelace Hodnoty kovariance se špatně interpretují; z dané hodnoty cov (X, Y ) 6= 0 poznáme, že X a Y jsou závislé a jakým směrem, ale nepoznáme, jak silně jsou závislé. Proto zavádíme korelaci. Definice 2.54. Uvažujme náhodný vektor X = X Y . Korelací náhodných veličin X a Y rozumíme hodnotu cov (X, Y ) cor (X, Y ) = √ . var Xvar Y Poznámka. Korelace se někdy značí ̺(X, Y ). Vlastnosti korelace Věta 2.55. 1. Korelace cor (X, Y ) vždy leží mezi −1 a 1. Korelace je nulová právě když cov (X, Y ) = 0. 2. Pokud jsou X a Y nezávislé, pak cor (X, Y ) = 0. 3. Platí cor (X, Y ) = 1 cor (X, Y ) = −1
právě když Y = a + bX pro nějaké a ∈ R a b > 0.
právě když Y = a + bX
pro nějaké a ∈ R a b < 0.
Interpretace korelace Poznámka. Korelace měří sílu lineární závislosti mezi X a Y . Její znaménko udává směr závislosti, podobně jako u kovariance. Jsou-li X a Y silně lineárně závislé (tj. hodnoty této dvojice padají nejčastěji někde kolem přímky v R2 s nenulovou směrnicí), pak je korelace blízko 1 nebo −1. Poznámka. Nezávislé veličiny mají vždy nulovou korelaci. Ale je-li korelace nulová, neznamená to, že X a Y jsou nutně nezávislé. Dokonce mezi nimi může být i funkční vztah — viz následující příklad.
61
Obrázek 2.28: Hustota spojitého dvourozměrného rozdělení s korelacemi cor (X, Y ) = 0, 0.3, 0.6, 0.95. cor(X,Y) = 0
cor(X,Y) = 0.3
4 2 0 −2 −4
4 2 0 −2 −4 −3
−2
−1
0
1
2
3
−3
−2
cor(X,Y) = 0.6
−1
0
1
2
3
2
3
cor(X,Y) = 0.95
4 2 0 −2 −4
4 2 0 −2 −4 −3
−2
−1
0
1
2
3
−3
−2
−1
0
1
Interpretace korelace Příklad (Funkčně závislé náhodné veličiny s nulovou korelací). Vezmeme X, která má rozdělení symetrické kolem 0. Potom E X = 0 a E X 3 = 0 (neboť X 3 má také rozdělení symetrické kolem 0). Vezmeme Y = X 2 . Pak Y a X nejsou nezávislé (Y je funkcí X). Spočítejme kovarianci X a Y: cov (X, Y ) = E XY − E XE Y = E X 3 − E XE Y = 0 − 0 · E Y = 0. Takže kovariance a tudíž i korelace veličin X a Y je nulová. Hustota dvourozměrného rozdělení s různými korelacemi Viz obrázek 2.28. Obrázek pro záporné korelace by měl elipsy otočené na druhou stranu (jako když překlopíme obrázek pro kladnou korelaci podél osy x.)
Zde končí přednáška 7, 12. 4.
2.12 Náhodný výběr Náhodný výběr Definice 2.56. Posloupnosti n nezávislých náhodných veličin X1 , . . . , Xn se stejným rozdělením F říkáme náhodný výběr o rozsahu n z rozdělení F . Poznámka. Náhodný výběr jsou opakovaná pozorování číselné charakteristiky nějakého jevu, jenž nás zajímá. Používáme jej k modelování a zkoumání opakovaných empirických pozorování světa kolem nás.
62
Náhodný výběr Poznámka. Náhodnými výběry se budeme zabývat ve statistické části přednášky. Naučíme se z náhodného výběru rozpoznávat, z jakého rozdělení tento náhodný výběr pochází a používat toto pro řešení praktických problémů. Poznámka. Občas se setkáme s náhodným výběrem X 1 , . . . X n , který obsahuje nezávislé náhodné vektory se stejným počtem složek, které mají všechny nějaké mnohorozměrné rozdělení FX . Výběrový průměr Jednou z nejdůležitějších charakteristik náhodného výběru je výběrový průměr. Uvedeme si nyní definici a několik teoretických vlastností výběrového průměru. Mějme náhodný výběr X1 , . . . , Xn z rozdělení F , tj. každá z veličin Xi má distribuční 2 rozptyl veličiny funkci F a jsou nezávislé. Označme jako µX střední hodnotu a jako σX Xi (jsou stejné pro všechny veličiny). Definice 2.57. Výběrovým průměrem náhodného výběru X1 , . . . , Xn rozumíme náhodnou veličinu n 1X Xn = Xi . n i=1
Výběrový průměr Výběrový průměr je náhodná veličina (kdybychom získali znovu náhodný výběr, dostali bychom jiné hodnoty Xi a tudíž jiný výběrový průměr) a jako náhodná veličina má výběrový průměr nějaké rozdělení, střední hodnotu, rozptyl a všechny ostatní charakteristiky. I když známe distribuční funkci F , která generovala náhodný výběr, určit rozdělení výběrového průměru může být příliš obtížné – ale v některých případech to dokážeme. Následující věta stanoví střední hodnotu a rozptyl výběrového průměru a v případě normálně rozdělených pozorování i celé jeho rozdělení. Vlastnosti výběrového průměru Věta 2.58. 1. E X n = E Xi = µX . Výběrový průměr má stejnou střední hodnotu, jako veličiny, z nichž je počítán. σ2 1 2. var X n = var Xi = X . Rozptyl výběrového průměru je roven rozptylu jednotlin n vých pozorování podělenému jejich počtem. 2 ), pak výběrový průměr 3. Pochází-li náhodný výběr z normálního rozdělení N(µX , σX
má také normální rozdělení, X n ∼ N(µX , Vlastnosti výběrového průměru Důkaz: Dokážeme si pouze body 1 a 2.
63
2 σX n ).
Obrázek 2.29: Hustota výběrového průměru z normálního rozdělení.
n=1 n=5 n = 10 n = 50
2.5
f(x)
2.0
1.5
1.0
0.5
0.0 −2
−1
0
1
2
x
1. E Xn = E
n
n
i=1
i=1
1X 1X nµX Xi = E Xi = = µX . n n n
2. var X n = var
n n X 1X 1 Xi = 2 var Xi = n n i=1
i=1
n 1 X nσ 2 σ2 = 2 var Xi = 2X = X . n n n i=1
První rovnost na druhém řádku využívá nezávislosti X1 , . . . , Xn .
Výběrový průměr má tedy stejnou stední hodnotu, jako všechna pozorování, ale jeho rozptyl je menší již pro n = 2 a s každým dalším pozorováním se zmenšuje. To ilustruje následující obrázek. Ilustrace vlastností výběrového průměru Viz obrázek 2.29. Výběrový průměr z normálního rozdělení se se vzrůstajícím počtem pozorování více a více soustřeďuje kolem střední hodnoty Limitní věty Jak jsme říkali, rozdělení výběrového průměru se těžko určuje, ledaže pozorování pocházejí z normálního rozdělení (anebo některých dalších). Pokud je však rozsah náhodného
64
výběru velký, přesto dokážeme o hodnotách výběrového půměru něco říci. Tomu se věnují takzvané limitní věty. Uvedeme si jen dvě nejdůležitější limitní věty. První z nich je zákon velkých čísel. Zákon velkých čísel Viděli jsme, že se výběrový průměr z normálního rozdělení se vzrůstajícím počtem pozorování více a více soustřeďuje kolem střední hodnoty. Tento princip však platí obecně: Věta 2.59 (Slabý zákon velkých čísel). Mějme dán nekonečný náhodný výběr X1 , X2 , . . . z rozdělení s konečnou střední hodnotou µX . Potom platí, že výběrový průměr X n spočítaný z prvních n pozorování se s n → ∞ přibližuje ke střední hodnotě µX ve smyslu lim P [ X n − µX > ε] = 0 pro každé ε > 0. n→∞
Význam zákona velkých čísel Poznámka. Zákon velkých čísel říká, že spočítáme-li výběrový průměr z nekonečného náhodného výběru, dostaneme střední hodnotu rozdělení, z něhož náhodný výběr pochází. Spočítáme-li výběrový průměr z konečného ale velkého náhodného výběru, nedostaneme přesně střední hodnotu, ale dostaneme číslo, které je střední hodnotě blízko. Význam zákona velkých čísel Poznámka. Nechť X1 , X2 , . . . , Xn je náhodný výběr z nějakého rozdělení, které neznáme. Zákon velkých čísel říká, že ačkoli toto rozdělení neznáme, můžeme určit jeho střední hodnotu s libovolnou přesností, jenom když napozorujeme dostatečně velký výběr. Navíc vhodnou aplikací zákona velkých čísel dokážeme libovolně přesně určit řadu jiných zajímavých charakteristik onoho neznámého rozdělení. Význam zákona velkých čísel Zákon velkých čísel má některé důležité praktické implikace. Poznámka. Uvažujme nějaký náhodný jev A a předpokládejme, že činíme opakovaná nezávislá pozorování tohoto jevu. Označme Xi = 1 pokud jev A nastal při i-tém pozorování a Xi = 0 pokud nenastal. Pak X1 , X2 , . . . je náhodný výběr z alternativního rozdělení Alt(p) s pravděpodobností úspěchu p = P (A) a E Xi = p. Můžeme tedy aplikovat zákon velkých čísel. Význam zákona velkých čísel Pn
X
i Poznámka (Pokr.). Máme X n = i=1 , tj. počet experimentů, při nichž nastal jev A n dělený celkovým počtem experimentů. Podle zákona velkých čísel potom X n → P (A), tj.
65
pravděpodobnost jevu A je přibližně rovna relativnímu počtu výskytů (relativní četnosti) jevu A při velkém počtu experimentů. To přesně odpovídá našemu intuitivnímu chápání pravděpodobnosti jako čísla, které udává, jak relativně často sledovaný jev nastává. Druhým příkladem důležité limitní věty je centrální limitní věta. Centrální limitní věta Věta 2.60 (Centrální limitní věta). Mějme dán nekonečný náhodný výběr X1 , X2 , . . . 2 . Potom platí, že náhodná z rozdělení s konečnou střední hodnotou µX a rozptylem σX √ veličina n(X n −µX )/σX , kde X n je výběrový průměr spočítaný z prvních n pozorování, má přibližně normované normální rozdělení N(0, 1) ve smyslu √ lim P [ n(X n − µX )/σX ≤ x] = Φ(x) pro každé x ∈ R, n→∞
kde Φ je distribuční funkce rozdělení N(0, 1).
Význam centrální limitní věty Poznámka. Centrální limitní věta říká, že výběrový průměr se při velkém rozsahu výběru chová jako normálně rozdělená náhodná veličina. Toto tvrzení můžeme psát několika dalšími způsoby: √ · 2 n(X n − µX ) ∼ N(0, σX ) n 1 X · 2 √ (Xi − µX ) ∼ N(0, σX ) n i=1
·
X n ∼ N(µX ,
n X i=1
2 σX ) n
·
2 Xi ∼ N(nµX , nσX )
·
kde X ∼ N(µ, σ 2 ) znamená, že X má přibližně normální rozdělení s parametry µ, σ 2 . Význam centrální limitní věty 2 /n. Poznámka. Už z dřívějška víme, že průměr X n má střední hodnotu µX a rozptyl σX Také víme, že pokud Xi pocházejí z normálního rozdělení, pak X n je také normální.
Centrální limitní věta k těmto poznatkům dodává, že ať už Xi pocházejí z jakéhokoli rozdělení, výběrový průměr je při dostatečně velkém počtu pozorování vždy přibližně normální. Význam centrální limitní věty
66
Poznámka. Centrální limitní věta ukazuje, proč je normální rozdělení tak důležité. Jednak řada věcí, s kterými budeme pracovat, má podle centrální limitní věty přibližně normální rozdělení a jednak řada v praxi sledovaných náhodných veličin má rozdělení blízké normálnímu, neboť je lze vyjádřit nebo představit si jako součty či průměry velkého počtu nezávislých náhodných veličin.
67
Část 3
Statistika
68
3.1 Úvod Pravděpodobnost vs. statistika Teorie pravděpodobnosti, kterou jsme se až dosud zabývali, pracuje s jednou nebo více teoretickými náhodnými veličinami, jejichž rozdělení je známo. Statistika pracuje s pozorováními (daty), které považuje za náhodný výběr z neznámého rozdělení a snaží se podle nich říci něco o rozdělení, z něhož pocházejí. Někdy pozorujeme více náhodných veličin nebo více náhodných výběrů a chceme něco usoudit o jejich vzájemném vztahu. Principy statistiky K řešení konkrétního problému pomocí statistiky je třeba: 1. Co nejpřesněji stanovit řešený problém. 2. Získat vhodná pozorování a sestavit je do datového souboru. 3. Stanovit pravděpodobnostní model popisující rozdělení pozorovaných dat. 4. Přeformulovat řešený problém v rámci zvoleného pravděpodobnostního modelu (převést na matematické vyjádření). 5. Provést analýzu dat, která vyřeší daný matematicky zformulovaný problém. 6. Řešení správně interpretovat, převést na odpověď na původně položenou otázku. Data Pozorování, která činíme kvůli zodpovězení položené otázky, většinou upravujeme do formátu datové tabulky a uchováváme v elektronické podobě jako počítačový soubor. V datové tabulce bývají většinou pozorování týkající se nezávislých subjektů náhodného výběru (osob, experimentů,. . . ) uvedena v řádcích a jednotlivé měřené veličiny ve sloupcích. K zaznamenávání dat a manipulacím s nimi se používají různé druhy počítačového softwaru (databázové systémy, Excel, R, SAS,. . . ). Příklad datového souboru Příklad datového souboru je v tabulce 3.1. Význam veličin je následující: id pořadové číslo, pohl pohlaví (0 = žena, 1 = muž), vys výška v cm, vaha váha v kg, n.sour počet sourozenců, v.o věk otce, v.m věk matky, bydl bydliště (kraj). Příklady problémů k řešení Příklad. Jsou otcové dětí starší než matky? Pokud ano, o kolik? Příklad. Jsou muži vyšší než ženy? Pokud ano, o kolik? Tyto problémy budeme postupně řešit s použitím dat sesbíraných na první přednášce.
69
Tabulka 3.1: Část datové tabulky představující náhodný výběr z populace studentů 1. ročníku PřF se sedmi veličinami. id .. .
pohl .. .
vys .. .
vaha .. .
n.sour .. .
v.o .. .
v.m .. .
bydl .. .
23 24 25 26 .. .
1 1 1 0 .. .
183 192 178 168 .. .
70 85 90 55 .. .
3 2 1 1 .. .
49 51 45 53 .. .
50 53 41 53 .. .
Vysočina Jižní Morava Karlovy Vary Praha .. .
Poznámka. Všimněte si, že otázky nejsou položeny přesně. Vzhledem k jejich vágní formulaci na ně lze s úspěchem odpovědět „Jak kdyÿ nebo „Většinou asi ano.ÿ Ale můžeme udělat něco víc?
3.2 Odhady charakteristik rozdělení Teorie odhadu Máme náhodný výběr X1 , . . . , Xn z rozdělení s neznámou distribuční funkcí F . Co můžeme zjistit o rozdělení F a jeho charakteristikách (střední hodnota, rozptyl atd.)? Průměr jako odhad střední hodnoty Již víme, že výběrový průměr X n má střední hodnotu µX = E Xi a že se vzrůstajícím počtem pozorování se X n blíží k µX . Má tedy smysl výběrový průměr prohlásit za odhad neznámé střední hodnoty rozdělení F našich pozorování. Ukážeme si teď, jak odhadovat i jiné charakteristiky rozdělení F . Vlastnosti odhadů Definice 3.1. Odhadem neznámé charakteristiky θ rozumíme jakoukoli funkci θbn pozorování X1 , . . . , Xn . Poznámka. Odhad je z principu náhodná veličina a jako taková má nějaké svoje rozdělení. Odhadů je mnoho a většina z nich nedává smysl. Vlastnosti odhadů Jaké vlastnosti má odhad mít, aby opravdu odhadoval to, co chceme? Vezměme nějaký konkrétní odhad θbn neznámé charakteristiky θ.
Terminologie. 1. Odhad θbn nazýváme nestranný (nevychýlený), pokud E θbn = θ. 2. Odhad θbn nazýváme konsistentní, pokud limn→∞ θbn = θ. 70
Vlastnosti odhadů Poznámka. Nestranný odhad v průměru odhaduje to, co chceme odhadovat, tj. nemá systematickou výchylku směrem nahoru ani dolů. Konsistentní odhad se s přibývajícím počtem pozorování přibližuje k odhadované hodnotě a při nekonečném počtu pozorování ji dosáhne přesně. Rozumné odhady by měly být konsistentní a pokud možno nestranné (ale malá výchylka nevadí). Poznámka. Výběrový průměr je nestranný a konsistentní odhad střední hodnoty µX pozorování Xi . Ilustrace konsistence Příklad (Doba čekání). (viz str. 39) Předpokládali jsme, že doba čekání u přepážky na obecním úřadě (v minutách) X má exponenciální rozdělení s parametrem λ = 0.012 a spočítali jsme, že střední doba čekání EX = 83.3. Představme si, že toto nevíme, ale pozorujeme doby čekání u přepážky n náhodně vybraných klientů, které mají rozdělení Exp(0.012). Zobrazme si prvních 20 pozorování: 6.0, 24.7, 37.1, 214.0, 14.8, 317.8, 71.8, 307.5, 94.8, 197.5, 180.8, 17.4, 183.4, 0.5, 29.2, 160.1, 37.6, 3.6, 46.4, 117.3 . . .
Ilustrace konsistence Použijeme výběrový průměr X n jako odhad střední doby čekání. Pro zvětšující se n dostaneme: n Xn
3 22.61
10 128.62
50 85.49
100 83.17
10 000 84.32
1 000 000 83.4
Graficky je průběh výběrového průměru při zvětšujícím se n znázorněn na následujícím obrázku. Ilustrace konsistence Viz obrázek 3.1. Skutečná střední hodnota je vyznačena modrou horizontální přímkou.
Zde končí přednáška 8, 19. 4.
Odhad střední hodnoty Problém: Máme náhodný výběr X1 , . . . , Xn z rozdělení s distribuční funkcí F . Jak odhadnout střední hodnotu E Xi (je stejná pro všechna pozorování i)? P Věta 3.2. Výběrový průměr X n = n1 ni=1 Xi je nestranným a konsistentním odhadem střední hodnoty E Xi . Poznámka. Toto již víme z dřívějška.
71
Obrázek 3.1: Výběrový průměr z rozdělení Exp(0.012) v závislosti na n.
120
Xn
110
100
90
80
1000
2000
3000
4000
5000
n
Odhad střední hodnoty Příklad. Odhadněte střední hodnotu výšky, váhy a velikosti bot studentů 1. ročníku PřF. Odhadněte střední hodnotu rozdílu věků jejich otců a matek. Máme zaznamenaných 130 hodnot každé veličiny, které budeme považovat za náhodný výběr z populace studentů 1. ročníku PřF. Stačí spočítat průměr naměřených hodnot každé z uvažovaných veličin. Máme např. pro výšku Xi , i = 1, . . . , 130: X=
1 (174 + 159 + 167 + · · · + 165 + 172 + 178) = 172.7 cm. 130
Odhad střední hodnoty Další veličiny: • Váha Yi , i = 1, . . . , 130: Y = 64.5 kg. • Velikost bot Zi , i = 1, . . . , 130: Z = 39.964. • Rozdíl věku otců Vi a matek Wi , i = 1, . . . , 130: V − W = 2.28 roku. Otcové jsou v průměru o 2.28 roku starší. Všimněte si, že nemá valného smyslu počítat střední hodnotu bydliště, neboť bydliště je diskrétní kategoriální veličina (rozděluje pozorování do skupin podle krajů), která nemá numerickou interpretaci. Odhad střední hodnoty Umíme-li z náhodného výběru X1 , . . . , Xn nestranně a konsistentně odhadnout střední hodnotu E Xi , umíme také nestranně a konsistentně odhadnout střední hodnotu jakékoli
72
funkce g veličiny Xi . Stačí vzít průměr hodnot g(Xi ) ze všech pozorování, tj. n
1X g(Xi ). n i=1
Například odhadem E Xi2 je výraz Odhad pravděpodobnosti
1 n
Pn
2 i=1 Xi .
Problém: Máme náhodný výběr X1 , . . . , Xn z diskrétního rozdělení, kde každá Xi může nabývat právě jedné hodnoty z množiny I (Příklad: bydliště, kde I je seznam krajů ČR.) Chceme odhadnout pj = P [Xi = j] pro j ∈ I.
Věta 3.3. Nestranným a konsistentním odhadem pravděpodobnosti pj = P [Xi = j] je relativní četnost n 1X I(Xi = j), pbj = n i=1
kde I(A) = 1, pokud jev A nastal, a I(A) = 0, pokud jev A nenastal. Relativní četnost hodnoty j je počet pozorování, která nabyla hodnoty j, dělený celkovým počtem pozorování n.
Odhad pravděpodobnosti Poznámka. Již víme z dřívějška, že pravděpodobnost pj je totožná se střední hodnotou alternativní náhodné veličiny I(Xi = j) a relativní četnost je výběrový průměr z těchto náhodných veličin. Viz poznámka u zákona velkých čísel. Jelikož výběrový průměr je nestranným a konsistentním odhadem střední hodnoty, tak i relativní četnost je nestranným a konsistentním odhadem pravděpodobnosti. Odhad pravděpodobnosti Příklad. Odhadněte pravděpodobnost, že vybraný(á) student(ka) 1. ročníku PřF se narodil(a) v daném měsíci a pravděpodobnost, že bydlí v daném kraji. Máme zaznamenané měsíce narození pro 130 studentů a z nich se 10 narodilo v lednu. Odhadnutá pravděpodobnost narození studenta v lednu je tedy 10/130 = 0.077. Zde je kompletní tabulka pro všechny měsíce narození: Leden 0.077 Červenec 0.120
Únor 0.069 Srpen 0.092
Březen 0.038 Září 0.120
Duben 0.069 Říjen 0.085
73
Květen 0.120 Listopad 0.085
Červen 0.054 Prosinec 0.085
Odhad pravděpodobnosti Tabulka odhadnutých pravděpodobností pro bydliště: Kraj Hradec Králové Jižní Čechy Jižní Morava Karlovy Vary Liberec Moravskoslezský Olomouc
Odhad 0.038 0.085 0.015 0.031 0.038 0.054 0.008
Kraj Pardubice Plzeň Praha Slovensko Ústí Vysočina Zlín
Odhad 0.015 0.077 0.330 0.046 0.069 0.054 0.054
Odhad rozptylu a směrodatné odchylky Problém: Máme náhodný výběr X1 , . . . , Xn z rozdělení s distribuční funkcí F . Jak od2 hadnout √ rozptyl σ = var Xi (stejný pro všechna pozorování i) a směrodatnou odchylku σ = var Xi ? Definice 3.4. Výběrový rozptyl náhodného výběru X1 , . . . , Xn je definován výrazem n
Sn2 =
1 X (Xi − X n )2. n−1 i=1
Věta 3.5. Výběrový rozptyl Sn2 je nestranným a konsistentním odhadem skutečného rozptylu σ 2 . Odhad rozptylu a směrodatné odchylky Poznámka. Výběrový rozptyl Sn2 má podobné vlastnosti jako teoretický rozptyl: • Platí Sn2
X n n 1 2 2 = Xi − X n n−1 n i=1
Toto je pro výpočetně jednodušší vzorec než původní definice Sn2 . • Spočítáme-li výběrový rozptyl veličin a + bXi , kde a, b ∈ R, vyjde b2 Sn2 . Odhad rozptylu a směrodatné odchylky Poznámka. Jiný možný odhad rozptylu je n
1X (Xi − X n )2 n i=1
(průměr čtvercových odchylek od výběrového průměru). Tento odhad je konsistentní, 2 ale není nestranný. Vzhledem k tomu, že tento odhad lze vyjádřit jako n−1 n Sn , je pro velké n tento odhad prakticky totožný s Sn2 a jeho vychýlení klesá k nule.
74
Odhad rozptylu a směrodatné odchylky Poznámka. Odhadem směrodatné odchylky je výběrová směrodatná odchylka v u n u 1 X Sn = t (Xi − X n )2 . n−1 i=1
Je to konsistentní odhad, ale nikoli nestranný.
Odhad rozptylu a směrodatné odchylky Příklad. Odhadněte rozptyl a směrodatnou odchylku výšky studentů 1. ročníku PřF zvlášť pro muže a pro ženy. Ve výběru máme 86 hodnot výšek žen (označíme je X1 , . . . , Xn , kde n = 86) a 44 hodnot výšek mužů (označíme je Y1 , . . . , Ym , kde m = 44). Výpočet výběrových rozptylů a směrodatných odchylek dá Skupina Ženy Muži
Výb. rozptyl 40.3 cm2 47.6 cm2
Výb. směr. odchylka 6.35 cm 6.90 cm
Odhad kvantilu / Uspořádaný náhodný výběr Problém: Máme náhodný výběr X1 , . . . , Xn z rozdělení s distribuční funkcí F . Jak odhadnout hodnotu kvantilu qX (α) rozdělení náhodné veličiny Xi pro nějaké dané α? Speciálně, jak odhadnout medián mX ≡ qX (0.5)? Poznámka. Víme, že na kvantil se můžeme dívat jako na hodnotu, kterou Xi ve 100α % případů nedosáhne a ve 100(1−α) % případů ji přesáhne. Toho využijeme při odhadování kvantilů. Definice 3.6. Uspořádaným náhodným výběrem rozumíme seznam hodnot původního náhodného výběru uspořádaný vzestupně podle velikosti. Uspořádaný výběr značíme indexem v závorce X(1) , X(2) , . . . , X(n−1) , X(n) .
Uspořádaný náhodný výběr Poznámka. Pro uspořádaný náhodný výběr musí platit X(1) ≤ X(2) ≤ · · · ≤ X(n−1) ≤ X(n) . X(1) je tedy nejmenší pozorování (minimum) z celého náhodného výběru a X(n) je největší pozorování (maximum).
75
Odhad kvantilu Máme náhodný výběr X1 , . . . , Xn , z něhož vytvoříme uspořádaný náhodný výběr X(1) , . . . , X(n) . Označme nα = (n + 1)α. Definice 3.7. Je-li nα celé číslo, α-tý výběrový kvantil definujeme jako qbn (α) = X(nα ) (nα -té nejmenší pozorování z náhodného výběru). Není-li nα celé číslo, definujeme α-tý výběrový kvantil výrazem qbn (α) = (1 − nα + [nα ])X([nα ]) + (nα − [nα ])X([nα ]+1) ,
kde [x] je celá část čísla x.
Odhad kvantilu Poznámka. Co znamená výraz qbn (α) = (1 − nα + [nα ])X([nα ]) + (nα − [nα ])X([nα ]+1) ,
Máme-li třeba n = 33 a α = 0.2, měli bychom vzít (n + 1)α = 6.8-té pozorování z uspořádaného výběru. To nelze, tak místo toho vezmeme 0.2 z šestého a 0.8 ze sedmého pozorování. Poznámka. α-tý výběrový kvantil pro α = 0.5 se nazývá výběrový medián a značí se m b n. Odhad kvantilu
Tvrzení 3.8. α-tý výběrový kvantil qbn (α) je konsistentním (nikoli však nestranným) odhadem teoretického α-tého kvantilu qX (α) rozdělení náhodné veličiny Xi (pro libovolné i = 1, . . . , n). Výběrový medián m b n je konsistentním (nikoli však nestranným) odhadem teoretického mediánu mX rozdělení náhodné veličiny Xi . Odhad kvantilu Příklad. Odhadněte medián věku otce a matky studentů 1. ročníku PřF v době narození studenta. Máme 130 pozorování současného věku otce (Zi ) a matky (Vi ) a také roku narození studenta Ri . Z toho spočítáme věk otce a věk matky při narození dítěte. Výběrový medián ze 130 pozorování je dán průměrem pozorování č. 65 a 66 v uspořádaném náhodném výběru (dvě prostřední pozorování). Dostaneme 28 let pro věk otce a 26 let pro věk matky. Polovina otců tedy byla při narození dítěte nejvýše 28 let stará a polovina matek nejvýše 26 let stará.
76
Odhad distribuční funkce Problém: Máme náhodný výběr X1 , . . . , Xn z rozdělení s distribuční funkcí F . Jak odhadnout hodnotu F (x) pro x ∈ R? Definice 3.9. Empirickou distribuční funkcí náhodného výběru X1 , . . . , Xn rozumíme (náhodnou) funkci Fbn (x), která danému x ∈ R přiřadí hodnotu n
1X I(Xi ≤ x) Fbn (x) = n i=1
Poznámka. Empirická distribuční funkce v bodě x je vlastně odhadem pravděpodobnosti P [Xi ≤ x] pomocí relativní četnosti jevu [Xi ≤ x] v našem náhodném výběru. Odhad distribuční funkce Poznámka. Empirická distribuční funkce Fbn (x) je nestranným a konsistentním odhadem skutečné distribuční funkce F (x).
Poznámka. Empirická distribuční funkce má všechny vlastnosti distribuční funkce diskrétní náhodné veličiny (i když skutečné rozdělení je spojité). Empirická distribuční funkce je po částech konstantní se skoky v pozorovaných hodnotách veličin X1 , . . . , Xn (které nemusí být navzájem různé). Velikost skoku v daném bodě x je rovna počtu veličin nabývající hodnoty x dělenému n. Odhad distribuční funkce – příklad Příklad. Spočítejte a nakreslete empirickou distribuční funkce Fbn (x) pro náhodný výběr s pozorovanými hodnotami 2, 5, 1, 2, 6, 4, 5, 2. Máme n = 8 pozorování, která nabyla pěti navzájem různých hodnot: 1, 2, 4, 5, 6. Empirická distribuční funkce tedy skáče v těchto pěti bodech, jinde je konstantní. Velikosti skoků jsou 1/8 v bodech, do nichž padlo jediné pozorování, 2/8 v bodech, do nichž padla dvě pozorování, 3/8 v bodech, do nichž padla tři pozorování, atd. Odhad distribuční funkce – příklad Graf výsledné empirické distribuční funkce viz obrázek 3.2.
Odhad distribuční funkce – příklad 2 Příklad. Nakreslíme empirickou distribuční funkci váhy studentů 1. ročníku PřF (muži a ženy zvlášť). Odhad distribuční funkce – příklad 2 Viz obrázek 3.3.
77
Obrázek 3.2: Empirická distribuční funkce náhodného výběru 2, 5, 1, 2, 6, 4, 5, 2.
1.0
0.8
^ Fn(x)
0.6
0.4
0.2
0.0 0
1
2
3
4
5
6
7
x
Obrázek 3.3: Empirické distribuční funkce váhy studentů.
1.0 Zeny Muzi 0.8
EDF
0.6
0.4
0.2
0.0 40
50
60
70
80
90
100
Váha
Odhad kovariance a korelace
Xn 1 Problém: Máme náhodný výběr dvojic X z dvourozměrného rozdělení s Y1 , . . . , Yn distribuční funkcí F . Jak odhadnout kovarianci cov (Xi , Yi ) a korelaci cor (Xi , Yi )? (Jsou stejné pro všechny dvojice i.) Označme • výběrový průměr veličin X1 , . . . , Xn jako X a veličin Y1 , . . . , Yn jako Y 2 a veličin Y , . . . , Y jako S 2 • výběrový rozptyl veličin X1 , . . . , Xn jako SX 1 n Y
78
Výběrová kovariance Kovariance:
cov (Xi , Yi ) = E [(Xi − E Xi )(Yi − E Yi )]
Definice 3.10. Odhadem kovariance dvou veličin je výběrová kovariance definovaná vzorcem n 1 X (Xi − X)(Yi − Y ) SXY = n−1 i=1
Poznámka. Výběrová kovariance má stejnou strukturu jako teoretická kovariance, ale střední hodnoty jsou nahrazeny průměry z náhodného výběru (a vnější průměr se dělí n − 1 namísto n). Vlastnosti výběrové kovariance Věta 3.11. Výběrová kovariance SXY je nestranným a konsistentním odhadem skutečné kovariance cov (Xi , Yi ). Poznámka. Pro výběrovou kovarianci platí n
SXY
n 1 X = Xi Yi − X Y , n−1 n i=1
dá se tedy počítat jako rozdíl průměru součinů a součinu průměrů obou veličin (s korekcí n/(n − 1)). Tento vztah zjednodušuje její výpočet. Odhad korelace Korelace:
cov (Xi , Yi ) cor (Xi , Yi ) = √ var Xi var Yi
Věta 3.12. Odhadem korelace je výběrový korelační koeficient Pn (Xi − X)(Yi − Y ) SXY = qP i=1 rXY = . Pn SX SY n 2 2 i=1 (Xi − X) i=1 (Yi − Y )
Poznámka. Výběrový korelační koeficient je podílem výběrové kovariance a součinu výběrových směrodatných odchylek. Odhad korelace Věta 3.13. Výběrový korelační koeficient rXY je konsistentním odhadem skutečné korelace cor (Xi , Yi ) (nikoli však nestranným). Odhad kovariance a korelace: příklad Příklad. Odhadněte kovarianci a korelaci mezi (a) výškou a váhou a (b) věkem otce a matky studentů 1. ročníku PřF. Máme zaznamenaných 130 hodnot každé dvojice (výška/váha, věk otce/matky), které budeme považovat za náhodný výběr z populace studentů 1. ročníku PřF.
79
Obrázek 3.4: Graf váhy proti výšce a věku matky proti věku otce (data studenti).
100 60 90 55 Vek matky
Vaha
80
70
50
45
60
50
40
150 160 170 180 190 200
40
Vyska
45
50
55
60
65
Vek otce
Tabulka 3.2: Postup výpočtu výběrové kovariance a korelace (data studenti). Výška Váha Xi Yi X = 172.72 Y = 64.50 2 = 99.07 SX SY2 = 144.33 1 P Xi Yi = 11232.3 n
Věk otce Věk matky Xi Yi X = 49.12 Y = 46.83 2 = 32.79 SX SY2 = 24.68 1 P Xi Yi = 2321.5 n
SXY = (11232.3 − 172.7 · 64.5) · 130/129 = 92.38 92.38 rXY = √ 99.07 · 144.33 = 0.773
SXY = (2321.5 − 49.1 · 46.8) · 130/129 = 21.57 21.57 rXY = √ 32.79 · 24.68 = 0.758
Odhad kovariance a korelace: příklad Graf pozorovaných hodnot váhy proti výšce a věku matky proti věku otce viz obrázek 3.4. Odhad kovariance a korelace: příklad Postup výpočtu odhadů je popsán v tabulce 3.2.
80
Odhad kovariance a korelace: příklad Výběrová kovariance mezi výškou a váhou je 92.38 kg · cm. Výběrová kovariance mezi věkem otce a matky je 21.57. Výběrový korelační koeficient mezi výškou a váhou je 0.77. Výběrový korelační koeficient mezi věkem otce a matky je 0.76. Oba páry veličin vykazují pozitivní odhadovanou korelaci, tj. zdá se, že větší výška může souviset s větší váhou a vyšší věk otce s vyšším věkem matky. . Odhad hustoty Problém: Máme náhodný výběr X1 , . . . , Xn ze spojitého rozdělení s hustotou f . Jak odhadnout hustotu f ? Odhad hustoty je relativně složitý problém, a proto se spokojíme s jednoduchou grafickou metodou, která nám dá vizuální představu o hustotě. Graf, který lze takto použít, se nazývá histogram. Histogram Konstrukce histogramu: Vezměme náhodný výběr X1 , . . . , Xn a stanovme interval A = (a, bi, takový, že pokrývá celé rozmezí dat, tj. Xi ∈ A pro všechna i = 1, . . . , n.
Interval A = (a, bi rozdělíme na K navazujících podintervalů Ak , k = 1, . . . , K. Nejsnazší je vzít stejně dlouhé intervaly: Ak = (a + (k − 1)h, a + khi, kde h =
k = 1, . . . , K,
b−a K .
Histogram Konstrukce histogramu: Označme Nk počet pozorování X1 , . . . , Xn , které padly do intervalu Ak (pro každé k = 1, . . . , K). Přesněji, n X Nk = I(Xi ∈ Ak ) i=1
kde I(Xi ∈ Ak ), i = 1, . . . , n, je náhodný výběr z rozdělení Alt(pk ) a pk = P [Xi ∈ Ak ] =
Z
a+kh
f (x) dx.
a+(k−1)h
Pokud je h relativně malé, pak pk ≈ h · f (x) pro x ∈ Ak . Histogram Konstrukce histogramu:
81
Obrázek 3.5: Histogram výšky studentů s proloženou hustotou normálního rozdělení.
0.05
Odhad hustoty
0.04
0.03
0.02
0.01
0.00 150
160
170
180
190
200
Vyska [cm] Nk Hodnota je vlastně výběrový průměr pro náhodný výběr z rozdělení Alt(pk ) a tudíž n odhaduje pravděpodobnost pk = P [Xi ∈ Ak ] ≈ h · f (x) pro x ∈ Ak . Hodnotu
Nk tedy můžeme považovat za odhad hustoty na intervalu Ak . nh
Histogram Konstrukce histogramu: Nk . Takový histonh gram je odhadem hustoty f (x) a například splňuje, že plocha pod histogramem je rovna 1. Nk Nk Někdy se do histogramu místo kreslí relativní četnosti anebo jen četnosti Nk . nh n Takový obrázek má stejný tvar, ale liší se jeho škála na ose y. Histogram je obrázek, v němž je na intervalu Ak zakreslena hodnota
Histogram – příklad Histogram výšky studentů 1. ročníku PřF – viz obrázek 3.5. Na obrázku je proložena hustota normálního rozdělení se střední hodnotou 172.7 a rozptylem 99.1 (výběrový průměr a rozptyl pozorovaných výšek). Obrázek říká, že výška by mohla mít přibližně normální rozdělení.
82
Obrázek 3.6: Histogram výšky studentů s třemi a pětadvaceti intervaly.
0.035 0.030
0.04
0.025 0.03 0.020 0.015
0.02
0.010 0.01 0.005 0.000
0.00
150
170
190
150
Vyska [cm]
170
190
Vyska [cm]
Histogram Histogram se může lišit podle toho, na kolik intervalů rozdělíme rozpětí dat. Obrázek 3.6 ukazuje histogramy výšky studentů s příliš malým (3) a příliš velkým (25) počtem intervalů. Takové histogramy nejsou příliš užitečné pro posouzení rozdělení zkoumané veličiny.
3.3 Grafické metody průzkumové statistiky Grafická prezentace dat Statistika používá mnoho různých grafických metod pro zkoumání rozdělení veličin a vztahů mezi nimi. Zakreslením vhodně zvolených výběrových charakteristik do grafu lze získat vizuální představu o analyzovaných datech. Již jsme se seznámili s dvěma takovými metodami: empirickou distribuční funkcí a histogramem. V této kapitole si ukážeme některé další grafické metody. Krabicový diagram Krabicový diagram (angl. boxplot) slouží k simultánnímu zobrazení několika vybraných charakteristik náhodných veličin. Je obzvlášť vhodný k neformálnímu porovnání rozdělení několika náhodných veličin či několika výběrů. Krabicový diagram nemá závaznou definici. Konkrétní podoba krabicového diagramu se liší podle implementace v používaném softwaru a uživatelem zadaných parametrů.
83
Obrázek 3.7: Krabicový diagram výšky studentů podle pohlaví a podle ročního období při narození.
200
200
190
190
180
180
170
170
160
160
150
150 Zena
Muz
Zima
Jaro
Leto
V krabicovém diagramu je obvykle zakreslen výběrový medián a kvartily (0.25- a 0.75kvantily), někdy i výběrový průměr. Krabicový diagram Krabicový diagram pro náhodný výběr vypadá jako svisle položená krabice, jejíž horní a dolní okraj určují výběrové kvartily (hodnoty odečítáme na ose y). Uprostřed krabice bývá čára určující výběrový medián, případně odlišná čára určující výběrový průměr. Z krabice mohou na obou koncích vycházet vousy (angl. whiskers) ukazující rozmezí dat. Krabicový diagram Obrázek 3.7 ukazuje krabicové diagramy výšky studentů. V levém diagramu jsou zvlášť zakresleny kvartily a medián výšky pro muže a pro ženy. V pravém diagramu jsou zvlášť zakresleny kvartily a medián výšky pro studenty narozené v daném ročním období. Z obrázku se zdá, že výšky mužů a žen se podstatně liší, zatímco výšky lidí narozených v různých ročních obdobích tolik ne. Bodový diagram Bodový diagram (angl. scatterplot) slouží k zobrazení párů náhodných veličin. Jde vlastně o dvojice pozorování obou zkoumaných veličin zakreslené do kartézské soustavy souřadnic. Je obzvlášť vhodný k neformálnímu zkoumání závislosti mezi náhodnými veličinami.
84
Obrázek 3.8: Bodový diagram výšky studentů proti věku otce s rozlišením pohlaví.
200
Vyska [cm]
190 180 170 160
Zeny Muzi
150 40
45
50
55
60
65
Vek otce
Bodový diagram Příklady bodových diagramů jsou na obrázku 3.4. Je vidět, že výška a váha jsou patrně závislé, podobně jako věk otce a věk matky. Obrázek 3.8 ukazuje bodový diagram výšky studentů proti věku otce s rozlišením pohlaví pomocí barvy a tvaru značek. Graf naznačuje, že výška postavy a věk otce jsou patrně nezávislé, ale výška nejspíš závisí na pohlaví. Obdélníkový a výsečový diagram Obdélníkový diagram (angl. barplot) a výsečový (koláčový) diagram (angl. pie chart) zobrazují četnosti, relativní četnosti nebo procenta pro hodnoty diskrétních veličin. Obdélníkový diagram je vlastně obdobou histogramu. Existuje mnoho různých variant obdélníkových a výsečových diagramů. Obdélníkový a výsečový diagram Příklady obdélníkového a výsečového diagramu jsou na obrázku 3.9. Oba se týkají rozdělení ročního období při narození v populaci studentů 1. ročníku PřF.
Zde končí přednáška 9, 26. 4.
3.4 Testování hypotéz Testování hypotéz – úvod Testováním hypotéz rozumíme vyhodnocování pravdivostní hodnoty výroků na základě náhodného výběru. Pomocí testování hypotéz můžeme například odpovědět na následu-
85
Obrázek 3.9: Obdélníkový a výsečový diagram období narození studentů.
40
Jaro
Cetnosti
30
Zima
20
10
Leto Podzim
0 Zima
Jaro
Leto
Podzim
jící otázky: • Jsou studenti vyšší než studentky? • Jsou otcové studentů v průměru o dva roky starší než matky? • Mají studenti narozeniny rovnoměrně rozdělené po celý rok, nebo existují období, kdy se narodilo více studentů než jindy? • Mají studenti žijící v Praze méně sourozenců než ostatní studenti? Testování hypotéz – úvod Uvažujme otázku: „Jsou studenti vyšší než studentky?ÿ Tuto otázku si musíme zformulovat přesněji. Patrně má znamenat, že střední hodnota výšky studenta je větší než střední hodnota výšky studentky (nikoli, že libovolný student je vždy vyšší než libovolná studentka). Jinými slovy, chceme vědět, zda výška závisí na pohlaví tak, že u mužů je střední hodnota vyšší. Testování hypotéz – úvod Pokud chceme vědět něco o středních hodnotách výšky mužů a žen, zajisté se podíváme na jejich odhady (výběrové průměry). Máme
Počet pozorování n Výb. průměr výšek X n
Muži
Ženy
44 183.2
86 167.4
Vidíme, že průměr u mužů je o dost vyšší. Ale opravňuje nás to tvrdit, že střední výška mužů je větší? Průměr je náhodná veličina s nějakým rozdělením. Pozorovaná hodnota průměru nemusí odpovídat skutečné střední hodnotě.
86
Testování hypotéz – úvod • Kdybychom si vzali dva výběry z toho samého rozdělení a vypočítali jejich průměry, nedostaneme stejná čísla. Průměry se liší, i když jsou střední hodnoty stejné. • Jak tedy z vypočtených průměrů poznat, jestli jsou skutečné střední hodnoty jiné nebo ne? Patrně půjde o to, jestli se vypočtené průměry liší jen o málo nebo ne. Pokud oba průměry odhadují tutéž střední hodnotu, pak by neměly být příliš daleko od sebe, zvláště pokud oba výběry obsahují dost velký počet pozorování. • Jak daleko by průměry měly být, abychom mohli považovat skutečné střední hodnoty za odlišné, to záleží jednak na počtu pozorování a jednak na jejich rozptylu: velký rozptyl znamená větší nejistotu o skutečných středních hodnotách. Testování hypotéz – úvod Vzhledem k tomu, že testujeme hypotézy na základě náhodného výběru, nemůžeme testovanou otázku zodpovědět s absolutní jistotou. Co ale můžeme udělat, je omezit chyby, kterých se při zodpovídání otázek dopouštíme. Testování hypotéz – principy Ukažme si principy testování hypotéz na jednodušším příkladě: Příklad (Výška). Je střední výška studentů 1. ročníku PřF stejná jako průměrná výška mužů v ČR, řekněme 180 cm? Je střední výška studentek 1. ročníku PřF stejná jako průměrná výška žen v ČR, řekněme 167 cm? Testování hypotéz – principy Uvažujme náhodný výběr X1 , . . . , Xn s distribuční funkcí F . Uvažujme nějakou charakteristiku θ rozdělení F , která nás zajímá, např. θ = E Xi . Tuto charakteristiku nazýváme parametr rozdělení F náhodného výběru X1 , . . . , Xn . Označme Θ množinu všech možných hodnot, jakých tento parametr může nabývat, například Θ = R. Nyní vybereme nějakou specifickou hodnotu θ0 ∈ Θ, která nás zajímá: chceme vědět, jestli θ = θ0 nebo ne. Definice 3.14. Výrok θ = θ0 nazýváme hypotéza a značíme H0 : θ = θ0 . Opačný výrok nazýváme alternativa a značíme H1 : θ 6= θ0 . Testování hypotéz – příklad Příklad (Výška). Parametr θ je roven střední hodnotě výšky E Xi (je obecně jiný u mužů a u žen). Muži: θ0 = 180. Testujeme hypotézu H0 : θ = 180 proti alternativě H1 : θ 6= 180. Ženy: θ0 = 167. Testujeme hypotézu H0 : θ = 167 proti alternativě H1 : θ 6= 167.
87
Testová statistika a kritický obor Formulace testu hypotézy: Test hypotézy H0 : θ = θ0 proti alternativě H1 : θ 6= θ0 je dán dvěma složkami: 1. Náhodnou veličinou Tn = Tn (X1 , . . . , Xn ), která je funkcí pozorování X1 , . . . , Xn a její rozdělení závisí na testovaném parametru θ. Tuto náhodnou veličinu nazýváme testová statistika. 2. Množinou C ⊂ R, která se nazývá kritický obor testu. Testová statistika a kritický obor Formulace testu hypotézy: Testová statistika Tn a kritický obor C dohromady určují rozhodovací pravidlo: • pokud Tn ∈ C, zamítáme hypotézu H0 ve prospěch alternativy H1 ;
• pokud Tn ∈ / C, hypotézu H0 nemůžeme zamítnout.
Poznámka. Test hypotézy tedy funguje tak, že spočítáme Tn pro daný náhodný výběr a podíváme se, zdali vypočtená hodnota padla do kritického oboru C. Pokud ano, zamítáme hypotézu. Pokud ne, hypotézu nezamítáme. Chyba I. a II. druhu Při testování hypotéz mohou nastat čtyři situace:
Hypotéza platí Hypotéza neplatí
H0 nezamítáme OK Chyba II. druhu
H0 zamítáme Chyba I. druhu OK
Pokud zamítneme neplatnou hypotézu anebo nezamítneme platnou hypotézu, naše rozhodnutí je správné. Pokud zamítneme platnou hypotézu, učinili jsme tzv. chybu I. druhu. Pokud nezamítneme neplatnou hypotézu, učinili jsme tzv. chybu II. druhu. Hladina testu a síla testu Jelikož pozorování jsou náhodná, nemůžeme se chybám I. a II. druhu zcela vyhnout. Obě chyby budou nastávat s jistou pravděpodobností. Definice 3.15. Pravděpodobnost zamítnutí platné hypotézy, nazýváme hladina testu. Pravděpodobnost zamítnutí neplatné hypotézy, nazýváme síla testu. Poznámka. Hladina testu jest rovna pravděpodobnosti chyby I. druhu. Síla testu jest rovna 1−pravděpodobnosti chyby II. druhu.
88
Hladina testu a síla testu Rádi bychom měli test s co nejmenší hladinou (tj. co nejmenší pravděpodobností chyby I. druhu) a co největší silou (tj. co nejmenší pravděpodobností chyby II. druhu). To ale není možné. Proto stanovíme pevnou hladinu α ∈ (0, 1) a budeme uvažovat pouze testy dosahující 1 této hladiny. V praxi se nejčastěji bere α = 0.05 = 20 . Na sílu testu se nekladou žádné požadavky. Sílu testu můžeme ovlivnit vhodnou volbou testové statistiky a dostatečného počtu pozorování. Filosofie testování hypotéz – shrnutí Při testování můžeme • dojít ke správnému rozhodnutí (zamítnout neplatnou hypotézu nebo nezamítnout platnou hypotézu) • udělat chybu I. druhu (zamítnout správnou hypotézu) anebo II. druhu (nezamítnout nesprávnou hypotézu) Situaci řešíme tak, že stanovíme dostatečně nízkou pravděpodobnost chyby I. druhu (hladinu testu). Pravděpodobnost chyby II. druhu omezena není, ale závisí na okolnostech: • na testové statistice, kterou si zvolíme • na počtu pozorování, které máme k disposici • na rozptylu (přesnosti) pozorování Filosofie testování hypotéz – shrnutí Hypotéza a alternativa tedy nejsou posuzovány symetricky. Hypotézu považujeme a priori za platnou a zamítáme ji jen tehdy, pokud k tomu máme dostatečně silné důvody. Výsledek testu proto posuzujeme takto: • pokud jsme zamítli hypotézu, můžeme tvrdit, že data svědčí o tom, že hypotéza neplatí • pokud jsme hypotézu nezamítli, pak je to buď tím, že hypotéza platí, anebo tím, že hypotéza sice neplatí, ale data neposkytují dostatečné důvody k jejímu zamítnutí (malá síla). Jinými slovy, hypotézu nemůžeme prokázat, ale pouze vyvrátit. Filosofie testování hypotéz – shrnutí Statistické testování připomíná soudní proces ctící princip presumpce neviny. • Hypotéza je „Obžalovaný je nevinenÿ. • Alternativa je „Obžalovaný je vinenÿ. • Zamítneme-li hypotézu, odsoudíme obžalovaného k trestu. • Nezamítneme-li hypotézu, obžalovaný je propuštěn. • Testová statistika je soudce, data představují důkazy svědčící pro nebo proti vině.
89
• Kritická hodnota je důkazní břemeno: množství důkazů nutné k odsouzení. • Hladina testu je pravděpodobnost odsouzení nevinného. • Síla testu je pravděpodobnost odsouzení pachatele. Filosofie testování hypotéz – shrnutí • Hladinu stanovíme malou, abychom chránili nevinné před odsouzením. Tím ale zároveň zvyšujeme důkazní břemeno a smiřujeme se s tím, že řada viníků bude propuštěna pro nedostatek důkazů. • Skončí-li proces odsouzením obžalovaného, můžeme usoudit, že je vinen. Je-li obžalovaný propuštěn, může být opravdu nevinen anebo může být vinen, ale soud neměl dostatečné důkazy k jeho odsouzení. • K odsouzení vinného (bez porušení presumpce neviny) si můžeme pomoci angažováním schopného soudce (vhodně zvolené testové statistiky), opatřením dodatečných důkazů (více dat) anebo zmenšením chyb a omylů v důkazním materiálu (rozptylu dat).
3.5 Jednovýběrový t-test Testování střední hodnoty Předveďme si, jak se odvodí testová statistika pro konkrétní test. Ukážeme si tzv. jednovýběrový t-test. Mějme náhodný výběr X1 , . . . , Xn z rozdělení N(µ, σ 2 ). Chceme otestovat hypotézu H0 : µ = µ0 proti alternativě H1 : µ 6= µ0 .
Testová statistika musí splňovat dvě podmínky: musí být citlivá na střední hodnotu rozdělení Xi a musíme znát její rozdělení za hypotézy. První podmínku určitě splňuje výběrový průměr X n , který odhaduje střední hodnotu µ. Můžeme vzít X n za základ testové statistiky a zamítat H0 pokud X n je dostatečně daleko od hypotetické střední hodnoty µ0 . Testování střední hodnoty Známe rozdělení X n ? Ano, měli jsme větu 2.58, 2
která říká, že X n ∼ N(µ, σn ).
Předpokládejme na chvilku, že σ 2 je známo. Pak za platnosti hypotézy platí (viz tvrzení 2.28) √ X n − µ0 n ∼ N(0, 1). σ Za testovou statistiku tedy vezmeme Tn =
√ X n − µ0 n . σ
90
Testování střední hodnoty • Platí-li nulová hypotéza, X n bude blízko µ0 a testová statistika bude (v absolutní hodnotě) malá. • Jestliže nulová hypotéza neplatí, pak bude větší vzdálenost mezi X n a µ0 a testová statistika bude v absolutní hodnotě velká. Proto hypotézu H0 : µ = µ0 zamítneme, když Tn padne daleko od 0 jedním nebo druhým směrem. Testování střední hodnoty Kritický obor stanovíme takto: H0 budeme zamítat právě když √ X n − µ0 n > z1−α/2 , σ kde z1−α/2 je kvantil rozdělení N(0, 1).
Zvolíme-li hladinu α = 0.05 dostaneme z1−α/2 = z0.975 = 1.96. (Viz tabulka 2.2.) Volbě kritického oboru se budeme podrobněji věnovat v příští kapitole. Testování střední hodnoty • Dosavadní postup předpokládá znalost rozptylu pozorování σ 2 . To není v praxi reálný předpoklad. Můžeme získat test bez znalosti σ 2 ? • Logická strategie je nahradit neznámý rozptyl σ 2 jeho nestranným a konsistentním odhadem, výběrovým rozptylem Sn2 . • Dostaneme tak testovou statistiku Tn =
√ X n − µ0 n , Sn
která už ovšem nemá za hypotézy normované normální rozdělení. t-rozdělení Tvrzení 3.16. Nechť X1 , . . . , Xn je náhodný výběr z rozdělení N(µ, σ 2 ). Nechť platí hypotéza H0 : µ = µ0 . Pak statistika Tn =
√ X n − µ0 n , Sn
má takzvané t-rozdělení o n − 1 stupních volnosti, které značíme tn−1 . Poznámka. Hustota rozdělení tk má pro velké k tvar velmi podobný normovanému normálnímu rozdělení. Pro malé k má ovšem větší rozptyl než 1 a její kritické hodnoty jsou vzdálenější od 0. Kvantily t-rozdělení Vybrané kvantily rozdělení tk jsou uvedeny v tabulce 3.3.
91
Tabulka 3.3: Vybrané kvantily rozdělení tk .
k 5 10 20 50 100 N(0, 1)
0.9 1.476 1.372 1.325 1.299 1.290 1.282
0.95 2.015 1.812 1.725 1.676 1.660 1.645
α 0.975 2.571 2.228 2.086 2.009 1.984 1.960
0.99 3.365 2.764 2.528 2.403 2.364 2.326
0.995 4.032 3.169 2.845 2.678 2.626 2.576
Jednovýběrový t-test: shrnutí Máme náhodný výběr X1 , . . . , Xn z rozdělení N(µ, σ 2 ). Chceme otestovat hypotézu H0 : µ = µ0 proti alternativě H1 : µ 6= µ0 . Testová statistika je
Tn =
√ X n − µ0 n , Sn
Test daný kritickým oborem H0 zamítáme právě když |Tn | > tn−1 1 −
α , 2
kde tn−1 (1 − α2 ) je (1 − α2 )-kvantil rozdělení tn−1 , nazýváme jednovýběrový t-test. Tento test má hladinu α. Jednovýběrový t-test Poznámka. Nechť pozorování X1 , . . . , Xn nepocházejí z normálního rozdělení, ale z nějakého jiného rozdělení se střední hodnotou µ a konečným rozptylem. Pak jednovýběrový t-test hypotézy H0 : µ = µ0 proti alternativě H1 : µ 6= µ0 má hladinu α alespoň asymptoticky (při velkém počtu pozorování n). Jednovýběrový t-test tedy můžeme použít i k testování střední hodnoty nenormálních dat, pokud je pozorování dostatečně mnoho (řekněme alespoň 50). Jednovýběrový t-test – příklad Příklad (Výška). Je střední výška studentů 1. ročníku PřF rovna 180 cm? Je střední výška studentek 1. ročníku PřF rovna 167 cm? Obě otázky zodpovíme jednovýběrovým t-testem. Spočítáme t-statistiku a porovnáme ji s příslušnou kritickou hodnotou t-rozdělení. Budeme testovat na hladině α = 0.05. Jednovýběrový t-test – příklad Muži:
92
Počet pozorování Průměr Hyp. hodnota Výběrová směr. odchylka Testová statistika Kritická hodnota
n Xn µ0 Sn Tn t43 (0.975)
44 183.20 180 6.90
√ 183.2−180 44 6.90 = 3.08 2.017
Jelikož |Tn | = 3.08 > t43 (0.975) = 2.017 zamítáme hypotézu H0 : µ = 180 ve prospěch alternativy H1 : µ 6= 180. Je tedy statisticky prokazatelné, že střední výška studentů je vyšší než 180 cm. Jednovýběrový t-test – příklad Ženy: Počet pozorování Průměr Hyp. hodnota Výběrová směr. odchylka Testová statistika Kritická hodnota
n Xn µ0 Sn Tn t85 (0.975)
√
86 167.36 167 6.35 86 167.36−167 = 0.53 6.35 1.988
Jelikož |Tn | = 0.53 < t85 (0.975) = 1.988 nemůžeme zamítnout hypotézu H0 : µ = 167. Střední výška studentek je buď rovna 167 cm anebo se od této hodnoty neliší dost na to, aby náš náhodný výběr neplatnost hypotézy prokázal.
3.6 Stanovení kritického oboru testu Požadavky na testovou statistiku Zvolíme-li testovou statistiku Tn , musíme nalézt kritický obor C tak, aby test měl hladinu α, to jest aby za platnosti hypotézy byla splněna rovnost P [Tn ∈ C] = α. nebo aspoň P [Tn ∈ C] → α při n → ∞.
Z toho plyne, že testová statistika nesmí záviset na neznámých konstantách a její rozdělení za platnosti hypotézy musí být známo aspoň asymptoticky (abychom dokázali spočítat P [Tn ∈ C]). Tvar kritického oboru U Kritický obor je většinou dán buď dvěma konstantami cL α < 0 a cα > 0 a nabývá tvaru U (−∞, cL α )∪ (cα , ∞) anebo je dán jedinou konstantou cα > 0 a má tvar (cα , ∞). V prvním případě zamítáme hypotézu, pokud
Tn < cL α
anebo Tn > cU α,
93
Zde končí přednáška 10, 3. 5.
to jest, pokud je testová statistika buď příliš malá anebo příliš velká. Ve druhém případě zamítáme hypotézu, pokud Tn > cα , to jest pouze tehdy, pokud je testová statistika příliš velká. U Konstanty cL α , cα a cα v této souvislosti nazýváme kritické hodnoty.
Nalezení kritických hodnot Představme si, že testujeme hypotézu H0 proti alternativě H1 s použitím testové statistiky Tn , která má za platnosti hypotézy známé rozdělení s distribuční funkcí F . Jak určit kritické hodnoty pro zamítání hypotézy tak, aby test měl požadovanou hladinu α? Pokud zamítáme jen pro příliš velké hodnoty Tn , musíme najít cα tak, aby platilo P [Tn > cα ] = α. To je ekvivalentní požadavku P [Tn ≤ cα ] ≡ F (cα ) = 1 − α,
tj. cα = F −1 (1 − α).
Kritická hodnota cα je tedy rovna (1 − α)-kvantilu rozdělení F testové statistiky Tn za platnosti hypotézy. Nalezení kritických hodnot Grafické znázornění kritické hodnoty a kritického oboru pro zamítání H0 pro příliš velké hodnoty Tn je ilustrováno obrázkem 3.10. Nahoře je zakreslena kritická hodnota cα na grafu distribuční funkce F testové statistiky Tn za platnosti hypotézy H0 . Dole je zakreslena kritická hodnota cα na grafu hustoty f testové statistiky Tn za platnosti H0 . Výsledný test bude mít hladinu α. Nalezení kritických hodnot Nyní se zabývejme nalezením kritických hodnot v situaci, kdy zamítáme pro příliš malé U anebo příliš velké hodnoty Tn . Musíme najít konstanty cL α a cα tak, aby platilo U L U P [Tn < cL α ∪ Tn > cα ] = P [Tn < cα ] + P [Tn > cα ] = α.
Nejlépe je volit oba sčítance stejné, tj. zajistit U P [Tn < cL α ] = P [Tn > cα ] =
α . 2
Dolní kritická hodnota cL α pak musí splňovat (pro spojité rozdělení Tn ) α L −1 α P [Tn ≤ cL , tj. cL . α =F α ] ≡ F (cα ) = 2 2
94
Obrázek 3.10: Kritická hodnota cα pro zamítání H0 pro příliš velké hodnoty Tn .
1
F(t)
1−α
0 cα
0
Kriticky obor
f(t)
t
P=1−α P=α 0
cα
Kriticky obor
t
Nalezení kritických hodnot Pro horní kritickou hodnotu cU α musí platit U P [Tn > cU α ] ≡ 1 − F (cα ) =
α , 2
H0 tedy zamítáme pokud
α anebo Tn > F −1 1 − . 2 2 Pokud je rozdělení Tn symetrické okolo 0, pak F −1 α2 = −F −1 1 − zamítáme právě když α |Tn | > F −1 1 − . 2 buď Tn < F −1
α
α −1 tj. cU 1− . α =F 2
Nalezení kritických hodnot
95
α 2
a hypotézu
U Obrázek 3.11: Kritické hodnoty cL α a cα pro zamítání H0 pro příliš malé anebo příliš velké hodnoty Tn .
2
F(t)
1−
1 α
α 2 0 Kriticky obor
cLα
0
cUα
Kriticky obor
f(t)
t
P=
α 2
Kriticky obor
P=
P=1−α
cLα
0
cUα
α 2
Kriticky obor
t
Grafické znázornění kritické hodnoty a kritického oboru pro zamítání H0 pro příliš malé anebo příliš velké hodnoty Tn je ilustrováno obrázkem 3.11. Nahoře jsou zakresleny U kritické hodnoty cL α a cα na grafu distribuční funkce F testové statistiky Tn za platnosti hypotézy H0 . Dole jsou zakresleny tytéž kritické hodnoty na grafu hustoty f testové statistiky Tn za platnosti H0 . Výsledný test bude mít hladinu α. Poznatky o kritických hodnotách si shrneme v následující větě: Nalezení kritických hodnot Věta 3.17. 1. Pokud má kritický obor testu tvar C = {Tn > cα }, pak kritická hodnota cα zaručující kladinu testu α ∈ (0, 1) je dána výrazem cα = F −1 (1 − α), kde F −1 (1 − α) je (1 − α)-kvantil rozdělení Tn za platnosti H0 .
96
U 2. Pokud má kritický obor testu tvar C = {Tn < cL α } ∪ {Tn > cα }, pak kritické U hodnoty cL α a cα zaručující kladinu testu α ∈ (0, 1) jsou dány výrazy −1 cL α =F
α 2
−1 a cU 1− α =F
kde F −1 (α) je α-kvantil rozdělení Tn za platnosti H0 .
α , 2
3.7 Párový t-test Problém • Nyní uvažujme dvě veličiny měřené na každé experimentální jednotce v rámci jednoho náhodného výběru. Příklad: věk otce a věk matky určitého studenta. • Chceme vědět, zda mají tyto dvě veličiny stejnou střední hodnotu. Příklad: jsou otcové a matky v průměru stejně staří, nebo je v jejich věku systematický rozdíl? Xn 1 • Matematický zápis pozorovaných dat: Máme náhodný výběr dvojic X , . . . , Y1 Yn z dvourozměrného rozdělení. Příklad: Xi je věk otce i-tého studenta, Yi je věk matky i-tého studenta, n je počet studentů. • Matematický zápis otázky, která nás zajímá: Označme µX = E Xi , µY = E Yi . Chceme otestovat hypotézu H0 : µX = µY proti alternativě H1 : µX 6= µY . Příklad: µX je střední věk otce, µY je střední věk matky. Věk otce vs. věk matky – průzkumová analýza Obrázek 3.12 ukazuje krabicové diagramy věku otce a věku matky. Vidíme, že rozmezí věku otců i matek jsou široká, ale zdá se, že rozdělení věku otců dává vyšší hodnoty, neboť výběrový medián (tlustá čára) i výběrové kvartily (hrany krabice) jsou výše než u matek. Věk otce vs. věk matky – průzkumová analýza • Pracujeme na datech pro n = 130 studentů z let 2006 – 2008, kteří nám řekli věk otce i věk matky. • Spočítejme si odhady střední hodnoty věku otce a věku matky (aritmetické průVěk otce X n = 49.1 měry). Máme Věk matky Y n = 46.8 • Průměr u otců je o více než 2 roky vyšší než u matek. Znamená to, že otcové jsou prokazatelně starší? Nevíme. Musíme provést formální test. Párový t-test K otestování hypotézy H0 : µX = µY proti alternativě H1 : µX 6= µY lze v této situaci uplatnit párový t-test. • Definujeme Zi = Xi −Yi , i = 1, . . . , n (rozdíly mezi oběma veličinami pozorovanými na téže jednotce)
97
Obrázek 3.12: Krabicový diagram věku otce a věku matky.
65 60 55 50 45 40 Vek otce
Vek matky
• H0 platí, právě když je splněna hypotéza H0∗ : µZ = 0 pro µZ ≡ E Zi = µX − µY .
• Stačí tedy otestovat, že rozdíly Zi mají nulovou střední hodnotu. Tento problém řeší jednovýběrový t-test. Provedeme tedy jednovýběrový t-test na rozdíly Zi = Xi − Yi . Párový t-test: shrnutí • Spočítáme Zi = Xi − Yi
P • Odhadneme střední hodnotu E Zi ≡ µZ pomocí průměrného rozdílu Z n = n1 ni=1 (Xi − Yi ) = Xn − Y n . q 1 Pn 2 • Odhadneme směrodatnou odchylku Zi pomocí SZ2 , kde SZ2 = n−1 i=1 (Zi −Z n ) je odhad rozptylu Zi . • Spočítáme testovou statistiku
Tn∗ =
√ Zn nq , SZ2
Párový t-test: shrnutí • Kritický obor párového t-testu je H0 : µX = µY zamítáme právě když |Tn∗ | > tn−1 1 −
98
α , 2
kde tn−1 (1 − α2 ) je (1 − α2 )-kvantil rozdělení tn−1 .
• Tento test dodržuje požadovanou hladinu α, pokud buď (i) rozdíly Zi mají normální rozdělení anebo (ii) počet pozorovaných dvojic n je dost velký (mělo by určitě stačit n > 50). • Párový t-test může dávat nesprávné výsledky, je-li počet pozorování malý a přitom rozdělení rozdílů Zi je daleko od normálního. Párový t-test: obecnější hypotéza Párovým t-testem můžeme samozřejmě také otestovat, zda rozdíl ve středních hodnotách Xi a Yi nabývá nějaké určité nenulové hodnoty δ (např., že střední věk otců je o dva roky vyšší než matek). Pak se postupuje následovně: • H 0 : µX − µY = δ • Testová statistika: Tn∗ =
√ Zn − δ n q SZ2
• H0 zamítáme, právě když |Tn∗ | > tn−1 1 − Věk otce vs. věk matky – řešení
α 2
.
• Testujeme hypotézu, že střední hodnoty věku otce a věku matky jsou stejné, tj. H 0 : µX = µY . • Spočítáme testovou statistiku párového t-testu: Počet pozorování Průměry
n Xn Yn Zn SZ Tn∗ t129 (0.975)
Výb. směr. odchylka Zi Testová statistika Kritická hodnota
130 49.1 46.8 2.28 3.79 √ 130 2.28 3.79 = 6.88 1.979
Věk otce vs. věk matky – řešení • Výsledek: |Tn∗ | = 6.88 > t129 (0.975) = 1.979 ⇒ zamítáme hypotézu H0 : µX = µY . • Závěr: Prokázali jsme, že střední věk otců je vyšší než střední věk matek. Věk otce vs. věk matky 2 – řešení • Nyní otestujeme hypotézu, že střední hodnota věku otce je přesně o dva roky vyšší než střední hodnota věku matky, tj. H0 : µX − µY = 2. • Spočítáme testovou statistiku párového t-testu:
99
Počet pozorování Průměry
Výb. směr. odchylka Zi Testová statistika Kritická hodnota
n Xn Yn Zn SZ Tn∗ t129 (0.975)
√
130 49.1 46.8 2.28 3.79 130 2.28−2 3.79 = 0.86 1.979
Věk otce vs. věk matky 2 – řešení • Výsledek: |Tn∗ | = 0.86 < t129 (0.975) = 1.979 ⇒ nemůžeme zamítnout hypotézu H0 : µX − µY = 2.
• Závěr: Střední věk otců je buď přesně o dva roky vyšší než střední věk matek anebo je rozdíl středního věku tak blízko 2 rokům, že odchylku od 2 let na základě nasbíraných dat nedokážeme rozpoznat.
3.8 Dvouvýběrový t-test Problém • Nyní uvažujme jednu veličinu měřenou na dvou nezávislých náhodných výběrech nebo na dvou skupinách v rámci jednoho náhodného výběru. Příklad 1: výška studentů v roce 2006 a v roce 2007. Příklad 2: hmotnost studentů a studentek. • Chceme vědět, zda mají tyto dvě veličiny stejnou střední hodnotu. Příklad 1: Jsou studenti (a studentky) v roce 2006 stejně vysocí jako v roce 2007, nebo je v jejich výšce rozdíl, který se projevuje ve střední hodnotě? Příklad 2: Jsou studenti stejně těžcí jako studentky nebo je v jejich hmotnosti rozdíl, který se projevuje ve střední hodnotě? Problém • Matematický zápis pozorovaných dat: Máme dva nezávislé náhodné výběry ze dvou různých rozdělení: jeden označíme X1 , . . . , Xm , druhý Y1 , . . . , Yn . Rozsah prvního výběru m a rozsah druhého výběru n mohou ale nemusí být totožné. Příklad 1: X1 , . . . , Xm jsou výšky studentů, kteří si zapsali přednášku v roce 2006, m je jejich počet; Y1 , . . . , Yn jsou výšky studentů, kteří si zapsali přednášku v roce 2007, n je jejich počet. Nezávislost obou výběrů platí, pokud žádný propadlík neudal svou výšku v obou rocích. Příklad 2: X1 , . . . , Xm jsou hmotnosti všech studentů, m je jejich počet; Y1 , . . . , Yn jsou hmotnosti všech studentek, n je jejich počet. Problém • Matematický zápis otázky, která nás zajímá: Označme µX = E Xi , µY = E Yi . Chceme otestovat hypotézu H0 : µX = µY proti alternativě H1 : µX 6= µY .
100
Obrázek 3.13: Krabicový diagram výšky v roce 2006 a 2007.
200 190 180 170 160 150 2006
2007
Příklad 1: µX je střední výška studenta či studentky zapsaných v roce 2006, µY je střední výška studenta či studentky zapsaných v roce 2007. Příklad 2: µX je střední hmotnost studenta, µY je střední hmotnost studentky. Výška v roce 2006 a 2007 – průzkumová analýza Obrázek 3.13 ukazuje krabicové diagramy výšky studentů (a studentek) v roce 2006 a 2007. Vidíme, že krabice pro rok 2007 je trochu širší (to naznačuje větší rozptyl), ale poloha středů krabic je skoro stejná. Nezdá se, že by se střední výška v obou letech lišila. Výška v roce 2006 a 2007 – průzkumová analýza • Počet pozorování výšek je m = 47 pro rok 2006 a n = 42 pro rok 2007. • Spočítejme si odhady střední hodnoty výšky (aritmetické průměry) pro každý rok Výška 2006 X m = 172.0 cm zvlášť. Máme Výška 2007 Y n = 173.4 cm • Studenti z roku 2007 jsou v průměru o 1.4 cm vyšší než studenti z roku 2006. Znamená to, že výška se během roku změnila? Nevíme. Musíme provést formální test. Hmotnost studentů a studentek – průzkumová analýza Obrázek 3.14 ukazuje krabicové diagramy hmotnosti studentů a studentek. Vidíme, že
101
Obrázek 3.14: Krabicový diagram hmotnosti studentů a studentek.
100 90 80 70 60 50
Zeny
Muzi
krabice pro studenty je o hodně výše. Vypadá to, že studenti jsou v průměru těžší než studentky. Hmotnost studentů a studentek – průzkumová analýza • Počet pozorování hmotností je m = 86 pro studentky a n = 44 pro studenty. • Spočítejme si odhady střední hodnoty výšky (aritmetické průměry) pro každé poHmotnost studentky X m = 58.2 kg hlaví zvlášť. Máme Hmotnost studenti Y n = 76.7 kg • Studenti jsou v průměru o 18.5 kg těžší než studentky. Mohl tak velký rozdíl vzniknout náhodou? Nevíme. Musíme provést formální test. Dvouvýběrový t-test: předpoklady K otestování hypotézy o rovnosti středních hodnot dvou nezávislých výběrů lze použít dvouvýběrový t-test. • Máme dva nezávislé náhodné výběry: X1 , . . . , Xm se střední hodnotou E Xi = µX a Y1 , . . . , Yn se střední hodnotou E Yi = µY . • Předpokládáme, že pozorování v obou výběrech mají totožný rozptyl σ 2 , tj. var Xi = var Yi = σ 2 . Dvouvýběrový t-test: odvození
102
Testová statistika: • Kdyby oba výběry měly stejnou střední hodnotu, průměry X m a Y n by byly blízko sebe. • Příliš velký rozdíl mezi průměry by měl vést k zamítnutí hypotézy. • Testová statistika pro dvouvýběrový test bere v úvahu rozdíl mezi průměry, ale také rozsahy obou výběrů a rozptyl jednotlivých pozorování. Konkrétně vypadá takto: r mn X m − Y n Tm,n = , m + n Sm,n 2 kde Sm,n je odhad rozptylu σ 2 jednoho pozorování spočítaný z obou výběrů.
Dvouvýběrový t-test: odvození Společný odhad rozptylu: • Jak odhadnout společný rozptyl obou výběrů? Umíme odhadnout σ 2 z každého výběru zvlášť pomocí výběrových rozptylů m
2 SX =
1 X (Xi − X m )2 m−1 i=1
a
n
SY2
1 X = (Yi − Y n )2 n−1 i=1
• Tyto odhady odhadují tentýž parametr z různých dat. Potřebujeme z nich vyrobit jeden odhad, ale vzít přitom v úvahu rozdíly v rozsazích výběru m a n. Dvouvýběrový t-test: odvození Společný odhad rozptylu: • Vezmeme tedy vážený průměr obou odhadů rozptylu, kde dáme větší váhu na výběr s větším rozsahem. 2 Sm,n =
1 2 (m − 1)SX + (n − 1)SY2 m+n−2
Dvouvýběrový t-test: testová statistika Definice 3.18. Testová statistika dvouvýběrového t-testu jest r mn X m − Y n Tm,n = , m + n Sm,n kde 2 Sm,n =
1 2 (m − 1)SX + (n − 1)SY2 m+n−2
103
Dvouvýběrový t-test: rozdělení Tm,n Věta 3.19. Jestliže X1 , . . . , Xm ∼ N(µX , σ 2 ) a Y1 , . . . , Yn ∼ N(µY , σ 2 ) jsou nezávislé náhodné výběry, pak náhodná veličina r mn X m − Y n − (µX − µY ) , T = m+n Sm,n 2 kde Sm,n je zavedeno v definici 3.18,
má rozdělení tm+n−2 , tj. t-rozdělení s m + n − 2 stupni volnosti. Dvouvýběrový t-test: kritické hodnoty Z předchozí věty plyne, že pokud mají pozorování normální rozdělení se stejnými rozptyly a pokud platí hypotéza H0 : µX = µY , pak testová statistika Tm,n má rozdělení tm+n−2 . Kritický obor dvouvýběrového t-testu je H0 : µX = µY zamítáme právě když |Tm,n | > tm+n−2 1 − kde tm+n−2 (1 − α2 ) je (1 − α2 )-kvantil rozdělení tm+n−2 .
α , 2
Dvouvýběrový t-test: rozdělení Tm,n Z centrální limitní věty lze dokázat následující výsledek, který lze aplikovat pro data z jiných rozdělení než normálního: Věta 3.20. Jestliže X1 , . . . , Xm a Y1 , . . . , Yn jsou nezávislé náhodné výběry ze dvou rozdělení takových, že var Xi = var Yi = σ 2 pak náhodná veličina r mn X m − Y n − (µX − µY ) , T = m+n Sm,n má pro m, n → ∞ přibližně normované normální rozdělení N(0, 1). Dvouvýběrový t-test: kritické hodnoty • Z předchozí věty plyne, že pokud mají pozorování libovolné rozdělení se stejnými rozptyly a pokud platí hypotéza H0 : µX = µY , pak testová statistika Tm,n má pro velké m i n přibližně rozdělení N(0, 1). • Jelikož hustota tm+n−2 a hustota N(0, 1) jsou pro velké m a n hodně podobné, můžeme používat kritické hodnoty z t rozdělení i pro nenormální data, pokud jsou rozsahy výběrů velké (řekněme m > 30 a n > 30). Dvouvýběrový t-test: shrnutí Dvouvýběrový t-test dodržuje požadovanou hladinu α, pokud jsou splněny následující dvě podmínky: • Buď (i) veličiny Xi a Yi mají normální rozdělení anebo (ii) rozsahy výběru m a n jsou dost velké.
104
• Rozptyly obou výběrů jsou přibližně stejné. Dvouvýběrový t-test může dávat nesprávné výsledky, je-li počet pozorování malý a přitom rozdělení veličin je daleko od normálního, anebo jsou-li rozptyly obou výběrů velmi odlišné. Dvouvýběrový t-test: obecnější hypotéza Poznámka. Dvouvýběrovým t-testem můžeme také otestovat jiný než nulový rozdíl mezi středními hodnotami obou výběrů. Například pro hypotézu H0 : µX − µY = δ použijeme testovou statistiku r mn X m − Y n − δ Tm,n = . m+n Sm,n H0 zamítneme, pokud |Tm,n | > tm+n−2 1 − α2 .
Dvouvýběrový t-test: nestejné rozptyly
Poznámka. Existují modifikace dvouvýběrového t-testu pro porovnání středních hodnot výběrů s nestejnými rozptyly. Testové statistiky těchto testů již nemají rozdělení tm+n−2 , ale mají pro velké rozsahy výběrů stále přibližně normované normální rozdělení. K disposici jsou i aproximace pomocí t rozdělení s počtem stupňů volnosti, který se vypočte z dat. Tyto testy mají různé názvy (dvouvýběrový z-test, Welchův test, . . . ). Výška studentů v roce 2006 a 2007 – řešení • Testujeme hypotézu, že střední hodnoty výšky studentů a studentek jsou stejné v roce 2006 a 2007, tj. H0 : µX = µY . • Spočítáme testovou statistiku dvouvýběrového t-testu: Počet pozorování Průměry Společ. odhad σ 2
m, n Xm Yn 2 Sm,n
Testová statistika Kritická hodnota
Tm,n t87 (0.975)
q
47, 42 172.04 cm 173.38 cm 105.9 cm2 47·42 −1.34 89 10.29
= −0.61 1.988
Výška studentů v roce 2006 a 2007 – řešení • Výsledek: |Tm,n | = 0.61 < t87 (0.975) = 1.988 ⇒ nemůžeme zamítnout hypotézu H 0 : µX = µY . • Závěr: Nemůžeme prokázat, že střední výška studentů v roce 2006 a 2007 se liší. Rozdíl v průměrných výškách mohl vzniknout náhodou. Hmotnost studentů a studentek – řešení • Testujeme hypotézu, že střední hodnoty hmotnosti studentů a studentek jsou stejné, tj. H0 : µX = µY .
105
• Spočítáme testovou statistiku dvouvýběrového t-testu: Počet pozorování Průměry Společ. odhad σ 2
m, n Xm Yn 2 Sm,n
Testová statistika Kritická hodnota
Tm,n t128 (0.975)
q
86, 44 58.2 kg 76.7 kg 67.8 kg2 86·44 −18.49 130 8.23
= −12.1 1.979
Hmotnost studentů a studentek – řešení • Výsledek: |Tm,n | = 12.1 > t128 (0.975) = 1.979 ⇒ zamítáme hypotézu H0 : µX = µY . • Závěr: Prokázali jsme, že hmotnost studentů a studentek se liší ve střední hodnotě.
Zde končí přednáška 11, 10. 5.
3.9 Interval spolehlivosti Přesnost bodového odhadu Máme náhodný výběr X1 , . . . , Xn veličin s distribuční funkcí F . Představme si, že z pozorování X1 , . . . , Xn chceme odhadnout nějakou charakteristiku θ jejich rozdělení, například střední hodnotu. Víme, že výběrový průměr
n
Xn =
1X Xi n i=1
je nestranným a konsistentním odhadem hledané střední hodnoty. Ta ovšem není rovna výběrovému průměru, ale leží někde „blízkoÿ. Otázka je, jak získat nějakou lepší představu o přesnosti výběrového průměru jakožto odhadu neznámé střední hodnoty. Intervalový odhad Místo jednoho bodového odhadu se můžeme pokusit najít interval, který nám řekne, v jakém rozmezí se hledaný parametr může nacházet. Interval spočítáme z pozorovaných dat. Jeho krajní body tudíž musí být náhodné. Sestavíme ho tak, aby pokrýval neznámou hodnotu θ s dostatečně velkou pravděpodobností. Interval spolehlivosti: definice Máme náhodný výběr X1 , . . . , Xn veličin s distribuční funkcí F a chceme odhadnout neznámý parametr θ. Zvolme si pravděpodobnost pokrytí 1 − α skutečného parametru θ intervalem.
Definice 3.21. Náhodný interval (CL , CU ) (kde CL < CU jsou náhodné veličiny spočítané z výběru X1 , . . . , Xn ) nazýváme intervalem spolehlivosti pro parametr θ právě když platí P [(CL , CU ) ∋ θ] = P [CL < θ, CU > θ] = 1 − α.
106
Interval spolehlivosti: definice Poznámka. Pravděpodobnost pokrytí se většinou bere 0.95, tj. α = 0.05. Poznámka. Interval spolehlivosti s pravděpodobností pokrytí 1−α můžeme též nazývat 100(1 − α)-procentním intervalem spolehlivosti (tj. pro α = 0.05 mluvíme o 95%-ním intervalu). Poznámka. Používají se i jiné ekvivalentní názvy pro interval spolehlivosti: konfidenční interval pro θ nebo intervalový odhad θ. Interval spolehlivosti: interpretace • Interval spolehlivosti nám dává rozmezí, které s požadovanou jistotou obsahuje hledaný parametr. • Spočítáme-li velké množství 95%-ních intervalů spolehlivosti, pak zhruba 95 % z nich bude obsahovat hledaný parametr a zbývajících 5 % nikoli. Interval spolehlivosti pro střední hodnotu: odvození Ukažme si nyní, jak odvodit interval spolehlivosti pro střední hodnotu náhodného výběru. Nejprve uvažujme pozorování X1 , . . . , Xn z normálního rozdělení N(µ, σ 2 ) s neznámým rozptylem σ 2 . Potřebujeme interval spolehlivosti pro parametr µ. Odvození musíme začít od bodového odhadu hledaného parametru. Tím je aritmetický průměr X n . Dále potřebujeme najít nějakou náhodnou veličinu, která závisí na průměru X n a skutečné hodnotě parametru µ, a přitom její rozdělení je známo (aspoň přibližně). Interval spolehlivosti pro střední hodnotu: odvození Nabízí se náhodná veličina Tn =
√ Xn − µ n , Sn
která má podle tvrzení 3.16 t-rozdělení o n − 1 stupních volnosti, pokud µ je skutečná střední hodnota pozorovaných veličin. (Sn je odmocnina z výběrového rozptylu.) Víme tedy, že
α α < Tn < tn−1 1 − = 1 − α, P tn−1 2 2 kde tn−1 α2 a tn−1 1 − α2 jsou po řadě α2 -tý a 1 − α2 -tý kvantil rozdělení t s n − 1 stupni volnosti. (Viz též věta 3.17 a obrázek 3.11.) Interval spolehlivosti pro střední hodnotu: odvození
107
Ze symetrie rozdělení t máme tn−1 α2 = −tn−1 1 − α2 . Proto můžeme psát α √ Xn − µ α 1 − α = P −tn−1 1 − < n < tn−1 1 − = 2 Sn 2 α Sn α Sn √ √ = P −tn−1 1 − < X n − µ < tn−1 1 − = 2 n 2 n α Sn α Sn √ < µ − X n < tn−1 1 − √ = P −tn−1 1 − = 2 n 2 n α Sn α Sn √ < µ < X n + tn−1 1 − √ . = P X n − tn−1 1 − 2 2 n n | {z } | {z } CL CU Interval spolehlivosti pro střední hodnotu: odvození 100(1 − α)-procentní interval spolehlivosti pro střední hodnotu má tedy krajní body X n ± tn−1 1 −
α Sn √ . 2 n
Tento interval jsme odvodili pro normálně rozdělená pozorování. Pokud veličiny X1 , . . . , Xn nemají normální rozdělení, platí α Sn α Sn √ < µ < X n + tn−1 1 − √ P X n − tn−1 1 − → 1−α 2 n 2 n
a náš interval spolehlivosti je tedy pouze přibližný. Jeho pokrytí bude blízko 1−α, pokud je počet pozorování dostatečně velký (n > 50). Interval spolehlivosti pro střední hodnotu: shrnutí Shrňme si právě odvozený výsledek do formálního tvrzení: Věta 3.22. Nechť X1 , . . . , Xn je náhodný výběr veličin se střední hodnotou µ. Pak interval s krajními body α Sn √ X n ± tn−1 1 − 2 n
je 100(1 − α)-procentní interval spolehlivosti pro střední hodnotu µ. Jsou-li pozorování normálně rozdělená, je tento interval přesný, jinak je pouze přibližný (jeho pokrytí se blíží 1 − α pro rostoucí počet pozorování). Vlastnosti intervalu spolehlivosti Délka intervalu spolehlivosti pro střední hodnotu je rovna 2tn−1 1 −
α Sn √ . 2 n
Závisí tedy na pravděpodobnosti pokrytí α, počtu pozorování n a rozptylu pozorování var Xi (skrze jeho odhad Sn2 ).
108
Obrázek 3.15: Pokrytí 95%-ních intervalů spolehlivosti pro střední hodnotu normálního rozdělení. Rozsah výběru n = 50.
4.5
Odhadnuta stredni hodnota
4.0
3.5
3.0
2.5
2.0
1.5
• Čím vyšší je požadovaná pravděpodobnost pokrytí, tím delší je interval. • Čím více pozorování, tím kratší interval. • Čím větší rozptyl pozorování, tím delší interval. Tyto vlastnosti platí pro intervaly spolehlivosti obecně (nejen pro tento konkrétní). Studie intervalů spolehlivosti Pro lepší představu o chování intervalu spolehlivosti provedeme následující studii: • Vezmeme n = 50(200) pozorování z normálního rozdělení N(3, 4). Jeho skutečná střední hodnota je µ = 3. • Spočítáme 95%-ní interval spolehlivosti pro střední hodnotu podle věty 3.22. • Vše zopakujeme 100-krát a zakreslíme do grafu. Co uvidíme? Studie intervalů spolehlivosti Obrázek 3.15 ukazuje odhadnuté střední hodnoty 100 výběrů z rozdělení N(3, 4) o rozsahu n = 50 (malé kroužky) a k nim přidružené intervaly spolehlivosti (svislé úsečky). Intervaly, které nepokryly skutečnou střední hodnotu (vyznačenou vodorovnou přerušovanou čarou), jsou nakresleny červeně. V tomto případě 4 ze 100 intervalů nepokryly skutečnou střední hodnotu.
109
Obrázek 3.16: Pokrytí 95%-ních intervalů spolehlivosti pro střední hodnotu normálního rozdělení. Rozsah výběru n = 200.
4.5
Odhadnuta stredni hodnota
4.0
3.5
3.0
2.5
2.0
1.5
Studie intervalů spolehlivosti Obrázek 3.16 ukazuje odhadnuté střední hodnoty 100 výběrů z rozdělení N(3, 4) o rozsahu n = 200 (malé kroužky) a k nim přidružené intervaly spolehlivosti (svislé úsečky). Intervaly, které nepokryly skutečnou střední hodnotu (vyznačenou vodorovnou přerušovanou čarou), jsou nakresleny červeně. Intervaly se proti obrázku 3.15 zúžily, neboť počet pozorování je vyšší. V tomto případě 7 ze 100 intervalů nepokrylo skutečnou střední hodnotu. Vzájemný vztah testování a intervalů spolehlivosti Mezi metodami pro testování hypotéz a sestavování intervalů spolehlivosti je blízký vztah. Za prvé, interval spolehlivosti můžeme využít k testování hypotéz: Tvrzení 3.23. Nechť je dán interval spolehlivosti (CL , CU ) pro nějaký parametr θ s pravděpodobností pokrytí 1 − α. Uvažujme test hypotézy H0 : θ = θ0 proti alternativě H1 : θ 6= θ0 daný pravidlem hypotézu zamítneme právě když interval (CL , CU ) nepokrývá hodnotu θ0 .
Tento test má hladinu α.
Vzájemný vztah testování a intervalů spolehlivosti
110
Za druhé, test hypotézy můžeme použít k vytvoření intervalu spolehlivosti: Tvrzení 3.24. Nechť je dán test hypotézy H0 : θ = θ0 proti alternativě H1 : θ 6= θ0 na hladině α. Uvažujme interval (CL , CU ) obsahující všechny hodnoty θ0 takové, že daný test při daném datovém souboru nezamítá hypotézu H0 : θ = θ0 . Pak (CL , CU ) je interval spolehlivosti pro parametr θ s pravděpodobností pokrytí 1 − α. Příklad: výška Spočítejme 95%-ní intervaly spolehlivosti pro střední výšku mužů a žen. Muži Počet pozorování Průměr Výběrová směr. odchylka Kvantil Dolní mez intervalu
n Xn Sn t43 (0.975) CL
Horní mez intervalu
CU
44 183.20 cm 6.90 cm 2.017 6.90 183.20 − 2.017 √ 44 = 181.1 cm 6.90 183.20 + 2.017 √ 44 = 185.3 cm
Skutečná střední výška studenta je pokryta intervalem (181.1, 185.3) s pravděpodobností 95%. Příklad: výška Spočítejme 95%-ní intervaly spolehlivosti pro střední výšku mužů a žen. Ženy Počet pozorování Průměr Výběrová směr. odchylka Kvantil Dolní mez intervalu
n Xn Sn t85 (0.975) CL
Horní mez intervalu
CU
86 167.36 cm 6.35 cm 1.988 6.35 167.36 − 1.988 √ 86 = 166.0 cm 6.35 167.36 + 1.988 √ 86 = 168.7 cm
Skutečná střední výška studentky je pokryta intervalem (166.0, 168.7) s pravděpodobností 95%. Interval spolehlivosti pro rozdíl středních hodnot: párový případ • Nyní uvažujme dvě veličiny měřené na každé experimentální jednotce v rámci jednoho náhodného výběru. Příklad: věk otce a matky jednoho studenta. • Chceme vědět, jak se liší střední hodnoty těchto veličin. Příklad: jaký je rozdíl ve středním věku otců a matek?
111
Xn 1 • Matematický zápis pozorovaných dat: Máme náhodný výběr dvojic X Y1 , . . . , Yn z dvourozměrného rozdělení. Příklad: Xi je věk otce i-tého studenta, Yi je věk matky i-tého studenta, n je počet studentů. • Matematický zápis otázky, která nás zajímá: Označme µX = E Xi , µY = E Yi . Chceme sestrojit interval spolehlivosti pro parametr θ = µX − µY s danou pravděpodobností pokrytí 1 − α. Příklad: θ je rozdíl mezi středním věkem otce a matky. Interval spolehlivosti pro rozdíl středních hodnot: párový případ Vzpomeňme si, že testování rovnosti středních hodnot dvou společně pozorovaných veličin párovým t-testem spočívalo v tom, že jsme provedli jednovýběrový t-test na rozdíly hodnot obou veličin v rámci každého páru. Nyní můžeme využít tutéž myšlenku ke konstrukci intervalu spolehlivosti pro rozdíl středních hodnot dvou společně pozorovaných veličin. Interval spolehlivosti pro rozdíl středních hodnot: párový případ Definujeme Zi = Xi − Yi , i = 1, . . . , n (rozdíly mezi oběma veličinami pozorovanými na téže jednotce) a použijeme větu 3.22 k sestrojení intervalu spolehlivosti pro E Zi = E Xi − E Yi = θ. Jeho krajní body jsou
X n − Y n ± tn−1 1 −
α Sn √ , 2 n
kde Sn je odmocnina z výběrového rozptylu veličin Zi . Příklad: Věk otce a věk matky
Nyní se vrátíme k příkladu o rozdílu věku otce a věku matky z kapitoly 3.7. • Máme data o věku otce (Xi ) a matky (Yi ) n = 130 studentů. • Spočítali jsme, že průměr věku otce je X n = 49.1 roku a průměr věku matky je Y n = 46.8 roku. Rozdíl v průměrném věku otců a matek tedy je 2.3 roku. Zavedli jsme veličiny Zi = Xi − Yi , použili jsme párový t-test a zamítli jsme hypotézu, že skutečný střední věk otců a matek je stejný. • Nyní spočítáme interval spolehlivosti pro střední rozdíl věku otce a matky. Příklad: Věk otce a věk matky Počet pozorování Rozdíl průměrů Výběrová směr. odchylka Kvantil Dolní mez intervalu
n Xn − Y n Sn t129 (0.975) CL
Horní mez intervalu
CU
112
130 2.28 roku 3.79 roku 1.979 2.28 − 1.979 √3.79 130 = 1.63 roku 2.28 + 1.979 √3.79 130 = 2.94 roku
Skutečný střední rozdíl ve věku otce a matky je pokryt intervalem (1.63, 2.94) s pravděpodobností 95%. Otcové jsou v průměru o 1.63 až 2.94 roku starší. Interval spolehlivosti pro rozdíl středních hodnot: dvouvýběrový případ • Nyní uvažujme jednu veličinu měřenou na dvou nezávislých výběrech. Příklad: výška studentů v roce 2006 a v roce 2007. • Chceme vědět, jak se liší střední hodnoty těchto veličin. Příklad: jaký je rozdíl ve střední výšce studentů v roce 2007 proti roku 2006? Interval spolehlivosti pro rozdíl středních hodnot: dvouvýběrový případ • Matematický zápis pozorovaných dat: Máme dva nezávislé náhodné výběry o rozsahu m a n ze dvou různých rozdělení: jeden označíme X1 , . . . , Xm , druhý Y 1 , . . . , Yn . Příklad: X1 , . . . , Xm jsou výšky studentů, kteří si zapsali přednášku v roce 2007, m je jejich počet; Y1 , . . . , Yn jsou výšky studentů, kteří si zapsali přednášku v roce 2006, n je jejich počet. • Matematický zápis otázky, která nás zajímá: Označme µX = E Xi , µY = E Yi . Chceme sestrojit interval spolehlivosti pro parametr θ = µX − µY s danou pravděpodobností pokrytí 1 − α. Příklad: θ je rozdíl mezi střední výškou studentů v roce 2007 a v roce 2006.
Interval spolehlivosti pro rozdíl středních hodnot: dvouvýběrový případ Vzpomeňme si, že k testování rovnosti středních hodnot jedné veličiny pozorované na dvou nezávislých výběrech se používal dvouvýběrový t-test. Nyní přizpůsobíme myšlenku dvouvýběrového t-testu ke konstrukci intervalu spolehlivosti pro rozdíl středních hodnot jedné veličiny pozorované na dvou nezávislých výběrech. Interval spolehlivosti pro rozdíl středních hodnot: dvouvýběrový případ Předpoklady: • Máme dva nezávislé náhodné výběry: X1 , . . . , Xm se střední hodnotou E Xi = µX a Y1 , . . . , Yn se střední hodnotou E Yi = µY . • Pozorování v obou výběrech mají totožný rozptyl σ 2 , tj. var Xi = var Yi = σ 2 . Interval spolehlivosti pro rozdíl středních hodnot: dvouvýběrový případ Tvrzení 3.25. Krajní body intervalu spolehlivosti pro parametr θ = E Xi − E Yi s pravděpodobností pokrytí 1 − α jsou r α 1 1 X n − Y n ± tm+n−2 1 − Sm,n + , 2 m n 113
kde 2 Sm,n =
1 2 (m − 1)SX + (n − 1)SY2 , m+n−2
2 , S 2 jsou výběrové rozptyly veličin X a Y . a SX i i Y
Interval spolehlivosti pro rozdíl středních hodnot: dvouvýběrový případ Poznámka. Pokrytí tohoto intervalu je přesné pro normálně rozdělená pozorování a přibližné pro ostatní případy. Poznámka. Existují i metody pro konstrukci přibližných intervalů spolehlivosti pro rozdíl středních hodnot, které nepředpokládají shodnost rozptylů obou veličin. Příklad: Výška studentů v roce 2006 a 2007 Počítáme interval spolehlivosti pro rozdíl střední výšky studentů v roce 2007 a 2006 s pravděpodobností pokrytí 1 − α = 0.95. Počet pozorování Rozdíl průměrů Společ. odhad σ Kvantil
48, 47 1.94 cm 10.43 cm 1.99 q
m, n Xn − Y n Sm,n t93 (0.975)
Dolní mez
CL
Horní mez
CU
1 + 1.94 − 1.99 · 10.43 48 = −2.3 cm q
1.94 + 1.99 · 10.43 = 6.2 cm
1 48
+
1 47 1 47
Skutečný střední rozdíl ve výšce studentů v roce 2007 proti roku 2006 je pokryt intervalem (−2.3 cm, 6.2 cm) s pravděpodobností 95%.
3.10 Závěrečné poznámky Shrňme si některé metody, které jsme probrali: Přehled testů • Jednovýběrový t-test: Testujeme střední hodnotu jedné spojité veličiny X, hypotéza H0 : µX = µ0 . • Párový t-test: Testujeme rovnost středních hodnot dvou spojitých veličin X a Y vyskytujících se v párech, hypotéza H0 : µX = µY . • Dvouvýběrový t-test: Testujeme rovnost středních hodnot dvou spojitých veličin X a Y pozorovaných na dvou různých skupinách, hypotéza H0 : µX = µY .
114
Přehled testů Čím se liší dvouvýběrový test od párového: • Párový t-test: Hodnoty veličin X a Y jsou nezávislá pozorování náhodného vektoru (X, Y ). Na každé experimentální jednotce pozorujeme vždy obě veličiny zároveň. Příklady: výška/váha téže osoby, věk otce/matky téže osoby, hmotnost téže osoby před dietou/po dietě, měření koncentrace látky v téže nádobě metodou A a metodou B. • Dvouvýběrový t-test: Hodnoty veličin X a Y jsou nezávislými pozorováními pocházejícími ze dvou různých skupin. Na každé experimentální jednotce pozorujeme jedinou hodnotu – buď jen X nebo jen Y . Příklady: výška studenta/výška studentky, prospěch Pražáků/prospěch mimopražských, hmotnost osoby, která drží dietu/hmotnost osoby, která dietu nedrží. Pro představu zmiňme několik z mnoha metod, které jsme neprobrali: Další metody • Jednovýběrový χ2 -test na rozptyl náhodného výběru (je rozptyl roven předem dané hodnotě?). • Dvouvýběrový F-test na rovnost rozptylů dvou náhodných výběrů (jsou jejich rozptyly stejné?). • Jednovýběrový test na pravděpodobnost (je pravděpodobnost pozorovaného jevu rovna předem dané hodnotě?). • χ2 -test dobré shody na rozdělení diskrétní náhodné veličiny (má diskrétní veličina určité dané rozdělení?). Další metody • χ2 -test dobré shody na nezávislost dvou diskrétních veličin. • F-test analýzy rozptylu na rovnost středních hodnot více než dvou náhodných výběrů. • Regresní analýza: závislost střední hodnoty jedné spojité veličiny na naměřených hodnotách jiné veličiny/veličin. Další metody Špatná zpráva: • Statistických metod je nepřeberně, i odborník zná jen malou část existujících metod. • Každý praktický problém vyžaduje specifický přístup k analýze; není žádný dokonale spolehlivý návod, jakou metodou jaký problém řešit. • Existence statistického softwaru situaci spíše komplikuje: žádný software není schopen uživateli poradit vhodný přístup k danému problému. Software pouze slepě spočítá metodu, kterou uživatel zvolí. Volba špatné metody má často za následek lživé, zavádějící či bezcenné výsledky.
115
Statistika v experimentální praxi • Většina experimentálních věd se neobejde bez použití statistiky k vyhodnocení výsledků experimentů. • Statistické vyhodnocení experimentu je třeba naplánovat před vlastním provedením měření a přizpůsobit mu plán celého experimentu (včetně zaznamenávání naměřených výsledků a experimentálních podmínek). • Složité experimenty by měl jak plánovat tak vyhodnocovat odborník na statistiku — špatně provedený experiment často není možné nijak rozumně vyhodnotit. • Existuje celé odvětví statistiky, které se zabývá plánováním a organizací experimentů.
Zde končí přednáška 12, 17. 5.
116
Část 4
Dodatky
117
Zde uvádíme různou rozšiřující a doplňující látku, která nebyla přednášena a nezkouší se.
4.1 Geometrická definice pravděpodobnosti Geometrická definice pravděpodobnosti Geometrická definice pravděpodobnosti předpokládá, že prostor Ω lze ztotožnit buď 1. s úsečkou h0, 1i nebo
2. s rovinným geometrickým útvarem W o ploše rovné 1.
Pravděpodobnost jevu A = (a, b), kde 0 ≤ a < b ≤ 1, je v případě 1 definována jako P (A) = b − a. Pravděpodobnost jevu A (který jest plošným útvarem ⊆ W) je v případě 2 definována jako plocha útvaru A. Geometrická pravděpodobnost Používáme-li geometrickou definici pravděpodobnosti, platí • Ω je nespočetná množina. • Každý elementární jev (reálné číslo z h0, 1i anebo bod uvnitř útvaru W) má nulovou pravděpodobnost. • Náhodné jevy o stejné délce (ploše) jsou stejně pravděpodobné bez ohledu na jejich umístění uvnitř h0, 1i, respektive uvnitř W. Geometrická pravděpodobnost I geometrická pravděpodobnost má všechny vlastnosti požadované od pravděpodobnosti. Příklad – čekání na tramvaj Pan Koumal chodí v náhodných okamžicích na tramvajovou zastávku, na níž staví jedna linka jezdící v pravidelném intervalu 10 minut. Jaká je pravděpodobnost, že pan Koumal bude čekat na tramvaj déle než 8 minut? Prostor elementárních jevů: Interval h0, 1i, kde 0 představuje nulové čekání a 1 představuje čekání po dobu 10 minut. Osmiminutové čekání je znázorněno bodem 0.8. Model: Geometrická pravděpodobnost na intervalu h0, 1i.
Řešení: P (čekání je delší než 8 min) = P (0.8 < ω ≤ 1) = 1 − 0.8 = 0.2. Pravděpodobnost, že pan K. bude čekat déle než 8 minut, je 0.2.
118
Příklad – střelba z houfnice Vojín Koumal střílí ze samohybné houfnice do čtverce o straně dlouhé 100 m. Jeho šrapnely dopadají na zcela náhodné místo, ale vždy dovnitř čtverce. Jaká je pravděpodobnost, že vojín Koumal trefí jedinou ranou obdélníkové nepřátelské stanoviště o velikosti 8 × 5 metrů, které se nachází uvnitř cílového čtverce?
Prostor elementárních jevů: Čtverec h0, 1i × h0, 1i, kde elem. jev (0, 0) představuje dopad šrapnelu do levého dolního rohu cílového čtverce a (1, 1) představuje dopad šrapnelu do pravého horního rohu cílového čtverce. Model: Geometrická pravděpodobnost na čtverci h0, 1i × h0, 1i.
Řešení: P (vojín se trefí) = P (ω ∈ polní kuchyně) = 8 · 5/1002 = 40/10000 = 4/1000. Pravděpodobnost, že vojín K. trefí nepřátelskou polní kuchyni je 0.004. Nevýhody geometrické pravděpodobnosti Geometrická pravděpodobnost také předpokládá, že všechny jevy jsou stejně pravděpodobné (záleží na ploše a nikoli na umístění jevů).
4.2 Kombinatorika Výpočty klasické pravděpodobnosti vyžadují vyčíslení počtu elementárních jevů v množině Ω a také v jevu A, který nás zajímá. To se provádí pomocí kombinatoriky. V této kapitole si uvedeme základní pojmy z kombinatoriky a ukážeme si na příkladech, jak se používají k výpočtům klasické pravděpodobnosti. Mohutnost množiny Označme symbolem Dn množinu {1, 2, . . . , n}. Definice 4.1. Říkáme, že neprázdná množina A má mohutnost n (značení |A| = n), pokud existuje vzájemně jednoznačné zobrazení A → Dn . Je-li A = ∅, definujeme |A| = 0. Vzájemně jednoznačné zobrazení A → Dn znamená, že každý prvek množiny A můžeme jednoznačně ztotožnit s jedním z čísel 1, . . . , n. Množinu A pak můžeme ztotožnit s množinou Dn . Posloupnosti Definice 4.2. Zobrazení Dr → Dn se nazývá posloupnost prvků množiny Dn délky r. Poznámka. Zobrazení Dr → Dn přiřazuje každému číslu 1, 2, . . . , r jeden prvek množiny {1, . . . , n}, tj. získáme jednu r-tici složenou z (možná opakujících se) čísel 1, . . . , n Posloupnosti
119
Tvrzení 4.3. Množina všech posloupností prvků množiny Dn délky r jest Dnr = {(x1 , . . . , xr ) : xj ∈ Dn , 1 ≤ j ≤ r} Její mohutnost je |Dnr | = nr . Tuto množinu též nazýváme variace r-té třídy z n prvků s opakováním. Poznámka. V klasické pravděpodobnosti pracujeme s posloupnostmi tehdy, jsou-li elementární jevy r-člennými uspořádanými skupinami opakujících se charakteristik z množiny {1, . . . , n}. Příklad na variace s opakováním Příklad. Jaká je pravděpodobnost, že ve třídě s n studenty se najde student, který má narozeniny ve stejný den jako třídní profesor? Rozbor: Stanovíme elementární jevy ω ∈ Ω jako ω = (d0 , d1 , d2 , . . . , dn ), kde d0 je den narození učitele (jako číslo z 1, . . . , 365) a d1 , . . . , dn jsou dny narození studentů seřazených podle abecedy. n+1 Předpokládáme, že všechny ω jsou stejně pravděpodobné. Máme Ω = D365 , |Ω| = n+1 365 .
Příklad na variace s opakováním 2. Zkoumaný jev: A ={aspoň 1 student se narodil v den d0 } ={ω : ∃i ∈ {1, . . . , n} : di = d0 }
Vezměme Ac ={žádný student se nenarodil v den d0 } ={ω : ∀i ∈ {1, . . . , n} : di 6= d0 } n ={1, . . . , 365} × D364
Příklad na variace s opakováním 3. Řešení: Nyní už snadno spočítáme |Ac | = 365 · 364n a P (Ac ) =
|Ac | 365 · 364n 364n = = |Ω| 365n+1 365n
a proto c
P (A) = 1 − P (A ) = 1 −
120
364 365
n
.
Značení Definice 4.4. • Pro n ∈ {1, 2, . . .} definujeme n! = 1 · 2 · · · · · (n − 1) · n. Pro n = 0 definujeme 0! = 1. Tuto funkci nazýváme faktoriál. • Pro n, k ∈ {0, 1, 2, . . .} a k ≤ n definujeme n n! = k k!(n − k)! Tento výraz nazýváme kombinační číslo a čteme „n nad kÿ. Variace bez opakování Definice 4.5. Posloupnosti (x1 , . . . , xr ) z množiny Drn , jejichž prvky jsou navzájem různé (platí xi 6= xj pro každou dvojici i 6= j), se nazývají variace r-té třídy z n prvků bez opakování. Množinu všech takových posloupností značíme V (n, r). Tvrzení 4.6. V (n, r) je množina všech prostých zobrazení Dr → Dn . Platí n n! |V (n, r)| = r! = . r (n − r)! Permutace Definice 4.7. Posloupnosti (x1 , . . . , xn ) z množiny Pn ≡ V (n, n) se nazývají permutace množiny Dn . Množinu všech permutací značíme Pn nebo V (n, n). Poznámka. Permutace jsou vzájemně jednoznačná zobrazení množiny Dn na sebe. Platí |Pn | = n!. Poznámka. V klasické pravděpodobnosti pracujeme s variacemi a permutacemi tehdy, jsou-li elementární jevy r-člennými uspořádanými skupinami neopakujících se charakteristik z množiny {1, . . . , n}. Příklad na variace bez opakování Příklad. Jaká je pravděpodobnost, že ve skupině n lidí se najdou alespoň dva lidé, kteří mají narozeniny ve stejný den? Rozbor: Stanovíme elementární jevy ω ∈ Ω jako ω = (d1 , d2 , . . . , dn ), kde di je den narození i-tého člověka. n , |Ω| = 365n . Předpokládáme, že všechny ω jsou stejně pravděpodobné. Máme Ω = D365
121
Příklad na variace bez opakování 2. Zkoumaný jev: A ={aspoň 2 lidé mají narozeniny ve stejný den} ={ω : ∃i 6= j ∈ {1, . . . , n} : di = dj } Vezměme Ac ={žádní 2 lidé nemají narozeniny ve stejný den} ={ω : ∀i 6= j ∈ {1, . . . , n} : di 6= dj } Ac je množina všech prostých posloupností, tj. pro n ≤ 365 je Ac = V (365, n). Příklad na variace bez opakování 3. 365 c Řešení: Máme |A | = n! a n |Ac | P (A ) = = |Ω| c
Proto
P (A) = 1 − P (Ac ) = 1 −
365! (365−n)! 365n
.
365 364 365 − n + 1 · · ··· · . 365 365 365
Je-li n > 365, je P (A) = 1. Kombinace bez opakování Definice 4.8. Rostoucí posloupnosti (x1 , . . . , xr ) z množiny V (n, r) (platí xi < xj pro každou dvojici i < j), se nazývají kombinace r-té třídy z n prvků bez opakování. Množinu všech takových posloupností značíme C(n, r). Značení • Označme J(r, n − r) množinu všech posloupností nul a jedniček délky n, v nichž je právě r jedniček a n − r nul. • Označme Expr (Dn ) množinu všech podmnožin A ⊆ Dn o mohutnosti r. Označme Exp(Dn ) množinu všech podmnožin A ⊆ Dn (včetně prázdné množiny). Kombinace bez opakování 1. |C(n, r)| = |J(r, n − r)| = |Expr (Dn )| n 2. |C(n, r)| = r 3. |Exp(Dn )| = 2n
Tvrzení 4.9.
Poznámka. V klasické pravděpodobnosti pracujeme s kombinacemi bez opakování tehdy, jsou-li elementární jevy r-člennými neuspořádanými skupinami neopakujících se charakteristik z množiny {1, . . . , n}, nebo rostoucími posloupnostmi prvků {1, . . . , n} délky r nebo podmnožinami Dn o mohutnosti r.
122
Kombinace s opakováním Definice 4.10. Neklesající posloupnosti (x1 , . . . , xr ) z množiny Dnr (platí xi <= xj pro každou dvojici i < j), se nazývají kombinace r-té třídy z n prvků s opakováním. Množinu všech takových posloupností značíme C ∗ (n, r). n−1+r ∗ Tvrzení 4.11. |C (n, r)| = |J(r, n − 1)| = r Kombinace s opakováním Poznámka. V klasické pravděpodobnosti pracujeme s kombinacemi s opakováním tehdy, jsou-li elementární jevy r-člennými neuspořádanými skupinami nikoli nutně různých charakteristik z množiny {1, . . . , n}, nebo neklesajícími posloupnostmi prvků {1, . . . , n} délky r. Zobecněné kombinace Rozdělme prvky Dn na k skupin o mohutnostech r1 , . . . , rk takových, že r1 +· · ·+rk = n. Kolika způsoby to můžeme udělat? Definice 4.12. Posloupnosti z množiny V (n, n), které lze rozdělit na k skupin (x1 , . . . , xr1 ), (xr1 +1 , . . . , xr1 +r2 ), . . . , (xr1 +r2 +···+rk−1 +1 , . . . , xn ) takových, že každá podposloupnost (xr1 +···+rj +1 , . . . , xr1 +···+rj+1 ) je rostoucí, se nazývají zobecněné kombinace třídy r1 , r2 , . . . , rk z n prvků bez opakování. Množinu všech takových posloupností značíme C(n, r1 , r2 , . . . , rk ). Zobecněné kombinace Označme J(r1 , r2 , . . . , rk ) množinu všech posloupností čísel 1, 2, . . . , k délky n, v nichž se číslo j vyskytuje právě rj -krát. Tvrzení 4.13. Platí n! r1 !r2 ! · · · rk ! Poznámka. Jestliže jde o dvě skupiny, k = 2, máme obyčejné kombinace bez opakování. |C(n, r1 , r2 , . . . , rk )| = |J(r1 , r2 , . . . , rk )| =
4.3 Dodatky k podmíněné pravděpodobnosti Zde si uvedeme větu o úplné pravděpodobnosti, která se používá při výpočtu pravděpodobností složitých jevů pomocí jednodušších podmíněných pravděpodobností. Tato věta je užitečná, ale v naší přednášce ji příliš nevyužijeme. Následuje příklad výpočtu podmíněných pravděpodobností při karetních hrách, konkrétně v mariáši. Ten notně využívá kombinatoriku. Věta o úplné pravděpodobnosti Věta 4.14 (o úplné pravděpodobnosti). S∞ Nechť A1 , A2 , . . . jsou neslučitelné náhodné jevy, z nichž právě jeden musí nastat, tj. i=1 Ai = Ω. Pak pro libovolný jev B platí P (B) =
∞ X i=1
P (B | Ai )P (Ai ).
123
Věta o úplné pravděpodobnosti – důkaz Důkaz: Protože
S
Ai = Ω, máme
P (B) = P (B ∩ Ω) = P
B∩
∞ [
i=1
Ai
!!
=P
∞ [
!
(B ∩ Ai ) .
i=1
Jelikož Ai jsou neslučitelné, tak i B ∩ Ai jsou neslučitelné. Proto ! ∞ ∞ ∞ [ X X P (B ∩ Ai ) = P (B ∩ Ai ) = P (B | Ai )P (Ai ). i=1
i=1
i=1
Příklad – mariáš Příklad. 32 promíchaných karet bylo rozdáno tak, že já mám 12 karet a moji dva protihráči každý 10. V ruce držím čtyři trumfy. Jaká je pravděpodobnost, že zbylé čtyři trumfy drží všechny v ruce jeden z protihráčů? Řešení: Ω = {všechna možná rozdání}
Kolik jich je? Zobecněné kombinace bez opakování: Celkový počet možných rozdání je tedy 32! |Ω| = 12!10!10!
Mariáš – řešení Označme si jevy A = {mám 4 trumfy}
B = {protihráč I má 4 trumfy a protihráč II má 0 trumfů nebo naopak}
Počítejme, kolik rozdání vede k tomu, že mám čtyři trumfy. Trumfů je 8, čili existuje 8 možností pro moje čtyři trumfy. Kromě trumfů mám 8 jiných karet, které můžu 4 24 dostat způsoby. 8 Mariáš – řešení
20 způsoby (dostane 10 10 ze zbylých 20 karet). Je-li i toto určeno, protihráč II má své karty též určeny. Určíme-li pevně moje karty, protihráč I může dostat karty
Všechny tyto možnosti se násobí, takže dohromady máme 8 24 20 |A| = , 4 8 10 tj. tolik je rozdání při nichž držím v ruce čtyři trumfy.
124
Mariáš – řešení Chceme spočítat, jaká je pravděpodobnost, že zbylé čtyři trumfy drží všechny v ruce jeden z protihráčů (B), pokud já mám čtyři trumfy (A). K tomu musíme určit počet možných rozdání karet, při nichž nastanou jevy A a B zároveň. Počítáme tedy počet rozdání, při nichž mám čtyři trumfy a zbylé čtyři trumfy drží všechny v ruce jeden člověk. Mariáš – řešení
16 Pokud protihráč I trumfy nemá, dostaneme možností pro jeho karty a karty proti10 hráče II už jsou jasné. Ale zbylé čtyři trumfy může držet i protihráč I a proto násobíme počet možností dvěma. Dostaneme a odtud
8 24 16 2 |A ∩ B| = 8 10 4
8 24 16 2 P (A ∩ B) 4·7 4 8 10 P (B | A) = = = = 0.087 8 24 20 P (A) 19 · 17 4 8 10
4.4 Dodatky k náhodným veličinám Existence a konečnost střední hodnoty Poznámka. Střední hodnota nemusí být konečná. Příklad. Uvažujme X nabývající hodnot 1, 2, . . . s pravděpodobnostmi P [X = j] = 6 · 1 . Pak E X = ∞. π2 j 2 Nekonečná řada
P
1 j2
konverguje: EX =
P∞
1 j=1 j 2
=
π2 6
. Jenomže
∞ ∞ 6 X 1 6 X1 j = = ∞. π2 j2 π2 j j=1
j=1
Existence a konečnost střední hodnoty Poznámka. Střední hodnota nemusí existovat. Příklad. Uvažujme X s hustotou fX (x) =
1 1 π (1+x)2
fX (x) je hustota neboť Z ∞
pro x ∈ R. Pak E X neexistuje.
Z ∞ 1 ∞ dx 1 fX (x) dx = = arctg (x) −∞ 2 π −∞ (1 + x) π −∞ 1 π π = − (− ) = 1 π 2 2
125
Existence a konečnost střední hodnoty Ale EX = a
a podobně
R0
Z
∞ 0
−∞ x fX (x) dx
Z
0
x fX (x) dx + −∞
1 x fX (x) dx = π
Z
∞ 0
= −∞.
Z
∞
x fX (x) dx
0
x dx = ∞ (1 + x)2
Takže E X = ∞ − ∞, což není korektní výraz. E X neexistuje.
126
Seznam obrázků 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 2.18 2.19 2.20 2.21 2.22 2.23 2.24 2.25 2.26 2.27 2.28 2.29 3.1 3.2 3.3 3.4 3.5
Příklad děti: Distribuční funkce počtu dcer . . . . . . . . . . . . . . . . . Příklad distribuční funkce spojité náhodné veličiny . . . . . . . . . . . . . Maxwellovo rozdělení: distribuční funkce rychlosti molekuly kyslíku při 25℃ Určení pravděpodobnosti daného rozmezí rychlostí molekuly z distribuční funkce Maxwellova rozdělení (O2 , 25℃) . . . . . . . . . . . . . . . . . . . Distribuční funkce a hustota rychlosti molekuly O2 (25℃). . . . . . . . . . Určení pravděpodobnosti daného rozmezí rychlostí molekuly z hustoty Maxwellova rozdělení (O2 , 25℃) . . . . . . . . . . . . . . . . . . . . . . . Rozdělení diskrétní veličiny . . . . . . . . . . . . . . . . . . . . . . . . . . Grafické znázornění binomického rozdělení . . . . . . . . . . . . . . . . . . Grafické znázornění Poissonova rozdělení . . . . . . . . . . . . . . . . . . . Hustota a distribuční funkce rovnoměrného rozdělení . . . . . . . . . . . . Hustota a distribuční funkce exponenciálního rozdělení . . . . . . . . . . . Hustoty rychlosti molekul různých plynů při teplotě 25℃ . . . . . . . . . Hustoty rychlosti molekul kyslíku při různých teplotách . . . . . . . . . . Hustota normálního rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . Distribuční funkce normálního rozdělení . . . . . . . . . . . . . . . . . . . Chvosty normálního rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . Hustota exponenciálního rozdělení Exp(λ) se zobrazením střední hodnoty 1/λ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Hustota Maxwellova rozdělení (O2 , 25℃) se zakreslením střední hodnoty. Hustota exponenciálního rozdělení Exp(λ) se zobrazením střední hodnoty 1/λ a mediánu ln 2/λ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Hustota Maxwellova rozdělení (O2 , 25℃) se zakresleným mediánem rychlosti, střední hodnoty rychlosti a střední kvadratické rychlosti. . . . . . . . Ilustrace k příkladu: Medián X je mX = 5. . . . . . . . . . . . . . . . . . Kvantily normovaného normálního rozdělení . . . . . . . . . . . . . . . . . Hustota normálního rozdělení s nulovou střední hodnotou a různými rozptyly. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Příklad distribuční funkce spojitého dvourozměrného rozdělení. . . . . . . Distribuční funkce z obrázku 2.24 nakreslená ve formě vrstevnic. . . . . . Příklad hustoty spojitého dvourozměrného rozdělení. . . . . . . . . . . . . Hustota z obrázku 2.26 nakreslená pomocí vrstevnic. . . . . . . . . . . . . Hustota spojitého dvourozměrného rozdělení s korelacemi cor (X, Y ) = 0, 0.3, 0.6, 0.95. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Hustota výběrového průměru z normálního rozdělení. . . . . . . . . . . . . Výběrový průměr z rozdělení Exp(0.012) v závislosti na n. . . . . . . . . . Empirická distribuční funkce náhodného výběru 2, 5, 1, 2, 6, 4, 5, 2. . . . . . Empirické distribuční funkce váhy studentů. . . . . . . . . . . . . . . . . . Graf váhy proti výšce a věku matky proti věku otce (data studenti). . . . Histogram výšky studentů s proloženou hustotou normálního rozdělení. .
127
20 21 22 23 25 26 26 28 29 30 31 33 33 34 36 37 40 41 44 45 46 47 48 52 52 54 54 62 64 72 78 78 80 82
3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 3.14 3.15 3.16
Histogram výšky studentů s třemi a pětadvaceti intervaly. . . . . . . . . Krabicový diagram výšky studentů podle pohlaví a podle ročního období při narození. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bodový diagram výšky studentů proti věku otce s rozlišením pohlaví. . . Obdélníkový a výsečový diagram období narození studentů. . . . . . . . Kritická hodnota cα pro zamítání H0 pro příliš velké hodnoty Tn . . . . . U Kritické hodnoty cL α a cα pro zamítání H0 pro příliš malé anebo příliš velké hodnoty Tn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Krabicový diagram věku otce a věku matky. . . . . . . . . . . . . . . . . Krabicový diagram výšky v roce 2006 a 2007. . . . . . . . . . . . . . . . Krabicový diagram hmotnosti studentů a studentek. . . . . . . . . . . . Pokrytí 95%-ních intervalů spolehlivosti pro střední hodnotu normálního rozdělení. Rozsah výběru n = 50. . . . . . . . . . . . . . . . . . . . . . . Pokrytí 95%-ních intervalů spolehlivosti pro střední hodnotu normálního rozdělení. Rozsah výběru n = 200. . . . . . . . . . . . . . . . . . . . . .
128
. 83 . . . .
84 85 86 95
. . . .
96 98 101 102
. 109 . 110
Seznam tabulek 2.1 2.2 2.3 2.4 3.1 3.2 3.3
Hodnoty distribuční funkce N(0, 1) . . . . . . . . . . . . . . . . . . . . . Vybrané kvantily rozdělení N(0, 1) . . . . . . . . . . . . . . . . . . . . . Charakteristiky vybraných diskrétních rozdělení. . . . . . . . . . . . . . Charakteristiky vybraných spojitých rozdělení. . . . . . . . . . . . . . . Část datové tabulky představující náhodný výběr z populace studentů 1. ročníku PřF se sedmi veličinami. . . . . . . . . . . . . . . . . . . . . . . Postup výpočtu výběrové kovariance a korelace (data studenti). . . . . . Vybrané kvantily rozdělení tk . . . . . . . . . . . . . . . . . . . . . . . . .
129
. . . .
35 46 50 50
. 70 . 80 . 92
Rejstřík grafické metody bodový diagram, 84 histogram, 81 krabicový diagram, 84 obdélníkový diagram, 85 výsečový diagram, 85
rovnoměrné rozdělení, 29 spojitá náhodná veličina, 17 náhodný jev elementární jev, 7 prostor elementárních jevů, 7, 10 jistý jev, 7 nemožný jev, 7 nezávislé jevy, 12 náhodný jev, 7 operace doplněk jevu, 8 průnik jevů, 8 sjednocení jevů, 8 náhodný vektor definice, 50 diskrétní náhodný vektor, 53 distribuční funkce, 51 hustota, 52 marginální rozdělení, 55 sdružené rozdělení, 55 náhodný výběr definice, 62 uspořádaný náhodný výběr, 75 výběrový průměr, viz odhad, výběrový průměr
interval spolehlivosti definice, 106 interpretace, 107 pro střední hodnotu, 108 rozdíl středních hodnot dvouvýběrový případ, 114 párový případ, 112 vlastnosti, 109 vztah k testování hypotéz, 110 limitní věty centrální limitní věta, 66 zákon velkých čísel, 65 náhodná veličina charakteristiky kvantil, 45 medián, 42 rozptyl, 47 střední hodnota, 38 definice, 15 diskrétní náhodná veličina, 16 korelace, 61 kovariance, 59 nezávislost, 57 rozdělení alternativní rozdělení, 27 binomické rozdělení, 27 exponenciální rozdělení, 30 Maxwellovo rozdělení, 32 normované normální rozdělení, 35, 66 normální rozdělení, 32, 66 Poissonovo rozdělení, 27
odhad definice, 70 empirická distribuční funkce, 77 konsistence, 70 nestrannost, 70 odhad hustoty, viz grafické metody, histogram relativní četnost, 73 výběrová kovariance, 79 výběrová směrodatná odchylka, 75 výběrový korelační koeficient, 79 výběrový kvantil, 76 výběrový průměr, 63, 71 výběrový rozptyl, 74
130
pravděpodobnost axiomatická definice, 10 klasická, 9 podmíněná pravděpodobnost, 11 základní vlastnosti, 8 rozdělení náhodné veličiny, 18 diskrétní rozdělení, 24 distribuční funkce, 19 diskrétní, 19 použití, 21 vlastnosti, 19 hustota, 22 vlastnosti, 23 testování alternativa, 87 chyba I. druhu, 88 chyba II. druhu, 88 dvouvýběrový t-test, 103 hladina testu, 88 hypotéza, 87 jednovýběrový t-test, 92 kritická hodnota, 94 kritický obor, 88 parametr, 87 párový t-test, 98 síla testu, 88 t-rozdělení, 91 testová statistika, 88
131