Matematika 4B Prof. RNDr. Jan Hamhalter, CSc. katedra matematiky FEL ČVUT e-mail:
[email protected] tel: 224353587 web: http://math.feld.cvut.cz//hamhalte 11. ledna 2007 16:56
1
• V.Rogalewicz: Pravděpodobnost a statistika pro inženýry, skripta, Vydavatelství ČVUT, 1998. • K.Zvára a J.Štěpán: Pravděpodobnost a matematická statistika, matfyzpress, Praha 2002. • J.Anděl: Matematika náhody, matfyzpress, Praha 2003. • J.Anděl: Statistické metody, matfyzpress, Praha 2003. • V.Dupač a M.Hušková: Pravděpodobnost a matematická statistika, Nakladatelství Karolinum, 1999. • Z.Prášková: Základy náhodných procesů II, Nakladatelství Karolinum, 2004. • A. Rényi: Teorie pravděpodobnosti, Academia, Praha 1972.
2
1
Historie a podstata teorie pravděpodobnosti
teorie pravděpodobnosti = matematika náhody, systémy s nedostatkem informace svět 19. století – deterministický systém, hodinový stroj svět 20. století – svět náhody (evoluce není možná bez náhody, mikrosvět se řídí pravděpodobnostními zákony, teorie chaosu, apod.) • Úloha o rozdělení sázky Pochází od Arabů. Nedávno objevena v rukopise z r. 1380. Dva hráči hrají sérii partií. Výsledky jednotlivých her jsou nezávislé. Vyhrává ten kdo poprvé zvítězí v šesti partiích. Pravděpodobnost výhry je pro každého hráče stejná, t.j. 1/2. Hra je přerušena ve chvíli kdy hráč A vyhrál 5x a hráč B 3x. Jak si rozdělí výhru? Úloha byla vyřešena nezávisle Pascalem a Fermatem (1654). Všechny možnosti pokračování (hra bude trvat nejvýše tři další partie): AAA AAB ABA ABB BAA BAB BBA BBB Pouze v jednom případě vítězí B, pravděpodobnost výhry hráče B je 1:8, výhra by se měla rozdělit v poměru 7:1. 3
• Huygens (1657) : On Reasoning in Games of Dice • Laplace (1812): Analytic Theory of Probabilities nestačí kombinatorické metody, je třeba uvažovat nekonečné soubory možností statistická fyzika, Brownův pohyb, teorie míry a integrace • A. Kolmogorov (1930): Axiomatické základy teorie pravděpodobnosti • současný stav a perspektivy: nové obory založené na pravděpodobnostním přístupu – kvantová teorie informace, teorie her v ekonomii, teorie chaosu, . . .
4
2
Pravděpodobnostní prostor
pravděpodobnostní model má dvě komponenty: • struktura náhodných jevů • pravděpodobnost jako kvantitativní funkce na jevech
2.1. Příklad. Střelba na terč Ω = kruh o poloměru r náhodné jevy = podmnožiny Ω
pravděpodobnost(A) =
5
obsah(A) . πr2
2.2. Příklad. Sportka Ω = {{1, 2, 3, 4, 5, 6}, {1, 3, 4, 6, 2, 17}, . . . } = { šestiprvkové podmnožiny množiny {1, 2, . . . , 49}} tyto šestice tvoří elementární jevy s pravděpodobností 1 49 6
=
1 = 0, 7151138242 · 10−7 13983816
jev= podmnožina Ω pravděpodobnost jevu A ⊂ Ω. P (A) =
velikost(A) . 49 6
konkrétní výpočet v tomto modelu – spočtěte pravděpodobnost, že uhodnete (právě) tři čísla.
P (A) =
6 3
·
43
3 49
= 0, 1765040387
6
6
náhodné jevy musíme umět kombinovat „ jev A nebo jev Bÿ, . . .
2.3. Definice. Nechť Ω je neprázdná množina. Systém A podmnožin množiny Ω se nazývá σ-algebra náhodných jevů, jestliže platí (i) Ω ∈ A. (ii) Jestliže A1 , A2 , . . . jsou množiny v A, pak S∞ i=1 Ai ∈ A (iii) Je-li A ∈ A, pak Ac = Ω \ A ∈ A
Terminologie: Ac . . . opačný jev k jevu A A, B jsou navzájem vylučující se (disjunktní) jevy jestliže A∩B =∅
7
2.4. Tvrzení. Je-li A σ-algebra podmnožin Ω pak T∞ (i) A1 , A2 , . . . ∈ A =⇒ i=1 Ai ∈ A. (ii) A, B ∈ A =⇒ A ∩ B c ∈ A. Důkaz: S∞ (i) Ac1 , Ac2 , . . . ∈ A, =⇒ i=1 Aci ∈ A =⇒ (de Morganova pravidla) [ c \ ∞ ∞ c Ai = Ai ∈ A . i=1
i=1
c
(ii) A, B ∈ A =⇒ A ∩ B c ∈ A .
8
pravděpodobnost modeluje relativní četnost, měla by respektovat stejná pravidla jako počet prvků množiny 2.5. Definice. Předpokládejme, že A je σ-algebra podmnožin množiny Ω. Pravděpodobnost P je zobrazení P : A → [0, 1] , pro které platí (i) P (Ω) = 1 S∞ P∞ (ii) P ( i=1 Ai ) = i=1 P (Ai ), jestliže A1 , A2 , .... jsou navzájem disjunktní množiny v A. Trojice (Ω, A, P ) se nazývá pravděpodobnostní prostor.
9
Základní vlastnosti pravděpodobnosti (i) A ∩ B = ∅ =⇒ P (A ∪ B) = P (A) + P (B) (ii) P (∅) = 0 (⇐= P (Ω) + P (∅) = P (Ω)) (iii) P (Ac ) = 1 − P (A) (⇐= P (A) + P (Ac ) = P (Ω) = 1.) (iv) A ⊂ B =⇒ P (B ∩ Ac ) = P (B) − P (A) (⇐= P (B) = P (A) + P (B ∩ Ac )) (v) P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
odvození: X = A ∩ (A ∩ B)c ,
Y = B ∩ (A ∩ B)c
P (X) + P (Y ) + P (A ∩ B) = P (A ∪ B) P (A)−P (A∩B)+P (B)−P (A∩B)+P (A∩B) = P (A∪B) P (A) + P (B) = P (A ∪ B) + P (A ∩ B)
10
Tato základní pravidla jsou často užitečná při konkrétních výpočtech. 2.6. Příklad. Určete pravděpodobnost, že při tahu Sportky bude vylosováno buďto číslo 7 nebo číslo 20. Řešení: A . . . taženo číslo 7, B . . . taženo číslo 20. 48 5 49 6
P (A) = P (B) = 47 4 49 6
P (A ∩ B) = Tedy
48 5 49 6
P (A ∪ B) = 2 ·
47 4 49 6
−
11
=
13 = 0, 232148571 . 56
Důležité typy pravděpodobnostních prostorů: • klasický pravděpodobnostní prostor • konečný pravděpodobnostní prostor • diskrétní nekonečný pravděpodobnostní prostor • geometrický pravděpodobnostní prostor
12
Klasický pravděpodobnostní prostor
Ω = {ω1 , . . . , ωn } A = všechny podmnožiny množiny Ω P (A) =
|A| |A| = . |Ω| n
V tomto modelu mají elementární jevy stejnou šanci =
1 n.
Někdy je těžké nalézt dobrý model slovní úlohy, často se setkáme se složitou kombinatorikou.
13
2.7. Příklad. Hodíme n krát mincí, rub i líc v jednom hodu mají stejnou šanci, tj. 12 . Jaká je pravděpodobnost že padne právě k krát líc? Řešení: elementární jevy – posloupnosti nul a jedniček délky n kódující výsledky hodů. |Ω| = 2n Ω = {ω1 , . . . , ω2n } Ak . . . . posloupnost obsahuje právě k jedniček.
|Ak | =
n k
Tedy P (Ak ) =
1 n . 2n k
Poznámka: Hodíme n krát mincí, kde n je sudé. Jaká je pravděpodobnost, že padne stejný počet nul jako jedniček? 1 n P (An/2 ) = n 2 n/2 Pomocí tzv. Stirlingova vzorce lze dokázat, že 1 P (An/2 ) ≈ p → 0 pro n → ∞ . πn/2
14
2.8. Příklad. Narozeninový problém Jaká je pravděpodobnost, že ve třídě s n žáky se najde dvojice mající narozeniny ve stejný den? (n ≤ 365). Řešení:
Ω = {posloupnosti délky n prvků množiny {1, 2, . . . , 365}} Elementární jevy kódují den narozenin 1. až n-tého žáka. A . . . sledovaný jev Ac . . . jev opačný, všichni mají narozeniny v jiný den. |Ω| = 365n |Ac | = 365 · 364 · 363 · · · (365 − n + 1)
P (A) = 1 −
365 · 364 · 363 · · · (365 − n + 1) = 365n n−1 Y j = 1− 1− 365 j=1
Nečekané numerické hodnoty: již pro n = 23 je P (A) > 1/2, pro n = 56 je P (A) = 0, 99.
15
Konečný pravděpodobnostní prostor Ω = {ω1 , . . . , ωn } A = všechny podmnožiny Ω p1 , . . . , pn > 0 . . . váhy n X pi = 1 i=1
P ({ωi }) = pi
• Z toho vyplývá že X P (A) =
pi ,
{i|ωi ∈A}
pro všechny A ⊂ Ω. • Klasický pravděpodobnostní prostor je speciálním případem, ve kterém jsou všechny váhy stejné: p1 = p 2 = · · · = pn =
1 . n
16
2.9. Příklad. Ω = {ω1 , ω2 , ω3 } 1 2 1 p2 = P ({ω2 }) = 4 1 p3 = P ({ω3 }) = 4 p1 = P ({ω1 }) =
ω1 1 2
ω2 1 4
ω3 1 4
Je tedy např. P ({ω1 , ω2 }) = p1 + p2 =
17
1 1 3 + = . 2 4 4
Bernoulliovo schéma Máme jev A (zdar) s pravděpodobností 0 < p < 1 a jev B (nezdar) s pravděpodobností 0 < 1 − p < 1. V náhodném pokusu nastane právě jeden z jevů A a B s příslušnou pravděpodobností. Provedeme sérii n těchto náhodných pokusů, jejichž výsledky se navzájem neovlivňují. Možné výstupy pro n = 4: ABAA, BBBA, . . . kódovány posloupnostmi 0 a 1: 1011, 0001, . . . Elementární jevy —- posloupnosti nul a jedniček délky n Nezávislost znamená, že pravděpodobnosti se násobí: P (1011) = p · (1 − p) · p · p = p3 · (1 − p) P (0001) = (1 − p) · (1 − p) · (1 − p) · p = p · (1 − p)3
18
To nás vede k následujícímu modelu: Ω= všechny posloupnosti nul a jedniček délky n |Ω| = 2n . P (posloupnost ) = ppočet 1 · (1 − p)počet 0 Ověříme, že součet vah je 1: n
2 X
pi =
i=1
n X n k=0
k
pk (1 − p)n−k = = (p + (1 − p))n = 1.
Důležitý je jev, Ak , že v sérii n pokusů nastane jev A právě k krát. |Ak | =
n k
.
n k P (Ak ) = p (1 − p)n−k . k Konkrétní příklady: hod mincí, hod kostkou, ankety, statistické šetření, apod. 2.10. Příklad. Terč zasáhneme s pravděpodobností 1/3. Jaká je pravděpodobnost, že se dvakrát strefíme při čtyřech pokusech. 2 4 1 2 48 = 0, 2963 . P (A2 ) = = 2 3 161 2 3 19
Nekonečný diskrétní pravděpodobnostní prostor Ω = {ω1 , ω2 , . . . } A = všechny podmnožiny Ω (pn )∞ n=1 . . . posloupnost vah ∞ X pn = 1, pn ≥ 0 n=1
P ({ωn }) = pn pro n = 1, 2, . . .
• Z toho vyplývá, že X P (A) =
pn ,
{n|ωn ∈A}
pro všechny A ⊂ Ω.
20
Poissonův zákon
Ω = {ω0 , ω1 , ω2 . . . } λ > 0 parametr pn =
λn −λ , n = 0, 1, . . . e n!
Ověříme korektnost zadání: ∞ ∞ X X λn λn −λ e = e−λ = e−λ eλ = 1 . n! n! n=0 n=0
2.11. Příklad. Za danou časovou jednotku volá na ústřednu průměrně λ > 0 účastníků. Pravděpodobnost pn , že zavolá právě n účastníků se řídí Poissonovým zákonem: pn =
λn −λ e n!
Pravděpodobnost, že zavolá alespoň někdo je 1 − e−λ .
21
Geometrický pravděpodobnostní prostor pravděpodobnost je dána geometrickou kvantitou (délka, obsah, objem) Ω ⊂ R, R2 , R3 , . . . , 0 < velikost (Ω) < ∞ , P (A) =
velikost (A) velikost (Ω)
pro A ⊂ Ω. 2.12. Příklad. Terč má poloměr 30 cm. Jaká je pravděpodobnost, že se trefíme do středu o poloměru 5cm ? Řešení: p=
25π = 0, 02777 . . . . 900π
22
2.13. Příklad. Buffonova úloha V rovině je dán systém rovnoběžek majících vzdálenost d. Na rovinu hodíme jehlu o velikosti l, l < d. Jaká je pravděpodobnost, že protne některou rovnoběžku? Řešení: Polohu jehly vůči rovnoběžné síti popíšeme dvěma parametry: x . . . vzdálenost středu jehly od nejbližší rovnoběžky
x ∈< 0,
d > 2
ϕ . . . úhel, který jehla svírá s rovnoběžnou sítí ϕ ∈< 0, π > . Podmínka protnutí: l sin ϕ > x 2
1 P = π d/2
Zπ 0
π l l sin ϕdϕ = − cos ϕ = 2 πd 0
2l . = πd
23
Další vlastnosti pravděpodobnosti:
Princip inkluze a exkluze Opakování: P (A ∪ B) = P (A) + P (B) − P (A ∩ B). Mějme nyní tři jevy A, B, C ∈ A. P (A ∪ B ∪ C) = P [(A ∪ B) ∪ C] = P (A ∪ B) + P (C) − P ((A ∩ C) ∪ (B ∩ C)) = P (A) + P (B) − P (A ∩ B) + P (C) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C) = P (A) + P (B) + P (C) − P (A ∩ C) − P (B ∩ C) − P (A ∩ B) + P (A ∩ B ∩ C)
24
Zobecnění se dá dokázat indukcí: 2.14. Věta. Princip inkluze a exkluze Předpokládejme, že A1 , . . . , An ∈ A, kde (Ω, A, P ) je pravděpodobnostní prostor. Pak platí P (A1 ∪A2 ∪· · ·∪An ) =
X
P (Ai )−
1≤i≤n
+
X
X
P (Ai ∩Aj )
1≤i<j≤n
P (Ai ∩Aj ∩Ak )+· · ·+(−1)n+1 P (∩ni=1 Ai ) .
1≤i<j
25
2.15. Příklad. Roztržitá šatnářka n hostů restaurace si přichází odložit svůj kabát. Šatnářka vydává kabáty chaoticky. Jaká je pravděpodobnost, že alespoň jeden z hostů dostane svůj kabát? Řešení: Elementární jevy jsou permutace n prvkové množiny. 1 2 ... n k1 k2 . . . kn Všechny mají stejnou pravděpodobnost, tj.
1 n! .
A = {(k1 , . . . , kn ) | existuje 1 ≤ i ≤ n tak že ki = i} . A = A1 ∪ A2 ∪ · · · ∪ An , kde Ai = {(k1 , . . . , kn ) | ki = i} (i-tý host je v pořádku) (n − 1)! n! (n − 2)! P (Ai ∩ Aj ) = , i 6= j n! 1 P (A1 ∩ A2 ∩ · · · ∩ An ) = n! P (Ai ) =
26
n (n − 2)! n (n − 3)! 1 P (A) = 1− + −· · ·+(−1)n+1 2 n! 3 n! n! 1 1 1 = 1 − + − · · · + (−1)n+1 2! 3! n! numerické hodnoty: n P (A)
1 1
2 0,5
3 0,6667
4 0,625
5 0,6333
asymptoticky: e−1 = 1 −
1 1 1 + − + ··· 1! 2! 3!
lim P (A) = 1 − e−1 = 0, 6321....
n→∞
27
6 0,6319
7 0,6321
Zacházení s nekonečnými posloupnostmi jevů, spojitost pravděpodobnosti: 2.16. Věta. Předpokládejme, že (Ω, A, P ) je pravděpodobnostní prostor. (i) Je-li A1 ⊂ A2 ⊂ · · · pro A1 , A2 , · · · z A, pak P
[ ∞
Ai
= lim P (Ai ) i→∞
i=1
(ii) Je-li A1 ⊃ A2 ⊃ · · · pro A1 , A2 , · · · z A, pak P
\ ∞
Ai
i=1
= lim P (Ai ) i→∞
Důkaz: (An ) splňuje (i) An = A1 ∪ (A2 \ A1 ) ∪ (A3 \ A2 ) ∪ · · · ∪ (An \ An−1 ) je disjunktní sjednocení. Pak P (An ) = P (A1 ) + P (A2 \ A1 ) + P (A3 \ A2 ) + + · · · + P (An \ An−1 ) . Dále platí ∞ [
An = A1 ∪ (A2 \ A1 ) ∪ (A3 \ A2 ) ∪ · · ·
n=1
28
P
P (An )
[ ∞
An
}| { z = P (A1 ) + P (A2 \ A1 ) + · · · + P (An \ An−1 ) + · · · =
n=1
= lim P (An ) n→∞
P
[ ∞ n=1
An
= lim P (An ) n→∞
(ii) obdobným způsobem, nebo z (i) přechodem k množinovému komplementu.
29
3
Nezávislé jevy a podmíněná pravděpodobnost
Pravděpodobnostní model se mění dostaneme-li částečnou informaci o systému. Víme, že nastal jev B. Pak pravděpodobnost, že nastane jev A je P (A ∩ B) . P (B) ——————————————————————— 3.1. Definice. Je dán pravděpodobnostní prostor (Ω, A, P ) a B ∈ A s P (B) > 0. Podmíněná pravděpodobnost náhodného jevu A za podmínky B je definována jako P (A|B) =
P (A ∩ B) . P (B)
Tedy P (A ∩ B) = P (A|B)P (B) = P (B|A)P (A) .
30
3.2. Příklad. Skříňka má tři zásuvky. V první jsou dvě zlaté mince, ve druhé zlatá a stříbrná mince a ve třetí dvě stříbrné mince. •z1
• z2
•z3
◦ s1
◦s2
◦ s3
Náhodně jsme vybrali zásuvku a náhodně z ní vytáhli minci. Tažená mince je stříbrná. Jaká je pravděpodobnost, že druhá mince ve vytažené zásuvce je zlatá? Řešení: naivní odpověď 1/2 není správná. Dvě fáze náhodného procesu: 1. volba zásuvky 2. volba mince Ω = {(1, z1 ), (1, z2 ), (2, z3 ), (2, s1 ), (3, s2 ), (3, s3 ), } Všechny tyto jevy mají stejnou šanci, tj. 1/6. Z . . . v otevřené zásuvce je zlatá mince S . . . vyjmuli jsme stříbrnou minci (tento jev nastal). Hledáme p = P (Z|S) P (S) = P {(2, s1 ), (3, s2 ), (3, s3 )} = P (Z ∩ S) = P {(2, s1 )} = 1/6 . p=
1/6 1 = . 3/6 3 31
1 3 = . 6 2
Formální vlastnosti podmíněné pravděpodobnosti: (i) P (B|B) = 1 (ii) P (A1 ∪ A2 |B) = P (A1 |B) + P (A2 |B) jsou-li A1 , A2 ∈ A disjunktní. ————————————————3.3. Tvrzení. Je-li (Ω, A, P ) pravděpodobnostní prostor a B ∈ A s P (B) > 0, pak (Ω, A, P ((·|B)) je také pravděpodobnostní prostor. ————————————————————– V pravděpodobnostním prostoru (Ω, A, P ((·|B)) mají jevy disjunktní s B nulovou pravděpodobnost, podmnožiny v B mají pravděpodobnost normovanou pravděpodobností jevu B.
32
Nezávislé jevy jsou jevy jejichž podmíněné pravděpodobnosti se neovlivňují: P (A), P (B) > 0 P (A ∩ B) P (B) P (A ∩ B) = P (A) · P (B) . P (A) = P (A|B) =
——————————————————3.4. Definice. Nechť (Ω, A, P ) je pravděpodobnostní prostor. Jevy A a B ∈ A nazýváme nezávislé, jestliže P (A ∩ B) = P (A) · P (B) . ———————————————————3.5. Příklad. Dvakrát hodíme mincí. Všechny výsledky jsou stejně pravděpodobné. Ukažte, že výsledky v prvním a druhém hodu jsou nezávislé. Řešení: R. . . rub, L . . . líc Ω = {RL, RR, LR, LL} 1 2 1 P ({RL, LL}) = 2 1 1 1 P ({RL}) = = · . 4 2 2
P ({RL, RR}) =
33
Obecnější definice:
3.6. Definice. Jevy A1 , . . . , An v pravděpodobnostní prostor (Ω, A, P ) jsou nezávislé, jestliže P (Ai1 ∩ Ai2 ∩ · · · ∩ Aik ) = P (Ai1 )P (Ai2 ) · · · P (Aik ) pro všechna i1 < i2 < · · · < ik , k ≤ n.
Bernoulliovo schéma (revisited) Výsledky pokusů v Bernoulliově schématu jsou nezávislé jevy. Bernoulliovo schéma tedy můžeme chápat jako sérii nezávislých pokusů se dvěma možnými výsledky, které mají doplňkovou pravděpodobnost.
34
3.7. Příklad. Elektrický obvod znázorněný na obrázku je náhodně přerušován pěti nezávislými spínači. V jedné větvi jsou tři spínače a ve druhé dva. Jaká je pravděpodobnost že obvodem prochází proud? Každý spínač je přerušen s pravděpodobností 1/2. Řešení: Ai . . . i-tý vypínač je sepnut p = P [(A1 ∩ A2 ∩ A3 ) ∪ (A4 ∩ A5 )] = = P (A1 ∩ A2 ∩ A3 ) + P (A4 ∩ A5 ) − P (A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5 ) = 1 1 11 1 = 3 + 2 − 5 = 5 = 0, 34375 . 2 2 2 2 3.8. Tvrzení. Jsou-li jevy A1 , . . . , An v pravděpodobnostním prostoru nezávislé, pak jsou nezávislé i jevy Ac1 , A2 , . . . , An . Důkaz: P (Ac1 ∩ A2 ∩ · · · ∩ An ) = P (A2 ∩ A3 ∩ · · · ∩ An ) − − P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A2 )P (A3 ) · · · P (An )−P (A1 )P (A2 ) · · · P (An ) = = (1 − P (A1 ))P (A2 ) · · · P (An ) = = P (Ac1 )P (A2 )P (A3 ) · · · P (An ) . Důsledek: Nahradíme-li v nezávislém systému jevů některé jevy jejich opakem, dostaneme opět nezávislý systém.
35
Situace: A1 , . . . , An disjunktní jevy, takové že P (A1 ) + P (A2 ) + · · · + P (An ) = 1 a P (Ai ) > 0 pro všechna i. Pak P ((A1 ∪ A2 ∪ · · · ∪ An )c ) = 0 . Pro každé B ∈ A máme P (B) = P (B ∩ A1 ) + P (B ∩ A2 ) + P (B ∩ A3 ) + · · · + P (B ∩ An ) + 0 = = P (B|A1 )P (A1 )+P (B|A2 )P (A2 )+· · ·+P (B|An )P (An ) . ———————————————————– 3.9. Definice. Posloupnost A1 , . . . , An disjunktních jevů v pravděpodobnostním prostoru (Ω, A, P ) se nazývá úplný systém jevů jestliže A1 , . . . , An jsou disjunktní, P (Ai ) > 0 pro všechna i a P (A1 ) + P (A2 ) + · · · + P (An ) = 1 . 3.10. Věta. (Věta o úplné pravděpodobnosti) Předpokládejme že A1 , . . . , An je úplný systém jevů v pravděpodobnostním prostoru (Ω, A, P ) takový, že P (Ai ) > 0 pro všechna i = 1, . . . n. Pro každé B ∈ A platí P (B) = P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + + · · · + P (B|An )P (An )
36
„P (B) je kombinace pravděpodobností P (A1 ), . . . , P (An ) s váhami danými podmíněnými pravděpodobnostmiÿ 3.11. Příklad. V urně č.1 je 50 černých a 60 bílých kuliček. V urně č.2 je 60 černých a 50 bílých kuliček. Hodíme si hrací kostkou. Padne-li šestka vybereme urnu č. 1. V opačném případě urnu č.2. Z vybrané urny vybereme náhodně kuličku. Jaká je pravděpodobnost, že je bílá? Řešení: 50 •
60 •
60◦
A1 ...padne šestka P (A1 ) = 1/6
(1)
50◦
A2 ...nepadne šestka P (A2 ) = 5/6
B . . . vytažená kulička je bílá
P (B|A1 ) =
p=
60 110
P (B|A2 ) =
50 . 110
50 5 1 25 31 60 1 · + · = + = = 110 6 110 6 11 66 66 = 0, 4697.
37
Bayesův vzorec Bayes (1761) . . . stejné apriorní pravděpodobnosti Laplace (1774) . . . obecný případ věta o úplné pravděpodobnosti: P (Ai ), P (B|Ai ) → P (B) nyní určíme P (Ai |B): 3.12. Věta. Bayesův vzorec Je-li A1 , . . . , An úplný systém jevů v pravděpodobnostním prostoru (Ω, A, P ) a B ∈ A s P (B) > 0 pak P (B|Aj )P (Aj ) P (Aj |B) = Pn i=1 P (B|Ai )P (Ai ) pro všechna j = 1, 2, . . . , n. Důkaz: P (Aj |B) =
P (Aj ∩ B) P (B|Aj )P (Aj ) = Pn P (B) i=1 P (B|Ai )P (Ai )
—————————————————————– vstup: P (A1 ), P (A2 ), . . . P (An ) . . . apriorní pravděpodobnosti P (B|A1 ), P (B|A2 ), . . . P (B|An ) . . . podmíněné pravděpodobnosti B . . . přináší novou informaci o stavu systému výstup: P (A1 |B), P (A2 |B), . . . P (An |B) —— upřesněná informace
38
3.13. Příklad. Máme dvě krabice s bílými a černými kuličkami. V krabici č. 1 je jedna bílá a devět černých kuliček. V krabici č.2 je jedna černá a devět bílých kuliček. 1◦
9•
č.1
1•
9◦
č.2
Za plentou byla vylosována jedna z krabic. Náhodně jsme z ní vytáhli jednu kuličku. Byla bíla. Jaká je pravděpodobnost, že máme před sebou krabici č.1. ?
A1 . . . první krabice A2 . . . druhá krabice B . . . tažena bílá kulička
P (A1 |B) =
1 2 1 P (A2 ) = 2 1 P (B|A1 ) = 10 9 P (B|A2 ) = . 10 P (A1 ) =
P (B|A1 )P (A1 ) P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) 1 1 ·1 ·1 1 . = 1 110 29 1 = 10 1 2 = 10 · + · 10 2 10 2 2
39
3.14. Příklad. Diagnóza nemoci Senzitivita testu: 0,95 (tj. má-li osoba AIDS je test pozitivní v 95% případů) specificita testu: 0,95 (tj. nemá-li osoba AIDS je test negativní v 95% případů) prevalence nemoci: 0,005 (tj. 0,5% populace je nakaženo) Jaká je pravděpodobnost, že osoba s pozitivním testem je nakažena virem HIV? (Naivní odpověď 0,95 je úplně mimo.) AIDS 0,005
NE-AIDS +, - . . . . výsledky testu 0,995
P (+|AIDS) = 0, 95 P (−|AIDS) = 0, 05
P (+|N EAIDS) = 0, 05 P (−|N EAIDS) = 0, 95
P (AIDS|+) = P (+|AIDS)P (AIDS) P (+|AIDS)P (AIDS) + P (+|N EAIDS)P (N EAIDS) 0, 95 · 0, 005 = = 0, 087 . 0, 95 · 0, 005 + 0, 05 · 0, 995 apriorní pravděpodobnosti → aposteriorní pravděpodobnosti (0, 005, 0, 995) → (0, 087, 0, 913) . =
40
Test opakujeme znovu. Testovaná osoba je opět pozitivní. Jaká je nyní pravděpodobnost že má AIDS ? Opakujeme postup s P (AIDS) = 0, 087
P (N EAIDS) = 0, 913 .
numerické výsledky: i . . . počet pozitivních testů, Pi . . . pravděpodobnost, že daná osoba má AIDS. i Pi
0 0,005
1 0,087
2 0,645
41
3 0,972
4 0,998
5 0,9992
4
Náhodná veličina
• Zajímá nás pouze sledovaná numerická veličina, nikoliv celý pravděpodobnostní prostor: počet zákazníků, cena akcie, hodnota měření napětí, . . . • Podstatné je stanovit pravděpodobnost, že náhodná veličina má hodnoty v daném rozmezí. ——————————————————– Značení: I . . . interval na reálné ose, zahrnujeme i jednobodové množiny. X : Ω → R . . . funkce definovaná na množině Ω. [X ∈ I] = {ω ∈ Ω | X(ω) ∈ I} .
4.1. Definice. Nechť (Ω, A, P ) je pravděpodobnostní prostor. Funkce X definovaná na Ω se nazývá náhodná veličina jestliže [X ∈ I] ∈ A pro všechny intervaly I ⊂ R.
42
Všechny funkce na konečném nebo diskrétním pravděpodobnostním prostoru jsou náhodné veličiny.
Náhodné veličiny popisujeme kvantitativně pomocí jejich distribučních funkcí: P [X ≤ x] = P ({ω | X(ω) ≤ x}) .
4.2. Definice. Předpokládejme, že X je náhodná veličina na pravděpodobnostním prostoru (Ω, A, P ). Distribuční funkce, FX , náhodné veličiny X je funkce FX (x) = P [X ≤ x],
x ∈ R.
43
4.3. Příklad. X . . . počet ok při hodu kostkou X nabývá šesti hodnot, 1,2,3,4,5,6; distribuční funkce je po částech spojitá funkce.
4.4. Příklad. X . . . poloha ručičky hodinek při náhodném zastavení: x 2π F (x) = 0 1
x ∈< 0, 2π > x≤0 x ≥ 2π .
4.5. Příklad. Vlak projíždí přejezdem jedenkrát za hodinu, Závory jsou staženy na dvanáct minut. Náhodná veličina X je doba čekání. P [X = 0] =
48 60 − 12 = = 0, 8 . 60 60
Pro x ∈ (0, 12 > máme: P [X ≤ x] = P [X = 0] + P [0 < X ≤ x] = 0, 8 + Tedy 0 0, 8 FX (x) = 0, 8 + 1
x 60
x<0 x=0 x ∈ (0, 12 > x ≥ 12
44
x . 60
4.6. Věta. Distribuční funkce FX náhodné veličiny X splňuje následující podmínky: (i) 0 ≤ FX ≤ 1 (ii) FX je neklesající (iii) FX je zprava spojitá (iv) limx→−∞ FX (x) = 0, limx→∞ FX (x) = 1 . Dukaz: (ii) Je-li x ≤ y, pak [X ≤ x] ⊂ [X ≤ y], a tedy FX (x) ≤ FX (y) . (iii) Volme (δn ) klesající posloupnost kladných čísel s nulovou limitou a a ∈ R. Uvažujme množiny An = [X ≤ a + δn ] . Platí ∞ \
An = [X ≤ a] .
n=1
Dle spojitosti pravděpodobnosti Věta 2.16 platí P [X ≤ a] = lim P (An ) . n→∞
Jinými slovy FX (a) = lim FX (a + δn ) , n→∞
a proto FX (a) = lim FX (x) . x→a+
45
(iv) An = [X ≤ −n] ,
n = 1, 2 . . .
Pak An je klesající posloupnost množin s prázdným průnikem. Dle Věty 2.16 máme lim FX (−n) = lim P (An ) = P (∅) = 0 .
n→∞
n→∞
FX je neklesající, a proto musí mít v −∞ limitu nula. (Druhá limita podobně.)
V distribuční funkci FX jsou všechny relevantní informace o náhodné veličině X: • P [X > a] = 1 − P [X ≤ a] = 1 − FX (a) . • P [X ∈ (a, b >] = P [(X ≤ b) ∧ (X ≤ a)c ] = = P [X ≤ b] − P [X ≤ a] = FX (b) − FX (a) . • 1 1 P [X < a] = lim P X ≤ a − = lim FX a − = lim FX (x) . n→∞ n→∞ x→a− n n • P [X = a] + P [X < a] = P [X ≤ a] . Odtud P [X = a] = FX (a) − lim FX (x) . x→a−
(Velikost případného skoku.) 46
4.7. Věta. Ke každé zprava spojité, neklesající funkci F (x) na R, s limitami limx→−∞ F (x) = 0, limx→∞ F (x) = 1, existuje náhodná veličina X tak, že FX = F . Důkaz je mimo naše možnosti – teorie míry. distribuční funkce (náhodná rozdělení) = náhodné veličiny.
Typy náhodných veličin: • diskrétní rozdělení • spojité rozdělení • smíšené rozdělení
47
4.8. Definice. Náhodná veličina X se nazývá diskrétní, jestliže existuje konečná nebo nekonečná posloupnost (xn ) taková, že X P [X = xn ] = 1 . n
Daná tabulkou resp. pravděpodobnostní funkcí: x1 p1
x2 p2
x3 p3
··· ···
P [X = xi ] = pi ,
(xn )n . . . uzly
4.9. Příklad. X . . . počet ok při hodu hrací kostkou 1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
4.10. Příklad. X . . . doba kdy poprvé padne líc při sérii hodů symetrickou mincí. 1
2
3
1 2
1 4
1 3
··· ···
P [X = n] =
1 . 2n
∞ X 1 = 1. 2n n=1
48
4.11. Tvrzení. Má-li náhodná veličina X diskrétní rozdělení s pravděpodobnostní funkcí (xn , pn )n , pak pro M ⊂ R platí X P [X ∈ M ] = pn . {n | xn ∈M }
4.12. Příklad. Jaká je pravděpodobnost, že při házení symetrickou mincí padne líc poprvé po sudém počtu hodů ? X z Příkladu 4.10. P [X = sudé] =
1 1 1 1 1 + + + ··· = 4 16 64 41−
49
1 4
=
1 . 3
4.13. Definice. Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f taková, že Zx f (t) dt .
FX (x) = −∞
Funkce f se přitom nazývá hustotou náhodné veličiny X.
• Funkce f je hustotouR náhodné veličiny právě tehdy ∞ když je nezáporná a −∞ f (t) dt = 1. • Je-li x bod spojitosti hustoty f , pak f (x) = FX (x)0 . Je-li f hustota náhodné veličiny X, pak Zb P [a ≤ X ≤ b] =
f (x) dx . a
Hustota dává preference hodnotám.
50
( 1 x ∈< 0, 1 > 4.14. Příklad. f (x) = 0 jinak (Rovnoměrné rozdělení) Pro x ∈< 0, 1 > Zx FX (x) = dt = x . 0
0 x ≤ 0 FX (x) = x x ∈< 0, 1 > 1 x≥1 ( 4.15. Příklad.
f (x) =
x+1 2
0
x ∈< −1, 1 > jinak
Pro distribuční funkci F (x) na intervalu < −1, 1 > platí Zx FX (x) = −1
2 x t+1 t t dt = + = 2 4 2 −1
x 1 (x + 1)2 x2 + + = . 4 2 4 4 Pravděpodobnost roste s kvadratickou rychlostí. Pro distribuční funkci máme x < −1 0 (x+1)2 FX (x) = x ∈< −1, 1 > 4 1 x≥1 =
51
x + 1 x ∈< −1, 0 > f (x) = 1 − x x ∈< 0, 1 > 0 jinak
4.16. Příklad. Pro x ∈< −1, 0 > Zx FX (x) =
(t + 1) dt =
t2 +t 2
x
−1
= −1
x2 1 +x+ . 2 2
Pro x ∈< 0, 1 > 1 FX (x) = + 2
Zx (1 − t) dt = 0
x 1 t2 x2 1 + t− =− +x+ . 2 2 0 2 2
4.17. Příklad. (Semicircular law) ( f (x) = Z p
1 2π
√
4 − x2
0
4 − x2 dx =
x ∈< −2, 2 > jinak
1 p x (x 4 − x2 + 4 arcsin ) + c . 2 2
Pro x ∈< −2, 2 > tedy máme:
FX (x) =
x 1 1 1 p x 4 − x2 + arcsin + . 4π π 2 2
52
4.18. Příklad.
f (x) =
1 −|x| e . 2
Pro x < 0
1 FX (x) = 2
Zx
et dt =
ex . 2
−∞
Pro x ≥ 0
1 1 FX (x) = + 2 2
Zx
e−t dt =
0
53
1 1 −x 1 1 − e + = 1 − e−x . 2 2 2 2
4.19. Příklad. Střílíme na terč o poloměru r. Výhra je dána vzdáleností zásahu d od středu terče vzorcem X = 10(r − d) . Nalezněte hustotu veličiny X. Řešení: Pro 0 ≤ x ≤ 10r x P [X ≤ x] = P [10r − 10d ≤ x] = P d ≥ r − = 10 x 2 x 2 (r − 10 π(r − 10 ) ) x = 1− . = 1−P d ≤ r− = 1− 2 2 10 πr r Hustota pro x ∈ (0, 10r >: f (x) =
0 FX (x)
−2(r − = r2
x 10 )
−1 x 1 · = 2 r− . 10 5r 10
Hustota je nulová mimo interval < 0, 10r >.
54
Důležité je reprezentovat náhodnou veličinu číselnými charakteristikami. Jednou z nich je střední hodnota. Motivace: Ve škole je N žáků z toho n1 n2 n3 n4 n5
má má má má má
pi =
prospěch prospěch prospěch prospěch prospěch
ni N
x1 x2 x3 x3 x5
=1 =2 =3 =4 =5
. . . relativní četnost.
Průměrný prospěch = n1 x1 + n2 x2 + n3 x3 + n4 x4 + n5 x5 = = N n2 n3 n4 n5 n1 x1 + x2 + x3 + x4 + x5 = = N N N N N = x1 p1 + x2 p2 + x3 p3 + x4 p4 + x5 p5 .
55
4.20. Definice. Nechť X je diskrétní náhodná veličina, která nabývá hodnot x1 , x2 , . . . s pravděpodobnostmi X P [X = xi ] = pi , pi = 1 . i
Předpokládejme, že X |xi | pi < ∞ . i
Střední hodnota, EX, veličiny X je definovaná vztahem EX =
X
xi pi .
i
4.21. Definice. Nechť X je náhodná veličina s hustotou f (x) taková, že Z∞ |x|f (x) dx < ∞ . −∞
Střední hodnota, EX, veličiny X je definována vztahem: Z∞ EX =
x f (x) dx . −∞
56
4.22. Příklad. Konstantní náhodná veličina P [X = c] = 1 EX = c · 1 = c .
4.23. Příklad. Počet ok při hodu hrací kostkou EX =
1 (1 + 2 + 3 + 4 + 5 + 6) = 3, 5 . 6
4.24. Příklad. Alternativní rozdělení
0 1−p
1 p
EX = 0 · (1 − p) + 1 · p = p . V tomto případě splývá střední hodnota s pravděpodobností p.
57
4.25. Příklad. Házíme symetrickou mincí. X je počet hodů než padne první líc.
P [X = n] =
EX =
1 , 2n
n = 1, 2, . . .
∞ X n . n 2 n=1
Při výpočtu si pomůžeme teorií mocninných řad. ∞ X
xn =
n=0
1 , 1−x
pro |x| < 1 .
Derivace člen po členu: ∞ X
n xn−1 =
n=1
1 1−x
0 =
Pronásobením x ∞ X
n xn =
n=1
Dosazením x =
x (1 − x)2
1 2
∞ X n 2 EX = = = 2. n 2 1 n=1
58
1 . (1 − x)2
Na každá náhodná veličina má definovánu střední hodnotu. Např. diskrétní veličina s pravděpodobnostní funkcí P [X = 2n ] =
1 , 2n
n = 1, 2 . . .
nemá střední hodnotu neboť ∞ ∞ X X 2n = 1 = ∞. 2n n=1 n=1
4.26. Příklad. Hustota ( x+1 x ∈< −1, 1 > 2 f (x) = 0 jinak
Z1 EX = −1
3 1 x+1 x x2 1 x dx = + = . 2 6 4 −1 3
59
4.27. Příklad. Semicircular law
1 EX = 2π
Z2 p x 1 − x2 dx = 0 . −2
4.28. Věta. Jsou-li X1 a X2 náhodné veličiny na pravděpodobnostním prostoru (Ω, A, P ), pak (i) E(X1 + X2 ) = EX1 + EX2 , α ∈ R.
(ii) E(αX1 ) = αE(X1 ) , (iii) E(X1 ) ≥ 0 je-li X1 ≥ 0.
60
Podrobnější popis rozložení hodnot kolem střední hodnoty poskytuje rozptyl
4.29. Definice. Rozptyl (variance) náhodné veličiny X, pro kterou existuje EX a EX 2 je definován varX = E[(X − EX)2 ] . Značení: var(X), D(X), Směrodatná odchylka:
p
var(X).
E[(X − EX)2 ] = E[X 2 − 2 X · (EX) + (EX)2 ] = = E(X 2 ) − (EX)2 .
Způsob výpočtu:
EX 2
=
X
x2i pi . . . diskrétní veličina
i
EX 2
Z∞ =
x2 f (x) dx . . . spojitá veličina
−∞
61
4.30. Příklad. Alternativní rozdělení X 0 1−p
1 p
X2 : 0 1−p
1 p
var(X) = EX 2 − (EX)2 = p − p2 = p(1 − p) . var(X) ≤
1 4
Nejvyšší možná hodnota rozptylu je pro p =
62
1 2
a to 41 .
4.31. Definice. Nechť FX (x) je distribuční funkce náhodné veličiny X. Předpokládejme, že pro každé α ∈ (0, 1) existuje právě jedno β tak, že F (β) = α. α-kvantil náhodné veličiny X je číslo, pro které platí FX (xα ) = α .
α = P [X ≤ xα ] . −1 Je-li FX prostá, pak xα = FX (α) . −1 FX se v tomto případě nazývá kvantilová funkce.
Významné kvantily: x0,5 . . . x0,75 . . . x0,25 . . . x0,9 . . . x0,1 . . . x0,99 . . .
medián horní kvartil dolní kvartil horní decil dolní decil horní percentil
Statistické tabulky: Průměrný čistý plat v ČR na osobu v domácnosti v roce 2003 byl 8175 KČ. Dolní decil x0,1 =4524 KČ.
63
4.32. Příklad. X je spojité rozdělení s hustotou f (x) = x+1 2 , x ∈< −1, 1 > a nula jinak. Viz Příklad 4.15. F (x) =
1 (x + 1)2 , 4
x ∈< −1, 1 > .
α ∈ (0, 1)
1 (x + 1)2 = α 4 √ 4α |x + 1| = √ xα = 2 α − 1 F (x)
=
Např. medián p x0,5 = 2 1/2 − 1 .
64
4.33. Příklad. Doba rozpadu radioaktivního atomu je náhodná veličina s hustotou ( λ e−λx x ≥ 0 f (x) = 0 x < 0, kde λ > 0. Určete poločas rozpadu. Řešení: Poločas rozpadu je medián. Pro distribuční funkci máme Zx F (x) =
λe−λt dt = [−e−λt ]x0 = 1 − e−λx .
0
1 − e−λx = 0, 5 e−λx = 0, 5 −λx = − ln 2 ln 2 x = λ Poločas rozpadu je medián x0,5 =
ln 2 . λ
65
4.34. Tvrzení. Platí-li pro náhodné veličiny X a Y vztah Y = aX + b ,
a, b ∈ R, a > 0 ,
pak yα = axα + b pro všechna α ∈ (0, 1). Důkaz: α = P [X ≤ xα ] = P [aX + b ≤ axα + b] = P [Y ≤ axα + b] . | {z } yα
66
5
Důležitá rozdělení
Diskrétní rozdělení
Alternativní rozdělení A(p), 0 < p < 1. 0 1−p
1 p
EX = p varX = p(1 − p) .
Binomické rozdělení Bi(n, p), n ∈ N, 0 < p < 1. 0 p0
1 p1
2 p2
... ...
n pn
n k P [X = k] = pk = p (1 − p)n−k k
67
k = 0, 1, . . . , n .
X = počet zdarů v sérii n pokusů Bernoulliova schématu. • počet líců v sérii n hodů • počet osob volící daný politický subjekt z n dotázaných • počet osob sledujících daný TV pořad z n sledovaných • počet částic v náhodně zvolené příhrádce z n příhrádek • počet vadných sučástek z n náhodně vybraných součástek ( 1 nastal-li zdar v i − tém pokusu Xi = 0 jinak Xi má rozdělení A(p). X = X1 + X2 + · · · + Xn .
68
5.1. Příklad. S.Pepys (1693), náruživý hráč v kostky. Co je pravděodobnější, že šesti kostkami hodíme alespoň jednu šestku (jev A), nebo že dvanácti kostkami hodíme alespoň dvě šestky (jev B)? Vyřešil Newton. počet šestek při hodu šesti kostkami . . . Bi(6, 1/6). (p = 61 ) P (A) =
6 X 6 k=1
k
pk (1 − p)n−k =
6 0 1− p (1 − p)6 = 0, 6651 . 0 počet šestek při hodu dvanácti kostkami . . . Bi(12, 1/6). (p = 61 )
P (B) =
12 X 12
6
pk (1 − p)n−k =
k=2 12 0 12 12 1− p (1−p) − p(1−p)11 = 0, 6189 . 0 1
69
Domácí cvičení: Pravděpodovbnost, že 18 kostkami hodíme alespoň 3 šestky je 0,5973.
5.2. Příklad. Náhodná procházka Částice se pohybuje po ose x. Začíná v bodě 0. V daném stádiu se rozhodne s pravděpodobností 1/2 jít doprava a s pravděpodobností 1/2 doleva. Sn je poloha částice v čase n. Jaké je rozdělení Sn ? Bernoulliovo schéma, n pokusů; p = 12 . 1. . jdeme doprava, -1. . . jdeme doleva. Je-li k jedniček a n − k -jedniček, pak je poloha k − (n − k) = 2k − n k = 0, . . . n . n −n P [Sn = 2k − n] = 2 . k (Dá se ukázat, že částice s pravděpodobnosí jedna navštíví každý bod. Totéž pro dvě dimenze, ne však pro tři.)
70
5.3. Příklad. Maxwellovo-Boltzmanovo schéma Máme n částic a r příhrádek. Každá částice si vybírá nějakou příhrádku. Všechny možnosti mají stejnou šanci. Jaké je rozložení počtu částic v pevně zvolené příhrádce? Bernoulliovo schéma: vybraná částice si zvolí danou přihrádku, celkem n pokusů (máme n částic). Šance zdaru je 1r . Náhodná veličina má rozdělení Bi(n, 1r ). Konkrétní situace: 5.4. Příklad. Máme n = 500 osob a r = 365 příhrádek (narozeniny). Počet osob mající naroze1 niny dne 18.7. (jako přednášející) se řídí Bi(500, 365 ). Tabulka numerických hodnot: počet 0 1 2 3 4 5 6 pravděpodobnost 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023
71
Pravděpodobnost, že tři osoby mají narozeniny 18.7. je 0,1089 . další modely: osoby obsazující vagóny, výsledky hodu kostkou padající do 6 možností, . . .
72
Charakteristiky Bi(n, k). X = X1 + X2 + · · · + Xn Xi . . . A(p), EXi = p. EX = EX1 + EX2 + · · · + EXn = np . E(X 2 ) = E(X1 +X2 +· · ·+Xn )2 = EX12 +EX22 · · ·+EXn2 + + 2E(X1 X2 ) + 2E(X1 X3 ) + · · · . Je-li i 6= j máme pro Xi Xj rozdělení 0 1 − p2
1 p2
Tedy E(Xi Xj ) = p2 , což znamená, že n 2 2 EX = np + 2 · p . 2 Konečně, n 2 2 2 var(X) = EX −(EX) = np+2· p −n p = 2 n(n − 1) 2 2 2 p −n p = np−np2 = np(1−p) . np+2 2 2
2
73
Má-li X rozdělení Bi(n, p), pak EX = np
varX = np(1 − p)
Průměrný počet šestek při sérii n hodů hrací kostkou je n6 .
Průměrný počet částic v jedné přihrádce u 500 částic náhodně rozptýlených v 365 příhrádkách je 500 = 1, 369863014. 365 ...
74
Co se děje s binomickým rozdělením, jestliže se nemění střední hodnota, ale počet pokusů jde do nekonečna? 5.5. Věta. Poissonova věta Předpokládejme, že (Xn )∞ n=1 je posloupnost náhodných veličin majících rozdělení Bi(n, nλ ), kde λ > 0. (Tj. EXn = λ pro všechna n.) Pak lim P [Xn = k] =
n→∞
λk −λ e . k!
Důkaz: pn =
λ . n
n k P [Xn = k] = p (1 − pn )n−k = k n n 1 npn · (n − 1)pn · · · (n − k + 1)pn λ = 1− . k! (1 − pn )k n λ npn = lim n→∞ 1 − n→∞ 1 − pn lim
λ n
= λ.
λ − nλ (n − 1)pn = λ. = lim n→∞ 1 − pn n→∞ 1 − λ n lim
75
Tedy n λ λk λk lim 1 − lim P [Xn = k] = = e−λ . n→∞ k! n→∞ n k! Aproximujeme pro n velké a pn malé P [X = k] ∼
λk −λ e . k!
5.6. Příklad. Stroj produkuje 1% zmetků. Jaká je pravděpodobnost, že z 200 náhodně vybraných výrobků neni žádný zmetek? X ∼ Bi(200,
1 ) 100
P [X = 0] = 0, 99200 = 0, 1340 . Aproximace pomocí Poissonovy věty: 1 =2 100 . P [X = 0] = e−2 = 0, 1353.
λ = 200 ·
76
n částic se náhodně rozděluje do r příhrádek, přičemž n, r → ∞ při konstantním poměru λ = nr . Počet částic v pevně zvolené příhrádce se asymtoticky řídí Poissonovým zákonem s parametrem λ. 5.7. Příklad. X ∼ Bi(500, 365) . . . viz Příklad 5.4. počet binomický zákon Poissonův zákon
0 1 2 3 4 5 6 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023 0,2541 0,3481 0,2385 0,1089 0,0372 0,0102 0,0023
77
Poissonovo rozdělení Náhodná veličina X, která nabývá hodnot 0, 1, . . . s pravděpodobnostmi λn −λ P [Xn = n] = e , n = 0, 1, . . . n! P o(λ) P [X = 0] = e−λ
P [X > 0] = 1 − e−λ .
5.8. Příklad. Lahve se vyrábějí ze skloviny obsahující kazy, keré jsou rozděly nepravidelně tak, že v každém metrickém centu skloviny je průměrně x kazů. Láhev váží 1 kg a je vadná obsahuje-li jeden či více kazů. Stanovte procento vadných lahví. Řešení Z M metrických centů se vyrobí 100M lahví, které budou obsahovat přibližně xM kazů. Pro počet kazů v jedné lahvi tedy máme rozdělení 1 Bi(xM, ). 100M 1 x EX = λ = xM = . 100M 100 78
Pro M → ∞ máme rozdělení x Po 100 Pravděpodobnost, že láhev bude bez kazu je x
1 − e− 100 . Je-li například x = 30, pak procento vadných lahví bude 1 − e−0,3 = 0, 2592. Při velkém počtu kazů je výhodnější vyrábět menší lahve. Je-li např. váha lahve 0, 25kg je procento zmetků 7, 22%.
79
Charakteristiky P (λ):
X ∞ ∞ X λn −λ λn−1 EX = n e =λ e−λ = n! (n − 1)! n=0 n=1 = λeλ e−λ = λ .
=λ
EX 2 =
∞ X
n2
n=0 ∞ X −λ
=e
n=2
λn −λ e n!
z }| { ∞ n n X λ λ = n(n−1) e−λ + n e−λ = n! n! n=2 n=0 ∞ X
∞ X λn λn−2 −λ 2 +λ = e λ +λ = (n − 2)! (n − 2)! n=2
= e−λ λ2 eλ + λ = λ2 + λ . Tedy var(X) = EX 2 − (EX)2 = λ2 + λ − λ2 = λ .
E(X) = λ var(X) = λ
80
Příklady Poissonova rozdělení: (homogenní chaos v prostoru nebo čase) • počet volání na telofonní ústřednu za jednotku času • počet atomů radioaktivní látky rozpadlých za jednotku času • počet hvězd v daném objemu galaxie • počet létavic meteorického roje za jednotku času • počet střel zasahující danou oblast • počet defektů kola (bad luck) za jednotku času • počet zákazníků za jednotku času
81
Geometrické rozdělení Ge(p), 0 < p < 1. X je počet zdarů v Bernoulliově schématu před prvním nezdarem. P [X = 0] = 1 − p . P [X = 1] = (1 − p)p . P [X = 2] = (1 − p)p2 . ................................... P [X = k] = (1 − p)pk
82
k = 0, 1, . . . .
5.9. Příklad. Dva hráči se střídají a házejí hrací kostkou. Vyhrává ten komu padne šestka. Jaká je pravděpodobnost výhry u jednotlivých hráčů?
X . . . geometrické rozdělení s p =
5 . 6
A . . . vyhrává hráč, který začíná
P (A) = P [X = sudé] =
∞ X
(1−p)p
2k
= (1−p)
k=0
1 1 = = = (1 − p) 2 1−p 1+p 1 6 = = 0, 54545455 . 5 = 11 1+ 6
83
∞ X k=0
p2k =
Střední hodnota geometrického rozdělení:
EX =
∞ X
n
n (1 − p) p = (1 − p)
n=0
∞ X
n pn =
n=0
d = (1−p) p dp
X ∞
p
n
n=0
= (1 − p)p
d 1 = (1−p)p = dp 1 − p
1 p . = (1 − p)2 1−p
5.10. Příklad. Žák umí 90% látky. Kolik přežije průměrně otázek? Ge(p), p = 0, 9 EX =
0, 9 = 9. 1 − 0, 9
84
Rozptyl ∞ ∞ d2 X n X p = n(n − 1)pn−2 . dp2 n=0 n=0
2
E(X ) − EX =
∞ X
n(n − 1)(1 − p)pn =
n=0 ∞ X
2
d = (1−p)p 2 dp 2
n
p = (1−p)p
n=0
= (1 − p)p2
2
1 1−p
00 =
2 2p2 = . (1 − p)3 (1 − p)2
p2 p 2p2 − + = (1 − p)2 1 − p (1 − p)2 p2 p2 + p(1 − p) p = + = (1 − p)2 1 − p (1 − p)2 p . = (1 − p)2
E(X 2 )−(EX)2 =
85
p 1−p p varX = . (1 − p)2 EX =
Rovnoměrné rozdělení na < a, b > R < a, b >. Hustota: ( f (x) =
1 b−a
0
x ∈< a, b > jinak
Distribuční funkce: x−a b−a F (x) = 0 1
x ∈< a, b > x
b
86
Zb EX = a
2 b 1 1 x x dx = = b−a b−a 2 a =
1 EX = b−a 2
Zb
x2 dx =
a+b b 2 − a2 = . 2(b − a) 2
1 b 3 − a3 = b−a 3
a
=
a2 + ab + b2 . 3
a2 + ab + b2 a2 + 2ab + b2 − = 3 4 1 a2 − 2ab + b2 = (b − a)2 . = 12 12
var(X) = E(X 2 )−(EX)2 =
a+b 2 1 varX = (b − a)2 . 12 EX =
87
Normální rozdělení (Gaussovo rozdělení) N (µ, σ 2 ). µ ∈ R, σ 2 > 0. hustota:
f (x) = √
(x−µ)2 1 e− 2σ2 2πσ
Vychází z Laplaceova integrálu: Z∞
2
e−x dx =
√
π.
−∞
standardní, normované normální rozdělení: N (0, 1). značení: 1 Φ(x) = √ 2π
Zx
t2
e− 2 dt
−∞
počítá se numericky, tabelována. 88
Souvislost mezi normálními rozděleními různých parametrů. • Má-li Y rozdělení N (0, 1) =⇒ X = µ + σ Y má rozdělení N (µ, σ 2 ). Odvození: FX (x) = P [X ≤ x] = P [µ + σ Y ≤ x] = x−µ x−µ =P Y ≤ =Φ σ σ x−µ ( σ )2 d 1 1 FX (x) = √ e− 2 · = dx σ 2π (x−µ)2 1 = √ e− 2σ2 . 2πσ
• Má-li X rozdělení N (µ, σ), pak Y = rozdělení N (0, 1).
89
X−µ σ
má
5.11. Příklad. S jakou pravěpodobností má veličina X s rozdělením N (1, 4) hodnotu v intervalu < 3, 5 > ?
5−1 3−1 P [3 ≤ X ≤ 5] = Φ −Φ = 2 2 = Φ(2)−Φ(1) = 0, 97250−0, 841345 = 0, 131155.
5.12. Tvrzení. Vzhledem k tomu, že hustota standardního normálního rozdělení je sudá funkce, platí Φ(x) = 1 − Φ(−x)
90
x ∈ R.
5.13. Příklad. Spočtěte pravděpodobnost, že veličina X s rozdělením N (0, σ 2 ) má hodnotu v intervalu < −a, a >, kde a > 0. Řešení: a X a P [−a ≤ X ≤ a] = P [− ≤ ≤ ]= σ σ σ a a a a =Φ −Φ − =Φ − 1−Φ = σ σ σ σ a 2Φ − 1. σ Střední hodnota a rozptyl normálního rozdělení: Pro Y s rozdělením N (0, 1) platí 1 EY = √ 2π
Z∞
x2
xe− 2 dx = 0 .
−∞
91
1 1= √ 2π
Z∞
x2
e− 2 dx .
−∞
Použijeme metodu per partes pro u0 = 1
x2
v = e− 2
x2
u = x v 0 = −xe− 2 a dostaneme
∞ Z∞ x2 x2 1 1 1= √ +√ xe− 2 x2 e− 2 dx . 2π 2π {z −∞} | −∞ =0
Odtud plyne, že var(Y ) = E(Y 2 ) = 1 . Obecně: X má rozdělení N (µ, σ 2 ) X = σY + µ , a proto EX = σEY + µ = µ .
92
X 2 = σ 2 Y 2 + 2µσY + µ2 EX 2 = σ 2 + 0 + µ2 . varX = E(X 2 ) − (EX)2 = σ 2 + µ2 − µ2 = σ 2 . Závěr:
EX = µ var(X) = σ 2 .
93
kvantilová funkce a kvantily uα . . . α-kvantil N (0, 1). kvantilová funke je inverzní funkce Φ−1 . Některé numerické hodnoty: u0,5 = 0, u0,95 = 1, 644, u0,975 = 1, 95996 u0,999 = 3, 09023 Pro α → 1 jde uα → ∞.
5.14. Tvrzení. (i) u1−α = −uα pro všechna α ∈ (0, 1). (ii) Pro α-kvantil xα rozdělení N (µ, σ 2 ) platí xα = µ + σ uα .
94
5.15. Příklad. Určete interval < −a, a > tak, aby náhodná veličina Y s rozdělením N (0, 1) měla v tomto intervalu hodnotu s pravděpodobností 0,95. . a = u0,975 = 1, 96 .
Pravidlo 3σ Máme rozdělení X typu N (µ, σ 2 ). Určeme P [|X − µ| ≤ 3σ] . Řešení:
|X − µ| ≤ 3 = Φ(3) − Φ(−3) = P σ = 2Φ(3)−1 = 2·0, 99865−1 = 0, 99730 .
Po třech σ zbývají asi tři promile případů.
95
5.16. Příklad. Pro oděvní továrnu je neziskové vyrábět šaty pro velmi malé a velmi velké muže. Záměr je nevyrábět pro 7,5% největších a 7,5% nejmenších mužů. Ví se, že výška mužů (v palcích) má rozdělení N (69, 2, 82 ). Nalezněte největší a nejmenší výšku pro kterou vyrábět. Řešení u0,925 = 1, 43953 .
x0,925 = 69 + 2, 8 · 1, 43953 = 73, 03068 x0,075 = 69 − 2, 8 · 1, 43953 = 64, 96932
96
5.17. Příklad. Výsledky přijímacích zkoušek se řídí normálním rozdělením s rozptylem 100. Je přijato 30% uchazečů. Hranice pro přijetí je 85 bodů. Jaký je průměrný výsledek u zkoušky? Řešení: N (µ, σ 2 ) x0,7 = µ + 10 · u0.7 . µ = 85 − 10 · u0,7 = 85 − 10 · 0, 52440 = 79, 8 . 5.18. Příklad. Máme rozdělení N (µ, 0, 5). Jak zvolit střední hodnotu, aby P [X ≥ 2] = 0, 01 . Řešení: 2−µ X −µ ≥ √ = 0, 01 P √ 0, 5 0, 5
2−µ √ = u0,99 0, 5 p . µ = 2 − 0, 5 · u0,99 = 0, 355023643 97
Exponenciální rozdělení Exp(λ)
λ>0
hustota: ( λ e−λx f (x) = 0
x≥0 x < 0.
distribuční funkce: x≥0 Zx F (x) =
λ e−λx dx = 1 − e−λ x .
0
funkce přežití: P [X ≥ x] = e−λ x Exponenciální rozdělení popisuje čas do první ”poruchy” u systému ”bez paměti”
98
Odvození: Hledáme funkci přežití R(t) = P [X ≥ t] tak, aby byly splněny následující předpoklady: (i) R(0) = 1 (ii) P [X ≥ t + h|X ≥ t] = P [X ≥ h] pro všechna x, h ≥ 0. (iii) R je diferencovatelná klesající funkce Z toho plyne: P [X ≥ t + h] = P [X ≥ t] · P [X ≥ h] . R(t + h) = R(t)R(h)
R(t + h) − R(t) R(t)R(h) − R(t) = = h h R(h) − 1 = R(t) h
99
Limitním přechodem h → 0+ dostaneme R0 (t) = R(t) · R0 (0) R(0) = 1 Diferenciální rovnice s počáteční podmínkou. Označme R0 (0) = −λ (λ > 0). Řešení (jediné): R(t) = e−λt . R(t) tedy vede na exponenciální rozdělení.
100
Střední hodnotu a rozptyl získáme integrací (per partes) 1 λ 1 var(X) = λ2 E(X) =
λ . . . ”intenzita poruch” Příklady exponenciálního rozdělení: • doba rozpadu atomu • doba do registrace zákazníka • doba do příletu létavice v meteorickém roji
101
5.19. Příklad. Na přílet meteoritu se průměrně čaká deset minut. Jaká je pravděpodobnost, že budeme na ”padající hvězdu” čekat dvě minuty? Řešení: 1 = 10 λ
λ = 0, 1
. F (2) = 1 − e−2·0,1 = 1 − e−0,2 = 0, 18127 .
102
6
Transformace náhodných veličin
Nutnost přepočítat distrubuční funkci. Například máme měření rychlosti a chceme ho přepočítat na energii. Obecná úloha: X je náhodná veličina, h : R 7→ R Y = h(X) • Diskrétní náhodná veličina se vždy zobrazí na diskrétní 6.1. Příklad. Diskrétní rozdělení X s pravděpodobnostní funkcí
Y = X2 . . .
-1 0 1 0,3 0,2 0,5
1 0 1 0,3 0,2 0,5
Y ... 0 1 0,2 0,8 103
Obecně stanovíme transformaci pomocí distribuční funkce: Y = h(X) FY (y) = P [h(X) ≤ y]
6.2. Příklad. Rychlost molekul plynu má rozdělení N (0, 1). Molekula má hmotnost m. Nalezněte distribuční funkci a hustotu energie částice. X ∼ N (0, 1) 1 Y = mX 2 2 Nerovnice 21 mX 2 ≤ y má řešení pouze pro y ≥ 0. y≥0 r r 1 2 2 FY (y) = P [ mX 2 ≤ y] = P [X ∈< − y, y >] = 2 m m r r r 2 2 2 =Φ y −Φ − y = 2Φ y −1 . m m m
104
Hustota je pro y > 0 derivací distribuční funkce: 2 1 my g(y) = 2 √ e− 2 · 2π
r
y 2 1 1 · √ =√ e− m m 2 y mπy
Pro y ≤ 0 je g(y) = 0 . Důležitý je případ lineární transformace. Y = aX + b, a 6= 0 a>0 y−b y−b FY (y) = P [aX + b ≤ y] = P X ≤ = FX . a a a<0 y−b y−b = 1 − FX − . FY (y) = P [aX + b ≤ y] = P X ≥ a a
105
Užitečné je aplikovat toto pravidlo na spojité rozdělení 6.3. Tvrzení. Je-li X spojitá náhodná veličina s hustotou f (x), pak náhodná veličina a 6= 0
Y = aX + b ,
je spojitá a má hustotu y−b 1 f . g(y) = |a| a Důkaz: a>0
y−b FY (y) = F a
Derivací podle y: 1 y−b g(y) = f . a a a<0
y−b FY (y) = 1 − F a 106
Derivací podle y: y−b 1 . g(y) = − f a a 6.4. Příklad. X má rovnoměrné rozdělení na intervalu < 0, 3 >. Určete hustotu Y = 2X + 1 1 y−1 g(y) = f . 2 2 y−1 ∈< 0, 3 > ⇐⇒ y ∈< 1, 7 > . 2 ( 1/6 y ∈< 1, 7 > g(y) = 0 jinak Y má rovnoměrné rozdělení na intervalu < 1, 7 >.
107
6.5. Příklad. Y = −X, kde X má rozdělení N (0, 1). (−y)2 y2 1 1 g(y) = √ e− 2 = √ e− 2 2π 2π
Y má také rozdělení N (0, 1).
6.6. Příklad. X má rozdělení Exp(1). Určete rozdělení −X. g(y) = f (−y) ( ey y ≤ 0 g(y) = 0 y > 0.
108
Nelineární transformace náhodné veličiny Předpoklady: X má hustotu f (x) soustředěnou na intervalu I a h je rostoucí diferencovatelná funkce definovaná na I, jejíž obor hodnot je interval J. Y = h(X) Pro y ∈ / J bude hustota nulová. Pro y ∈ J −1 (y) hZ
FY (y) =
f (x) dx −∞
Substituce: t = h(x), x = h−1 (t), dt = h0 (x) dx. Zy FY (y) =
f (h−1 (t))
dt h0 (h−1 (t))
−∞
Podobně lze postupovat v případě, kdy h je klesající, nebo je možno použít −(−h).
109
Závěr:
g(y) =
f (h−1 (y)) . |h0 (h−1 (y))|
pro y ∈ J a nula jinak.
6.7. Příklad. Logaritmicko-normální rozdělení Y = eX , kde X má rozdělení N (µ, σ 2 ). h(x) = ex , g(y) =
h−1 (x) = ln x ,
J = h(R) = (0, ∞) .
(ln y−µ)2 1 f (ln y) 1 − 2σ 2 √ e , = eln y y 2πσ
pro y > 0; a nula jinak.
110
K výpočtu střední hodnoty transformované veličiny nepotřebujeme znát rozdělení transformace: 6.8. Věta. Předpokládejme, že X je náhodná veličina a Y = h(X). Pak X (i) E(Y ) = h(xi )pi , i∈I
je-li X diskrétní náhodná veličina s pravděpodobnostní funkcí (xi , pi )i∈I . Z∞ (ii)
E(Y ) =
f (x)h(x) dx −∞
je-li X spojitá náhodná veličina s hustotou f (x). Důkaz: (i) h(Y ) má (včetně násobnosti) pravděpodobnostní funkci (h(xi ), pi )i∈I , a proto X h(xi )pi . E(Y ) = i∈I
(ii) je spojitou verzí.
111
6.9. Příklad. Určete střední hodnotu třetí mocniny rozdělení Exp(1). Z∞ E(Y ) =
x3 e−x dx = 6 .
0
112
7
Náhodné vektory
Značení:
x = (x1 , x2 , . . . xn ) ∈ Cn
7.1. Definice. Nechť (Ω, A, P ) je pravděpodobnostní prostor. Zobrazení X : Ω → Rn X(ω) = (X1 (ω), X2 (ω), . . . , Xn (ω)) , kde X1 , . . . , Xn jsou náhodné veličiny na Ω, se nazývá náhodný vektor. Veličiny X1 , . . . , Xn se nazývají marginální rozdělení vektoru X. Nestačí znát marginální distribuční funkce, ale distribuční funkci sdruženou. Značení: [X ≤ x] = [X1 ≤ x1 ∧ X2 ≤ x2 ∧ · · · ∧ Xn ≤ xn ]. 7.2. Definice. Je-li X : Ω → Rn náhodný vektor, pak distribuční funkci FX : Rn → R definujeme jako FX (x) = P [X ≤ x] .
113
7.3. Příklad. X má distribuční funkci F . Určete distribuční funkci náhodného vektoru X = (X, X)
FX (x, y) = P [X ≤ x ∧ X ≤ y] = = P [X ≤ min(x, y)] = F (min(x, y))
Pomocí distribuční funkce spočítáme všechny relevantní pravděpodobnosti: např. X = (X, Y ) P [(a < X ≤ b) ∧ (c < Y ≤ d)] = = FX (b, d)−FX (a, d)−FX (b, c)+FX (a, c) .
114
Základní vlastnosti vícerozměrné distribuční funkce: 7.4. Věta. Je-li F (x1 , . . . , xn ) sdružená distribuční funkce náhodných veličin X1 , . . . , Xn , pak (i) limx1 →∞,x2 →∞,... ,xn →∞ F (x1 , . . . , xn ) = 1 (ii)
lim
x1 →−∞,x2 →−∞,... ,xn →−∞
F (x1 , . . . , xn ) = 0
(iii) F je zprava spojitá a neklesající v každé proměnné. Tyto vlastnosti nestačí k tomu, aby F byla distribuční funkcí. Musí splňovat složitejší podmínku pro hodnoty ve vrcholech vícerozměrných intervalů.
Jak spočítat marginální rozdělení vektoru X = (X1 , . . . , Xn )? FX1 (x) =
lim
x2 →∞,x3 →∞,... ,xn →∞
115
FX (x, x2 , x3 , . . . , xn ) .
7.5. Příklad. X má rovnoměrné rozdělení na jednotkovém kruhu se středem v počátku. Nalezněte marginální rozdělení. X = (X, Y ) Pro −1 < x < 1. 2 FX (x) = π
Zx √
x √ 2 1 1 1 − t2 dt = t 1 − t2 + arcsin t = π 2 2 −1 −1 √ x 1 − x2 arcsin x 1 = + + . π π 2
7.6. Definice. Náhodný vektor se nazývá diskrétní, jestliže všechny jeho složky mají diskrétní rozdělení. Diskrétní vektor je dán pravděpodobnostní funkcí: (x1 , p1 ); (x2 , p2 ); (x3 , p3 ), . . . n X pi > 0 , pi = 1 . i=1
116
7.7. Příklad. Pravděpodobnost soustředěná ve vrcholech čtverce:
P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4, P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2 tabulka: Y /X 0 1 0 1/8 1/4 1 1/8 1/2 Diskrétní rozdělení pro X
P [X = 0] = 1/8 + 1/4 = 3/8 P [X = 1] = 1/8 + 1/2 = 5/8 X ∼ A(5/8). Podobně Y ∼ A(3/4).
117
• Distribuční funkce diskrétního vektoru je po částech konstantní. • Má-li X diskrétní rozdělení je X P [X ∈ A] = pi . {i | xi ∈A}
• Marginální rozdělení diskrétního rozdělení má pravděpodobnostní funkci P [X1 = a] =
X {i | xi ∈A}
kde A = {xi | (xi )1 = a}.
118
pi ,
7.8. Definice. Nechť f (x1 , . . . , xn ) ≥ 0 je funkce definovaná na Rn s Z f (x) dx = 1 . Rn
Náhodný vektor X = (X1 , . . . , Xn ) má spojité rozdělení s hustotou f , jestliže Zx1 Zx2 Zxn FX (x1 , . . . , xn ) = ··· f (t1 , . . . , tn )dt1 · · · dtn . −∞ −∞
−∞
• ∂ n FX (x1 , . . . , xn ) ∂x1 ∂x2 · · · ∂xn v bodech spojitosti funkce f f (x1 , . . . , xn ) =
• Z P [X ∈ A] =
f (x) dx . A
Například: X = (X, Y ) Zb Zd P [X ∈ (a, b > ∧Y ∈ (c, d >] =
f (x, y) dxdy . a
119
c
7.9. Příklad. Rovnoměrné rozdělení na jednotkové kouli se středem v počátku má hustotu ( 1 pro x2 + y 2 + z 2 ≤ 1 f (x, y, z) = 4/3π 0 jinak
7.10. Příklad. Dvourozměrná distribuční funkce ( (1 − e−x )(1 − e−y ) je-li x, y > 0 F (x, y) = 0 jinak Pro x, y > 0 f (x, y) =
∂2 (1 − e−x )(1 − e−y ) = ∂x∂y = e−x e−y .
(Jinak je f (x, y) nulová.) Je správně neboť Z∞ Z∞ f (x, y) = 0
e−x e−y = 1 .
0
120
Marginální rozdělení: X = (X1 , . . . , Xn ) má hustotu f (x1 , . . . , xn ). Pak X1 má distribuční funkci:
Zx Z∞
Z∞ ···
FX1 (x) = −∞ −∞
|
−∞
{z
··· −∞
−∞
|
}
(n−1)× Z∞
Zx Z∞ =
f (t1 , . . . , tn ) dt1 · · · dtn =
f (t1 , . . . , tn ) dt2 · · · dtn dt1
−∞
{z
}
(n−1)×
Hustota tedy bude Z∞
Z∞ ···
fX1 (x) = −∞
|
f (x, t2 , · · · tn ) dt2 · · · dtn .
−∞
{z
(n−1)×
}
121
7.11. Příklad. Dvourozměrné Gaussovo rozdělení hustota: 1 − x2 +y2 e 2 . f (x, y) = 2π X, Y ∼ N (0, 1) FX (x, y) = Φ(x)Φ(y) . Např. P [X ≤ 3 ∧ Y ≤ 5] = Φ(3)Φ(5) = 0, 9986498158. Jaká je pravděpodobnost, že (X, Y ) ∈ A, kde A je mezikruží A = {(x, y) | 4 ≤ x2 + y 2 ≤ 9}?
1 P = 2π
Z Z A
Substituce: x = % sin ϕ, y = % cos ϕ, Jakobián: dxdy = % d% dϕ.
122
e−
x2 +y 2 2
dxdy
1 P = 2π
Z2π Z3 0
e−%
2 /2
% d% dϕ =
2
1 2 = 2π[−e−% /2 ]32 = e−2 −e−9/2 = 0, 12422 . 2π Nezávislost náhodných veličin 7.12. Definice. Náhodné veličiny X1 , . . . , Xn na pravděpodobnostním prostoru (Ω, A, P ) jsou nezávislé, jestliže sdružená distribuční funkce vektoru X = (X1 , . . . , Xn ) je součinem marginálních distribučních funkcí.
123
7.13. Tvrzení. Náhodné veličiny X1 , . . . , Xn jsou nezávislé právě tehdy když P [(X1 ∈ I1 ) ∧ (X2 ∈ I2 ) ∧ · · · ∧ (Xn ∈ In )] = = P [X1 ∈ I1 ] · P [X2 ∈ I2 ] · · · P [Xn ∈ In ] pro všechny možné výběry intervalů I1 , . . . , In ⊂ R. Zdůvodnění pro X = (X, Y ), kde X, Y jsou nezávislé :
P [X ∈ (a, b > ∧Y ∈ (c, d >] = = FX (b, d)−FX (a, d)−FX (b, c)+FX (a, c) = = FX (b)Fy (d)−FX (a)FY (d)−FX (b)FY (c)+FX (a)FY (c) = = (FX (b) − FX (a))(FY (d) − FY (c)) . 7.14. Příklad. X = (X, Y ) je rovnoměrné rozdělení na čtverci < 0, 1 > × < 0, 1 >. Pak X a Y jsou nezávislé: 0 ≤ x, y ≤ 1 FX (x, y) = xy = FX (x) · FY (y) 124
7.15. Tvrzení. Diskrétní náhodné veličiny X1 , . . . , Xn jsou nezávislé právě tehdy když všechny jevy [X1 = x1 ], [X2 = x2 ], . . . , [Xn = xn ] , kde x1 , . . . , xn ∈ R, jsou nezávislé.
7.16. Příklad. Pravděpodobnost soustředěná ve vrcholech čtverce:
P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4, P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2 tabulka: Y /X 0 1
0 1 1/8 1/4 1/8 1/2
X a Y nejsou nezávislé, protože P [X = 0 ∧ Y = 0] = 1/8 6= P [X = 0]P [Y = 0] = 3/8 · 1/4 .
125
X = (X1 , . . . , Xn ) náhodné veličiny v Bernoulliově schématu. Tyto veličiny jsou nezávislé. Binomické rozdělení Bi(n, p) je součtem n nezávislých alternativních rozdělení A(p).
126
7.17. Tvrzení. Spojité vícerozměrné rozdělení je rozdělení nezávislých veličin právě tehdy když sdružená hustota je součinem hustot marginálních. Důvod: hustota je derivací distribuční funkce.
7.18. Příklad. Je-li (X, Y ) rovnoměrné rozdělení na jednotkovém kruhu, pak X a Y nejsou nezávislé, protože součin marginálních hustot je nenulový v každém bodě čtverce < 0, 1 > × < 0, 1 >.
7.19. Příklad. X a Y jsou nezávislé náhodné veličiny s rozděleními N (0, σ12 ), N (0, σ22 ). Jaká je hustota součinu? 2
f (x, y) =
2
− x2− y 2 1 e 2σ1 2σ2 2πσ1 σ2
Gaussovská plocha.
127
charakteristiky nezávislých veličin: 7.20. Věta. Jsou-li X1 , . . . , Xn nezávislé náhodné veličiny na pravděpodobnostním prostoru (Ω, A, P ), pak E(X1 X2 · · · Xn ) = E(X1 )E(X2 ) · · · E(Xn ) . Důkaz: pro diskrétní rozdělení X má pravděpodobnostní funkci (xi , pi )i∈I Y má pravděpodobnostní funkci (yj , pj )j∈J
X
E(XY ) =
xi yj P [X = xi ∧ Y = yj ] =
i∈I,j∈J
=
X
xi yj P [X = xi ]P [Y = yj ] =
i∈I,j∈J
=
X
X xi P [Y = xi ] · yj P [Y = yj ] =
i∈I
j∈J
= E(X)E(Y )
128
7.21. Věta. Jsou-li X1 , . . . , Xn nezávislé náhodné veličiny na pravděpodobnostním prostoru (Ω, A, P ), pak var(X1 + X2 + · · · + Xn ) = var(X1 ) + var(X2 ) + · · · + var(Xn ) .
Důkaz pro n = 2 Víme, že E(X1 X2 ) = E(X1 )E(X2 ). var(X1 +X2 ) = E[(X1 +X2 )2 ]−(E(X1 )+E(X2 ))2 = = E(X12 ) + E(X22 ) + 2E(X1 X2 ) − − (E(X1 ))2 − (E(X2 ))2 − 2E(X1 )E(X2 ) = E(X1 )2 −(E(X1 ))2 +E(X2 )2 −(E(X2 ))2 = = var(X1 ) + var(X2 ) .
129
7.22. Příklad. Pro X s rozdělením Bi(n, p) a Y s rozdělením A(p) platí var(X) = n var(Y ) = np(1 − p) . Funkce nezávislých náhodných veličin 7.23. Příklad. Doba kdy lano vydrží zátěž se řídí exponeniálním rozdělením Exp(1). Dvě lana zapojíme a) paralelně b) sériově. Určete rozdělení doby po kterou systém lan vydrží v obou případech a stanovte střední hodnotu těchto náhodných veličin. X a Y jsou nezávislé náhodné veličiny s rozdělením Exp(1). a) Zpar = max(X, Y ) b) Zserie = min(X, Y ) .
130
a) paralelně Distribuční funkce je nulová pro t < 0. Pro t > 0 je FZpar = (1 − e−t )(1 − e−t ) = (1 − e−t )2 Hustota pro t > 0: f (t) = 2(1 − e−t )e−t Střední hodnota Z∞ EZpar = 2
te−t dt − 2
0
Z∞ 0
131
te−2t dt = 1, 5 .
a) sériově Distribuční funkce je nulová pro t < 0. Pro t > 0 je FZpar = 1 − e−t e−t = 1 − e−2t Hustota pro t < 0: g(t) = 2e−2t Střední hodnota Z∞ EZserie = 2
e−2t dt = 0, 5 .
0
132
Rozdělení součtu spojitých nezávislých náhodných veličin Z =X +Y , kde X a Y jsou nezávislé, X má hustotu f (x) a Y má hustotu g(x). Úlohou je stanovit hustotu náhodné veličiny Z. Sdružená hustota vektoru (X, Y ) je funkce h(x, y) = f (x)g(y). ZZ P [Z ≤ z] = P [X+Y ≤ z] =
f (x)g(y) dxdy =
{(x,y) | x+y≤z}
Z∞ Zz−x
f (x)g(y) dy dx . −∞
−∞
Substituce ve vnitřním integrálu y = v − x, dv = dy
133
Z∞ Zz
f (x) g(v − x) dv dx =
= −∞
−∞
Zz Z∞
f (x)g(v − x) dx
=
dv
−∞
−∞
|
{z
hustota h(v)
}
Závěr: Hustota součtu X + Y je funkce Z∞ f (x)g(y − x) dx .
h(y) = −∞
Terminologie : funkce h je konvolutivní součin funkcí f a g.
134
7.24. Příklad. Čas do první poruchy daného zařízení se řídí exponenciálním zákonem Exp(λ). Náhodná veličina Z je čas do druhé poruchy. Určete její hustotu. Z =X +Y , kde X a Y jsou nezávislé s rozdělením Exp(λ). Hustota h(y) je
Zy
Z∞ h(y) =
f (x)g(y−x) dx = −∞
= λ2 e−λy
0 y Z
0
pro y ≥ 0 a nula jinak.
135
λe−λx λe−λ(y−x) dx =
dx = λ2 ye−λy
7.25. Příklad. Souprava metra přijíždí kdykoliv během jedné minuty. Dvakrát přestupujeme. Jaká je hustota čekací doby? Která hodnota je nejvíc preferována? Z =X +Y , kde X a Y jsou nezávislé náhodné veličiny s rozdělením R < 0, 1 >. Z∞ f (x)g(y − x) dx ,
h(y) = −∞
kde f a g jsou chrakteristické funkce intervalu < 0, 1 >. Tento integrál je délkou průniku intervalu < 0, 1 > s intervalem < y − 1, y >. Tedy 0 y≤0 y 0≤y≤1 h(y) = 2−y 1≤y ≤2 0 y≥2 Trojúhelníkové rozdělení, preferována je čekací doba 1.
136
8
Kovariance a korelace náhodných vektorů
Je-li X náhodný vektor, je vektor středních hodnot vektor EX = (EX1 , EX2 , . . . EXn ) . Nepopisuje interakci mezi náhodnými veličinami. 8.1. Definice. Nechť X a Y jsou náhodné veličiny na pravděpodobnostním prostoru (Ω, A, P ), které mají rozptyl. Kovariance náhodných veličin X a Y je definována cov(X, Y ) = E[(X − EX)(Y − EY )] .
137
• cov(X, X) = var(X) • cov(X, Y ) = cov(Y, X) • cov(X, Y ) = E(XY ) − E(X)E(Y ) :
E[(X−EX)(Y −EY )] = E(XY )−2EX·EY +EX·EY = = E(XY ) − E(X)E(Y ) Pro výpočet potřebujeme: 1. Diskrétní vektor (X, Y ) s pravděpodobnostní funkcí ((xi , yi ); pi )i∈I . EX =
X
EY =
X
xi pi
i∈I
yi pi
i∈I
E(XY ) =
X
xi yi pi
i∈I
138
1. Spojitý vektor (X, Y ) se sdruženou hustotou f (x, y). Z xf (x, y) dxdy
EX = R2
Z yf (x, y) dxdy
EY = R2
Z xyf (x, y) dxdy
E(XY ) = R2
8.2. Příklad. X má rovnoměrné rozdělení na intervalu < 0, 1 >. Určete cov(X, X 2 ) . cov(X, X 2 ) = EX 3 − EX · EX 2 EX 3 =
Z1
x3 dx =
1 4
x2 dx =
1 3
0
EX 2 =
Z1
EX =
0
cov(X, X 2 ) =
1 1 1 1 − · = . 4 2 3 12 139
1 . 2
8.3. Příklad. X = (X, Y ) má rovnoměrné rozdělení na jednotkovém kruhu. Stanovte cov(X, Y ).
ZZ x dxdy = 0
EX = ZKZ
xy dxdy = 0 .
E(XY ) = K
cov(X, Y ) = 0 .
140
8.4. Věta. Jsou-li X a Y nezávislé náhodné veličiny je cov(X, Y ) = 0. Důkaz: Jsou-li X a Y nezávislé, pak E(XY ) = EX ·EY .
Veličiny X, Y souřadnice rovnoměrného rozdělení na jednotkovém kruhu mají nulovou kovarianci, a přesto nejsou nezávislé. √ Normování náhodné veličiny X : X−EX má nulovarX vou střední hodnotu a jednotkový rozptyl.
X − EX Y − EY , √ cov √ varX varY
=√
cov(X, Y ) √ . varX varY
8.5. Definice. Předpokládejme, že X a Y jsou náhodné veličiny s nenulovým rozptylem. Korelace %(X, Y ) je definována vztahem %(X, Y ) = √
cov(X, Y ) √ . varX varY 141
8.6. Příklad. (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí ((x1 , y1 ), 1/3); ((x2 , y2 ), 1/3); ((x3 , y3 ), 1/3); Předpokládejme dále, že x1 + x2 + x3 = 0
cov(X, Y ) = q
y1 + y2 + y3 = 0 .
1 xy 3 1 1
+ 13 x2 y2 + 13 x3 y3 q = 1 1 2 2 2 2 2 2 (x1 + x2 + x3 ) 3 (y1 + y2 + y3 ) 3
x1 y1 + x2 y2 + x3 y3 p = cos ϕ , x21 + x22 + x23 y12 + y22 + y32
=p
kde ϕ je úhel mezi vektory x = (x1 , x2 , x3 ) a y = (y1 , y2 , y3 ). Pokud je tedy cov(X, Y ) = 1 je y kladným násobkem x, pokud je cov(X, Y ) = −1 je y záporným násobkem x
142
8.7. Věta. Pro korelaci %(X, Y ) náhodných veličin X a Y platí |%(X, Y )| ≤ 1 . Přitom %(X, Y ) = 1 právě tehdy když hodnoty X a Y leží s pravděpodobností 1 na jedné přímce s kladnou směrnicí. %(X, Y ) = −1 právě tehdy když hodnoty X a Y leží s pravděpodobností 1 na jedné přímce se zápornou směrnicí. Důkaz: Pro všechna t ∈ R máme X − EX Y − EY 0 ≤ var √ +t √ = varX varY = 1 + 2t%(X, Y ) + t2 . (2) Diskuse kvadratického výrazu: 4%2 (X, Y ) − 4 ≤ 0 a tedy |%(X, Y )| ≤ 1 . 143
Předpokládejme, že cov(X, Y ) = 1. Pak v nerovnosti (2) nastane rovnost a to může nastat právě když t = −1. Dosazením t = −1 pak vede k X − EX Y − EY √ − √ = konst . varX varY Tedy √ varY Y =√ · X + konstanta . varX %(X, Y ) je míra lineární závislosti X a Y .
144
9
Asymptotické vlastnosti náhodných veličin
Větou asymptotického typu byla již věta Poissonova: binomické rozdělení s počtem pokusů jdoucím k nekonečnu a střední hodnotou jdoucí k λ se blíží Poissonově rozdělení P o(λ). Základní otázka: Co se děje s Bi(n, p), jestliže n → ∞ a p se nemění? Orientační odhady poskytuje Čebyševova nerovnost. 9.1. Věta. Čebyševova nerovnost Nehť X je náhodná veličina s E(X 2 ) < ∞. Potom platí P [|X| ≥ ε] ≤
E(X 2 ) . ε2
Speciálně, má-li X rozptyl, pak P [ |X − EX| ≥ ε] ≤
145
var(X) . ε2
Důkaz pro spojité rozdělení s hustotou f (x).
Z P [ |X| ≥ ε] =
f (x) dx {x | |x|≥ε}
Z∞
E(X 2 ) =
x2 f (x) dx =
−∞
Z
Zε x2 f (x) dx+ x2 f (x) dx ≥
{x | |x|≥ε}
Z
ε2 f (x) dx = ε2 P [ |X| ≥ ε] .
≥ {x | |x|≥ε}
9.2. Důsledek. Je-li Xn náhodná veličina s rozdělením Bi(n, p), pak pro každé ε > 0 platí Xn P − p ≥ ε → 0 pro n → ∞ . n Důkaz:
Xn E n
=
np =p n 146
−ε
Xn var n
=
1 1 np(1 − p) ≤ 2 n 4n
Dle Čebyševovy nerovnosti Xn var( Xnn ) 1 P − p ≥ ε ≤ ≤ . 2 n ε 4nε2 9.3. Příklad. Kolika respondentů je třeba se zeptat, abychom odhadli volební preference p s tolerancí 1% s pravděpodobností alespoň 90% ? n . . . počet osob Xn . . . Bi(n, p) (počet osob volících danou stranu) p ≈ Xnn (aproximace) Chceme: Xn P − p < 0, 01 ≥ 0, 9 . n Nebo-li Xn − p ≥ 0, 01 ≤ 0, 1 P n | {z } ≤
1 4n(0,01)2
147
1 ≤ 0, 1 4n(0, 01)2 n≥
105 = 25000. 4
Je pesimistický, nicméně jistý horní odhad. 9.4. Věta. Centrální limitní věta Nehť X1 , X2 , X3 , . . . je posloupnost nezávislých náhodných veličin, pro které platí EXi = µ ,
varXi = σ 2 ,
E|Xi |3 < ∞ .
pro všechna i ∈ N. Pro veličinu Sn (normovaný součet), Sn =
X1 + X2 + · · · + Xn − nµ √ , nσ
platí lim P [ Sn ≤ x] = Φ(x) ,
n→∞
pro všechna x ∈ R.
148
Tedy X1 + X2 + · · · + Xn má přibližně rozdělení N (nµ, nσ 2 ). 9.5. Věta. Moaivrova-Laplaceova věta Pro náhodnou veličinu Xn s rozdělením Bi(n, p) platí Xn − np lim P p ≤ x = Φ(x) n→∞ np(1 − p) pro každé x ∈ R. Důkaz: Binomické rozdělení je součtem nezávislých alternativních rozdělení.
Bi(n, p) ≈ N (np, np(1 − p)) Empiriké pravidlo pro velikost n : np ≥ 5, n(1 − p) ≥ 5.
149
9.6. Příklad. 250 krát hodíme symetrickou mincí. Určete pravděpodobnost, že rub padne 100 až 150 krát. X − 125 √ 250 ≈ N (0, 1) 250 · 0, 25 P [100 ≤ X250 ≤ 150] = −25 X250 − 125 25 =P √ ≤√ ≤√ = 250 · 0, 25 250 · 0, 25 250 · 0, 25 √ 25 · 2 . . −1 = 2Φ( 10)−1 = 2Φ(3, 16)−1 = = 2Φ √ 250 = 0, 99842 . 1 P 250 Přesně: 150 k=125 k 2250
9.7. Příklad. Kolika respondentů je třeba se zeptat, abychom odhadli volební preference p s tolerancí 1% a to s pravděpodobností alespoň 90%. Xn P − p ≤ 0, 01 ≥ 0, 9 n 150
0, 01n |Xn − np| . ≤p P [ |Xn −np| ≤ 0, 01n] = P p = np(1 − p) np(1 − p) √ √ 0, 01 · n 0, 01 · n . −1 ≥ 2Φ = 2Φ p −1 = 1/2 p(1 − p) √ = 2Φ(0, 02 n) − 1 .
Volíme n tak aby √ 2Φ(0, 02 n) − 1 ≥ 0, 9 √ Φ(0, 02 n) ≥ 0, 95 √ 0, 02 n ≥ u0,95 √
n≥
n≥
u0,95 0, 02 u0,95 0, 02
2
=
1, 644 0, 02
2
. = 6763, 8586
Pro srovnání při 5% toleranci potřebujeme 270 respondentů.
151
10
Statistika
Základní výběrové statistiky 10.1. Definice. Náhodný výběr z rozdělení s distribuční funkcí F (x) je vektor X = (X1 , . . . , Xn ) , kde X1 , . . . , Xn jsou nezávislé náhodné veličiny mající stejnou distribuční funkci F (x). Základní výběrové statistiky: Výběrový průměr 1 (X1 + X2 + · · · Xn ) n Výběrový rozptyl Xn =
n
Sn2 =
1 X (Xi − Xn )2 n − 1 i=1
Výběrová směrodatná odchylka Sn 152
Výběrové maximum max(X1 , . . . , Xn ) Výběrové minimum min(X1 , . . . , Xn ) Výběrové rozpětí max(X1 , . . . , Xn ) − min(X1 , . . . , Xn ) Výběrový průměr EX = µ, var(X) = σ 2 nµ 1 = µ. E = E( (X1 + · · · + Xn )) = n n X1 + · · · + Xn 1 σ2 var(Xn ) = var = 2 nσ 2 = . n n n E(Xn ) = µ σ2 var(Xn ) = n 153
Důležité je, že var(Xn ) → 0 pro n → ∞. Čebyševova nerovnost:
P [ |Xn − µ| ≥ ε] ≤
σ2 . nε2
Výběrový rozptyl n
Sn2 =
1 X (Xi − Xn )2 . n − 1 i=1
pomocný výpočet:
n X
(Xi − Xn )2 =
n X
2
(Xi2 − 2Xi Xn + Xn ) =
i=1
i=1
= =
n X i=1 n X
Xi2
− 2Xn
n X
Xi +
i=1 2 2 Xi2 −2nXn +nXn
i=1
n X i=1
=
n X i=1
154
2
Xn = 2
Xi2 −nXn .
Výpočet střední hodnoty:
(n−1)E(Sn2 )
=E
X n
2 Xi2 −nXn
i=1
=
n X
=
n X i=1
(var(Xi )+E 2 (Xi ))−n(var(Xn )+E 2 (Xn )) =
i=1
= nσ 2 + nµ2 − n
σ2 − nµ2 = (n − 1)σ 2 n
E(Sn2 ) = σ 2 .
Výběrové statistiky odvozené od normálního rozdělení. 10.2. Tvrzení. Výběrový průměr z rozdělení N (µ, σ 2 ) 2 má rozdělení N (µ, σn ). Důkaz je založen na tom, že součet nezávislých normálních rozdělení je normální rozdělení, což se dá dokázt pomocí konvoluce gaussovských funkcí. Pro popis Sn2 potřebujeme zavést nové rozdělení
155
2
E(Xi2 )−nE(Xn ) =
10.3. Definice. Nechť X1 , . . . , Xn jsou nezávislé veličiny s normovaným normálním rozdělením. Rozdělení χ2 o n stupních volnosti je rozdělení náhodné veličiny Y = X12 + X22 + · · · + Xn2 Značení : χ2n kvantily: χ2n,α χ2n (α) Má-li X rozdělení χ2n , pak EX = n
var(X) = 2n .
10.4. Příklad. X, Y, Z jsou nezávislé náhodné veličiny s rozdělením N (0, 1). Stanovte r tak, aby √ P [ X 2 + Y 2 + Z 2 ≤ r] = 0, 995 (Legenda: složky rychlosti molekul plynu) r=
q
χ23 (0, 995) =
p 12, 838 = 3, 58
156
Základní věta klasické statistiky 10.5. Věta. Nechť X = (X1 , . . . , Xn ) je náhodný výběr z rozdělení N (µ, σ 2 ). Pak (i) Xn a Sn2 jsou nezávislé náhodné veličiny (ii)
2 (n−1)Sn 2 σ
má rozdělení χ2n−1 .
Statistická varianta normování veličiny: Xn − µ √ Sn / n 10.6. Definice. Nechť X = (X1 , . . . , Xn ) je náhodný výběr z rozdělení N (µ, σ 2 ). Studentovo rozděleni s n − 1 stupni volnosti je rozdělení náhodné veličiny Xn − µ √ Sn / n Značení: tn−1 , kvantily tn−1 , α; tn−1 (α).
157
W. Gosset – pseudonym Student, Studentovo rozdělení tn má sudou hustotu, fn (x), která pro n → ∞ konverguje bodově k Φ(x). (Aproximuje se obvykle pro n ≥ 31)
158
Intervalové odhady Lokalizace neznámého parametru pomocí dat 10.7. Definice. Nechť X = (X1 , . . . , Xn ) je náhodný výběr z rozdělení s neznámým parametrem θ a α ∈ (0, 1). (i) Interval < TD (X), TH (X) > se nazývá 100(1 − α)% oboustranným intervalem spolehlivosti parametru θ jestliže P [ TD (X) ≤ θ ≤ TH (X) ] = 1 − α (ii) Interval < TD (X), ∞) se nazývá dolním 100(1 − α)% intervalem spolehlivosti parametru θ, jestliže P [θ ≥ TD (X)] = 1 − α (iii) Interval (−∞, TH (X) > se nazývá horním 100(1 − α)% intervalem spolehlivosti parametru θ, jestliže P [θ ≤ TH (X)] = 1 − α
159
Pro odvození intervalových odhadů pro parametry µ a σ 2 používáme statistiky
Z=
Xn − µ √ ∼ N (0, 1) σ/ n
T =
Xn − µ √ ∼ tn−1 Sn / n
(n − 1)Sn2 ∼ χ2n−1 2 σ 10.8. Věta. Nechť X = (X1 , . . . , Xn ) je náhodný výběr z rozdělení N (µ, σ 2 ). Pak σ σ (i) P [ Xn − u1−α/2 √ ≤ µ ≤ Xn + u1−α/2 √ ] = 1 − α n n (ii)
Sn Sn P [ Xn − tn−1,1−α/2 √ ≤ µ ≤ Xn + tn−1,1−α/2 √ ] = 1 − α n n
Důkaz: (i) Z =
Xn√ −µ σ/ n
∼ N (0, 1)
P [uα/2 ≤ Z ≤ u1−α/2 ] = 1 − α . σ σ √ uα/2 ≤ Xn − µ ≤ √ u1−α/2 n n
160
(ii) Totéž s využitím statistiky T =
Xn −µ √ Sn / n
∼ tn−1 .
10.9. Příklad. Je měřena výška 16 rostlin. Průměr naměřených hodnot je 72,5 cm, výběrová směrodatná odchylka je 4,5 cm. Nalezněte 90% interval spolehlivosti pro střední výšku. 1 − α = 0, 9; α = 0, 1; 1 − α/2 = 0, 95 t15 (0, 95) = 1, 75 r = 1, 75 √4,5 = 1, 97 16 (70, 53; 74, 47)
10.10. Příklad. X ∼ N (µ, σ 2 ). Při padesáti měření byla získána směrodatná odchylka p S50 = 2, 192 Určete horní 95% interval spolehlivosti pro σ 2 . (n − 1)σ 2 ∼ χ2n−1 σ2 161
(n − 1)Sn2 2 P ≥ χn−1,α = 1 − α σ2 (n − 1)Sn2 2 =1−α P σ ≤ χ2n−1,α
χ249 (0, 05) = 33, 930 49 · 2, 192 = 3, 166 . 33, 930 Interval: (0, 3,166).
Přibližné intervalové odhady: Xn má podle Centrální limitní věty pro velké n přibližně normální rozdělení: X1 + X2 + · · · + Xn − nµ Xn − µ √ √ = nσ σ/ n má přibližně rozdělení N (0, 1). Dá se použít intervalový odhad pro normální rozdělení: Sn Sn Xn − u1−α/2 √ ≤ E(X) ≤ Xn + u1−α/2 √ n n 162
s pravděpodobností 1 − α. U alternativního rozdělení A(p) se navíc aproximuje σ 2 hodnotou Xn (1 − Xn ) q q Xn (1 − Xn ) Xn (1 − Xn ) √ √ Xn − u1−α/2 ≤ p ≤ Xn + u1−α/2 n n s pravděpodobností 1 − α. 10.11. Příklad. Při průzkumu se zjistilo, že z 1500 oslovených osob poslouchá rádiovou stanici kvůli hudbě 63%. Určete 98% interval spolehlivosti pro skutečné procento takovýchto posluchačů. X 1500 = 0, 63 r 0, 63 · 0, 37 r = u0,99 · = 0, 029 1500 interval (60, 1%; 65, 9%)
163
11
Testování statistických hypotéz
statistické rozhodování při neúplné informaci, vždy s jistým rizikem. H0 . . . nulová hypotéza: k−tice parametrů (θ1 , . . . , θk ) ∈ A ⊂ Rn H1 . . . alternatvní hypotéza: k−tice parametrů (θ1 , . . . , θk ) ∈ B ⊂ Rn A∩B =∅ kritický obor: W ⊂ Rn naměřená data: X = (X1 , . . . , Xn ). H0 zamítneme ve prospěch H1 pokud X ∈ W , volí se tak, aby P [X ∈ W |H0 ] ≤ α 164
α . . . hladina významnosti standardy: α = 0, 5; 0, 01 Chyba prvního druhu: H0 platí a test ji zamítá Chyba druhého druhu: H0 neplatí a test ji nezamítá 11.1. Příklad. V roce 1951 byla naměřena průměrná výška 10 letých chlapců v ČSSR 136,1 cm. V roce 1961 se u 15 náhodně vybraných 10 letých chlapců zjistila průměrná výška X15 = 139, 133cm V obou případech je σ = 6, 4cm Vzrostla výška? Výška v r. 1961, N (µ, 6, 42 ) H0 : µ = 136, 1 = µ0 H1 : µ > 136, 1
165
Hypotézu H0 zamítneme pokud X15 bude příliš velký, tj. pokud X15 > c, kde c je vhodně zvolená konstanta. 2
Platí-li H0 , pak X15 má rozdělení N (µ0 , 6,4 ). Tedy 15 Z=
X15 − µ0 √ ∼ N (0, 1) . σ/ 15
Zamítáme na hladině α jestliže Z > u1−α . Volme α = 0, 05. u0,95 = 1, 64 Z=
139, 133 − 136, 1 . √ = 1, 835 6, 4/ 15
Protože Z > u0,95 zamítáme hypotézu H0 na hladině významnosti 5%. Kritický obor: {x ∈ R15 |
1 (x1 15
+ · · · + x15 ) ≥ c}
√ c = 136, 1 + u0,95 · 6, 4 15 = 136, 1 + 1, 838 = 137, 938
166
Lze volit mnoho kritických oborů. Existuje matematický výsledek (Neymannovo-Pearsonovo lemma) říkající, že tento test má největší sílu. Síla testu: pravděpodobnost s jakou zamítneme nulovou hypotézu když platí hypotéza alternativní. Vztah mezi chybou prvního a druhého druhu α a β. Pokud H0 neplatí, pak α → 0 implikuje β → 1. Testy o střední hodnotě normálního rozdělení X = (X1 , . . . , Xn ) . . . náhodný výběr z rozdělení N (µ, σ 2 ). H 0 : µ = µ0 H1 : µ 6= µ0 ...oboustranný test H2 : µ > µ0 ...jednostranný test H3 : µ < µ0 ...jednostranný test
167
Z-test známe σ Z=
Xn − µ0 √ σ/ n
má za podmínky H0 rozdělení N (0, 1). H0 zamítneme na hladině významnosti α a) proti H1 : pokud |Z| > u1−α/2 b) proti H2 : pokud Z > u1−α a) proti H3 : pokud Z < uα = −u1−α
168
t-test neznáme σ T =
Xn − µ0 √ Sn / n
má za podmínky H0 rozdělení tn−1 . H0 zamítneme na hladině významnosti α a) proti H1 : pokud |T | > tn−1 (1 − α/2) b) proti H2 : pokud T > tn−1 (1 − α) a) proti H3 : pokud T < tn−1 (α) = −tn−1 (1 − α) Pro velké n aproximujeme tn−1 rozdělením N (0, 1).
169
11.2. Příklad. Automat plní krabice práškem. Norma je 2kg. Náhodně bylo vybráno 6 krabic. Zjistily se následující odchylky od normy v dkg. −5, 1, −1, −8, 7, −6 Testujeme správnost funkce automatu. H0 : µ = 0 H1 : µ 6= 0 . n = 6, X6 = −2, S62 = 30, 4 −2 − 0 . √ = −0, 889 . T =√ 30, 4/ 6 t5 (0, 975) = 2, 5706 |T | < 2, 5706 Závěr: H0 nezamítáme.
170
Párový t-test: Sledujeme související veličiny, předpokládáme, že rozdíl má normální rozdělení. 11.3. Příklad. váha osob před dietou váha osob po dietě
82 70 91 81 69,5 89
Má dieta efekt ? Rozdíly před a po: 1— 0,5— 2 H0 : µ = 0 H1 : µ > 0 X3 = 1, 167 S32 = 0, 583 T =
1, 167 √ = 2, 647 . S3 / 3
t2 (0, 95) = 2, 92
171
Závěr: nezamítáme nulovou hypotézu, pokles váhy neni průkazný. (I když se zdá být ztráta váhy velká, máme málo pokusných osob).
172
Asymtotický test proporce A(p) . . . alternativní rozdělení Centrální limitní věta: Xn se aproximuje rozdělením N (p, p(1−p) ). n H0 : p ≤ p 0 H1 : p > p0 H0 zamítáme, jestliže Xn > c. Volíme vhodně c tak, aby P [Xn > c|H0 ] ≤ α c−p . = P Xn > c|H0 = 1 − Φ √ p(1−p) √ n
√ n(c − p) = 1−Φ p p(1 − p) p p(1 − p) ≤ 1/2
c − p ≥ c − p0
implikuje √ √ n(c − p) p ≥ 2 n(c − p0 ) p(1 − p) 173
Tedy √ √ n(c − p) 1−Φ p ≤ 1 − Φ(2 n(c − p0 )) p(1 − p) Podmmínce vyhovíme, jestliže √ 1 − Φ(2 n(c − p0 )) ≤ α √ Φ(2 n(c − p0 )) ≥ 1 − α √ 2 n(c − p0 ) ≥ u1−α u1−α c ≥ p0 + √ 2 n Závěr: H0 zamítáme ve prospěch H1 jestliže u1−α Xn ≥ p0 + √ 2 n
174
11.4. Příklad. Průzkum zahrnuje 1600 osob. Kolik procent z tohoto vzorku má daná koalice získat hlasů, abychom na hladině významnosti 1% potvrdili hypotézu, že koalice vyhraje volby. u0,99 . 2, 326 = 0, 529 . = 0, 5 + 80 80 . Musíme tedy získat 0, 529 · 1600 = 847 hlasů. Musíme vždy získat o asi 2, 9% více než je daná mez. X1600 ≥ 0, 5 +
175
Test rozptylu normálního rozdělení X = (X1 , . . . , Xn ) . . . náhodný výběr z rozdělení N (µ, σ 2 ) H0 : σ 2 = σ02 H1 : σ 2 > σ02 Využíváme statistiku S=
(n − 1)Sn2 σ02
která má za předpokladu H0 rozdělení χ2n−1 . Hypotézu H0 zamítáme ve prospěch H1 při hladině významnosti α jestliže (n − 1)Sn2 > χ2n−1 (1 − α) . 2 σ0
176
Testy dobré shody (Ω, A, P ) . . . pravděpodobnostní prostor A1 , . . . , Ak . . . úplný systém jevů k X
P (Ai ) = pi
pi = 1 .
i=1
A1 p1
A2 p2
··· ···
Ak pk
Odpovídá rozdělení dat do disjunktních tříd. pi jsou apriorní pravděpodobnosti. Testujeme jejich shodu s empirickými daty. H0 : P (Ai ) = pi (k = 2) máme vpodstatě alternativní rozdělení. Učiníme sérii n pokusů, v každém indikujeme jeden z jevů A1 , . . . , Ak . Počítáme kolikrát který jev nastane. Při k = 2 tak máme binomické rozdělení.
177
Značení: n . . . počet nezávislých pokusů Oi . . . počet výskytů jevu Ai v sérii n pokusů. Náhodná veličina – empirická četnost. n pi . . . teoretická četnost (k = 2 pak Oi ∼ Bi(n, pi )) Testujeme shodu npi ≈ Oi 11.5. Věta. Náhodná veličina k X (Oi − npi )2 i=1
npi
má při n → ∞ přibližně rozdělení χ2k−1 . Důkaz je založen na centrální limitní větě Hypotézu H0 o apriorních pravděpodobnostech zamítáme na hladině významnosti α, pokud k X (Oi − npi )2 i=1
npi
> χ2k−1 (1 − α)
178
Tento test se nazývá χ2 test, nebo též Pearsonův test. Tento test je asymptotický, doporučuje se ho použít pro n tak velké, že npi > 5 pro všechna i = 1, . . . , k .
11.6. Příklad. Testujeme zda hrací kostka neni falešná. Provedeno 120 hodů. Výsledky jsou hodnota 1 2 3 4 5 6 četnost 15 16 25 31 15 18 n = 120, pi = 1/6, npi = 120 · 16 = 20.
6 X (Oi − npi )2
npi
i=1
=
=
52 42 52 112 52 22 + + + + + = 10, 8 . 20 20 20 20 20 20
χ25 (0, 95) = 11, 07 . Závěr: nelze zamítnout hypotézu, že kostka je falešná.
179
Často se používá na test typu rozdělení: 11.7. Příklad. Testujeme hypotézu, že data pocházejí z rozdělení N (0, 1). Provedeno je 1000 měření, data jsou rozdělena do tří skupin u0,8 = 0, 84162 250 hodnot v (−∞, −u0,8 ) 550 hodnot v (−u0,8 , u0,8 ) 200 hodnot v (u0,8 , ∞) H0 : p1 = 0, 2;
p2 = 0, 6;
p3 = 0, 2
np1 = 200 np2 = 600 np3 = 200 3 X (Oi − npi )2 i=1
npi
=
502 502 0 + + = 16, 667 . 200 600 200
χ22 (0, 95) = 5, 9915 Závěr: Hypotézu o rozdělení N (0, 1) zamítáme.
180
Testy shody při neznámých parametrech Testujeme zda data pocházejí z rozdělení s neznámými parametry. Je-li l počet odhadnutých parametrů, pak k X (Oi − npi )2 i=1
npi
má asymptoticky rozdělení χ2k−1−l . Postup: 1. Neznámé parametry odhadneme z dat. 2. Pomocí nich spočítáme apriorní pravděpodobnosti 3. Hypotézu o daném rozdělení zamítneme, jestliže k X (Oi − npi )2 i=1
npi
> χ2k−1−l (1 − α)
181
11.8. Příklad. Za války byl Londýn bombardován střelami V1 a V2. Hypotéza je, že střely dopadaly náhodně (bez zaměřování) do jednotlivých lokalit. Celkem na Londýn dopadlo 537 raket. Území města bylo rozděleno na 242 = 576 čtverců stejné velikosti. Empirická data: počet zásahů: 0 1 2 3 4 a více počet oblastí: 229 211 93 35 8
X: počet zásahů v náhodně vybrané oblasti:
1 Bi počet střel , počet oblastí 1. Odhadneme: počet střel . 537 = . λ= 576 počet oblastí 2. Platí-li H0 je P [X = i] =
λi e−λ . i! 182
≈ P o počet střel ·
1 počet oblastí
.
počet pokusů = počet oblastí n = 576 537 . nP [X = 0] = 576 e− 576 = 226, 7 .
nP [X = 1] = 576 ·
537 − 537 . e 576 = 211, 4 . 576
. nP [X = 2] = 98, 5 . . nP [X = 3] = 30, 6 . . nP [X ≥ 4] = 8, 7 . počet zásahů: 0 1 2 3 4 a více skutečnost: 229 211 93 35 8 teorie: 226,7 211,4 98,5 30,6 8,7
Numerický výpočet: 5 X (0i − npi )2 i=1
npi
= 1, 569
χ25−1−1 (0, 95) = 7, 81 . Závěr: Na hladině významnosti 5% potvrzujeme hypotézu H0 . 183