PaS 1.-10. přednáška
1
Pravděpodobnostní prostor
Náhodný pokus je takový pokus, jehož výsledek nelze s jistotou předpovědět. Pokud jsme schopni pokus za stále stejných podmínek opakovat (například házíme stále stejnou kostkou ze stejné výšky na stejný stůl) a výsledky si zaznamenáváme, zkušenost říká, že relativní četnost jednot- livých výsledků pokusu se bude pohybovat blízko nějaké hodnoty. Teorie pravděpodobnosti se snaží tuto zkušenost matematizovat. První krok tímto směrem je uvážit vůbec všechny možné dále nedělitelné výsledky náhodného pokusu. To nás vede k následující definici. Definice 1.1. Prostorem elementárních jevů nazýváme libovolnou neprázdnou množinu Ω. Prvky množiny Ω (elementární jevy) reprezentují všechny myslitelné výsledky náhodného po- kusu. Příklad 1.2.
• Všechny možné výsledky hodu šestistěnnou kostkou můžeme reprezentovat pomocí
množiny Ω = {1, 2, 3, 4, 5, 6}. • Pokud náhodný pokus spočívá v tom, že náhodně přijdeme na zastávku autobusu, který jezdí v pětiminutových intervalech a výsledek pokusu je doba čekání na autobus, můžeme všechny možné výsledky pokusu reprezentovat intervalem Ω = h0, 5i. • Pokud nám v předchozím pokusu chybí na hodinkách vteřinová ručička (jsme schopni měřit čas jen s přesností na minuty), byl by vhodný prostor elementárních jevů Ω = {1, 2, 3, 4, 5}. • Výsledky dvou hodů mincí (zajímá nás, zda padla pana či orel) bude vhodně reprezentovat tato množina uspořádaných dvojic prvků R a L: Ω = {[L, L], [L, R], [R, L], [R, R]}. Budeme chtít zkoumat i komplikovanější jevy než jen elementární. Při již popisovaném hodu kostkou nás může zajímat, zda padne liché číslo případně zda nastane jev opačný t.j. padne sudé číslo. To nás vede k následující definici. Definice 1.3. Mějme prostor elementárních jevů Ω. Množinu β naýváme prostorem jevů na Ω, pokud její prvky (jevy) jsou podmnožiny množiny Ω (jevy se skládají z elementárních jevů podobně, jako molekuly z atomů) a splňují následující podmínky: 1. Ω ∈ β (celá Ω je jev, kterému říkáme jev jistý); 2. Pokud A je jev (t.j. A ∈ β), pak i jeho doplněk (komplement) AC je jev (t.j. AC ∈ β), který nazýváme jev opačný k jevu A. 3. Pokud Ai je jev z β pro všechna i ∈ N, pak i sjednocení
S
i∈N
Ai je jev z β (sjednocení spočetně
mnoha jevů je jev). Poznámka 1.4. Ač definice prostoru jevů dovoluje i extrémní případ, kdy jevy jsou jen Ω a ∅, v praxi se setkáme jen s prostory jevů, které obsahují mimo jiné i každý elementární jev (tedy Ω ⊂ β). Pomocí de Morganových zákonů lze snadno dokázat následující: Tvrzení 1.5. Nechť β je prostorem jevů na Ω. Potom platí:
1. ∅ ∈ β (prázdná množin je jev, kterému říkáme jev nemožný) T
2. Pokud Ai je jev z β pro všechna i ∈ N, pak i průnik
iN
Ai je jev z β (průnik spočetně mnoha jevů
je jev). Konečně, máme-li prostor elementárních jevů i prostor jevů na něm, které reprezentují výsledky náhodného pokusu, budeme u každého jevu chtít vyjádřit šanci, že nastane - pravděpodobnost jevu. Bude to číslo mezi nulou a jednou. Čím blíže je pravděpodobnost jevu jedničce, tím by měl jev při opakování náhodného pokusu nastávat častěji (pokud je naše matematizace náhodného pokusu povedená). Definice 1.6. Mějme množinu elementárních jevů Ω a prostor jevů β na Ω. Nechť P : β → [0, 1] je zobrazení, které splňuje následující podmínky: (P1) P (Ω) = 1 (pravděpodobnost jevu jistého je 1). (P2) Pokud A1 , A2 , . . . , Ai , . . . jsou po dvou disjunktní jevy (prvky z β), pak platí ! [ X P Ai = P (Ai ). i∈N
i∈N
(pravděpodobnost sjednocení spočetně mnoha jevů, kde každé dva mají prázdný průnik, je rovna součtu pravděpodobností jednotlivých jevů). Trojici [Ω; β; P ] nazýváme pravděpodobnostní prostor. Máme-li jev A ∈ β, pak číslo P (A) nazýváme pravděpodobností jevu A. Tvrzení 1.7. V pravděpodobnostním prosotru [Ω; β; P ] platí: 1. P (∅) = 0 (pravděpodobnost nemožného jevu je 0); 2. Jsou-li A a B jevy, které mají prázdný průnik, pak P (A ∪ B) = P (A) + P (B); 3. Obecněji, pro každé dva jevy A, B platí P (A ∪ B) = P (A) + P (B) − P (A ∩ B); 4. P (AC ) = 1 − P (A). Příklad 1.8. Tento příklad dobře modeluje hod šestistěnnou kostkou. • Ω = {1, 2, 3, 4, 5, 6}. Elementární jevy jsou tedy jednotlivá čísla, která mohou padnout; • β je tvořena všemi podmnožinami množiny Ω. Jev {1, 3, 5} reprezentuje případ, kdy padne liché číslo, jev „padloÿ číslo větší než 4 je pak množina {5, 6}; • P přiřazuje jevu počet jeho prvků dělený šesti. Pravděpodobnost, že padne liché číslo je tedy 3/6 = 0, 5. Pravděpodobnost jevu Ω (to jest, pravděpodobnost, že padne nějaké číslo) je 6/6 = 1, pravděpodobnost, že padne jednička je 1/6. Příklad 1.9. Tento příklad může modelovat dobu čekání na trolejbus, který jezdí každých 10 minut, v případě, že na zastávku přicházíme náhodně. • Ω je interval [0, 10]. • β je tvořena mimo jiné podintervaly intevalu [0, 10]. • P přiřadí intervalu jeho délku dělenou deseti. Například P ([2, 4]) = 2/10 = 0, 2, tedy pravděpodobnost, že budeme čekat od dvou do čtyř minut je 0, 2. Definice 1.10. Tojice [Ω, β, P ] se nazývá klasický pravděpodobnostní prostor pokud Ω je ko- nečná, β je množina všech podmnožin Ω a pro A ∈ β máme P (A) = |A|/|Ω|. Pravděpodobnostní prostor z Příkladu 1.8 je klasický pravděpodobnostní prostor.
2
Náhodná veličina
Definice 2.1. Uvažujme pravděpodobnostní prostor [Ω; β; P ]. Pak náhodná veličina je každé zobrazení X : Ω → R, které splňuje formální podmínku1 {ω ∈ Ω : X(w) < r} ∈ β pro každé reálné číslo r ∈ R. Neformálně řečeno je náhodná veličina očíslování elementárních jevů. Toto očíslování děláme tak, aby náhodná veličina vystihovala zkoumaný jev. Množina Ω může například odpovídat množině studentů UJEP. Ten který elementární jev pak odpovídá náhodnému zvolení konkrétního studenta. Pokud nás zajímá výška studentů, bude náhodná veličina každému elementárnímu jevu přiřazovat číslo, které odpovídá jeho výšce. Toto zobrazení bude jiné, než kdyby nás zajímala studentova hmotnost či jeho IQ. Příklad 2.2. Uvažme klasický pravděpodobnostní prostor Ω = {♣, ♦, ♥, ♠, , F} a definujme náhodnou veličinu X : Ω → R jako: X(♥) = 1 a X(ω) = 0 pro ω ∈ Ω \ {♥}. Očíslování je pěkná věc, ale je třeba též nějak přenést informaci o pravděpodobnosti do světa čísel. To nás vede k následující definici. Definice 2.3. Distribuční funkce FX náhodné veličiny X je definována vztahem FX (x) = P (X < x), kde X < x je zkrácený zápis pro jev {ω ∈ Ω : X(ω) < x}. Příklad 2.4. V případě náhodné veličiny z Příkladu 2.2 vypadá její distribuční funkce takto:
FX (x) =
0
pro x ≤ 0
1
pro x > 1
5 6
pro x ∈ (0, 1]
Věta 2.5. Distribuční funkce je neklesající a může nabývat pouze hodnot z intervalu [0, 1]. Věta 2.6. lim FX (x) = 0 a lim FX (x) = 1
x→−∞
x→∞
. Věta 2.7. Distribuční funkce je zleva spojitá v každém bodě. Věta 2.8. Pro každé x0 ∈ R platí lim FX (x) = FX (x0 ) + P (X = x0 ).
x→x+ 0
Definice 2.9. Náhodná veličina X definivaná na pravděpodobnostním prostoru [Ω, β, P ] se nazývá diskrétní náhodná veličina, pokud nabývá pouze konečně případně spočetně mnoha hodnot x1 , . . . , xn , . . .. Poznámka 2.10. Náhodná veličina definovaná na konečném či spočetně nekonečném pravděpodobnostním prostoru je nutně diskrétní. Příklad 2.11. Uvažme pravděpodobnostní prostor z Příkladu ??, který modeluje čekání na trolejbus. Dejme tomu, že pokud trolejbus přijede do tří minut, stihneme přípojný rychlík, pokud přijede do sedmi minut, stihneme alespoň přípojný osobní vlak, a pokud přijede později zmeškáme veškeré přípoje. Tuto situaci dobře popíšeme následující náhodnou veličinou: 1 Tuto
podmínku nebudeme dále používat.
X(ω) =
0
pro ω ∈ [0; 3] pro ω ∈ (3, 7]
1 2
pro ω ∈ (7, 10].
Protože nabývá pouze tří (tedy konečně mnoha) hodnot, jedná se o diskrétní náhodnou veličinu. Definice 2.12. Pro diskrétní náhodnou veličinu X nabývající hodnot x1 , . . . , xn , . . . definujeme její pravděpodobnostní funkci PX vztahem PX (xi ) = P (X = xi ). Příklad 2.13. Věta 2.14. Pro diskrétní náhodnou veličinu X nabývající hodnot x1 , . . . , xn , . . . platí (i)
P
n
PX (xn ) = 1;
(ii) FX (x) =
P
xn <x
PX (xn ).
Věta 2.15. Lze-li hodnoty x1 , . . . , xn , . . . náhodné veličiny X uspořádat tak, že x1 < x2 < x3 < . . . < xn < . . ., je distribuční funkce FX konstantní v každém intervalu (xn , xn+1 ]. Definice 2.16. Náhodná veličina X definivaná na pravděpodobnostním prostoru [Ω, β, P ] se nazývá spojitá náhodná veličina, pokud existuje nezáproná funkce fX taková, že platí Z x FX (x) = fX (t)dt. −∞
Funkci fX nazýváme hustota náhodné veličiny X. Příklad 2.17. Trolejbus a identita Věta 2.18. Pro spojitou náhodnou veličinu X s hustotou fX platí (i)
R∞ −∞
fX (t)dt = 1;
(ii) V bodech, kde existuje derivace distribuční funkce platí FX0 (x) = fX (x); (iii) Pro každé x ∈ R platí P (X = x) = 0; (iv) Distribuční funkce FX (x) je spojitá v každém bodě; (v) Platí P (x1 < X < x2 ) = P (x1 ≤ X ≤ x2 ) = FX (x2 ) − FX (x1 ) =
R x2 x1
fX (t)dt.
Příklad 2.19. Příklad 2.20.
3
Charakteristiky náhodných veličin
V této kapitole se naučíme přiřazovat náhodným veličinám čísla, která dávají jakousi základní představu o jejich chování. Definice 3.1. Střední hodnotou diskrétní náhodné veličiny X nabývající hodnot x1 , . . . , xn , . . . nazýváme číslo EX =
X
xn PX (xn ).
n
Poznámka 3.2. Dobře význam pojmu střední hodnota vysvětlují její dva anglické názvy: expected value tedy očekávaná hodnota a mean value tedy průměrná hodnota.
Příklad 3.3. Uvažme klasický pravděpodobnostní prostor (Ω, β, P ), kde Ω = {1, 2, 3, 4, 5, 6}, který dobře modeluje hod pravidelnou šestistněnnou kostkou. Definujme na něm náhodnou veličinu X : Ω → R vztahem X(ω) = ω pro ω ∈ Ω. Protože všechna čísla mohou padnout se stejnou pravděpodobností, očekávaná průměrná hodnota by měla být 3,5. To potvrzuje výpočet střední hodnoty: EX =
6 X
ωPX (ω) =
ω=1
6 X 1 ω = 3, 5. 6 ω=1
Příklad 3.4. Uvažme konečný pravděpodobnostní prostor (Ω, β, P ), kde Ω = {1, 2, 3, 4, 5, 6}, β = 2Ω a ( 0, 02 pro ω ∈ Ω \ {6} P (ω) = 0, 9 pro ω = 6, který modeluje hod nepravidelnou šestistněnnou kostkou. Definujme na něm náhodnou veličinu X : Ω → R vztahem X(ω) = ω pro ω ∈ Ω. Zřejmě bude na kostce padat šestka s daleko větší frekvencí než ostatní čísla. Očekávaná průměrná hodnota tak oproti Příkladu 3.3 bude blíže číslu 6. To potvrzuje výpočet střední hodnoty: EX =
6 X
ωPX (ω) =
ω=1
!
5 X
ω ∗ 0, 02
+ 6 ∗ 0, 9 = 5, 7.
ω=1
Střední hodnotu spojité náhodné veličiny definujeme podobně, akorát pravděpodobnostní funkci nahradí hustota a sumu integrál: Definice 3.5. Střední hodnotou spojité náhodné veličiny X s hustotou fX nazýváme číslo Z ∞ EX = tfX (t)dt. −∞
Příklad 3.6. Uvažme spojitou náhodnou veličinu z Příkladu 2.17. Vypočtěme její střední hodnotu: Z ∞ Z ∞ Z 0 Z 10 1 0dx = 5. EX = xfX (x)dx = 0dx + x xdx + 10 10 −∞ −∞ 0 Příklad 3.7. střelba na terč Věta 3.8. Pro náhodné veličiny X a Y a reálné číslo k platí 1. Ek = k 2. EkX = kEX 3. E(X + Y) = EX + EY Obecněji: Věta 3.9. Pro náhodné veličiny X1 , . . . , Xn a reálné čísla k1 , . . . , kn platí ! n n X X E k i Xi = ki EXi . i=1
i=1
Věta 3.10. Pro nezávislé náhodné veličiny X a Y platí E(XY) = EXEY. Definice 3.11. Rozptylem náhodné veličiny X nazýváme číslo D(X) = E(X − EX)2 . Definice 3.12. Směrodatnou odchylkou náhodné veličiny X nazýváme číslo σ(X) =
p
D(X).
Věta 3.13. Pro náhodnou veličinu X a konstantu k ∈ R platí
1. D(k) = 0 2. D(kX) = k 2 D(X). Definice 3.14. Kovariancí náhodných veličin X, Y nazýváme číslo cov(X, Y) = E((X − EX)(Y − EY)). Věta 3.15. Jsou-li X, Y nezávislé náhodné veličiny, pak cov(X, Y) = 0. Věta 3.16. Pro náhodné veličiny X a Y platí D(X ± Y) = D(X) + D(Y) ± 2cov(X, Y). Důsledek 3.17. Pro nezávislé náhodné veličiny X a Y platí D(X + Y) = D(X) + D(Y). Uveďme si vzoreček vhodný pro výpočet rozptylu: Věta 3.18. D(X) = E(X2 ) − (EX)2 . Příklad 3.19. Definice 3.20. Pro n ∈ N nazýváme číslo • Mn (X) = E(Xn ) n-tým momentem náhodné veličiny X; • CMn (X) = E(X − EX)n n-tým centrálním momentem náhodné veličiny X; n • N Mn (X) = E X−EX n-tým normovaným momentem náhodné veličiny X. σ(X) Definice 3.21. Pro 0 < p < 1 nazveme p-kvantilem náhodné veličiny X číslo xp = inf{r ∈ R : FX (r) ≥ p}. Tvrzení 3.22. Nechť distribuční funkce FX je ostře rostoucí na intervalu (a, b) a F ((a, b)) = (0, 1). Pak pro každé p ∈ (0, 1) platí F (xp ) = p. Jinak řečeno, funkce, která každému p ∈ (0, 1) přiřadí xp , je inverzní k distribuční funkci FX na intervalu (a, b). Příklad 3.23. Příklad 3.24. Příklad 3.25.
4
Některá rozdělení pravděpodobnosti diskrétního typu
Definice 4.1. Náhodná veličina X má alternativní rozdělení pokud nabývá pouze hodnot 0 a 1 a existuje reálné čislo p ∈ (0, 1) takové, že pro její pravděpodobnostní funkci platí PX (x) = px (1 − p)1−x , pro x ∈ {0, 1}. Tento fakt zapisujeme symbolicky jako X ∼ A(p). Příklad 4.2. Náhodná veličina z Příkladu 2.2 má alternativní rozdělení A( 61 ). Věta 4.3. Pro náhodnou veličinu X ∼ A(p) platí EX = p, D(X) = p(1 − p).
Definice 4.4. Náhodná veličina X má binomické rozdělení s parametry n, p, kde n ∈ N a p ∈ (0, 1), pokud nabývá jen hodnot x = 0, 1, . . . , n a pro její pravděpodobnostní funkci platí ! n x PX (x) = p (1 − p)n−x pro x ∈ {0, 1, . . . , n}. x Tento fakt značíme X ∼ Bi(n, p). Věta 4.5. Pro X ∼ Bi(n, p) platí: EX = n · p
D(X) = n · p · (1 − p).
a
Příklad 4.6 (Těsto s rozinkami). Do 100 kg těsta na vánočku bylo přimýcháno 10 000 rozinek. Jaká je pravděpodobnost, že v kilogramové vánočce z těsta vyrobené bude právě n rozinek? Definice 4.7. Diskrétní náhodná veličina X má Poissonovo rozdělení P o(λ) pro λ > 0 (značíme X ∼ P o(λ)), pokud její pravděpodobnostní funkce má tvar PX (n) = e−λ
λn , pro n ∈ N. n!
Poissonovo rozdělení dobře modeluje výskyt událostí (například počet rozpadů dané částice v čase, počet hovorů spojených danou telefonní ústřednou v daném čase) během procesů, které splňují následující podmínky • Počet jevů závisí jen na délce časového intervalu, nikoli na konkrétním čase pozorování a průběh procesu v minulosti neovlivňuje průběh v budoucnosti. • Sledované jevy se vyskytují v čase izolovaně. To jest, pravděpodobnost že v krátkém čase nastane více než jeden sledovaný jev je zanedbatelně malá vůči pravděpodobnosti, že nastane právě jeden jev. Příklad 4.8. Při provozu telefonní ústředny dochází v průměru k pěti spojením za minutu. Jaká je pravděpodobnost, že během 3 minut nedojde k žádnému spojení? Věta 4.9. Pro X ∼ P o(λ) platí EX = D(X) = λ. Věta 4.10. Pro nezávislé náhodné veličiny X1 , . . . , Xn takové, že Xi ∼ P o(λi ), platí n X
Xi ∼ P o(λ), kde λ =
i=1
n X
λi .
i=1
Příklad 4.11 (Těsto s rozinkami II). Mějme nekonečný přísun těsta na vánočku, v němž je průměrně 100 hrozinek na 1 kg. Jaká je pravděpodobnost, že v kilogramové vánočce z těsta vyrobené bude právě n rozinek?
5
Některá rozdělení pravděpodobnosti spojitého typu
Definice 5.1. Náhodná veličina X má Rovnoměrné rozdělení Ro(a, b),kde a < b jsou reálná čísla, pokud má hustotu ( fX (x) = Příklad 5.2 (Pravítko).
0
pro x 6∈ (a, b)
1 b−a
pro x ∈ (a, b)
Věta 5.3. Pro náhodnou veličinu X ∼ Ro(a, b) platí: EX = D(X) =
a+b , 2 (b − a)2 . 12