Příklad 1: Házíme třemi kostkami. Jaká je pravděpodobnost, že součet bude roven 5? Řešení: Jev A značí příznivé možnosti: {1, 1, 3}; {1, 2, 2}; {1, 3, 1}; {2, 1, 2}; {2, 2, 1}; {3, 1, 1}; 6 |A| 1 = 3 = = 0.0277, P (A) = |Ω| 6 36 kde |.| značí počet pvků a Ω je množina všech jevů. Příklad 2: V urně jsou kuličky tří barev. Nechť jevy A, B, C, postupně znamenají, že náhodně vybraná kulička je černá, červená, bílá. Určete význam následujících jevů: 1. Ac ∩ B c , 2. (A ∪ C) ∩ B, 3. A ∪ B ∪ C. Řešení: 1. Ac ∩ B c ... nebyla tažena ani černá ani červená kulička, tj. byla tažena bílá kulička, tj. nastal jev C. 2. (A ∪ C) ∩ B... byla tažena buďto černá nebo bílá kulička a zároveň byla tažena červená kulička, tj. nastal jev nemožný. 3. A ∪ B ∪ C... byla tažena buď černá nebo červená nebo bílá kulička, tj. nastal jev jistý.
Příklad 3: Při zkoušce dostane student tři otázky. Nechť jev A znamená, že náhodně vybraný student zodpoví správně první otázku, jev B, že zodpoví správně druhou otázku a jev C, že zodpoví správně třetí otázku. Vyjádřete pomocí jevů A, B, C, Ac , B c , C c , že náhodně vybraný student: 1. zodpoví správně jen první otázku, 1
2. zodpoví správně právě jednu otázku, 3. zodpoví správně alespoň dvě otázky. Řešení: 1. zodpoví správně jen první otázku: A ∩ B c ∩ C c , 2. zodpoví správně právě jednu otázku: (A ∩ B c ∩ C c ) ∪ (Ac ∩ B ∩ C c ) ∪ (Ac ∩ B c ∩ C), 3. zodpoví správně alespoň dvě otázky: (A ∩ B) ∪ (B ∩ C) ∪ (A ∩ C).
Příklad 4: Na party se sešlo 14 studentů, z toho 8 vysokoškoláků a 6 středoškoláků. Jaká je pravděpodobnost, že v náhodně vybrané čtveřici budou 1. všichni čtyři vysokoškoláci, 2. právě jeden vysokoškolák? Řešení: Počet všech možných čtveřic utvořených ze 14 studentů je 1. Počet všech čtveřic vytvořených z vysokoškoláků je pravděpodobnost je 8 P =
14 4
8 4
.
, tudíž hledaná
4 14 . 4
6 , počet všech 2. Počet všech trojic vytvořených ze středoškoláků je 3 8 "jednic" vytvořených z vysokoškoláků je 1 = 8. K vytvoření příznivých čtveřic je třeba všechny trojice zkombinovat se všemi "jednicemi", tudíž hledaná pravděpodobnost je 8 · 63 P = 14 . 4
2
Příklad 5: Během dne se v porodnici narodilo 10 dětí. Pravděpodobnost narození chlapce je p = 0, 514. Jaká je pravděpodobnost, že se během tohoto dne narodil v porodnici: 1. alespoň jeden chlapec, 2. maximálně dva chlapci? Řešení: Jestliže jev A pak znamená "alespoň jedno narozené dítě je chlapec", pak jev Ac znamená "všechny narozené děti jsou holčičky". Tudíž P (A) = 1 − P (Ac ) = 1 − (0, 486)10 . Jev B znamená, že se v ten den narodily buď samé holčičky nebo že jedno narozené dítě byl chlapec a zbytek holčičky (na pořadí nezáleží) nebo že dvě z narozených děti byli chlapci a zbytek holčičky (na pořadí rovněž nezáleží). Pak 10 10 10 9 P (B) = (0, 486) + 0, 514 · (0, 486) + (0, 514)2 · (0, 486)8 . 1 2
Příklad 6: Autobusy přijíždějí na zastávku v desetiminutových intervalech. Pokud přijdu na zastávku úplně náhodně, jaká je pravděpodobnost, že budu čekat déle než 7 minut a 24 sekund? Řešení: Nakreslíme-li si úsečku o délce 10 značící časovou osu, kde počáteční a koncový bod budou odpovídat příjezdům dvou autobusů, pak část této úsečky odpovídající době, kdy přijdu a budu čekat aspoň 7 minut a 24 sekund (označme si tento jev jako jev A), bude interval [0, 2.6], tudíž odpovídající pravděpodobnost je 2.6 P (A) = = 0.26. 10 Příklad 7: Mějme dvě zcela náhodná čísla x a y mezi 0 a 1. Jaká je pravděpodobnost, že jejich součet je menší než 1 a zároveň rozdíl x − y větší než 0,5? 3
Příklad 8: Dvě osoby přijdou na smluvené místo úplně náhodně nezávisle na sobě mezi 12. a 13. hodinou, počkají 20 minut a pak odejdou. Jaká je pravděpodobnost, že se potkají? Řešení: Nakreslíme-li si čtverec o hraně délky 60 značící minutu po dvanácké hodině, kdy přijde první (osa x), resp. druhá (osa y) osoba, pak odpovídající plocha je část čtverce ohraničená přímkami y = x + 20 a y = x − 20. Její plocha je rovna 2000, tudíž hledaná pravděpodobnost je P =
5 2000 = . 3600 9
Příklad 9: Při hodu dvěma mincemi uvažujeme tyto náhodné jevy: A1 . . . jev spočívající v tom, že na 1. minci padne rub, A2 . . . jev spočívající v tom, že na 2. minci padne líc, A3 . . . jev spočívající v tom, že na obou mincích padne rub nebo na obou líc. Zjistěte, zda dané jevy jsou nezávislé nebo alespoň po dvou nezávislé. Řešení:
1 1 1 P (A1 ) = , P (A2 ) = , P (A3 ) = , 2 2 2 1 1 1 P (A1 ∩ A2 ) = , P (A1 ∩ A3 ) = , P (A2 ∩ A3 ) = , 4 4 4 1 1 1 P (A1 ) · P (A2 ) = , P (A1 ) · P (A3 ) = , P (A2 ) · P (A3 ) = , 4 4 4 P (A1 ∩ A2 ∩ A3 ) = 0, neboť A1 ∩ A2 ∩ A3 je jev nemožný. Protože P (A1 ) · P (A2 ) · P (A3 ) 6= 0, nejsou jevy A1 , A2 , A3 nezávislé. Platí ale P (A1 ∩ A2 ) = P (A1 ) · P (A2 ), P (A1 ∩ A3 ) = P (A1 ) · P (A3 ), P (A2 ∩ A3 ) = P (A2 ) · P (A3 ). Proto o jevech A1 , A2 , A3 můžeme říci, že jsou nezávislé po dvou. 4
Příklad 10: Ve skupině sportovců je 20 lyžařů, 4 běžci a 6 cyklistů. Pravděpodobnost splnění normy pro lyžaře je 0.9, pro běžce 0.8 a pro cyklistu 0.75. 1. Určete pravděpodobnost toho, že náhodně vybraný sportovec splní normu. 2. Náhodně vybraný sportovec splnil normu. Jaká je pravděpodobnost, že je to cyklista? Řešení: Označme si A1 náhodně A2 náhodně A3 náhodně B náhodně Potom
vybraný vybraný vybraný vybraný
sportovec sportovec sportovec sportovec
je lyžař, je běžec, je cyklista, splnil normu.
1. Víme, že P (A1 ) =
20 30
=
2 , 3
P (A2 ) =
4 30
=
2 , 15
P (A3 ) =
6 30
=
1 . 5
Dále platí, že P (B|A1 ) = 0.9, P (B|A2 ) = 0.8, P (B|A3 ) = 0.75. Z věty o úplné pravděpodobnosti pak máme P (B) = P (B|A1 ) · P (A1 ) + P (B|A2 ) · P (A2 ) + P (B|A3 ) · P (A3 ), tj. pravděpodobnost jevu B je P (B) = 0.9 ·
2 2 1 + 0.8 · + 0.75 · = 0.86. 3 15 5
Náhodně vybraný sportovec tedy splní normu s pravděpodobností 0.86.
5
2. Po dosazení do Bayesovy věty obdržíme 0.75 · 15 P (B|A2 ) · P (A2 ) = P (A2 |B) = P3 = 0.1744. 0.86 P (A ) · P (B|A ) j j j=1 Pravděpodobnost, že náhodně vybraný sportovec splňující normu je cyklista, je rovna 0.1744.
Příklad 11: Házíme mincí. Vymyslete a popište dvě různé náhodné veličiny na množině jevů {padne rub, padne líc} a sestrojte jejich distribuční funkce. Řešení: Označme si jevy ω1 ... padne rub, ω2 ... padne líc. Pak náhodnými veličinami mohou být např. zobrazení √ X(ω1 ) = 0, X(ω2 ) = 1 a Y (ω1 ) = 10.11, Y (ω2 ) = − 2, (ale i další přiřazující jevům ω1 a ω2 nějaké reálné číslo). Jejich distribuční funkce jsou tvaru x ∈ (−∞, 0) x ∈ [0, 1) x ∈ [1, ∞).
FX (x) =0 1/2 1 a
√ x ∈ (−∞, − 2) √ x ∈ [− 2, 10.11) x ∈ [10.11, ∞).
FY (x) =0 1/2 1
Příklad 12: Uvažujme hod kostkou, tj. množinu jevů Ω = {ω1 , ..., ω6 }, kde ωi značí, že padlo číslo i, a náhodnou veličinu X takovou, že X(ω1 ) = X(ω3 ) = X(ω4 ) = X(ω6 ) = −1
6
a X(ω2 ) = X(ω5 ) = 2. Sestrojte distribuční funkci. Řešení: Jelikož čtyřem jevům přiřazujeme hodnotu -1 a pravděpodobnosti každého z jevů je 1/6, přičemž tyto jevy jsou disjunktní, pak pravděpodobnost, že náhodná veličina je menší nebo rovna -1 je 4·1/6 = 2/3. Obdobně uvažujeme i pravděpodobnost, že X nabude hodnoty 2, rovnu 2/6 = 1/3. Distribuční funkce je pak tvaru x ∈ (−∞, −1) x ∈ [−1, 2) x ∈ [2, ∞).
FX (x) =0 2/3 1
Příklad 13: Určete konstantu c tak, aby funkce f (x) byla hustota nějaké náhodné veličiny, když f (x) =cx2 ex 0
x ∈ (0, 1) jinak.
Řešení: Pro hustotu musí platit Z f (x)dx = 1. R
Dvojitým použitím integrace per partes dostaneme Z Z 1 f (x)dx = cx2 ex dx = c(e − 2), R
0
a tudíž c = 1/(e − 2). Příklad 14: Sestrojte distribuční funkci náhodné veličiny dané hustotou z příkladu 13 a určete pravděpodobnost, že tato náhodná veličina nabývá hodnoty mezi -0,5 a 0,5. 7
Řešení: Distribuční funkce pro spojité náhodné veličiny je tvaru Z x F (x) = f (y)dy, −∞
tudíž F (x) =0 Z =
x≤0 x
2 y
y e 1 dy = [y 2 ey − 2yey + 2ey ]x0 = e−2 0 e−2 2 x x x e − 2xe + 2ex − 2 e−2 =1
x ∈ (0, 1) x ≤ 1.
Obecně pro spojité náhodné veličiny platí Z b P (a < X < b) = f (x)dx = F (b) − F (a), a
tudíž Z
0.5
P (−0.5 < X < 0.5) =
Z f (x)dx =
−0.5
0
0.5
x2 ex 1.25 · e0.5 − 2 dx = e−2 e−2
nebo také P (−0.5 < X < 0.5) =F (0.5) − F (−0.5) = =
0.52 e0.5 − 2 · 0.5 · e0.5 + 2e0.5 − 2 −0= e−2
1.25 · e0.5 − 2 . e−2
Příklad 15: Uvažujme pravděpodobnostní prostor s množinou jevů Ω = {ω1 , ω2 , ω3 }, přičemž P (ω1 ) = 1/2, P (ω2 ) = 1/3 a P (ω3 ) = 1/6, a náhodnou veličinu X definovanou jako X(ω1 ) = 1, X(ω2 ) = 3 a X(ω3 ) = 6. Spočtěte EX a var X. Řešení: EX =
3 X
xi P (X = xi ) = 1 ·
i=1
8
1 1 1 5 +3· +6· = , 2 3 6 2
3 X
1 1 19 1 + 32 · + 62 · = , 2 3 6 2 i=1 2 19 5 13 2 2 var X = EX − (EX) = − = . 2 2 4
EX 2 =
x2i P (X = xi ) = 12 ·
Příklad 16: Uvažujme náhodnou veličinu danou hustotou f (x) =e−x 0
x ≥ 0, jinak.
Spočtěte EX a var X. Řešení: Z
∞
EX = EX 2 =
∞
Z
xe−x dx = 1,
xf (x)dx = Z
−∞ ∞
0
x2 f (x)dx =
Z
−∞
∞
x2 e−x dx = 2,
0 2
2
var X = EX − (EX) = 2 − 12 = 1.
Příklad 17: V testu je 15 otázek s možnými odpověďmi a)-e), právě jedna je správná. Jaká je pravděpodobnost, že při zcela náhodném tipování trefí student správně aspoň tři otázky? Popište náhodnou veličinu popisující počet správných odpovědí. Řešení: Označme X náhodnou veličinu popisující počet správných odpovědí. Ta má binomické rozdělení Bi(15; 0,2), tj. P (X = k) =
15 0, 2k (0, 8)15−k , k
pro k = 0, 1, . . . , 15.
EX = 15 · 0, 2 = 3, var X = 15 · 0, 2 · 0, 8 = 2, 4. 9
Pravděpodobnost, že při zcela náhodném tipování trefí student správně aspoň tři otázky, je tedy P (X ≥ 3) =
15 X
15 0, 2k (0, 8)15−k . k
k=3
Příklad 18: Telefonní ústředna zapojí během hodiny průměrně 15 hovorů. Jaká je pravděpodobnost, že během 4 minut zapojí ústředna 1. právě jeden hovor, 2. alespoň dva hovory a nejvýše pět hovorů? Řešení: Označme X náhodnou veličinu popisující počet příchozích hovorů během 4 minut. Ta má Poissonovo rozdělení P o(1), neboť střední hodnota počtu příchozích hovorů během 4 minut odpovídající parametru λ je 1, tj. P (X = k) =
1k −1 e , k!
P (X = 1) =
11 −1 e = e−1 = 0, 3678, 1
tudíž a P (2 ≤ X ≤ 5) =
k = 0, 1, . . . ,
12 −1 13 −1 14 −1 15 −1 e + e + e + e = 0, 2636. 2! 3! 4! 5!
Příklad 19: Pan Novák má svazek pěti klíčů, z nichž právě jeden je od jeho bytu. Po příchodu z hospody ke dveřím bytu je ve stavu, že správný klíč nehledá, ale zkouší strčit do zámku klíč náhodně vybraný, přičemž vždy, když netrefí ten pravý, mu svazek klíčů spadne na zem. Po desátém pokusu se pak vzbudí jeho manželka a...(důsledky raději nedomýšlet). Jaká je pravděpodobnost, že se manželka pana Nováka nevzbudí? Řešení: Označme X náhodnou veličinu popisující počet neúspěšných pokusů. Pak 10
X ∼ Geom(0.2), tj. P (spící manželka) = P (X ≤ 9) =
9 X
0.8k 0.2 = 0.2
k=0 10
= 1 − 0.8
1 − 0.810 1 − 0.8
= 0.893.
Nebo jinak: Označme Y náhodnou veličinu popisující počet úspěšných pokusů v prvních 10 pokusech. Pak Y ∼ Binom(10, 0.2), tj. 10 P (spící manželka) = P (Y ≥ 1) = 1 − P (Y = 0) = 1 − 0.20 0.810 0 = 1 − 0.810 = 0.893.
Příklad 20: Pošta chodí pravidelně mezi 10:00 až 12:00 rovnoměrně. Jaká je pravděpodobnost, že obdržíme poštu mezi 11:30 až 12:30? Řešení: Označme X náhodnou veličinu popisující čas příchodu pošty. Ta má rovnoměrné rozdělení Ro(10, 12). Hustota je tedy 1 2 0
x ∈ (10, 12),
f (x) =
jinak.
a hledaná pravděpodobnost je Z 12,5 Z f (x)dx = 11,5
12
11,5
1 1 dx = . 2 4
Příklad 21: Do pojišťovny přijdou průměrně 2 hlášení škody denně. Jaká je pravděpodobnost, že do pojišťovny přijde nejbližší hlášení škody nejdříve třetí den? 11
Řešení: Tuto úlohu můžeme řešit jak s využitím Poissonova rozdělení, tak exponenciálního rozdělení. a) Náhodná veličina X "doba čekání na příchod dalšího hlášení" má exponenciální rozdělení. Parametr λ = 2, protože EX = 1/λ = 1/2 (ze zadání víme, že v průměru přijdou 2 hlášení škody denně, tj. střední doba čekání je půl dne). Hledaná pravděpodobnost je pak P (X > 2) = 1 − P (X ≤ 2) = 1 − F (2) = 1 − (1 − e−2·2 ) = e−4 nebo také počítáno jako ∞
Z
Z
∞
f (x)dx =
P (X > 2) =
2e−2x dx = e−4 .
2
2
b) Náhodná veličina Y "počet hlášení během dvou dní" má Poissonovo rozdělení. Parametr λ = 4 protože EY = λ a ze zadání víme, že během dvou dní přijdou v průměru 4 hlášení. Hledaná pravděpodobnost je pak P (Y = 0) = e−4 ·
40 = e−4 . 0!
Příklad 22: Z dlouhodobých měření je známo, že přístroj má poruchu v průměru jednou za 10 000 hodin. Předpokládejme, že "doba čekání na poruchu" je náhodná veličina X s exponenciálním rozdělením. Stanovme hodnotu t tak, aby pravděpodobnost, že přístroj bude pracovat delší dobu než t, byla 0.99. Řešení: P (X > t) = 1 − P (X ≤ t) = 1 − F (t) = 0.99, neboli F (t) = 0.01. Ze zadání je patrné, že X ∼ Exp(1/10000), a tedy t
0, 01 = 1 − e− 10000 .
12
Odtud po úpravě t = −10000 · log 0, 99 . t = 100, 5.
Příklad 23: Víme, že populace určitého druhu stromů dorůstá výšky X s normálním rozdělením N (20, 16). Spočtěte pravděpodobnost, že náhodně vybraný strom má výšku a) menší než 16, b) větší než 20, c) v mezích od 12 do 28, d) menší než 12 nebo větší než 28, e) rovnu 22. Řešení: Provedeme transformaci veličiny X na normovanou veličinu Z = stejně upravíme i druhou stranu nerovnosti.
X−20 √ 16
a) P (X < 16) = P (Z <
16−20 ) 4
= P (Z < −1) = Φ(−1) =
= 1 − Φ(1) = 1 − 0, 84134 = 0, 15866 b) 20 − 20 ) = P (Z > 0) = 1 − P (Z ≤ 0) = 4 = 1 − Φ(0) = 1 − 0.5
P (X > 20) = P (Z >
c) P (12 ≤ X ≤ 28) = P ( 12−20 ≤Z≤ 4
28−20 ) 4
=
= P (−2 ≤ Z ≤ 2) = Φ(2) − Φ(−2) = = Φ(2) − [1 − Φ(2)] = 2Φ(2) − 1 = = 2 · 0, 97725 − 1 = 0, 95450 13
a
d) P (X < 12) + P (X > 28) = 1 − P (12 ≤ X ≤ 28) = = 1 − 0, 95450 = 0, 04550 e) P (X = 22) = 0.
Příklad 24: Nechť X ∼ Ro(0, 2) a Y = X 2 + 1. 1. Sestrojte distribuční funkci náhodné veličiny Y . 2. Spočtěte cov(X, Y ). 3. Rozhodněte, zda jsou X a Y nezávislé? Proč? Řešení: 1. Označme F distribuční funkci náhodné veličiny X a G distribuční funkci náhodné veličiny Y . Pak F (x) = 0 pro x ≤ 0, x = pro x ∈ (0, 2), 2 = 1 pro x ≥ 2, a tudíž G(y) = P (Y ≤ y) = P (X 2 + 1 ≤ y) = P (X ≤ = 0 pro y ≤ 1, √ y−1 = pro y ∈ (1, 5), 2 = 1 pro y ≥ 5.
p
y − 1) =
2. Upravme cov(X, Y ) = EXY − EXEY = EX(X 2 + 1) − EXE(X 2 + 1) = EX 3 + EX − EXEX 2 − EX = EX 3 − EXEX 2 . 14
Hustota náhodné veličiny X je f (x) =
1 2
pro x ∈ [0, 2] a 0 jinde. Pak Z
Z EX =
2
xf (x)dx = ZR2
0
x dx = 1 2
2
x 4 dx = 2 3 Z0 2 3 x EX 3 = dx = 2 0 2 2 4 cov(X, Y ) = 2 − 1 · = 3 3 EX 2 =
3. Nejsou nezávislé ⇐ cov(X, Y ) 6= 0.
Příklad 25: Sdružené pravděpodobnosti náhodných veličin X a Y jsou dány následující tabulkou: Y=0 Y=1 Y=2 X=0 1/8 1/8 0 X=1 3/8 1/8 1/4 Jaká jsou jejich marginální rozdělení? Jsou veličiny X a Y nezávislé? Jak vypadá jejich korelační matice? Řešení: a) Rozdělení vektoru X je P (X = 0) = P (X = 0, Y = 0) + P (X = 0, Y = 1) + P (X = 0, Y = 2) = 1 1 1 = + +0= 8 8 4 P (X = 1) = P (X = 1, Y = 0) + P (X = 1, Y = 1) + P (X = 1, Y = 2) = 3 1 1 3 = + + = . 8 8 4 4
15
Rozdělení vektoru Y je analogicky 1 3 1 + = 8 8 2 1 1 1 P (Y = 1) = + = 8 8 4 1 1 P (Y = 2) = 0 + = . 4 4 P (Y = 0) =
b) Veličiny X a Y nejsou nezávislé, neboť např. P (X = 0) · P (Y = 2) =
1 6= 0 = P (X = 0, Y = 2). 16
c) Kovarianci vypočteme ze vztahu cov(X, Y ) = EXY − EXEY : 1 3 3 +1· = 4 4 4 1 1 1 3 EY =0 · + 1 · + 2 · = 2 4 4 4 1 1 EXY =0 · 0 · + 0 · 1 · + 0 · 2 · 0 8 8 1 1 5 3 +1·0· +1·1· +1·2· = 8 8 4 8 5 3 3 1 cov(X, Y ) =EXY − EXEY = − · = . 8 4 4 16 EX =0 ·
Rozptyly pak vypočteme ze vztahů var X = EX 2 − (EX)2 a var Y = EY 2 − (EY )2 : 3 3 1 + 12 · = 4 4 4 1 1 1 5 EY 2 =02 · + 12 · + 22 · = 2 4 4 4 2 3 3 3 var X = − = 4 4 16 EX 2 =02 ·
5 var Y = − 4
2 3 11 = 4 16
16
Korelace je tedy corr(X, Y ) = √
1 cov(X, Y ) √ = q 16 3 var X var Y · 16
11 16
1 =√ 33
a korelační matice Corr(X, Y ) =
√1 33
1 √1 33
1
! .
Příklad 26: Sdružená hustota náhodných veličin X a Y je y 1 f(X,Y ) (x, y) = e−x− 2 2 =0
x > 0, y > 0 jinak.
Jaká jsou jejich marginální rozdělení? Jsou veličiny X a Y nezávislé? Jak vypadá jejich korelační matice? Řešení: a) fX (x) =
R∞
=
R∞
fY (y) =
R∞
=
R∞
−∞
0
1 −x− y2 e dy 2
−∞
0
fX,Y (x, y)dy = y
−x = 12 e−x · [−2e− 2 ]∞ 0 = e .
fX,Y (x, y)dx =
1 −x− y2 e dx 2
y
y
1 −2 = 12 e− 2 · [−e−x ]∞ . 0 = 2e
b) Složky jsou nezávislé právě tehdy, když fX,Y (x, y) = fX (x)·fY (y), ∀x, y, což podle a) platí. c) Z nezávislosti X, Y plyne okamžitě cov(X, Y ) = 0 ⇒ corr(X, Y ) = 0 ⇒ 1 0 Corr(X, Y ) = . 0 1 17
Příklad 27: Firma má 50 poboček. Pravděpodobnost, že v současné finanční krizi pobočka krachne do příštího léta, je 0.1. Jaká je pravděpodobnost, že krachnou minimálně tři pobočky? (Řešte pomocí CLV.) Řešení: Označme Xi ∼ Alt(0.1) náhodnou veličinu, která představuje to, zda nám i-tá pobočka do příštího léta krachne (Xi = 1) nebo ne (Xi = 0). Pro Xi platí, že EXi = µ = 0.1, var Xi = σ 2 = 0.1 · 0.9. Je třeba vypočíst 50 X P( Xi ≥ 3). i=1
Použití CLV spočívá v úpravě výrazu do tvaru majícího na levé straně normované normální rozdělení. Můžeme tedy psát
P
X 50 i=1
P50 3 − 50 · µ i=1 Xi − 50 · µ √ ≥ √ Xi ≥ 3 = P 50 · σ 2 50 · σ 2 P50 3 − 50 · 0.1 i=1 Xi − 50 · 0.1 √ =P ≥ √ 50 · 0.09 50 · 0.09 = 1 − P (Z < −0.94) = 1 − Φ(−0.94) = Φ(0.94),
kde Z ∼ N (0, 1). V tabulkách najdeme hodnotu distribuční funkce Φ(0.94) = 0.83, což je hledaná pravděpodobnost. Příklad 28: Cestou na přednášky do Dejvic přestupuju na Muzeu. Ráno i odpoledne mají metra stejný interval mezi odjezdy 3 minuty. Přednášek během semestru je celkem 24. Jaká je pravděpodobnost, že při cestách na přednášky a zpět (!!!) strávím čekáním na metro v součtu více než 1.5 hodiny? Řešení: Označme Xi ∼ Ro(0, 3) náhodnou veličinu, která představuje dobu čekání na metro při jedné cestě. Pro Xi platí, že EXi = µ = 1.5, var X = σ 2 = 0.75. Je třeba vypočíst 48 X P( Xi ≥ 90). i=1
18
Spočtěme tento příklad opět pomocí CLV.
P
X 48 i=1
P48 90 − 48 · µ i=1 Xi − 48 · µ √ Xi ≥ 90 = P ≥ √ 48 · σ 2 48 · σ 2 P48 90 − 48 · 1.5 i=1 Xi − 48 · 1.5 √ ≥ √ =P 48 · 0.75 48 · 0.75 = 1 − P (Z < 3) = 1 − Φ(3) = 1 − 0.999 = 0.001.
Příklad 29: Uvažujme následující data: 1. počty výskytů jistého druhu rostliny na ploše 1 m2 : 0, 2, 1, 4, 4, 5, 2, 3, 7; 2. časy (v sekundách) mezi impulzy v mozku: 4.25, 0.65, 1.35, 0.20, 0.55, 6.63, 1.38, 0.22, 0.27; 3. venkovní teploty naměřené v různých letech při pravidelné akci konané v půlce října: 8.07, 19.23, 9.27, 5.71, 12.62, 11.24, 11.92, 17.30, 14.87. Nakreslete pro tato data a) histogramy b) boxploty c) empirickou distribuční funkci a odhadněte, z jakého rozdělení mohou tato data pocházet. Řádně zdůvodněte. Řešení: Cetnosti teplot
1.0
cetnosti
cetnosti 2
1.0
0
0.0
1
0.5
0.5 0.0
cetnosti
3
1.5
1.5
4
5
2.0
Cetnosti casu mezi impulzy
2.0
Cetnosti vyskytu rostlin
0
2
4 pocet rostlin na 1 m^2
6
0
1
2
3
4
casy mezi impulzy
19
5
6
7
5
10
15 teploty
20
Boxplot pro pocty rostlin
Boxplot pro teploty
0
0
6
1
1
8
2
2
10
3
3
12
4
4
14
5
5
16
6
6
18
7
Boxplot pro casy mezi impulzy
0
2
4 pocty
6
8
1.0 0.8 0.6 0.0
0.2
0.4
Empiricka distribucni funkce
0.8 0.6 0.0
0.2
0.4
Empiricka distribucni funkce
0.8 0.6 0.4 0.0
0.2
Empiricka distribucni funkce
Empiricka distribucni funkce pro teploty
1.0
Empiricka distribucni funkce pro casy mezi impulzy
1.0
Empiricka distribucni funkce pro pocty rostlin
0
2
4 casy mezi impulzy
6
5
10
15
20
teploty
1. Jedná se o diskrétní rozdělení, přičemž počet rostlin na dané ploše není teoreticky omezený ⇒ data pocházejí nejspíš z Poissonova rozdělení. 2. Jedná se o spojité rozdělení, přičemž histogram připomíná křivku hustoty exponenciálního rozdělení (nebo také graf empirické distribuční funkce připomíná křivku distribuční funkce exponenciálního rozdělení) ⇒ data pocházejí nejspíš z exponenciálního rozdělení. 3. Jedná se o spojité rozdělení, přičemž histogram připomíná Gaussovu křivku (tj. křivku hustoty normálního rozdělení) ⇒ data pocházejí nejspíš z normálního rozdělení.
20
Příklad 30: Počet kazů na tabulkách skla se řídí Poissonovým rozdělením. Bylo pozorováno 17 tabulek 4 tabulky 1 tabulka 2 tabulky 1 tabulka
bez s1 s2 s3 s5
kazu kazem kazy kazy kazy.
Metodou maximální věrohodnosti určete parametr λ tohoto Poissonova rozdělení. Řešení: Máme realizaci náhodného výběru x1 , . . . , xn . Pro náhodnou veličinu s rozdělením P ois(λ) je P (X = k) = Věrohodnostní funkce je L(λ) =
n Y λ xi i=1
xi !
e−λ = (
λk −λ e . k!
λ0 −λ 17 λ1 −λ 4 λ2 −λ 1 λ3 −λ 2 λ5 −λ 1 λ17 −25λ e ) ( e )( e )( e )( e ) = e . 0! 1! 2! 3! 5! 1440
Logaritmicko-věrohodnostní funkce je l(λ) = log L(λ) = 17 log λ − 25λ − log 1440. Její derivace je 17 ∂l(λ) = − 25. ∂λ λ Řešením je 17 ˆ = 17 . − 25 = 0 ⇒ λ ˆ 25 λ
Příklad 31: Doba do poruchy daného přístroje má exponenciální rozdělení. Od začátku roku bylo zjištěno, že stroj se porouchal postupně za 20 dní, 37.5 dní, 28 dní, 10.5 dní a 54 dní. Metodou maximální věrohodnosti určete parametr λ tohoto exponenciálního rozdělení. Řešení: Máme realizaci náhodného výběru x1 , . . . , xn . 21
Pro náhodnou veličinu s rozdělením Exp(λ) je f (x) = λe−λx pro x > 0. Věrohodnostní funkce je L(λ) =
n Y
λe−λxi = λe−λ·20 λe−λ·37.5 λe−λ·28 λe−λ·10.5 λe−λ·54 = λ5 e−λ·150 .
i=1
Logaritmicko-věrohodnostní funkce je l(λ) = log L(λ) = 5 log λ − 150λ. Její derivace je 5 ∂l(λ) = − 150. ∂λ λ Řešením je 5 ˆ= 1. − 150 = 0 ⇒ λ λ 30 Příklad 32: Pro data z příkladu 29 nakreslete Q-Q plot a rozhodněte podle něj, která z dat splňují normalitu. Řešení:
Q−Q plot pro casy mezi impulzy
Q−Q plot pro teploty
14
0
0
6
1
1
8
2
10
12
kvantily pro teploty
4 3
kvantily pro casy mezi impulzy
4 3 2
kvantily pro pocty rostlin
5
5
16
6
6
18
7
Q−Q plot pro pocty rostlin
−1.5
−1.0
−0.5
0.0 kvantily rozdeleni N(0,1)
0.5
1.0
1.5
−1.5
−1.0
−0.5
0.0 kvantily rozdeleni N(0,1)
0.5
1.0
1.5
−1.5
−1.0
−0.5
0.0
0.5
1.0
1.5
kvantily rozdeleni N(0,1)
Z grafů lze usoudit, že z normálního rozdělení pocházejí třetí data (tj. teploty). Rovněž s prvními daty (počty rostlin) bychom dle výsledku Q-Q plotu mohli zacházet jako s normálně rozdělenými (nesmíme však zapomínat, že se jedná o počty, tudíž diskrétní rozdělení). Příklad 33: U 64 praktických lékařů byl naměřen výběrový průměr počtu pacientů za den 23, výběrový rozptyl pak byl roven 36, rozdělení počtu pacientů 22
není známé. Otestujte (pomocí intervalu spolehlivosti) na hladině 5%, zda skutečná střední hodnota počtu pacientů za den může být považována za rovnu 25. Řešení: Za nulovou, resp. alternativní, hypotézu si zvolíme H0 : střední počet pacientů denně = 25, HA : střední počet pacientů denně 6= 25. Víme, že pro libovolné rozdělení náhodné veličiny X je oboustranným intervalovým odhadem pro µ = EX o asymptotické spolehlivosti 1 − α interval Sn ¯ Sn ¯ n − u1−α/2 √ (X , Xn + u1−α/2 √ ). n n 2 ¯ 64 = 23, S64 Z dat máme n = 64, X = 36, α = 0.05 a z tabulek vyčteme u0.975 = 1.96. Hledaný interval tedy je 6 6 (23 − 1.96 · , 23 − 1.96 · ) = (21.53, 24.47). 8 8 Jelikož hodnota 25 v tomto intervalu neleží, zamítáme na hladině 5% hypotézu H0 ve prospěch alternativy HA . Příklad 34: Výrobce tvrdí, že spotřeba jím vyráběného automobilu je 8 l/100km. Průměrná spotřeba u 49 uživatelů ale byla 8.4 l/100km. Naměřen byl dále výběrový rozptyl 2.56. Testujte na hladině 5%, zda měl výrobce pravdu. Řešení: Za nulovou, resp. alternativní, hypotézu si zvolíme H0 : spotřeba = 8 l/100km, HA : spotřeba 6= 8 l/100km. Za platnosti H0 má náhodná veličina ¯ − 8√ X √n 49 2.56 rozdělení t48 . Vypočteme proto hodnotu 8.4 − 8 T0 = · 7 = 1.75. 1.6 23
Jelikož |T0 | < t48;0.975 = 2.011, hypotézu H0 ve prospěch HA nezamítáme. Možnost také je, že si za nulovou, resp. alternativní, hypotézu zvolíme H0 : spotřeba = 8 l/100km, HA : spotřeba > 8 l/100km. Hodnotu T0 = 1.75 však porovnáme s kvantilem t48;0.95 = 1.68, neboť alternativě tentokrát nahrává "horních 5%". A jelikož T0 > t48;0.95 = 1.68, hypotézu H0 ve prospěch této HA zamítáme. Příklad 35: Firma má tři pobočky. Dva roky bylo sledováno, která z nich zaznamenala nejvyšší měsíční výnos. Bylo zjištěno, že nejvýnosnější byla první pobočka desetkrát, druhá šestkrát a třetí osmkrát. Je možné říct, že první pobočka je nejvýnosnější dvakrát častěji než zbylé dvě? Testujte na hladině 5%. Řešení: Pro i = 1, 2, 3 označme pi pravděpodobnost, že nejvýnosnější pobočkou měsíce bude i−tá pobočka, a Xi počet měsíců, kdy byla i−tá pobočka nejvýnosnější pobočkou měsíce. Za nulovou, resp. alternativní, hypotézu si zvolíme H0 : p1 = 12 , p2 = p3 = 14 , HA : hodnoty jsou jiné. Za platnosti H0 má náhodná veličina 3 X (Xi − 24 · pi )2 i=1
24 · pi
rozdělení χ2 . Vypočteme proto hodnotu (10 − 12)2 (6 − 6)2 (8 − 6)2 χ = + + = 1. 12 6 6 2
Jelikož χ2 < χ22;0.95 = 5.992, hypotézu H0 ve prospěch HA nezamítáme. Příklad 36: U 120 osob byla pozorována výše jejich platu a schopnost splácet 24
úvěr. Naměřeny byly následující sdružené četnosti: plat / schopnost splácet nízký střední vysoký
špatná 10 15 5
dobrá 20 45 25
Jsou vlastnosti plat a schopnost splácet úvěr nezávislé? Testujte na hladině 5%. Řešení: Za nulovou, resp. alternativní, hypotézu si zvolíme H0 : veličiny jsou nezávislé, HA : veličiny nejsou nezávislé. Za platnosti H0 má náhodná veličina ni. ·n.j 2 n ni. ·n.j n
3 X 2 X nij − i=1 j=1
rozdělení χ2(3−1)(2−1) = χ22 . Doplníme proto tabulku o marginální četnosti plat / schopnost splácet nízký střední vysoký celkem
špatná 10 15 5 30
dobrá 20 45 25 90
celkem 30 60 30 120
30·30 2 ) (20 − 30·90 )2 (15 − 60·30 )2 120 120 120 + + 30·30 30·90 60·30 120 120 120 30·90 2 2 (5 − 30·30 ) (25 − ) . 120 120 + = 2.22. 30·30 30·90 120 120
(45 −
a vypočteme hodnotu 2
χ =
(10 −
+
+
60·90 2 ) 120 60·90 120
Jelikož χ2 = 2.22 < χ20.95,2 = 5.992, nezamítáme hypotézu H0 ve prospěch HA . 25
Příklad 37: Pro testy v příkladech 34-36 určete p-hodnotu. Řešení: 1. Příklad 34: (a) oboustranná alternativa: p-value = α : t48;1−α/2 = 1.75 ⇒ p-value = 0.0865; (b) jednostranná alternativa: p-value = α : t48;1−α = 1.75 ⇒ p-value = 0.04325. 2. Příklad 35: p-value = α : χ22;1−α = 1 ⇒ p-value = 0.6065. 3. Příklad 36: p-value = α : χ22;1−α = 2.22 ⇒ p-value = 0.3296.
Příklad 38: Na pěti deskách ze stejného materiálu byla pozorována závislost průhybu desky (v 10−2 mm) na tlaku (v 10−1 MPa). Měření byla následující: tlak 2 4 6 8 10 ohyb 14 35 48 61 80 1. Sestrojte regresní přímku (tj. odhadněte parametry a zakreslete do grafu). 2. Otestujte, zda některý z koeficientů je možno považovat za nulový. 3. Pokud je to možné, sestavte podmodel a odhadněte znovu jeho parametr(y). Řešení: 1. Bodové odhady parametrů a a b metodou nejmenších čtverců, tj. 5
X ∂ S(a, b) = −2 (yi − a − bxi ) = 0 ∂a i=1 5
X ∂ S(a, b) = −2 (yi − a − bxi )xi = 0 ∂b i=1 ⇓ 26
P5 P5 P5 x y − x y (xi − x¯)yi i i i i i=1 i=1 i=1 ˆb = = Pi=1 P5 P 2 5 5 ¯)2 5 i=1 x2i − i=1 (xi − x i=1 xi a ˆ = y¯ − ˆb¯ x, 5
P5
jsou a ˆ = 0.2, ˆb = 7.9. Regresní přímka je tedy přímka y = 0.2 + 7.9x. 2. Pro testovaní, zda se koeficienty modelu výrazně liší od nuly, používáme statistiky ˆb a ˆ Ta = , resp. Tb = , Sa Sb kde P s2 5i=1 x2i 2 Sa = P5 2 P5 5 i=1 x2i − i=1 xi s2 Sb2 = P5 , 2 2 x − 5¯ x i=1 i P5
(y −a−bx )2
i i přičemž s2 = i=1 5−2 . Jelikož Ta = 0.072 < t3;0.975 = 3.18, hypotézu H0 : a = 0 ve prospěch HA : a 6= 0 nezamítáme. Jelikož Tb = 18.975 > t3;0.975 = 3.18, hypotézu H0 : b = 0 ve prospěch HA : b 6= 0 zamítáme.
3. Podmodel tedy je Y = bX + a odhad b metodou nejmenších čtverců je 5 X ˆb = arg min (yi − bxi )2 , b
i=1
tj. 5
5
X ∂ X (yi − bxi )2 = −2xi (yi − bxi ) = 0, ∂b i=1 i=1 jejímž řešením dostáváme P5 ˆb = Pi=1 xi yi = 7.927, 5 2 i=1 xi takže výsledný podmodel je Y = 7.927X + . 27
Příklad 39: Při experimentu byly naměrěny následující hodnoty veličin X a Y: X −2 −1 0 1 2 Y −0.1 0.33 1.12 2.62 7.11 1. Předpokládejme, že mezi X a Y by měl být následující Y = αeX . Pvztah xi Určete P 2xi koeficient α metodou nejmenších čtverců. ( e yi = 60.89, e = 63.14) 2. Předpokládejme, že mezi X a Y by měl být lineární vztah ve tvaru YP= a + bX. b metodou nejmenších čtverců. P Určete koeficienty P 2 a aP ( xi = 0, yi = 11.08, xi = 10, xi yi = 16.71) 3. Jaký model z předchozích dvou modelů je vhodnější a proč? Řešení: α ˆ = arg min α
5 X
(yi − αexi )2 ,
i=1
tj. 5
5
X ∂ X (yi − αexi )2 = 2(yi − αexi )exi = 0, ∂α i=1 i=1 jejímž řešením dostáváme P5 yi exi 60.89 = = 0.964, α ˆ = Pi=1 5 2x i 63.14 i=1 e takže výsledný model je Y = 0.964eX + . Příklad 40: Nechť {Xt , t ∈ Z} je posloupnost nezávislých, stejně rozdělených náhodných veličin. Je tento proces striktně stacionární? Dokažte nebo vyvraťte. Řešení: Náhodný proces {Xt , t ∈ T } je striktně stacionární, jestliže pro libovolné n ∈ N, pro libovolná reálná x1 , . . . , xn a pro libovolná reálná t1 , . . . , tn a h taková, že tk ∈ T , tk + h ∈ T , 1 ≤ k ≤ n, platí Ft1 ,...,tn (x1 , . . . , xn ) = Ft1 +h,...,tn +h (x1 , . . . , xn ). 28
V našem případě pro všechna přípustná h, tj. h ∈ Z platí Ft1 ,...,tn (x1 , . . . , xn ) = P (Xt1 ≤ x1 , . . . , Xtn ≤ xn ) =
n Y
P (Xti ≤ xi )
i=1
=
n Y
P (Xti +h ≤ xi ) = P (Xt1 +h ≤ x1 , . . . , Xtn +h ≤ xn )
i=1
= Ft1 +h,...,tn +h (x1 , . . . , xn ), tudíž je tento proces striktně stacionární. Příklad 41: Nechť X je náhodná veličina s nulovou střední hodnotou a konečným kladným rozptylem σ 2 . Definujme proces {Xt , t ∈ Z} předpisem Xt = (−1)t X. Je tento proces slabě stacionární? Je striktně stacionární? Dokažte nebo vyvraťte. Řešení: 1. Slabá stacionarita: Náhodný proces {Xt , t ∈ T } je slabě stacionární, jestliže R(s, t) je funkcí pouze rozdílu s − t, tj. ˜ − t), R(s, t) = R(s neboli R(s, t) = R(s + h, t + h) pro každé h ∈ R takové, že s + h ∈ T a t + h ∈ T. V našem případě R(s, t) = cov(Xs , Xt ) = EXs Xt −EXs EXt = EXs Xt = (−1)s+t X 2 = (−1)s+t σ 2 a pro všechna přípustná h, tj. h ∈ Z tudíž platí R(s + h, t + h) = (−1)s+h+t+h σ 2 = (−1)2h (−1)s+t σ 2 = (−1)s+t σ 2 , takže proces je slabě stacionární. 29
2. Striktní stacionarita: Zvolíme-li např. X náhodnou veličinu takovou, že 2 3 1 P (X = −2) = , 3 pak tato náhodná veličina splňuje podmínky zadání, ale zárověň v procesu {Xt , t ∈ Z} pro t = 1 a h = 1 platí P (X = 1) =
2 3 1 P (X1+1 ≤ 0) = P (X2 ≤ 0) = , 3 což je ve sporu s definicí striktní stacionarity, takže proces není striktně stacionarní. P (Xt ≤ 0) = P (X1 ≤ 0) =
Příklad 42: Pro pojištění motorových vozidel používá pojišťovna tři kategorie pojistného: 1 - základní pojistné, 2 - bonus 30%, 3 - bonus 50%. V prvním roce platí pojištěný základní pojistné. Jestliže má rok bezeškodní průběh, je pojištěný v dalším roce zařazen o třídu výše (pokud je to možné), pokud ale uplatní jeden pojistný nárok, je v příštím roce zařazen o kategorii níže (pokud je to možné) a při uplatnění více než jednoho nároku o dvě kategorie níže (pokud je to možné). Počty výskytů pojistné události v jednotlivých letech jsou nezávislé, stejně rozdělené náhodné veličiny s Poissonovým rozdělením s parametrem λ. Určete počáteční rozdělení a matici pravděpodobností přechodu. Řešení: Počáteční rozdělení je p = (1, 0, 0)T . Označme X náhodnou veličinu popisující počet uplatnění pojistných nároků za rok. Víme, že X ∼ P o(λ), tj. P (X = 0) =
λ0 −λ e = e−λ , 0!
P (X = 1) = 30
λ1 −λ e = λe−λ 1!
a P (X ≥ 2) = 1 − P (X = 0) − P (X = 1) = 1 − e−λ − λe−λ . Matice pravděpodobností přechodu tedy je 1 − e−λ e−λ 0 1 − e−λ 0 e−λ . P= 1 − e−λ − λe−λ λe−λ e−λ
Příklad 43: Na příkladu havarijního pojištění z předešlého příkladu určete matici pravděpodobností přechodu druhého řádu. Jaká je pravděpodobnost, že po dvou letech pojištění bude mít pojištěný 50% bonus, když začíná v základní třídě a uplatňuje nárok na pojistné plnění průměrně jednou za šest let? Řešení: Pro matici pravděpodobností přechodu druhého řádu platí 1 − e−λ 1 − e−λ e−λ 0 1 − e−λ 1 − e−λ 0 e−λ P(2) = P2 = −λ −λ −λ −λ 1 − e−λ − λe−λ 1 − e − λe λe e 1 − e−λ e−λ (1 − e−λ ) e−2λ e−2λ = 1 − e−λ − λe−2λ e−λ (1 − e−λ + λe−2λ ) −λ −2λ −λ −λ −2λ 1 − e − λe e (1 − e ) e (λ + 1)
e−λ 0 0 e−λ = −λ λe e−λ .
Hledaná pravděpodobnost je tedy 2
(2)
p1,3 = e−2λ = e− 6 = 0.71653.
Příklad 44: Uvažujme posloupnost nezávislých hodů kostkou. Nechť Xm značí maximální počet ok dosažených do m−tého hodu včetně. 1. Určete matici pravděpodobností přechodu. 2. Klasifikujte jednotlivé stavy. 3. Existuje v tomto řetězci nějaký absorpční stav? 4. Které stavy jsou dosažitelné z kterých? 31
Řešení: 1. Pro prvky matice platí 1 6 j = 6 =0
i<j
pij =
i=j i > j.
Matice pravděpodobností přechodu tedy je 1 1 1 1 1 6
P=
0 0 0 0 0
6 2 6
6 1 6 3 6
6 1 6 1 6 4 6
6 1 6 1 6 1 6 5 6
1 6 1 6 1 6 1 6 1 6
0 0 0 0 0 0 0 0 0 0 1
2. Stav j Markovského řetězce je trvalý, jestliže P (τj (1) < ∞) = 1, a přechodný, jestliže P (τj (1) = ∞) > 0, kde τj (1) = inf{n > 0 : Xn = j} je čas prvního návratu řetězce startujícího z j do stavu j. Jelikož P (τj (1) = ∞) =
X
pjk =
k:k>j
6−j > 0 pro j = 1, 2, . . . , 5, 6 = 0 pro j = 6,
jsou stavy 1,...,5 přechodné a stav 6 je trvalý. Trvalý stav j Markovského řetězce je nenulový, jestliže Eτj (1) < ∞, a nulový, jestliže Eτj (1) = ∞. Jelikož Eτ6 (1) = 1, je stav 6 trvalý nenulový. 3. Je-li pjj = 1, pak se stav j nazývá absorpční. Absorpční je tedy stav 6. 4. Stav j je dosažitelný ze stavu i, jestliže existuje n ∈ N takové, že (n) pij > 0. Jelikož v našem případě pij = 0 pro j < i, tak dosažitelné jsou stavy: 1 ze stavu 1, 32
2 3 4 5 6
ze ze ze ze ze
stavu stavu stavu stavu stavu
1,2, 1,2,3, 1,...,4, 1,...,5, 1,...,6.
Příklad 45: Uvažujme havarijní pojištění z příkladu 42. Najděte pro tento řetězec stacionární rozdělení. Řešení: P Vektor π se nazývá stacionární rozdělení, jestliže πj ∈ [0, 1], j∈S πj = 1 a platí π T = π T P, neboli πj =
X
πk pkj , j ∈ S.
k∈S
Při označení a = e−λ a b = λe−λ dostáváme tudíž soustavu rovnic π1 = π1 (1 − a) + π2 (1 − a) + π3 (1 − a − b) π2 = π1 a + π3 b π3 = π2 a + π3 a, která sice sama o sobě nemá jednoznačné řešení (neboť P3 matice, která ji určuje, nemá plnou hodnost), avšak přidáním podmínky j=1 πj = 1 již jednoznačné řešení dostaneme, a to 1 − a − ab 1 − e−λ − λe−2λ , = 1 − ab 1 − λe−2λ a(1 − a) e−λ (1 − e−λ ) π2 = = , 1 − ab 1 − λe−2λ a2 e−2λ π3 = = . 1 − ab 1 − λe−2λ π1 =
Příklad 46: Určete matici intenzit přechodu v Poissonově procesu. 33
Řešení: Pro počty událostí v časovém intervalu (t, t + h) platí P (Nt+h − Nt = 0) = 1 − λh + o(h), P (Nt+h − Nt = 1) = λh + o(h), P (Nt+h − Nt ≥ 2) = o(h), neboli pij = λh + o(h), = 1 − λh + o(h), = o(h) =0
j = i + 1, j = i, j > i + 1, j < i.
Limity jsou pak λh + o(h) = λ, h→0+ h
qi,i+1 = lim a
1 − (1 − λh + o(h)) = λ ⇒ qi,i = −λ h→0+ h
qi = lim tudíž
Q=
−λ λ 0 0 0 −λ λ 0 0 0 −λ λ .. .. .. .. . . . .
0 ... 0 ... 0 ... .. .
Příklad 47: Metodou směrodatné odchylky (a = 2.5) spočtěte brutto pojistné, které musí pojišťovna od pojištěnců vybrat v případě, že celková výše škod se řídí složeným rozdělením, počet škodních událostí má Poissonovo rozdělení, výše jednotlivých škod má exponenciální rozdělení, průměrně je pojišťovně hlášeno 5000 škod ročně a průměrná výše jedné hlášené škody je 20 000 Kč. Řešení: Brutto pojistné je BP = ES + a ·
34
√ var S.
Pro složená rozdělení S=
N X
Xi .
i=1
platí ES = EN EX1 a var S = EN var X1 + var N (EX1 )2 . Jelikož N ∼ P o(5 · 103 ), máme EN = 5 · 103
var N = 5 · 103 .
a
Jelikož X ∼ Exp(1/(2 · 104 )), máme EX1 = 2 · 104
var X1 = 4 · 108 .
a
Tudíž ES = 108 , var S = 1012 a dosazením dostáváme výsledek √ BP = 108 + 5 · 1012 = 105 mil. Kč.
Příklad 48: Za škody vzniklé v roce 2010 zaplatila pojišťovna 8 mil. Kč ještě v roce 2010 a dále 4 mil. Kč v roce 2011, 2 mil. Kč v roce 2012 a 1 mil. Kč v roce 2013. Další roky již pojišťovna nic platit nebude. Za škody vzniklé v roce 2011 zaplatila pojišťovna 10 mil. Kč v roce 2011, 3 mil. Kč v roce 2012 a 3 mil. Kč v roce 2013. Za škody vzniklé v roce 2012 zaplatila pojišťovna 7 mil. Kč v roce 2012 a 3 mil. Kč v roce 2013. Za škody vzniklé v roce 2013 zaplatila pojišťovna 10 mil. Kč v roce 2013. Údaje za rok 2014 ještě k dispozici nemáme. Metodou chain ladder spočtěte výši rezervy na pojistná plnění. Řešení: Kumulativní trojúhelník (s jednotkou 1 milion Kč) pro tento případ má tvar 2010 2011 2012 2013
0 8 10 7 10
1 12 13 10
35
2 14 16
3 15
Metoda chain ladder předpokládá, že sloupce jsou si úměrné, tj. že . Xj,s+1 = cs Xj,s , s = 0, 1, 2, j = 2010, ..., 2013. Odhady parametru cs jsou 12 + 13 + 10 = 1.4, 8 + 10 + 7 14 + 16 cˆ1 = = 1.2, 12 + 13 15 = 1.07. cˆ2 = 14
cˆ0 =
Trojúhelník na čtverec pak tedy doplníme pomocí vztahu ˆ j,r = Xj,2011−j cˆ2011−j · · · cˆr−1 , X tj. ˆ 2009,3 = X2008,2 · cˆ2 = 16 · 1.07 = 17.14, X ˆ 20010,2 = X2009,1 · cˆ1 = 10 · 1.2 = 12, X ˆ 20010,3 = X2009,1 · cˆ1 · cˆ2 = 10 · 1.2 · 1.07 = 12.86, X ˆ 2011,1 = X2010,0 · cˆ0 = 10 · 1.4 = 14, X ˆ 2011,2 = X2010,0 · cˆ0 · cˆ1 = 10 · 1.4 · 1.2 = 16.8, X ˆ 2011,3 = X2010,0 · cˆ0 · cˆ1 · cˆ2 = 10 · 1.4 · 1.2 · 1.07 = 18, X tj. do tvaru 2008 2009 2010 2011
0 8 10 7 10
1 12 13 10 14
2 14 16 12 16.8
3 15 17.14 12.86 18
takže výše rezervy (tj. součet rozdílů hodnot v posledním sloupečku mínus poslední známá hodnota) je R = (15 − 15) + (17.14 − 16) + (12.86 − 10) + (18 − 10) = 12 mil. Kč. 36
Příklad 49: Spočtěte 1. pravděpodobnost, že se 97-letá žena dožije sta let, 2. pravděpodobnost, že tato žena ve věku 100 let zemře. (V úmrtnostních tabulkách nalezneme hodnoty p97 = 0.51, p98 = 0.46, p99 = 0.41 a p100 = 0.36). Řešení: 1. Chceme spočítat 3 p97 . Pro tuto hodnotu platí 3 p97
. = p97 · p98 · p99 = 0.51 · 0.46 · 0.41 = 0.10.
2. Chceme spočítat hodnotu 3 p97 · q100 . Jelikož platí q100 = 1 − p100 , dostáváme hodnotu q100 = 0.64, takže hledaná pravděpodobnost je 3 p97
· q100 = 0.10 · 0.64 = 0.064.
Příklad 50: Spočtěte JNP pro pojištění 40-letého muže na dožití věku 60 let a částku 100 000 Kč (nejprve vyjádřete obecně pomocí pravděpodobností úmrtí/dožití se a pak převeďte na komutační čísla, které dosadíte do výpočtu). Řešení: l60 20 D60 l60 · v 60 = 105 · · v = 105 · = 40 l40 l40 · v D40 20087.4 = 53660 Kč. = 105 · 37434.4
JN P = 105 ·20 p40 · v 20 = 105 ·
Příklad 51: Spočtěte JNP pro pojištění 60-letého muže pro případ smrti na částku 100 000 Kč (nejprve vyjádřete obecně pomocí pravděpodobností úmrtí/dožití se a pak převeďte na komutační čísla, které dosadíte do výpočtu). Řešení: ∞ ∞ ∞ X X X d60+k k+1 d60+k · v 60+k+1 k+1 5 5 JN P = 10 · p ·q ·v = 10 · ·v = 10 · k 60 60+k l60 l60 · v 60 k=0 k=0 k=0 5
37
5
= 10 ·
P∞
k=0
C60+k
D60
= 105 ·
M60 13369.1 = 105 · = 66555 Kč. D60 20087.4
Příklad 52: Spočtěte JNP pro dočasné pojištění 60-letého muže pro případ smrti na dobu 10 let a na částku 100 000 Kč (nejprve vyjádřete obecně pomocí pravděpodobností úmrtí/dožití se a pak převeďte na komutační čísla, které dosadíte do výpočtu). Řešení: 9 9 9 X X X d60+k k+1 d60+k · v 60+k+1 k+1 5 5 = 10 · ·v = 10 · = JN P = 10 · k p60 ·q60+k ·v l60 l60 · v 60 k=0 k=0 k=0 P∞ P∞ P9 5 5 k=10 C60+k k=0 C60+k − k=0 C60+k = 10 · = = 10 · D60 D60 P∞ P∞ C − M60 − M70 60+k k=0 C70+k = 105 · k=0 = 105 · = D60 D60 13369.1 − 9394.3 = 105 · = 19787.5 Kč. 20087.4 5
Příklad 53: Spočtěte JNP pro smíšené pojištění 50-leté ženy na dobu 20 let a na částku 100 000 Kč v případě smrti a 50 000 Kč v případě dožití (vyjádřete za znalosti předešlého pomocí komutačních čísel, které pak dosadíte do výpočtu). Řešení: JN P = 105 · JN P1 + 5 · 104 · JN P2 , kde JN P1 je JN P na 1 Kč pro případ smrti před dosažením věku 50+20=70 let a JN P2 je JN P na 1 Kč pro případ dožití se 70 let. Z příkladu 52 víme, že JN P1 =
M50 − M70 14586.6 − 11356.2 = = 0.10921, D50 29580.9
38
a z příkladu 50 zase máme JN P2 =
15674.5 D70 = = 0.52989, D50 29580.9
takže JN P = 105 · 0.10921 + 5 · 104 · 0.52989 = 37415.5 Kč.
Příklad 54: Spočtěte JNP pro pojištění doživotního důchodu 60-letého muže na částku 10 000 Kč ročně vyplácenou na začátku každého roku, kdy je pojištěnec naživu (nejprve vyjádřete obecně pomocí pravděpodobností úmrtí/dožití se a pak převeďte na komutační čísla, které dosadíte do výpočtu). Řešení: 4
JN P = 10 ·
∞ X
k p60
k
4
· v = 10 ·
k=0
∞ X l60+k k=0
l60
k
4
· v = 10 ·
∞ X l60+k · v 60+k k=0
l60 · v 60
=
P∞
D60+k N60 286652.2 = 104 = 104 = 142702.5 Kč. D60 D60 20087.4
4
k=0
= 10 ·
Příklad 55: Spočtěte JNP pro pojištění doživotního důchodu odloženého o 25 let pro 35-letou ženu na částku 10 000 Kč ročně vyplácenou na začátku každého roku, kdy je pojištěnec naživu (nejprve vyjádřete obecně pomocí pravděpodobností úmrtí/dožití se a pak převeďte na komutační čísla, které dosadíte do výpočtu). Řešení: ∞ X
JN P = 104 ·
k 4 k p35 · v = 10 ·
k=25 4
= 10 ·
P∞
k=25
D35+k
D35
4
= 10 ·
∞ ∞ X X l35+k k l35+k · v 35+k · v = 104 · = 35 l l 35 35 · v k=25 k=25
P∞
D60+k N60 377413.6 = 104 = 104 = 87537.5 Kč. D35 D35 43114.5
k=0
Příklad 56: Na osmi vzorcích různých materiálů byla sledovaná jejich pružnost 39
a pevnost. Obě vlastnosti byly ohodnoceny stupni 1-nízká až 5-vysoká a zaznamenány do následující tabulky: vzorek č. 1 2 3 4 5 6 7 8 pružnost 1 1 1 2 2 3 4 4 pevnost 1 2 4 1 5 3 3 4 Setřiďte materiály do tří skupin tak, aby si dvojice vlastností byly co nejpodobnější. Použijte k tomu 1. metodu centroidů, 2. metodu medoidů. Řešení: 1. Počáteční centroidy (např. první tři prvky ze souboru): C1 = [1, 1], C2 = [1, 2], C3 = [1, 4] 1.iterace: vzdál. ↓ k → C1 C2 C3 do shluku [1, 1] 0 1 3 1 [1, 2] 1 0 2 2 [1, 4] 3 3 √ 2 √ 0 [2, 1] 1 √ 1 √ 1 + 1 √1 + 9 2 2 [2, 5] 1 + 4 1 + 3 1 + 1 3 √ √ √ 2 2 2 2 [3, 3] √2 + 2 √2 + 1 √2 + 1 2 (nebo 3) 2 2 2 2 [4, 3] √3 + 2 √ 3 + 1 √3 + 1 2 (nebo 3) [4, 4] 32 + 32 32 + 22 32 + 0 3 shluk 1: [1, 1], [2, 1] ⇒ nový centroid C1 = [ 1+2 , 1+1 ] = [ 32 , 1] 2 2 shluk 2: [1, 2], [3, 3], [4, 3] ⇒ nový centroid C2 = [ 1+3+4 , 2+3+3 ] = [ 83 , 83 ] 3 3 shluk 3: [1, 4], [2, 5], [4, 4] ⇒ nový centroid C3 = [ 1+2+4 , 3+3+4 ] = [ 73 , 13 ] 3 3 3
40
2.iterace: vzdál. ↓ k → [1, 1] [1, 2] [1, 4] [2, 1] [2, 5] [3, 3] [4, 3] [4, 4]
q C1 ( 12 )2 + 0 q ( 1 )2 + 1 q 2 ( 12 )2 + 32 q ( 1 )2 + 0 q 2 ( 12 )2 + 42 q ( 3 )2 + 22 q 2 ( 52 )2 + 22 q ( 52 )2 + 32
C2 q
( 53 )2
q
+
( 53 )2
( 5 )2 + ( 23 )2 q 3 ( 53 )2 + ( 43 )2 q ( 2 )2 + ( 53 )2 q 3 ( 23 )2 + ( 73 )2 q ( 1 )2 + ( 13 )2 q 3 ( 43 )2 + ( 13 )2 q ( 43 )2 + ( 43 )2
do shluku q C3 10 2 4 2 ( ) +(3) 1 q3 ( 4 )2 + ( 37 )2 1 q 3 ( 43 )2 + ( 31 )2 3 q )2 ( 1 )2 + ( 10 1 3 q3 ( 13 )2 + ( 32 )2 3 q ( 2 )2 + ( 34 )2 2 q 3 ( 53 )2 + ( 34 )2 2 q ( 53 )2 + ( 31 )2 3
, 1+2+1 ] = [ 43 , 43 ] shluk 1: [1, 1], [1, 2], [2, 1] ⇒ nový centroid C1 = [ 1+1+2 3 3 shluk 2: [3, 3], [4, 3] ⇒ nový centroid C2 = [ 3+4 , 3+3 ] = [ 72 , 3] 2 2 , 4+5+4 ] = [ 73 , 13 ] shluk 3: [1, 4], [2, 5], [4, 4] ⇒ nový centroid C3 = [ 1+2+4 3 3 3 3.iterace: vzdál. ↓ k → [1, 1] [1, 2] [1, 4] [2, 1] [2, 5] [3, 3] [4, 3] [4, 4]
do shluku q C1 q C2 q C3 )2 ( 1 )2 + ( 13 )2 ( 5 )2 + 22 ( 4 )2 + ( 10 1 3 q 3 q2 q3 ( 1 )2 + ( 23 )2 ( 5 )2 + 1 ( 4 )2 + ( 73 )2 1 q 3 q 2 q 3 ( 1 )2 + ( 12 )2 ( 5 )2 + 1 ( 4 )2 + ( 13 )2 3 3 q3 q 2 q 3 )2 ( 2 )2 + ( 13 )2 ( 3 )2 + 22 ( 1 )2 + ( 10 1 3 q 3 q 2 q3 ( 2 )2 + ( 11 ( 3 )2 + 22 ( 1 )2 + ( 23 )2 3 )2 3 q3 q2 q 3 ( 5 )2 + ( 53 )2 ( 1 )2 + 0 ( 2 )2 + ( 43 )2 2 q 3 q 2 q 3 ( 8 )2 + ( 53 )2 ( 1 )2 + 0 ( 5 )2 + ( 43 )2 2 q 3 q 2 q 3 ( 83 )2 + ( 83 )2 ( 12 )2 + 1 ( 53 )2 + ( 13 )2 2
shluk 1: [1, 1], [1, 2], [2, 1] ⇒ nový centroid C1 = [ 1+1+2 , 1+2+1 ] = [ 43 , 43 ] 3 3 3+4+4 3+3+4 , 10 ] shluk 2: [3, 3], [4, 3], [4, 4] ⇒ nový centroid C2 = [ 3 , 2 ] = [ 11 3 3 41
, 4+5 ] = [ 32 , 29 ] shluk 3: [1, 4], [2, 5] ⇒ nový centroidC3 = [ 1+2 2 2 4.iterace: vzdál. ↓ k → [1, 1] [1, 2] [1, 4] [2, 1] [2, 5] [3, 3] [4, 3] [4, 4]
q C1 ( 1 )2 + ( 13 )2 q 3 ( 13 )2 + ( 23 )2 q ( 1 )2 + ( 12 )2 3 q3 ( 23 )2 + ( 13 )2 q )2 ( 2 )2 + ( 11 3 q3 ( 53 )2 + ( 53 )2 q ( 8 )2 + ( 53 )2 q 3 ( 83 )2 + ( 83 )2
q C2 ( 8 )2 + ( 37 )2 q 3 ( 83 )2 + ( 34 )2 q ( 8 )2 + ( 32 )2 q 3 ( 53 )2 + ( 37 )2 q ( 5 )2 + ( 35 )2 q 3 ( 23 )2 + ( 31 )2 q ( 1 )2 + ( 31 )2 q 3 ( 13 )2 + ( 32 )2
C3
do shluku
q
( 12 )2 + ( 27 )2
1
q
( 12 )2 + ( 25 )2
1
q
( 12 )2 + ( 21 )2
3
q
( 12 )2 + ( 27 )2
1
q
( 12 )2 + ( 21 )2
3
q
( 32 )2 + ( 23 )2
2
q
( 52 )2 + ( 23 )2
2
q
( 52 )2 + ( 21 )2
2
shluk 1: [1, 1], [1, 2], [2, 1] shluk 2: [3, 3], [4, 3], [4, 4] shluk 3: [1, 4], [2, 5] ⇒ nedošlo k přesunu prvků ⇒ je to konečná podoba shluků. 2. Počáteční medoidy (např. první tři prvky ze souboru): M1 = [1, 1], M2 = [1, 2], M3 = [1, 4] 1.iterace: M1 M2 M3 do shluku vzdál. ↓ k → [1, 1] 0 1 3 1 [1, 2] 1 0 2 2 [1, 4] 3 2 0 3 √ √ [2, 1] 1 √ 1 √ 1 + 1 √1 + 9 2 2 [2, 5] 3 √1+4 √1 + 3 √ 1 + 1 2 2 2 2 [3, 3] √2 + 2 √2 + 1 √2 + 1 2 (nebo 3) 2 2 2 2 [4, 3] √3 + 2 √ 3 + 1 √3 + 1 2 (nebo 3) 2 2 2 2 [4, 4] 3 +3 3 +2 32 + 0 3 • shluk 1: [1, 1], [2, 1] D[1,1],[2,1] = D[2,1],[1,1] = 1 ⇒ nový medoid např. M1 = [1, 1] 42
• shluk 2: [1, 2], [3, 3], [4, 3] √ D[1,2],[3,3] = D[3,3],[1,2] = √22 + 1 D[1,2],[4,3] = D[4,3],[1,2] = 32 + 1 D[3,3],[4,3] = D[4,3],[3,3] = 1 √ √ D[1,2] = D[1,2],[3,3] + D[1,2],[4,3] = √22 + 1 + 32 + 1 D[3,3] = D[3,3],[1,2] + D[3,3],[4,3] = √22 + 1 + 1 D[4,3] = D[4,3],[1,2] + D[4,3],[3,3] = 32 + 1 + 1 ⇒ nový medoid M2 = [3, 3] • shluk 3: [1, 4], [2, 5], [4, 4] √ D[1,4],[2,5] = D[2,5],[1,4] = 2 D[1,4],[4,4] = D[4,4],[1,4] = 3√ D[2,5],[4,4] = D[4,4],[2,5] = 22 + 1√ D[1,4] = D[1,4],[2,5] + D[1,4],[4,4] = √2 + √ 3 2 D[2,5] = D[2,5],[1,4] + D[2,5],[4,4] = 2 + √ 2 +1 D[4,4] = D[4,4],[1,4] + D[4,4],[2,5] = 3 + 22 + 1 ⇒ nový medoid M3 = [2, 5] 2.iterace: vzdál. ↓ k → M1 do shluku √ M3 √ M2 2 2 2 [1, 1] 0 1 √2 + 2 √1 + 4 2+1 2 [1, 2] 1 2 1 + 3 1 √ √ 2 [1, 4] 3 2 3 √2 + 1 2 4 1 [2, 1] √ 1 √1 + 2 2 2 [2, 5] 1+2 3 √1+4 √ 0 2 2 2 [3, 3] 0 2 √2 + 2 √1+2 2 + 22 2 + 22 [4, 3] 3 1 2 2 √ √ √ 2 2 2 3 +3 2 2 +1 2 [4, 4] • shluk 1: [1, 1], [1, 2], [2, 1] D[1,1],[1,2] = D[1,2],[1,1] = 1 D[1,1],[2,1] = D[2,1],[1,1] = 1√ D[1,2],[2,1] = D[2,1],[1,2] = 2 D[1,1] = D[1,1],[1,2] + D[1,1],[2,1] = 1 + 1√ D[1,2] = D[1,2],[1,1] + D[1,2],[2,1] = 1 + √2 D[2,1] = D[2,1],[1,1] + D[2,1],[1,2] = 1 + 2 ⇒ nový medoid M1 = [1, 1] 43
• shluk 2: [3, 3], [4, 3], [4, 4] √ D[4,4],[3,3] = D[3,3],[4,4] = 2 D[4,4],[4,3] = D[4,3],[4,4] = 1 D[3,3],[4,3] = D[4,3],[3,3] = 1 √ D[4,4] = D[4,4],[3,3] + D[4,4],[4,3] = √2 + 1 D[3,3] = D[3,3],[4,4] + D[3,3],[4,3] = 2 + 1 D[4,3] = D[4,3],[4,4] + D[4,3],[3,3] = 1 + 1 ⇒ nový medoid M2 = [4, 3] • shluk 3: [1, 4], [2, 5] √ D[1,4],[2,5] = D[2,5],[1,4] = 2 ⇒ nový medoid např. M3 = [2, 5] 3.iterace: vzdál. ↓ k → M1 do shluku √ M3 √ M2 2 2 2 [1, 1] 0 1 √3 + 2 √1 + 4 2 2 [1, 2] 1 1√+ 3 1 √3 + 1 2 [1, 4] 3 2 3 √3 +1 2 + 22 [2, 1] 1 2 4 1 √ √ 2 2 2 2 +2 √ 0 3 [2, 5] √1+4 2 2 2 [3, 3] 1 2 √2 + 2 √1+2 2 2 2 2 [4, 3] 0 2 √2 + 2 √3 + 2 2 2 2 3 +3 1 2 +1 2 [4, 4] • shluk 1: [1, 1], [1, 2], [2, 1] • shluk 2: [3, 3], [4, 3], [4, 4] • shluk 3: [1, 4], [2, 5] ⇒ nedošlo k přesunu prvků ⇒ je to konečná podoba shluků.
44