8
Střední hodnota a rozptyl
8
Střední hodnota a rozptyl Břetislav Fajmon, UMAT FEKT, VUT Brno
Této přednášce odpovídá kapitola 10 ze skript [1]. Také je k dispozici sbírka úloh [2], kde si můžete procvičit příklady z kapitol 2, 3 a 4. K samostatnému procvičení této přednášky: po přečtení kapitoly 10 ve skriptech [1] můžete absolvovat str. 165-168 (otázky i příklady).
bEd b@d
OBSAH
1/39
8
Střední hodnota a rozptyl Nejdůležitějšími pojmy této přednášky jsou • průměr, modus a medián souboru naměřených hodnot ; rozptyl souboru naměřených hodnot (= empirický rozptyl); směrodatná odchylka souboru naměřených hodnot (= empirická směrodatná odchylka) (JEDNODUCHÉ, nebudeme probírat, prosím přečtěte si ve skriptech [1] strany 154-159) • distribuční funkce náhodné veličiny X – vzorce pro diskrétní i pro spojitou veličinu; • střední hodnota a rozptyl náhodné veličiny X – vzorce pro diskrétní i pro spojitou veličinu.
bEd b@d
OBSAH
2/39
8
Střední hodnota a rozptyl
Uvedené pojmy budou vysvětleny na příkladech 2 a 5 z minulé přednášky a na dalších čtyřech příkladech v této přednášce. Vraťme se k příkladu 2 z minulé přednášky (X = počet šestek v pěti hodech kostkou; situace popsána tzv. pravděpodobnostní funkcí, veličina X je diskrétní veličina). A vraťme se také k příkladu 5 z minulé přednášky (X = životnost žárovky do temné komory; situace popsána tzv. hustotou, veličina X je spojitá veličina).
bEd b@d
OBSAH
3/39
8
Střední hodnota a rozptyl
Existuje nějaký matematický pojem, který by dokázal spojit jak popis diskrétní veličiny (pravděpodobnosti počítáme pomocí sumy), tak popis spojité veličiny (pravděpodobnosti počítáme pomocí integrálu)? Existuje, a jmenuje se distribuční funkce. Definice: Distribuční funkce F (x0) náhodné veličiny X se definuje jako pravděpodobnost, že náhodná veličina X nabude hodnotu menší než x0. F (x0) = P (X < x0).
bEd b@d
OBSAH
4/39
8
Střední hodnota a rozptyl Způsob výpočtu:
P pro diskrétní X; k<x0 p(k) F (x0) = P (X ∈ (−∞, x0)) = R x (1) 0 f (x) dx pro spojitou X. −∞ (POZOR, ROZLIŠUJTE f hustotu od F distribuční fce! – case-sensitivity) Je jasné, že pak hodnoty distribuční funkce vypočteme buď diskrétním, nebo spojitým přístupem, ale samotný pojem distribuční funkce popisuje jak veličiny spojité, tak veličiny diskrétní. Vypočtěme distribuční funkci v příkladech 2 a 5 z minulé přednášky: bEd b@d
OBSAH
5/39
8
Střední hodnota a rozptyl
Ad příklad 2: v tabulce jsou dány hodnoty pravděpodobnostní funkce p(k): k
0
1
2
3
4
5
.
p(k) 0,4019 0,4019 0,1608 0,0321 0,0032 0,0001 Sestrojte příslušnou distribuční funkci F (x) této veličiny. Řešení: užijme vzorec 1 pro každé reálné x – dostaneme funkci F (x) na obrázku:
bEd b@d
OBSAH
6/39
8
Střední hodnota a rozptyl
bEd b@d
OBSAH
7/39
8
Střední hodnota a rozptyl
Ad příklad 5: hustota životnosti X žárovky je dána vztahem 0 pro x < 0; f (x) = 1 x 1 · e− 100 pro x ≥ 0. 100
Vypočtěte distribuční funkci F (x) této veličiny (opět POZOR – rozlišujte f od F ). Už v minulé přednášce jsme viděli obrázek hustoty f (x):
bEd b@d
OBSAH
8/39
8
Střední hodnota a rozptyl
bEd b@d
OBSAH
9/39
8
Střední hodnota a rozptyl
Nyní se podíváme na obrázek distribuční funkce F (x): Tato byla získána integrací hustoty f (x) podle vztahu 1: Z x 0 pro x ≤ 0; f (t) dt = F (x) = 1 x 1 − e− 100 −∞ pro x > 0.
bEd b@d
OBSAH
10/39
8
Střední hodnota a rozptyl 1 0.8 0.6 0.4 0.2
–0.4 –0.2
0
0.2
0.4
0.6
0.8
1
Co mají společného grafy na stranách 7 a 11?
bEd b@d
OBSAH
11/39
8
Střední hodnota a rozptyl
Jedná se o distribuční funkce v případě diskrétním (ad př. 2 z minulé přesnášky) i v případě spojitém (ad příklad 5 z minulé přednášky). Přestože spojitý případ se od diskrétního liší, existuje několik vlastností distribuční funkce, které platí pro všechny situace. Tyto vlastnosti lze odvodit z definice distribuční funkce (z toho, že distribuční funkce je jistá pravděpodobnost, tj. hodnota v intervalu h0; 1i). Například pro x1 < x2 máme z definice F (x1) = P (X ∈ (−∞, x1)),
F (x2) = P (X ∈ (−∞, x2)),
a protože druhý z intervalů je delší než ten první, musí platit F (x1) ≤ F (x2). vlastnosti přehledně: 1. limx→−∞ F (x) = 0; bEd b@d
limx→∞ F (x) = 1.
OBSAH
12/39
8
Střední hodnota a rozptyl 2. F je neklesající funkce (jedná se o jakousi kumulativní pravděpodobnost, která pro rostoucí hodnoty proměnné x může jen růst, nikoli klesat). 3. Funkce F je zleva spojitá v každém bodě, tj. limita zleva se rovná funkční hodnotě v každém bodě: lim F (x) = F (x0) x→x0−
pro libovolné reálné x0. 4. U obou typů veličin (diskrétní i spojité) platí P (X ∈ ha; b)) = F (b) − F (a).
bEd b@d
OBSAH
13/39
8
Střední hodnota a rozptyl
Klíčová je vlastnost číslo 4: pro diskrétní i spojitou veličinu X platí vztah P (X ∈ ha; b)) = F (b) − F (a). (tento vztah pro spojitou veličinu není nic než jiného než Newton-Leibnizova formule pro výpočet určitého integrálu, ale po zavedení pojmu distribuční funkce je jeho platnost rozšířena i pro diskrétní veličiny). Pro výpočet pravděpodobností platí tedy tento klíčový vztah: P k∈ha;b) p(k) pro diskrétní X; P (X ∈ ha; b)) = F (b) − F (a) = R b f (x) dx pro spojitou X. a
bEd b@d
OBSAH
14/39
8
Střední hodnota a rozptyl
Podívejme se nyní na další příklady, ve kterých se naučíme pracovat s distribuční funkcí. Příklad 8.1. Náhodná veličina X je popsána distribuční funkcí 0,5 pro 0 < x ≤ 1; F (x) = 0,7 pro 1 < x ≤ 3; ?? jinak . Určete následující pravděpodobnosti, pokud je to možné: a) P (X > 1); b) P (X < 1); c) P (X ≥ 1); d) P (X ≤ 1).
bEd b@d
OBSAH
15/39
8
Střední hodnota a rozptyl
Řešení: Distribuční funkci známe jen na části reálné osy, ale jsme schopni pomocí ní určit všechny uvedené pravděpodobnosti: Nejednodušší je b), protože to je přesně definice funkce F (x) v bodě x = 1: P (X < 1) = F (1) = 0,5. Ze zadání jsme také schopni určit hodnotu pravděpodobnostní funkce p v bodě x = 1, protože ta je rovna „výšce schoduÿ distribuční funkce v bodě x = 1, A TEDY p(1) = 0,2. Odtud lze určit b): P (X ≥ 1) = P (X < 1)+P (X = 1) = F (1)+p(1) = 0,5+0,2 = 0,7. a) a c) dopočítáme z toho faktu, že od hodnoty 1 bEd b@d
OBSAH
16/39
8
Střední hodnota a rozptyl
odečteme pravděpodobnost opačného jevu: P (X > 1) = 1 − P (X ≤ 1) = 1 − 0,7 = 0,3; P (X ≥ 1) = 1 − P (X < 1) = 1 − 0,5 = 0,5. Tyto patálie se mohou objevit pouze u diskrétní veličiny. U spojité veličiny P (X = 1) = 0 vždy, a proto vždy platí pro spojitou veličinu P (X < 1) = P (X ≤ 1). Podívejme se tedy také na distribuční funkci spojité veličiny: Vezměme opět příklad 5 z minulé přednášky:
bEd b@d
OBSAH
17/39
8
Střední hodnota a rozptyl
Příklad 8.2. Distribuční funkce životnosti žárovky X je dána vztahem 0 pro x ≤ 0; F (x) = 1 x 1 − e− 100 pro x > 0. Určete pravděpodobnosti a) P (X < 1) = P (X ≤ 1); b) P (X ≥ 30) = P (X > 30); c) P (X ∈ h80; 120i).
Řešení: u spojité veličiny nás nezajímá, zda je v intervalech kulatá či ostrá závorka, protože to při integraci nehraje roli. Také je ideální, že je zadána bEd b@d
OBSAH
18/39
8
Střední hodnota a rozptyl
distribuční funkce. Ta totiž v sobě uchovává výsledek integrace – a pro výpočet integrálů stačí už jen dosadit meze!! −1 . P (X < 1) = F (1) = 1 − e 100 = 0,00995; −30 . P (X > 30) = 1 − P (X ≤ 30) = 1 − F (30) = e 100 = 0,74082; −80
−120
P (80 < X < 120) = F (120) − F (80) = e 100 − e 100 = 0,14813. Viz prostřední řádek výpočtu: s využitím opačného jevu se snažíme nerovnosti typu X > x0 převést na výraz využívající pravděpodobnost X < x0, a pak dosadit distribuční funkci v daném x0. Důležitým cvičením je v každém z uvedených tří případů nakreslit obrázek plochy, jejíž obsah počítáme (viz minulá přednáška). bEd b@d
OBSAH
19/39
8
Střední hodnota a rozptyl
Příklad 8.3. Domácí úkol na příští přednášku: s využitím vztahu Z x F (x) = f (t) dt −∞
vypočtěte F (x), jeli zadána hustota f (x) na obrázku: 1
y 0.5
–1
bEd b@d
0
0.5
1
x
2
3
OBSAH
20/39
8
Střední hodnota a rozptyl
Důležitými parametry pro popis náhodné veličiny jsou střední hodnota a rozptyl. Střední hodnota náhodné veličiny X je, zhruba řečeno, průměrná hodnota, kterou naměříme. Přesněji řečeno, jedná se o „teoretický průměrÿ = průměr hodnot měření veličiny X, který bychom většinou spočetli, pokud by se měřená veličina chovala přesně podle teoretického popisu zadaného distribuční funkcí F (x). Studenti musí opět pečlivě vážit, zda při výpočtu užít „diskrétníÿ či „spojitouÿ variantu vzorce:
bEd b@d
OBSAH
21/39
8
Střední hodnota a rozptyl P pro diskrétní X; k∈Ω k · p(k) EX = R +∞ −∞ x · f (x) dx pro spojitou X.
(3)
Dalším důležitým parametrem je rozptyl: ten udává, jak moc by se odchylovaly měřené hodnoty X od své střední hodnoty EX, pokud by se veličina X chovala přesně podle teoretického popisu zadaného distribuční funkcí F (x). Vzorec pro výpočet: P 2 2 pro diskrétní X; k∈Ω k · p(k) − (EX) (4) DX = R +∞ 2 2 pro spojitou X. −∞ x · f (x) dx − (EX) bEd b@d
OBSAH
22/39
8
Střední hodnota a rozptyl
Protože rozměr veličiny DX je čtverec rozměru veličiny X, pro praktické účely potřebujeme znát tzv. směrodatnou odchylku, definovanou jako √ (5) σ(X) = DX. Směrodatná odchylka je tedy veličina, která nám reprezentuje míru odchylování veličiny X od její střední hodnoty EX – a to ve stejných jednotkách jako jsou jednotky veličiny X.
bEd b@d
OBSAH
23/39
8
Střední hodnota a rozptyl
Pro názornost: zhruba řečeno, u mnoha veličin platí tzv. pravidlo šesti σ: „asi 97,5 procent měření veličiny X (tedy naprostá většina měření veličiny) leží v intervalu hEX − 3σ; EX + 3σiÿ. Tedy rozptýlenost měření veličiny X lze popsat intervalem šířky 6σ a středem v bodě EX. Více o tomto pravidle bude řečeno u normálního rozdělení pravděpodobnosti.
bEd b@d
OBSAH
24/39
8
Střední hodnota a rozptyl
Poznámka: pokud máme k dispozici měření x1, x2, . . . , xn veličiny X, tak odhadem její střední hodnoty EX je průměr těchto měření n
1X x= xi , n 1 odhadem jejího rozptylu DX je empirický rozptyl naměřených hodnot ! n n 1X 2 1X 2 2 xi − (x)2 s = (x − x) = . . . = n 1 n 1 (pomůcka pro zapamatování: průměr čtverců minus čtverec průměru). bEd b@d
OBSAH
25/39
8
Střední hodnota a rozptyl
Příklad 8.4. Diskrétní náhodná veličina udává počet gramatických chyb v krátkém textu, platí pro ni 0 pro x ≤ 0 0,5 pro x ∈ (0; 1i; 0,8 pro x ∈ (1; 2i; F (x) = 0,9 pro x ∈ (2; 3i; 0,95 pro x ∈ (3; 4i; 1 pro x ∈ (4; ∞). Určete pravděpodobnost toho, že v textu budou a) méně než dvě chyby; b) právě tři chyby; c) vypočtěte EX, DX. bEd b@d
OBSAH
26/39
8
Střední hodnota a rozptyl
Řešení: Ad a) Nejjednodušší úkol: pouze dosadíme zadání: P (X < 2) = F (2) = 0,8. Ad b,c) Veličina X může nabývat hodnot 0, 1, 2, 3, 4 – to plyne z charakteru funkce F (x). Hodnoty pravděpodobnostní funkce jsou rovny výšce schodů v jednotlivých bodech skoku. Pak P (X = 3) = 0,05; pro střední hodnotu platí (vzorec 3)
EX = 0 · (0,5 − 0) + 1 · (0,8 − 0,5) + 2 · (0,9 − 0,8) + 3 · (0,95 − 0,9) +4 · (1 − 0,95) = 0,85. DX = 1 · 0,3 + 22 · 0,1 + 32 · 0,05 +42 · 0,05 − 0,852 = 1,2275. √ . σ = DX = 1,08. bEd b@d
OBSAH
27/39
8
Střední hodnota a rozptyl
Příklad 8.5. Spojitá náhodná veličina je popsána distribuční funkcí 0 pro x ≤ 0 x pro x ∈ (0; 2i; 4 F (x) = x2 − 2x + 52 pro x ∈ (2; 3i; 2 1 pro x ∈ (3; ∞). Určete a) P (X ∈ (1,5; 2,5)); P (X > 2, 5) b) EX, DX; c) x0 tak, aby veličina X nabývala hodnoty menší než x0 s pravděpodobností 0,8.
bEd b@d
OBSAH
28/39
8
Střední hodnota a rozptyl Řešení: ad a) získáme pomocí vztahu 2: P (X ∈ (1,5; 2,5)) = F (2,5) − F (1, 5) = 0,25; 5 P (X > 2,5) = 1 − F (2,5) = 1 − = 0,375. 8
Ad c) vlastně tentýž příklad jako a), jen máme zadaný výsledek pravděpodobnosti a máme určit x0. Jen musíme dát pozor, který předpis pro F (x) platí pro dané x0: z toho, že P (X < x0) = 0,8 ⇒ F (x0) = 0,8 plyne, že x0 nemůže být z intervalu (0; 2i, protože rovnice x4 = 0,8 nemá řešení na intervalu (0; 2i. Tedy
bEd b@d
OBSAH
29/39
8
Střední hodnota a rozptyl
x ∈ (2; 3i a lze do F (x0) = 0,8 dosadit předpis x20 5 − 2x0 + = 0,8; 2 2 A nyní víme, že při řešení této kvadratické rovnice musíme hledat řešení v intervalu x ∈ (2; 3i, tedy ze dvou řešení kvadratické rovnice nyní odpovídá situaci pouze x0 = 2,7746. Ad b) pozor, case-sensitive vzorec pro EX vyžaduje, abychom z F (x) určili hustotu f (x). Díky vzorci 1 víme, že F (x) je integrálem z f (x) – naopak f (x)
bEd b@d
OBSAH
30/39
8
Střední hodnota a rozptyl
tedy najdeme jako derivaci distribuční funkce: 0 pro x ≤ 0 1 pro x ∈ (0; 2i; 4 0 f (x) = F (x) = x − 2 pro x ∈ (2; 3i; 0 pro x ∈ (3; ∞). Nyní pomocí vzorce 3 můžeme počítat 2
Z 3 1 EX = x · dx + x · (x − 2) dx = 4 0 2 2 3 2 3 x x + − x2 = 1,8333. = 8 0 3 2 Z
bEd b@d
OBSAH
31/39
8
Střední hodnota a rozptyl a podle 4 2
Z 3 1 x2 · dx + DX = x2 · (x − 2) dx − 1,83332 = 2 2 3 2 0 4 3 x 2x3 x + − 1,83332 = 0,97222. − = 6 0 4 3 2 Z
bEd b@d
OBSAH
32/39
8
Střední hodnota a rozptyl
Zakončíme dalšími shrnujícími otázkami k opakování, jejichž odpovědi musí každý student znát: otázka č. 6. Jak se definuje distribuční funkce F (x)? Odpověď: F (x) = P (X < x). otázka č. 7. Jak se čte zápis z otázky číslo 6? Odpověď: Hodnota funkce F v bodě x se rovná pravděpodobnosti, že veličina X nabude hodnoty menší než x, tj. hodnoty z intervalu (−∞; x). otázka č. 8. Jaké jsou vlastnosti distribuční funkce F (x) u diskrétní i spojité veličiny X? Odpověď:
bEd b@d
OBSAH
33/39
8
Střední hodnota a rozptyl 1. limx→−∞ F (x) = 0;
limx→∞ F (x) = 1.
2. F je neklesající funkce (jedná se o jakousi kumulativní pravděpodobnost, která pro rostoucí hodnoty proměnné x může jen růst, nikoli klesat). 3. Funkce F je zleva spojitá v každém bodě, tj. limita zleva se rovná funkční hodnotě v každém bodě: lim F (x) = F (x0)
x→x0−
pro libovolné reálné x0. 4. U obou typů veličin (diskrétní i spojité) platí P (X ∈ ha; b)) = F (b) − F (a). bEd b@d
OBSAH
34/39
8
Střední hodnota a rozptyl
otázka č. 9. Je nějaký rozdíl mezi hodnotami pravděpodobnostiP (X ∈ (a; b)), P (X ∈ ha; b)), P (X ∈ (a; bi), P (X ∈ ha; bi)? Odpověď: U spojité veličiny NE, u diskrétní veličiny ANO. přesněji u diskrétní veličiny uvedené čtyři pravděpodobnosti mohou být navzájem různé: P (X ∈ ha; b)) P (X ∈ ha; bi) P (X ∈ (a; b)) P (X ∈ (a; bi)
= = = =
F (b) − F (a); F (b) − F (a) + P (X = b); F (b) − F (a) − P (X = a); F (b) − F (a) + P (X = b) − P (X = a).
Jednoduše řečeno, pokud by se uvedené vzorce někomu zdály kostrbaté, vždy lze z funkce F (x) bEd b@d
OBSAH
35/39
8
Střední hodnota a rozptyl vyjádřit pravděpodobnostní funkci p(x) a vzorec X P (X ∈ I) = p(k) k∈I
platí pro jakýkoli tvar intervalu I. otázka č. 10. Jak se vypočte střední hodnota náhodné veličiny X? Odpověď: Pro diskrétní veličinu (s pravděpodobnostní funkcí p(k)) X EX = k · p(k); k∈Ω
bEd b@d
OBSAH
36/39
8
Střední hodnota a rozptyl (s hustotou f (x) – pozor, case-sensitive!) Z ∞ EX = x · f (x)dx. −∞
otázka č. 11. Jak se vypočte rozptyl náhodné veličiny X? odpověď: Pro diskrétní veličinu (s pravděpodobnostní funkcí p(k)) ! X DX = k 2 · p(k) − (EX)2; k∈Ω
bEd b@d
OBSAH
37/39
8
Střední hodnota a rozptyl (s hustotou f (x) – pozor, case-sensitive!) Z ∞ x2 · f (x)dx − (EX)2. DX = −∞ 0
R
otázka č. 12. Sice platí F (x) = f (x), ale F (x) 6= f (x). Jak je to možné? R Odpověď: f (x) je označení celé třídy funkcí, které se liší o konstantu. Jen jedna z nich má graf ležící celý v pásu mezi přímkami y = 0 a y = 1 a je dost malá pravděpodobnost, že je to zrovna ta, pro niž je konstanta rovna nule. Správný vztah je Z x F (x) = f (t)dt. −∞
bEd b@d
OBSAH
38/39
Literatura
Dosazením mezí je výpočet správné konstanty zaručen.
Literatura [1] Fajmon, B., Růžičková, I.: Matematika 3. Skriptum FEKT 2003 (identifikační číslo v informačním systému VUT: MAT103). http://www.rozhovor.cz/souvislosti/matematika3.pdf. [2] Hlavičková, I., Hliněná, D.: Sbírka úloh z pravděpodobnosti. Skriptum FEKT 2008.
bEd b@d
OBSAH
39/39