6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5 - 5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme měli náhodnou veličinu, která nabývala jednotlivých diskrétních hodnot. Její distribuční funkce byla po úsecích konstantní. V příkladě 5.9 jsme ukázali náhodnou veličinu, jejíž distribuční funkce byla spojitá a pravděpodobnost toho, že taková náhodná veličina nabývá jediné konkrétní hodnoty je pak nulová. V příkladu 5.10 jsme ukázali náhodnou veličinu, která měla vlastnosti obou předchozích. Její distribuční funkce byla někde spojitá, a v některých bodech měla skoky. Ty odpovídaly hodnotám s kladnou pravděpodobností výskytu. Uvedeme nyní typy rozdělení náhodné veličiny, jejich charakteristiky a vztahy pro výpočet pravděpodobností. I. D i s k r é t n í
rozdělení
6.1. Definice: Diskrétní rozdělení, pravděpodobnostní funkce. Říkáme, že náhodná veličina X má diskrétní rozdělení, jestliže nabývá pouze diskrétních hodnot. Funkce p, která je definována vztahem p(x) = P (X = x),
x ∈ R,
se nazývá pravděpodobnostní funkce. 6.2. Věta: Vlastnosti pravděpodobnostní funkce. Jestliže má náhodná veličina X diskrétní rozdělení a p je její pravděpodobnostní funkce, pak platí: a) Náhodná veličina X nabývá konečně nebo nejvýše spočetně mnoha hodnot. Ty tvoří konečnou nebo nekonečnou posloupnost M = {xi } = {x1 , x2 , . . .}. b) Je 0 ≤ p(x) ≤ 1, x ∈ R. c) p(x) > 0 ⇔ x ∈ M. P d) p(x) = 1. x∈M
51
e) Distribuční funkce F je po úsecích konstatní. Body nespojiosti jsou pouze v bodech množiny M a pro xi ∈ M je F (xi ) − F (xi −) = p(xi ) = P (X = xi ). Pro distribuční funkci platí vztah: X
F (x) = P (X ≤ x) =
p(xi ).
xi ∈M, xi ≤x
Důkaz: a) Pokud náhodná veličina nabývá nějaké hodnoty x, je pak P (X = x) > 0. Jestliže má být součet všech těchto kladných hodnot roven jedné, musí jich být konečně nebo nejvýše spočetně mnoho. Víme, že je pak můžeme uspořádat do posloupnosti (očíslovat je). b) Je p(x) = P (X = x) a to je vždy číslo z intervalu mezi 0 a 1. c) Vlastnost plyne ze skutečnosti, že p(x) = P (X = x). d) Je-li množina M výčtem všech hodnot náhodné veličiny X, pak tvrzení vyplývá z vlastnosti pravděpodobnosti, additivity a skutečnosti, že P (U ) = 1. e) Jestliže si uvědomíme co znamená vztah F (x) = P (X ≤ x), x ∈ R, pak z něj bezprostředně uvedené vlastnosti plynou. Poznámka: Pro řady z d) a e) používáme obvykle značení X
p(x) =
x∈R
X
p(x)
X
a
xi ∈M, xi ≤x
x∈M
p(xi ) =
X
p(z),
z≤x
kde sčítáme pouze kladné hodnoty argumentu. Je zřejmé, že pravděpodobnostní funkce p je úplnou charakteristikou diskrétního rozdělení, která je jednodušší než distribuční funkce. Používáme ji proto k popisu náhodné veličiny častěji. Stačí tedy takovou náhodnou veličinou zadat posloupností M = {xi } hodnot, kterých náhodná veličina nabývá a jejich pravděpodobnostmi. Obvykle tak činíme pomocí tabulky. x p(x)
x1 p(x1 )
x2 p(x2 )
... ...
xk p(xk )
... ...
6.3. Příklad: Zapišme do tabulky pravděpodobnostní funkce náhodných veličin z příkladů 5.5, 5.6 a 5.8. 52
a) Podle zadání je X ∈ {0, 1} a P (X = 0) = p(0) = 1 − p, P (X = 1) = p(1) = p. Je tedy x p(x)
0 1−p
1 p
b) Ze zadání je X ∈ ! {0, 1, 2, . . . , n} a n P (X = k) = p(k) = pk (1 − p)n−k , 0 ≤ k ≤ n. Tudíž k x p(x)
0 (1 − p)n
1
...
np(1 − p)n−1
...
k n k
...
n
...
pn
!
pk (1 − p)n−k
c) Ze zadání je X ∈ N a P (X = k) = p(k) = p(1 − p)k−1 , k = 0, 1, 2, . . . . Tedy x p(x)
1 p
2 p(1 − p)
II. S p o j i t é
... ...
k p(1 − p)k−1
... ...
rozdělení
Poznámka: V příkladě 5.9 jsme uvedli příklad rozdělení, kdy byla distribuční funkce spojitá. V tomto případě je ale pravděpodobnost toho, že náhodná veličina nabývá jediné hodnoty rovna nule. Uvedeme vhodnější charakteristiku takových rozdělení než je distribuční funkce. 6.4. Definice: Spojité rozdělení. Říkáme, že náhodná veličina X má spojité rozdělení, jestliže existuje funkce f taková, že pro distribuční funkci F náhodné veličiny X platí Z
x
f (t) dt, x ∈ R.
F (x) = −∞
Funkci f nazýváme hustotou rozdělení náhodné veličiny X. 6.5. Věta: Vlastnosti hustoty. Reálná funkce f : R → R je hustotou rozdělení náhodné veličiny X, jestliže platí: Z ∞
a) f (x) ≥ 0 pro x ∈ R;
b)
f (x) dx = 1. −∞
53
Dále platí: c) F 0 (x) = f (x) pro skoro všechna x ∈ R; R d) Pro A ⊂ R je P (X ∈ A) = A f (x) dx, speciálně je Z
b
f (x) dx = F (b) − F (a).
P (a < X < b) = a
III. S m í š e n é
rozdělení
Poznámka: Distribuční funkce náhodné veličiny z příkladu 5.10 má distribuční funkci, která má jednak skoky v některých bodech a je spojitá a rostoucí v některých intervalech. Pro takové rozdělení se výpočet pravděpodobnosti provádí podle vzorců, které jsou sloučením vzorců z 6.2 a 6.5. 6.6. Definice: Smíšené rozdělení. Říkáme, že náhodná veličina X má smíšené rozdělení, jestliže je její distribuční funkce F nespojitá a pro její distribuční funkci platí: F (x) =
X
(F (t) − F (t−)) +
Z
x
F 0 (t) dt, x ∈ R.
−∞
t≤x
Číselné charakteristiky náhodné veličiny. Poznámka: Distribuční funkce nebo hustota či pravděpodobnostní funkce jsou úplným popisem rozdělení náhodné veličiny. V některých případech používáme k popisu jednodušších charakteristik, čísel, které v některých případech k popisu stačí. 6.7. Definice: Střední hodnota. Je-li X náhodná veličina, pak vážený průměr jejích hodnot podle pravděpodobnosti nazýváme střední hodnotou náhodné veličiny X a označujeme ji E(X).R Potom: ∞ a) pro spojité rozdělení s hustotou f je E(X) = −∞ xf (x) dx; b) pro diskrétní rozdělení s pravděpodobnostní funkcí p je P E(X) = xp(x); x∈R
c) pro smíšené rozdělení s distribuční funkcí F je R∞ P 0 E(X) = x[F (x) − F (x−)] + −∞ xF (x) dx, x∈R
54
pokud hodnoty ze vzorců existují. 6.8. Věta: Vlastnosti střední hodnoty. Pro střední hodnotu E(X) náhodné veličiny X platí: a) Je-li X = a, pak E(X) = a. b) Je E(αX + β) = αE(X) + β. c) Je-li X ≥ a > −∞, pak E(X) ≥ a, je-li X ≤ b < ∞, je E(X) ≤ b, tedy pro −∞ < a ≤ X ≤ b < ∞ je a ≤ E(X) ≤ b. Pro náhodné veličiny X a Y je E(X + Y ) = E(X) + E(Y ). Jsou-li nezávislé, pak i E(XY ) = E(X)E(Y ). Poznámka: Jestliže má náhodná veličina konečnou střední hodnotu, pak jako další číselnou charakteristiku používáme rozptyl či směrodatnou odchylku, pomocí které sledujeme jak jsou hodnoty rozloženy kolem střední hodnoty. 6.9. Definice: Rozptyl a směrodatná odchylka. Je-li X náhodná veličina se střední hodnotou E(X), pak hodnotu D(X) = E([X − (E(X)]2 ) nazýváme rozptylem náhodné veličiny X. Hodnotu σ(X) =
q
D(X)
nazýváme její směrodatnou odchylkou. 6.10. Věta: Vlastnosti rozptylu. Pro rozptyl náhodné veličiny X platí: a) Je-li X = a, pak je D(X) = 0. b) Pro náhodnou veličinu, která není konstantní je D(X) > 0. c) Je D(X) = E(X 2 ) − (E(X))2 . d) Je D(αX + β) = α2 D(X). e) Jsou-li X a Y nezávislé náhodné veličiny, je D(X + Y ) = D(X) + D(Y ). 6.11. Věta: Vzorec pro výpočet rozptylu. Rozptyl D(X) náhodné veličiny X vypočteme podle vzorce:
55
a) má-li X spojité rozdělení s hustotou f, pak Z
∞
(x − E(X))2 f (x) dx,
D(X) =
E(X 2 ) =
Z
−∞
∞
x2 f (x) dx;
−∞
b) má-li X diskrétní rozdělení s pravděpodobnostní funkcí p, pak D(X) =
X
(x − E(X))2 p(x),
X
E(X 2 ) =
x∈R
x2 p(x);
x∈R
c) pro smíšené rozdělení s distribuční funkcí F je D(X) =
X
(x − E(X))2 [F (x) − F (x−)] +
(x − E(X))2 F 0 (x) dx,
−∞
x∈R
E(X 2 ) =
∞
Z
X
x2 [F (x) − F (x−)] +
Z
∞
x2 F 0 (x) dx,
−∞
x∈R
pokud mají vzorce smysl. Poznámka: V rozptylu sledujeme rozložení kvadrátů odchylek od střední hodnoty. Skutečné odchylky od střední hodnoty zachycuje směrodatná odchylka, která je v měřítku a v jednotkách v jakých jsou hodnoty X. K dalšímu popisu chování náhodné veličiny slouží její momenty. Zavádíme obecné a centrální momenty. Uvedeme jejich definici. 6.12.Definice: Momenty náhodné veličiny Pro náhodnou veličinu X definujeme pro k ∈ N k−tý obecný moment vztahem µ0k (X) = µ0k = E(X k ) a k−tý centrální moment vztahem µk (X) = µk = E([X − E(X)]k ), pokud konečné hodnoty existují. Poznámka: Je µ01 (X) = E(X), µ1 (X) = 0 a µ2 (X) = D(X).
56
Jestliže definujeme µ0 = µ00 = 1, je podle binomické věty µk =
k X i=0
k i
!
(−1)k−i µ0i (µ01 )k−i .
6.13. Definice: Koeficienty šikmosti a špičatosti. Pro náhodnou veličinu X definujeme koeficient šikmosti vztahem α(X) =
µ3 (X) σ 3 (X)
a koeficient špičatosti vztahem ε(X) =
µ4 (X) − 3. σ 4 (X)
Poznámka: Tyto koeficienty se používají k podrobnějšímu popisu rozdělení pravděpodobnosti. Pro symetrické rozdělení je koeficient šikmosti α(X) = 0. Je-li α(X) > 0, pak je rozdělení vychýlené vpravo, pro α(X) < 0 je vychýlené vlevo. Pro normální rozdělení je koeficient špičatosti ε(X) = 0. Rozdělení, pro které je ε(X) > 0 je hustota více koncentrována ke střední hodnotě než normální rozdělení a pro ε(X) < 0 je průběh hustoty plošší než je průběh hustoty normálního rozdělení. Poznámka: Jako další se velice často, zejména ve statistice používají kvantily. Budeme je nejdříve definovat pro specielní případ distribuční funkce, který je v aplikacích nejčastnější. 6.14.Definice: Kvantily. Nechť má náhodná veličina spojité rozdělení takové, že je jeho distribuční funkce F spojitá a rostoucí v intervalu (a, b) a F (a+) = 0, F (b−) = 1, tedy náhodná veličina nabývá hodnot poze z intervalu (a, b). Potom pro číslo p, 0 < p < 1, definujeme p − kvantil, či 100p% − kvantil, jako hodnotu xp , pro kterou platí: P (X ≤ xp ) = p ⇔ F (xp ) = p ⇔ xp = F −1 (p). Poznámka: Kvantily jsou vlastně inverzní hodnoty k distribuční funkci. Určují mez, při které dosáhne pravděpodobnost výskytu náhodné 57
veličiny požadované hodnoty p. Znázorníme na obrázku význam kvantilů pro rovnoměrné rozdělení v intervalu (0, 1).
y F (x)
1− p
0
up 1 Obr. 6.1a
x
y f (x)
1−
0
p Obr 6.1b
up 1
x
6.15.Poznámka: Kvantily rovnoměrného rozdělení. Pro distribuční funkci F rovnoměrného rozdělení v intervalu (a, b) platí podle 5.9 vyjádření: F (x) = P (X ≤ x) =
x−a , b−a
a ≤ x ≤ b.
Pro kvantily xp odtud dostaneme F (xp ) = p ⇔
x−a = p ⇒ xp = a + p(b − a). b−a
Všimneme si, že pro medián dostaneme x0,5 = 12 (b + a) = E(X), což je střed intervalu. Pokud je interval pro náhodnou veličinou zadán svým středem µ = 12 (a + b) a rozpětím h = 12 (b − a), tedy a = µ − h a b = µ + h, je pak xp = µ + h(2p − 1). 58