3. Charakteristiky a parametry náhodných veličin Úkolem této kapitoly je zavést pomocný aparát , kterým budeme dále popisovat pomocí jednoduchých prostředků náhodné veličiny. Takovýmto aparátem jsou tzv. parametry nebo charakteristiky náhodné veličiny. Obecně je dělíme na parametry polohy a parametry variability.
3.1 Medián a kvantily Definice 3.1 Nechť X je náhodná veličina a F je její distribuční funkce. 100p% kvantilem této náhodné veličiny nazveme číslo xp takové, že pro dané p œ (0 , 1) je F(xp) § p ⁄ lim+ F ( x) ≥ p . (3.1) x→ x
p
Některé kvantily mají speciální označení: x = x0,5 ........................................................... medián – 50% kvantil x0,25 ............................................................... dolní kvartil – 25% kvantil x0,75. ............................................................... horní kvartil – 75% kvantil xk , k = 1, 2,...,9 ....................................... k – tý decil 10
xk ,
k = 1, 2,...,99 .................................... k – tý percentil
100
Poznámka 3.1 Předchozí charakteristiku budeme využívat především v matematické statistice. Příklad. Nechť X je náhodná veličina typu Bi(30;0,4). Jde tedy o binomické rozdělení s parametry n=30 a p=0,4. Podle předchozí části můžeme zjistit jednotlivé kvantily: 10% 9
20% 10
30% 11
40% 11
Kvantily 50% 60% 12 13
70% 13
80% 14
90% 15
Dolní kvartil je v tomto případě 10 a horní kvartil je 14. Příklad . Zjistěme hodnoty příslušných kvantilů rozdělení N(0,1). 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% 90% 95% -1,64 -1,28 -1,04 -0,84 -0,67 -0,52 -0,39 -0,25 -0,13
0,00
0,13
0,25
0,39
0,52
0,67
0,84
1,04
1,28
1,64
3.2 Modus Definice 3.2 Nechť X je diskrétní náhodná veličina. Potom bod x nazveme modusem náhodné veličiny X , jestliže pro něj platí P ( X = x ) ≥ P( X = y ) , y ≠ x . (3.2) Nechť X je spojitá náhodná veličina s hustotou f . Potom bod x nazveme modulem náhodné veličiny X , jestliže pro něj platí f ( x ) ≥ f ( x), x ≠ x . (3.3) V případě diskrétní náhodné veličiny je modusem nejčetnější hodnota, v případě spojité náhodné veličiny hodnota ,v níž je hustota maximální. V případě , že takovéto možnosti nastávají ve více než v jednom bodě , jsou všechny takové body prohlášeny modusem náhodné veličiny X.
Příklad Modusem náhodné veličiny N(0,1) je hodnota 0, neboť v této hodnotě nabývá hustota 1 náhodné veličiny maximum . 2.π Modusem náhodné veličiny Bi(10;0,7) je nejčetnější hodnota tedy modus je roven 7.
3.3 Střední hodnota náhodné veličiny Tento parametr je jeden z nejdůležitějších parametrů, má velké využití v statistických studiích, proto se jím budeme zabývat obšírněji. Definice 3.3 Nechť X je náhodná veličina. Řekneme , že tato náhodná veličina má střední hodnotu E(X) , jestliže absolutně konverguje řada resp. existuje integrál: ∞ ∞ diskrétní náhodná veličina ∑ xi .P( X = xi ) = ∑ xi . pi , i =1 i =1 .(3.4) E( X ) = +∞ ∫−∞ x. f ( x)dx, spojitá náhodná veličina Konvergence řady resp. existence integrálu v (3.4) je podstatná! Bez důkazu uvedeme některá tvrzení o vlastnostech střední hodnoty! Věta 3.1 Vlastnosti střední hodnoty náhodné veličiny Nechť X je náhodná veličina typu konstanta k. Potom její střední hodnota 1. E(X) existuje a je rovna hodnotě k. Nechť X je náhodná veličina , c > 0. Nechť dále existuje E(X) . Potom 2. náhodná veličina c.X má střední hodnotu c . E(X) Nechť X je náhodná veličina , nechť dále X ¥ 0 . Potom E(X) ¥ 0. 3. Nechť X , Y jsou náhodné veličiny , nechť existuje E(X) a E(Y). Potom má 4. náhodná veličina X + Y střední hodnotu E(X) + E(Y) . Poznámka 3.1 Vlastnost 2. v předchozí větě se obecně nazývá homogenita, vlastnost 4. aditivita, dohromady tyto dvě vlastnosti nazýváme linearitou. Vlastnost 3. se nazývá nezápornost zobrazení. Každé zobrazení do prostoru √1 nazýváme obecně funkcionářem. Střední hodnota jako zobrazení E : → √1 , je prostor náhodných veličin, je tedy lineární a nezáporný funkcionář na množině náhodných veličin, které mají střední hodnotu. Příklady na stanovení středních hodnot náhodných veličin uvedeme v další kapitole. Bez důkazu uvedeme důležité tvrzení. Věta 3.3 Nechť X je náhodná veličina a g:√1 ->√1 je spojitá funkce. Potom g ë X je náhodná +∞
veličina, která má střední hodnotu právě , když existuje integrál
∫ g ( t ) . f (t )dt. Dále
−∞ +∞
je E ( g D X ) =
∫ g (t ). f (t )dt .
−∞
Důkaz: Proveden například v [1],[2].
Poznámka 3.2 V předchozí větě je dán návod jak počítat střední hodnoty náhodných veličin typu X2 , (X – a ) atd. Takovéto výpočty se provádí skutečně velmi často. Příklad 3.1 Házíme 3 x mincí , jestliže padne 0 x líc zaplatíme 5 Kč , jestliže padne 1 x líc zaplatíme 2 Kč , jestliže padne 2 x líc neplatíme nic a jestliže padne líc 3 x dostaneme 6 Kč. Zjistěte střední hodnotu náhodné veličiny padnutí líce a střední hodnotu výhry! Řešení: Podle (3.4) musíme nejdříve zjistit pravděpodobnosti jednotlivých náhodných jevů – padnutí lícu n x. Výsledky uvedeme v tabulce: n 0 1 2 3 pn 0,125 0,375 0,375 0,125 Tyto hodnoty nyní využijeme k výpočtu střední hodnoty náhodné veličiny X: E ( X ) = 0.0,125 + 1.0,375 + 2.0,375 + 3.0,125 = 1, 25
Nyní budeme počítat střední hodnotu výhry . Výpočet provedeme podle věty 3.3. Nejdříve si musíme upravit výše uvedenou tabulku: n 0 1 2 3 Výhra při nx -5 -2 0 6 padnutí líce pn 0,125 0,375 0,375 0,125 Tyto hodnoty již umožňují vypočítat střední hodnotu výhry: E ( výhry ) = −5.0,125 − 2.0,375 + 0.0,375 + 6.0,125 = −0, 625 Průměrná „výhra“ je tedy -0,625 Kč .
3.4 Rozptyl náhodné veličiny Definice 3.4 Nechť X je náhodná veličina , pro kterou existuje střední hodnota. Jestliže má náhodná veličina (X – E(X))2 střední hodnotu , potom VAR ( X ) = E ( X − E ( X )) 2 (3.8)
nazveme rozptylem náhodná veličina X. Číslo σ ( X ) = VAR( X ) se nazývá směrodatná odchylka náhodná veličina X. Věta 3.4 Vlastnosti rozptylu náhodné veličiny Nechť náhodná veličina X má rozptyl VAR(X). Potom: 1. VAR(X) = E(X2) – (E(X))2 2. Nechť dále a œ √1 , potom VAR(a . X ) = a2 . VAR(X) 3. Nechť b œ √1 , potom VAR(X + b ) = VAR(X) Důkaz těchto tvrzení nebudeme opět provádět.
(3.9) (3.10) (3.11)
Některé další vlastnosti rozptylu náhodných veličin budeme vyšetřovat v kapitole věnované nezávislosti náhodných veličin.
Uvedeme ještě některé další typy charakteristik náhodných veličin. Příklady na výpočet takovýchto čísel ponecháme na závěrečnou část této kapitoly. Pokračování příkladu 3.1 a) Nejdříve budeme hledat rozptyl náhodné veličiny X . Přímo z tabulky pro stanovení rozdělení pravděpodobností této náhodné veličiny vyplývá , že E ( X 2 ) = 02.0,125 + 12.0,375 + 22.0,375 + 32.0,125 = 2,5
Využijeme nyní vlastnost (3.9) a získáváme : VAR( X ) = 2,5 − 1, 252 = 2,5 − 2, 25 = 0, 25 b) Podobně nyní budeme počítat rozptyl výhry: E ( výhra 2 ) = (−5) 2 .0,125 + (−2) 2 .0,375 + 0.0,375 + 62.0,125 = 9,125
Využijeme nyní opět vlastnosti (3.9) 2 VAR ( výhra ) = 9,125 − ( 0, 625 ) = 9,125 − 0,390625 = 8, 734375 Závěr : Náhodná veličina X má hodnoty ( n ) rozloženy relativně kompaktně ( tj. na malém intervalu ) , proto je její rozptyl malý , zatímco náhodná veličina výhra má hodnoty rozloženy na podstatně širším intervalu , proto je její rozptyl podstatně větší.
3.5 Momenty náhodné veličiny Definice 3.5 Nechť X je náhodná veličina , k œ Í. Potom číslo :
1. µ k ( X ) = E ( X k )
(3.12)
nazveme k-tým momentem náhodné veličiny X, pokud existuje. 2. ν k ( X ) = E
(( X − E ( X )) ) k
(3.13)
nazveme k-tým centrálním momentem náhodné veličiny X , jestliže uvedený výraz existuje µ (X ) 3. δ k ( X ) = k (3.14) k σ ( X ) nazveme k-tým normovaným momentem náhodné veličiny X, mají – li všechny výrazy smysl 4. Specielně 3. normovaný moment nazýváme koeficient šikmosti náhodné veličiny X α3 ( X ) = δ 3 ( X ) (3.15) 5. Specielně dále určujeme koeficient špičatosti náhodné veličiny X jako α4 ( X ) = δ4 ( X ) − 3 (3.16) Tyto dva koeficienty hrají velkou roli ( respektive jejich tzv. výběrové tvary ) při vyšetřování normality dat . Normalita dat je velmi důležitý a základní pojem . Mnoho základních metod je na tomto pojmu založeno např. regrese , korelace , testování statistických hypotéz parametrických , ANOVA atd.
3.6 Výpočet střední hodnoty a rozptylu některých základních typů náhodných veličin Diskrétní náhodné veličiny
3.6.1 Degenerované rozdělení a) E(X) = x0 . 1 = x0 ; b) VAR(X) = x02.1 – (x0)2 = 0
3.6.2 Alternativní rozdělení a) E ( X ) = x1. p + x2 .(1 − p),
b) VAR( X ) = ( x12 . p + x22 .(1 − p) ) − ( x1. p + x2 .(1 − p) ) , 2
Je – li specielně x1 = 1 a x2 = 0 je potom a) E(X) = p b) VAR(X) = p.(1-p) = p . q
3.6.3 Binomické rozdělení n n n n − 1 i −1 n −i a) E ( X ) = ∑ i. . p i .(1 − p ) n −i = n. p.∑ . p .(1 − p ) = i =0 i i =1 i − 1 n −1 n − 1 n −1 j n −1− j = n. p.∑ =n. p. ( p + (1 − p ) ) = n. p . p .(1 − p) j j =0 n n n 2 n b) VAR( X ) = ∑ ( i − n. p ) . . p i .(1 − p) n −i = n 2 . p 2 .1n − 2.n. p.∑ i. . p i .(1 − p ) n −i + i =0 i =0 i i n n n n! . p i .(1 − p ) n −i = + ∑ i 2 . . p i .(1 − p) n −i = n 2 . p 2 − 2.n 2 . p 2 + n. p + ∑ i i n i ( 2)!.( )! − − i =0 i=2 n−2 n − 2 i −2 ( n − 2) − ( i − 2) = n. p − n 2 . p 2 + n.(n − 1). p 2 .∑ = n. p − n. p 2 =n. p.(1 − p ) = n. p.q . p .(1 − p ) 2 i − i=2
3.6.4 Poissonovo rozdělení ∞ λj = λ .e − λ . ∑ = λ .e − λ .eλ = λ i! i =0 j =0 j ! i −λ ∞ ∞ ∞ λ i .e− λ λ i .e− λ ∞ 2 λ i .e − λ 2 λ .e 2 = − = − + ∑i . = VAR ( X ) i λ . λ . 2. λ . i . b) ( ) ∑ ∑ ∑ i! i! i! i! i =0 i =0 i =0 i =0 ∞
a) E ( X ) = ∑ i.
λ i .e − λ
∞ ∞ λ i −1 λj 2 2 −λ = λ − 2.λ + e .λ . ∑ i. = λ − 2.λ + e .λ . ∑ ( j + 1). = j! i =1 (i − 1)! i =1 = λ 2 − 2.λ 2 + e − λ .λ . ( λ .eλ + eλ ) = λ 2 − 2.λ 2 + λ 2 + λ = λ 2
2
−λ
Spojité náhodné veličiny
3.6.5 Rovnoměrné rozdělení a) E ( X ) =
+∞
b
−∞
a
1
∫ x. f ( x)dx =∫ x. b − a dx =
a+b 2 2
2 +∞ b 2 1 a+b b) VAR( X ) = ∫ x . f ( x)dx − ∫ x. f ( x)dx = ∫ x . dx − = 2 −∞ −∞ a b−a +∞
2
2
1 a 2 − a.b + b 2 a+b = . ( a 2 + a.b + b 2 ) − = 3 12 2
3.6.6 Cauchyho rozdělení +∞
+∞
a dx, posledně psaný integrál ale neexistuje . a + x2 −∞ −∞ Proto neexistuje ani střední hodnota tohoto rozdělení b) Protože neexistuje střední hodnota , nemůže existovat ani rozptyl. a) E ( X ) =
1
∫ x. f ( x)dx = ∫ x. π
2
.
2
3.6.7 Normální rozdělení a) +∞
+∞
− 1 .e E ( X ) = ∫ x. f ( x)dx = ∫ x. σ . 2.π −∞ −∞ +∞
1 .e = σ . ∫ t. −∞ σ . 2.π
t2 − 2
( x − µ )2 2.σ
2
substituce
2
+∞
t − 1 .e 2 .σ dt = = ∫ (σ .t + µ ) . dx = x − µ = t −∞ σ . 2.π
σ
2
+∞
t − 1 .σ dt + µ . ∫ .e 2 .σ dt =0 + µ .1 = µ . 2. σ π −∞
+∞
+∞
− 1 b) VAR( X ) = ∫ ( x − µ ) . f ( x)dx = ∫ ( x − µ ) . .e σ . 2.π −∞ −∞ 2
2
( x − µ )2 2.σ 2
substituce dx = x − µ
σ
=t
=
+∞ t2 t2 t2 − − − 1 1 1 2 2 2 = ∫ σ .t . .e .σ dt =σ . . lim −t.e + ∫ e 2 dt = σ 2 . . 0 + 2.π = 2.π 2.π N →∞ 2.π −∞ −∞ =σ2 Je zřejmé , že střední hodnota rozdělení N(0,1) je tedy rovna 0 a rozptyl tohoto rozdělení je roven 1. +∞
2
{
}
3.7 Smíšené momenty náhodných veličin V této části se zaměříme na případy, kdy je nutno vyšetřovat více náhodných veličin, které jsou spolu spojené v náhodném vektoru buď pomocí sdružené hustoty nebo pomocí sdružené pravděpodobnostní funkce. Definice 3.6 Nechť × = (X1 , X2 ,…,Xn ) je náhodný vektor. Nechť dále X 1r1 . X 2r2 ,..., X nrn , kde ri ¥ 0 n
a ∑ ri = r , je náhodná veličina , která má střední hodnotu. Potom smíšeným momentem r – i =1
(
)
tého řádu náhodných veličin X1 , X2 ,…,Xn nazveme hodnotu E X 1r1 . X 2r2 ,..., X nrn .
a)
Poznámka 3.3 V případě , že náhodný vektor × = (X1 , X2 ,…,Xn ) je diskrétní se sdruženou pravděpodobnostní funkcí P , hodnota smíšeného momentu r – tého řádu rovna :
(
)
∑
E X 1r1 . X 2r2 ,..., X nrn =
b)
x1r1 .x2r2 ...xnrn .P( X 1 = x1 , X 2 = x2 ,..., X n = xn ) (3.17)
x1 , x2 ,..., xn
v uvedeném součtu sčítáme samozřejmě přes všechny možné n – tice, v nichž je sdružená pravděpodobnostní funkce nenulová. V případě , že náhodný vektor × = (X1 , X2 ,…,Xn ) je spojitý se sdruženou hustotou f , je hodnota smíšeného momentu r – tého řádu rovna :
(
)
E X 1r1 . X 2r2 ,..., X nrn =
+∞
+∞
r r r ∫ ... ∫ x11 .x22 ...xnn . f ( x1 , x2 ,..., xn )dx1dx2 ...dxn
−∞
(3.18).
−∞
Sdružené momenty náhodných veličin budeme vyšetřovat především v situacích, kdy je nutné zkoumat vliv jednotlivých náhodných veličin ( prvků náhodného vektoru ) na sebe. Toto zkoumání budeme provádět především v následující kapitole a potom dále v matematické statistice.