Statistika I., cvi ení
Ing. Martina Litschmannová
4
NÁHODNÁ VELI INA
Náhodná veli ina je veli ina, jejíž hodnota je jednozna n ur ena výsledkem náhodného pokusu (je-li tento výsledek dán reálným íslem). Jde o reálnou funkci definovanou na základním prostoru a charakterizovanou distribu ní funkci. Distribu ní funkce je definována jako F(x) = P(X<x), jde tedy o funkci, která každému reálnému íslu p i azuje pravd podobnost, že náhodná veli ina nabývá hodnot menších než toto reálné íslo. Pravd podobnost výskytu náhodné veli iny na n jakém intervalu ur ujeme na základ t chto vztah : P( X < a) = F (a) P( X ≥ b) = 1 − F (b) P(a ≤ X < b) = F (b) − F (a ) P(a ≤ X < b)
f(x)
x
Podle toho, jakých m že náhodná veli ina nabýt hodnot (resp. z jakého intervalu), rozlišujeme spojitou a diskrétní náhodnou veli inu, p esn ji e eno náhodnou veli inu se spojitým a diskrétním rozd lením.
Diskrétní náhodná veli ina je náhodnou veli inou, která m že nabývat pouze kone ného nebo spo etn nekone ného množství hodnot (nap . výsledek hodu kostkou) Diskrétní náhodnou veli inu popisujeme prost ednictvím pravd podobnostní funkce, pop . distribu ní funkce. Spojitá náhodná veli ina je náhodnou veli inou, která m že nabývat všech hodnot z libovolného kone ného nebo nekone ného intervalu (nap . životnost zá ivky) Pro popis spojité náhodné veli iny používáme distribu ní funkci, hustotu pravd podobnosti a v p ípad , že jde o nezápornou spojitou náhodnou veli inu používáme také intenzitu poruch. Intenzita poruch má pro v tšinu výrobk z technické praxe charakteristický tvar vanové k ivky. V mnoha p ípadech je výhodné shrnout celkovou informaci o náhodné veli in do n kolika ísel, které charakterizují n které vlastnosti náhodné veli iny, p ípadn umož ují srovnání r zných náhodných veli in. Tato ísla se nazývají íselné charakteristiky náhodné veli iny. Mezi základní íselné charakteristiky adíme nap . st ední hodnotu, rozptyl, sm rodatnou odchylku, kvantily, modus, šikmost a špi atost. V p ípad , že g(x) je n jaká prostá reálná funkce, definovaná na základním souboru náhodné veli iny X, m žeme snadno odvodit rozd lení transformované náhodné veli iny Y = g(X). - 40 -
Statistika I., cvi ení
Ing. Martina Litschmannová
Diskrétní náhodná veli ina 4.1. M jme náhodnou veli inu X definovanou jako výsledek hodu klasickou pravidelnou kostkou. Ur ete typ NV, její pravd podobnostní a distribu ní funkci (zakreslete). ešení: X
...
výsledek hodu kostkou
Základní soubor NV X (množina všech možných výsledk ): Ω = {1; 2; 3; 4; 5; 6} Vzhledem k tomu, že základní soubor je tvo en kone n mnoha (šesti) hodnotami, jedná se o diskrétní NV
Pravd podobnostní funkce této NV je uvedena v následující tabulce: xi 1 2 3 4 5 6
P( X = xi ) 1/6 1/6 1/6 1/6 1/6 1/6
(nap . P(X=1) teme: pravd podobnost, že výsledek hodu kostkou je 1). V tabulce jsou p itom uvedeny pouze nenulové hodnoty pravd podobnostní funkce. Je z ejmé, že platí:
∀ xi ∈ R \ Ω : P ( X = xi ) = 0 (nap . P(X=1,5)=P(X=-3)= ... = 0). Všimn te si zárove , že je spln na 2. ást definice diskrétní NV : P( X = xi ) = 1 (i )
Na následujícím obrázku pak vidíme grafickou podobu pravd podobnostní funkce (izolované body).
P(
x) /6
1
3 4
4
5
6
x
x
Dále se pokusíme na základ definice ur it distribu ní funkci. Z vlastností distribu ní funkce vyplývá, že body nespojitosti této funkce jsou ty body, v nichž je pravd podobnostní funkce nenulová (P( x = x0 ) = lim F(x) - F( x0 )). Proto si ur íme hodnoty distribu ní funkce na x →x 0 +
všech intervalech vymezených body nespojitosti. - 41 -
Statistika I., cvi ení
Ing. Martina Litschmannová
nap .: ∀x ∈ (−∞;1 : F ( x) = P ( X < x) = 0 (pravd podobnost, že na kostce padne íslo menší než 1)
∀x ∈ (1; 2 : F ( x) = P( X < x ) = 1 / 6 (pravd podobnost, že na kostce padne íslo menší než 2) ∀x ∈ (2; 3 : F ( x ) = P ( X < x) = 2 / 6 (pravd podobnost, že na kostce padne íslo menší než 3) ....... Hodnoty distribu ní funkce na celém defini ním oboru (R) jsou uvedeny v následující tabulce.
xi (-∝;1> (1;2> (2;3> (3;4> (4;5> (5;6> (6;∝)
F( xi ) 0 1/6 2/6 3/6 4/6 5/6 1
Na grafu distribu ní funkce si všimn te jejich vlastností: • • •
neklesající zleva spojitá lim F(x) = 1 ; lim F(x) = 0
•
P( X = x0 ) = lim F(x) − F ( x0 ) , tj.:
x → +∞
x → −∞
x →x 0 +
distribu ní funkce je nespojitá v bodech, v nichž je pravd podobnostní funkce nenulová velikost „skoku“ v bodech nespojitosti je rovna p íslušné pravd podobnosti F(
x)
1 P(x) 1/6
1
/6
2
3
4
5
6
x
1 1
2
3
4
5
6
x
4.2. V osudí je 5 bílých a 7 ervených mí k . Náhodná veli ina X p edstavuje po et bílých mí k mezi p ti vybranými. Vytvo te pravd podobnostní a distribu ní funkci této náhodné veli iny. ešení: Náhodná veli ina X nabývá hodnot {0,1,2,3,4,5}. - 42 -
Statistika I., cvi ení
Ing. Martina Litschmannová
Z teorie pravd podobnosti víme, že se jedná o opakované závislé pokusy. Je z ejmé, že jde o diskrétní náhodnou veli inu, m žeme tedy sestavit pravd podobnostní funkci: 5 p ( xi ) =
xi
7
.
5 − xi 12 5
Dosazením jednotlivých hodnot náhodné veli iny do pravd podobnostní funkce získáme pravd podobnostní tabulku:
xi P(xi)
0 21 792
1 175
2 350
3 210
4 35
5 1
792
792
792
792
792
Grafické zobrazení pravd podobnostní funkce (bodový graf):
Distribu ní funkce: xi (-∝;0> (0;1> (1;2> (2;3> (3;4> (2;5> (5;∝)
F( xi ) 0 21/792 196/792 546/792 756/792 791/792 792/792=1
- 43 -
Statistika I., cvi ení
Ing. Martina Litschmannová
Spojitá náhodná veli ina 4.3. Nech Y je spojitá náhodná veli ina definována hustotou pravd podobnosti: f ( y) =
a) b) c) d)
c(1 − y )(1 + y ) 0
−1 < y < 1 jinde
nalezn te konstantu c, zakreslete f(y) nalezn te a zakreslete distribu ní funkci F(y), ur ete: P(0
0,5), P(Y=0,3)
ešení:
∞
a) pro nalezení konstanty c využijeme toho, že:
f ( x) dx = 1
−∞
−1
1
∞
−∞
−1
0dt + c(1 − t 2 ) dt + 0dt = 1
0+c t −
1 3 1
t 3
+0 =1
−1
1 (−1) c (1 − ) − ( −1 − ) =1 3 3 4 3 c. = 1 c = = 0,75 3 4
b)
3 (1 − y )(1 + y ) f ( y) = 4 0
−1 < y < 1 jinde
Hustota pravd podobnosti 0,8 0,6 f(y)
0,4 0,2 0 -4
-2
-0,2 0
2
4
y y
c) Distribu ní funkci ur íme z definice: F ( y ) = −∞
y
Pro − ∞ < y < −1 :
F ( y) =
0dt = 0 −∞
- 44 -
f (t )dt
pro − ∞ < y < ∞
Statistika I., cvi ení
Ing. Martina Litschmannová Pro − 1 ≤ y < 1 : y
−1
3 3 t3 2 F ( y ) = 0dt + 1 − t dt = 0 + t − 4 4 3 −∞ −1
(
)
y
(
1 − y3 + 3 y + 2 4
= −1
)
Pro 1 ≤ y < ∞ : −1
y
1
3 3 t3 (1 − t 2 )dt + 0dt = 0 + t − F ( y ) = 0dt + 4 4 3 −∞ −1 1
1
+0 =1 −1
Distribu ní funkce F(y)
1,2
1
0,8
y
0,6
0,4
0,2
0 -4
-3
-2
-1
0
1
2
3
4
-0,2 F(y)
d) Pravd podobnosti výskytu náhodné veli iny Y na ur itém intervalu ur íme pomocí p íslušných vztah : •
1 1 P(0 < Y < 1) = F (1) − F (0) = 1 − (0 + 0 + 2) = ~ 50% 4 2
•
1 1 1 27 5 P(Y > 0,5) = 1 − F (0,5) = 1 − (−( )3 + 3. + 2) = 1 − = ~ 15,6% 4 2 2 32 32
•
P(Y = 0,3) = 0
íselné charakteristiky diskrétní náhodné veli iny 4.4. Vra me se k d íve definované diskrétní náhodné veli in X – hod kostkou. V jednom z výše ešených p íkladu jsme si ur ili a zakreslili její pravd podobnostní i distribu ní funkci. xi 1 2 3 4 5 6
xi (-∝;1> (1;2> (2;3> (3;4> (4;5> (5;6> (6;∝)
P( X = xi ) 1/6 1/6 1/6 1/6 1/6 1/6
- 45 -
F( xi ) 0 1/6 2/6 3/6 4/6 5/6 1
Statistika I., cvi ení
Ing. Martina Litschmannová
Nyní ur eme: a) b) c) d) e)
st ední hodnotu rozptyl sm rodatnou odchylku medián modus
ešení: a) EX = µ = (i )
1 1 1 1 + 2 + 3 + 4 + 5 + 6 21 1 1 1 xi .P( xi ) = 1. + 2. + 3. + 4. + 5. + 6. = = = 3,5 6 6 6 6 6 6 6 6
b) DX = µ 2 = E ( X − EX ) = EX 2 − (EX ) 2
EX 2 = (i )
2
1 1 1 1 1 1 91 xi2 P ( xi ) = 12. + 22. + 32. + 4 2. + 52. + 6 2. = ≅ 15,2 6 6 6 6 6 6 6
91 21 DX = EX − ( EX ) = − 6 6 2
c) σ x = DX =
2
2
=
546 441 105 − = ≅ 2,9 36 36 36
105 ≅ 1,7 6
d) x0,5=?
F ( xi ) = 0,5 ⇔ xi ∈ (3;4 x0,5 = sup{(3; 4 } = 4 (ov ení: platí, že 50% hodnot náhodné veli iny je ≤ 4) ^
e) modus je hodnota, pro kterou platí: P ( X = x) ≥ P ( X = xi ), i = 1,2,... (tj. hodnota, které nabývá NV s nejv tší pravd podobností) Protože v našem p ípad nabývá NV X všech hodnot se stejnou pravd podobností, jedná se o vícemodální rozd lení s mody {1;2;3;4;5;6}.
íselné charakteristiky spojité náhodné veli iny 4.5. A nyní najdeme vybrané íselné charakteristiky pro spojitou náhodnou veli inu. Zvolme si náhodnou veli inu Y definovanou takto: f ( y) =
c(1 − y )(1 + y ) 0
−1 < y < 1 jinde
Ur ete: a) st ední hodnotu - 46 -
Statistika I., cvi ení
Ing. Martina Litschmannová
b) c) d) e)
rozptyl sm rodatnou odchylku medián modus
ešení:
∞
f ( y )dy = 1
Nejd íve bychom museli ur it konstantu c ze vztahu: −∞
My využijeme toho, že daný problém jsme již výše ešili a m žeme proto p ímo p evzít výsledek, že c=0,75. ∞
a)
−1
1
∞
3 3 y2 y4 − EY = µ = y. f ( y ) dy = y.0dy + y. 1 − y 2 dy + y.0dy = 0 + 4 4 2 4 −∞ −∞ −1 1
(
)
1
+0 = 0 −1
(výsledek byl o ekávatelný, protože hustota pravd podobnosti NV Y je sudá funkce) b)
DY = EY 2 − (EY ) 2 ∞
∞ 3 3 y3 y5 EY = y . f ( y )dy = y .0dy + y . 1 − y 2 dy + y 2 .0dy = 0 + − 4 4 3 5 1 −∞ −∞ −1
2
−1
2
3 4 1 ⋅ = 4 15 5
=
DY = EY 2 − ( EY ) 2 =
c) σ y = d)
1
2
2
(
)
1
+0 = −1
1 1 − 0 2 = = 0,2 5 5
1 5 = ≅ 0,45 5 5
DY =
F ( y0,5 ) = 0,5 Znovu využijeme toho, že jsme s touto náhodnou veli inou pracovali již d íve a bez op tovného výpo tu použijeme znalosti distribu ní funkce F(y).
F ( y) =
(
0
1 − y3 + 3 y + 2 4 1
)
pro y < (−1) pro (−1) ≤ y ≤ 1 pro y > 1
Ze vztahu pro distribu ní funkci je z ejmé, že medián m že být pouze hodnota z intervalu (-1;1):
(
)
1 − y03,5 + 3 y0,5 + 2 = 0,5 4 − y03,5 + 3 y0,5 + 2 = 2
(
)
−y
3 0,5
+ 3 y0 , 5
=0
- 47 -
Statistika I., cvi ení
Ing. Martina Litschmannová
(
)
y0,5 − y02,5 + 3 = 0
y0,51 = 0 y0,5 2 = 3 ∉ (−1;1) y0,53 = − 3 ∉ (−1;1)
e) modus je hodnota, pro kterou platí: f ( xˆ )≥ f ( x) pro − ∞ < x < ∞ (tj. hodnota, v níž hustota pravd podobnosti nabývá svého maxima) Pro maximum funkce platí, že první derivace v n m musí být nulová (nebo nedefinována) a druhá derivace v n m musí být záporná. Je z ejmé, že rovn ž modus budeme hledat na intervalu (-1;1): df ( y ) =0 dy
(
)
,
3 1 − y2 = 0 4 3 (0 − 2 y ) = 0 4 y = 0 bod podez elý z max ima
Zda se jedná o maximum bychom mohli ov it z druhé derivace f(y), ale my využijeme op t toho, že jsme s danou NV pracovali a pohledem na graf f(y) si ov íme, že hustota pravd podobnosti f(y) skute n nabývá svého maxima v bod 0. yˆ = 0
Funkce náhodné veli iny V mnoha p ípadech, kdy známe rozd lení náhodné veli iny X, pot ebujeme ur it rozd lení náhodné veli iny Y, která je funkcí X, tzn. Y = g(X). Je-li funkce g(x) v oboru možných hodnot veli iny X monotónní, pak existuje inverzní funkce g − 1(y) , a jde o vzájemn jednozna ný vztah mezi X a Y. Je-li v takovém p ípad g(x) rostoucí, pak pro všechna x1 < x2 je y1 < y2 a distribu ní funkci veli iny Y lze psát jako: H(y) = P(Y < y) = P[X < g − 1(y)] = F[g − 1(y)] Pro klesající funkci g(x), pak pro všechna x1 < x2 je y1 > y2 a distribu ní funkci veli iny Y lze psát jako: H(y) = P(Y < y) = P[X > g − 1(y)] = 1 − F[g − 1(y)]
- 48 -
Statistika I., cvi ení
Ing. Martina Litschmannová
Je-li X spojitá náhodná veli ina s hustotou pravd podobnosti f(x), p i emž g-1(y) má pro všechna y spojitou derivaci, pak pro rostoucí funkci g(x) dostaneme hustotu pravd podobnosti h(y) veli iny Y jako: dH ( y ) dg −1 dx −1 h( y ) = = f g ( y) ⋅ = f g −1 ( y ) ⋅ dy dy dy
(
)
(
)
Podobn pro klesající funkci h(x) dostaneme: dH ( y ) dg −1 dx = − f g −1 ( y ) ⋅ = − f g −1 ( y ) ⋅ dy dy dy
(
h( y ) =
)
Vzhledem k tomu, že v p ípad rostoucí funkce g(x) je
)
dx > 0 , zatímco v p ípad klesající dy
dx < 0 , lze oba p edchozí vztahy spojit do jednoho: dy
funkce g(x) je
h( y ) =
4.6. Nech veli iny Y.
(
dH ( y ) dg −1 dx = f g −1 ( y ) ⋅ = f g −1 ( y ) ⋅ dy dy dy
(
)
(
)
náhodná veli ina W je definována jako lineární transformace náhodné
f ( y) =
0,75(1 − y )(1 + y ) 0
−1 < y < 1 jinde
W = 5Y + 6 Nalezn te: a) distribu ní funkci H(w) náhodné veli iny W b) hustotu pravd podobnosti h(w) náhodné veli iny W, c) st ední hodnotu EW náhodné veli iny W d) rozptyl DW náhodné veli iny W. ešení: Stejn jako v p edchozích p ípadech využijeme toho, že jsme již s NV Y pracovali (v opa ném p ípad bychom museli nejd íve najít F(y), EY a DY).
F ( y) =
(
0
1 − y3 + 3 y + 2 4 1
)
pro y < (−1) pro (−1) ≤ y ≤ 1 pro y > 1
- 49 -
, EY = 0, DY = 0,2
Statistika I., cvi ení
Ing. Martina Litschmannová a)
H ( w) = P(W < w) = P(5Y + 6 < w) = P(Y <
w−6 w−6 ) = F( ) 5 5
Nyní ur íme distribu ní funkci H(w) tak, že do p edpisu pro distribu ní funkci F(y) w−6 dosadíme za y výraz . 5
0 H ( w) =
w−6 < −1 5 w−6 pro − 1 ≤ ≤1 5 w−6 pro >1 5 pro
1 w−6 − 4 5
3
+3
w−6 +2 5
1
0
1 ( w3 − 18w 2 + 33w − 16) H ( w) = − 500 1
pro w < 1 pro 1 ≤ w ≤ 11 pro w > 11
b) Hustotu pravd podobnosti ur íme jako derivaci distribu ní funkce:
h (w ) =
h( w) =
dH ( w) dw −
1 (3w2 − 36w + 33) 500
pro 1 ≤ w ≤ 11 pro (w < 1) ∪ (w > 11)
0 po úprav :
h( w) =
−
3 ( w2 − 12 w + 11) 500
pro 1 ≤ w ≤ 11 pro (w < 1) ∪ (w > 11)
0 c) Z vlastností st ední hodnoty plyne, že:
EW = E (5Y + 6) = 5.EY + 6 = 5.0 + 6 = 6 d) Z vlastností rozptylu plyne, že:
DW = D(5Y + 6) = 52.DY = 25.0,2 = 5
- 50 -
Statistika I., cvi ení
Ing. Martina Litschmannová
4.7. Nech náhodná veli ina X má spojitou rostoucí distribu ní funkci F(x). Najd te distribu ní funkci a hustotu pravd podobnosti náhodné veli iny Y = F(X). ešení: Y = F(x) •
F(x) nabývá pro x∈R hodnot z intervalu <0;1> hodnot z intervalu <0;1> pro y < 0 pro y > 1
H ( y) = 0 H ( y) = 1
H ( y ) = P(Y < y ) = P( F ( X ) < y ) = P( X < F −1 ( y )) = F ( F −1 ( y )) = y
pro 0 ≤ y ≤ 1
H ( y) =
•
náhodná veli ina Y nabývá rovn ž
0
pro y < 0
y 1
pro 0 ≤ y ≤ 1 pro y > 1
Hustota pravd podobnosti náhodné veli iny Y h( y ) =
h( y ) =
1
dH ( y ) dy pro y ∈ 0;1
0
jinde
Hustota pravd podobnosti rovnom rného rozd lení 1,2
1
0,8
0,6
0,4
0,2
0 -2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
Náhodná veli ina Y má tzv. rovnom rné (rektangulární) rozd lení v intervalu <0, 1> .
- 51 -
Statistika I., cvi ení
Ing. Martina Litschmannová
4.8. Nech veli ina X má rovnom rné rozd lení v intervalu −
π π
. Jaké rozd lení ; 2 2
má veli ina Y = tg X ? Nalezn te hustotu pravd podobnosti NV Y. ešení:
(
)
h( y ) = f g −1 ( y ) ⋅
dx dy
Hustota pravd podobnosti rovnom rného rozd lení na intervalu −
1
π 2
f (x ) =
− −
π
=
1
na −
π
π π
: ; 2 2
π π
; 2 2
2
0 g ( x ) = y = tg x
jinde g −1 ( y ) = x = arctg y
d (arctg y ) dx 1 1 = = = 2 dy dy 1+ y 1+ y2 Hustota pravd podobnosti veli iny Y je tedy:
(
)
h ( y ) = f g −1 ( y ) ⋅
dx 1 = , dy π 1 + y 2
(
)
y∈R
Uvedené rozd lení se nazývá Cauchyho. Je p íkladem rozd lení, které nemá kone ný rozptyl: DY =
∞
y 2 ⋅ g ( y )dy =
−∞
=
1
π
∞
−∞
y2 ⋅
1 1 dy = 2 π π 1+ y
(
)
∞
⋅
−∞
1 y2 +1−1 dy = 2 π 1+ y
(
)
∞
∞
⋅ 1dy − ⋅
−∞
−∞
1 dy = 1+ y2
(
)
[∞ − π ] = ∞
4.9. Nech veli ina X má rovnom rné rozd lení v intervalu 0; π . Jaké rozd lení má veli ina Y = cot g X ? Nalezn te distribu ní funkci NV Y. ešení: Hustota pravd podobnosti rovnom rného rozd lení na intervalu 0;π :
- 52 -
Statistika I., cvi ení
Ing. Martina Litschmannová
f (x ) =
1 1 = π −0 π
na 0; π
0
jinde
Distribu ní funkce rovnom rného rozd lení na intervalu 0; π : x ∈ (− ∞;0 )
0 x
F (x ) =
f (t )dt =
−∞
0
0dt +
−∞
1
x
0
1
π
dt =
1
π
x ∈ 0; π
x
x ∈ (π ; ∞ )
Distribu ní funkce NV Y: H ( y ) = P(Y < y) = P(cotg X < y ) = P( X > arccotg y ) = 1 − F (arccotg y )
1− 0 1 H ( y ) = 1 − arc cot g y
π
1−1
arc cot g y ∈ (− ∞;0 ) arc cot g y ∈ 0; π arc cot g y ∈ (π ; ∞ )
Vzhledem k tomu, že obor hodnot funkce arccotg x je (0;π ) : 10
8
arccotg y
6
4
2
0
-2 -50
H (y) = 1 −
1
π
arc cot g y
-40
-30
-20
-10
y∈R
- 53 -
0
10
20
30
40
50