AVDAT ˇ ˇ Náhodný vektor, mnohorozmerné rozdelení Josef Tvrdík Katedra informatiky ˇ Pˇrírodovedecká fakulta Ostravská univerzita
ˇ Opakování, náhodná veliˇcina, rozdelení
Náhodná veliˇcina – zobrazuje elementární náhodný jev do R Distribuˇcní funkce – F (x) = P(X < x) ˇ diskrétní veliˇcina – pravdepodobnostní funkce [xi , P(X = xi )] spojitá veliˇcina – hustota Z a F (a) = f (x) dx, −∞
f (x) =
dF (x) dx
Opakování, náhodná veliˇcina, stˇrední hodnota, rozptyl
Stˇrední hodnota – diskrétní veliˇcina X EX = xi P(X = xi ) Stˇrední hodnota – spojitá veliˇcina Z +∞ EX = x f (x)dx −∞
Rozptyl var X = E[X − E X ]2
Opakování, kovariance, korelaˇcní koeficient
Kovariance cov (X1 , X2 ) = E [(X1 − E X1 )(X2 − E X2 )] Korelaˇcní koeficient %(X1 , X2 ) = √
cov (X1 , X2 ) √ var X1 var X2
−1 ≤ %(X1 , X2 ) ≤ 1
ˇ Náhodný vektor – rozdelení
Náhodný vektor X = [X1 , X2 , · · · , Xp ]T je vektor, jehož složky X1 , X2 , · · · , Xp jsou náhodné veliˇciny.
ˇ U náhodného vektoru musíme rozlišovat rozdelení ˇ sdružené, marginální a podmínené.
ˇ Sdružené rozdelení -p=2 sdružená distribuˇcní funkce F (x1 , x2 ) = P(X1 < x1 , X2 < x2 ) ˇ X1 , X2 diskrétní veliˇciny, pak sdružená pravdepodobnostní funkce je P(x1 , x2 ) = P(X1 = x1 , X2 = x2 ) Existuje-li nezáporná funkce f (x1 , x2 ) taková, že Z x1 Z x2 F (x1 , x2 ) = f (u, v )dudv , −∞
−∞
ˇ pak náhodný vektor [X1 , X2 ]T má rozdelení spojitého typu. Funkce f (·, ·) se nazývá sdružená hustota.
ˇ Sdružené rozdelení ˇ Pravdepodobnost, že náhodné veliˇciny X1 , X2 nabývají hodnot z intervalu˚ [a1 , b1 ), [a2 , b2 ) je urˇcena vztahem Z
b1
Z
b2
P(a1 ≤ X1 < b1 , a2 ≤ X2 < b2 ) =
f (x1 , x2 )dx1 dx2 a1
a2
Sdružená hustota je f (x1 , x2 ) =
∂ 2 F (x1 , x2 ) ∂x1 ∂x2
Pro p > 2 platí analogické vztahy, mimo jiné sdružená hustota je derivací distribuˇcní funkce: f (x) = f (x1 , x2 , · · · , xp ) =
∂ p F (x1 , x2 , · · · , xp ) ∂x1 ∂x2 · · · ∂xp
ˇ Pˇríklad – sdružená pravdepodobnostní funkce
ˇ Sdružená pravdepodobnostní funkce náhodného vektoru [X , Y ]T je zadána tabulkou
Y = y1 Y = y2
X = x1 p11 p21
X = x2 p12 p22
X = x3 p13 p23
ˇ Marginální rozdelení F (x1 , x2 ) je sdružená distribuˇcní funkce, pak marginální distribuˇcní funkce veliˇcin X1 a X2 jsou F1 (x1 ) = P(X1 < x1 , X2 < ∞) = F (x1 , ∞) F2 (x2 ) = P(X1 < ∞, X2 < x2 ) = F (∞, x2 ) ˇ ˇ Pro diskrétní rozdelení marginální pravdepodobnostní funkce jsou definovány takto: X P1 (x1 ) = P(x1 , x2 ) M2
P2 (x2 ) =
X
P(x1 , x2 )
M1
kde Mi je množina hodnot diskrétní náhodné veliˇciny Xi .
ˇ Pˇríklad – marginální pravdepodobnostní funkce
ˇ Sdružená pravdepodobnostní funkce a marginální ˇ pravdepodobnostní funkce vektoru [X , Y ]T :
Y = y1 Y = y2 marg2
X = x1 p11 p21 p•1
X = x2 p12 p22 p•2
X = x3 p13 p23 p•3
marg1 p1• p2• 1
ˇ Kolik marginálních rozdelení má tento vektor?
Marginální hustoty
ˇ Pro spojité rozdelení marginální hustoty jsou Z f1 (x1 ) = f (x1 , x2 )dx2 M2
Z f2 (x2 ) =
f (x1 , x2 )dx1 M1
kde Mi je obor hodnot spojité náhodné veliˇciny Xi .
ˇ ˇ Podmínené rozdelení - diskrétní veliˇciny
ˇ ˇ podmínená pravdepodobnostní funkce P(x1 | x2 ) =
P(x1 , x2 ) P2 (x2 )
ˇ podmínená distribuˇcní funkce P t<x1 P(t, x2 ) F (x1 | x2 ) = P2 (x2 )
pro P2 (x2 ) 6= 0
pro P2 (x2 ) 6= 0
ˇ ˇ Pˇríklad – podmínené rozdelení Pro Y = y2 :
Y = y1 Y = y2 marg2
X = x1 p11 p21 p•1
X = x2 p12 p22 p•2
X = x3 p13 p23 p•3
marg1 p1• p2• 1
ˇ ˇ Podmínená pravdepodobnostní funkce P((X = xi ) | y2 ) =
p2i p2•
p2• 6= 0
ˇ ˇ Kolik je podmínených rozdelení tohoto vektoru?
Nezávislé náhodné veliˇciny
Pro nezávislé veliˇciny platí: F (x1 , x2 ) = F1 (x1 ) F2 (x2 ) P(x1 , x2 ) = P1 (x1 ) P2 (x2 ) f (x1 , x2 ) = f1 (x1 ) f2 (x2 )
ˇ rozdelení ˇ Jsou-li veliˇciny nezávislé, pak podmínená jsou rovna marginálním.
Charakteristiky náhodného vektoru X = [X1 , X2 , · · · , Xp ]T Marginální charakteristiky: Stˇrední hodnoty pro diskrétní: X E(Xj ) = xj Pj (xj ),
j = 1, 2, . . . , p
Mj
Stˇrední hodnoty pro spojité: Z E(Xj ) = xj fj (xj )dxj ,
j = 1, 2, . . . , p
Mj
ˇ ˇ jen místo marginálního Podmínené charakteristiky – podobne, ˇ ˇ rozdelení je podmínené. ˇ Podmínená stˇrední hodnota E(X1 | x2 ) se nazývá regresní funkce (závislost X1 na X2).
Vektor stˇredních hodnot, kovarianˇcní matice E(X) =
E(X1 ) E(X2 ) .. .
E(Xp ) a kovarianˇcní (varianˇcní) matice h i Σ = var(X) = cov(X) = E (X − E(X))(X − E(X))T což znamená, že Σ=
σ12 σ12 · · · σ21 σ22 · · · .. .. .. . . . σp1 σp2 · · ·
σ1p σ2p .. . σp2
,
(1)
ˇ ˇ Vícerozmerné normální rozdelení
f (x) = (2π)
−p/2
−1/2
|Σ|
(x − µ)T Σ−1 (x − µ) exp − 2
! ,
kde µ je vektor stˇredních hodnot a Σ je kovarianˇcní matice. ˇ ˇ Pro jednorozmerné normální rozdelení z rov. (2) dostaneme 1 (x − µ)2 f (x) = √ exp − 2σ 2 2πσ 2 ˇ ˇ Vícerozmerné normální rozdelení má tyto vlastnosti: ˇ lineární kombinace prvku˚ z X mají normální rozdelení ˇ všechny podmnožiny X mají normální rozdelení nekorelovanost veliˇcin z X (složek vektoru X) znamená i jejich nezávislost ˇ ˇ všechna podmínená rozdelení jsou normální
(2)
ˇ ˇ Dvourozmerné normální rozdelení
parametry EX1 = µ1 , EX2 = µ2 , varX1 = σ12 , varX2 = σ22 a kovariancí σ12 je kovarianˇcní matice 2 σ1 σ12 σ12 σ1 σ2 ρ Σ= = σ12 σ22 σ1 σ2 ρ σ22 nebot’ korelaˇcní koeficient ρ = σ12 /(σ1 σ2 ). Determinant kovarianˇcní matice je pak 2 |Σ| = σ12 σ22 − σ12 = σ12 σ22 (1 − ρ2 ).
Vidíme, že tento determinant je roven nule, když ρ2 = 1.
µ1 = µ2 = 0, σ1 = σ2 = 1, ρ = 0
µ1 = µ2 = 0, σ1 = 1, σ2 = 2, ρ = 0
µ1 = µ2 = 0, σ1 = σ2 = 1, ρ = −0.6
µ1 = µ2 = 0, σ1 = σ2 = 1, ρ = 0.8
µ1 = µ2 = 0, σ1 = 1, σ2 = 2, ρ = 0.8
µ1 = µ2 = 0, σ1 = 1, σ2 = 2, ρ = −0.8