VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Katedra statistiky a pravděpodobnosti
STATISTIKA VZORCE PRO 4ST201
verze 2.3 poslední aktualizace: 14.9.2009
KSTP 2009
Popisná statistika k
ni n
pi =
n
x=
i =1
i
i =1
=1
i = 1, 2, ..., k
P P < zP < n ⋅ +1 100 100
P + 0,5 = z p 100
n
∑x
∑p
i =1
n⋅
xɶ p
k
∑ ni = n
n p < zp < n p +1
np + 0,5 = z p k
∑x
i
x=
n
i
i =1 k
ni
k
x = ∑ xi pi
∑n
i =1
i
i =1 k
xH =
∑n
n n
1
∑x i =1
xG =
xH =
i
∏ xi =
ni i
xG =
x1 ⋅ x2 ⋅ ... ⋅ xn
n
xH =
∑x i =1
i
n
n
i =1 k
k
n
∏x
ni i
i =1
i =1
=
n
1 k
pi
i =1
i
∑x
x1n1 ⋅ x2n2 ⋅ ... ⋅ xknk
R = xmax - xmin n
s = 2 x
∑ (x i =1
i
− x)
n x ∑ ∑ xi i =1 i =1 2 2 2 sx = x − x = − n n n
2
2 i
n
k
∑ (x − x ) n 2
s =
i
i =1
2 i
i
k
∑n i =1
i
k
i =1
k
s = s + s = 2 x
i =1 k
k
i =1
i =1
2 i
∑ (x − x )
ni
∑n i =1
k
i =1
i =1
i
+
i =1
k
2
i
k
∑n i =1
i
∑x
ni x=
i =1 k
i
ni
∑n i =1
k
sx2 = ∑ si2 pi + ∑ (xi − x ) 2 pi
s x = s x2
k
2
k
∑s 2
k
sx2 = x 2 − x 2 = ∑ xi2 pi − (∑ xi pi ) 2
sx2 = ∑ (xi − x ) 2 pi
2 x
2
k x ni ∑ xi ni ∑ i =1 i =1 2 2 2 sx = x − x = k − k ni ∑ ∑ ni i =1 i =1
k
2 x
i
x = ∑ xi pi i =1
s Vx = x x 1
Pravděpodobnost Počet pravděpodobnosti m P (A) = n P(A ∪ B) = P(A) + P(B)
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
Náhodné veličiny F(x) = P(X ≤ x)= ∑ P(t )
P(x) = P(X = x)
P( x1 < X ≤ x 2 ) =
t≤x
x
F(x) = P(X ≤ x) =
∫
∞
f (x) = F ′(x)
f (t )dt
∫ f ( x)dx = 1
−∞
−∞
P(x1 < X ≤ x2) =
∑ P ( x) = F ( x
x1 < x ≤ x2
x2
∫ f ( x)dx = F(x2) - F(x1)
x1
xP
F(xP)=P
x P = F −1 ( P )
E (X ) = ∑ x P (x)
E (X ) =
∞
∫x
f (x)dx
−∞
x
D(X ) = ∑ x P(x) − ∑ x P(x) x x
2
2
∞
∞ D( X ) = ∫ x f ( x)dx − ∫ xf ( x)dx − ∞ −∞ 2
σ = σ ( X ) = D( X ) Pravděpodobnostní rozdělení Alternativní rozdělení A[π] P(x) = πx(1 - π)1-x E(X) = π
x = 0, 1, 0< π <1
D(X) = π(1 - π)
Binomické rozdělení Bi[n;π]
n P ( x ) = π x (1 − π ) n − x x = 0, 1, 2, ..., n, n > 0, 0< π <1 x E(X) = nπ D(X) = nπ(1 - π) Poissonovo rozdělení Po[λ] P (x) = e− λ
λx x!
x = 0, 1, ... , λ > 0,
E(X) = λ
2
D(X) = λ
2
2
) - F ( x1 )
pravděpodobnost Hypergeometrické rozdělení Hy[N;M;n]
P( x) =
M x
E( X ) = n
N −M n−x ,
N n M N
Normální rozdělení
x = max(0, M-N+n), ..., min(M, n), n > 0, N ≥ n, M ≤ N
D(X ) = n
M N
N[µ;σ2]
-∞ < x < ∞, -∞ < µ < ∞, σ2 > 0 u=
M N −n 1 − N N −1
x−µ
σ
E(X) = µ
x−µ F ( x) = Φ (u ) = Φ σ
D(X) = σ2 xP = µ + σ u P
x − µ X − µ x2 − µ P (x1 ≤ X ≤ x2 ) = P 1 ≤ ≤ = P (u1 ≤ U ≤ u2 ) = Φ (u2 ) − Φ (u1 ) σ σ σ Normované normální rozdělení U=
X −µ
σ
Φ (u ) = 1 − Φ (-u )
Chí-kvadrát rozdělení Rozdělení t (Studentovo)
N[0;1]
E(U) = 0
D(U) = 1
Φ (-u ) = 1 − Φ (u ) χ2[ν] t[ν]
F - rozdělení (Fisherovo – Snedecorovo)
u P = −u1− P x>0
-∞ < x < ∞ F[ν1;ν2]
3
x>0
tP[ν] = - t1-P[ν] FP [ν 1 ;ν 2 ] =
1 F1− P [ν 2 ;ν 1 ]
KSTP 2009
Matematická statistika n
s′x =
∑ (x − x) i =1
2
i
n −1
Odhady parametrů střední hodnota est µ = µˆ = x
est Nµ = N x
normální rozdělení a) σ2 známé σ σ P x − u1−α / 2 < µ < x + u1−α / 2 = 1−α n n
σ P x − u1−α < µ = 1−α n
σ P µ < x + u1−α = 1−α n
b) σ2 neznámé s′ s′ P x − t1−α / 2 x < µ < x + t1−α / 2 x = 1 − α n n s′ P x − t1−α x < µ = 1 − α n
t ~ t[n – 1]
s′ P µ < x + t1−α x = 1 − α n
obecné rozdělení, σ2 neznámé, velký výběr (n > 30) s′ s′ P x − u1−α / 2 x < E (X ) < x + u1−α / 2 x = 1 − α n n s′ P x − u1−α x < E (X ) = 1 − α n
s′ P E (X ) < x + u1−α x = 1 − α n
rozptyl σ2 (normální rozdělení) est σ2= σˆ 2 = s ′x2 parametr π alternativního rozdělení est π = πˆ = p est Nπ = Np P p − u1−α / 2
P p − u1−α
p (1 − p ) < π < p + u1−α / 2 n
p(1 − p) < π = 1 − α n
p (1 − p ) = 1−α n
P π < p + u1−α
4
p (1 − p) = 1−α n
matematická statistika Testování hypotéz Střední hodnota normálního rozdělení H0 µ = µ0
H1 µ > µ0 µ < µ0 µ ≠ µ0
Testové kritérium σ2 známé x − µ0 U= n
U ~ N[0;1]
σ
σ2 neznámé x − µ0 t=
s′x
t ~ t[n – 1]
n
Kritický obor Wα={U ≥ u1-α} Wα={U ≤ -u1-α} Wα={|U| ≥ u1-α/2} Wα={t ≥ t1-α} Wα={t ≤ -t1-α} Wα={|t| ≥ t1-α/2}
Střední hodnota, obecné rozdělení, velký výběr H0 E(X)= µ0
H1 Ε(X) > µ0 Ε(X) < µ0 Ε(X) ≠ µ0
Testové kritérium σ2 neznámé (n > 30) x − µ0 U= n U ≈ N[0;1] sx′
Kritický obor Wα={U ≥ u1-α} Wα={U ≤ -u1-α} Wα={|U| ≥ u1-α/2}
Parametr π alternativního rozdělení (velké výběry) H0 π = π0
H1 π > π0 π < π0 π ≠ π0
Testové kritérium p −π0 U ≈ N[0;1] U= π 0 (1 − π 0 ) n
Kritický obor Wα={U ≥ u1-α} Wα={U ≤ -u1-α} Wα={|U| ≥ u1-α/2}
Rovnost středních hodnot dvou rozdělení velké nezávislé výběry H0 µ1 = µ2 µ1 - µ2 = 0
H1 µ1 > µ2 µ1 < µ2 µ1 ≠ µ2
Testové kritérium σ1 , σ2 neznámé x1 − x 2 U= s1′ 2 s 2′ 2 + n1 n 2 2
2
U ≈ N[0;1]
Kritický obor Wα={U ≥ u1-α} Wα={U ≤ -u1-α} Wα={|U| ≥ u1-α/2}
závislé výběry z normálního rozdělení (párový t-test) H0
H1
µ1 = µ2 µ1 - µ2 = 0
µ1 > µ2 µ1 < µ2 µ1 ≠ µ2
Testové kritérium d t= n t ~ t[n–1] s′d di = x1i – x2i, i=1,2,..,n
Kritický obor Wα={t ≥ t1-α} Wα={t ≤ -t1-α} Wα={|t| ≥ t1-α/2}
Chí-kvadrát test dobré shody H0 a H1 H0: πi = π0,i i = 1, .., k H1: non H0
Testové kritérium k
G=∑ i =1
Kritický obor
(ni − nπ 0,i )
2
nπ 0,i
G ≈ χ2[k-1]
Wα={G ≥ χ21-α} nπ 0,i ≥ 5
5
KSTP 2009
Analýza závislostí Kontingenční tabulka (r x s) s
r
ni . = ∑ nij
n. j = ∑ nij
j =1
i =1
H0 πij= πi. π.j 1≤i≤r 1≤j≤s
C=
H1 non H0
nij′ =
ni.n. j n
nij′ ≥ 5
Testové kritérium
(nij − nij′ ) 2 G = ∑∑ nij′ i =1 j =1 r
G n+G
Tabulka 2 x 2
s
Kritický obor Wα ={G ≥ χ21-α}
G ≈ χ2[(r - 1)(s - 1)]
V =
G , m = min (r,s) n(m − 1)
G=n
(n11n22 − n12 n21 )2 n1.n2.n.1n.2
Analýza rozptylu k
Sy = ∑ i =1
ni
∑ ( yij − y ) = Sy.m + Sy.ν 2
j =1
P2 =
S y ,m
µ1 = µ2 = ..=µk
2
i =1
ni
S y .ν = ∑∑ ( yij − yi ) k
2
i =1 j =1
P = P2
Sy
H0
k
S y .m = ∑ ( yi − y ) ni
H1 non H0
Testové kritérium
Kritický obor Wα={F ≥ F1-α}
S y .m F = k −1 S y .v
F
~ F[k – 1;n – k]
n−k
Regrese a korelace regresní přímka y = β0 + β1x + ε ,
n
Y = b0 + b1 x
n
sxy =
∑ ( x − x )( y − y ) i =1
i
n
b1 = byx =
b0 =
i
= xy − x . y
n ∑ yi xi − ∑ xi
∑ yi = xy − x . y = sxy 2 s x2 x2 − x 2 n ∑ xi2 − ( ∑ xi )
∑ yi ∑ xi2 − ∑ yi xi ∑ xi = y − b x yx n∑ xi2 − (∑ xi ) 2
6
minimumb0 ,b1
∑ (y − b i =1
i
0
− b1 xi ) 2
analýza závislostí
n
S y = ∑ ( yi − y )
Y = b0 + b1 x1 + b2 x2 + .. + bk xk
Y = b0 + b1 x + b2 x 2
Jiné regresní funkce
n
ST = ∑ (Yi − y )
2
i =1
s y2 =
i =1
S 1 n 2 ( yi − y ) = y ∑ n i =1 n n
sY2 =
n
S R = ∑ ( yi − Yi ) = ∑ e 2
i =1
2 i
i =1
2 (y −Y )
s
ST Sy
S 1 n 2 (Yi − y ) = T ∑ n i =1 n
S 1 n = ∑ (yi − Yi ) 2 = R n i =1 n
s 2y = sY2 + s(2y −Y )
Sy = SR + ST
I yx2 = R 2 = I 2 =
2
sR =
I yx = I yx2
s R2 =
SR n− p
SR = s R2 n− p
2 2 I ADJ = RADJ = 1 − (1 − I yx2 )
n −1 n− p
Test hypotézy o regresních parametrech H0 βi = 0
H1 βi ≠ 0
Test o modelu H0
β0 = c β1 = 0
Testové kritérium
bi s (bi )
t=
Kritický obor Wα={|t| ≥ t1-α/2}
t ~ t [ n – p]
p=k+1
H1 non H0
Testové kritérium
Kritický obor Wα = {F ≥ F1-α}
ST p −1 F= SR n− p
...
βk = 0
F ~ F[p – 1; n – p]
korelační koeficient
ryx = rxy =
n
n
n
i =1
i =1
i =1
n ∑ xi yi − ∑ xi ∑ yi n
n
i =1
i =1
n ∑ xi2 − ( ∑ xi ) 2
H0 ρyx = 0
H1 ρyx ≠ 0
n
n
i =1
i =1
=
n ∑ yi2 − ( ∑ yi ) 2
(x
xy − x y 2
− x2
Testové kritérium
t=
)( y
2
− y2
)
=
s xy sx s y
Kritický obor Wα={t ≥ t1-α/2}
ryx n − 2
t ~ t[n –2]
1 − ryx2
7
KSTP 2009
Časové řady n −1 1 1 y1 + ∑ yt + yn 2 2 t =2 y= n −1
n
∑ yt t =1
y=
n
∆t = yt - yt-1
∆=
kt =
yt y t −1
I t /1 =
yt = I 2 /1 I 3/ 2 ... I t / t −1 y1
y + y3 y + yn y1 + y2 d1 + 2 d 2 + ... + n −1 d n −1 2 2 y= 2 d1 + d 2 + ... + d n −1
y −y 1 n ∆t = n 1 ∑ n − 1 t =2 n −1
k = n −1 k 2 k 3 ...k n = n −1
I t / t −1 =
yn y1
yt I = t /1 yt −1 I t −1/1
Klouzavé průměry p
∑
yt =
m = 2p + 1
yt =
m = 2p
i =− p
yt +i
m
=
yt − p + ... + yt −1 + yt + yt +1 + ... + yt + p m
(
1 yt − p + 2 yt − p +1 + . + 2 yt −1 + 2 yt + 2 yt +1 + . + 2 yt + p −1 + yt + p 2m
)
Dekompozice časové řady yt=Tt + St + Ct + εt Tt = β 0 + β 1t
yt=Tt St Ct εt T t = β 0 + β 1 t + β 2 t2
Tˆt = b0+b1t
Tt = β 0 β1t
lnTt= ln(β0) + ln(β1) t
Tˆt = = b0 + b1t + b2t2
ln(Tˆt ) = ln(b0) + ln(b1) t
n
∑ ( yt − Tˆt ) 2 MSE =
t =1
n
Regresní metoda s umělými proměnnými (lineární trend, sezónnost délky 4) yt = Tt + St + εt = β0 + β1t + α1x1t + α2 x2t + α3 x3t + εt a=
a1 + a2 + a3 4
Si + 4 j = ai − a
S4 + 4 j = −a
i =1,2,3
8
Tˆt = (b0 + a ) + b1t
Indexní analýza Q = pq Ip =
p1 p0
∆ p = p1 − p0
I (Σq ) =
∑ q = ∑ Iq.q ∑q ∑q
=
∑Q = ∑ p q ∑Q ∑ p q
=
1
0
0
I (ΣQ) =
Iq =
1 1
0
0 0
∑ Q1 p ∑ q1 = Ip = 1 = p0 ∑ Q0 ∑ q0
∆q = q1 − q0
∑q q ∑ Iq
IQ =
Q1 Q0
∆Q = Q1 − Q0
∆(Σq) = ∑ q1 − ∑ q0
1
1
0
1
q1 q0
∑ IQ.Q ∑Q
0
0
∑ p1q1 ∑ q1 = ∑ p0 q0 ∑ q0
=
∑Q Q ∑ IQ
∆(ΣQ) = ∑ Q1 − ∑ Q0
1
1
∑Q Q ∑p ∑Q Q ∑p
1 1
∆ p = p1 − p0 = ∑
1
p1q1
∑q
0
−
1
∑pq ∑q
0 0 0
0
0
Ip ( L ) =
∑ ∑
Ip ( F ) =
Iq ( L ) =
p1q0 p0 q0
=
∑ Ip. p q ∑ pq
0 0
0 0
=
∑ Ip.Q ∑Q
Ip ( P ) =
0
0
∑pq = ∑pq ∑p q ∑ pq Ip 1 1
1 1
0 1
1 1
=
∑Q Q ∑ Ip 1
1
Ip ( L ) Ip ( P )
∑ ∑
p0 q1 p0 q0
=
∑ Iq. p q ∑pq
0 0
0 0
=
∑ Iq.Q ∑Q
Iq ( P ) =
0
0
Iq ( F ) = Iq ( L ) Iq ( P )
9
∑ ∑
p1q1 p1q0
=
∑pq pq ∑ Iq
1 1 1 1
=
∑Q Q ∑ Iq 1 1