VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Katedra statistiky a pravděpodobnosti
STATISTIKA VZORCE PRO 4ST201
verze 3.0 poslední aktualizace: 16.2.2015
KSTP 2015
Popisná statistika pi
k
ni n
n
P 0,5 z p 100
n
x
i
i 1
1
i = 1, 2, ..., k
P P zP n 1 100 100
n
i 1
p
i 1
xp
x
k
ni n
n p z p n p 1
np 0,5 z p k
i
x
n
x
ni
i
i 1 k
k
x xi pi
n
i 1
i
i 1 k
xH
n n
1
x i 1
xG n
xH
n i 1 k
i
ni
x i 1
i
n
xi n x1 x2 ... xn
i
xG
i 1
xH
k
n
x
ni i
i 1
n
1 k
pi
i 1
i
x
x1n1 x2n2 ... xknk
R = xmax − xmin n
s x2
( xi x ) 2
n
i 1
2
s x2 x 2 x
n
(x x ) n
s
i
2 i
i
k
n i 1
i
k
i 1
k
s s s 2
2 x
k
i 1
i 1
i 1 k
2 i
ni
n
i
(x x )
k
k
i 1
i 1
2
k
i 1
2
i
k
n i 1
i
ni
x
x i 1 k
i
ni
n i 1
k
sx2 si2 pi (xi x ) 2 pi
s x s x2
2
k
s i 1
k
sx2 x 2 x 2 xi2 pi ( xi pi ) 2
sx2 (xi x ) 2 pi
2 x
n k
2
i 1
i 1
n xi i 1 n
k x ni xi ni i 1 i 1 sx2 x 2 x 2 k k ni ni i 1 i 1
k
2 x
xi2
i
x xi pi i 1
s Vx x x 1
Pravděpodobnost Počet pravděpodobnosti m P (A) n P(A B) = P(A) + P(B)
P(A B) = P(A) + P(B) − P(A B)
Náhodné veličiny P(x) = P(X = x) F(x) = P(X x) = P(t )
P(x1 X x2 )
t x
f ( x)dx 1
f (x) F (x)
f (t )dt
P(x1 < X x2) =
P(x) F (x2 ) F (x1 )
x
F(x) = P(X x) =
x1 x x2
x2
f ( x)dx F(x2) − F(x1)
x1
xP
F xP P
x P F 1 ( P)
E (X ) x P(x)
E (X )
x
f (x)dx
x
D(X ) x P (x) x P (x) x x
2
2
D( X ) x f ( x)dx xf ( x)dx 2
( X ) D( X ) Pravděpodobnostní rozdělení Alternativní rozdělení A[]
P x x (1 )1 x
x = 0, 1, 0 1
D X (1 )
E(X) =
Binomické rozdělení Bi[n;]
n P( x ) x (1 ) n x x
E X n
x = 0, 1, 2, ..., n, n N , 0 1
D X n 1
Poissonovo rozdělení Po[]
P(x) e E(X) =
x x!
x = 0, 1, ... , > 0, D(X) =
2
2
pravděpodobnost Hypergeometrické rozdělení Hy[N;M;n] M N M x nx P( x) , x max 0,M N n , ..., min(M, n), n > 0, N ≥ n, M ≤ N N n M M M N n E( X ) n D(X ) n 1 N N N N 1 Normální rozdělení N[µ;2] - x , - µ , 2 > 0 E(X) = D(X) = 2 x x xP u P u F ( x) (u ) x X x2 P(x1 X x2 ) P 1 P(u1 U u2 ) (u2 ) (u1 ) Normované normální rozdělení N[0;1] X U E(U) = 0 D(U) = 1 (u) 1 (-u) (-u) 1 (u)
Chí-kvadrát rozdělení Rozdělení t (Studentovo)
2[] t[]
F - rozdělení (Fisherovo – Snedecorovo)
u P u1 P
x 0, N - x , N F[1;2]
3
x0
tP[ν] = −t1-P[ν] FP [ 1 ; 2 ]
1 F1 P [ 2 ; 1 ]
KSTP 2009
Matematická statistika n
sx
(x x )
2
i
i 1
n 1
Odhady parametrů střední hodnota est μ = ˆ x
est Nμ = N x
normální rozdělení a) 2 známé P x u1 / 2 x u1 / 2 1 n n
P x u1 1 , n
P x u1 1 n
b) 2 neznámé s s P x t1 / 2 x x t1 / 2 x 1 n n
s P x t1 x 1 , n
t ~ t[n – 1]
s P x t1 x 1 n
obecné rozdělení, 2 neznámé, velký výběr (n > 30)
s s P x u1 / 2 x E (X ) x u1 / 2 x 1 n n s s P x u1 x E (X ) 1 , P E (X ) x u1 x 1 n n rozptyl 2 (normální rozdělení) est σ2= ˆ 2 s x2 Parametr alternativního rozdělení (odhad relativní četnosti základního souboru) est π = ˆ = p est Nπ = Np p (1 p ) P p u1 / 2 p u1 / 2 n p(1 p) P p u1 1 , n p (1 p ) 1 P p u1 n
4
p (1 p ) 1 n
matematická statistika Testování hypotéz Střední hodnota normálního rozdělení H0 = 0
H1 > 0 < 0 0
Testové kritérium 2 známé x 0 U n 2 neznámé x 0 t n sx
U ~ N[0;1]
Kritický obor Wα={U u1-} Wα={U -u1-} Wα={U u1-/2}
t ~ t[n – 1]
Wα={t t1-} Wα={t -t1-} Wα={t t1-/2}
Střední hodnota, obecné rozdělení, velký výběr H0 E(X) =0
H1 X) > 0 X < 0 X 0
Testové kritérium 2 neznámé (n > 30) x 0 U n U ≈ N[0;1] sx
Kritický obor Wα={U u1-} Wα={U -u1-} Wα={U u1-/2}
Parametr alternativního rozdělení (velké výběry H0 = 0
H1 > 0 < 0 0
Testové kritérium p 0 U ~ N[0;1] U 0 (1 0 ) n
Kritický obor Wα={U u1-} Wα={U -u1-} Wα={U u1-/2}
Rovnost středních hodnot dvou rozdělení velké nezávislé výběry H0 1 = 2 1 − 2 = 0
H1 1 > 2 1 < 2 1 2
Testové kritérium 1 , 2 neznámé x1 x 2 U s1 2 s 2 2 n1 n2 2
2
U ≈ N[0;1]
Kritický obor Wα={U u1-} Wα={U -u1-} Wα={U u1-/2}
závislé výběry z normálního rozdělení (párový t-test) H0
H1
1 = 2 1 − 2 =0
1 > 2 1 < 2 1 2
Testové kritérium d t n t ~ t[n–1] sd di = x1i – x2i, i=1, 2, ..., n
Kritický obor Wα={t t1-} Wα={t -t1-} Wα={t t1-/2}
Chí-kvadrát test dobré shody H0 a H1 Testové kritérium 2 k ( n n H0: i = 0,i i = 1, …, k i 0 ,i ) G H1: non H0 n i 1
0 ,i
Kritický obor G ≈ 2[k−1]
Wα={G 21-}
n 0,i 5
5
KSTP 2009
Analýza závislostí Kontingenční tabulka (r x s) s
r
ni . nij
n. j nij
j 1
i 1
H0 πij= πi. π.j 1≤i≤r 1≤j≤s
C
nij
ni.n. j n
nij 5
Testové kritérium
H1 non H0
Kritický obor Wα ={G ≥ 21-}
(nij nij ) 2 G G ≈ 2[(r − 1)(s − 1)] nij i 1 j 1 r
G nG
Tabulka 2 x 2
s
V
G , m = min (r, s) n(m 1)
Gn
(n11n22 n12 n21 )2 n1.n2.n.1n.2
Analýza rozptylu k
Sy i 1
ni
y j 1
P2
ij y = Sy.m + Sy.ν 2
S y ,m
1 = 2 = ...=k
2
i 1
ni
S y. yij yi k
2
i 1 j 1
P P2
Sy
H0
k
S y.m yi y ni
H1 non H0
Testové kritérium
Kritický obor Wα={F F1-α}
S y .m F k 1 S y .v
F
~ F[k – 1; n – k]
nk
Regrese a korelace regresní přímka y = 0 + 1x + ,
n
Y = b0 + b1x
n
sxy
x x y y i 1
b1 byx
i
i
n
xy x . y
n yi xi xi
yi xy x . y sxy 2 sx2 x2 x 2 n xi2 xi
yi xi2 yi xi xi b0 y byx x n xi2 ( xi ) 2
6
minimumb0 ,b1
(y b i 1
i
0
b1 xi ) 2
analýza závislostí
n
S y yi y
Y b0 b1 x1 b2 x2 .. bk xk
Y b0 b1 x b2 x 2
Jiné regresní funkce
n
ST Yi y
2
i 1
s y2
i 1
S 1 n 2 yi y y n i 1 n n
sY2
n
S R yi Yi ei2 2
i 1
s y2 sY2 s(2y Y )
Sy = SR + ST ST Sy
S 1 n 2 Yi y T n i 1 n
S 1 n (yi Yi ) 2 R n i 1 n
s(2y Y )
i 1
I yx2 R 2 I 2
2
sR =
I yx I yx2
s R2
SR n p
SR s R2 n p
2 2 I ADJ RADJ 1 (1 I yx2 )
n 1 n p
Test hypotézy o regresních parametrech H0 i = 0
Test o modelu H0
0 = c 1 = 0
Testové kritérium
H1 i 0
bi s (bi )
t
Kritický obor Wα={t ≥ t1-/2}
t ~ t[n – p]
p=k+1 Testové kritérium
H1 non H0
Kritický obor Wα = {F ≥ F1-}
ST p 1 F SR n p
...
k = 0
F ~ F[p – 1; n – p]
korelační koeficient
ryx rxy
H0 ρyx = 0
n
n
n
i 1
i 1
i 1
n xi yi xi yi n
n
i 1
i 1
n xi2 ( xi ) 2
H1 ρyx 0
n
n
i 1
i 1
n yi2 ( yi ) 2
x
xy x y 2
x2
Testové kritérium t
y
2
y2
sxy sx s y
Kritický obor Wα={t ≥ t1-/2}
ryx n 2
t ~ t[n –2]
1 ryx2
7
KSTP 2009
Časové řady n 1 1 1 y1 yt yn 2 2 t 2 y n 1
n
y
yt t 1
n
t = yt − yt-1
kt
yt y t 1
I t /1
yt I 2 /1 I 3/ 2 ... I t / t 1 y1
y y3 y yn y1 y2 d1 2 d 2 ... n 1 d n 1 2 2 y 2 d1 d 2 ... d n 1
y y 1 n t n 1 n 1 t 2 n 1
k n 1 k 2 k 3 ...k n n 1
I t / t 1
yn y1
yt I t /1 yt 1 I t 1/1
Klouzavé průměry p
yt
m = 2p + 1
yt
m = 2p
i p
yt i
m
yt p ... yt 1 yt yt 1 ... yt p m
1 yt p 2 yt p 1 . 2 yt 1 2 yt 2 yt 1 . 2 yt p 1 yt p 2m
Dekompozice časové řady yt=Tt + St + Ct + εt Tt = 0 + 1t
yt=Tt St Ct εt T t = 0 + 1 t + 2 t2
Tˆt b0+b1t
Tˆt b0 + b1t + b2t2
n
( yt Tˆt ) 2 MSE =
t 1
n
Regresní metoda s umělými proměnnými (lineární trend, sezónnost délky 4) yt = Tt + St + εt = β0 + β1t + α1x1t + α2 x2t + α3 x3t + εt a
a1 a2 a3 4
Si 4 j ai a
S 4 4 j a
i =1,2,3
8
Tˆt (b0 a ) b1t
Indexní analýza Q = pq Ip
p1 p0
p p1 p0
I (Σq )
q Iq.q q q
Q p q Q p q
1
0
0
I (ΣQ)
Iq
1 1
0
0 0
Q1 p q1 Ip 1 p0 Q0 q0
q q1 q0
q q Iq IQ.Q Q
0
q0
Q Q IQ
Q1 Q0
Q Q1 Q0
(Q) Q1 Q0
1
1
0
p1q1 q1 p0 q0
IQ
Δ(q) q1 q0
1
1
0
1
q1 q0
Q Q p Q Q p
1 1
p p1 p0
1
p1q1
q
0
1
pq q
0 0 0
0
0
Ip ( L )
Ip ( F )
Iq ( L )
p1q0 p0 q0
Ip. p q pq
0 0
0 0
Ip.Q Q
Ip ( P )
0
0
pq pq p q pq Ip 1 1
1 1
0 1
1 1
Q Q Ip 1
1
Ip ( L ) . Ip ( P )
p0 q1 p0 q0
Iq ( F ) Iq ( L )
I (ΣQ)
Iq. p q pq
0 0
0 0
Iq.Q Q
Iq ( P )
0
0
p1q1 p1q0
pq pq Iq
1 1 1 1
Q Q Iq
Iq ( P )
Q p q Q p q 1
1 1
0
0 0
IQ.Q Q
0
0
Q Q IQ
Δ(Q) p1 q1 p0 q0
1
1
9
1 1