STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
alapfogalmak egy ismérv szerinti elemzés két ismérv szerinti elemzés standardizálás indexszámítás
1. ALAPFOGALMAK 1.1.Ismérvek típusai TERÜLETI, IDŐBELI, MINŐSÉGI, MENNYISÉGI.
MINŐSÉGI
Nominális (névleges) A sokaság elemeit valamilyen tulajdonságok szerinti csoportokba soroljuk, de a csoportok közt nincs semmiféle rangsor példák: az áldozatok halálának oka a terroristák nemzetisége
Ordinális (sorrendi) A csoportok között már felállítható sorrendiség példák: a hotelek besorolása (** *** **** *****) a vizsgázók jegyei (1, 2, 3, 4, 5 )
MENNYISÉGI Intervallum A sokaság elemeit itt már valamilyen mértékegység szerint osztályozzuk, de csak a „mennyivel több?” kérdésre tudunk válaszolni, a „hányszoros?”-ra nem példák: hőmérséklet (tegnap -5 fok volt, ma 0 fok, hányszor melegebb van?)
Arány Itt is mértékegység szerinti az osztályozás, de a „hányszoros?” kérdésre is tudunk válaszolni (mindig 0-tól kezdünk mérni) példák: életkor testmagasság
1.2.Viszonyszámok
V
A B
SÚLYOZOTT SZÁMTANI ÁTLAG: A súlyok B1 B2 stb.
V
V1 B1 V2 B2 B1 B2
V
több tagra
A1 A2 A1 A2 V1 V2
több tagra
© www.mateking.hu
[email protected]
i
i
MÉRTANI ÁTLAG:
i
V V1 V2
SÚLYOZOTT HARMONIKUS ÁTLAG: A súlyok A1 A2 stb.
V
V B B
V
több tagra
V n
n
V
i
1
A A V
i i
i
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
2
2. EGY ISMÉRV SZERINTI ELEMZÉS 2.1. Adatok 20 23 24 24 24 25 27 30 31 32
Szórás a teljes populációra
alsó kvartilis=23,5
medián=24,5
2
i
26 202 26 232 26 242 26 242 ... 10
N
A teljes populációból vett n elemű minta szórása
felső kvartilis=31,5
s
módusz=24 átlag:
X X
X X
2
i
S
26 202 26 232 26 242 26 242 ... 9
n 1
X 26
2.2. Adatsorok GYAKORISÁG
OSZTÁLYKÖZÖK
10-19 20-29 30-39 40-49
ÉRTÉKÖSSZEG
RELATÍV ÉRT.ÖSSZ.
Si
Zi
200
200/2000
200/2000
5∙200
5∙200/S
600
400/2000
600/2000
15∙400
15∙400/S
Me
1100
500/2000
1100/2000
25∙500
25∙500/S
Mo
1700
600/2000
1700/2000
35∙600
35∙600/S
2000
300/2000
2000/2000
45∙300
45∙300/S
x1 5 x2 15 x3 25
200 400 500
x4 35 x5 45
600 300 i
KUMULÁLT RELATÍV GYAKORISÁG
g i
f i
f
RELATÍV GYAKORISÁG
gi
fi
Osztályközép: xi
0-9
KUMULÁLT GYAKORISÁG
S
N 2000
Becsült átlag
X
X i fi X i gi N
X
i
S
5 200 15 400 ... 27 2000
Becsült medián
N 1 f me 2 Me me hme f me Becsült módusz
Mo mo
k1 hmo k1 k 2
me a mediánt tartalmazó osztályköz alsó határa, hme a mediánt tartalmazó osztályköz hossza
2000 600 2 Me 20 20 500
mo a móduszt tartalmazó osztályköz alsó határa k1 f mo f mo1 k 2 f mo f mo1
Mo 30
Becsült szórás a teljes populációra
X x
2
i
N
fi
X x g
© www.mateking.hu
[email protected]
2
i
i
100 20 100 300
Relatív szórás
V
X
27 52 200 27 152 400 ...
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
2000
3
2.3. A Lorenz-görbe Azt fejezi ki, hogy a gyakoriság egy adott százalékához az összérték hány százaléka tartozik. Az x tengelyen tehát a kumulált relatív gyakoriságot, míg az y tengelyen a kumulált relatív értékösszeget mérjük.
Zi
g i
V 2 1 HI Z N 2 i
2.4. Alakmutatók
Pearson-féle mérőszámok
P3
Y Me
A
X Mo
F-mutatók
F0,1
D9 Me Me D1 D9 Me Me D1
© www.mateking.hu
[email protected]
F0, 25
Q3 Me Me Q1 Q3 Me Me Q1
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
4
3. KÉT ISMÉRV SZERINTI ELEMZÉS
3.1. Mindkét ismérv minőségi: ASSZOCIÁCIÓS KAPCSOLAT
C1
C2
…
Cj
… Total
f11
f12
…
f1 j
…
f1
R2 f 21 f 22 … … … f i1 Ri fi 2 … … … Total f 1 f 2
…
f2 j … … … f ij … … f j
…
f 2
… …
f i
R1
f ij
N
f i f j N
2
…
f
ij
f ij
2
f ij
Cramer-féle asszociációs együttható
C
N min (r 1); (c 1)
Csuprov-féle asszociációs együttható
C1
C2
…
Cj
… Total
f11
f12
…
f1 j
…
f1
R2 f 21 … … f i1 Ri … … Total f 1
f 22 … fi 2 … f 2
…
f2 j … … … f ij … … f j
…
f 2
… …
f i
2
2 N r 1 c 1
R1
… N
Yule-féle asszociációs együttható
f f f12 f 21 Y 11 22 f11 f 22 f12 f 21
© www.mateking.hu
[email protected]
R1 R2 Total
C1 f11 f 21 f 1
C2 Total f12 f1 f 22 f 2 f 2 N
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
5
3.2. Az egyik ismérv minőségi, a másik mennyiségi: VEGYES KAPCSOLAT
MENNYISÉGI
Részátlag Nj
X ij
i 1
Nj
Yj
Nj
f ij X i
i 1
Nj
Rész-szórás
j
j 1 2 X ij X j N j i 1
N
j 1 2 f ij X i X j N j i 1
N
R1 R2 … Ri
X1 X2 … Xi
ÖSSZ.
MINŐSÉGI
C1 f11 f 21 … f i1
C2 f12 f 22 … fi 2
… … … … …
N1
N2
Nj
ÖSSZ.
N
OSZTÁLYKÖZEPEK
MENNYISÉGI
Főátlag N
N
1 M j 1 j M Y X ij f ij X i N j 1 i 1 N i 1 j 1
B
1 2 X ij X j N j 1 i 1 Nj
SSB X ij X j Nj
2
f11 f12 f 21 f 22 … … f i1 fi 2
… … … …
C1 f11 f 21 … f i1
ÖSSZ.
N1
ÖSSZ.
N1
MENNYISÉGI
MINŐSÉGI
X1 X2 … Xi
R1 R2 … Ri ÖSSZ.
X1 X2 … Xi
N2
ÖSSZ.
C2
…
f11 f12 f 21 f 22 … … f i1 fi 2
… … … …
C1 f11 f 21 … f i1
N1
ÖSSZ.
N1
C1
M
Belső eltérés-négyzetösszeg SSB (sum of squares belső) M
…
R1 R2 … Ri
1 N j 2j N j 1
ÖSSZ.
C2
C1
Belső szórás azt adja meg, hogy az egyes elemek átlagosan mennyivel térnek el a saját részátlaguktól: M
MINŐSÉGI
N2
j 1 i 1
© www.mateking.hu
[email protected]
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
6
Külső szórás azt adja meg, hogy a részátlagok átlagosan mennyivel térnek el a főátlagtól:
K
MENNYISÉGI
1 2 N j X j X N j 1
Külső eltérés-négyzetösszeg SSK (sum of squares külső)
SSK N j X j X
2
Teljes szórás azt adja meg, hogy az egyes elemek átlagosan mennyivel térnek el a főátlagtól:
1 2 X ij X N j 1 i 1 Nj
Teljes eltérés-négyzetösszeg SST (sum of squares teljes)
SST X ij X Nj
M
f11 f12 f 21 f 22 … … f i1 fi 2
… … … …
ÖSSZ.
N1
ÖSSZ.
N1
MENNYISÉGI
MINŐSÉGI
R1 R2 … Ri
X1 X2 … Xi
R1 R2 … Ri
X1 X2 … Xi
N2
ÖSSZ.
C1
ÖSSZ.
2
C2
C1 f11 f 21 … f i1
j 1
M
ÖSSZ.
C1
M
M
MINŐSÉGI
C2
f11 f12 f 21 f 22 … … f i1 fi 2
… … … …
C1 f11 f 21 … f i1
N1
ÖSSZ.
N1
N2
j 1 i 1
2 B2 K2
SST SSB SSK
A relatív hibacsökkenés, vagyis a PRE kiszámolására a következő képlet van forgalomban:
PRE
B2 K2 SST SSB SSK 2 B2 1 H2 SST SST 2 2 2
Ha PRE=0 akkor a két ismérv független Ha PRE=1 akkor a két ismérv közt függvényszerű kapcsolat van. Ha pedig PRE értéke valahol nulla és egy között van, akkor a kapcsolat nem független és nem is függvényszerű, tehát sztochasztikus. Amikor a két ismérv független
PRE 0
SSK 0
K2 0
2 B2
Amikor a két ismérv kapcsolata függvényszerű
PRE 1
SSB 0
© www.mateking.hu
[email protected]
B2 0
K2 2 STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
7
3.3. Mindkét ismérv mennyiségi: KORRELÁCIÓS KAPCSOLAT
d X X X d Y Y Y dX dY X X Y Y 2
2
2
2
Lineáris korrelációs együttható
r
dX dY d X d Y 2
2
Kovariancia
C ( X , Y )
dX dY N
A regressziós egyenes egyenlete:
Yˆ ˆ0 ˆ1 X
ahol
ˆ1
dX dY
d2X
és ˆ0 Y ˆ1 X
X-nek az Y-ra vonatkozó determinációs hányadosa
2 XY
K2 ( X ) 2 (X )
Y-nak az X-re vonatkozó determinációs hányadosa
Y2 X
K2 (Y ) 2 (Y )
© www.mateking.hu
[email protected]
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
8
4. STANDARDIZÁLÁS 4.1.A különbségfelbontás EGYIK IZÉ
ÖSSZ:
MÁSIK IZÉ
A0
B0
V0
A0 B0
A0
B0
V0
A B
0 0
A1
B1
V1
A1 B1
A1
B1
V1
A B
k V1 V0 1
K V1 V0
1
FŐÁTLAGOK KÜLÖNBSÉGE K V1 V0 RÉSZHATÁS KÜLÖNBSÉG (részhatás=V ilyenkor az összetételhatás=B a standard)
K V1 V0
B B
STD
V1
STD
B B
STD
V0
B
STD
STD
(V1 V0 )
B
STD
B B
STD
k
STD
ÖSSZETÉTELHATÁS KÜLÖNBSÉG (összetételhatás=B ilyenkor a részhatás=V a standard, de mindig a másik, ha az előbb B1 volt akkor most V0 ha pedig B0 volt, most V1 )
K V1 V0
B1 VSTD
B
1
B V B 0
STD
0
4.2. A hányadosfelbontás EGYIK IZÉ
ÖSSZ:
MÁSIK IZÉ
A0
B0
V0
A0 B0
A0
B0
V0
A B
0 0
A1
B1
V1
A1 B1
A1
B1
V1
A B
i
V1 V0
I
V1 V0
1 1
FŐÁTLAG INDEX V I 1 V0 RÉSZHATÁS INDEX (részhatás=V ilyenkor az összetételhatás=B a standard és általában
I
V1 B1 V1 B1 V0 B1 V1 : V0 B1 B1 B1 V0
A A i
B1 )
1 1
ÖSSZETÉTELHATÁS INDEX (összetételhatás=B ilyenkor a részhatás=V a standard, de mindig a másik, ezért
I
V1 B1 V0 B0 V0 : V0 B1 B0
© www.mateking.hu
[email protected]
V0 )
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
9
5. INDEXEK 5.1. Egyedi ár- volumen- és értékindexek p q pq i p 1 i q 1 iv 1 1 i p i q p0 q0 p0 q0 5.2. Ár- és volumenindexek Ár
Volumen
P
q
Árindex Laspeyres Volumenindex Laspeyres Bázis /bázisidőszak szerinti/ /bázisidőszak szerinti/ időszaki
0
p q p q
I p0
I q0
1 0 0 0
p q p q 0
1
0
0
Volumenindex Paasche Tárgy Árindex Paasche /tárgyidőszak szerinti/ /tárgyidőszak szerinti/ időszaki
1
p q p q
I 1p
I q1
1 1 0 1
pq pq 1
1
1
0
5.3. A Fischer-féle árindex és volumenindex:
I pF I p0 I 1p
I qF I q0 I q1
5.4. Az értékindex: p1q1 I 1 I 0 I 1 I 0 I F I F Iv p q q p p q p0 q0
amiből
I 1p I p0
I q1 I q0
5.5. Az indexek átlagformái
I p0
p q i p q 0 0
p
pq pq i
1 0
1 0
0 0
v i v 0
p
I q0
0
p q i p q 0 0
q
p q i p q 0 1
p
0 1
pq pq i
1 1 1 1 p
0 1
0 1
0 0
p
I 1p
p q pq i
v i v 0
q
0
q
v v i
1
I q1
1
p q i pq 1 0
1 0
q
pq pq i
1 1 1 1 q
p
v v i
1 1
q
5.6. Vásárlóerő-paritás
PPP A ( A / B)
p p
A
qA
B
qA
PPP B ( A / B)
p p
A
qB
B
qB
PPP F ( A / B) PPP A ( A / B) PPP B ( A / B) © www.mateking.hu
[email protected]
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
10
6. IDŐSOROK 6.1.Állapotidősor és tartamidősor ÁLLAPOTIDŐSOR Változás mértéke Változás üteme
d
d
t
n 1
yn y1 n 1
n
l n1 lt n1 t 2
Átlag
TARTAMIDŐSOR
d
d
t
n 1 n
yn y1
yn y1 n 1
l n1 lt n1 t 2
y y1 y2 ... n 2 yk 2 n 1
y
yn y1
y1 y2 ... yn n
6.2. Mozgóátlagok Ha a tagok száma páratlan:
yˆ t
yt k ... yt 1 yt yt 1 ... yt k 2k 1
Ha pedig a tagok száma páros
yt k y ... yt 1 yt yt 1 ... t k 2 yˆ t 2 2k 6.3. Lineáris és exponenciális trend Lineáris trend
yˆ 0 1 t Lineáris trend normálegyenletei n
n
t 1
t 1
yt n 0 1 t
n
n
n
t 1
t 1
t 1
t yt 0 t 1 t 2
Exponenciális trend
t yˆ 0 1
ln yˆ ln 0 t ln 1
© www.mateking.hu
[email protected]
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
11
6.4. Szezonális eltérés lineáris trend esetén
y n/ p
sj
ij
i 1
yˆ ij
n/ p
SZEZONOK=j (szezonfajták száma p)
ÉVEK=i
j=1
j=2
j=3
…
i=1
y1 1
y1 2
y1 3
y1 4
i=2
y2 1
y2 2
y2 3
y2 4
i=3
y3 1
y3 2
y3 3
y3 4
…
y4 1
y4 2
y4 3
y4 4
6.5. Korrigált szezonális eltérés lineáris trend esetén
sj sj s 6.6. Szezonindex exponenciális trend esetén
yij ˆ i 1 y ij sj n/ p n/ p
6.7. Korrigált szezonindex exponenciális trend esetén s j sj s
© www.mateking.hu
[email protected]
STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
12