2. konzult. LEV. 2013. ápr. 5. MENNYISÉGI ISMÉRV szerinti ELEMZÉS Tk. 23-82., 88-90. oldal, kimarad: 70., 74. oldal A mennyiségi ismérv (X) lehet: diszkrét és folytonos. A rangsor a mennységi ismérv értékeinek monoton sorozata. Ha a megfigyelt sokaság elemszáma nagy, akkor a rangsor nehezen áttekinthető, ezért célszerű az ismérvértékeket tömörítenünk. Ennek legelterjedtebb módja a sokaság egységeinek mennyiségi ismérv szerinti osztályozása, csoportosítása. („k” darab osztályba) Az osztályozás eredménye egy csoportosító sor, ami egy gyakorisági sor: - egy-egy ismérvérték képez egy-egy osztályt (pl. osztályzatok szerint) - intervallumokat, osztályközöket képezünk (Xi a – Xif) (i = 1, … k) A gyakoriság az egy osztályba, osztályközbe eső egységek száma: fi. A gyakoriságok összege mindig egyenlő a sokaság elemszámával, azaz fi = N (i = 1, … k) Osztályköz: a mennyiségi ismérv értékközei. Lehet: - zárt: van alsó (Xia) és felső (Xif) határa; hossza: hi = Xif – X(i-1)f - nyitott: vagy csak felső (az első osztályköznél), vagy csak alsó (az utolsó osztályköznél) határa van A nyitott osztályközt úgy kezeljük, mintha zárt lenne, a második és az utolsó előtti osztályköz hossza segítségével: h1 = h2 vagy h1 = X1f – 0 (mert X1a = 0, hiszen X1a negatív nem lehet!) és hk = hk-1. X (i 1) f X if Az i-edik osztályközépső meghatározása: X i 2 A gyakoriságok (fi) helyett szerepeltethetjük a relatív gyakoriságokat (gi) is. gi = fi÷fi (=Vm) A relatív gyakoriságok összege mindig egyenlő 1-gyel, azaz gi =1 = 100%. A vizsgált mennyiségi ismérv értékeinek egyes osztályokon (osztályközökön) belüli összegeit értékösszegeknek (Si) nevezzük. Ha csak az osztályközös gyakorisági sor (megoszlás) áll rendelkezésre, akkor az értékösszegeket a gyakoriságok (fi) és az osztályközepek (Xi) szorzataként becsüljük. Si = fi∙Xi S = Si = fi∙Xi Ha az értékösszegek megoszlásáról is képet akarunk kapni, akkor relatív értékösszeg-sort képezünk. Az i-edik osztály relatív értékösszege: Zi = Si÷Si (=Vm) Zi =1 = 100%. Kumulált sorok: (f’, g’, s’, z’, f”, g”, s”, z”) A mennyiségi sor adataiból újabb sorokat, mégpedig ún. felfelé kumulált sorokat is képezhetünk. Képzésük az adatok (gyakoriságok, relatív gyakoriságok, értékösszegek, relatív értékösszegek) fokozatos, „halmozott” összeadásával történik (f’, g’, s’, z’). Az így kapott sor „i”-edik tagja azt mutatja meg, hogy mennyi az első „i” gyakoriság (, relatív gyakoriság, értékösszeg, relatív értékösszeg) összege. Készíthetünk lefelé kumulált sorokat (f”, g”,s”,z”) is, ha az összesen adatokból fokozatosan kivonjuk az adatokat! Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok 1999. október hó: (adott a vastagon szedett!)
hi 200 200 200 200 200 200 200 --
ismérvértékek gyakoriság Forgalom Boltok xi (eFt) száma (x) fi …… – 400 300 5 500 401 – 600 15 700 601 – 800 40 900 801 – 1000 20 1001 – 1200 1100 16 1201 – 1400 1300 9 1401 – …….. 1500 3 ---Összesen 108
fi ’
f i xi x
Si
gi
zi
gi’
zi’
fi”
gi”
5 20 60 80 96 105 108 --
1 362 420 1 555 260 595 360 121 680 1 236 544 2 056 356 1 379 052 8 306 672
1 500 7 500 28 000 18 000 17 600 11 700 4 500 88 800
4,6 > 13,9 > 37,0 > 18,5 < 14,8 < 8,3 < 2,9 < 100,0
1,7 8,4 31,5 20,3 19,8 13,2 5,1 100,0
4,6 18,5 55,5 74,0 88,8 97,1 100,0 --
1,7 10,1 41,6 61,9 81,7 94,9 100,0 --
108 103 88 48 28 12 3 --
100,0 95,4 81,5 44,5 26,0 11,2 2,9 --
2
Feladat: Végezze el a mennyiségi sor komplex elemzését, minden kiszámított mutatószámot értékeljen szövegesen! (Kerekítés eFt-ra.)
1. Számított és helyzeti középértékek kiszámítása 5 300 15 500 40 700 20 900 16 1100 9 1300 3 1500 88800 822,222 822 eFt 108 108 A boltok átlagos forgalma 822 eFt.
a) Átlag: x
b) Módusz: (Mo) a leggyakrabban előforduló ismérvérték; tipikus érték. a) Diszkrét ismérv esetén a leggyakrabban előforduló (mennyiségi) ismérvérték. b) Folytonos ismérv esetén: Modális osztályköz: a móduszt tartalmazó osztályköz → egyenlő hosszúságú osztályközök kellenek (átszámítás!) - nyers módusz: a modális osztályköz közepe - becsült módusz (módusz) értéke:
Mo mo
k1 hmo k1 k 2
A jelölések magyarázata: tk. 55. o.
Az osztályközök azonos hosszúságúak, a legnagyobb gyakoriság 40 bolt, a 600-800 eFt modális osztályközben. k1 = fmodális – fmodálist megelőző = 40-15 = 25 k2 = fmodális – fmodálist követő = 40-20 = 20 Mo 600
mo (a modális osztályköz alsó határa) = 600 eFt hmo (a modális osztályköz hossza) = 200 eFt
40 - 15 25 200 600 200 711,111 711 eFt 40 - 15 40 20 25 20
Ell: 600-800 közé esik!
A boltok tipikus forgalma 711 eFt. Csak egyenlő hosszúságú osztályközök esetén számítható, ezért nem egyenlő hosszúságú osztályközök esetén először azonos hosszúságú osztályközös sort kell előállítani, azután számítható a módusz. Új gyakoriságok az új (egyenlő) osztályközök esetén:
fi új
húj hrégi
fi
c) Medián: (Me) a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb mint nagyobb érték fordul elő. A mediánt az ismérvértékek rangsorából a következő módon határozhatjuk meg: a) Diszkrét ismérvértékek esetén: ld. tk. 57. oldal - Ha a megfigyelt sokaság elemszáma páratlan, akkor a medián a rangsor középső ismérvértékével azonos. Középső az (N+1)/2 sorszámú, ennek ismérvértéke a Me. - Ha a megfigyelt sokaság elemszáma páros, akkor a medián a két középső ismérvérték számtani átlaga. A két középső az N/2 és N/2+1 sorszámú, ezek ismérvértékeinek számtani átlaga a Me. b) Osztályközös gyakorisági (relatív gyakorisági) sor esetén a mediánt becsléssel tudjuk meghatározni. (Ezért mindegy, hogy páros vagy páratlan elemszámú!) A mediánt az az osztályköz tartalmazza, amelyikbe a középső gyakoriság esik. Ehhez kumulált gyakorisági (relatív gyak.) sort készítünk. (fi’, gi’) N ' f me 1 2 A medián becsült értéke: Me me A jelölések magyarázata: tk. 58. o. hme f me középső:
sorszáma: (j/k∙N) ½ ∙108 = 54. bolt
→
600-800 eFt forgalom közé esik (hme = h3 = 200)
me (a mediánt magába foglaló osztályköz alsó határa) = 600 eFt f’me-1 (a mediánt megelőző osztályköz kumulált gyakorisága) = 20 fme (a mediánt magába foglaló osztályköz gyakorisága) = 40 Me 600
54 20 200 770 eFt 40
Ell: 600-800 közé esik!
A vizsgált boltok felének 770 eFt-nál kevesebb, felének pedig 770 eFt-nál több a forgalma. 2
d) Kvantilisek: A rangsorba rendezett sokaságot 2, 3, 4, 5, …, általában k egyenlő részre osztjuk és az osztópontoknak megfelelő ismérvértékeket megállapítjuk. Ezeket kvantilis értékeknek nevezzük. A kvantilis a sokaságot q : (1-q) arányban osztja ketté. A gyakran előforduló kvantilisek: k 2 4 10 100
Elnevezés Medián Kvartilis Decilis Percentilis
Jele Me Qj Dj Pj
Q1 = alsó kvartilis Q3 = felső kvartilis
Az összes kvantilis rangsorból való meghatározásának és osztályközös gyakorisági sorból történő becslésének menete azonos a mediánnál tanultakkal. Számításának képlete: Q j / k
j N fi'1 k ai hi fi
A jelölések magyarázata: tk. 65. o.
Kvartilisek: a rangsorba rendezett sokaságot 4 egyenlő részre osztjuk. (A Medián tehát a középső kvartilis!) Q¼ = Q1 a mennyiségi ismérvnek az az értéke, amelyiknél az összes értékek ¼-e kisebb, 75 %-a pedig nagyobb. Q¾ = Q3 a mennyiségi ismérvnek az az értéke, amelyiknél az összes értékek ¾-e kisebb, 25 %-a pedig nagyobb. Alsó kvartilis: f’3-1 = 20;
sorszáma: (j/k∙N) ¼∙108 = 27. bolt Q1 600
f3 = 40;
→ 600-800 eFt forg. közé esik (h3 = 200, a3 = 600)
27 20 200 635 eFt 40
Ell: 600-800 közé esik!
A boltok ¼-ének forgalma 635 eFt-nál kevesebb, ¾-ének forgalma pedig több volt. Felső kvartilis: sorszáma: (j/k∙N) ¾∙108 = 81. bolt → 1000-1200 eFt forg. közé esik (h5 = 200, a5 = 1000) f’5-1 = 80;
Q3 1000
f5 = 16;
81 80 200 1012,5 1013 eFt 16
Ell: 1000-1200 közé esik!
A boltok 75%-ának forgalma 1013 eFt-nál kevesebb, 25%-ának a forgalma pedig több. 2. A szóródás mutatószámai: a) A szóródás teljes terjedelme: az előforduló legnagyobb és legkisebb ismérvérték különbsége R = Xmax. – Xmin. R = 1500 – 300 = 1200 eFt (vagy: R = 1600 – 200 = 1400 eFt) A legnagyobb és a legkisebb forgalmú bolt forgalma között 1200 eFt különbség van. Gyakran használják helyette az ún. interkvantilis terjedelemmutatókat, amelyek két szélső kvantilis különbségével azonosak. Interkvartilis terjedelem: R0,5 = IQT = 1013 – 635 = 378 eFt A forgalom szempontjából középső 50% bolt forgalmának legkisebb és legnagyobb értéke között 378 eFt különbség van. (A középső 50% bolt forgalma egy 378 eFt széles sávon belül ingadozik.) b) Szórás (jele: σ) Az egyes értékek számtani átlagtól vett eltéréseinek ( di xi x ) négyzetes átlaga.
fi X i X fi
2
2 fi di gi X i X fi
2
g i
1
X q2 X
2
B2 K2
A szórás azt mutatja meg, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól.
5 (300 822)2 15 (500 822)2 ..... 3 (1500 822)2 108
8306672 76913,63 277 eFt 108
Az egyes boltok forgalma átlagosan 277 eFt-tal tér el az átlagos (822 eFt) forgalomtól. 3
c) Relatív szórás (jele: V) Az egyes ismérvértékek átlagosan hány százalékkal térnek el az átlagtól.
V
V
X
277 0,3369 33,7% 822
Az egyes boltok forgalma átlagosan 33,7%-kal tér el az átlagos forgalomtól. d) Átlagos különbség (Gini-mutató: G) (az egyes ismérvértékek átlagosan mennyivel térnek el egymástól) e) Átlagos (abszolút) eltérés (jele: δ) Az egyes értékek számtani átlagtól vett eltérései abszolút értékeinek számtani átlaga.
3. Az aszimmetria Az eloszlások lehetnek (amivel foglalkozunk): 1. egymóduszú eloszlás a) szimmetrikus: Mo = Me = X (Q3 – Me) = (Me – Q1) b) aszimmetrikus (ferde) - baloldali: Mo < Me < X (Q3 – Me) > (Me – Q1) - jobboldali: Mo > Me > X (Q3 – Me) < (Me – Q1) 2. többmóduszú eloszlás Az aszimmetria leggyakrabban használt mutatószámai A mutatószámok előjele az aszimmetria irányát mutatja: - bal oldali aszimmetria esetén: > 0, azaz „+” (jobbra hosszan elnyúló eloszlás) - jobb oldali aszimmetria esetén: < 0, azaz „-” (balra hosszan elnyúló eloszlás) A mutatószámok értéke az aszimmetria mértékét jelzi. a) A-mutató: A A = 0: |A| < 0,2: 0,2 – 0,6: 0,6 – 1: |A| > 1: A
X Mo
Értékének nincs korlátja.
(Pearson-féle mutatónak is nevezik.)
szimmetrikus eloszlás statisztikailag szimmetrikus gyenge, enyhe, mérsékelt aszimmetria közepes erősségű aszimmetria erős aszimmetria
822 711 0,4007 0,4 277
(másik Pearson-féle mutató: P
3 x Me
)
A boltok forgalom szerinti eloszlása enyhe bal oldali aszimmetriát mutat. b) F-mutató: Az alsó és felső kvartilis mediántól való eltérésének egymáshoz viszonyított nagyságán alapul. Bal oldali aszimmetria esetén a medián az alsó (Q1), jobb oldali aszimmetria esetén a felső (Q3) kvartilishez esik közelebb. 0 0,5 1 Q3 Me Me Q1 0≤|F|≤1 gyenge közepes erős F0 ,25 Q3 Me Me Q1 F
1013 770 770 635 243 135 108 0,2857.. 0,29 1013 770 770 635 243 135 378
Eszerint a mutató szerint is enyhe bal oldali aszimmetriát mutat a boltok forgalom szerinti eloszlása. Az F-mutatót nemcsak a kvartilisek, hanem a többi kvantilis alapján is számíthatjuk. Az F-mutató – szemben az A-val – többmóduszú eloszlásoknál is használható. Összehasonlításkor mindig ugyanazt a mérőszámot (vagy A vagy F) kell használni! 4
4. Koncentráció (K) elemzése: Azt vizsgáljuk, hogy az értékösszeg mennyire koncentrálódik a sokaság bizonyos egységeire. a) Koncentrációs tábla készítésével: a relatív gyakoriságok (gi) és a relatív értékösszegek (zi) összehasonlításával. (ld. mintapélda táblázata) Az első három osztályközben a relatív gyakoriságok nagyobbak mint a relatív értékösszegek, a max. 800 eFt forgalmú boltok aránya 55,5%, de az összes forgalomnak csak a 41,6%-át bonyolítják le, tehát van koncentráció, bár nem nagy. (A két arány nem tér el jelentősen egymástól.) b) LORENZ-görbe készítésével: A Lorenz-görbe egy egységnyi oldalú négyzetben elhelyezett vonaldiagram, mely a kumulált relatív gyakoriságok (gi’) függvényében ábrázolja a kumulált relatív értékösszegeket (zi’). zi’ 100,0% 94,9%
81,7% koncentrációs terület 61,9%
koncentrációs görbe 41,6%
10,1% 1,7% 4,6%
18,5%
55,5%
74,0%
gi’ 88,8% 100,0%
A boltok forgalmának koncentrációja gyenge (kicsi) a Lorenz-görbe alapján. c) Egyéb (koncentrációs együttható) Nem egyenlő hosszúságú osztályközök esetén, az osztályköz hosszak és a gyakoriságok átszámítása Móduszhoz: h 200 200 200
Forgalom, eFt 200 – 400 401 – 600 601 – 800
Boltok száma (fi) 5 15 40
400
801 – 1200
20
600
1201 – 1800
10
200
1801 – 2000 Összesen
5 95
k1 40 15 25 k 2 40 10 30
húj 200 200 200 200 200 200 200 200 200 --
Azonos hosszúságú osztályközre eső (új) gyakoriság (fi új) 5,0 15,0 40,0 200/400 × 20 = 10,0 10,0 200/600 × 10 ~ 3,3 3,3 3,4 5,0 95,0
Mo 600
Ha a móduszhoz nem kell, nem számítjuk ki ezeket!
25 200 691 eFt a boltok tipikus forgalma 25 30
5
Gyakorló feladatok mennyiségi sor elemzésére: M1. (Pt. 24/37. alapján) Egy szállítási vállalkozásnál az autók futásteljesítmény szerinti eloszlása:
…… …… …… …… ……
Futásteljesítmény ezer km – 25,0 25,1 – 35,0 35,1 – 45,0 45,1 – 55,0 55,1 – Összesen
…… …… …… …… ……
Autók száma db 3 5 9 6 4 27
…… …… …… …… ……
Feladat: a) Számítsa ki és értékelje az átlagot, a szórást és a relatív szórást! b) Becsülje meg a tipikus futásteljesítményt! c) Vizsgálja az autók futásteljesítmény szerint eloszlását az aszimmetria F-mutatójával! (Minden kiszámított mutatószámot értékeljen!) M2. (Pt. 25/41. alapján) Egy kft. alkalmazottainak szakmai gyakorlat szerinti megoszlása:
…… …… …… ……
Szakmai gyakorlat év 0– 1 1– 5 5 – 10 10 – 20 Összesen
…… …… …… ……
Létszám fő 30 80 50 100 260
…… …… …… ……
…… …… …… ……
…… …… …… ……
Feladat: a) Számítsa ki és értékelje az átlagot, a szórást, a relatív szórást, a móduszt és a mediánt! b) Értékelje az alkalmazottak szakmai gyakorlat szerint eloszlását az aszimmetria A-mutatója alapján! M3. (Pt. 25/43. alapján) A budapesti szállodák szobaszám szerinti megoszlása 1990. jan. 1-jén:
…… …… …… …… ……
Szobák száma, szoba 0 – 50 51 – 100 101 – 200 201 – 400 400 felett Összesen
…… …… …… …… ……
Szállodák száma db 10 15 12 17 1 55
…… …… …… …… ……
…… …… …… …… ……
…… …… …… …… ……
Feladat: a) Számítsa ki a relatív szórást! Minden kiszámított mutatószámot értékeljen szövegesen! b) Becsülje meg a tipikus szobaszámot! c) Számítsa ki az aszimmetria F-mutatóját, ha ismert, hogy a szállodák 25%-ában 63 szobánál kevesebb van! Minden kiszámított mutatószámot értékeljen szövegesen! M4. Egy felmérés alapján vizsgálták a személyi tulajdonban lévő gépkocsik évi futásteljesítményét. A vizsgált gépkocsik megoszlása:
…… …… …… …… ……
Megtett út ezer km – 5,0 5,1 – 10,0 10,1 – 15,0 15,1 – 20,0 20,1 – 30,0 Összesen
…… …… …… …… ……
Gépkocsik száma db 175 201 204 203 217 1000
…… …… …… …… ……
…… …… …… …… ……
…… …… …… …… ……
Feladat:a) Értékelje a gépkocsik megtett út szerint eloszlását az aszimmetria A-mutatója alapján! Minden kiszámított mutatószámot értékeljen szövegesen! b) Számítsa ki és értékelje az alsó és a felső kvartilist! 6
Statisztikai ismérvek kapcsolatának vizsgálata Tankönyv I.: 124-160. oldal
Feladatok: Példatár I.: 126-154. feladata
Az ismérvek közötti kapcsolat lehet: a) nincs kapcsolat, tehát függetlenek az ismérvek b) sztochasztikus c) függvényszerű A sztochasztikus kapcsolat típusai a vizsgálatba bevont ismérvek fajtája szerint: 1. asszociáció: minőségi /területi és minőségi /területi ismérvek közötti kapcsolat vizsgálatával foglalkozik. Mutatói: Yule (Y), Cramer (C), Csuprov (T) 2. vegyes kapcsolat: minőségi/terület (mint OK) és mennyiségi ismérvek (mint OKOZAT) közötti kapcsolat vizsgálata. Mutatói: Szórásnégyzet-hányados (H2) %, Szóráshányados (H) 3. korreláció: mennyiségi és mennyiségi ismérvek közötti kapcsolat vizsgálata (ld. Stat. 2.) Mutatói: determinációs hányados (H2(Y/X)), korrelációs hányados (HY/X) kovariancia C (K), lineáris korrelációs együttható (r) I. ASSZOCIÁCIÓS kapcsolat Mutatói: - Yule (alternatív ismérvek esetén alkalmazható) - Cramer (térbeli és időbeli összehasonlításra is alkalmazható) (ezzel foglalkozunk) - Csuprov (alkalmazása korlátozott) (kiszámítását nem kérjük) 1. Alternatív ismérvek (2×2 ismérvváltozat) esetén: Yule-mutató Példa: Egy vállalkozás dolgozóinak megoszlása nemek (A ismérv) és beosztás (B ismérv) szerint: ismérvváltozat B1 B2 Megnevezés Vezető Beosztott Összesen A1 Férfi 36 = f11 148 = f12 184 A2 Nő 26 = f21 490 = f22 516 Összesen 62 638 700 Feladat: Vizsgálja, hogy milyen szoros a kapcsolat az ismérvek között! A tábla belső adatai az együttes gyakoriságok: fij , ahol i = 1,2 és j = 1,2 Ha nincs kapcsolat, akkor
f11 f 21 , azaz f11∙f22 – f12∙f21 = 0, ha van kapcsolat, akkor f11∙f22 – f12∙f21 0 f12 f 22
A Yule-féle asszociációs együttható: Y
f 11 f 22 f 12 f 21 f 11 f 22 f 12 f 21
–1 Y 1 0 Y 1
Y értéke minél közelebb van a 0-hoz, a kapcsolat annál lazább, gyengébb és minél közelebb van az 1-hez, annál szorosabb, erősebb. Ha a kapcsolat olyan, hogy az A1 tulajdonsággal inkább B1 tulajdonság és az A2-vel inkább B2 jár együtt, az Y értéke "+" lesz, ellenkező esetben "–" lesz. Pl: „+”: A vezetők inkább férfiak, a beosztottak pedig inkább nők. A példában: Y
36 490 148 26 0,64 36 490 148 26
A nem és a beosztás között közepes erősségű kapcsolat van. 7
2. Nem alternatív ismérvek esetén: Cramer-, Csuprov-mutató Példa: Egy vállalkozás dolgozóinak megoszlása beosztás és iskolai végzettség szerint: Iskolai végzettség Megnevezés Felsőfokú Középfokú Alapfokú Összesen fi1 fi1* fi2 fi2* fi3 fi3* Peremgyakoriság: Vezető f1j 50 ….. 12 ….. 0 ….. 62 = f1• fi• i = 1,.., s (sorok száma) Beosztott f2j 32 ….. 420 ….. 186 ….. 638 = f2• fj• j = 1,.., t (oszlopok sz.) Összesen 82 = f•1 432 = f•2 186 = f•3 700 = N (n) Feladat: Vizsgálja, hogy van-e kapcsolat és ha igen, milyen szoros, az ismérvek között! Például, ha Vm
f11 50 f 82 0,806 Vm 1 0,117 van kapcsolat a két ismérv között. f1 62 N 700
Alapgondolat: a függetlenség feltételezésével számítunk gyakoriságokat (fij) a következő képlettel és mérjük az ettől való "távolságot", eltérést. f i f j f ij Ha az ismérvek függetlenek, akkor f ij f ij minden esetben. N A függetlenség feltételezésével számított gyakoriságok (fij*) az előző tábla adataiból: Megnevezés Vezető Beosztott
Iskolai végzettség Középfokú
Felsőfokú 62 82 7 ,3 7 700 638 82 74,7 75 700
62 432 38,3 38 700 638 432 393,7 394 700
62 186 16,4 17 700 638 186 169,6 169 700
82
432
186
Összesen
Összesen
Alapfokú !!
62
!!
638 700
Minél jobban eltérnek fij* értékek a tényleges fij értékektől, annál kisebb a függetlenség, azaz annál szorosabb a kapcsolat. 2 s t ( f ij f ij ) 2 , ahol s, t: sorok, oszlopok száma i 1 j 1 f ij A példában:
2
50 72 32 752 12 382 420 3942 0 172 186 1692 7
75
38
394
17
169
327,011 327,0
Függvényszerű kapcsolat csak s = t esetén lehet, ekkor χ2 = N(s–1), és ez a 2 maximális értéke. Ha s t, akkor 0 2 N (s 1), és
0 2 N (t 1), ha s t.
Cramer-féle asszociációs együttható (C) számítható: 1. közvetlenül: 2 értékét a lehetséges maximális 2-hez viszonyítva: C
2 N ( s 1)
, ha s t
(vagy s helyett t, ha s > t)
0C1
(Ezért „s” mindig legyen a kevesebb a sorok és oszlopok száma közül.) 0-hoz közeli eredmény laza kapcsolatot, 1-hez közeli pedig erős, szoros kapcsolatot jelez. A példában: C
327 0,4671 0,683 0,68 700 2 1
A beosztás és az iskolai végzettség között közepes erősségű kapcsolat van. 2. közvetve: a Csuprov mutató (T) korrekciójával 8
II. VEGYES KAPCSOLAT Egy vállalkozás dolgozóinak keresetadatai iskolai végzettség szerint a vizsgált időszakban: Keresetek Iskolai Létszám, fő átlaga, eFt/fő x j szórása, eFt/fő σj végzettség Nj (=nj) (fi) Ismérvváltozatok Felsőfokú 165 = x1 82 = N1 = n1 44 = σ1 száma: 85 = x 2 Középfokú 432 = N2 = n2 20 = σ2 M=3 55 = x3 Alapfokú 186 = N3 = n3 8 = σ3 Együtt 700 = N (n) X 86,4 Feladat: Milyen szoros a kapcsolat a két ismérv között? Mennyiben határozza meg az iskolai végzettség a keresetek eltéréseit?
…….
Ha függetlenek az ismérvek, akkor az x j -k egyenlőek, tehát x j X (j-edik részátlag = főátlag) minden j-re. (j = 1, .., M)
De: a részátlagok egyenlőségéből nem következik a függetlenség!!
Bij xij x j :
egy részsokaság egyedi értékei és részátlaga közötti eltérés
BELSŐ ELTÉRÉS
K j xj X :
a részátlagok és a főátlag eltérése
KÜLSŐ ELTÉRÉS
d ij xij X :
egyedi értékek és a főátlag különbsége
TELJES ELTÉRÉS
Belső eltérés négyzetösszeg: SSB xij x j
2
N j 2j
Külső eltérés négyzetösszeg: SSK N j x j X
Teljes eltérés négyzetösszeg: SS xij X
2
2
SSB SSK
Belső szórásnégyzet: B2 SSB N Külső szórásnégyzet: K2 SSK N Teljes szórásnégyzet: 2 SS N B2 K2
M
2 N j j
SS B 82 44 2 432 20 2 186 8 2 490,65 ( B = 22,15 eFt) N N 700 (Az egyes dolgozók keresetei átlagosan 22,15 eFt-tal térnek el az iskolai végzettség szerinti csoportjuk átlagkeresetétől.) Külső szórásnégyzet:
B2
Belső szórásnégyzet:
M
N j xj X
j 1
2
SS K 82(165 86,4) 2 432(85 86,4) 2 186(55 86,4) 2 986,9 ( K = 31,4 eFt) N N 700 (Az iskolai végzettség szerinti átlagkeresetek átlagosan 31,4 eFt-tal térnek el a váll-i átlagkeresettől.)
K2
j 1
Teljes szórásnégyzet: (közvetlenül ritkán számítjuk) Közvetve: σ 2 σ B2 σ K2 A példában: σ2 = 490,65 + 986,9 = 1477,55 (→ = 38,4 eFt) (Az egyes dolgozók keresetei átlagosan 38,4 eFt-tal térnek el a vállalkozási szintű átlagkeresettől.)
K2 H2 A vegyes kapcsolat szorosságának mérőszáma a szóráshányados (H): H 2 A példában:
H
0≤H≤1
986,9 0,668 0,817 1477,55
Elég szoros kapcsolat van az iskolai végzettség és a keresetek nagysága között.
K2 0 ≤ H2 ≤ 1 Az eredményt %-ban fejezzük ki. 2 Ennyi %-ban határozza meg a minőségi ismérv szerinti hovatartozás a mennyiségi ismérv eltéréseit.
Szórásnégyzet-hányados: H 2
A példában:
H 2 0,6679 66,8 %
Az iskolai végzettség 66,8%-ban magyarázza a keresetek szóródását (a keresetek eltéréseit), a többi (33,2%) egyéb (nem vizsgált) tényezők és a véletlen hatása. 9
Gyakorló feladatok a sztochasztikus kapcsolatok vizsgálatára Sz1. Egy felmérés során vizsgálták a település típusa szerint a háztartások élvezeti cikkekre fordított kiadását. Település Háztartások 1 főre jutó évi kiadás típusa száma átlaga (ezer Ft) szórása (ezer Ft) Főváros 14 23,4 3,6 Városok 30 21,0 3,2 Községek 26 21,6 3,4 Együtt 70 …… …. Feladat: a) Állapítsa meg, milyen szoros a kapcsolat a két ismérv között! b) Állapítsa meg, hány %-ban magyarázzák egyéb tényezők az élvezeti cikkekre fordított kiadás szóródását! Sz2. Egy felmérés során a családnagyság és a lakások alapterülete közötti kapcsolatot vizsgálták. Családok A lakások alapterületének (m2) Családnagyság megoszlása, % átlaga szórása Kis létszámú 35,0 50,0 4,0 Közepes 50,0 57,0 4,0 Nagycsalád 15,0 60,0 4,0 Együtt 100,0 …… …. Feladat: Állapítsa meg, hány %-ban magyarázza a lakások alapterületének szóródását a családnagyság! Sz3. Egy felmérés során vizsgálták egy iparágban foglalkoztatott fizikai dolgozók keresetét szakképzettség szerint. Fizikaiak Nettó keresetek Szakképzettség száma (fő) átlaga (ezer Ft) szórása (ezer Ft) Szakmunkás 60 55,2 3,8 Betanított munkás 40 50,0 3,2 Segédmunkás 20 46,0 4,2 Együtt 120 …… …. Feladat: Vizsgálja meg, milyen szoros a kapcsolat a két ismérv között! Sz4. Három üdülőkörzet megfigyelésbe bevont szállodáiban az 1 éjszakára jutó szállásdíj: Üdülőkörzet Vízparti Hegyvidéki Egyéb Együtt
Szállodák száma 10 10 10 30
Átlagos szállásdíj (ezer Ft) 2,9 3,8 3,5 …
Az egyes szállodák 1 vendégéjszakára jutó szállásdíja átlagosan 0,5 ezer Ft-tal tér el az átlagos szállásdíjtól. Feladat: a) Állapítsa meg, milyen szoros a kapcsolat az üdülőkörzet jellege és a szállásdíj nagysága között! b) Állapítsa meg, hány %-ban magyarázza az üdülőkörzet jellege a szállásdíj szóródását! Sz5. Egy budapesti vállalat dolgozói körében vizsgálták a közlekedésre fordított napi időt. Állandó Dolgozók A közlekedésre fordított idő lakóhely megoszlása, % napi átlaga, perc Budapest 60,0 60 Vidék 40,0 80 Együtt 100,0 … A vállalat egészénél az egyes dolgozók közlekedésre fordított ideje átlagosan 40%-kal tér el az átlagtól. Feladat: Vizsgálja a kapcsolatot a két ismérv között a tanult mutatószámokkal! 10
Sz6. A lakott lakások (ezer db) megoszlása lakásnagyság (szobaszám) és településtípus szerint: Településtípus Lakásnagyság Összesen Budapest Egyéb település Kis lakás (1 szobás) 100 700 800 Közepes lakás (2 sz.) 350 1650 2000 Nagy lakás (3 v. több sz.) 550 650 1200 Összesen 1000 3000 4000 Feladat: Elemezze az ismérvek közötti kapcsolat szorosságát! Sz7. A vállalkozások számának megoszlása nemzetgazdálkodási ágak és kiemelt gazdálkodási formák szerint (adatok ezerben). Kiemelt gazdálkodási formák Nemzetgazd. ág Összesen Betéti társaság Egyéni vállalkozás Mg., ipar, ép.ipar 60 160 220 Kereskedelem 30 270 300 Egyéb 110 370 480 Összesen 200 800 1000 Feladat: Elemezze az ismérvek közötti kapcsolat szorosságát! Sz8. Egy üzem munkásainak megoszlása nemek és szakképzettség szerint (fő): Szakképzettség Férfi Nő Összesen Szakmunkás 60 40 100 Betanított munkás 20 30 50 Segédmunkás 10 40 50 Összesen 90 110 200 Feladat: Milyen szoros a kapcsolat a két ismérv között? Sz9. Az elmúlt év során az egyik intézményből a foglalkoztatottak közül kétszázan mentek el önkéntesen. A saját kezdeményezésből távozók csoportosítása nemhez való tartozás és felmondási ok szerint (fő): Ok Nyugdíjba menetel Jobb munkahelyet Alkalmatlannak Összesen Nem talált tartotta magát Férfi 60 70 10 140 Nő 40 10 10 60 Összesen 100 80 20 200 Feladat: Vizsgálja meg, hogy milyen szoros a kapcsolat a nemhez való tartozás és a felmondási ok ismérvek között! Sz10. Egy nagyüzemnél a szakmunkások körében a nemek és a keresetek közötti kapcsolatot vizsgálták. Nemek Létszám Átlagkereset, Keresetek szórása fő eFt/fő eFt % Férfi 25 70,0 ……. 20,0 Nő 13 60,0 10 .. Együtt 38 …… .. .. Feladat: Milyen szoros a kapcsolat a két ismérv között? Hány %-ban magyarázza a nem a keresetek szóródását? Sz11. A nyugdíjasokról az alábbi adatokat ismerjük: Nyugdíjak Nyugdíjasok Nem megoszlása, % átlaga (eFt) szórása (eFt) Férfi 60,0 85,0 30,0 Nő 40,0 70,0 20,0 Együtt 100,0 …… ….. Feladat: Értékelje, milyen szoros a kapcsolat a nyugdíjasok neme és a nyugdíj nagysága között! 11