Dr. Szőke Szilvia – Dr. Balogh Péter: Nemparaméteres eljárások
Bevezetés A magas mérési szintű változók adataiból számolhatunk átlagot, szórást. Fontos módszerek alapulnak ezeknek a „származtatott paramétereknek” a matematikai tulajdonságain; ezeket a módszereket paraméteres módszereknek nevezik. Könnyű belátni, hogy például a nominális skálán mért adatok esetében nem helyénvaló átlagot számítani, és – következésképpen – nem alkalmazhatók a paraméteres statisztikai módszerek. Például, ha egy mintábankét régióból származó adatok vannak, akkor a mintára vonatkozóan nem lehet átlagos régióról beszélni. A nominális és az ordinális skálán mért adatokra számos módszer alkalmazható, melyek egyik közös tulajdonsága, hogy nem szükséges az, hogy az adatokból átlag, vagy szórás számolható legyen. Általában elmondható, hogy ezek a módszerek nem az ismert nevezetes eloszlás, a normális eloszlás paramétereinek tulajdonságain alapulnak, ezeket nemparaméteres módszereknek szokták nevezni. Vagyis ha az eloszlás jellege ismert, és a nullhipotézisünk az eloszlás valamely paraméterére vonatkozik, paraméteres próbáról, ellenkező esetben nemparaméteres próbáról beszélünk. A nemparaméteres módszerek az alábbi esetek közül valamelyikre vonatkoznak. 1. Nominális skálán mért adatokra. 2. Ordinális (rendezett) skálán mért adatokra. 3. Intervallum skálán mért adatokra anélkül, hogy azt kellene feltételeznünk, hogy az adatok azonos eloszlású sokaságból származnak. Ebben az esetben az adatokat rangtranszformációnak vetjük alá. Ez azt jelenti, hogy az intervallum skálán tett megfigyeléseket az ordinális skálán értékeljük ki. Hogyan válasszunk a paraméteres és nemparaméteres módszerek között ? A nemparaméteres módszerek előnyei: Kevesebb feltételük van, így hibás alkalmazásuk esélye kisebb. Nominális és ordinális változókon is használhatók. Próbastatisztikáik számítása sokszor egyszerűbb. Skálaérzéketlenek, azaz az adatok transzformálása nem befolyásolja a tesztek eredményét. Kevésbé érzékenyek a kiugró adatokra. Nem csak az átlag különbségeit tudjuk vizsgálni, hanem az eloszlás más tulajdonságának (például ferdeség fellépése kezelés hatására) változását is. A nemparaméteres módszerek hátrányai: Erejük kisebb mint a paraméteres megfelelőiknek (azok feltételeinek teljesülése esetén) de ez sokszor nem jelentős. Sok parametrikus tesztnek nincs meg a nemparametrikus megfelelője. A paraméteres módszerek előnyei. Ha feltételeik teljesülnek, a paraméteres próbák nagyobb erejűek, mint a helyettük alkalmazható nemparaméteres próbák. Ha az adatok normális eloszlásúak, akkor ettől az információtól való eltekintés jelentős információ veszteséggel jár. Ha nincs rá okunk, ne mondjunk le a paraméteres próbák előnyeiről. 1
A paraméteres próbák esetében a nullhipotézisek gyakran többet mondanak, mint a nemparaméteres próbák nullhipotézisei. A paraméteres próbák hátrányai: Szűkebb az alkalmazási terület, csak bizonyos eloszlású sokaságok esetén alkalmazhatók. Választás az alkalmazható nemparaméteres próbák között. Ha csak azt feltételezzük, hogy két csoport között van-e bármilyen különbség, akkor bármelyik próbát alkalmazhatjuk. Tudnunk kell azonban, hogy a nemparaméteres próbák, ellentétben a t-próbával, nem a két csoport átlagának a különbségét vizsgálják, hanem a csoportok más tulajdonságait, mégpedig próbánként különböző tulajdonságait. Így aztán a szignifikáns különbség nem biztosan jelenti azt, hogy a két csoport átlaga (várható értéke) is különbözik, mert lehet, hogy a két vizsgált populáció eloszlásának valamilyen más tulajdonsága különbözik (medián, eloszlás jellege). Eloszlásokra vonatkozó próbák (χ2- próba) A sokaságok százalékos megoszlására vagy a valószínűségi változó eloszlására vonatkozó hipotézis ellenőrzésére szolgál. Diszkrét és folytonos valószínűségi változó eloszlásának vizsgálatára egyaránt alkalmas oly módon, hogy osztályokat képezünk, és az osztálygyakoriságokat, vagy a relatív osztálygyakoriságokat, ill. a megfelelő valószínűségeket vizsgáljuk. Feltételek (fi : az i-edik osztály megfigyelt gyakorisága): Nagy minta (n ≥ 50). Valamennyi megfigyelt osztályban az osztálygyakoriság fi ≥ 1. Maximum az osztályok 20%-ában lehet fi ≤ 5. Illeszkedésvizsgálat Tiszta illeszkedésvizsgálat: a minta eloszlását hasonlítjuk egy elméleti eloszláshoz. Példa: Egy dobókocka szabályosságát szeretnénk ellenőrizni. Minden dobás egyforma (1/6) valószínűséggel következhet be. H0: a kocka szabályos H1: a kocka nem szabályos 60 dobás eredménye: Érték 1 2 3 4 5 6
Megfigyelt gyakoriság 8 6 16 17 9 4
Me.: kocka dobások száma Várt gyakoriság 10 10 10 10 10 10
( f i − f i* ) 2 , i = 1, … , n ahol χ =∑ f i* fi : az i-edik osztály megfigyelt gyakorisága fi * : az i-edik osztály várt gyakorisága n : a minta elemszáma 2 2 ( f − f * ) 2 (8 − 10) (6 − 10) (4 − 10)2 = 14,2 = + + ... + Behelyettesítve a képletbe: χ 2 = ∑ i * i 10 10 10 fi . 2
2
Ha a megfigyelt gyakoriságok messze vannak a várttól, akkor ez az összeg nagy lesz, ha azonban közel, akkor kicsi. Így χ2 megad egy értéket a megfigyelt és a várt gyakoriságok távolságának mérésére. Természetesen a dobások véletlenszerűsége miatt még szabályos kocka esetén sem fogunk pontosan χ2 = 0-t kapni. A χ2 értékre meg kell engednünk egy bizonyos intervallumot, amelybe ha beleesik, akkor még elég nagy a valószínűsége annak, hogy a kocka szabályos. Úgy is lehet fogalmazni: mekkora a valószínűsége annak, hogy szabályos kocka esetén ilyen eredményt kapjunk. Ehhez be kell vezetni a χ2 eloszlásfüggvényt, melynél egy görbeseregről van szó. Azt, hogy a görbeseregből melyiket kell kiválasztanunk, a szabadság fok mondja meg. A szabadság fok illeszkedésvizsgálat esetén egyenlő az osztályok száma mínusz 1-gyel, esetünkben k - 1 = 6 - 1 = 5. Ezek után vizsgáljuk meg a χ2 -eloszlás táblázatát, és keressük ki a számolt χ2 értékhez tartozó valószínűséget. A táblázatokban általában csak bizonyos valószínűségekhez tartozó χ2 értékeket adnak meg. Ha 5%-os szignifikancia szinttel dolgozunk, akkor azt mondjuk, hogy akkor utasítjuk el a kocka szabályosságára vonatkozó hipotézisünket, ha szabályos kockát feltételezve kisebb, mint 5% a valószínűsége annak, hogy olyan eredményt kapjunk, amilyet kaptunk, akkor ki kell keresnünk a táblázatból az 5%-hoz és a megfelelő szabadság fokhoz tartozó értéket, és össze kell hasonlítani a számítottal. Ha a számított nagyobb a táblázatbeli értéknél, akkor elutasítjuk hipotézisünket. Példánkban χ2számított = 14,2 χ2 táblázatbeli = 11,1; tehát a kockánkat nem tekinthetjük szabályosnak. Becsléses illeszkedésvizsgálat: csak az eloszlás típusa ismert (normális, exponenciális…), paramétereit a minta alapján becsüljük, majd ezekre vonatkozóan végzünk illeszkedésvizsgálatot. ( f i − f i* ) 2 ( f i − npi ) 2 2 χ =∑ , ahol =∑ f i* npi fi : az i-edik osztály megfigyelt gyakorisága, fi * : az i-edik osztály várt gyakorisága, n : a minta elemszáma, pi : az i-edik osztály várt relatív gyakorisága. Feltétel: a várható érték gyakorisága minden osztályban érje el legalább az 5 értéket (fi * > 5) és a minta kellően nagy legyen (n > 30). Szabadság fok: tiszta illeszkedésvizsgálatnál szf = k-1, becsléses illeszkedésvizsgálatnál szf = k-1-b, ahol a k : a csoportosítás során képezett osztályok száma, b : a mintából becsült paraméterek száma. Példa: Egy élelmiszer faogyasztásával kapcsolatos felmérés során 60 személy szokását vizsgálták. Az adatokat a következő táblázatban tüntettük fel. Átlagos értékként 1037 dkg/időszak, szórásként 116,3 dkg volt becsülhető. Feltételezhető, hogy normális eloszlású az adott időszakra eső fogyasztás ebből az élelmiszerből. A feladat ennek ellenőrzése.
3
Időszakra eső fogyasztás (dkg) xia - xif
Osztályközbe eső emberek száma (fő) fi
751-850 851-950 951-1050 1051-1150 1151-1250 1251-1350 Összesen:
7 10 15 12 9 7 60
Megoldás: Időszakra eső fogyasztás (dkg) xia - xif 751-850 851-950 951-1050 1051-1150 1151-1250 1251-1350 Összesen
Osztályközbe eső emberek száma (fő) fi 7 10 15 12 9 7 60
Transzformált osztályköz határ Alsó Felső xia’ xif’ -2,47 -1,6 -0,74 0,12 0,98 1,84
-1,61 -0,75 0,11 0,97 1,83 2,69
pi
0,0537 0,1729 0,3172 0,2902 0,1324 0,0336 1,0000
fi* = npi
3 11 19 17 8 2 60
fi - fi*
4 -1 -4 -5 1 5 0
(f
i
− f i* f i*
)
2
5,33 0,09 0,84 1,47 0,13 12,5 20,36
A várható gyakoriságok kiszámolásához először az egyes osztályközökbe esés valószínűségét kell meghatározni. Ehhez a mintaeloszlás osztályköz határait standard normális eloszlássá kell transzformálni. (Várható érték = 0, szórás = 1). Becsléses illeszkedésvizsgálat esetén a várható értéket a mintaátlaggal (x) , a szórást a mintabeli szórással (s) becsülve, az új osztályköz határokat a x −x . következő módon kell kiszámítani: xi ' = i s x2 f − x 950 − 1037 = = −0,75 . Ezek után az A második osztályköz felső határa esetében: x2 f ' = s 116,3 egyes intervallumokba esés valószínűségét (pi) a standard normális eloszlás táblázatából lehet meghatározni. A χ2 táblázatbeli érték α = 5%-nál és 6-1-2 =3 szabadság foknál 7,815. Megállapítható, hogy a számított χ2 érték (20,36) nagyobb, mint a kritikus érték, ezért a nullhipotézist elvetjük, a minta szignifikánsan eltér a normális eloszlástól. Homogenitásvizsgálat Két független minta eloszlásfüggvényének összehasonlítására szolgál. Kérdés: Származhat-e a két független minta azonos eloszlásfüggvényű sokaságból? A próbastatisztika kiszámolásához a megfigyelési egységeket mindkét – n1 ill. n2 elemű minta esetén – azonos osztályokba soroljuk (k osztályt képzünk), melyekre igazak az alábbi összefüggések:
4
∑f
1i
= n1 ,
i
∑f
2i
= n2
i
i = 1, … , k. A próbastatisztika értékének kiszámolása: 2
⎛ 1 ⎞⎛ f1i f 2i ⎞ ⎟⎟⎜⎜ − ⎟ , szabadság fok: k-1, ahol χ = n1n2 ∑ ⎜⎜ n2 ⎟⎠ i ⎝ f1i + f 2 i ⎠⎝ n1 i = 1, … , k. a minta elemszáma osztályonkénti gyakoriságok mintánként az osztályok száma. 2
n1, n2 : f1i, f2i : k:
A két sokaság azonosnak tekinthető, ha χ2számított ≤ χ2 táblázatbeli. Példa: Két vállalkozás 4 féle terméket állít elő. Az első vállalkozásnál 345db terméket soroltak be, a másodiknál pedig 640 darabot. Az alábbi táblázat mutatja az egyes terméktípusok gyakoriságát. Azonos termékprofilúnak tekinthető-e a két vállalkozás? Termékek A B C D Összesen
Me.: darab II. vállalat (f2i) 167 248 156 69 640
I. vállalat (f1i) 76 162 72 35 345
Megoldás: Termékek A B C D Összesen
I. vállalat (f1i) 76 162 72 35 345
II. vállalat (f2i) 167 248 156 69 640
Me.: darab χ részösszeg 1,5013 3,6269 1,1900 0,0860 6,4042 2
2
⎛ 1 ⎞⎛ f1i f 2i ⎞ ⎟⎟⎜⎜ − ⎟ = 6,4042 , a szabadság fok 4-1 = 3, a kritikus érték (α = 0,05): χ = n1n2 ∑ ⎜⎜ n2 ⎟⎠ i ⎝ f1i + f 2 i ⎠⎝ n1 χ2 táblázatbeli = 7,815. Ez alapján megállapítható, hogy a két vállalat azonosnak termékprofilúnak tekinthető. 2
Függetlenség vizsgálat Az alapsokaság két ismérv szerinti csoportosításakor s × t típusú kontingencia táblázatot kapunk. (s db csoportot képeztünk az első, t db csoportot pedig a második szempont szerint.) Vizsgálhatjuk, hogy az első szempont szerinti eloszlás független-e a második szempont szerinti eloszlástól (Szűcs, 2002). 5
2
f ⋅f ⎞ ⎛ ⎜ f kl − k . .l ⎟ * 2 (f − f ) n ⎠ , ahol χ 2 = ∑ i * i = ∑∑ ⎝ f f ⋅ fi k. .l n fi : az i-edik osztály megfigyelt gyakorisága, fi * : az i-edik osztály várt gyakorisága, n : a minta elemszáma, fkl : az első szempont k-adik és a második szempont l-edik osztálykombinációjába tartozó egyedek elméleti relatív gyakorisága, fk. : az első szempont k-adik osztályának gyakorisága, f.l : a második szempont l-edik osztályának gyakorisága. A szabadság fok száma: szf: (s-1)(t-1).
Példa: Egy kozmetikai cég megbízásából felmérést készítettek arról, hogy a nők és a férfiak milyen típusú dezodorokat használnak. A felmérésben 200 nő és 150 férfi adatai szerepelnek. Hasonlóak vagy eltérőek a nők és a férfiak szokásai ezen a téren? (Függ-e a dezodorválasztás a nemtől?)
Nő Férfi Összesen
Spray 93 73 166
Golyós 46 39 85
Krém 61 38 99
Me.: fő Összesen 200 150 350
Megoldás: Függetlenség esetén a 350 elemű minta megoszlása az alábbiak szerint alakulna. f ⋅f Peremgyakoriságok: f i * = k . .l , ahol n fk. = k-adik sor összege k = 1, 2, f.l = l-edik oszlop összege l = 1, 2, 3, n = 350, a minta elemszáma.
Nő Férfi Összesen
χ
2 számított
3
2
= ∑∑ j =1 i =1
(f
ij
− f ij* f ij*
Spray 94,86 71,14 166
Golyós 48,57 36,43 85
Krém 56,57 42,43 99
) = (93 − 94,86) + (46 − 48,57 ) 2
2
94,86
2
48,57
Me.: fő Összesen 200 150 350
2 ( 38 − 42,43) + ... +
42,43
= 1,21
Szabadság fok száma: (s-1)(t-1) = 2·1 = 2 α = 5% esetén χ2 krit = 5,99. A próba nem szignifikáns, χ2 krit > χ2 számított. Megállapítható, hogy nincs statisztikailag igazolható különbség az eltérő nemű vásárlók dezodor választása között. Előjel-próba Közvélemény kutatásokban gyakran vizsgálják azt, hogy egy minta egyedei két lehetőség közül melyiket választják. Például két ismert márkájú hasonló termék közül melyiket kedvelik inkább. A két lehetőség közötti választás, vagy két (egymást kizáró) esemény előfordulásának valószínűsége
6
elvileg azonos jellegű probléma. Például egy adott beteg populációban a született gyermekek között a fiúk és a lányok aránya azonos-e? Mindezen vizsgálatok eredményét értékelhetjük az előjel próbával oly módon, hogy az egyik esemény előjelét pozitívnak, a másik előjelét negatívnak nevezzük, és nem engedünk meg eldöntetlen esetet. Az előjel próbának nincs elterjedt, ismert megfelelője a paraméteres próbák között. Az előjel próbával értékelhető adatok esete lényegében véve azonos a binomiális eloszlást mutató kísérletek vizsgálatával. Lehetnek olyan esetek, amikor nem lehet egyértelműen eldönteni az előjelet. Ezekben az eldöntetlen esetekben a megfigyelést nem vesszük figyelembe egyik fajta előjelek számlálása során sem. Példa: Két gyümölcs csomagolására és tárolására alkalmas módszert tesztelnek. Mindkét eljárással tíz-tíz darab egymázsás csomagot készítenek, és három hónap múlva megszámolják a romlott gyümölcsöket. Van-e különbség a két eljárás között? Az adatokat az alábbi táblázat tartalmazza. Csomagok I. módszer II. módszer
1 47 71
2 56 63
3 54 45
4 49 64
5 36 50
6 48 55
7 51 42
8 38 46
Me.: darab 9 10 61 49 53 57
Megoldás: H0 : a két eljárás között nincs különbség. H1 : a két eljárás között van különbség. Páros mintánk van, ilyenkor vehetjük a két eljárás során keletkezett romlott gyümölcsök különbségének előjelét. Csomagok I. módszer II. módszer Előjel
1 47 71 -
2 56 63 -
3 54 45 +
4 49 64 -
5 36 50 -
6 48 55 -
7 51 42 +
8 38 46 -
Me.: darab 9 10 61 49 53 57 + -
Vagyis három plusz és hét mínusz jel van. Azt várnánk, hogy ha a két eljárás között nincs különbség, akkor öt pluszt és öt mínusz jelet kapunk. Ez a probléma megegyezik azzal, hogy 10szer feldobva egy érmét 3-szor fejet és 7-szer írást kapunk. Vajon ez az érme szabályos-e? Binomiális eloszlással számolunk tovább. ⎛n⎞ P(ξ = k ) = ⎜⎜ ⎟⎟ p k ⋅ q n− k ⎝k ⎠ , 10 − k
⎛10 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎞ P(ξ = k ) = ⎜⎜ ⎟⎟ ⋅ ⎜ ⎟ ⋅ ⎜ ⎟ ⎝ k ⎠ ⎝2⎠ ⎝2⎠ k
10
⎛10 ⎞ ⎛ 1 ⎞ = ⎜⎜ ⎟⎟ ⋅ ⎜ ⎟ , ⎝ k ⎠ ⎝2⎠
10
⎛10 ⎞ ⎛ 1 ⎞ p0 = P(ξ = 0 ) = ⎜⎜ ⎟⎟ ⋅ ⎜ ⎟ = 0,000977 , ⎝ 0 ⎠ ⎝2⎠ 10 ⎛10 ⎞ ⎛ 1 ⎞ p1 = P(ξ = 1) = ⎜⎜ ⎟⎟ ⋅ ⎜ ⎟ = 0,009766 , ⎝ 1 ⎠ ⎝2⎠ 10
⎛10 ⎞ ⎛ 1 ⎞ p2 = P(ξ = 2 ) = ⎜⎜ ⎟⎟ ⋅ ⎜ ⎟ = 0,043945 , ⎝ 2 ⎠ ⎝2⎠
7
10
⎛10 ⎞ ⎛ 1 ⎞ p3 = P(ξ = 3) = ⎜⎜ ⎟⎟ ⋅ ⎜ ⎟ = 0,117188 , ⎝ 3 ⎠ ⎝2⎠ P(ξ < 2) = p0 + p1 = 0,010743 ,
P(ξ < 3) = p0 + p1 + p2 = 0,054688 .
Kétoldali próbával kell dolgoznunk, mert H1 azt állítja, hogy különbség van a módszerek között. 1 Ezért az 5%-os szignifikancia szintnél: 0,05 ⋅ = 0,025 a keresett valószínűségi szint. Mivel 2 0,010743 < 0,025 < 0,054688, akkor utasítjuk el a H0 hipotézist, ha a plusz jelek száma nulla vagy egy. Itt azonban három van, így 5%-os szignifikancia szinten nem utasíthatjuk el a H0-t, ilyen szinten nincs különbség az eljárások között. Mann-Whitney-Wilcoxon próba (más néven U próba vagy rangösszegpróba) Két egymástól független minta medián értékének összehasonlítására szolgál, ha a mintaelemek párosíthatók, tehát a kétmintás t-próba nemparaméteres megfelelője. Ordinális mérési szintű változókra is használható. A próba alkalmazhatóságának feltételei: a használt valószínűségi változók függetlenek, azonos alakú eloszlásúak legyenek, de használható folytonos és diszkrét eloszlásoknál is.
Kísérleti elrendezés: két független, véletlen minta. A próba menete a következő. Elvégezzük a rangtranszformációt, ami azt jelenti, hogy az összes adatot (a csoporthoz való tartozástól függetlenül) nagysága szerint sorba állítjuk, az adatok helyébe azok rangszámát helyettesítjük. Ha két, vagy több azonos adatot találunk, akkor azok helyébe az átlagos rangszámokat írjuk. Az így kapott rangszámokat az eredeti csoportokra szétbontjuk. Ez a transzformáció az eredeti megfigyeléseket az ordinális skálán fejezi ki. Ha a két csoport középértéke (mediánja) között nincs különbség (azaz H0 teljesül), akkor mind a két csoportban lesznek alacsony és magas rangszámú megfigyelések, és az átlagos rangszám értékek is közel azonosak lesznek. Ha H0 -t elvetjük, akkor az egyik csoportban nagy valószínűséggel nagyobb lesz az átlagos rangszám, mint a másik csoportban. Ha sok az azonos rangsorú érték, ezeket a teszt nem veszi figyelembe, és ezért ilyenkor kissé alulértékeli a szignifikancia szintet. Kétmintás t-próbát célszerű alkalmazni, ha a két sokaság, amelyekből a két független minta származik, normális eloszlású. Ha a normalitás nem áll fenn, de a két populáció eloszlása „azonos formájú” akkor e próba alkalmazása ajánlható. Ezután végezzük el a rangtranszformációt és számoljuk ki mindkét mintára a sorszámok összegét. Jelölje a két összeget R1 és R2; N1 és N2 pedig rendre a minta-elemszámokat. (N1 ≤ N2) Az R1 és R2 közötti szignifikáns különbség a két minta közötti szignifikáns különbségre utal. A teszteléshez használjuk az első mintához tartozó N ( N + 1) U = N1 N 2 + 1 1 − R1 2 statisztikát. U mintavételi eloszlása szimmetrikus, átlaga és varianciája a következő módon számolható: N N N N ( N + N 2 + 1) µ U = 1 2 σ U2 = 1 2 1 2 12 . U − µU Ha N1 és N2 is legalább 8, akkor U eloszlása közel normális lesz úgy, hogy z = 0 átlagú
σµ
és 1 varianciájú normális eloszlást követ (Murray, 1995).
8
Példa: Két tanulócsoport ugyanazt a dolgozatot írta meg. A dolgozatokra kapott pontszámok a következők. I. csoport: 18; 17; 23; 17,5; 19; 25; 16; 24. II. csoport: 12,5; 14; 20,5; 11; 15,5; 20; 13; 15; 12; 14. H0 : a két minta ugyanabból a sokaságból származik (nincs különbség a két csoport tudása között). Megoldás: Rendezzük az összes mintaértéket, és adjunk sorszámokat ezekhez az értékekhez. Egyet a legkisebbhez, tizennyolcat a legnagyobbhoz. Kiszámolva: R1 = 106, R2 = 65, N1 = 8 és N2 = 10, U = 10; µU = 40; σU =11,25; z = -2,67 Mivel a vizsgált H0 hipotézis az, hogy nincs különbség a csoportok között, kétoldali próbát kell alkalmazni. 5%-os szignifikancia szinten a döntési szabály: Elfogadjuk H0-t, ha -1,96 ≤ z ≤ 1,96. Ennek alapján elutasítjuk a H0-t, vagyis a két csoport tudása nem azonos. Kruskal-Wallis próba (H próba) (az előző általánosítása k számú mintára.) Az eljárás célja összehasonlítani 3, vagy több sokaságot, melyekből véletlen egyváltozós mintát vettünk. A H – próba az egyutas osztályozás vagy egytényezős kísérlet varianciaanalízisére ad általánosítható nemparaméteres módszert. Ez a próba különösen érzékeny a medián változásaira. A hipotézis pár: H0: A minták eloszlása nem különbözik egymástól. H1: Legalább két eloszlás különbözik egymástól. Ha elvetjük H0-t, akkor arra következtetünk, hogy a vizsgált sokaságok között vannak különbségek.
A próba alkalmazhatóságának feltételei: véletlen mintavétel, független minták és legalább ordinális skálán mérhető változó. Tegyük fel, hogy k számú mintánk van, egyenként N1, N2, … Nk mintanagyságokkal, és így az összes minta N = N1 + N2 +…+ Nk elemszámú. Az összes mintát együtt kell rangsorolni, és a rangösszegek: R1, R2, … Rk . k R2 12 H= ∑ j + 3( N + 1) N ( N + 1) j =1 N j H mintavételi eloszlása közelítőleg k-1 szabadság fokú χ2 eloszlást követ, feltéve, hogy az N1, N2, … Nk mindegyike legalább 5. Példa: Egy ipari kísérletben 4 különböző gyártósoron készítenek ugyanolyantermékeket. Minden gépsorról 5-5 mintát vesznek. Az eredmények kg/db egységben kifejezve az alábbi táblázatban olvashatók. Vizsgáljuk meg, hogy van-e szignifikáns különbség az egyes gyártósorok között? Gyártósor A típus B típus C típus D típus
Me.: kg/db Eredmények 18,4; 16,1; 19,2; 17,2; 18,6 17,5; 17,3; 15,4; 16,4; 17,9 19,3; 18,2; 19,6; 20,0; 18,9 14,0; 15,4; 16,8; 17,6; 16,9
Megoldás: N = 20 A rangok és a rangösszegek:
9
A típus B típus C típus D típus
14 10 18 1
4 9 13 2,5
Rangok 17 2,5 19 6
8 5 20 11
15 12 16 7
Σ 58 38,5 86 27,5
k R2 12 H= ∑ j − 3( N + 1) = 12,28 N ( N + 1) j =1 N j
k-1 = 3 szabadság foknál 5%-os szignifikancia szinten χ2 krit = 7,81. Mivel 7,81 < 12,28 elvetjük a nullhipotézist, azaz van különbség a gyártósorokon előállított termékek tömege között.
10
Esetelemzések az SPSS használatával
1. Egy felmérés során azt vizsgálták, hogy a háziasszonyok körében a vásárolt mosószer típusa függ-e az életkortól. A mososzer.sav fileban 300 megkérdezett háziasszony életkora és a vásárolt mosószer típusa található. A használt kódolás: a nulla jelenti a régi típusú, az egy pedig az új fajta mosószert. Igazolható-e, hogy a fiatalabb korosztály szívesebben próbál ki új termékéket, míg az idősebbek ragaszkodnak régi kedvenc márkájukhoz? Megoldás: Első lépésben vizsgáljuk meg a sokaságot néhány leíró statisztikai mutatóval. Az ANALYZE / DESCRIPTIVE STATISTICS / DESCRIPTIVES útvonalon elérhető párbeszéddobozban a kor (életkor) változót helyezzük el a VARIABLE(S) részhez.
Válaszul az OK gomb lenyomása után az alábbi táblázatot kapjuk: Descriptive Statistics életkor Valid N (listwise)
N 300 300
Minimum 26.00
Maximum 55.00
Mean Std. Deviation 41.4033 8.61014
Látható, hogy a 300 megkérdezettből a legfiatalabb vásárló 25 éves, a legidősebb 55 éves volt. A kezelhetőség érdekében érdemes életkor helyett életkor kategóriákkal dolgozni. Az életkorok kategóriákba osztását több módon is elvégezhetjük. A TRANSFORM / RECODE / INTO DIFFERENT VARIABLES… menüben a kor változót kell a NUMERIC VARIABLE −> OUTPUT VARIABLES részbe áttenni. Ezután kitölthetők az OUTPUT VARIABLE mező NAME és LABEL cellái. A CHANGE gomb megnyomásával definiálhatjuk az új változónkat, ahová az életkorok kategóriái kerülnek majd. Ezután áttérhetünk az érdemi részre az OLD AND NEW VALUES gomb megnyomásával.
11
A párbeszédablak bal oldalán állíthatjuk be a régi értékeket. A rádiógombok közül az első (VALUE) segítségével egy-egy értékhez tudunk újat rendelni. A következő kettő (SYSTEM–MISSING és a SYSTEM– OR USER MISSING) a hiányzó adatok kezelésére szolgál. A RANGE résznél beállítható az alsó és a felső intervallum is, amibe eső értékek helyett szeretnénk valami mást használni. A LOWEST THROUGH jelentése: a legalacsonyabbtól, A THROUGH HIGHEST pedig a legmagasabb értékig. Az ALL OTHER VALUES bejelölésével az összes maradék számhoz rendelhetünk más számokat.
12
A kategóriák meghatározásához nehéz biztosan használható receptet adni. A kategóriák számát és terjedelmét elsősorban szakmai megfontolás befolyásolja, de mindenképpen úgy célszerű elrendezni az adatainkat, hogy lehetőleg ne legyenek nagyon eltérő terjedelműek, és a kategóriák száma ne legyen se túl sok, se túl kevés. Készítsünk először négy kategóriát. A legfiatalabb és a legidősebb vásárló életkora között 30 év van, ezt osztjuk négy részre. Legyenek a korosztályok a következők: 25–32; 33–40; 41–48; 49–55. Ezekhez a korcsoportokhoz rendeljük hozzá az 1, 2, 3 és 4 számokat. A hozzárendelés menete: először a bal oldali részben feltüntetjük az életkor intervallumot, majd a jobb oldalon a NEW VALUE részbe beírjuk a megfelelő számot, majd az ADD gombbal rögzíthetjük. Ezt követően a következő intervallum beállítása jön a bal oldalon, majd ismét a hozzárendelt érték és a rögzítés következik. Az összes intervallum rögzítése után a CONTINUE gombbal juthatunk vissza az előző ablakra, és ott az OK gomb megnyomása után elkészül az új változónk. Ezek alapján elvégezhetjük a sokaság függetlenség vizsgálatát χ2 teszt segítségével. A kontingencia táblázatot az ANALYZE / DESCRIPTIVE STATISTICS / CROSSTABS… menüpontja alapján készítjük el. A ROW(S) sorokat, a COLUMN(S) oszlopokat jelent, és ide helyezzük el a két vizsgálandó változónkat. A korkat (életkor kategóriák) került a sorokhoz és mosopor (mosópor típusa), de e két változót fel is cserélhettük volna, ugyanis a számításokban nem, csak a táblázat elrendezésében jelent különbséget.
13
A párbeszédablakon belül a STATISTICS gomb lenyomásával a kapott menüben kérhetjük a χ2 teszt elvégzését (CHI-SQUARE).
Az output ablakban az alábbi eredményeket találjuk. A kontingencia táblázatban (crosstabulation) látható, hogy melyik korcsoportban hányan vásároltak az egyik vagy a másik mosóporból. életkor kategóriák * mosópor típusa Crosstabulation Count életkor kategóriák
Total
25-32 33-40 41-48 49-55
mosópor típusa régi 11 37 47 41 136
Total új 48 40 41 35 164
59 77 88 76 300
14
A χ2 teszt eredménye is olvasható (Chi-Square Tests). A számolt χ2 érték 21,779, a szabadság fok 3, és a próba szignifikáns eredményt hozott, jelentős a különbség a korosztályok vásárlási szokásai között. Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Square 21.779 3 .000 Likelihood Ratio 23.414 3 .000 Linear-by-Linear Association 15.204 1 .000 N of Valid Cases 300 a 0 cells (.0%) have expected count less than 5. The minimum expected count is 26.75.
(Gyakorlásképpen elvégezheti ismét a számításokat három korcsoportot alkalmazva. Hasonlítsa össze az eredményeket!) Megjegyzés: Az ANALYZE / DESCRIPTIVE STATISTICS / CROSSTABS… menüben a CELLS… gombra kattintva a kontingencia táblázatban szereplő értékek százalékos arányát is kérhetjük.
A PERCENTAGES / COLUMN kapcsoló segítségével egy olyan táblázathoz juthatunk, ahol a régi mosóport vásárlókat, az új mosóport vásárlókat és az összes vásárlót külön-külön 100%-nak véve ezen belül a korosztályok szerinti megoszlást láthatjuk. életkor kategóriák * mosópor típusa Crosstabulation életkor kategóriák
25-32 33-40 41-48 49-55
Total
Count % within mosópor típusa Count % within mosópor típusa Count % within mosópor típusa Count % within mosópor típusa Count % within mosópor típusa
mosópor típusa régi 11 8.1% 37 27.2% 47 34.6% 41 30.1% 136 100.0%
Total új 48 29.3% 40 24.4% 41 25.0% 35 21.3% 164 100.0%
59 19.7% 77 25.7% 88 29.3% 76 25.3% 300 100.0%
A százalékos megoszlást sorok szerint is számíttathatjuk, csak akkor a PERCENTAGES / COLUMN kapcsoló helyett a PERCENTAGES / ROW kapcsolót kell beállítani.
15
2. Egy kérdőíves felmérés során 216 személy fizetési–, életkori adatait valamint nemét jegyezték fel 2003-ban1. A fizetéseket és az életkort kategóriákba osztották. A fizetés esetében a következő négy kategóriát különböztették meg: havi bruttó jövedelem 50 000 Ft alatt, 50 000 forinttól 110 000 forintig, 111 000 forinttól 160 000 forintig, illetve 160 000 Ft felett. Az életkoroknál 18 évtől 25 éves korig, 26 évtől 35 éves korig, 36 évtől 50 éves korig, végül 50 éves kor felett lettek kialakítva a csoportok. Az adatok a fizetés.sav fileban találhatók. Vizsgálja meg, hogy van-e statisztikailag bizonyítható különbség a férfiak és a nők fizetése között, illetve azt, hogy eltérőek-e a jövedelmek az egyes életszakaszokban? A kérdőív megfogalmazásánál nem konkrét összegeket kértek, hanem csak kategória megjelölést. Ha mindenki a pontos havi bruttó jövedelmét írta volna be, akkor kétmintás t-próbát lehetne alkalmazni. Esetünkben azonban a változónk ordinális skálán mért, itt tehát Mann-Whitney próbát alkalmazhatunk. A próbát az ANALYZE / NONPARAMETRIC TESTS / 2 INDEPENDENT SAMPLES menüben találhatjuk. A TEST VARIABLE LIST részhez kerüljön a bér változó, a GROUPING VARIABLE cellához pedig a nem változó. Itt a DEFINE GROUPS gomb megnyomásával be kell állítani az egyes nemeknek megfelelő kódokat, most a férfiakat 1, a nőket 2 jelöli.
Az OK gomb lenyomása után az output ablakban az alábbi két táblázatot találjuk. Ranks 50,50-110,111-160,160
férfi 1, nő 2
N
1 2 Total
122 94 216
Mean Rank 116.39 98.27
Sum of Ranks 14199.00 9237.00
Test Statistics Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed)
50,50-110,111-160,160 4772.000 9237.000 -2.207 .027
a Grouping Variable: férfi 1, nő 2
1
Forrás: Szakál Zoltán
16
A felső táblázatból leolvashatjuk, hogy a rangtranszformáció után a rangok átlaga (Mean Rank) 116,39 a férfiaknál és 98,27 a nőknél. Ez azt jelenti, hogy a vizsgálatban szereplő személyek között a férfiak magasabb bérkategóriába estek. A második táblázat Asymp. Sig. sorában a 0,027 arról tájékoztat bennünket, hogy a nullhipotézist elvethetjük, a fizetésbeni különbségek statisztikailag bizonyíthatók. A második kérdésnél már nemcsak két mintánk van, hanem négy, a négy életkor kategóriának megfelelően. Ehhez a Kruskal – Wallis próba használható. A próbát az ANALYZE / NONPARAMETRIC TESTS / K INDEPENDENT SAMPLES menüben találhatjuk. A párbeszédablakban be kell állítani a TEST TYPE résznél A KRUSKAL – WALLIS kapcsolót, a TEST VARIABLE LIST részhez áthelyezni a bér változót, valamint a Grouping Variable esetén a Define Range gomb megnyomásával a korosztályokat meghatározni. Ez utóbbinál a legkisebb és a legnagyobb értéket kell beírni a minimum és a maximum cellákba.
A beállítások elvégzése után az OK gomb megnyomásával megkapjuk az eredmény táblázatokat. Ranks 50,50-110,111-160,160
18-25;26-35;36-50;50 felett 1 2 3 4 Total
N 54 64 62 36 216
Mean Rank 82.98 120.84 122.42 100.86
A rangok átlagánál (Mean Rank) megfigyelhető, hogy a legmagasabb fizetéseket a hármassal jelölt korosztálynál, vagyis a 36 évestől 50 éves korig találjuk, a legalacsonyabbak a kezdő fizetések a 18 évtől 25 éves korig. Ezek az adatok nem mondanak ellent a mindennapi életben megszokottnak, tekintve a mai nagyobb cégek viszonylag fiatal, magas beosztásban levő alkalmazottjainak fizetését. Test Statistics
17
Chi-Square df Asymp. Sig.
50,50-110,111-160,160 16.501 3 .001
a Kruskal Wallis Test b Grouping Variable: 18-25;26-35;36-50;50 felett
A második táblázatban a 0,001–es P érték alapján megállapíthatjuk, hogy ezek a különbségek szignifikánsak, nem a véletlen mintavételi hibáknak köszönhető.
Irodalomjegyzék:
Anonym: xenia.sote.hu/hu/biosci/docs/biometr/course/ (1999) Baráth Cs. – Ittzés A. – Ugrósdy Gy.: Biometria. Mezőgazda Kiadó 1996 Kiss A. – Manczel J. – Pintér L. – Varga K.: Statisztikai módszerek alkalmazása a mezőgazdaságban. Mezőgazdasági Kiadó 1983 Kovács István: Statisztika. Szent István Egyetem Gazdálkodási és Mezőgazdasági Főiskolai Kar jegyzete. Gyöngyös 2000 Korpás Attiláné dr. szerkesztette, Kriszt – Varga – Kenyeres: Általános statisztika II. Nemzeti Tankönyvkiadó 1997. Fodor János: Biomatematika http://www.univet.hu/users/jfodor/index_h.html Meszéna György – Ziermann Margit: Valószínűségelmélet és matematikai statisztika Közgazdasági és Jogi Könyvkiadó 1981 Murray R. Spiegel: Statisztika. Elmélet és gyakorlat. Panem – McGraw – Hill 1995 Szűcs István: Alkalmazott statisztika. Agroinform Kiadó 2002 Vargha András: Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal. Pólya Kiadó, 2000. Vincze István – Verbanova Mária: Nemparaméteres matematikai statisztika. Elmélet és alkalmazások. Akadémiai Kiadó 1993.
18