Gyakorlat 8 1xANOVA Dr. Nyéki Lajos 2016
A probléma leírása • Azt vizsgáljuk, hogy milyen hatása van a család jövedelmének a tanulók szövegértés teszten elért tanulmányi eredményeire. • A minta 59 iskola adatait tartalmazza. • Az iskolákat alacsony, közepes és magas FR (Free or Reduced price lunch) csoportokba sorolták aszerint, hogy a tanulók hány százaléka jogosult ingyenes vagy kedvezményes ebédre (a 33.33% és a 66.67% értékeket használva a csoportok kialakítására). • Az FR az alacsony családi jövedelem indikátora.
Az előfeltételek • A minták normális eloszlásúak. • A minták varianciái egyenlők. • A minták egymástól függetlenek. • A függő változó adatai intervallum skálán vannak.
Feladatok • Töltse be a Gyakorlat-8.xlsx állományt! • Vizsgálja meg, hogy teljesülnek-e az előfeltételek! • Végezze el a variancia-analízist Excel és SPSS használatával! • Értékelje a kapott eredményeket!
A minták normális eloszlásúak? • Ennek eldöntéséhez az Excel és az SPSS leíró statisztikai jellemzők kimeneteit fogjuk felhasználni.
Leíró statisztikai jellemzők (Excel)
Leíró statisztikai jellemzők (SPSS)
A low kategória
A middle kategória
A high kategória
Az alapsokaság normális eloszlású? • Az alacsony (FR=1) kategóriában a csúcsossági és a ferdeségi index is kívül van a 2-3 határértéken. • Az alacsony (FR=1) kategóriában van egy 26-os extrém érték. • Ezt az extrém értéket célszerű eltávolítani. • Az eltávolítás után célszerű újra kiszámítani a leíró statisztikai jellemzőket.
Leíró statisztikai jellemzők az extrém érték kizárásával (Excel)
Leíró statisztikai jellemzők az extrém érték kizárásával (SPSS)
A minták normális eloszlásúak? • Az extrém eset eltávolítása után a csúcsossági és a ferdeségi indexek is a határértéken belül vannak. • A minták így már normális eloszlásúnak tekinthetők.
A további előfeltételek ellenőrzése • A minták varianciái egyenlők. Ezt a feltételezést majd az SPSS Levene próba eredménye alapján tudjuk ellenőrizni. • A minták egymástól függetlenek. Ez az előfeltétel teljesül. • A függő változó adatai intervallum skálán vannak. Ez az előfeltétel teljesül.
A minták varianciái egyenlők? H 0 : 1 2 3 H A : 1 2 3
Az SPSS Levene próba kimenete
Az SPSS Levene próba eredménye • A Levene próba null hipotézise azt mondja ki, hogy a szórások egyenlők. • Az eredmény szignifikáns (p < 0,05), tehát a null hipotézist elutasítjuk. A három minta szórásai nem egyenlők.
1ANOVA az extrém érték kizárásával H 0 : 1 2 3 H A : 1 2 3
1ANOVA az extrém érték kizárásával (Excel)
1ANOVA az extrém érték kizárásával (SPSS)
Az eredmények értelmezése • Az eredmények mindkét szoftverrel azonosak. • F = 24,22, p < 0,05, tehát az eredmény szignifikáns. A három minta átlagának egyenlőségére vonatkozó null hipotézist elvetjük. • Megjegyzésre érdemes, hogy a két program eltérően jelzi a szignifikanciát. Az Excel kiírja a táblázatbeli kritikus értéket, az SPSS nem. Az Excel tudományos alakban adja meg a szignifikancia értékét, az SPSS kerekít három tizedesjegyre.
A hatásméret kiszámítása SS B SST 2
6069 12960 2
2 0, 47
A Post Hoc elemzés folyamata • Ha az ANOVA próba eredménye szignifikáns, akkor post hoc (ez utáni) elemzést szokás végezni az okok feltárása érdekében. • Ennek egyik módja a Tukey-féle Terjedelem próba elvégzése. • Mivel az Excel nem végez post hoc elemzést, azt az SPSS használatával végezzük el.
A Post Hoc elemzés kimenete (SPSS)
Az eredmények értékelése • Az elvégzett elemzés szerint a család jövedelmének (az FR csoportoknak) van hatása a szövegértési teszten elért eredményekre. • A hatásméret közepes kapcsolatot jelez. Ez a gyakorlati hatás. • A post hoc elemzés szerint mindhárom csoport átlagainak különbsége szignifikáns 0,05 szinten. Ez azt jelenti, hogy az egyes csoportok szövegértési eredményei szignifikánsan különböznek más csoportokétól.