Esetelemzés az SPSS használatával A gepj.sav fileban négy különböző típusú, összesen 80 db gépkocsi üzemanyag fogyasztási adatai találhatók. Vizsgálja meg, hogy befolyásolja-e az üzemanyag fogyasztás mértékét a gépkocsi típusa. Megoldás: A gépjárművek típusa négyféle volt: Ford, Opel, Suzuki, Toyota. Az előző feladatokban egy- illetve kétmintás t-próba segítségével oldottuk meg a problémát. Az összehasonlításokhoz használhatnánk itt is kétmintás t-próbát, de ily módon csak párokat tudunk összehasonlítani. Négy minta esetén hat páronkénti összehasonlítás kellene végrehajtani. Ebben az esetben célszerű alkalmazni az egytényezős varianciaanalízist. A menüből az ANALYZE / COMPARE MEANS / ONE-WAY ANOVA párbeszédablakot válasszuk ki. Az ábrán látható módon a függő változónak a fogyaszt (fogyasztást), faktornak pedig a gjtip-et (gépjármű típust) jelöljük meg.
Érdemes még az OPTIONS alpontban a DESCRIPTIVES szolgáltatásaival élni, ahol leíró statisztika segítségével egy általános tájékoztatást kapunk.
1
Descriptives Fogyasztás (l/100km) N Mean Ford Toyota Opel Suzuki Total
20 20 20 20 80
6.19 5.71 6.41 5.64 5.99
Std. Deviation
Std. Error
.209 .216 .251 .181 .391
.047 .048 .056 .041 .044
95% Confidence Interval for Mean Lower Bound 6.10 5.60 6.29 5.55 5.90
Upper Bound 6.29 5.81 6.53 5.72 6.07
Minimum
Maximum
6 5 6 5 5
7 6 7 6 7
Az átlagos üzemanyag fogyasztás (Mean) 5,99 l/100 km. Az átlagosan legkisebb fogyasztású autók a Suzuki gépkocsik, a legnagyobbak az Opelek. ANOVA Fogyasztás (l/100km) Between Groups Within Groups Total
Sum of Squares 8.512 3.542 12.055
df 3 76 79
Mean Square 2.837 .047
F 60.874
Sig. .000
A kapott táblázat az úgynevezett varianciaanalízis táblázat. Az utolsó oszlopban található 0,000 empirikus szignifikancia mutatja (Sig.), hogy jelentős különbségek vannak a gépjárművek között az üzemanyag fogyasztás tekintetében. Ha azt is szeretnénk megtudni, hogy pontosan mely típusok között van szignifikáns különbség, akkor az ANALYZE / COMPARE MEANS / ONE-WAY ANOVA párbeszédablakon belül a POST HOC gombra kattintva a többszörös összehasonlításhoz használt teszteket találjuk meg. Ezek közül a Tukey módszert ajánljuk, mert a felsoroltak közül ez a legszigorúbb, és háromnál több csoportra már alkalmazható.
2
Multiple Comparisons Dependent Variable: Fogyasztás (l/100km) Tukey HSD Mean Difference (I-J) (I) Gépjármű (J) Gépjármű típus típus Ford Toyota .49* Opel -.22* Suzuki .56* Toyota Ford -.49* Opel -.70* Suzuki .07 Opel Ford .22* Toyota .70* Suzuki .77* Suzuki Ford -.56* Toyota -.07 Opel -.77* * The mean difference is significant at the .05 level.
Std. Error
Sig.
.068 .068 .068 .068 .068 .068 .068 .068 .068 .068 .068 .068
.000 .012 .000 .000 .000 .735 .012 .000 .000 .000 .735 .000
95% Confidence Interval Lower Upper Bound Bound .31 .67 -.39 -.04 .38 .74 -.67 -.31 -.88 -.53 -.11 .25 .04 .39 .53 .88 .60 .95 -.74 -.38 -.25 .11 -.95 -.60
A Post Hoc teszt eredmény táblázatában felsorolásra kerül minden lehetséges párosítás. A harmadik oszlopban az átlagok közötti különbség van feltüntetve. Csillaggal azok a párosítások vannak megjelölve, ahol a szignifikancia szint 0,05 alatti, vagyis ahol jelentős különbség mutatkozik a csoportátlagok között. Esetünkben csak a Suzuki – Toyota párosításnál nincs csillag, közöttük nincs számottevő különbség, az összes többi típusra ugyanez már nem mondható el. Legkifejezettebb az eltérés a Suzuki és az Opel között. A következő táblázatban a gépjármű típusokat csoportokba sorolva láthatjuk. Fogyasztás (l/100km) Tukey HSD N Subset for alpha = .05 Gépjármű típus 1 Suzuki 20 5.64 Toyota 20 5.71 Ford 20 Opel 20 Sig. .735 Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = 20.000.
2
3
6.19 1.000
6.41 1.000
Ezek szerint a japán gépkocsik (Toyota, Suzuki) egy kategóriába sorolhatók üzemanyag fogyasztás tekintetében. Külön csoportba került a Ford, és megint külön csoportba az Opel. Most nézzük meg, van-e különbség a fogyasztásban eltérő gumiabroncsot használva! Az eljárás megegyezik az előzőekben leírtakkal, csak az ANALYZE / COMPARE MEANS / ONE-WAY ANOVA párbeszédablakon belül a faktor a gépjármű típus helyett a gumitip (gumiabroncs típusa) lesz, a függő változó továbbra is a fogyasztás marad.
3
Descriptives Fogyasztás (l/100km) N
Michelin Matador Firestone Goodyear Total
20 20 20 20 80
Mean
Std. Deviation
Std. Error
6.03 6.23 5.93 5.76 5.99
.375 .377 .333 .346 .391
.084 .084 .074 .077 .044
95% Confidence Interval for Mean Lower Upper Bound Bound 5.86 6.21 6.05 6.40 5.77 6.09 5.59 5.92 5.90 6.07
Minimum
Maximum
6 6 6 5 5
7 7 7 6 7
ANOVA Fogyasztás (l/100km) Between Groups Within Groups Total
Sum of Squares 2.320 9.735 12.055
df 3 76 79
Mean Square .773 .128
F 6.039
Sig. .001
A leíró statisztikai részben olvasható, hogy minden gumitípushoz 20-20 fogyasztási adatunk van. Átlagosan a legkisebb fogyasztást a Goodyear-nél találjuk (5,76 l/100 km), a legnagyobbat pedig a Matadornál (6,23 l/100 km). A variancia táblázat alapján láthatjuk, hogy az abroncsok is befolyásolják az üzemanyag fogyasztás mértékét, hiszen a szignifikancia oszlopban 0,001-et látunk és az kisebb 0,05-nál. Multiple Comparisons Dependent Variable: Fogyasztás (l/100km) Tukey HSD Mean Difference (I-J) (I) Gumi típus (J) Gumi típus Michelin Matador -.19 Firestone .10 Goodyear .28 Matador Michelin .19 Firestone .29 Goodyear .47* Firestone Michelin -.10 Matador -.29 Goodyear .17 Goodyear Michelin -.28 Matador -.47* Firestone -.17 * The mean difference is significant at the .05 level.
Std. Error
Sig.
.113 .113 .113 .113 .113 .113 .113 .113 .113 .113 .113 .113
.342 .790 .072 .342 .053 .000 .790 .053 .415 .072 .000 .415
95% Confidence Interval Lower Bound -.49 -.19 -.02 -.11 .00 .17 -.40 -.59 -.12 -.58 -.77 -.47
Upper Bound .11 .40 .58 .49 .59 .77 .19 .00 .47 .02 -.17 .12
4
A többszörös összehasonlítás során világossá válik, hogy szignifikáns különbség csak a Goodyear és a Matador márka között van. Az összes többinél a szignifikancia oszlopban 0,05-nál nagyobb értékeket találunk. Ezt erősíti meg a következő táblázat is. Fogyasztás (l/100km) Tukey HSD N Gumi típus Goodyear Firestone Michelin Matador Sig. Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = 20.000.
20 20 20 20
Subset for alpha = .05 1 5.76 5.93 6.03 .072
2 5.93 6.03 6.23 .053
A csoportokba sorolásnál két kategóriát készített a program, de ezek között most átfedés figyelhető meg. Az egyikbe tartozik a Goodyear, a Firestone és a Michelin, a másik kategóriába a Firestone, a Michelin és a Matador. Ez tehát azt jelenti, hogy fogyasztási paramétereit tekintve ezek a típusok közel állnak egymáshoz, a Firestone és a Michelin egyaránt tekinthető a felső kategória alsó szélének, vagy az alsó kategória felső részének. A gépkocsik típusa és a gumiabroncs minősége egyaránt befolyásolja tehát az üzemanyag fogyasztást. Ezen kívül még kölcsönhatás is előfordulhat közöttük, hiszen elképzelhető, hogy Goodyear gumiabroncs hatása eltérő egy Ford vagy egy Suzuki gépkocsin. A kérdés megválaszolására a kéttényezős varianciaanalízist alkalmazhatjuk. A szokásos elnevezéseket használva blokkoknak tekinthetjük a gépkocsik típusát, kezeléseknek pedig az egyes gumiabroncs márkákat. A kéttényezős varianciaanalízis lefuttatásához az ANALYZE / GENERAL LINEAR MODEL / UNIVARIATE pontját kell lefuttatni. A változókat az ábrán látható módon helyezzük el. Függő változó a fogyaszt (fogyasztás), fix hatásokhoz a gjtip és a gumitip (gépjármű típus és gumi típus) kerülnek.
5
Az OK gomb lenyomása után az output részben az alábbi táblázatot kapjuk. Tests of Between-Subjects Effects Dependent Variable: Fogyasztás (l/100km) Source Type III Sum of Squares Corrected Model 10.879 Intercept 2866.815 GJTIP 8.512 GUMITIP 2.320 GJTIP * GUMITIP 4.612E-02 Error 1.176 Total 2878.870 Corrected Total 12.055 a R Squared = .902 (Adjusted R Squared = .880)
df 15 1 3 3 9 64 80 79
Mean Square .725 2866.815 2.837 .773 5.125E-03 1.838E-02
F 39.470 156017.150 154.420 42.093 .279
Sig. .000 .000 .000 .000 .978
A varianciaanalízis táblázat gjtip és gumitip (gépjármű típusa és gumiabroncs típusa) sorában látható 0,000 empirikus szignifikancia érték ugyanazt mutatja, mint az előzőekben kapott eredmények, mivel az egytényezős varianciaanalízis számítások során már megbizonyosodtunk arról, hogy a gépkocsi típusok között is és a gumiabroncs típusok között is szignifikáns eltérés mutatkozik az üzemanyag fogyasztást tekintve. A gépkocsi – gumiabroncs kölcsönhatásra vonatkozik a gjtip*gumitip sor. A szignifikancia oszlopban a sorhoz tartozó P érték 0,978, így biztosak lehetünk benne, hogy nincs kölcsönhatás közöttük. A gépkocsi típusa és a gumiabroncs típusa külön-külön hatnak az üzemanyag fogyasztásra. A táblázat alatt látható R Squared vagyis R négyzet értékre érdemes még figyelni, amelyet magyarázó erőnek szoktak nevezni. Értéke 0 és 1 közé eshet, minél közelebb van az egyhez, annál jobban illeszkedik a modell az adott problémára. A 0,9-es érték jónak mondható, úgy is fogalmazhatjuk, hogy az autók fogyasztásának varianciáját 90%-ban az autó és a gumiabroncs típusa határozza meg.
Irodalomjegyzék
Baráth Cs. – Ittzés A. – Ugrósdy Gy.: Biometria. Mezőgazda Kiadó 1996 Kiss A. – Manczel J. – Pintér L. – Varga K.: Statisztikai módszerek alkalmazása a mezőgazdaságban. Mezőgazdasági Kiadó 1983 Kovács István: Statisztika. Szent István Egyetem Gazdálkodási és Mezőgazdasági Főiskolai Kar jegyzete. Gyöngyös 2000 Kriszt – Varga – Kenyeres: Általános statisztika II. Nemzeti tankönyvkiadó 1997. Fodor János: Biomatematika http://www.univet.hu/users/jfodor/index_h.html Meszéna György – Ziermann Margit: Valószínűségelmélet és matematikai statisztika Közgazdasági és Jogi Könyvkiadó 1981 Murray R. Spiegel: Statisztika. Elmélet és gyakorlat. Panem – McGraw – Hill 1995 Szűcs István: Alkalmazott statisztika. Agroinform Kiadó 2002 Vargha András: Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal. Pólya Kiadó
6