Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Diszkriminancia-analízis az SPSS-ben
Petrovics Petra Doktorandusz
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Diszkriminancia-analízis folyamata
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Feladat Megnyitás: Employee_data.sav
Milyen tényezőktől függ a dolgozók beosztása?
Nem Metrikus metrikus
Függő változó (y)
Független változó (x) Nem metrikus Metrikus Kereszttábla elemzés
Diszkriminancia-analízis, Logisztikus regresszió
Varianciaanalízis
Korreláció- és regresszióelemzés
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
2.
• Feltételek vizsgálata
1. Adatok, változók X: Metrikus változók / Dummy változók (age, education level, current salary, beginning salary, month since hire, previous experience, minority classification)
Adatok kizárólagossága: Pl. aki vezető, az nem hivatalnok Mindenki valamelyik csoport tagja, stb
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
2.
• Feltételek vizsgálata
2. Normális eloszlás Graph / Histogram Stb.
• n • Mahalanobis távolság
Nonparametric Tests / 1-Sample K-S Test
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
2.
• Feltételek vizsgálata
3. Multikollinearitás (vagy Pooled Within-Groups Matrices)
Faktoranalízis (?)
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
2.
• Feltételek vizsgálata
4. Outlier: Mahalanobis távolság 5. Homoszkedaszticitás: Box’s M Analyze / Classify / Discriminant…
Elemzés lefuttatásával
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Multikollinearitás (r) Homoszkedaszticitás: nemcsak variancia állandóság, de varianciakovariancia mátrixok egyezősége is feltétel Változók bevonása: Outlier Normál eloszlás
• milyen mértékben csökken a Wilks’ λ • Milyen mértékben csökken a nem magyarázott variancia • Kisebb M-távolság • Legnagyobb F-érték • Rao’s V értékének növekedése
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
mert nem ugyanannyi menedzser van, mint pl. hivatalnok
5.
• Érvényesség vizsgálat
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output - Month since hire - Minority - Age (?) STEPWISE
Megmutatja, hogy vannak-e különbségek a csoportosító változó által kialakított csoportok átlagai között: ha a csoportosító változó a varianciának nagy részét magyarázza, akkor a csoportok átlagai között szignifikáns eltérés mutatkozik, és a mutató értéke 0-hoz közelít. Így az egyes változók az alapján kerülhetnek bevonásra a diszkriminanciaelemzésbe, hogy milyen mértékben képesek a Wilks’ λ értékét csökkenteni.
Magas F érték, alacsony Wilks’ Lambda !!! A kevés diszkriminatív értékkel bíró változók a stepwise diszkriminanciaelemzés segítségével eltávolíthatók.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Stepwise Statistics:
1. 2. 3. 4. 5.
Education Level Previous Experience Current Salary Age Beginning Salary
Output
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
Group Statistics Employment Category Clerical
Custodial
Manager
Total
Educational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age Educational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age Educational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age Educational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age
Mean 12.86 27818.90 14079.05 81.11 85.12 .24 33.06 10.19 30938.89 15077.78 81.56 298.11 .48 48.59 17.25 63977.80 30257.86 81.15 77.62 .05 31.50 13.49 34418.45 17009.25 81.14 95.95 .22 33.67
Std. Deviation 2.330 7569.196 2893.376 10.093 95.393 .428 12.140 2.219 2114.616 1341.235 8.487 101.426 .509 9.532 1.612 18244.776 9980.979 10.410 73.260 .214 6.433 2.886 17093.723 7877.562 10.048 104.680 .415 11.784
Valid N (listwise) Unweighted 362 362 362 362 362 362 362 27 27 27 27 27 27 27 84 84 84 84 84 84 84 473 473 473 473 473 473 473
Weighted 362.000 362.000 362.000 362.000 362.000 362.000 362.000 27.000 27.000 27.000 27.000 27.000 27.000 27.000 84.000 84.000 84.000 84.000 84.000 84.000 84.000 473.000 473.000 473.000 473.000 473.000 473.000 473.000
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Vs.
Output
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
Egyező log determinánsok (nagyon alacsony log determinánssal rendelkező csoportokat célszerű törölni, ha M szignifikáns – minél magasabb kritikus p-érték)
H0: homoszkedasztikus (egyező kovariancia mátrixok) H1: heteroszkedasztikus p<0.000 szignifikancia-szinten fogadjuk el, hogy homoszkedasztikus (nagy mintaelemszámnál a szignifikancia eredménye kevésbé jelentős)
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 3.
Output
• Diszkriminancia függvény
Stepwise: Nő a magyarázó erő Kevésbé járul a magyarázó erő növekedéséhez
Szignifikáns diszkriminancia függvény p=0.000 λ=22,3% a nem magyarázott variancia (≈ ANOVA H2 inverze)
KANONIKUS DISZKRIMINANCIA FÜGGVÉNY
Min {p;Y kategóriáinak száma-1} = 2
A különbözőség azon része, amit a DF1 nem foglal magába
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
DF külső szórásnégyzet DF belső szórásnégyzet DF által magyarázott különbözőség DF által nem magyarázott különbözőség • Többszörös korreláció a magyarázó változók és a diszkriminancia fv. között DF-k a magyarázott • H komplementere különbözőség hány %-t 2 (modell • 1 fv. esetében a négyzete ≈R magyarázzák (∑100%) illeszkedés) Az DF1 83,4%-ban járul • A DF1 0,8262=68,23%-ban magyarázza hozzá a különbözőség a csoportosító változó varianciáját magyarázatához, míg a DF2 csak 16,6%-ban.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 3-4.
Output
• DF, Értelmezés
Diszkrimináló hatás értelmezése → DF elnevezése
• Változók fontossága • DF-k és a magyarázó változók • Kapcsolat iránya közötti korreláció • ≈ β együtthatók (parciális) Pl. DF1-t a leginkább a • Változók relatív fontossága (a korreláció abszolút mértékének jelenlegi fizetés, míg DF2-t a sorrendjében) korábbi munkatapasztalat • ≈ faktor loading (határ: >0,3 fontos) határozza meg
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
Diszkriminancia függvény paraméterei: bi együtthatók
(A mértékegységek különbözősége miatt nem látszik a jelentősége, de ezek is diszkriminálnak)
DF1 = 0,082 education level - 0,002 previous experience + 0,019 age - 4,923 DF2 = -0,201 education level + 0,013 previous experience − 0,038 age + 1,748 b: a változók parciális hozzájárulása a DF-ekhez (a többi változó változatlansága mellett) Dummy változók használata esetén: elemzés a használatuk nélkül → használatukkal (a kanonikus korreláció négyzetében mért különbség a Dummy változók magyarázó ereje)
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
Egy egyed ahhoz a csoporthoz tartozik, amely csoport centroidjához a legközelebb esik a diszkriminancia értéke (discriminant score) (Mahalanobis távolság alapján) Pl: 1. személy: manager Átlagos D értékek Predicted group Discriminant membership score
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
5.
Output
• Érvényesség vizsgálat
Találati arány
Helyes kategorizálás
Új dolgozó: abba csoportba tartozik, amelyik centroidjától a kiszámított Mahalanobis távolság értéke a legalacsonyabb
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Köszönöm a figyelmet!