Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése -
Petrovics Petra Doktorandusz
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Többváltozós lineáris regressziós modell • x1, x2, …, xp és y közötti kapcsolatot ábrázoló egyenes. • Az y függ: • x1, x2, …, xp – p db magyarázó változótól • A véletlen ingadozásától (ε) • β0, β1, …, βp regressziós együtthatóktól.
Y = β0 + β1x1 + β2x2 +…+ βpxp +ε
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek 1. 2. 3. 4.
Várható értéke 0 ⇒ M(ε) = 0 Varianciája konstans ⇒ Var(ε) = σ2 A hibatag értékei nem autokorreláltak. Normális eloszlású valószínűségi változó.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
A magyarázó változókra vonatkozó feltételek 1. Egymástól lineárisan függetlenek legyenek. (egyik magyarázó változót se lehessen a többi magyarázó változó lineáris kombinációjaként előállítani)
2. Értékeik rögzítettek legyenek, változzanak mintáról mintára. 3. Mérési hibát nem tartalmaznak. 4. Nem korrelálnak a hibatényezővel.
ne
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Standard lineáris regressziós modell Ahol az előbb említett feltételek teljesülnek. ⇒Amennyiben a mintabeli adatok nem igazolják a feltételek teljesülését, bonyolultabb modellre és becslési eljárásokra van szükség.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
SPSS (Feladat) 10 véletlenszerűen kiválasztott vállalat adatai a következők:
1 2 3 4 5 6 7 8 9 10
y - árbevétel 35 27 42 47 53 45 61 58 65 77
x1-vagyon 54 52 50 58 82 72 120 108 92 122
x2-létszám 98 120 95 145 184 106 240 175 165 202
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek ellenőrzése a) b) c) d)
Várható értéke 0 ⇒ M(ε) = 0 Varianciája konstans ⇒ Var(ε) = σ2 A hibatag értékei nem autokorreláltak. Normális eloszlású valószínűségi változó.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
1. M(ε) = 0 • A hibatagok pozitív és negatív értékei kiegyenlítik egymást. • Ha eltér a 0-tól, annak oka lehet, hogy kihagytunk a modellből egy szignifikáns magyarázó változót. • Nehéz a gyakorlatban ellenőrizni. • Ha feltételezzük, hogy a legkisebb négyzetek módszere érvényesül, akkor teljesül ez a feltétel.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek ellenőrzése a) b) c) d)
Várható értéke 0 ⇒ M(ε) = 0 Varianciája konstans ⇒ Var(ε) = σ2 A hibatag értékei nem autokorreláltak. Normális eloszlású valószínűségi változó.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
2. Homoszkedaszticitás (Var(ε) = σ2) • A hibatag varianciája állandó. Ha nem: heteroszkedaszticitás ⇒ Logaritmizálni! • Tesztelése: o
Grafikus – a becsült reziduumokat a kiválasztott magyarázó változó vagy az ŷ függvényében ábrázoljuk
o
Statisztikai tesztek – Goldfeld-Quandt-féle teszt
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Homoszkedaszticitás grafikus tesztelése e
e
xi ŷ
Homoszkedasztikus hibatag e – reziduum xi – becsült érték
e
xi ŷ
Heteroszkedasztikus hibatag
xi ŷ
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Homoszkedaszticitás GoldfeldQuandt-féle tesztelése •
H0 : σ j 2
=
σ2
(a varianciák
χ
2 n -r 2
eloszlást követnek és ezek egymástól függetlenek)
H 1 : σ j2 ≠ σ 2 • Lépései: 1. Rangsor n -r n -r n -r ; r ; 2. Független részminták ( 2 2 , ahol r > 0, 2 > p ) 3. Regressziós függvények, reziduális szórásnégyzet (se2) 2 n − r e s 12 ∑ 1 4. F-próba: F = ν1 =ν 2 = = 2 2
∑
e2
H0 F(α/2)
F(1-α/2); ν1,ν2
s2
2
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
SPSS Analyze / Regression / Linear… - Plots Függő változó Standardizált becsült érték Standardizált reziduum Törölt reziduum Korrigált becsült érték Studentizált reziduum Studentizált törölt reziduum
Standardizált becsült érték (ZPRED) és a standardizált reziduum (ZRESID) viszonya – Homoszkedaszticitás?
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
A reziduumok varianciája ~konstans ⇒ Homoszkedaszticitás
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Ha heteroszkedasztikus… LOGARITMIZÁLÁS!
log (y? ) y x1 x2 …
xp
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek ellenőrzése a) b) c) d)
Várható értéke 0 ⇒ M(ε) = 0 Varianciája konstans ⇒ Var(ε) = σ2 A hibatag értékei nem autokorreláltak. Normális eloszlású valószínűségi változó.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
A hibatag értékei korrelálatlanok • Egyszerű véletlen mintavétel esetében ez a feltétel automatikusan teljesül. • Ha a modell idősoros adatokra épül, gyakran előfordul a hibatagok autokorreláltsága.
• Autokorreláció oka: – Nem megfelelő függvénytípus. – Nem véletlen jellegű mérési hiba. – A modellben nem szerepel valamennyi lényeges magyarázó változó (nem tudjuk, hogy kell / túl rövid idősor / nincs adat).
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Autokorreláció grafikus tesztelése e
e
A kihagyott változók miatt a reziduumok nem véletlenszerűek, hanem az egymást t követő értékek között jelentős korreláció van.
t
e
Az autokorreláció a függvénytípus helytelen megválasztásának a következménye. t
+ KVANTITATÍV TESZTEK!
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Autokorreláció tesztelése DurbinWatson próbával n
∑
( e t − e t−1 )
H0: ρ = 0 korrelálatlan
d =
H1: ρ ≠ 0 autokorreláció
Határai: 0
2
t= 2 n
∑
e t2
t=1
≤ d ≤ 4
Pozitív autokorreláció:
0 ≤ d ≤ 2 - zavaró autokorreláció
+ zavaró autokorreláció
0
dl du
2
4-du 4-dl
Elfogadási tartomány
4
Negatív autokorreláció:
2 ≤ d ≤ 4 Bizonytalansági tartomány: nem tudunk dönteni • Növelni kell a megfigyelések számát • Új változót kell bevonni a modellbe
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
A Durbin-Watson próba döntési táblázata H1 p>0 Pozitív autokorreláció p<0 Negatív autokorreláció
Elfogadjuk
H0:p=0 Elvetjük
Nincs döntés
d>du
d
dl
d<4-du
d>4-dl
4-dl
du illetve dl értékét a Durbin-Watson táblázatból határozzuk meg Forrás: Kerékgyártó-Mundruczó [1999]
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Durbin-Watson próba - SPSS Analyze / Regression / Linear… - Statistics
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Durbin-Watson statisztika (5%-os szignifikanciaszint mellett) n
Forrás: Statisztikai képletgyűjtemény
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 50 60 70 80 90 100
m=1
m=2
m=3
m=4
m=5
dL
dU
dL
dU
dL
dU
dL
dU
dL
dU
1,08 1,10 1,13 1,16 1,18 1,20 1,22 1,24 1,26 1,27 1,29 1,30 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,43 1,44 1,50 1,55 1,58 1,61 1,63 1,65
1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,44 1,45 1,45 1,46 1,47 1,48 1,48 1,49 1,50 1,50 1,51 1,51 1,52 1,52 1,53 1,54 1,54 1,54 1,59 1,62 1,64 1,66 1,68 1,69
0,95 0,98 1,02 1,05 1,08 1,10 1,13 1,15 1,17 1,19 1,21 1,22 1,24 1,26 1,27 1,28 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,46 1,51 1,55 1,59 1,61 1,63
1,54 1,54 1,54 1,53 1,53 1,54 1,54 1,54 1,54 1,55 1,55 1,55 1,56 1,56 1,56 1,57 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,59 1,60 1,60 1,63 1,65 1,67 1,69 1,70 1,72
0,82 0,86 0,90 0,93 0,97 1,00 1,03 1,05 1,08 1,10 1,12 1,14 1,16 1,18 1,20 1,21 1,23 1,24 1,26 1,27 1,28 1,29 1,31 1,32 1,33 1,34 1,42 1,48 1,52 1,56 1,59 1,61
1,75 1,73 1,71 1,69 1,68 1,68 1,67 1,66 1,66 1,66 1,66 1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,69 1,70 1,72 1,73 1,74
0,69 0,74 0,78 0,82 0,86 0,90 0,93 0,96 0,99 1,01 1,04 1,06 1,08 1,10 1,12 1,14 1,16 1,18 1,19 1,21 1,22 1,24 1,25 1,26 1,27 1,29 1,38 1,44 1,49 1,53 1,57 1,59
1,97 1,93 1,90 1,87 1,85 1,83 1,81 1,80 1,79 1,78 1,77 1,76 1,76 1,75 1,74 1,74 1,74 1,73 1,73 1,73 1,73 1,73 1,72 1,72 1,72 1,72 1,72 1,73 1,74 1,74 1,75 1,76
0,56 0,62 0,67 0,71 0,75 0,79 0,83 0,86 0,90 0,93 0,95 0,98 1,01 1,03 1,05 1,07 1,09 1,11 1,13 1,15 1,16 1,18 1,19 1,21 1,22 1,23 1,34 1,41 1,46 1,51 1,54 1,57
2,21 2,15 2,10 2,06 2,02 1,99 1,96 1,94 1,92 1,90 1,89 1,88 1,86 1,85 1,84 1,83 1,83 1,82 1,81 1,81 1,80 1,80 1,80 1,79 1,79 1,79 1,77 1,77 1,77 1,77 1,78 1,78
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
0
dl 0,95
du 1,54
2
4-du 2,46
4-dl 3,05
4
1,381
dl
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek ellenőrzése a) b) c) d)
Várható értéke 0 ⇒ M(ε) = 0 Varianciája konstans ⇒ Var(ε) = σ2 A hibatag értékei nem autokorreláltak. Normális eloszlású valószínűségi változó.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
A hibatag eloszlása normális Tesztelése: • Grafikusan – a reziduumokat várható értékük függvényében ábrázoljuk ⇒ haranggörbe – normális eloszlás
• Kvantitatív módszerekkel – illeszkedésvizsgálat χ
2
- próba
• Ferdeségi, csúcsossági mérőszámokkal
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Grafikus tesztelés - SPSS Analyze / Regression / Linear… - Plots Függő változó Standardizált becsült érték Standardizált reziduum Törölt reziduum Korrigált becsült érték Studentizált reziduum Studentizált törölt reziduum
Hisztogram
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
A harang alakú standard normális eloszlás középértéke 0, szórása 1. Közelítőleg NORMÁLIS (de nem egyértelműen)
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
2. megoldás Analyze / Regression / Linear… - SAVE
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Normális eloszlás grafikus tesztelése 2. - SPSS Graphs / Histogram - Display normal curve A normális eloszlásgörbe harang alakú.
Közelítőleg normális eloszlás.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Nonparametric Test Analyze / Nonparametric Test / 1-Samle K-S...
H0 - normális eloszlás H1 - nem normális eloszlás
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Output
Ha a szignifikanciaszint (p) kisebb mint 5% (0,05), elutasítjuk a nullhipotézist. Most nagyobb 0,05-nél, vagyis elfogadjuk, hogy normális eloszlású a görbe. Normális eloszlású
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Köszönöm a figyelmet!