ÖKONOMETRIA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi Tanszék az MTA Közgazdaságtudományi Intézet és a Balassi Kiadó közreműködésével
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter 2010. június
ÖKONOMETRIA 8. hét Heteroszkedaszticitás, multikollinearitás Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
Heteroszkedaszticitás fogalma Próbák Következmények Megoldások Multikollinearitás – definíció, következmények Röviden az endogenitásról
Heteroszkedaszticitás fogalma Alapmodell feltevése Var(ui) = σ2 minden i-re – homoszkedaszticitás Hibatagok varianciája nem állandó Var(ui) = σi2 minden i-re – heteroszkedaszticitás
2
Példa heteroszkedaszticitásra Fogyasztás modell (adatok: SHARE, 2004, Németország – élelmiszer kiadások)
Ci 0 1Inci 2Th _ Wealthi ui Cˆ i 379.6 0.02 Inci 0.007Th _ Wealthi Reziduálisok eloszlása jövedelem függvényében
2,000
1,500
RESID01
1,000
500
0
-500
-1,000
Alternatív modell log Ci 0 1 log Inci 2 log Th _ Wealthi ui log Cˆ i 4.63 0.15 log Inci 0.05Th _ Wealthi
0
10,000
20,000
30,000
40,000
30,000
40,000
INC
Reziduálisok eloszlása jövedelem függvényében
1.6 1.2 0.8
RESID02
0.4 0.0 -0.4 -0.8 -1.2 -1.6 -2.0 0
10,000
20,000 INC
Próbák 1. White-próba Kérdés: Van-e szisztematikus tényező maradéktag varianciájában? 2
White-próba: uˆi regressziója magyarázó változókon, azok négyzetein és keresztszorzatain → F- vagy khi-négyzet próba együtthatók szignifikanciájára 3
Próbák 2. Breusch-Pagan próba 2
Segédregresszió: uˆi regressziója z1,..., zk magyarázó változókon (amikről azt gondoljuk, hogy a varianciát befolyásolják) S0 segédregresszió négyzetösszege (ESS) R2 segédregresszió det. együtthatója σ2 (eredeti!) hibatagok becsült varianciája LM-teszt a segédregresszió használhatóságára, ami u normális eloszlása esetén kifejezhető másképpen is:
nR 2 ~ k2
(és (és
S0 hauu normális) normális) ha 2ˆ 4
Következmény 1. Szokásos standard hiba becslés nem jó Egyváltozós modell yi = α + βxi + ui, Var(ui) = σi2 →
ˆ
xi x yi y x x ui i 2 xi x xi x 2
Torzítatlan (E(ui) = 0; xi, ui függetlenek) xi x ui xi x 2 i2 Var ( ˆ ) Var 2 2 x x 2 i xi x
Homoszkedaszticitás esetén:
Var ( ˆ )
2
x x
2
i
Torzított varianciabecslést ad heteroszkedaszticitás esetén! – Szokásos tesztek nem használhatók.
4
Következmény 2. OLS nem hatásos Példa: σi2 = σ2zi2 Súlyozott (homoszkedasztikus) modell:
yi x i vi zi zi
Új modellOLS (WLS) : *
( xi / zi )vi ( xi / zi ) 2
Eredeti modellOLS : V ( ˆ ) V ( * ) V ( ˆ )
x
2 2 i 2
(x / z ) x i
Cauchy–Schwarz:
i
2 2 i i
z
x x 2 i
2 i 2 2 i
2
V ( * )
2
(x / z ) i
x z x
2
i
2 2 i i 2 2 i
1
(a b ) a b 2
i i
2 i
2 i
Megoldás 1. – White SE Heteroszkedaszticitás robusztus becslés becsült együttható varianciájára ( xi x )2 uˆi2 Kétváltozós modell: Var ( ˆ1 ) 2 S xx Többváltozós modell:
Var ( ˆ j )
rˆ uˆ
2 2 ij ij
RSS j
,
rij : reziduális x j regresszió jából többi magyarázó változón reziduális xj regressziójából többi magyarázó változón reziduálisnégyzetöss négyzetösszeg ugyanebbőlaaregresszió regresszióból RSS j : reziduális zeg ugyanebbőg ból ˆ 0 t t-teszt: robosztus SE
Aszimptotikusan t-eloszlású: nagy mintára használható csak
5
Megoldás 2 – WLS Súlyozott legkisebb négyzetek (WLS)
yi xi ui ,
V (ui ) 2 zi2
yi x 1 i vi , V (vi ) 2 zi zi zi Ez utóbbi egyenletet becsüljük OLS-sel, ami súlyozott összeg minimalizálásának felel meg n
min i 1
1 yi ˆ ˆxi 2 2 zi
Ha a variancia jól specifikált, akkor – hatásosabb, mint a sima OLS (sőt BLUE), – és kismintában is t- és F-eloszlású tesztek.
Példák: WLS yi = α + βxi + ui 1. gyakori eset: Var(ui) = σ2xi2 yi/xi = α/xi + β + ui/xi OLS-sel becsülendő 2. gyakori eset: Var(ui) = σ2xi yi/(xi1/2) = α/(xi1/2) + βxi1/2 + ui/(xi1/2) OLS-sel becsülendő Sokszor a magyarázó változó transzformálása (pl. logaritmizálása) megoldja a heteroszkedaszticitási problémát.
Megoldás 3.: TWLS, FGLS TWLS: two-step weighted least squares FGLS: feasible generalalised least squares 6
Lépések: 1. yi 1 x1i ... k xki ui becsléseOLS - sel 2. uˆi becsült hibatagok képzése 3. variancia specifikációja, pl. σ i2 exp( 0 1 x1i ...) 4. log (uˆi2 ) regresszálása konstans,x1i , ..., xki változókon 5. gˆ i az illesztett értékek, hˆi exp( gˆ i ) 6. Eredeti egyenlet becsléseWLS - sel,a hˆi súlyokkal
FGLS tulajdonságai Mivel a súlyokat becsültük, a becslőfüggvény nem torzítatlan. De konzisztens és aszimptotikusan hatásosabb, mint az OLS. Ha úgy gondoljuk, hogy nem specifikáltuk tökéletesen a varianciát, akkor használhatjuk itt is a White-féle standard hibákat.
Példa: dohányzást meghatározó tényezők vizsgálata Adatok (forrás: Wooldridge) CIGS: naponta elszívott cigaretták száma INCOME: éves jövedelem CIGPRIC: egy doboz cigaretta ára (cent) EDUC: iskolai évek száma AGE: életkor RESTAURN: vannak-e az adott tagállamban éttermi dohányzást korlátozó rendelkezések
7
OLS szokásos és robusztus standard hibákkal
Próbák
8
FGLS becslés
Eviews program equation eq_ols equation eq_olsrob eq_ols.ls cigs c lincome lcigpric educ age age^2 restaurn delete white delete breuschpagan freeze(white) eq_ols.hettest(type=white) freeze(breuschpagan) eq_ols.hettest(BPG) @regs eq_olsrob.ls(h) cigs c lincome lcigpric educ age age^2 restaurn forecast olsf genr olsres=cigs-olsf equation eq_logu2 genr logu2=log(olsres^2) eq_logu2.ls logu2 c lincome lcigpric educ age age^2 restaurn forecast logu2f genr h=exp(logu2f) genr sqrth=h^(1/2) equation eq_fgls equation eq_fgls2 9
eq_fgls.ls(w=1/(h)^(1/2)) cigs c lincome lcigpric educ age age^2 restaurn eq_fgls2.ls cigs/sqrth 1/sqrth lincome/sqrth lcigpric/sqrth educ/sqrth age/sqrth age^2/sqrth restaurn/sqrth
Multikollinearitás Magas korreláció magyarázó változók között: Egyedi hatás nehezen kiszűrhető Alapmodell feltevéseinek nem mond ellent Tökéletes kollinearitás: függvényszerű kapcsolat Pl.: y = β1x1 + β2x2 + u, x2 = ax1 y = (β1 + aβ2) x1 + u
Következmények, megoldások Becsült együttható érzékeny változók hozzáadására, kihagyására Becsült együttható varianciája nőhet
2 2 Var ( ˆi ) RSS i Sii (1 Ri2 ) Magas, ha hibatag varianciája nagy vagy Sii alacsony vagy Ri2 magas (multikoll.: sem szükséges, sem elégséges) Lehetséges megoldások Változó kihagyása: variancia csökken, de torzítás! Adatgyűjtés (nagyobb variancia x-ben) Változók „összevonása” (pl. hányados)
Endogenitás Endogenitás: az eltérésváltozó korrelált a magyarázó változóval Yi= α + βXi + ui E(ui|xi) ≠ 0 Következmény: β OLS becslése torz és inkonzisztens 10
Endogenitás néhány lehetséges oka Kihagyott változó (u tartalmaz valamit, ami korrelált X-szel) Szimultaneitás (nemcsak X hat Y-ra, hanem Y is X-re: u miatt változik Y, és ez hat X-re) Pl. kereslet–kínálati modellek Önszelekció hatásvizsgálatokban: „kezelés” (pl. programba való beválogatás) nem független a hibatagtól Vállalatoknak nyújtott támogatás hatása az eredményességre Stb.
Összefoglalás Házi feladatok Példatípusok a zárthelyin Regressziós outputok értelmezése Elméleti, kifejtősebb kérdések Hogyan ismerhetők fel a kiugró értékek, milyen teendők vannak outlierek esetén? Gauss-Markov tétel kimondása Előrejelzés standard hibája mitől függ az egyváltozós esetben Rövid válaszos feladatok Igaz / hamis állítások
Gyakorlat Heteroszkedaszticitás, multikollinearitás Maddala: 5/7, 5/8, 7/1, 7/3 Wooldridge: 8.1, 8.2, 8.3, 8.7, 8.9, (3.7, 3.11) 11
Megbeszélendő Heteroszkedaszticitás tesztelése, kezelése Multikollinearitás – valóban „probléma”? Adatok Egészségügyi kiadások modellje (HRS vagy SHARE rész-adatbázis) Heteroszkedaszticitás tesztelése Multikollinearitás: különböző jövedelem vagy vagyon indikátorok együttes bevonása
12