ÖKONOMETRIA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi Tanszék az MTA Közgazdaságtudományi Intézet és a Balassi Kiadó közreműködésével
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter 2010. június
ÖKONOMETRIA 6. hét Többváltozós regresszió III. Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
Tartalom F-próba (folyt.), Stabilitási próbák Korrigált R2, modellszelekció, Dummy változók
F-próba általánosabban Több (r számú) korlátozás együttes tesztelése k magyarázó változós regresszióban Egymásba ágyazott hipotézisek: a modell együtthatóinak halmaza az eredetinek részhalmaza Példa U: y = α + β1x1 + β2x2 + β3x3+ u H0: β2 = 0, β3 = 0 R: y = α + β1x1 + v
2
F-próba, tesztstatisztika Négyzetösszeg – felbontás TSS = RESS + RRSS = RESS + (RRSS – URSS) + URSS Szabadságfokok n – 1 = (k – r) + (n – k + r – 1) = (k – r) + r + (n – k – 1)
F=
(RRSS – URSS) / r ~ F r,(n – k –1) URSS /(n – k – 1)
(nagymintában kb. ~ χr2/ r, ez lényegében a Wald-teszt) RRSS = Syy (1 – RR2) URSS = Syy (1 – RU2) F=
(RU2 – RR2) / r ~ F r,(n – k –1) (1 – RU2) / (n – k – 1)
Együtthatók lineáris függvényének tesztelése Példa: Cobb-Douglas termelési fv. logX= α + β1logL + β2logK + u H0: β1 + β2 = 1 t-próba: l
θ = β1 + β2 β2 = θ – β1 ogX = α + β1(logL – logK) + θ logK + u H0: θ = 1
t-próba közvetlenül β1 + β2 -re, felhasználva, hogy az összeg varianciája kiszámolható Var(β1^ + β2^) = Var(β1^) + Var(β2^)+ 2cov(β1^,β2^) F-próba:
β2 = 1 – β1 R: logX – logK = α + β1 (logL – logK) + u
3
Stabilitási próba – 2 független adathalmaz (gyakran Chow-próbaként hivatkozva) 1. yi = α1 + β11x1i + β21x2i +…+ βk1xki + ui, i = 1…n1 2. yi = α2 + β12x1i + β22x2i +…+ βk2xki + vi, i = 1…n2 H0: α1 = α2, β11 = β12, …, βk1 = βk2
F=
(RRSS – RSS1 – RSS2) / (k + 1) (RSS1 + RSS2) / (n1 + n2 – 2k – 2)
~ F k + 1, n1 + n2 – 2k – 2
RRSS: összevont adatbázisból, RSS1, RSS2: külön regressziókból
Stabilitási próba – Chow-próba (prediktív) 1. yi = α1 + β11x1i + β21x2i +…+ βk1xki + ui, i = 1…n1 2. yi = α2 + β12x1i + β22x2i +…+ βk2xki + vi, i = 1…n n – n1 < k + 1 lehetséges (ellentétben az előzővel) RSS1: rez. négyzetösszeg az első n1 megfigyelés alapján RRSS: rez. négyzetösszeg az összes (n=n1+n2) megfigyelésből becsült modell szerint
F=
(RRSS – RSS1) / (n – n1) ~ F (n – n1),(n1 – k – 1) RSS1 / (n1 – k – 1)
Korrigált R2 ˆ 2
RSS szabadságfok
Újabb változó bevonása: RSS és szabadságfok is csökken (normálegyenletek száma nő) 4
Korrigált R2 :
1 R 2
n 1 (1 R 2 ) n k 1
t < 1: változó kihagyása: nő R 2 F< 1: változók kihagyása: nő R 2 Lehetséges: t, F alapján különböző következtetés (pl. multikollinearitás)
Modellszelekció Egymásba ágyazott hipotézisek: t- és F-próba Nem egymásba ágyazott hip., függő változó azonos, pl.: R&D = α + β log(bevétel) + u R&D = α + β1 bevétel + β2 bevétel2 + u korrigált R2 vagy információs kritériumok (pl. AIC) alapján AIC (Akaike információs kritérium): RSS∙exp(2(k +1)/n)
Korrigált R2, példa Bértarifa (2003): tapasztalat vagy életkor a jobb magyarázó változó béregyenletben?
5
Logaritmikus formák Log-log (loglineáris) – rugalmasság ln(y) = α + βln(x) + u
%yˆ e 1 %x ˆ %x ˆ
Félig logaritmikus alakok
y ln( x) u ln( y ) x u
yˆ
ˆ
%x 100 %yˆ 100ˆ x
Kvadratikus forma Növekvő vagy csökkenő parciális hatás
y 1 x1 2 x1 u 2
yˆ ˆ1 2ˆ2 x1 x1 Példa: Bértarifa (2003), tapasztalat négyzetes tag, becsült egyenletek log(Ker) = 9.83 + 0.135 ISKVEG9 + 0.0082 EXP log(Ker) = 9.83 + 0.135 ISKVEG9 + 0.022 EXP – 0.00029 EXP2 0.022/(2*0.00029) = 39 évig pozitív parciális hatás (de végig csökkenő)
Interakciók Parciális hatás függ más magyarázó változótól is
y 1 x1 2 x1 x2 u yˆ ˆ1 ˆ2 x2 x1 Példa: Bér és iskolázottsági prémium, függhet a cég nyereségességétől (nettó árbev. – anyagköltség) Log(Ker) = 10.304 + 0.139 Iskveg9 + 0.092 Log(Cs_Arbev) Log(Ker) = 10.597 + 0.079 Iskveg9 + 0.043 Log(Cs_Arbev) + 0.010 (Iskveg9*Log(Cs_Arbev)) 6
Dummy változók a jobb oldalon Eddig: főként folytonos változók (kvantitatív információ) – pl. bér, fogyasztás, vagyon, végzettség (?) Kétértékű változók = dummy / binary / 0 – 1 Kvalitatív információ Példák: nem, foglalkoztatott, képzett, ország dummy…
Különböző tengelymetszet – 2 csoport Példa:
Iski ui , ha budapesti log( Keri ) 1 2 Iski ui , különben log(Keri ) 1 ( 2 1 ) Di Iski ui , Di 0, ha budapesti,Di 1 különben
Különböző tengelymetszet, példa 2003-as bértarifa alapján
7
Log függő változó log( Kˆ eri ) 10.93 0.16Videk i 0.15Iski
Becsült egyenlet
Vidéki: ceteris paribus kb. 16%-kal kisebb kereset Pontos különbség (EViews „log” természetes logaritmus) Ker1 log( Ker1 ) log( Ker0 ) 0.16 log Ker0
% - os kereset külöbség: e 0.16 1 100 14.79
Több csoport N csoport (pl. Budapest/vidék helyett kistérség)
1 xi ui az 1. csoportban x u a 2. csoportban i i yi 2 N xi ui az N. csoportban yi 1 ( 2 1 ) D2 ... ( N 1 ) DN xi ui D2 1 a 2. csoportra (0 különben),..., DN 1 az N. csoportra (0 különben) N csoport esetén N-1 dummy a regresszióban, N. csoport: viszonyítási/benchmark csoport!
Interakciók kétértékű változók között Példa: vidék/Bp és férfi/nő dummy + nemek közti kereseti különbség eltér vidéken és Bp-en Négy kategória Budapest vidék
nő férfi 8
Viszonyítási csoport: bp-i nők 2 ekvivalens modell
log( Keri ) 0 1Vidék _ nő i 2 Bp _ ffi i 3Vidék _ ffi i Iski ui log( Keri ) 0 1 ffi i 2 Vidék i 3 Vidék i ffi i Iski ui
Interakciók, példa Bértarifa becslések (benchmark: bp-i nők)
–0,1026 = –0.1726 + 0.0540 + 0.016
Nem állandó regressziós együtthatók 2 csoport esetén
11x1i 2 x2i ui 1. csoportra yi 12 x1i 2 x2i ui 2. csoportra yi 11x1i ( 12 11) Di x1i 2 x2i ui Di 0 az 1. csoportra, Di 1 a 2. csoportra → Kétértékű változó és magyarázó változó interakciója 9
Példa Végzettség hatása nemenként eltér, de feltesszük, hogy életkor hatása azonos
log( Keri ) 0 1Iski 2 Iski ffii 3 Kori ui
Együtthatók stabilitásának vizsgálata Példa: férfiakra – nőkre azonos-e a kereseti modell? Keresztmetszeti vizsgálat (idősor: együttható időbeli stabilitása)
log( Keri ) 1 2 ffi i 1Iski 2 Iski ffi i 3 Kori 4 Kori ffi i ui H0 : 2 0, 2 0, 3 0 F-próba (lehet nem mindhárom együtthatóra is) Probléma: ha N2 < k → Chow-próba (prediktív) használható (ld. 5. hét) Becslési eredmények és tesztstatisztika
10
Dummy függő változó Példák Munkapiac: foglalkoztatott-e Fogyasztás: ingatlan tulajdonos-e Pénzügy: hitelfelvevő csődje Kétértékű függő változó ↔ lineáris modell?
Lineáris valószínűségi modell I. y kétértékű változó
E ( y | x) P( y 1 | x) x Becsült modell: yi xi ui yˆ : y 1 becsült valósz. Nemlineáris modell P( y 1 | x) F (x) ha F a normális eloszlásfv, akkor a probit, ha F(z) = ez/(1 + ez), akkor a logit modellt kapjuk)
Lineáris valószínűségi modell II. 1. probléma: becsült valószínűség [0,1] intervallumon kívül eshet
1.2 1 0.8 0.6 0.4 0.2 0 -0.2
11
Lineáris valószínűségi modell III. 2. probléma: heteroszkedaszticitás:
yi xi ui , E (ui ) 0 xi (1- xi ) valósz. ui xi valósz. 1 xi Var( ui ) (1- xi )( xi ) 2 xi (1- xi ) 2 xi (1- xi ) yˆ i (1 yˆ i ) Megoldás Robosztus SE használata Súlyozott LS: wi yˆi (1 yˆ i )
Lineáris val. modell, példa Függő változó: magán egészségbiztosítással rendelkezik-e (SHARE adatbázis) Magyarázó változók: vagyon, jöv., életkor, végzettség, ország dummyk
Előrejelzett val. hisztogramja INSF 6,000
5,000
Frequency
4,000
3,000
2,000
1,000
0 -0.2
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
12
Szeminárium Többváltozós regresszió III. Feladat: béregyenlet becslése kis bértarifa részminta alapján Változók Iskev (iskolai évek száma) Exp (tapasztalat) Ker (kereset) Teltip (településtípus – kvalitatív változó) Bp (Budapest dummy) Ffi (férfi dummy)
Béregyenlet becslése 1. 1. modell: log(ker) modellezése a versenyszférában iskev, exp, exp2, bp, ffi változókkal, továbbá az iskev, exp változók ffi változóval való interakciójával Különbözik-e szignifikánsan a férfiakra vonatkozó egyenlet a nőkétől? Ffi, iskev*ffi és exp*ffi együtthatók együttes tesztelése Tapasztalat-profil a bp-i, 12 iskolai évvel rendelkező férfiakra Hol a maximum? Tapasztalat-profil ábrázolása konfidencia-intervallummal
Béregyenlet becslése 2. 2. modell: előző modell kiegészítése a változókkal
megyeszékhely és egyéb város dummy
A megyeszékhely és egyéb város hatása egyenlőségének tesztelése három módszerrel 13
Közvetlenül Átalakítás után t-teszttel A korlátozott és korlátozatlan modell R2-ének összehasonlításával Heteroszkedaszticitás tesztelése White- és Breusch-Pagan próbákkal Robusztus standard hibák számítása és összehasonlítása a nem robusztus hibákkal Feladat: munkapiaci részvétel becslése lineáris valószínűségi modellel
14