Panel adatok elemzése Mikroökonometria, 4. hét Bíró Anikó
A tananyag a Gazdasági Versenyhivatal Versenykultúra Központja és a Tudás-Ökonómia Alapítvány támogatásával készült az ELTE TáTK Közgazdaságtudományi Tanszékének közreműködésével
Panel adatok • Keresztmetszeti és idő dimenzió együtt • Ugyanazokról az egyénekről, háztartásokról, vállalatokról, államokról stb. megfigyelés több időpontban • Megfigyelések függetlenek?
Két időszaki modell yit = β 0 + δ 0 d 2t + β1 xit + ai + uit d2=1 a második időszakban a: meg nem figyelt, időben konstans tényezők – fix hatás u: meg nem figyelt, időben változó tényezők a+u: összetett hibatag Ha a korrelál x változóval: OLS torzított, még ha u korrelálatlan is x változóval
Differenciálás • Differenciálás: „a” kiesik:
∆yi = δ 0 + β1∆xi + ∆ui • Feltevés: ∆x és ∆u függetlenek – OLS használható • Teljesül, ha u független mindkét időpontban megfigyelt x értékektől (szigorú exogenitás)
• Szükséges: ∆x-nek legyen szóródása • x változzon időben • Változás ne legyen azonos minden megfigyelésre • Probléma pl. nem, végzettség, életkor
Differenciálás, folyt. Modell bővíthető: • Több magyarázó változó • Késleltetett hatások Fő probléma: Regresszorok szóródása jelentősen csökkenhet – OLS becslés standard hibája nő
Hatásvizsgálat • Panel adatok alkalmazhatók hatásvizsgálatokra • Két csoport: kontrollcsoport és kezeltek csoportja (treatment group) • Példák: támogatott vs. nem támogatott vállalatok, képzésben résztvevő vs. részt nem vevő egyének • Fontos: vizsgált két időszak között legyen változás a státuszban (kezelt vagy kontrollcsoportba tartozásban)!
Hatásvizsgálat, folyt. Programban részvétel bináris indikátora: prog
yit = β 0 + δ 0 d 2t + β1 prog it + ai + uit βˆ = ∆y − ∆y 1
treat
control
„Differencia a differenciában” becslőfüggvény • Hatásvizsgálat módszerei részletesen: nem tárgya a kurzusnak
Differenciálás, több időszaki modell yit = δ1 + δ 2 d 2t + ... + δ T dTt + β1 xit1 + ... + β k xitk + ai + uit ∆yit = α 0 + α 3d 3t + ... + α T dTt + β1∆xit1 + ... + β k ∆xitk + ∆uit Feltevés : Cov( xitj , uis ) = 0 ∀t,s és j esetén
Kérdés: ∆u autokorrelált? • Tesztelhető • Ha igen: OLS standard hiba becslés torzított
Fixhatás modell • Fixhatás modell: y és x időbeli varianciáját használja fel egyes keresztmetszeti megfigyelési egységeken belül („within estimator”):
yit = β1 xit + ai + uit yi = β1 xi + ai + ui ( yit − yi ) = β1 ( xit − xi ) + uit − ui • OLS becslés
• „Between estimator”: y és x idősoros átlagán keresztmetszeti regresszió – torzított, ha a korrelál x átlagával
Fixhatás modell • OLS torzítatlan, ha x szigorúan exogén • a és x korrelációja nem okoz torzítást • Időben konstans x változók együtthatója nem becsülhető • OLS standard hibák torzítatlanok, ha u autokorrelálatlan és homoszkedasztikus • Alternatív megközelítés: „dummy változó regresszió”: ai fix hatások dummy magyarázó változók lennének (N darab)
Fixhatás (FE) modell vagy differenciálás (FD)? • T = 2: a két módszer azonos • T > 2: • Ha u autokorrelálatlan: FE hatásosabb, standard hibák torzítatlanok • Ha ∆u véletlen bolyongás: FD a jobb • Köztes esetek?
• FE becslés kevésbé érzékeny szigorú exogenitási kritérium sérülésére, de érzékenyebb heteroszkedaszticitársra és autokorrelációra
Véletlenhatás modell yit = β 0 + β1 xit1 + ... + β k xitk + ai + uit Feltevés : Cov( xitj , ai ) = 0 • Korrelálatlanság – keresztmetszeti OLS alkalmazható lenne • De: panel adatokban többlet információ van
• Véletlenhatás (random effect, RE) modell becslése: GLS módszer – összetett hibatagok autokorrelációját kezeli • Ekvivalens: transzformált modell OLS becslése, ld. köv. dia
Véletlenhatás modell becslése vit = ai + uit
Corr (vit , vis ) = σ a /(σ a + σ u ), t ≠ s 2
2
Transzformáció :
[
2
]
1/ 2
λ = 1 − σ u /(Tσ a + σ u ) yit − λyi = β 0 (1 − λ ) + β1 ( xit1 − λxi1 ) + ... + β k ( xitk − λxik ) + (vit − λvi ) 2
2
2
Becsülni kell λ paramétert OLS: λ=0. FE: λ=1.
Véletlenhatás vagy fixhatás modell? • RE modell: időben konstans magyarázó változók együtthatója is becsülhető • Ha a megfigyelések nem tekinthetők véletlen mintának egy nagy populációból: FE • Ha „a” korrelál valamelyik magyarázó változóval: FE • Tesztelhető: Hausman-próba
Gyakorló feladatok • W 13.3: Miért nem alkalmazható differenciálás, ha 2 évben két különböző keresztmetszeti mintánk van? (Exogenitás?) • W 13.9: hulladékégető építésének hatása ingatlanárakra • W 13.11: városban tanuló diákok számának hatása bérleti díjakra
Gyakorló feladatok, folyt. W 14.3: Véletlenhatás modell: transzformált modellben hibatag nulla átlagú, konstans varianciájú és autokorrelálatlan
[ (
vit = ai + uit , λ = 1 − σ u / σ u + Tσ a 2
eit = vit − λvi
2
)]
2 1/ 2
e = v − λv = 0 2 σ u2 2 σu2 − λ σ a + = Var (e) = σ a + + λ σ a + T T T 2 σu2 1 + λ2 − λ = σ a + T Cov(eit , eis ) = Cov(ai + uit − λai − λui , ai + uis − λai − λui ) = 2
σ u2
(
(
)
)
= σ a 1 − 2λ + λ − 2λ 2
2
2
σu2 T
+λ
2
σu2 T
(
)
= σ a σ u / σ u + Tσ a + 2
2
2
2
σu2 T
(
)
σ u / σ u + Tσ a − 2
2
2
σ u2 T
=0
EViews: panel adatok Példa: W 14.8: munkahelyi oktatás támogatásának hatása oktatásra fordított órákra Adat: jtrain.wf1 Idő indikátor: year, keresztmetszeti indikátor: fcode
EViews: panel adatok – adatstruktúra 1. Proc – Structure/Resize current page 2. Dated panel, keresztmetszeti és idő változók megadása, „balance” opciók NE legyenek kijelölve Új adatstruktúra: azonosító: fcode + year
EViews: panel modell becslése • Quick – Estimate equation – LS • Panel options: keresztmetszeti vagy időbeni fix vagy véletlen hatás • Standard hiba becslése: heteroszkedaszticitásra és autokorrelációra robosztus opciók Gyakorlás: W 14.8 feladat megoldása
2. házi feladat W 13.5, 14.2, 14.6