EKONOMETRIE – 9. přednáška Zobecněný lineární regresní model •
Porušení základních podmínek klasického modelu
Metoda zobecněných nejmenších čtverců Jestliže jsou porušeny některé podmínky klasického modelu 1. E(u) = 0 , 2. E (uu`) = σ2In , 3. E(X`u) = 0 , 4. h(X ) = k+1 ≤ n , mluvíme o zobecněném modelu. Zobecněný lineární regresní model Podmínka 1 a) Konstantní střední hodnota •
Jestliže platí pro všechna pozorování E(u) = Θ, potom můžeme zahrnout nenulovou střední hodnotu náhodné složky do úrovňové konstanty modelu
•
E(Yi) = β1 + β2 X2i + ... + βk Xki + Θ
•
nemá vliv na vlastnosti odhadu bj , j=2,...,k,
•
pouze b1 je vychýleným odhadem β1.
b) Nekonstantní střední hodnota •
Jestliže se mění střední hodnota náhodných složek v různých pozorováních E(ui) = Θi
•
Můžeme to považovat za výsledek nezahrnutí vysvětlujících proměnných do modelu a postupovat jako v případě chybné specifikace
Podmínka 2 c) Homoskedasticita a sériová závislost •
Jestliže je první podmínka klasického modelu splněna E(u) = 0,
•
ale druhá podmínka je porušena tak, že platí E (uu`) = σ2V,
•
kde V je známá symetrická pozitivně definitní matice,
•
potom můžeme použít metodu zobecněných nejmenších čtverců
Metoda zobecněných nejmenších čtverců •
Spočívá v transformaci zobecněného modelu pomocí transformační matice P, pro kterou musí platit V-1 = PTP
•
Dostáváme transformovaný model Py = PXβ + Pu, neboli y* = X*β + u*
•
Nyní můžeme již použít metodu nejmenších čtverců
•
Při řešení praktických úloh však většinou matici V neznáme a nemůžeme stanovit transformační matici P
•
Proto nejdříve odhadneme model metodou nejmenších čtverců
•
Matici P pak konstruujeme na základě vypočtených reziduí
•
Způsob transformace je různý v případě heteroskedasticity a v případě autokorelace
Heteroskedasticita •
Heteroskedasticitou rozumíme situaci, kdy je porušena podmínka konečného a konstantního rozptylu náhodných složek
Příčiny: 1) mikroekonomická průřezová data nabývají značně rozdílných hodnot 2) chybná specifikace modelu – chybí vysvětlující proměnné 3) kumulace chyb s rostoucí vysvětlovanou proměnnou 4) použití skupinových průměrů Důsledky: 1) odhady ztrácejí vydatnost a asymptotickou vydatnost 2) odhady nelze počítat stejně jako při homoskedasticitě •
Existují různé formy heteroskedasticity, při kterých se volí různé postupy
•
Nejjednodušší z nich: závislost rozptylu náhodných složek na velikosti pozorování vysvětlujících proměnných: σi2 = xi`α .
•
Potom můžeme odhadovou funkci metody zobecněných nejmenších čtverců psát ve tvaru: b* = (X`V-1X)-1X`V-1y
•
V je diagonální matice s i-tým prvkem xi`α .
•
σi2 se nahradí konzistentním odhadem ei2 z MNČ: ei2 = xi`α + ηi
•
α se nahradí konzistentním odhadem a z MNČ: a = (X`X)-1X`e2
•
Další typy heteroskedasticity v navazujícím kursu
Testy heteroskedasticity •
Spearmenův test korelace pořadí – asi nejjednodušší a nejčastěji používaný
•
Uspořádají se vzestupně nebo sestupně absolutní hodnoty reziduí
•
Stejně se uspořádají pozorování vysvětlující proměnné
•
Spearmenův koeficient korelace pořadí se vypočte podle: rex = 1 −
6∑ d i2 n( n 2 − 1)
•
kde di je diference v pořadí dvojic absolutní hodnoty reziduí a pozorování vysvětlující proměnné
•
Jestliže Spearmenův koeficient korelace pořadí vykazuje hodnoty blízké jedné, potom nastává heteroskedasticita (perfektní závislost znamená nulové diference i jejich druhé mocniny, zlomek nulový a koeficient tedy roven jedné).
Autokorelace •
Porušení předpokladu o vzájemné nezávislosti náhodných složek z různých pozorování: E(ut ,us) ≠ 0
Příčiny 1) Náhodná složka obsahuje nějaký systematicky se měnící faktor – například ekonomickou veličinu, která se explicitně neuvažovala při formulaci modelu – nutnost specifikace další proměnné 2) Špatná specifikace: neodpovídající ekonometrická formulace ekonomické hypotézy, která se projevuje v chybné specifikaci matematické formy modelu, v zanedbání nebo nesprávné specifikaci časového posunu mezi veličinami, ve faktu, že napozorovaná data neumožňují verifikaci hypotézy v důsledku malého počtu pozorování 3) Většina ekonomických časových řad vykazuje setrvačnost. Autokorelace náhodných složek je typickým znakem vývoje veličin v čase. 4) Odhad modelu byl proveden z vyrovnaných dat Důsledky:
1) Odhady parametrů zůstávají nestranné a konzistentní, ale nejsou vydatné ani asymptoticky vydatné. 2) Odhadnuté rozptyly jsou vychýlené, špatně určené intervaly spolehlivosti, nelze použít běžné testy. Autokorelace 1. řádu •
náhodné složky jsou závislé podle vztahu: ut = ρut-1 + εt, t=1,2,...,n,
•
kde |ρ| < 1 koeficient autokorelace 1. řádu
•
εt normálně rozdělená náhodná složka, vyhovuje podmínkám MNČ.
•
Pro náhodné složky platí: E(ut ,us) = ρt-s σ2, E( ut ,ut-1 ) = ρ σ2
•
Jestliže ρ > 0 pozitivní autokorelace – většinou stejná znaménka ρ < 1 negativní autokorelace – znaménka se střídají ρ = 0 sériová nezávislost
Testování autokorelace •
Test reziduí pomocí Durbinovy-Watsonovy statistiky po aplikaci MNČ n
∑ (e d=
t =2
t
− et −1 ) 2
n
∑ et2
, d = 2 (1 – ρ)
t =1
•
•
Mohou nastat následující situace: úplná pozitivní autokorelace
ρ=1
pozitivní autokorelace
d ≤ dL
nezávislost
ρ=0
žádná autokorelace
dL ≤ d ≤ dU
negativní autokorelace
d ≥ dU
úplná negativní autokorelace
ρ = –1
, d=0 , d=2
, d=4
Hodnoty pro Durbinovu-Watsonovu statistiku najdeme v tabulkách. Postup při autokorelaci
1) Zkoumání správnosti specifikace – zahrnutí dalších vysvětlujících proměnných. 2) Transformace pomocí matice P.
•
Pro náhodné složky platí
1 ρ 2 E (uu`) = σ ... ρ n−1 •
ρ 1 ...
ρ n− 2
... ...
ρ n−1 ρ n− 2
... ...
... 1
Transformační matice má tvar
1− ρ2 1 −ρ P= 1 − ρ 2 ... 0
0 ... 0 1 ... 0 ... ... ... 0 1
•
Jestliže neznáme ρ, můžeme odhadnout z D-W statistiky: r = 1 −
•
Vlastnosti odhadové funkce MZNČ platí pouze asymptoticky.
•
Transformované hodnoty vypočteme podle následujících vztahů Y 1 − ρ2 1 ρ Y − Y 1 y* = 2 ⋅⋅⋅ Yn − ρYn −1
•
d 2
X 1 − ρ2 j1 X − ρ X j1 X*j = j2 ⋅⋅⋅ X jn − ρYj,n −1
Na tyto hodnoty je potom možno použít metodu nejmenších čtverců.
Multikolinearita •
Jestliže pro hodnost matice X platí h(X) < k
•
potom nastává perfektní multikolinearita
•
následně nelze stanovit (X`X)-1 a MNČ selhává
•
Jestliže determinant matice |X`X| → 0 , nastává multikolinearita
•
Lze sice stanovit (X`X)-1, ale signalizuje to silnou závislost mezi pozorováními vysvětlujících proměnných
•
Podstatou zkoumání multikolinearity je zjistit intenzitu této závislosti
Příčiny: 1) Tendence časových řad vyvíjet se stejným směrem 2) Používání výběru pozorování 3) Zpožděné proměnné 4) Větší počet vysvětlujících proměnných než je rozsah výběru ( k > n )
Důsledky: 1) Snižuje se přesnost odhadů 2) Při opakovaných výběrech se parametry značně liší 3) Velké standardní chyby způsobují pochybnosti o správnosti specifikace modelu.
Měření významnosti multikolinearity Pro dvě vysvětlující proměnné •
Vypočtou se párové korelační koeficienty
•
Jestliže pro některý je absolutní hodnota větší než 0,8, potom se to bere za významnou multikolinearitu
Pro větší počet vysvětlujících proměnných: •
Multikolinearita se stává neúnosnou, jestliže platí R2 < Rj2
•
Kde R2 koeficient determinace odhadnutého modelu,
•
Rj2 koeficient vícenásobné korelace j-té vysvětlující proměnné a ostatních vysvětlujících proměnných.
Postup při významné multikolinearitě 1) Zvětšit rozsah výběru 2) Využít omezení parametrů z ekonomické teorie 3) Kombinace průřezových dat a časových řad 4) Změna specifikace modelu – vynechání kolineárních vysvětlujících proměnných se statisticky nevýznamnými parametry 5) Transformace pozorování – první diference, podíl proměnných 6) Formální statistické metody vícerozměrné analýzy