EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

EKONOMETRIE – 9. přednáška Zobecněný lineární regresní model •

Porušení základních podmínek klasického modelu

Metoda zobecněných nejmenších čtverců Jestliže jsou porušeny některé podmínky klasického modelu 1. E(u) = 0 , 2. E (uu`) = σ2In , 3. E(X`u) = 0 , 4. h(X ) = k+1 ≤ n , mluvíme o zobecněném modelu. Zobecněný lineární regresní model Podmínka 1 a) Konstantní střední hodnota •

Jestliže platí pro všechna pozorování E(u) = Θ, potom můžeme zahrnout nenulovou střední hodnotu náhodné složky do úrovňové konstanty modelu

•

E(Yi) = β1 + β2 X2i + ... + βk Xki + Θ

•

nemá vliv na vlastnosti odhadu bj , j=2,...,k,

•

pouze b1 je vychýleným odhadem β1.

b) Nekonstantní střední hodnota •

Jestliže se mění střední hodnota náhodných složek v různých pozorováních E(ui) = Θi

•

Můžeme to považovat za výsledek nezahrnutí vysvětlujících proměnných do modelu a postupovat jako v případě chybné specifikace

Podmínka 2 c) Homoskedasticita a sériová závislost •

Jestliže je první podmínka klasického modelu splněna E(u) = 0,

•

ale druhá podmínka je porušena tak, že platí E (uu`) = σ2V,

•

kde V je známá symetrická pozitivně definitní matice,

•

potom můžeme použít metodu zobecněných nejmenších čtverců

Metoda zobecněných nejmenších čtverců •

Spočívá v transformaci zobecněného modelu pomocí transformační matice P, pro kterou musí platit V-1 = PTP

•

Dostáváme transformovaný model Py = PXβ + Pu, neboli y* = X*β + u*

•

Nyní můžeme již použít metodu nejmenších čtverců

•

Při řešení praktických úloh však většinou matici V neznáme a nemůžeme stanovit transformační matici P

•

Proto nejdříve odhadneme model metodou nejmenších čtverců

•

Matici P pak konstruujeme na základě vypočtených reziduí

•

Způsob transformace je různý v případě heteroskedasticity a v případě autokorelace

Heteroskedasticita •

Heteroskedasticitou rozumíme situaci, kdy je porušena podmínka konečného a konstantního rozptylu náhodných složek

Příčiny: 1) mikroekonomická průřezová data nabývají značně rozdílných hodnot 2) chybná specifikace modelu – chybí vysvětlující proměnné 3) kumulace chyb s rostoucí vysvětlovanou proměnnou 4) použití skupinových průměrů Důsledky: 1) odhady ztrácejí vydatnost a asymptotickou vydatnost 2) odhady nelze počítat stejně jako při homoskedasticitě •

Existují různé formy heteroskedasticity, při kterých se volí různé postupy

•

Nejjednodušší z nich: závislost rozptylu náhodných složek na velikosti pozorování vysvětlujících proměnných: σi2 = xi`α .

•

Potom můžeme odhadovou funkci metody zobecněných nejmenších čtverců psát ve tvaru: b* = (X`V-1X)-1X`V-1y

•

V je diagonální matice s i-tým prvkem xi`α .

•

σi2 se nahradí konzistentním odhadem ei2 z MNČ: ei2 = xi`α + ηi

•

α se nahradí konzistentním odhadem a z MNČ: a = (X`X)-1X`e2

•

Další typy heteroskedasticity v navazujícím kursu

Testy heteroskedasticity •

Spearmenův test korelace pořadí – asi nejjednodušší a nejčastěji používaný

•

Uspořádají se vzestupně nebo sestupně absolutní hodnoty reziduí

•

Stejně se uspořádají pozorování vysvětlující proměnné

•

Spearmenův koeficient korelace pořadí se vypočte podle: rex = 1 −

6∑ d i2 n( n 2 − 1)

•

kde di je diference v pořadí dvojic absolutní hodnoty reziduí a pozorování vysvětlující proměnné

•

Jestliže Spearmenův koeficient korelace pořadí vykazuje hodnoty blízké jedné, potom nastává heteroskedasticita (perfektní závislost znamená nulové diference i jejich druhé mocniny, zlomek nulový a koeficient tedy roven jedné).

Autokorelace •

Porušení předpokladu o vzájemné nezávislosti náhodných složek z různých pozorování: E(ut ,us) ≠ 0

Příčiny 1) Náhodná složka obsahuje nějaký systematicky se měnící faktor – například ekonomickou veličinu, která se explicitně neuvažovala při formulaci modelu – nutnost specifikace další proměnné 2) Špatná specifikace: neodpovídající ekonometrická formulace ekonomické hypotézy, která se projevuje v chybné specifikaci matematické formy modelu, v zanedbání nebo nesprávné specifikaci časového posunu mezi veličinami, ve faktu, že napozorovaná data neumožňují verifikaci hypotézy v důsledku malého počtu pozorování 3) Většina ekonomických časových řad vykazuje setrvačnost. Autokorelace náhodných složek je typickým znakem vývoje veličin v čase. 4) Odhad modelu byl proveden z vyrovnaných dat Důsledky:

1) Odhady parametrů zůstávají nestranné a konzistentní, ale nejsou vydatné ani asymptoticky vydatné. 2) Odhadnuté rozptyly jsou vychýlené, špatně určené intervaly spolehlivosti, nelze použít běžné testy. Autokorelace 1. řádu •

náhodné složky jsou závislé podle vztahu: ut = ρut-1 + εt, t=1,2,...,n,

•

kde |ρ| < 1 koeficient autokorelace 1. řádu

•

εt normálně rozdělená náhodná složka, vyhovuje podmínkám MNČ.

•

Pro náhodné složky platí: E(ut ,us) = ρt-s σ2, E( ut ,ut-1 ) = ρ σ2

•

Jestliže ρ > 0 pozitivní autokorelace – většinou stejná znaménka ρ < 1 negativní autokorelace – znaménka se střídají ρ = 0 sériová nezávislost

Testování autokorelace •

Test reziduí pomocí Durbinovy-Watsonovy statistiky po aplikaci MNČ n

∑ (e d=

t =2

t

− et −1 ) 2

n

∑ et2

, d = 2 (1 – ρ)

t =1

•

•

Mohou nastat následující situace: úplná pozitivní autokorelace

ρ=1

pozitivní autokorelace

d ≤ dL

nezávislost

ρ=0

žádná autokorelace

dL ≤ d ≤ dU

negativní autokorelace

d ≥ dU

úplná negativní autokorelace

ρ = –1

, d=0 , d=2

, d=4

Hodnoty pro Durbinovu-Watsonovu statistiku najdeme v tabulkách. Postup při autokorelaci

1) Zkoumání správnosti specifikace – zahrnutí dalších vysvětlujících proměnných. 2) Transformace pomocí matice P.

•

Pro náhodné složky platí

 1  ρ 2 E (uu`) = σ  ...  ρ n−1 •

ρ 1 ...

ρ n− 2

... ...

ρ n−1   ρ n− 2 

... ...

...  1 

Transformační matice má tvar

 1− ρ2  1  −ρ P= 1 − ρ 2  ...   0

0 ... 0   1 ... 0  ... ... ...  0 1 

•

Jestliže neznáme ρ, můžeme odhadnout z D-W statistiky: r = 1 −

•

Vlastnosti odhadové funkce MZNČ platí pouze asymptoticky.

•

Transformované hodnoty vypočteme podle následujících vztahů  Y 1 − ρ2   1   ρ Y − Y 1  y* =  2  ⋅⋅⋅   Yn − ρYn −1 

•

d 2

 X 1 − ρ2   j1   X − ρ X j1  X*j =  j2  ⋅⋅⋅    X jn − ρYj,n −1   

Na tyto hodnoty je potom možno použít metodu nejmenších čtverců.

Multikolinearita •

Jestliže pro hodnost matice X platí h(X) < k

•

potom nastává perfektní multikolinearita

•

následně nelze stanovit (X`X)-1 a MNČ selhává

•

Jestliže determinant matice |X`X| → 0 , nastává multikolinearita

•

Lze sice stanovit (X`X)-1, ale signalizuje to silnou závislost mezi pozorováními vysvětlujících proměnných

•

Podstatou zkoumání multikolinearity je zjistit intenzitu této závislosti

Příčiny: 1) Tendence časových řad vyvíjet se stejným směrem 2) Používání výběru pozorování 3) Zpožděné proměnné 4) Větší počet vysvětlujících proměnných než je rozsah výběru ( k > n )

Důsledky: 1) Snižuje se přesnost odhadů 2) Při opakovaných výběrech se parametry značně liší 3) Velké standardní chyby způsobují pochybnosti o správnosti specifikace modelu.

Měření významnosti multikolinearity Pro dvě vysvětlující proměnné •

Vypočtou se párové korelační koeficienty

•

Jestliže pro některý je absolutní hodnota větší než 0,8, potom se to bere za významnou multikolinearitu

Pro větší počet vysvětlujících proměnných: •

Multikolinearita se stává neúnosnou, jestliže platí R2 < Rj2

•

Kde R2 koeficient determinace odhadnutého modelu,

•

Rj2 koeficient vícenásobné korelace j-té vysvětlující proměnné a ostatních vysvětlujících proměnných.

Postup při významné multikolinearitě 1) Zvětšit rozsah výběru 2) Využít omezení parametrů z ekonomické teorie 3) Kombinace průřezových dat a časových řad 4) Změna specifikace modelu – vynechání kolineárních vysvětlujících proměnných se statisticky nevýznamnými parametry 5) Transformace pozorování – první diference, podíl proměnných 6) Formální statistické metody vícerozměrné analýzy

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Recommend Documents