4EK211 Základy ekonometrie Heteroskedasticita Cvičení 7
Zuzana Dlouhá
Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1.
E(u) = 0 – náhodné vlivy se vzájemně vynulují
2.
E(uuT) = σ2 In – konečný a konstantní rozptyl = homoskedasticita → porušení: heteroskedasticita – náhodné složky jsou sériově nezávislé → porušení: autokorelace
3.
X je nestochastická matice – E(XTu) = 0 – veškerá náhodnost je obsažena v náhodné složce
4.
X má plnou hodnost k – matice X neobsahuje žádné perfektně lineárně závislé sloupce pozorování vysvětlujících proměnných → porušení: multikolinearita 2
Heteroskedasticita - obecně • •
rozptyl náhodné složky σ2 není konečný a konstantní, tj. σ2 je funkcí některé exogenní proměnné náhodná složka může mít v případě heteroskedasticity pro každé pozorování odlišný rozptyl:
Příklad y = počet chyb při psaní na stroji x = počet hodin strávených cvičením y = f(x) + u • •
Počet chyb
E(ui2 ) σ2i konst
Hodiny praxe
čím více hodin cvičení – tím méně chyb rozptyl větší pro skupinu lidí s nižší praxí – někdo se učí rychleji a už od počátku dělá méně chyb než ti, kteří se učí pomaleji a na začátku dělají spoustu chyb – s rostoucím počtem hodin praxe se schopnosti jednotlivců začínají sbližovat a rozptyl se tak zmenšuje 3
Heteroskedasticita - příčiny •
•
•
•
chybná specifikace modelu – vynechání podstatné vysvětlující proměnné – nevhodná funkční forma modelu odhad z prostorových dat se značnou variabilitou v jednom náhodném výběru – variabilita endogenní proměnné (a tedy i reziduí) může být závislá na některé exogenní proměnné chyby měření – s rostoucí hodnotou endogenní proměnné dochází ke kumulaci chyb měření – to zvyšuje rozptyl endogenní proměnné a tedy i rozptyl reziduí odhad z upravených dat – odhad nikoliv na původních pozorováních, ale např. ze skupinových průměrů získaných z tříděných dat
4
Heteroskedasticita - důsledky •
•
bodové odhady parametrů – zůstávají nevychýlené a konzistentní – nemají však minimální rozptyl – tj. nejsou vydatné a ani asymptoticky vydatné odhady směrodatných chyb bodových odhadů (sbi) a rozptylu sigma (s2) jsou vychýlené – intervalové odhady nejsou směrodatné – statistické testy (t-testy, F-test) ztrácejí na síle
5
Heteroskedasticita – testování – grafický test heteroskedasticita ei
homoskedasticita
ei
xi / yi^
xi / yi^
heteroskedasticita
heteroskedasticita
ei
ei
xi / yi^
xi / yi^ 6
Heteroskedasticita – neparametrické testy Spearmanův test korelace pořadí zkoumá korelaci pořadí mezi jednou vysvětlující proměnou a rezidui test je tedy třeba dělat pro každou vysvětlující proměnnou zvlášť!!! počítá se pro konkrétní výběr – třeba pak testovat jeho statistickou významnost pro abstraktní model Postup 1. Absolutní hodnoty reziduí |ei| seřadíme vzestupně a očíslujeme 2. Pořadové číslo přiřadíme k původním (tj. nesrovnaným) reziduím 3. Absolutní hodnoty exogenní proměnné |xi| seřadíme vzestupně a očíslujeme 4. Pořadové číslo přiřadíme k původním (tj. nesrovnaným) hodnotám xi 5. Spočítáme rozdíly v pořadí reziduí a pozorování: di = pořadí |ei| - pořadí |xi| 6. Spočítáme Spearmanův koeficient korelace pořadí: n
re , x 1
6d i2 i 1 2
n(n 1) 7
Heteroskedasticita – neparametrické testy 7. Vyhodnocení: • |re,x| → 0 (resp. |re,x| < 0,8 – 0,9) … je možné očekávat homoskedasticitu • |re,x| → 1 (resp. |re,x| > 0,8 – 0,9) … je možné očekávat heteroskedasticitu • třeba testovat statistickou významnost pro abstraktní model • testuje se přes t-statistiku:
t re ,x
n k 1 t(nk 1) 1 re2,x
Testovaná hypotéza: H0: homoskedasticita H1: heteroskedasticita • •
vypočtená t hodnota > t*1-α/2 (n-k-1) → zamítneme H0 vypočtená t hodnota ≤ t*1-α/2(n-k-1) → nezamítneme H0
8
Heteroskedasticita – neparametrické testy – příklad Soubor: CV6_PR1.xls Data:
y = průměrný roční výnos cenného papíru x = riziko cenného papíru (směrodatná odchylka)
Zadání: Odhadněte závislost průměrného ročního výnosu cenného papíru (y) na riziku (x). Vyhodnoťte heteroskedasticitu s využitím Spearmanova koeficientu korelace pořadí pro α = 0,05. yi = β0 + β1xi + ui,
i = 1, 2,...,10
9
Heteroskedasticita – neparametrické testy Goldfeldův-Quandtův test Postup: 1. zvolíme statisticky významnou proměnnou a seřadíme datový soubor vzestupně podle této proměnné 2. rozdělíme data na dvě stejné poloviny a kolem středu řady vynecháme q hodnot (q ≤ n/4) 3. vypočteme stupně volnosti v
v 4.
n q k 1 2
vypočteme F(v,v) statistiku (odhad 2 modelů v EViews a použít Sum Squared resid)
F (v ,v )
S2 , kde S1
Sj
e
j 1,2
2 j
dělím vyšší hodnotu nižší (F vyjde ≥ 1)
10
Heteroskedasticita – neparametrické testy 5. Vyhodnocení - testovaná hypotéza: H0: homoskedasticita H1: heteroskedasticita F(v,v) > F*(v,v) → zamítám H0 o homoskedasticitě na hladině α, F(v,v) ≤ F*(v,v) → nezamítám H0 o homoskedasticitě na hladině α
11
Heteroskedasticita – neparametrické testy – příklad Soubor: CV6_PR2.xls
Data:
y = spotřební výdaje (tis. USD/rok) x = disponibilní příjem (tis. USD/rok)
Zadání: Odhadněte závislost spotřebních výdajů (y) na disponibilním příjmu (x). Vyhodnoťte heteroskedasticitu • graficky (EViews → scat x resid anebo fit yf (uložím predikované hodnoty y) scat yf resid • s využitím testu Goldfelda-Quandta pro α = 0,05 (EViews → sort x; smpl 1 12; ls y c x; smpl 19 30; ls y c x) • uvažujte logaritmickou transformaci modelu a vyhodnoťte heteroskedasticitu s využitím testu Goldfelda-Quandta pro α = 0,05 (EViews → smpl 1 12; ls @log(y) c @log(x); smpl 19 30; ls @log(y) c @log(x))
yi = β0 + β1xi + ui, i = 1, 2,...,30 12
Heteroskedasticita – parametrické testy • •
testy s pomocnou regresí většinou potřebujeme n ≥ 30
Parkův test • podle Parka je vztah mezi rozptylem a proměnnou (která způsobuje heteroskedasticitu) následovný (pomocná regrese):
σt2 β0 X tβ1evt •
po zlogaritmování:
lnσt2 β0 β1 lnXt vt •
náhodná složka je neměřitelná, takže pomocná regrese přes rezidua:
ln et2 β0 β1 lnXt vt •
parametry modelu odhadneme pomocí MNČ a t-testem vyhodnotíme významnost β1 → H0: homoskedasticita H1: heteroskedasticita
13
Heteroskedasticita – parametrické testy Glejserův test • pomocná regrese na absolutní hodnotě reziduí a formy závislosti:
et β0 β1 X t vt et β1 X t vt et β0 β1
1 vt Xt
et β0 β1 X t vt et β0 β1 X t vt et β0 β1 X t2 vt •
t 1,2, ...,T
parametry modelu odhadneme pomocí MNČ a t-testem vyhodnotíme významnost β1 → H0: homoskedasticita H1: heteroskedasticita 14
Heteroskedasticita – parametrické testy Whiteův test • pomocná regrese: et2 = f(x1, x2, x12, x22, x1*x2,…) + v • •
testuje se koeficient determinace (R2) u této pomocné regrese statistika n* R2 ≈ χ2(k-1) – n = rozsah souboru – k = počet parametrů pomocné regrese
Testovaná hypotéza: H0: homoskedasticita H1: heteroskedasticita n* R2 > tabulková χα2(k-1) ...
zamítáme nulovou hypotézu o homoskedasticitě
EViews – odhad modelu, okno Equation -> View -> Residual Diagnostics White Prob. Chi-Square(k) < 0,01 (α) -> zamítame hypotézu o homoskedasticitě 15
Heteroskedasticita – parametrické testy – příklady Soubor: CV6_PR3.xls Data: vydaje = průměrné měsíční výdaje placené kreditní kartou (v USD) vek = věk (v letech) prijem = příjem (v tis. USD) Zadání: Odhadněte závislost výdajů na věku a příjmu. Vyhodnoťte heteroskedasticitu s využitím Whiteova testu pro α = 0,05. vydajei = β0 + β1veki + β2prijemi + ui,
i = 1, 2,...,72
Výsledek z EViews: Heteroskedasticity Test: White F-statistic 1.317236 Obs*R-squared 6.532993 Scaled explained SS 43.20148
Prob. F(5,66) Prob. Chi-Square(5) Prob. Chi-Square(5)
0.2676 0.2578 0.0000
n* R2 = 6,539 < Χ0,052(5) = 11,070 Prob. Chi-Square(5) = 0,2578 > 0,05 => nezamítáme nulovou hypotézu o homoskedasticitě na α = 0,05 16
Heteroskedasticita – parametrické testy – příklady Soubor: CV6_PR4.xls Data:
prijmy = příjem (v tis. USD) vydaje = výdaje placené kreditní kartou (v tis. USD)
Zadání: Odhadněte závislost výdajů na příjmech. Vyhodnoťte heteroskedasticitu s využitím Whiteova testu pro α = 0,01. vydajei = β0 + β1prijmyi + ui,
i = 1, 2,...,20
Výsledek z EViews: Heteroskedasticity Test: White F-statistic 61.23720 Obs*R-squared 17.56228 Scaled explained SS 6.721933
Prob. F(2,17) Prob. Chi-Square(2) Prob. Chi-Square(2)
0.0000 0.0002 0.0347
n* R2 = 17,562 > Χ0,012(2) = 9,21 Prob. Chi-Square(5) = 0,0002 < 0,01 => zamítáme nulovou hypotézu o homoskedasticitě na α = 0,01 17