4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita
LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE
1. Heteroskedasticita - teorie Druhý GM předpoklad: týká se kovarianční matice náhodné složky
2. E(uuT) = σ2In
Rozptyl náhodných složek je konečný a konstantní: 𝐸 𝑢𝑖2 = 𝜎 2 homoskedasticita
CVIČENÍ 10 HETEROSKEDASTICITA
1. Heteroskedasticita - teorie Pokud platí, že 𝐸 𝑢𝑖2 = 𝜎𝑖2 heteroskedasticita Rozptyl náhodných složek není stejný pro všechna pozorování. Př:
Zdroj: http://www.acastat.com/Statbook/molsassump018.jpg
CVIČENÍ 10 HETEROSKEDASTICITA
1. Heteroskedasticita - příčiny Průřezová data: variabilita vysvětlované proměnné, a tedy i reziduí, může být závislá na některé vysvětlující proměnné Chyby měření: s rostoucí hodnotou endogenní proměnné dochází ke kumulaci chyb měření, což zvyšuje rozptyl endogenní proměnné, a tedy i rozptyl reziduí
Chybná specifikace modelu: vynechání podstatné proměnné, nevhodná funkční forma Odhad z upravených dat (skupinové průměry apod.) Zdroj: Zuzana Dlouhá - prezentace
CVIČENÍ 10 HETEROSKEDASTICITA
1. Heteroskedasticita - důsledky • Odhady jsou nestranné a konzistentní, ale nejsou vydatné ani asymptoticky vydatné
• Odhad rozptylu náhodné složky a odhady směrodatných chyb odhadnutých koeficientů jsou vychýlené (problém - potřebujeme je při testování hypotéz a konstrukci intervalů spolehlivosti)
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Data: vacation.wf1 Zdroj: ECON2300, University of Queensland, 2012 Proměnné: miles:
počet mil ujetých za rok
income:
roční příjem (tis. USD)
age:
průměrný věk dospělých členů domácnosti
kids:
počet dětí
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 𝑚𝑖𝑙𝑒𝑠 = 𝛽0 + 𝛽1 𝑖𝑛𝑐𝑜𝑚𝑒 + 𝛽2 𝑎𝑔𝑒 + 𝛽3 𝑘𝑖𝑑𝑠 + 𝑢 Vykreslete rezidua oproti proměnným age a income.
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 2,000
1,500
1,500
1,000
1,000
500
500
E
E
2,000
0
0
-500
-500
-1,000
-1,000
-1,500
-1,500
20
25
30
35
40
45
50
55
60
0
AGE
20
40
60 INCOME
CVIČENÍ 10 HETEROSKEDASTICITA
80
100
120
2. Heteroskedasticita - příklad 1 Goldfeldův-Quandův test (neparametrický) ◦ H0: homoskedasticita ◦ H1: heteroskedasticita 1. Seřadíme pozorování podle proměnné income (sestupně) Proc Sort Current Page (income, descending)
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Goldfeldův-Quandův test (neparametrický) 2. Rozdělíme data na dvě stejné poloviny, kolem středu můžeme vynechat q hodnot (q ≤ n/4) 3. Vypočteme stupně volnosti: v =
𝑛−𝑞 2
− 𝑘 − 1 = 96
4. Odhadneme dvě regrese pro jednotlivé poloviny dat - zjistíme součty čtverců reziduí s1 a s2 a spočítáme testovou statistiku: F(v,v) = s2 / s1 5. Porovnáme s F* s (v, v) stupni volnosti
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 sample 1 100
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 sample 101 200
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Goldfeldův-Quandův test (neparametrický) 4. Odhadneme dvě regrese pro jednotlivé poloviny dat - zjistíme součty čtverců reziduí s1 a s2 a spočítáme testovou statistiku: F(v,v) = s2 / s1 = 29635382 / 10251955 = 2,89
5. Porovnáme s F* s (v, v) stupni volnosti - 5% hladina významnosti
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Goldfeldův-Quandův test (neparametrický) 4. Odhadneme dvě regrese pro jednotlivé poloviny dat - zjistíme součty čtverců reziduí s1 a s2 a spočítáme testovou statistiku: F(v,v) = s2 / s1 = 29635382 / 10251955 = 2,89
5. Porovnáme s F0,95(96, 96) = 1,405
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Goldfeldův-Quandův test (neparametrický) 2,89 > 1,405 zamítáme nulovou hypotézu o homoskedasticitě
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Parametrické testy
pomocné regrese k posouzení, zda rozptyl náhodné složky závisí na některé / některých z vysvětlujících proměnných. Hodnoty náhodné složky neznáme,
používáme rezidua.
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Parametrické testy H0: homoskedasticita H1: heteroskedasticita Parkův: 𝑙𝑛𝑒𝑖2 = 𝛽0 + 𝛽1 𝑙𝑛𝑋𝑖 + 𝑣𝑖 t-test
Glejserův: |𝑒𝑖 | = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖 |𝑒𝑖 | = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖 |𝑒𝑖 | = 𝛽0 + …
1 𝛽1 𝑋𝑖
+ 𝑣𝑖 t-test
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Parametrické testy
H0: homoskedasticita H1: heteroskedasticita Whiteův:
Závislost druhé mocniny reziduí na vysvětlujících proměnných z původní regrese, jejich druhých mocninách, příp. i násobcích 𝑒𝑖2 = 𝛽0 +𝛽1 𝑋1𝑖 +𝛽2 𝑋2𝑖 + 𝛽3 𝑋1𝑖 2 +𝛽4 𝑋2𝑖 2 +𝛽5 𝑋1𝑖 𝑋2𝑖 + 𝑣𝑖
𝑛 ∙ 𝑅2 ~ chí-kvadrát rozdělení s k stupni volnosti (n počet pozorování, k počet vysvětlujících proměnných v pomocné regresi) 𝑛 ∙ 𝑅2 > χ2k zamítáme nulovou hypotézu o homoskedasticitě CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita View Residual Tests Heteroskedasticity tests
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Metoda zobecněných nejmenších čtverců Zvolíme vhodnou transformační matici T. Pronásobíme maticí T proměnné původního modelu a odhadneme nový model s takto upravenými proměnnými. Náhodná složka tohoto nového modelu už bude splňovat G-M předpoklady. Musíme však zvolit vhodnou matici T.
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Metoda zobecněných nejmenších čtverců
Př: rozptyl je funkcí čtverců některé vysvětlující proměnné x 𝜎𝑖2 = 𝜎 2 𝑥𝑖2 vydělíme 𝑥𝑖
Zdroj: Zuzana Dlouhá, prezentace
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Metoda zobecněných nejmenších čtverců
Př: rozptyl je funkcí čtverců některé vysvětlující proměnné x 𝜎𝑖2 = 𝜎 2 𝑥𝑖2 vydělíme 𝑥𝑖 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝑢𝑖 𝑦𝑖 𝑥𝑖
=
𝛽0 𝑥𝑖
+ 𝛽1 +
𝑢𝑖 𝑥𝑖
kde 𝜎𝑖2 = 𝐸(𝑢𝑖2 ) = 𝜎 2 𝑥𝑖2 tzn.:
𝑢𝑖 2 1 E( ) = 2 𝐸(𝑢𝑖2 ) 𝑥𝑖 𝑥𝑖
CVIČENÍ 10 HETEROSKEDASTICITA
=
1 2𝑥 2) (𝜎 𝑖 𝑥𝑖2
= 𝜎2
2. Heteroskedasticita - příklad 1 Metoda zobecněných nejmenších čtverců
Př: rozptyl je funkcí některé vysvětlující proměnné x 𝜎𝑖2 = 𝜎 2 𝑥𝑖 vydělíme 𝑥𝑖
Zdroj: Zuzana Dlouhá, prezentace
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Na původní model 𝑚𝑖𝑙𝑒𝑠 = 𝛽0 + 𝛽1 𝑖𝑛𝑐𝑜𝑚𝑒 + 𝛽2 𝑎𝑔𝑒 + 𝛽3 𝑘𝑖𝑑𝑠 + 𝑢
použijte metodu zobecněných nejmenších čtverců. Předpokládejte přitom, že 𝜎𝑖2 = 𝜎 2 𝑖𝑛𝑐𝑜𝑚𝑒𝑖2
Estimate Equation Options Weighted LS/TSLS Weight 1/income (EViews 6) Estimate Equation -> Options -> type = Standard deviation, weight series = income (Eviews 8) Přesvědčte se Whiteovým testem, že se nám podařilo odstranit heteroskedasticitu.
CVIČENÍ 10 HETEROSKEDASTICITA
2. Heteroskedasticita - příklad 1 Na původní model 𝑚𝑖𝑙𝑒𝑠 = 𝛽0 + 𝛽1 𝑖𝑛𝑐𝑜𝑚𝑒 + 𝛽2 𝑎𝑔𝑒 + 𝛽3 𝑘𝑖𝑑𝑠 + 𝑢
použijte metodu zobecněných nejmenších čtverců. Předpokládejte přitom, že 𝜎𝑖2 = 𝜎 2 𝑖𝑛𝑐𝑜𝑚𝑒𝑖2 Ručně: 1) Odhadnout model:
𝑚𝑖𝑙𝑒𝑠 𝑖𝑛𝑐𝑜𝑚𝑒
=
1 𝛽0 𝑖𝑛𝑐𝑜𝑚𝑒
+ 𝛽1 +
2) Pronásobit zpět proměnnou income CVIČENÍ 10 HETEROSKEDASTICITA
𝑎𝑔𝑒 𝛽2 𝑖𝑛𝑐𝑜𝑚𝑒
+
𝑘𝑖𝑑𝑠 𝛽3 𝑖𝑛𝑐𝑜𝑚𝑒
+𝑢∗
2. Heteroskedasticita - příklad 1
CVIČENÍ 10 HETEROSKEDASTICITA
3. Heteroskedasticita - příklad 2 Data: research.wf1 (zdroj: Zuzana Dlouhá, prezentace)
Proměnné: rd = výdaje na výzkum a vývoj, sales = prodeje (obojí mil. USD) Odhadněte model: 𝑟𝑑 = 𝛽0 + 𝛽1 𝑠𝑎𝑙𝑒𝑠 + 𝑢 Otestujte Whiteovým testem, jestli je v modelu heteroskedasticita (na 10% hladině významnosti), a pokud ano, pokuste se ji odstranit.
CVIČENÍ 10 HETEROSKEDASTICITA
Na doma: Co byste měli umět 1. Co je to heteroskedasticita?
2. Co je příčinou a důsledkem heteroskedasticity? 3. Jaké existují testy na heteroskedasticitu? 4. Jak otestovat přítomnost heteroskedasticity Whiteovým testem?
5. Co je to MZNČ? 6. Jak odstranit z modelu heteroskedasticitu?
CVIČENÍ 10 HETEROSKEDASTICITA