4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ
LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE
Upřesnění k pojmům a značení • parametr 𝛽𝑖
• odhad parametru, odhadnutý koeficient, regresní koeficient 𝑏𝑖 , 𝛽𝑖 • směrodatná odchylka (Standard Deviation) • směrodatná chyba (Standard Error) • vektor náhodných složek 𝐮 • vektor reziduí e, 𝐮 Vektory a matice značíme tučně. Vektory se považují za sloupcové, transponované vektory za řádkové.
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
2
1. Gaussovy-Markovovy předpoklady Zapište a vysvětlete G-M předpoklady.
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
3
1. Gaussovy-Markovovy předpoklady Zapište a vysvětlete G-M předpoklady. 1. E(u) = 0 2. E(uuT) = σ2In
3. X je nestochastická matice 4. X je má plnou hodnost
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
4
1. Gaussovy-Markovovy předpoklady První předpoklad: náhodné složky mají identické rozdělení s nulovou střední hodnotou 1. E(u) = 0 Porušení předpokladu: nenulová střední hodnota se promítne do odhadu úrovňové konstanty odhad bude vychýlený
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
5
1. Gaussovy-Markovovy předpoklady Druhý předpoklad: týká se kovarianční matice náhodné složky 2. E(uuT) = σ2In
Co je na diagonále kovarianční matice náhodné složky? Co je mimo diagonálu? Jak by měla při splnění tohoto předpokladu kovarianční matice vypadat?
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
6
1. Gaussovy-Markovovy předpoklady Druhý předpoklad: týká se kovarianční matice náhodné složky 2. E(uuT) = σ2In
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
7
1. Gaussovy-Markovovy předpoklady Druhý předpoklad: týká se kovarianční matice náhodné složky 2. E(uuT) = σ2In autokorelace heteroskedasticita Vysvětlete oba pojmy. Jak v tom případě vypadá kovarianční matice?
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
8
1. Gaussovy-Markovovy předpoklady Třetí předpoklad: nezávislost vysvětlujících proměnných a náhodné složky 3. X je nestochastická matice
simultánní rovnice
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
9
1. Gaussovy-Markovovy předpoklady Čtvrtý předpoklad: matice X nemá lineárně závislé sloupce 4. X má plnou hodnost
perfektní multikolinearita - kdy se s ní můžeme setkat? - v čem je pak „háček“? multikolinearita
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
10
1. Gaussovy-Markovovy předpoklady Jsou-li všechny G-M předpoklady splněny, můžeme použít MNČ a odhady budou nestranné, vydatné a konzistentní.
http://upload.wikimedia.org/wikipedia/commons/thumb/7/70/AAMarkov.jpg/220px-AAMarkov.jpg http://www.magnet.fsu.edu/education/tutorials/pioneers/images/carlfriedrichgauss.jpg
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
11
1. Gaussovy-Markovovy předpoklady Příklad:
Uvažujte model: útrata = β0 + β1mzda + u (útrata je měsíční útrata v Kč, mzda je měsíční mzda v Kč)
1. Respondenti byli vybrání náhodným losováním z populace. Co byste v modelu spíš očekávali: heteroskedasticitu nebo autokorelaci? 2. Který G-M předpoklad bude v tom případě porušen?
CVIČENÍ 3 LINEÁRNÍ REGRESNÍ MODEL
12
2. Vlastnosti MNČ: obecně Při splnění G-M předpokladů můžeme tvrdit, že odhady metodou nejmenších čtverců mají některé vlastnosti: nestrannost vydatnost
konzistence asymptotická nestrannost asymptotická vydatnost
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
13
1. Vlastnosti MNČ: obecně NESTRANNOST
E(b) = β Vychýlená odhadová funkce parametr systematicky podhodnocuje f(b)
E(b) < β
Nestrannost
či nadhodnocuje
E(b) > β ß
b
Zdroj: prezentace Zuzana Dlouhá 4EK211 CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
14
1. Vlastnosti MNČ: obecně VYDATNOST
Vydatnost
f(b)
sb je nejnižší ze všech možných postupů (odhadová funkce má nejmenší rozptyl mezi všemi nestrannými odhadovými funkcemi)
ß
b
Zdroj: prezentace Zuzana Dlouhá 4EK211 CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
15
1. Vlastnosti MNČ: obecně KONZISTENCE (pro velké výběry)
hodnota b s rostoucím rozsahem výběru konverguje ke skutečné hodnotě parametru n
n=1000 n=500 n=200
f(b)
p lim b β
Konzistence
β
b
Zdroj: prezentace Zuzana Dlouhá 4EK211 CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
16
1. Vlastnosti MNČ: obecně ASYMPTOTICKÁ NESTRANNOST (pro velké výběry)
slabší vlastnost než konzistence
p lim E( b) β
Asymptotická nestrannost
n
n=500 n=200
f(b)
Je každý konzistentní odhad i asymptoticky nestranný? Je každý asymptoticky nestranný odhad i konzistentní?
ß
E(b)
Zdroj: prezentace Zuzana Dlouhá 4EK211 CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
17
1. Vlastnosti MNČ: obecně ASYMPTOTICKÁ VYDATNOST (pro velké výběry) Asymptotická vydatnost n=500
f(b)
rozptyl konverguje k nule rychleji v porovnání s jinými konzistentními odhadovými funkcemi
n=200
ß
b
Zdroj: prezentace Zuzana Dlouhá 4EK211 CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
18
1. Vlastnosti MNČ: obecně Budeme pracovat se skriptem Simulace.R
Skript bude na webu, kdybyste si to chtěli doma zkoušet. 1. VYDATNOST: Porovnáme dvě odhadové techniky: MNČ a laický odhad, kdy parametr β1 odhadneme jako směrnici přímky spojující body s nejnižší a nejvyšší hodnotou x. Porovnejte jejich rozptyl. Který odhad je podle vás nestranný? Který je vydatnější? 2. KONZISTENCE: Pomocí simulace se přesvědčíme, že s rostoucím rozsahem výběru konverguje b1 ke skutečné hodnotě parametru β1 Pozn: tohle je „bonus“, kdo jste nebyli na cvičení a neumíte s R,
přijďte, pokud vás to zajímá, a pusťte to z hlavy, pokud vás to nezajímá
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
19
2. Vlastnosti MNČ: Monte Carlo simulace Otevřete soubor Simulace.xlsx (Zdroj: Krkošková, Ráčková, Zouhar: Základy ekonometrie v příkladech, 2010)
1. Vygenerujte hodnoty náhodné složky (funkce NORM.INV) 2. Spočítejte hodnoty Y.
3. Odhadněte parametry regresní přímky (funkce INTERCEPT, SLOPE) 4. Opakujte několikrát a sledujte, jak se mění graf. (klávesa F9)
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
20
2. Vlastnosti MNČ: Monte Carlo simulace 5. Pomocí Tabulky dat zopakujte totéž pro 500 různých výběrů.
6. Podívejte se na histogram četností odhadů b0, b1. Připomíná vám nějaké známé rozdělení?
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
21
3. Rozdělení odhadové funkce b Předpokládejme, že náhodná složka má rozdělení: 𝐮 ~𝑁(𝟎, 𝜎 2 𝐈𝑛 ) Rozdělení odhadové funkce b:
𝐛 ~𝑁(𝛃, 𝜎 2 𝐗´𝐗
−1 )
Střední hodnota: E(𝐛) ~𝛃 Kovarianční matice (pro 1 vysvětlující proměnnou) 𝑉𝐴𝑅(𝑏0 ) 𝐶𝑂𝑉(𝑏1 , 𝑏0 )
𝐶𝑂𝑉(𝑏0 , 𝑏1 ) 𝑉𝐴𝑅(𝑏1 )
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
22
3. Rozdělení odhadové funkce b Problém je, že rozptyl náhodné složky 𝝈𝟐 v praxi neznáme.
Můžeme jej ale odhadnout z reziduí: 𝑠2
1 = 𝑛−𝑘−1
𝑛
𝑒𝑡2 𝑡=1
Odhad kovarianční matice b pak získáme jako S(b) = 𝑠 2 𝐗´𝐗
−1
Odmocniny diagonálních prvků S(b) jsou tzv. směrodatné chyby (Std. Error, pracovali jsme s nimi v EViews už minule)
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
23
3. Rozdělení odhadové funkce b V sešitu Simulace je list Vyber.
V něm je jeden konkrétní výběr při respektování parametrů z předchozí simulace. 1. Najděte odhad rozptylu náhodné složky. 2. Najděte odhad kovarianční matice odhadnutých koeficientů b0, b1.
3. Najděte odhady směrodatných chyb odhadnutých koeficientů b0, b1. Porovnejte odhad sm. chyb odhadnutých koeficientů b0, b1 s údaji zjištěnými během předchozí Monte Carlo simulace. (výsledky: viz samotný Excel)
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
24
3. Rozdělení odhadové funkce b Otevřete si tatáž data v EViews: soubor Vyber.wf1
1. Odhadněte a zapište regresní přímku. 2. Najděte v EViews odhad směrodatné odchylky reziduí. Jak souvisí s RSS? 3. Najděte v EViews odhad směrodatných chyb odhadnutých koeficientů b0, b1.
4. Najděte v EViews odhad kovarianční matice odhadnutých koeficientů b0, b1.
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
25
3. Rozdělení odhadové funkce b Otevřete si tatáž data v EViews: soubor Vyber.wf1 1. Odhadněte a zapište regresní přímku: 𝑦 = −3,5 + 10,68𝑥 4. Najděte v EViews odhad kovarianční matice odhadnutých koeficientů b0, b1 View Covariance Matrix
CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
26
Na doma: Co byste měli umět 1. Jaké jsou G-M předpoklady a co znamenají?
2. Jaké jsou vlastnosti odhadů MNČ? 3. Co tyto vlastnosti přesně znamenají? (co je to přesně vydatnost, jaký je rozdíl mezi konzistencí a asymptotickou nestranností…)
4. Jaké rozdělení má b (za předpokladu normality náhodné složky)? 5. Jak lze odhadnout rozptyl náhodné složky? Jak jej zjistíme z EViews?
6. Jak lze odhadnout kovarianční matici b a jak z ní zjistíme odhady směrodatných chyb? Kde to všechno najdeme v EViews? CVIČENÍ 4 STATISTICKÉ VLASTNOSTI MNČ
27