5EN306 Aplikované kvantitativní metody I Přednáška 5
Zuzana Dlouhá
Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam popisných charakteristik 4. Vicenásobná regrese v ekonomické analýze 5. Vicenásobná regrese: DUMMY proměnné a jejich interakce 6. Difference in differences estimator 7. First Differencing a Fixed Effects 8. Instrumentální proměnné, Panelová data 9. Testy robustnosti 10. Úvod do časových řad (zbyde-li čas) •
témata se prolínají
2
Základy ekonometrie – vícenásobná regrese •
kap. 3 – vícenásobný lineární regresní model
• • •
lepší analýza ceteris paribus, protože explicitně umožňuje kontrolovat ostatní faktory, které simultánně ovlivňují vysvětlovanou proměnnou vytvořit lepší model pro predikci vysvětlované proměnné zahrnout obecnější funkční formy
•
lineární regrese – lineární v parametrech, ne v proměnných!!!
3
Základy ekonometrie – vícenásobná regrese •
MNČ ve vícenásobné regresi: – náhodný výběr – rezidua (odchylky) regrese
– minimalizuji sumu čtverců rezidui
• interpretace – ceteris paribus
4
Základy ekonometrie – vlastnosti MNČ • •
vlastnosti MNČ pro každý výběr odhadnuté (fitované) hodnoty a rezidua
algebraické vlastnosti MNČ: • suma reziduí je rovna 0 •
korelace reziduí a vysvětlujících proměnných je rovna 0
•
výběrové průměry regresorů x a y leží na regresní přímce
•
koeficient determinace
5
Základy ekonometrie – G-M předpoklady Gauss-Markovy předpoklady 1. Populační model je lineární v parametrech: 2. Výběrový soubor o velikosti n je získán z populace náhodným výběrem:
3. Neexistuje perfektní kolinearita mezi regresory – malý výběr: – vztahy mezi regresory: 4. Podmíněná střední hodnota náhodné složky je rovna 0:
6
Základy ekonometrie – G-M předpoklady Endogenní vs. exogenní proměnné • předpoklad 4 je splněn, pokud jsou všechny vysvětlující (exogenní) proměnné nezávislé na náhodné složce, v případě závislosti jsou endogenní, endogenita je tedy porušení předpokladu 4 • naopak, závislá (endogenní) proměnná modelu je funkcí systematické i náhodné složky •
pokud jsou splněny předpoklady 1 až 4 je MNČ estimátor nestranný (Theorem 3.1 – Unbiasedness of OLS)
Irelevantní a chybějící proměnné • chyby specifikace modelu – (ne)zahrnutí regresorů • pokud zahrneme do modelu irelevantní proměnnou (přespecifikujeme model), nemá chyba specifikace žádný efekt na nestrannost estimátorů (očekávaná hodnota příslušného koeficientu je nula) – pozor, může mít negativní efekt na rozptyl estimátorů • pokud nezahrneme do modelu relevantní proměnnou (model podspecifikujeme), estimátory mohou být vychýlené
7
Základy ekonometrie – G-M předpoklady Zahrnutí irelevantní proměnné • skutečná (populační) regresní funkce: •
odhadovaná rovnice (v populační regresní funkci platí β3 = 0):
•
při dohadu MNČ platí – pro konkrétní výběr (i = 1, 2, …, n) obecně platí 𝛽3 ≠ 0 – je-li výběrová korelace mezi x3 a ostatními regresory nenulová, pak se rozptyl estimátorů zvýší
8
Základy ekonometrie – chybějící regresory Chybějící regresory • skutečná (populační) regresní funkce: •
odhadovaná rovnice (vynechám důležitou proměnnou x2):
•
jsou-li x1 a x2 korelované, předpokládejme mezi nimi lineární regresní vztah ve formě:
•
odhadnuté koeficienty budou vychýlené (biased) 𝛽1 = 𝛽1 + 𝛽2 𝛿1 E 𝛽1 = 𝛽1 + 𝛽2 𝛿1 Bias 𝛽1 = E 𝛽1 − 𝛽1 = 𝛽2 𝛿1
9
Základy ekonometrie – chybějící regresory • •
odchylka (bias) závisí na znaménku 𝛽2 a na znaménku u korelace mezi regresory 𝛿1 při stejných znaménkách je odchylka pozitivní, při rozdílných negativní:
•
předpokládejme obecnější model
•
vynecháme x3
• •
nelze obecně/snadno popsat směr či mechanismus odchylky podobně komplikovaná situace nastane při vynechání více než jedné důležité vysvětlující proměnné 10
Základy ekonometrie – chybějící regresory – příklad •
skutečná (populační) regresní funkce
•
platí
•
když vynecháme abil:
•
potom odhadnutý (overestimated)
kladné hodnoty
efekt
vzdělání
educ
bude
nadhodnocený
Kdy není estimátor vychýlený při vynechání regresoru? • regresory jsou navzájem nekorelované (δ1 = 0) • vynechaná proměnná je irelevantní (nepatří do skutečné (populační) regresní funkce)
11
Základy ekonometrie – G-M předpoklady 5. Podmíněný rozptyl náhodné složky je konstantní a konečný (homoskedasticita)
kde • tento předpoklad 5 není pro nestrannost MNČ nutný (nedodržení negativně ovlivňuje rozptyl MNČ estimátorů)
12
Základy ekonometrie – G-M předpoklady •
pokud jsou splněny předpoklady 1 až 5, jsou rozptyly estimátorů podmíněně na hodnotách vysvětlujících proměnných v daném výběru dány vztahem (Theorem 3.2 – Sampling variances of OLS slope estimators)
pomocné regrese xj ← ostatní regresory. •
pokud jsou splněny předpoklady 1 až 5, je nestranný estimátor rozptylu náhodné složky dán vztahem
•
standardní chyba odhadu
13
Základy ekonometrie – G-M předpoklady
• • •
rozptyl každého estimátoru 𝛽𝑗 se zvyšuje s rostoucím rozptylem náhodných složek σ2 a se zvyšující se lineární závislostí mezi xj a ostatními regresory 𝑅𝑗2 rozptyl každého estimátoru se snižuje s výberovým rozptylem příslušné proměnné SSTj multikolinearita – vysoká korelace mezi dvěma či více vysvětlujícími proměnnými (je vlastností konkrétního výběru)
•
hodnota VIF by neměla přesahovat hodnotu 10 pro případ únosné multikolinearity
•
zařazení irelevantní proměnné zvyšuje rozptyl estimátoru 𝛽𝑗 , pokud existuje lineární závislost mezi xj a irelevantním regresorem – tj. pokud irelevantní proměnná zvýší 𝑅𝑗2
14
Základy ekonometrie – G-M předpoklady Vynechání důležité vysvětlující proměnné: • odhady jsou zkreslené • může dojít ke snížení rozptylu estimátorů •
pokud jsou splněny předpoklady 1 až 5, tak je nestranný estimátor rozptylu náhodné složky dán vztahem (Theorem 3.3 - Unbiased estimator of the error variance):
•
pokud jsou splněny předpoklady 1 až 5, je MNČ nejlepším lineárním nestranným estimátorem β BLUE – Best Linear Unbiased Estimator, kde lineární znamená:
•
libovolná funkce výběrových pozorování všech regresorů
a nejlepší - má mezi všemi lineárními nestrannými estimátory nejmenší rozptyl 15
Základy ekonometrie – statistická indukce • •
• • • •
kap. 4 v KLRM je pro intervalový odhad k pěti G-M předpokladům přidán předpoklad normality (Theorem 4.1 Normal sampling distributions) náhodné složky jsou normálně rozdělené a nezávislé na předpoklad 6 dubluje G-M předpoklady 2, 4 a 5, navíc přidává normalitu náhodné složky pokud je splněno všech šest předpokladů KLRM, mají MNČ estimátory nejmenší rozptyl ze všech možných nestranných estimátorů pro KLRM předpoklady 1-5 (tj. G-M předpoklady) je MNČ nejlepší jen ze všech lineárních nestranných estimátorů
Pokud je splněno všech šest předpokladů KLRM, platí: 1. variabilita y|x pochází z náhodné složky 2. je-li náhodná složka normálně rozdělena, řídí se β také N-rozdělením 3. normovaná odchylka odhadnutého parametru od skutečného:
16
Základy ekonometrie – statistická indukce •
pokud je splněno všech šest předpokladů KLRM, platí
•
při rostoucích stupních volnosti se t-rozdělení přibližuje normovanému normálnímu rozdělení, pokud je počet stupňů volnosti vyšší než 120, je rozdíl prakticky zanedbatelný
•
pravostranný (right-tail)
•
pro t > t* zamítneme H0
17
Základy ekonometrie – statistická indukce •
levostranný (left-tail)
pro t < -t* zamítneme H0
•
oboustranný (two-sided / two-tail t-test)
pro І t І > t* zamítneme H0
18
Testy hypotéz v KLRM – alternativní t-testy Oboustranný (two-sided / two-tail t-test) H0: β1 = 0 H0: β1 = 0,3 H1: β1 ≠ 0 H1: β1 ≠ 0,3 0,5091 − 0 𝑡 = = 14,24 0,0357
𝑡 =
0,5091 − 0,3 = 5,86 0,0357
H0: β1 = − 0,3 H1: β1 ≠ − 0,3 𝑡 =
0,5091 − (−0,3) = 22,66 0,0357
t* = 2,306 (α = 0,05, d.f. = 8), v tabulkách two-tailed
19
Testy hypotéz v KLRM – alternativní t-testy Jednostranný (one-sided / one-tail t-test) pravostranný (right-tail) H0: β1 ≤ 0,3 0,5091 − 0,3 𝑡 = = 5,86 H1: β1 > 0,3 0,0357 t* = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t* → zamítám H0 levostranný (left-tail) H0: β1 ≥ 0,3 0,5091 − 0,3 𝑡= = 5,86 H1: β1 < 0,3 0,0357 − t * = − 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > − t * → nezamítám H0
20
Testy hypotéz v KLRM – alternativní t-testy Jednostranný (one-sided / one-tail t-test) pravostranný (right-tail) H0: β1 ≤ − 0,3 0,5091 − (−0,3) 𝑡 = = 22,66 H1: β1 > − 0,3 0,0357 t* = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t* → zamítám H0 levostranný (left-tail) H0: β1 ≥ − 0,3 0,5091 − (−0,3) 𝑡 = = 22,66 H1: β1 < − 0,3 0,0357 − t * = − 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > − t * → nezamítám H0
21
Testy hypotéz v KLRM – alternativní t-testy
22
Testy hypotéz v KLRM – dílčí F-test • pro libovolnou podmnožinu regresorů • zpravidla pro skupinu souvisejících proměnných (např. dummies) • k včetně úrovňové konstanty
• neomezený (unrestricted) model
• omezený (restricted) model 23
Funkční tvar v LRM •
obecně nás zajímá, jaký efekt závislé proměnné vyvolá marginální změna j-té vysvětlující proměnné level-level 𝐹𝑜𝑜𝑑𝐸𝑥𝑝𝑖 = 94,201 + 0,437𝑇𝑜𝑡𝑎𝑙𝐸𝑥𝑝𝑖 • zvýšení celkových výdajů o 1 rupii vyvolá v průměru zvýšení výdajů na jídlo o 0,437 rupie level-log 𝐹𝑜𝑜𝑑𝐸𝑥𝑝𝑖 = −1283,910 + 257,270 ln 𝑇𝑜𝑡𝑎𝑙𝐸𝑥𝑝𝑖 • zvýšení celkových výdajů o 1 % vyvolá v průměru zvýšení výdajů na jídlo o 2,573 rupie (dělím 100) log-level ln 𝑒𝑥𝑝𝑠𝑒𝑟𝑣𝑖𝑐𝑒𝑠𝑡 = 7,789 + 0,007𝑡𝑖𝑚𝑒 • výdaje na služby rostli čtvrtletně v průměru o 0,7 % (násobím 100) log-log ln 𝑒𝑥𝑝𝑑𝑢𝑟𝑡 = −9,697 + 1,906 ln 𝑝𝑐𝑒𝑥𝑝𝑡 • elasticita • zvýšení celkových výdajů o 1 % vyvolá v průměru zvýšení výdajů na předměty dlouhodobé spotřeby o 1,91 %
24