4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4
Zuzana Dlouhá
Aplikace EM – predikce obecně • •
•
ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné mimo interval pozorování s užitím minulé i současné informace – extrapolace modelu do budoucna – extrapolace modelu do minulosti – tj. před interval pozorování (tzv. retrospektiva) predikcí získáváme vyrovnané hodnoty (tj. hodnoty „fitted“)
Predikce ex-ante (resp. dopředu) – tzv. podmíněná – podmíněná volbou vysvětlujících proměnných – na napozorované hodnoty musíme „čekat“ Predikce ex-post (resp. dozadu) – tzv. pseudopředpověď – slouží k testování kvality modelu – napozorované hodnoty jsou již k dispozici 2
Aplikace EM – predikce ex-ante •
volba podmíněných exogenních proměnných, možné způsoby: – zadáno z jiné analýzy – zadáno pomocí procentuální změny oproti minulému období (např. o 10 %) – zadáno pomocí diferencí
• •
predikce bodová predikce intervalová – se směrodatnou odchylkou sigma: yˆ p ± sigma ~ ~ – se směrodatnou odchylkou s p : yˆ p t1*α / 2( n ( k 1)) s p
~ s 1 x ( X T X )1 x T s p p p – – –
„s“ ve vzorci je sigma, výpočet viz předchozí cvičení nebo to je S.E. of regression ve výstupu v EViews ~ vždy platí: s p sigma intervalový odhad se sigma bývá podhodnocený
3
Aplikace EM – predikce ex-ante + příklad Soubor: CV4_PR1.xls Data:
Mira_nezam_obec = obecná míra nezaměstnanosti (%) → x Inflace = míra inflace (%) → y
Zadání: Odhadněte závislost míry inflace (y) na obecné míře nezam (x). Proveďte bodovou předpověď ex-ante ručně i pomocí EViews, víte-li, že hodnota Mira_nezam_obec v roce 2008 je 4,4. Proveďte intervalovou předpověď ex-ante ručně i pomocí EViews, víte-li, že hodnota Mira_nezam_obec v roce 2008 je 4,4 a α = 1 %. yt = β0 + β1xt + ut, •
t = 1, 2,...,15
EViews: range 1993 2008 (příkazový řádek) doplnit do dat Mira_nezam_obec hodnotu 4.4 smpl 1993 2007 (příkazový řádek) ls inflace c mira_nezam_obec (příkazový řádek) okno Equation → Forecast → S.E. jako sp + 1993 2008 ~ naleznu v sp → predikci vidím v inflacef a s p 4
Aplikace EM – predikce ex-post • • • • • •
testuje se kvalita modelu vyřadíme určitý počet pozorování z modelu odhadneme model provedeme predikci vynechaných hodnot porovnáme získané předpovědi se skutečnými hodnotami obecně platí, že predikce je dobrá, pokud je průměrná absolutní hodnota chyby predikce menší než 5 % ze skutečné hodnoty pro dané období (EViews → Mean Absolute Percent Error)
5
Aplikace EM – predikce ex-post + příklad Příklad: Proveďte predikci/předpověď ex-post pro roky 2006 a 2007 na datech CV4_PR1.xls.
𝑖𝑛𝑓𝑙𝑎𝑐𝑒2006 = 20,606 − 2,157 ∗ 7,1 = 5,29 % EViews: smpl 1993 2005 (příkazový řádek) ls inflace c mira_nezam_obec (příkazový řádek) okno Equation → Forecast → 2006 2006 Mean Abs. Percent Error = 111,72 % > 5% model není vhodný k predikci
6
Aplikace EM – predikce ex-post + příklad Příklad: Proveďte predikci/předpověď ex-post pro roky 2006 a 2007 na datech CV4_PR1.xls.
𝑖𝑛𝑓𝑙𝑎𝑐𝑒2007 = 20,606 − 2,157 ∗ 5,3 = 9,18 % EViews: smpl 1993 2005 (příkazový řádek) ls inflace c mira_nezam_obec (příkazový řádek) okno Equation → Forecast → 2007 2007 Mean Abs. Percent Error = 227,68 % > 5% model není vhodný k predikci
7
Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1.
E(u) = 0 – náhodné vlivy se vzájemně vynulují
2.
E(u uT) = σ2 In – konečný a konstantní rozptyl = homoskedasticita → porušení: heteroskedasticita – náhodné složky jsou sériově nezávislé → porušení: autokorelace
3.
X je nestochastická matice – E(XTu) = 0 – veškerá náhodnost je obsažena v náhodné složce
4.
X má plnou hodnost k – matice X neobsahuje žádné perfektně lineárně závislé sloupce pozorování vysvětlujících proměnných → porušení: multikolinearita 8
Multikolinearita - definice •
• • • • • • •
• •
momentová matice XTX není singulární, existuje determinant matice různý od 0, lze spočítat odhadovou funkci b lineární nezávislost sloupců matice X porušení vede k multikolinearitě multikolinearita = existence více než jednoho vztahu lineární závislosti mezi pozorováními vysvětlujících proměnných kolinearita = existence pouze jednoho lineárního vztahu týká se pouze výběrového vzorku, nikoliv abstraktního modelu multikolinearita se NETESTUJE, jen měří v jednom konkrétním výběru podstata zkoumání: intenzita závislosti mezi dvěma nebo více vysvětlujícími proměnnými, zda je či není multikolinearita únosná perfektní multikolinearita: x1, x2 = 2x1 +5, neplatí ceteris paribus!!! v modelech je téměř vždy nějaká mutikolinearita – problém – jak velká a jestli to je problém
9
Multikolinearita – příčiny a důsledky Příčiny • tendence časových řad ekonomických ukazatelů (makroúdajů) vyvíjet se stejným směrem (např. HDP, C, I, S, Ex, Im) • průřezová analýza (velikost firmy, objem kapitálu, příjmy) • zahrnutí zpožděné endogenní nebo exogenní proměnné • špatně diskretizovaná proměnné pomocí 0, 1 (v cvičení o umělých proměnných) Důsledky • snížená přesnost odhadů regresních koeficientů • velké standardní chyby odhadové funkce MNČ – pochybnosti či nejistotu pokud jde o správnost specifikace modelu • odhady zůstávají nestranné, vydatné • velká citlivost odhadové funkce MNČ na velmi malé změny v matici X • obtížné vyjádření odděleného působení silně kolineárních proměnných 10
Měření multikolinearity – metoda I • •
použití párových korelačních koeficientů pro pouze 2 vysvětlující proměnné:
r x1 , x 2 •
cov( x1x 2 ) 1,1 s x1 s x 2
multikolinearita je únosná, pokud: rx1 , x2 0,9 a současně
rx21x 2 R(2y . x1x 2 ) koeficient vícenásobné determinace modelu •
EViews → cor x1 x2 (příkazový řádek)
11
Měření multikolinearity – příklad na metodu I Soubor: CV3_PR1.xls
Data:
y = maloobchodní obrat potřeb pro domácnost v mld. CZK x1 = disponibilní příjem v mld. CZK x2 = cenový index v %
Zadání: Odhadněte závislost maloobchodního obratu (y) na disponibilním příjmu (x1) a cenovém indexu (x2). Vyhodnoťte multikolinearitu. yi = β0 + β1x1i + β2x2i + ui, i = 1, 2,...,8
12
Měření multikolinearity – metoda II •
•
více vysvětlujících proměnných (tj. nelze dělat párové korelační koeficienty) využívá se koeficientů pomocné regrese Ri2
•
y = f(x1, x2, x3) → z modelu → R2
•
–
x1 = f(x2, x3) → R12
–
x2 = f(x1, x3) → R22
–
x3 = f(x1, x2) → R32
jsou-li všechna Ri2 < R2, pak je multikolinearita únosná
13
Měření multikolinearity – příklad na metodu II Soubor: CV4_PR2.xls
Data:
y = počet prodaných kuřat (v desítkách milionů kusů) x1 = výše dotace do zemědělství (v mld. Kč) x2 = cena za kuře (Kč/kg) x3 = cena vepřového (Kč/kg)
Zadání: Odhadněte závislost počtu prodaných kuřat (y) na proměnných x1, x2 a x3. Vyhodnoťte multikolinearitu.
yt = β0 + β1x1t + β2x2t + β3x3t + ut, t = 1, 2,...,23 Eviews → ls y c x1 x2 x3 → R-squared ls x1 c x2 x3 → R-squared ls x2 c x1 x3 → R-squared ls x3 c x1 x2 → R-squared 14
Měření multikolinearity – příklad na metodu I a II Soubor: CV4_PR3.xls Data:
HDP = hrubý domácí produkt (v mld. Kč) C = spotřeba (v mld. Kč) I = investice (v mld. Kč) G = vládní výdaje (v mld. Kč)
Zadání – metoda I: Odhadněte závislost HDP na proměnných C a I. Vyhodnoťte multikolinearitu. HDPt = β0 + β1Ct + β2It + ut,
t = 1, 2,...,19
Zadání – metoda II: Odhadněte závislost HDP na proměnných C, I a G. Vyhodnoťte multikolinearitu.
HDPt = β0 + β1Ct + β2It + β3Gt + ut,
t = 1, 2,...,19 15
Multikolinearita – řešení • • • • •
získání dalších pozorování snížení počtu exogenních proměnných (pozor, jestli tam podle teorie proměnná patří, ponechám ji tam) použití jinak specifikovaného modelu použití jiné odhadové techniky transformace pozorování – první diference - pozor na autokorelaci – poměrové veličiny - pozor na heteroskedasticitu
16