Lekce 1 úvod do ekonometrie
• • • • • • • • • • •
Některé věci se zde budou opakovat několikrát – důležité pro rozležení v hlavě a jiný úhel pohledu Dokázat aplikovat ekonometrie nestačí se pouze naučit na zkoušku Základní kurz – lineární algebra (matice) spíše v dodatcích Využití programu Gretl (zdarma) – pro základy stačí Je dobré mít základy statistiky ekofun – určitě ne „flákač“ !! v apendixu, určité „opáčko“ –průběžně budu doplňovat Některé použitá data jsou z reálná, některá vymyšlená Použité modely jsou většinou pro didaktické účely a nemusí se zakládat na ekonomické (jiné) teorii Než se budete ptát, projděte si celou lekci Snažte se dát lekci na jeden „zátah“ Stažení materiálů
Co si řekneme v této lekci • Co je to ekonometrie a k čemu slouží • Motivační příklady, zatím bez matematického aparátu • Lehký, ale důležitý úvod
K čemu slouží ekonometrie Mikroekonomie Jak ovlivní změna ceny poptávku po .... Jak ovlivní snížení daně z příjmu, množství nabízené práce Makroekonomie Jak ovlivní změna úrokové míry, HDP, množství úvěrů Dopad měnové, fiskální politiky na makroekonomické indikátory Finanční trhy Fundamentální analýza Predikce volatility aktiv Bankovnictví Podle kterých kritérií má banka pujčovat peníze Vývoj porfolia CP Marketing Které faktory ovlivňují poptávku po...
Sociologie, medicína...
Typy ekonomických dat Průřezová data - Cross-section Data firem (poměrové ukazatele), lidí (mzda, tlak) za konkrétní časové období Vybíráme výběrový soubor z určité populace – co ovlivňuje mzdu v ČR, jaké faktory ovlivňují krevní tlak Prostorový charakter Pooled (repeated) cross-section Data firem (poměrové ukazatele), lidí (mzda, tlak) za rozdílná časová období Vybereme data firem pro rok 2000 a 2014 a např. zjišťujeme zda došlo k nějaké změna (dopad změny v preferencích)
Časové řady Danou proměnnou (é) sledujeme v různých časových intervalech Finanční časové řady, HDP, vývoj peněžní zásoby Panelová data Data mají jak průřezový, tak časový charakter Sledujeme konkrétní firmy (poměrové ukazatele) v čase Sledujeme konkrétní domácnosti v čase a zjišťujeme například nákupní chování
Motivační příklady Z mikroekonomie známe, že poptávka (Q) je např: 𝑄 = 𝑓(𝑃, 𝑃𝑆 , 𝑌) Q-poptávané množství (pivo) P – cena komodity (pivo) 𝑃𝑆 - cena substitutu (víno) Y – disponibilní důchod
Z ekonomie Ceteris paribus
POZOR POPTÁVKU PO STATKU NEODHADNEME JAKO REGRESI NAPŘ. 4 PROMĚNNÝCH PROBLÉM JE SLOŽITĚJŠÍ
Mikroekonomická teorie nám dala „námět“ čím je řízena poptávka po dané komoditě Ekonometrie nám pomůže aplikovat tento „námět“ v praxi Ekonometrický model poptávky např: 𝑄 = 𝛽0 + 𝛽1 𝑃 + 𝛽2 𝑃𝑠 + 𝛽3 𝑌 + 𝜖 Využijeme ekonometrické nástroje a zjistíme, že: 𝑄 = 20 − 0,7𝑃 + 0,001𝑃𝑠 + 0,25𝑌
Interpretace: Mezi cenou piva a poptávaným množstvím existuje nepřímá úměra Pokles ceny vína způsobí substituci mezi pivem a vínem Citlivost poptávky po pivu na cenu vína je „malá“ S růstem disponibilního důchodu, vzroste poptávka po pivu Přesnou interpretaci hodnot si vysvětlíme dále
𝑤𝑎𝑔𝑒 = β0 + β1 𝑒𝑑𝑢𝑐 + ε
𝑤𝑎𝑔𝑒 = −2,41 + 0,7607𝑒𝑑𝑢𝑐 + 𝑒 Zjistili jsme: Růst vzdělání (o 1 rok) Znamená růst mzdy o 0,7607
Postup při modelování ekonomických procesů 1) Sestavit ekonomický model 2) Sestavit ekonometrický model na základě ekonomického modelu 3) Získat data (pozor) 4) Odhadnout ekonometický model na datovém vzorku 5) Otestovat model a odhadnuté parametry možná chyba v bodě 1,2,3,4 6) Interpretovat výsledky
Základní soubor (populace) vs. Výběr (sample) log(𝑤𝑎𝑔𝑒) = β0 + β1 𝑒𝑑𝑢𝑐 + ε
Výběrový soubor
Nemůžeme zkoumat každého jedince v populaci • Nákladné • Často nemožné
provedeme výběr, se kterým pak pracujeme
log(𝑤𝑎𝑔𝑒) = 0,2535 + 0,0359𝑒𝑑𝑢𝑐 + ε
Kdybychom mohli opakovat výběr Odhad vztahu z výběrového souboru log(𝑤𝑎𝑔𝑒) = 0,3491 + 0,0279𝑒𝑑𝑢𝑐 + 𝑒 0,0359𝑒𝑑𝑢𝑐 ≠ 0,0279𝑒𝑑𝑢𝑐 Proč? Odhad je náhodná veličina – má své rozdělení!!! β1
Musíme rozlišovat log 𝑤𝑎𝑔𝑒 = β0 + β. 𝑒𝑑𝑢𝑐 + ε
log 𝑤𝑎𝑔𝑒 = 𝑏0 + 𝑏1 . 𝑒𝑑𝑢𝑐 + 𝑒
Populační regresní funkce
výběrová regresní funkce (sample)
𝑏0 𝑗𝑒 𝑜𝑑ℎ𝑎𝑑𝑒𝑚 β0
Naším úkolem v ekonometrii bude PRÁVĚ ODHADNOUT hodnoty parametrů
𝑏1 𝑗𝑒 𝑜𝑑ℎ𝑎𝑑𝑒𝑚 β1 β0 , β1 𝑗𝑠𝑜𝑢 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑦 − 𝑁𝐸𝑀Ě𝑁Í 𝑆𝐸
𝑏0 , 𝑏1 𝑗𝑠𝑜𝑢 𝑒𝑠𝑡𝑖𝑚á𝑡𝑜𝑟𝑦 𝑜𝑑ℎ𝑎𝑑 𝑛áℎ𝑜𝑑𝑛é 𝑣𝑒𝑙𝑖č𝑖𝑛𝑦 𝑚ě𝑛í 𝑠𝑒, 𝑠𝑒 𝑧𝑚ě𝑛𝑜𝑢 𝑣ý𝑏ě𝑟𝑜𝑣éℎ𝑜 𝑠𝑜𝑢𝑏𝑜𝑟𝑢‼!
NEZNÁME • Hodnoty populační regresní funkce • Ani zda-li má skutečný vztah tvar:
log(𝑤𝑎𝑔𝑒) = β0 + β1 𝑒𝑑𝑢𝑐 + ε
Velikost mzdy může záviset na: • Vzdělání • Délce praxe • Dobu u nynějšího zaměstnavatele • Pohlaví • ....
Proto je nutné nejprve vytvořit ekonomický model!!! Ekonomická teorie nám pomáhá k jeho vytvoření
Výběrový soubor
log(𝑤𝑎𝑔𝑒) = 0,2535 + 0,0359𝑒𝑑𝑢𝑐 + ε Odhad základního souboru log(𝑤𝑎𝑔𝑒) = 0,3491 + 0,0279𝑒𝑑𝑢𝑐 + 𝑒
Ekonomický model
Jak závisí velikost prodaného zboží na jednotkových nákladech?
P-cena piva C – průměrné náklady na jednotku výstupu Q(P) – poptávka po pivu
π𝑝𝑖𝑣𝑜𝑣𝑎𝑟
= 𝑄.
Vytvoříme ekonomický model
2) 3) 4) 5) 6)
Vytvoříme ekonometrický model podle ekonomického modelu Získáme data Vytvoříme odhad ekonometrického modelu Testujeme model, vlastnosti odhadu Interpretujeme výsledky
π𝑝𝑖𝑣𝑜𝑣𝑎𝑟 = 𝑃. 𝑄 − 𝐶. 𝑄 = 𝑡𝑟ž𝑏𝑦 − 𝑛á𝑘𝑙𝑎𝑑𝑦
π𝑝𝑖𝑣𝑜𝑣𝑎𝑟 = 𝑄 𝑃 . 𝑃 − 𝑄 𝑃 . 𝐶
𝑎−𝑄 =𝑄 − 𝑄. 𝐶 𝑏
1)
𝑎 − 𝑄 − 𝐶. 𝑏 𝑏
𝜕π𝑝𝑖𝑣𝑜𝑣𝑎𝑟 = 𝑎 − 2. 𝑄 − 𝑏. 𝐶 = 0 𝜕𝑄 𝑄=
𝑄 𝑃 = 𝑎 − 𝑏. 𝑃 𝑎−𝑄 𝑃 𝑃= 𝑏 Jen ukázka
𝑎 𝑏 − .𝐶 2 2
Ekonometrický model Předpokládáme následující vztah:
𝑄 = β0 + β1 . 𝐶 + ε
Nemusí být správný!!!
𝑄=
β0 =a/2 (úrovňová konstanta) β1 =-b/2 (sklon) ε- další vlivy
𝑎 𝑏 − .𝐶 2 2
1)
Vytvoříme ekonomický model
2) 3) 4) 5) 6)
Vytvoříme ekonometrický model podle ekonomického modelu Získáme data Vytvoříme odhad ekonometrického modelu Testujeme model, vlastnosti odhadu Interpretujeme výsledky
𝑃=
𝑎−𝑄 𝑃 𝑏
Pro zjištění vztahu „nejlepší“ získat data z celé ekonomiky (základní soubor) Nákladné, nereálné Pracujeme s výběrovým souborem
Firma
1
2
3
4
5
6
Q
15
31
52
14
37
27
C
290
246
152
320
170
220
1)
Vytvoříme ekonomický model
2) 3) 4) 5) 6)
Vytvoříme ekonometrický model podle ekonomického modelu Získáme data Vytvoříme odhad ekonometrického modelu Testujeme model, vlastnosti odhadu Interpretujeme výsledky
𝑄 = β0 + β1 . 𝐶 + ε Odhad populační regresní funkce 𝑄 = 𝑏0 + 𝑏1 . 𝐶 + 𝑒
Závislost výstupu na průměrných nákladech
𝑄
60 50
40 30 20 10 0 0
50
100
150
200
250
300
350
𝐶
Pracujeme s výběrovým souborem!!!
Skutečný vztah (neznáme)
Vytváříme odhad
"""""𝑄 = 72 − 1,8. 𝐶 + ε""""""
𝑄 = β0 + β1 . 𝐶 + ε
Reziduum 𝑞 = 𝑏0 + 𝑏1 . 𝐶 + 𝑒 Musíme odhadnout parametry (β) modelu • metoda nejmenších čtverců • maximum likelihood – maximální věrohodnost • GLZ • GMM
𝑞 = 71,74 − 1,77. 𝐶 + 𝑒 Všechny body neleží na přímce
Závislost výstupu na průměrných nákladech
𝑄 60 50
40 30 20 10 0 0
50
100
150
200
250
300
350
𝐶
𝑄 = β0 + β1 . 𝐶 + ε
𝑞 = 𝑏0 + 𝑏1 . 𝐶 + 𝑒
𝑞 = 71,74 − 0,177. 𝐶 + 𝑒
Firma
1
2
3
4
5
6
Q
15
31
52
14
37
27
C
290
246
152
320
170
220
𝑞3 = 71,74 − 0,177.152 = 44,8 Existují další faktory, které ovlivňují velikost prodeje Značka, kvalita výrobku…
𝑞6 = 71,74 − 0,177.220 = 32
Závislost výstupu na průměrných nákladech
𝑄 60 50
40 30 20 10 0 0
50
100
150
200
250
300
350
𝐶
𝑄 = β0 + β1 . 𝐶 + ε
𝑞 = 𝑏0 + 𝑏1 . 𝐶 + 𝑒
𝑄 = 72 − 0,18. 𝐶 + ε
𝑞 = 71,74 − 0,177. 𝐶
Odhadnutý vztah
Skutečný vztah Nepozorovatelný Naměřené hodnoty NELEŽÍ na teoretické (populační) regresní přímce Naměřené hodnoty NELEŽÍ ani na empirické (odhadnuté) regresní přímce Náhodná složka (chyba)
60
50
40
30
20
10
0 0
50
100
150
200
250
300
350
Náhodná složka 𝜺 Představuje další faktory, které kromě (x) ovlivňují (y) Chybová složka je NEPOZOROVATELNÁ 𝑦 = β0 + β1 . 𝑥1 + ε Díky náhodné chybě – neleží všechny hodnoty na přímce
1) y je ovlivňováno x 2) y je ovlivňováno ε
𝑦 𝑦 = β0 + β1 . 𝑥1
𝑥
Našim úkolem je zjistit parametry β0,1 Udělat odhad těchto parametrů Sestrojit SRF – sample regression function
𝑄𝑝𝑖𝑣𝑜 = β0 . 𝑃𝑟𝑢𝑚 + β1 𝑌 − β2 𝑃𝑝𝑖𝑣𝑜 + ε Na základě teorie sestavíme model (eko+ekonometrický) Udělali bychom průzkum (výběrový soubor) Odhadli parametry
𝑄𝑝𝑖𝑣𝑜 = 0,51𝑃𝑟𝑢𝑚 + 0,99𝑌 − 2,01𝑃𝑝𝑖𝑣𝑜 + 𝑒 𝑦 = 0,51𝑥1 + 0,99𝑥2 − 2,01𝑥3 + 𝑒 𝑒 = 𝑦 − 0,51𝑥1 − 0,99𝑥2 + 2.01. 𝑥3 Existují nějaké další „vlivy“ které působí (počasí), měsíc (Prosinec) Zahrunuté v náhodné složce ε a tedy i v residuu e.
𝑄 = β0 + β1 . 𝐶 + ε
𝑞 = 𝑏0 + 𝑏1 . 𝐶 + 𝑒
Skutečný vztah Nepozorovatelný
𝑞 = 71,74 − 0,177. 𝐶
Odhadnutý vztah !!!Náhodná chyba není to samé jako reziduum!!! Náhodná chyba nepozorovatelná – neznáme totiž „bety“ Reziduum pozorovatelné Reziduum je odhadem náhodné chyby
60
50
40
ε
30
𝑒 𝑒
20
10
ε
0 0
50
100
150
200
250
300
350
Vyrovnané hodnoty a rezidua Každé napozorované yi nahradíme (nafitujeme) vyrovnanou hodnotou 𝑦ො i Ideální by bylo kdyby yi=𝑦ො i Všechny body by ležely na přímce – deterministický model „bohužel“ existují další proměnné (náhodné)
Rozlišovat !!! 𝑦 = β0 + β1 . 𝑥 + ε
𝑦ො = 𝑏0 + 𝑏1 . 𝑥
Úkol Určit odhady parametrů b0,1 tak, aby hodnota reziduí byla co nejmenší 𝑦5
𝑦
𝑦 = β0 + β1 . 𝑥 + ε 𝑦ො = 𝑏0 + 𝑏1 . 𝑥 𝑦ො5
𝑦ො2
𝑦2
𝑥
𝑦 = 𝑏0 + 𝑏1 . 𝑥 + 𝑒
𝑦 = β0 + β1 . 𝑥 + ε
Provedeme náhodný výběr
𝑦ො = 𝑏0 + 𝑏1 . 𝑥
Skutečný vztah
Vytvoříme odhad Skutečného vztahu
Vyrovnáme (nafitujeme) hodnoty Napozorované hodnoty nahradíme vyrovnanými hodnotami Otázkou je: • podle jakého pravidla nahrazovat napozorované hodnoty • jak zjistit, zda-li bylo nahrazení „OK“ 𝑦5
𝑦
𝑦ො = 𝑏0 + 𝑏1 . 𝑥
𝑒5
𝑦ො5
𝑦𝑖 = 𝑦ො𝑖 + 𝑒𝑖
𝑦5 = 𝑦ො5 + 𝑒5 𝑦2
𝑥5
𝑥
Existence náhodné chyby
𝑤𝑎𝑔𝑒 = β0 + β1 𝑒𝑑𝑢𝑐 + ε
1) Zahrnuje v sobě další minoritní vlivy praxe, schopnosti 2) Chyba v měření, sběru dat 3) Možnost špatné specifikace modelu praxe, schopnosti 4) Stochastický (náhodný) charakter lidského chování (nepředvídatelný)
𝐶
𝐶 = β0 + β1 𝑌 + ε 𝐶 = β0 + β1 𝑌 Analýza residuí
𝑌
Co bychom si měli z této lekce odnést • • • •
Rozlišovat populaci a výběrový soubor Populační regresní funkce neznámá Cílem odhadnout její parametry Vycházíme z teorie – ekonomického modelu – „nenaflákáme“ veškerá data, která nás napadnou