PŘEDPOKLADY A PODMÍNKY TVORBY EKONOMETRICKÝCH MODELŮ Ekonometrie jako interdisciplinární věda Definování ekonometrie L .R. Klein a další ekonometrové Předpoklady pro rozvoj ekonometrie Metodika tvorby a analýzy ekonometrických modelů Definování EM Statistická indukce Analýza EM Informační základna Údaje, informace Členění a agregace dat Informační systémy Charakteristika ekonometrického modelu Matematická funkce Jednofaktorové modely Aditivní typy funkcí Multiplikativní typy funkcí
Vícefaktorové modely Aditivní typy funkcí Multiplikativní typy funkcí Dvoufaktorový model - příklad Metoda minimálních čtverců MMČ – graf a algebraický výraz MMČ – polynomická funkce Normální rovnice Jednoduchá lineární funkce Polynom s-tého stupně Vícefaktorová mocninná funkce Funkce vícefaktorové závislosti Rozklad empirického rozptylu Charakteristiky korelace Index korelace Koeficient korelace Volba vysvětlujících proměnných Metoda postupného přidávání Metoda stupňovité regrese Kroková metoda Kroková metoda kupředu Kroková metoda zpětně Využití faktorové analýzy
EKONOMETRIE jako interdisciplinární věda Ekonometrie je hraniční disciplinou mezi ekonomií a statistikou. Ekonomie je věda o tom, jak společnost využívá omezené (vzácné) zdroje k výrobě užitečných statků a jak tyto statky rozděluje mezi různé skupiny svých členů. Statistika je věda, která z kvantitativního hlediska zkoumá hromadné společenské jevy.
Definování EKONOMETRIE O ekonometrii se mluví od 30. let minulého století. Je důsledkem využívání matematiky a statistiky v ekonomické teorii. Zakladatelé ekonometrie: FRISCH, SCHUMPETER, TINBERG.
LAWRENCE ROBERT KLEIN (profesor na pensylvánské a oxfordské universitě, nositel Nobelovy ceny z roku 1980, autor knih Textbook of Econometrics (1953) a An Introduction to Econometrics (1966)
„Ekonometrie je odvětví ekonomie zabývající se kvantifikací vztahů zkoumaných apriorně ekonomickou analýzou. Jde o statistický odhad parametrů a jejich významnosti v ekonomicko matematických modelech.“
Předchůdci: o HENRY SCHULTZ – analýza poptávky o PAUL DOUGLAS – měření produkčních funkcí o JOEL DEAN – měření nákladových funkcí o VASILIJ LEONTIEV – analýza meziodvětvových vztahů o VILFRED PARETO – teorie důchodového rozdělení o JAN TINBERGEN – konstrukce makroekonomických modelů o RAGNAR FRISCH – řešení problému multikolinearity
Nositelé Nobelovy ceny za ekonomii za rok 2003 Clive W. J. Granger, britský statistik a ekonometr, profesor z University of California San Diego
(za metody analýzy ekonomických časových řad se společnými trendy - kointegrace časových řad) Robert F. Engle, americký statistik a ekonometr, profesor z New York University
(za metody analýzy ekonomických časových řad s časově proměnlivou volatilitou) Podle Velkého slovníku naučného, DIDEROT, Praha 1999:
EKONOMETRIE • věda zabývající se kvantifikovatelnými problémy ekonomie; • je syntézou ekonomické teorie a jejích metod, hospodářských statistik a statistické teorie odhadů a testů.
Předpoklady pro rozvoj ekonometrie
a využívání ekonometrických modelů ♦ rozvoj ekonomické teorie (mikroekonomie, makroekonomie)
♦ rozvoj matematicko statistické metodologie (pravděpodobnost, lineární algebra, analytická geometrie, derivace a integrály, charakteristiky úrovně a variability, regrese a korelace, statistický odhad, testování hypotéz, analýza časových řad)
♦ rozvoj informačních systémů a jejich plynulá inovace ♦ zabezpečení moderní výpočetní technikou ♦ ověřování modelů v ekonomické praxi ♦ výchova kvalifikovaných odborníků V období socialismu jen produkční a nákladové funkce (Krastin – Riga, Lotyšsko, Ambroš, Svoboda – ČSSR,). V současném období tržní ekonomiky se kromě produkčních modelů uplatňují i ekonometrické modely spojené s trhem (modely poptávky, nabídky, tržní rovnováhy, maximalizace tržeb či zisku, apod.). Významné jsou modely založené na modelování časových řad (trend, cyklické kolísání).
METODIKA TVORBY A ANALÝZY EKONOMETRICKÝCH MODELŮ 1) Definování EM: Analýza problému s cílem kvantifikace vztahů, tj. pochopení věcné podstaty problému • zjištění relevantních dat • určení závisle proměnné • výběr nezávisle proměnných (počet, stupeň agregace, vyloučení duplicity,…)
Specifikace modelu v matematické formě • volba typu funkce z hlediska věcného i formálního • výpočet konkrétní rovnice modelu
2) Statistická indukce: • statistický odhad - modelu jako celku • test. stat. průkaznosti - parametrů modelu - charakteristik korelace
3) Analýza EM: • ověření reálnosti praktické interpretace • výpočet odvozených charakteristik • celkové vyhodnocení (včetně ekonomického)
INFORMAČNÍ ZÁKLADNA o modelované realitě Údaje – identifikace, vlastnosti (chování) prvku Informace – souvislost s rozhodovacím procesem
Členění: časové, prostorové, věcné interní, externí makroekonomické, mikroekonomické kvalitativní, kvantitativní extenzitní, intenzitní průřezové, časové (úsekové, okamžikové) primární, sekundární
Agregace: hierarchická, věcná, v čase Informační systémy komplex několika činností (sběr informací, jejich přenos a uchovávání, zpracování, … , prezentace, distribuce) Význam spojení informační základny s výpočtovými operacemi → uplatnění počítačů
automatizované integrované informační systémy
CHARAKTERISTIKA
EKONOMETRICKÉHO MODELU Matematická funkce (vyjádřená jednou rovnicí nebo systémem rovnic) kvantifikující ekonomické vztahy při určitém stupni abstrakce reality.
y = f ( x1 , x2 , K , xk ,ε ) kde:
y … závisle proměnná xi … nezávisle (vysvětlující) proměnné [ přičemž: i = 1,2,…,k ]
ε … náhodná složka (reziduum)
EM přičemž:
y′ = f (x1 , x2 , K , xk )
ε = y − y′
y …empirická hodnota y ′…teoretická hodnota
Typy funkcí: • jednoduché, vícenásobné • lineární, nelineární • aditivní, multiplikativní, semimultiplikativní
JEDNOFAKTOROVÉ MODELY Aditivní typy funkcí: y ′ = b0 + b1 x
lineární (přímka)
y′ = b0 + b1 x + b2 x 2
kvadratický (parabola 2.st.)
y′ = b0 + b1 x + b2 x 2 + b3 x 3 kubický (parabola 3.st.) b y′ = b0 + 1 lomený 1.st. (hyperbola 1.st.) x b b lomený 2.st. (hyperbola 2.st.) y′ = b0 + 1 + 22 x x
y′ = b0 + b1 x + b2 x
odmocninný
y ′ = b0 + b1 log x
logaritmický
Multiplikativní typy funkcí: y′ = b0 ⋅ b1
x
( log y ′ = log b0 + x log b1 )
y′ = b0 ⋅ x b1 ( log y ′ = log b0 + b1 log x )
exponenciální
mocninný
VÍCEFAKTOROVÉ MODELY Aditivní typy funkcí: lineární
y ′ = a + b1 x1 + b2 x2 + K + bk xk
lineární s interakcí
y′ = a + b1 x1 + b2 x2 + K + bk xk + b1,2 x1 x2 + b1,3 x1 x3 + K + bk −1,k xk −1 xk
kvadratický
y ′ = a + b1 x1 + b2 x2 + K + bk xk + c1 x12 + c2 x22 + K + ck2
kvadratický s interakcí
y′ = a + b1 x1 + b2 x2 + K + bk xk + c1 x12 + c2 x22 + K + ck xk2 + d 1,2 x1 x2 + d 1,3 x1 x3 + K + d k −1,k xk −1 xk
Interakce mohou být vyjádřeny nejen jako násobek proměnných v lineárním vyjádření xi xj , ale i v různých 2 x jiných vztazích, jako např. i x j , xi x j , x j xi apod.
Multiplikativní typy funkcí: exponenciální
y ′ = a ⋅ b1x1 ⋅ b2x2 ⋅ K ⋅ bkxk
( log y ′ = log a + x1 log b1 + x2 log b2 + K + xk log bk ) mocninný
y ′ = a ⋅ x1b1 ⋅ x2b2 ⋅ K ⋅ xkbk
( log y′ = log a + b1 log x1 + b2 log x2 + K + bk log xk )
Př.:
DVOUFAKTOROVÝ MODEL
Y = f (X 1 , X 2 )
kde:
Y …. výnos plodiny X1 … hustota sazenic X2 … hnojení
Jednofaktorové vztahy: Y = f (X 1 )
Y = f (X 2 )
y
y
hustota sazenic x1
y ′ = a1 + b1 x1 + c1 x12
hnojení
x2
y ′ = a2 +
b2 x2
Dvoufaktorový model:
1 y′ = B0 + B1 x1 + B x + B3 x2 2 2 1
METODA MINIMÁLNÍCH ČTVERCŮ Závisle proměnná Y (hodnoty závisle proměnné yi (i=1, 2,…, n)
y
yi y′
yii
x n
2 ′ ( ) y − y ∑ i i = min i =1
Podmínka: aditivní typ funkce
Platí pro funkce lineární i nelineární, jednoduché i vícenásobné.
METODA MINIMÁLNÍCH ČTVERCŮ Předpoklad:
aditivní typ funkce multiplikativní typ → logaritmování
Polynomická funkce - nejčastější typ modelu s
yi′ = ∑ Ar Fri
yi′ = A0 F0i + A1 F1i + A2 F2i + K + As Fsi
r =0
kde: Ar … hledané parametry Fri … F0i = 1, F1i, F2i, … Fsi funkce nezáv. prom. prosté neznámých parametrů Pro uvedený typ funkce tedy platí n
s
∑(y − ∑ A F i
i =1
r
r =0
ri
) 2 = min
Výraz má být minimální, tzn. že první parciální derivace podle všech parametrů jsou rovny nule. n s dΣ ⎛ ⎞ = 2∑ ⎜ yi − ∑ Ar Fri ⎟ (− Fri ) = 0 dAr i =1 ⎝ r =0 ⎠
n
n
s
∑ y F − ∑∑ A F F i =1
i
ri
n
r
i =1 r = 0
ri
ri
=0
n
∑ y F = ∑ y′F i =1
i
ri
i =1
i
ri
Obecné vyjádření soustavy s+1 normálních rovnic o s+1 neznámých parametrech.
Př.:
NORMÁLNÍ ROVNICE Jednoduchá lineární regresní funkce (přímka): n
n
∑ y F = ∑ y ′F i =1
i
ri
i =1
i
soustava normálních rovnic (obecně)
ri
yi′ = a + b xi
Rovnice regresní přímky:
Funkce nezávisle proměnné v rovnici přímky při parametrech: F0 = 1, F1 = xi Dosazení do obecné rovnice: n
n
∑ y ⋅1 = ∑ (a + b x ) ⋅1 i =1 n
i
i
i =1 n
∑ y ⋅ x = ∑ (a + b x ) ⋅ x i =1
i
n
∑y i =1 n
i
i
i =1
i
n
i
= n a + b ∑ xi i =1
n
n
i =1
i =1
2 y x = a x + b x ∑ ii ∑ i ∑ i i =1
soustava normálních rovnic pro výpočet parametrů regresní přímky
Př.:
NORMÁLNÍ ROVNICE Polynom s-tého stupně jednoduché korelační závislosti 2 s ′ yi = A0 + A1xi + A2 xi + K+ As xi
Soustava normálních rovnic: n
∑y i =1
i
n
∑yx i =1
n
i i
n
n
i =1
i =1
n
= nA0 + A1 ∑ xi + A2 ∑ x + K + As ∑ xis n
n
i =1
i =1
2 i
i =1
n
n
= A0 ∑ xi + A1 ∑ x + A2 ∑ x + K + As ∑ xis +1 n
2 i
n
i =1 n
3 i
i =1 n
s+2 y x = A x + A x + A x + K + A x ∑ 0∑ 1∑ 2∑ s∑ i i =1
2 i i
i =1
M
n
2 i
n
3 i
i =1
n
∑ y x = A0 ∑ x + A1 ∑ x i =1
s i i
i =1
s i
i =1
s +1 i
i =1
n
4 i
+ A2 ∑ x i =1
s+2 i
i =1
n
+ K + As ∑ xi2 s i =1
Př.:
NORMÁLNÍ ROVNICE Vícefaktorový model vyjádřený mocninnou funkcí (tzv. Cobb-Douglasovou funkcí)
y′ = a ⋅ x1b1 ⋅ x2b2 ⋅ ... ⋅ xkbk se převede logaritmováním na aditivní tvar
log y ′ = log a + b1 log x1 + b2 log x2 + . . . + bk log xk a pak se vyvodí soustava normálních rovnic.
Např. dvoufaktorová mocninná funkce
y′ = a ⋅ x1b1 ⋅ x2b2 soustava normálních rovnic :
∑ log y = n log a + b ∑ log x 1
1
+ b2
∑ log x
2
∑ (log y )(log x
1
) = log a ∑ log x1 + b1
∑ (log x
1
)2 + b2
∑ (log x
∑ (log y )(log x
2
) = log a ∑ log x2 + b1
∑ (log x
1
)(log x2 ) + b2
1
)(log x2 )
∑ (log x
2
)2
Př.:
NORMÁLNÍ ROVNICE Vícefaktorová závislost vycházející z různých jednoduchých dílčích vztahů
y ′ = a + b1
1 + b2 x22 + b3 x3 x1
Normální rovnice:
∑ y = n a + b1 ∑
1 + b2 ∑ x22 + b3 ∑ x3 x1
x3 x 22 y 1 1 a b b b = + + + ∑ x ∑ x 1 ∑ x2 2 ∑ x 3 ∑ x 1 1 1 1 1
x22 ∑ x y = a∑ x + b1 ∑ x + b2 ∑ x24 + b3 ∑ x22 x3 1 2
∑
2 2
x3 y = a ∑ x3 + b1 ∑
x3 x1
+ b2 ∑ x22 x3 + b3 x3
ROZKLAD EMPIRICKÉHO ROZPTYLU Empirický rozptyl lze rozložit na součet rozptylu teoretického a rozptylu reziduálního: n
∑ (y i =1
n
− y)
2
i
=
n
∑ ( y′ − y ) ∑ ( y i =1
2
i
+
i =1
− yi′ )
2
i
n n n V symbolické formě je rozklad rozptylu vyjádřen jako
var y = var y ′ + var ( y − y ′)
, resp.
s y2 = s y2′ + s y2− y′
Při výpočtu indexu determinace s ohledem na podíl složek na empirickém rozptylu mohou nastat tři možnosti: a) var y´ = 0, takže var y = var (y-y´) Jde o limitní případ, kdy je yi´ nezávislé na xi, takže regresní čarou je přímka rovnoběžná s osou x. Jde o nezávislost. b) var(y-y´) = 0, takže var y = var y´ Jde o druhý limitní případ, kdy je každé yi´ stejné s yi . Všechny body leží přímo na regresní křivce a jde tedy o pevnou závislost. c) var y´≠ 0, var (y-y´) ≠ 0, takže var y = var y´+ var (y-y´) V daném případě jde o volnou závislost, která je předmětem statistického zkoumání.
•
y
•
•
•
•
• • •• •
•
•
x y
• •
y
•
•
• • •
•
• •
• •
y´ x
• • •
• • • •
•
y′ x
INDEX KORELACE Index korelace je odmocninou indexu determinace:
I yx =
var ( y − y ′ ) var y ′ = 1− var y var y
Index korelace pak může nabývat hodnot
0 ≤ I yx ≤ 1
Čím je hodnota indexu korelace větší, tím je těsnost závislosti vyšší. Praktický výpočet indexu korelace: 1⎛ n ⎞ yi′ − ⎜ ∑ yi ⎟ ∑ n ⎝ i =1 ⎠ i =1 n
2
2
var y′ = var y
I yx = přičemž n
1⎛ n ⎞ y − ⎜ ∑ yi ⎟ ∑ n ⎝ i =1 ⎠ i =1 n
2
2 i
n
∑ y′ = ∑ y y′ 2
i
i =1
i =1
i
i
takže např. pro kvadratickou funkci platí
∑ y y′ = ∑ y (a + bx + cx ) = a∑ y n
i =1
n
i
i
i =1
n
i
i
2 i
i =1
i
n
n
i =1
i =1
+ b∑ xi yi + c ∑ xi2 yi
Do posledně uváděného výrazu se dosazují parametry definovaného modelu a členy z levé strany normálních rovnic při jeho výpočtu.
KOEFICIENT KORELACE Index korelace má při určování těsnosti závislosti obecné uplatnění. Předpokladem jeho výpočtu však je předchozí definování regresní funkce. Specifickým případem indexu korelace je koeficient korelace, který je určován při lineární závislosti. Má tu výhodu, že může být stanoven i tehdy, když není vypočtena rovnice regresní přímky.
I yx =
I yx =
=
=
var y ′ var y
var ( a yx + b yx xi ) var y (cov xy )2 var x (var x )2 = var y
yi′ = a yx + byx xi
=
2 yx
b var x var y
=
(
cov xy 2 ) var x var x = var y
(cov xy )2 (cov xy )2 var x = = var y (var x )(var y )
cov xy =r var x ⋅ var y
r = ryx = rxy
… v případě jednoduché závislosti není u lineární korelace třeba rozlišovat závisle a nezávisle proměnnou
VOLBA VYSVĚTLUJÍCÍCH PROMĚNNÝCH
METODA POSTUPNÉHO PŘIDÁVÁNÍ na základě statistické významnosti přínosu k růstu n
2 ′ ( ) y − y ∑ i i =1
V podstatě jde o maximalizaci teoretického rozptylu a tedy zároveň o maximalizaci charakteristiky korelace. Výpočet všech jednoduchých koeficientů korelace mezi závisle proměnnou a nezávisle proměnnými:
ryx1 , ryx2 , ryx3 , K , ryxk Do modelu zařazena proměnná s maximálním koeficientem korelace. Výpočet dílčích koeficientů korelace, přičemž proměnná, která již byla vzata do modelu je zvažována jako konstantní (v symbolu dílčího koeficientu za tečkou):
ryx1⋅x2 , ryx3 ⋅x2 , ryx4 ⋅x2 , K , ryxk ⋅x2 Do modelu zařazena další nezávisle proměnná s maximálním dílčím koeficientem. Výpočet dílčích koeficientů s další zkonstantněnou nezávisle proměnnou a opakování postupu
ryx1⋅x2 x3 , ryx4 ⋅x2 x3 , ryx5 ⋅x2 x3 , K , ryxk ⋅x2 x3
VOLBA VYSVĚTLUJÍCÍCH PROMĚNNÝCH
METODA STUPŇOVITÉ REGRESE Výpočet všech jednoduchých koeficientů korelace mezi závisle proměnnou a nezávisle proměnnými:
ryx1 , ryx2 , ryx3 , K , ryxk Do modelu zařazena proměnná s maximálním koeficientem korelace. Určení reziduí yi − yi′ = eI , která jsou zvažována jako hodnoty další závisle proměnné a výpočet koeficientů korelace se zbývajícími nezávisle proměnnými:
reI x1 , reI x3 , reI x4 , K , reI xk Do modelu zařazena proměnná, která má s reziduem maximální koeficient korelace. Určení nových reziduí yi korelačních koeficientů proměnnými:
− yi′ = eII se
a znovu výpočet zbývajícími nezávisle
reII x1 , reII x3 , reII x5 , K , reII xk Do modelu znovu zařazena další nezávisle proměnná s maximálním koeficientem korelace, výpočet dalšího nového rezidua a odpovídajících koeficientů korelace, atd. (Opakování postupu.)
VOLBA VYSVĚTLUJÍCÍCH PROMĚNNÝCH
KROKOVÁ METODA ♦ dopředu : - Vypočtou se jednoduché funkce se všemi zúčastněnými proměnnými a vybere se proměnná, jejíž parametr má nejvyšší statistickou průkaznost. - Vypočtou se funkce pro dvě nezávisle proměnné, přičemž se k již zařazené proměnné přidávají postupně zbývající proměnné. Vybere se pak ta proměnná, při jejímž zařazení měl její parametr nejvyšší průkaznost. - Postup se opakuje, takže při dalších krocích se k již zařazeným proměnným přidávají postupně ty proměnné, jejichž parametry dosahují při rozšíření funkce nejvyšší průkaznost.
♦ zpětně - Vypočte se funkce se všemi zúčastněnými nezávisle proměnnými. Otestují se všechny parametry funkce a proměnná s nejnižší průkazností svého parametru se vyloučí. - Postup se opakuje. Při každém vyloučení další proměnné se znovu testují parametry funkce a vyřadí se proměnná s nejnižší průkazností parametru. (Může být, že v pořadí druhý nejméně průkazný parametr se při vyřazení proměnné s parametrem o nejnižší průkaznosti projeví v dalším kroku průkazněji.)
VOLBA VYSVĚTLUJÍCÍCH PROMĚNNÝCH
VYUŽITÍ FAKTOROVÉ ANALÝZY Při výběru vysvětlujících proměnných lze využít některou z metod vícerozměrné analýzy jakou je např. faktorová analýza. ♦
Vypočte se matice jednoduchých korelačních koeficientů charakterizujících stupeň závislosti mezi všemi zúčastněnými nezávisle proměnnými navzájem.
♦
Na základě tzv. rotované matice korelačních koeficientů jsou stanoveny skupiny zúčastněných proměnných (faktory), v nichž jsou zařazeny proměnné silně spolu korelované.
♦
V prvním kroku jsou to dva faktory a každým dalším krokem se jejich počet o jeden další faktor zvyšuje postupným členěním. Testovací procedurou je stanoven vhodný počet faktorů.
♦
Z každé skupiny je vybrána proměnná s nejvyšší faktorovou zátěží.
♦
Proměnné vybrané ze všech faktorů představují zvolené nezávisle proměnné pro definování modelu.