EKONOMETRIE. Univerzita Palackého v Olomouci

EKONOMETRIE Univerzita Palackého v Olomouci

Úvod Ekonometrie je hraniční disciplína, která čerpá ze tří oblastí: – ekonomie – matematika – statistika Další „meziobory“: – matematická ekonomie (všechny ekonomické procesy je možné redukovat na směnu a modelovat je matematicky, 1850 – 1940) – ekonomická statistika (základní statistické postupy aplikované na ekonomická data, především získávání a třídění dat + základní popis dat z oblasti ekonomie) – matematická statistika (teorie statistické indukce založená na teorii pravděpodobnosti) Předmětem zkoumání ekonometrie je vyhledávání, měření a matematická formulace ekonomických vztahů a zákonitostí. Pomocí matematických metod se vyvozují kvantitativní závislosti hospodářského života. Historie: – v roce 1930 vznikla ekonometrická společnost – v roce 1933 se začal vydávat časopis Econometrica (vydává se dodnes) – mezi nejvýznamnější osoby ekonometrie patří Frisch, Schumpeter, Cobb, Douglas Ekonometrické modelování (=výstavba ekonometrického modelu)

Model = zjednodušení Ekonomický model obsahuje: •

(A)+ (B) – proměnné a jejich typ Dělení z různých hledisek: 1) Regrese ‒ nezávislé proměnné (regresory) ‒ závislé proměnné (odezvy) 2) Dle formy zápisu ‒ vysvětlující (napravo) ‒ vysvětlované (nalevo) 3) Dle času ‒ nezpožděné ‒ zpožděné 1

4) Simultánní rovnice (subjektivní, záleží na cíli analýzy a na dostupných datech) ‒ endogenní (jsou předmětem zkoumání, jsou generovány modelem, jsou vysvětlující i vysvětlované) ‒ exogenní (nejsou zkoumaným systémem ovlivňovány, ale působí na něj, jsou pouze vysvětlující) 5) Simultánní rovnice ‒ nezpožděné endogenní ‒ predeterminované 6) Stochasticky ‒ náhodné (C) ‒ nenáhodné Parametry: – konstanty, které nám dolaďují vztah mezi proměnnými – jsou neznámé – apriorní omezení (ve formě znamének) •

(B) – rovnice Dělení z různých hledisek: 1) Počet rovnic ‒ jednorovnicový model ‒ vícerovnicový model −zdánlivě nesouvisející rovnice (přes kovarianční strukturu) −simultánní rovnice 2) Podle typu rovnic ‒ lineární modely − v proměnných − v parametrech (lze užít MNČ) ‒ nelineární modely

•

(C) – specifikace náhodných proměnných Zajímá nás rozdělení pravděpodobnosti, momenty, kovarianční struktura. 1) Systematické 2) Chybové (chyby měření, chyby z funkčního zjednodušení)

•

(D) – kvantifikace (odhad parametrů) Parametry – strukturní, koeficienty u proměnných – stochastické, např. rozptyl chyb – volba vhodné odhadovací metody (např. MNČ) – ověření předpokladů metody (např. typ rozdělení, nezávislost, rozsah výběru, stejné rozptyly, kolinearita, identifikace simultánních rovnic,...) – verifikace, ověření modelu – ekonometrická - kontrola omezení a znamének parametrů – statistická – významnost parametrů nebo celkového modelu, t-testy, F-testy, index determinace

2

Využití modelu: – analýza závislostí – jedná se o pochopení generujícího mechanismu – předpovědi (predikce, prognózy) – na základě modelu se snažíme uhodnout, jak se vše bude vyvíjet dál – je zde předpoklad, že funkční závislosti zůstávají stejné – řízení a optimalizace – jak zvolit vstupy, abychom dostali optimální výstupy Typy ekonometrických modelů: – strukturní (desagregované) - proměnné dle odvětví, území apod. – agregátní - souhrnné proměnné – makroekonomické - popisují celé hospodářství nebo odvětví – mikroekonomické - popis podniků, domácností, jednotlivých subjektů – statické – dynamické - časová proměnná a časové zpoždění proměnné

3

Model obecně: Y j t=f j ( Y 1 t , Y 1,t −1 ,... , Y 1,t −z , ... , Y j ,t−1 , ... ,Y j , t− z , ... , Y q t , Y q ,t −1 , ... , Y q , t− z , x 1 t , ... , x 1,t −z , ... , 1

x p t , x p ,t −1 , ... , x p ,t −z , E j t ) , ' p

j

q

' 1

j=1 , ... , q

dynamický model, ve strukturním tvaru

q rovnic pro q endogenních proměnných Y j t - závislé proměnné f - funkce známá (až na parametry) Y - endogenní proměnné (náhodné) x - exogenní proměnné (nenáhodné) t - čas z , z ' - zpoždění proměnných Predeterminované proměnné jsou všechny Y a x kromě Y 1 t , ... , Y q t , tj. všechny x a nezpožděné Y . Zobecnění: 1) X ... náhodné veličiny náhodné regresory nosiče předpokládáme nezávislost X , E 2) opakovaná pozorování j=1 ,... , q endogenní proměnné/rovnice Y j t i kde t čas i=1, ... , n pozorování nezávislá

{

Speciální případy: 1) q=1 ... jednorovnicový model 2) f lineární v parametrech i proměnných statický model (bez vlivu času) Y 1=1 2 Y 21 3 Y 3...1 q Y q1 1 x 1...1 p x pE 1 Y 2=2 1 Y 1 23 Y 3...2 q Y q2 1 x 1...2 p x p E2 ......................................................................................... Y q = q 1 Y 1 q 2 Y 2...q q−1 Y q −1 q 1 x 1...q p x p Eq soustava simultánních rovnic ve strukturním tvaru

lze přepsat maticově  y  B x = e q×q q ×1

q× p q ×1 

 q×1

 , B ... matice strukturních parametrů  =I ... prosté modely, mezi endogenními proměnnými není žádný vztah  =trojúhelníková ... rekurzivní modely, jednosměrné vazby mezi Y  =obecná ... obecné modely, jsou zde také zpětné vazby

4

I. Lineární regresní model Vícenásobná lineární regrese Y i=01 x i 12 x i 2...k x i k  Ei , i=1 , ... , n model statický, jednorovnicový, lineární s absolutním členem Y ... vysvětlovaná, závislá proměnná, odezva (endogenní proměnná) x ... vysvětlující, nezávislá proměnná, regresor, nosič, (exogenní proměnná) E ... náhodná proměnná, chyba, fluktuace n ... rozsah výběru, počet pozorování maticový zápis: y = X   e n ×1 

n× p  p×1

n×1

y=Y 1 , ... ,Y n T ... vektor pozorování, náhodný

 

1 x 11 X =⋮ ⋮ n × p 1 xn 1 respektive x11 ⋯ X = ⋮ ⋱ n × p xn1 ⋯

⋯ x1k ⋱ ⋮ ⋯ xnk x1 k ⋮ xn k





dizajnová matice, nenáhodná

... dizajnová matice bez absolutního členu

p ... počet parametrů, dimenze modelu p= k+ 1 s absolutním členem k bez absolutníhočlenu k ... počet vlastních regresorů n− p ... počet stupňů volnosti  =0 , 1 ,... , k T ... regresní parametry, nenáhodné

{

p ×1

e = E1 , ... , E nT ... chyby, náhodné

n ×1

Předpoklady regularity: 1) n> p ... kladné stupně volnosti, více pozorování než parametrů 2) h( X )= p ... plná hodnost, lineárně nezávislé regresory 3) E e= 0 ... nulová střední hodnota  n×1 2

var e= I n ... konstantní rozptyly Ei jsou nezávislé

Alternativy k bodu 3) Ei jsou nekorelované Ei tvoří náhodný výběr (náhodný výběr znamená nezávislé a stejně rozdělené veličiny) Poznámka: a) regulární model splňuje 1) – 3) b) normální regulární model splňuje navíc Ei ∼N ( Ei má normální rozdělení)

5

Zobecnění 1) y  Y n ×1

Y = X n ×q

2) 3)

, tj. q vysvětlovaných proměnných

 n×q 

B  E

 n× p   p ×q

 n×q 

- vícerozměrná lineární regrese

h( X )< p ... model s neúplnou hodností h( X )= p ... plná hodnost, ale regresory jsou „téměř“ lineárně závislé... kolinearita

Nechť jsou splněny předpoklady regularity, pak platí: E y= X  – var y= 2 I n – Y i jsou nezávislé –

6

I.1 Odhad regresních parametrů  Metoda nejmenších čtverců (MNČ) kritérium kvality odhadu = střední čtvercová chyba n

min ∑ Y i−x Ti⋅ 2=min  y− X T  y −X =min∥y− X ∥ 





i=1

T

T

řešení splňuje normální rovnice  X X =X y v regulárním modelu platí:  X T X −1 X T y ... jednoznačné řešení = v modelu s neúplnou hodností, tj. h( X )< p  X T X − X T y ... řešení není jednoznačné =  X T X −1 X T y ... MNČ odhad, náhodný vektor =  = n ... spočtený z dat o rozsahu n p ×1

Vlastnosti  - MNČ odhadu: 1. lineární odhad  =M y , kde M=(X T X )−1 X T , matice = lineární transformace 2. nevychýlený, nestranný  E = , ∀n ,∀ 3. rozptyl 2  var =  X T X −1 4.

y = X  ... vyrovnané hodnoty y … projekce y do L  X  , lineárního prostoru sloupců X y je nejbližší prvek z L  X  k y platí: y= y  e ... y ⊥ e ∈L  X 

y =P y , kde

∈ ⊥ L X 

P = X  X T X −1 X T je projekční matice, která je n ×n

symetrická, idempotentní  P2=P , h P=h X = p 5. pokud navíc e~N n , tak 2 T −1  ~N p   ,  X X   y ~N n  X ,  2 P 6.

 je NNLO (BLUE) tzn. má nejmenší rozptyl mezi všemi nestrannými lineárními odhady ve smyslu  var  −var ≥0 (pozitivně semidefinitní)  p× p 

7

Důkaz: Nechť  je nestranný lineární odhad, tj.  =L y , =E  =L E y=L X ⇒ L X=I p var  =L var y LT =L  2 I n LT = 2 L LT   víme: = X T X −1 X T y =M y 2 T −1  var = X X  T −1 T

T

M M = X X  X X  X T X −1= X T X −1 L M T=  L X  X T X −1= X T X −1=M L T =M M T Ip 2  var  −var = L LT − 2 M M T = 2   L−M  L−M 2 T

T

T

p.s.d.

2

∀ c : c  L−M L−M  c=d d=∥d∥ ≥0 ⇒ L− M L−M T je p.s.d. (pozitivně semidefinitní) dle definice 7. silná konzistence 1 T platí: X X omezená pro n ∞ n  p× p ⇒ n   skoro jistě 8. (slabá) konzistence P ∞  tj. n n (plyne ze silné konzistence) 9. asymptotická normalita 1 T X X  Q regulární platí: n ∞ n D ⇒  n  n− n N p 0 , 2 Q−1  ∞ neboli  n  n−~ A N p  0 , 2 Q−1  10. eficience, vydatnost Definice: T Nechť f n  y ,  je sdružená hustota náhodného výběru y=Y 1 , ... ,Y n  ,kde d ln f n  y ,  ∈⊆ℝ p je parametr. Označ  y ,= d  p ×1  T Potom J  :=E [  y ,    y ,  ] se nazývá Fisherova informační matice o parametru  p× p 

 . Lemma: Nechť {f n  y ,, ∈⊆ℝ p } je regulární systém hustot (tj. splňuje jistá omezení). Potom: E  y ,=0 i) ii) var  y , =J  iii) Nechť n je nestranný odhad parametru  , tj. E n= ∀ n . Potom platí var n −J −1 ≥0 (p.s.d.)

8

Poznámka: Rovnosti v bodě iii) je dosažené, pokud n=J −1  y ,  , ale vzorec je použitelný jen pokud pravá strana nezávisí na  . Definice: Nestranný odhad n se nazývá eficientní (vydatný), jestliže var n =J −1  , tj. jeho rozptyl dosahuje Raovy-Cramérovy spodní meze. (Má nejmenší rozptyl mezi všemi nestrannými odhady.) Platí:  je eficientní ⇔

e~N n

Důkaz: ' ⇐' Y i~N  x Ti⋅ ,  2 , i=1 , ... , n nezávislé sdružená hustota 1 n n n − − 1 1 T 2 2 2 f n  y , =∏ 2  2  2 exp −  y−x  =2   exp −  y i−x Ti⋅ 2 = i⋅ 2 2∑ i=1 2 2 i=1 −n 1 =2  2 2 exp − 2  y− X T  y− X  2 d d n 1  y , = ln f n  y , = − ln2  2 −  y−X T  y− X  = 2 d d 2 2 1 1 =− 2 −2 X T  y− X = 2 X T  y −X  2  1 1 1 J  = E T =E 4 X T  y −X  y− X T X= 4 X T  E [  y− X  y− X T ] X= 2 X T X   

{

}

{

{

}

}

[

]

2

= var y= I n

 Víme: var =  X X  =J   ⇒ eficience 2

T

−1

−1

9

I.2. Odhad rozptylu chyb  2 Regulární lineární regresní model: y = X   e n ×1 

n× p  p×1

n×1

 - odhad  metodou nejmenších čtverců E e=0 , var e= 2 I n y = X  ... vyrovnané hodnoty y =P y , kde P= X  X T X −1 X , jedná se o projekci do L  X  P je symetrická, idempotentní, h P=p e = y − y = y−X  ... rezidua n ×1 

e = y −P y= I −P y , Q :=I−P je projekce do ⊥ L  X  , je symetrická, idempotentní, h Q=n− p n ×n

y= y e platí: y ⊥ e , tj. y T e =0 Důkaz: y T e = P y T  I −P y= y T P  I −P y= y T  P− P 2  y =0 =P

Lemma: cov  y , e =0 i) ii) cov   , e =0 Pokud navíc e~N n , tak iii) y , e jsou nezávislé iv)  , e jsou nezávislé v) e ~N n 0 ,  2  I −P  Důkaz: i) cov  P y ,  I −P y =P cov  y , y I −P=P var  y  I −P= 2 P I −P= 0 n×n 

ii) dle i) 0=cov  y , e =cov X  , e =X cov   , e  ⇒ cov  , e = 0  p×n 

iii) + iv) nezávislost ⇒ cov=0 u normálního rozdělení platí: nezávislost ⇔ cov=0 v) lineární transformace zachovává normalitu e = I −P y , y ~N n  X  , 2 I  Lemma: Nechť máme regulární lineární model y= X e , E e =0, var e =2 I n , E i jsou nezávislé. 4 Označ 4 :=E E i  . Nechť A je symetrická. Potom: n ×n

i) E y T A y =T X T A X  2 trace  A ii) pokud A X =0 , tak E y T A y =E e T A e= 2 trace  A  n

var y T A y=var e T A e=4 −3 4  ∑ a 2ii 2 4 trace A 2 1

10

Nechť navíc e~N n , A je idempotentní, h  A =r . Pak iii) y T A y ~ 2 2r  , kde =T X T A X  E  y T A y =r  2 iv) pokud A X =0 , tak y T A y ~2 2r centrální E  y T A y =r⋅ 2 var  y T A y =2r  4 Definice: (Reziduální součet čtverců - RSČ)  T  y −X =  e T e S2R := y −X  n

 2= y T  S2R=∑ Y i−x Ti⋅ I −P y= y T Q y i=1

projekce

Definice: (Standardní odhad  2 ) 1 1  T  y −X   , kde p=h X  ... počet regresních parametrů  2 := RSČ=  y− X  n− p n− p Vlastnosti standardního odhadu: 2 1. kvadratický odhad  =

1 y T  I −P y n− p

2. nevychýlený, tj. E  2 = 2 3.

 2 je nejlepší nestranný kvadratický odhad (NNKO, MINQUE), pokud špičatost chyb  4 := 44 =3 , anebo pokud diagonální prvky pi i projekční matice P jsou konstantní 

Poznámka: 4 =3 například pro normální rozdělení.  4 4 = 44 , 4=E  Ei −E  Ei    =0

[

[

]

n

1 1 y T  I−P y = 4−3  4  ∑ 1−p i i 22 4 n− p 2 n− p n− p 1 viz. Lemma ii) A=Q=I −P , X je regresní matice A X =I −P X =X −P X =X −X  X T X −1 X T X=0 ! P X =P , neboť X ∈L  X  ! h I −P=trace I −P =n−p

 2=var 4. rozptyl var 

Pokud navíc e~N n 5.

 ,  2 jsou nezávislé Důkaz: víme, že  , e jsou nezávislé 1 T  2 = e e n− p

11

]

6. rozdělení viz. Lemma iv) n− p  2 ~2n− p ... centrální 2  7.

var  2=

2n− p 4 2  4 = n− p n− p2

8. sdružené rozdělení  j a  2  j− j ~t n− p , kde q j j je j-tý diagonální prvek matice Q= X T X −1 2 jj   ⋅q 9. sdružené rozdělení  a  2 T T    − X X  − ~F p ,n −p p  2 Poznámka: Pomocí Studentova a Fisherova rozdělení můžeme testovat významnost regresních parametrů, a sice po složkách nebo vcelku. I.3. Intervaly spolehlivosti a testy hypotéz  = 0 , ... , k  ... MNČ odhad

p ×1 2

 ... standardní odhad předpokládáme: e~N n 0 ,  2 I n Interval pro  j : 〈  j±   2 q j j t n− p  〉 ... pokryje  j s pravděpodobností 1− test hypotézy H 0j :  j=0j : ∣ j−0j∣ t n − p   2 q j j oblast spolehlivosti pro vektor  : T T   p  −b X X  −b b∈ℝ : ≤F p ,n− p  p  2

{

}

test H 0 :=0 : 0 T 0    −  X T X  −  F p , n− p ... zamítám H 0 2 p 

12

Interval spolehlivosti pro vysvětlovanou proměnnou Y 0 : x 0 ... zadané regresory vysvětlující proměnné p ×1

Předpokládáme stejný lineární model Y 0 =x T0  E0 , kde E0 ~N  0 , 2 nezávislé na E1 , ... , E n , tj. Y 0 nezávisí na  ,  2 interval 〈 xT0  ±  2 1 xT0  X T X −1 x 0 ⋅t n− p 〉 Interval spolehlivosti pro E Y 0 =x T0  : 〈 x T0  ±    2  x T0  X T X −1 x 0 ⋅t n− p 〉 Pás spolehlivosti pro všechna x T  pro všechna x ∈ℝ p současně: 〈 xT  ±  2⋅p⋅F p , n− p ⋅x T  X T X −1 x 〉 S pravděpodobností 1− pokrývá skutečnou hodnotu x T  ∀ x ∈ℝ p současně. Poznámka: 1) Pás spolehlivosti je na okraji dat širší než v jejich středu. 2) Pás spolehlivosti je širší než interval spolehlivosti pro každé jednotlivé x 0 .

13

Věta: (Fisher-Cochran, věta o rozdělení kvadratických forem) Nechť y=Y 1 , ... ,Y nT je náhodný vektor s nezávislými složkami, y~N n  , I n  , =1 , ... , nT . Nechť Q j  y := y T A j y jsou kvadratické formy, kde A j je symetrická, m

h  A j =n j , j=1 , ..., m . Nechť y T y =∑ Q j  y  . Potom Q j  y  jsou nezávislé, j=1

2 nj

m

Q j  y ~  j , kde  j= A j , právě tehdy , když n=∑ n j podmínka na hodnosti T

j=1

n

m

∑  =∑  j

Dále platí

2 i

i=1

.

j =1

Poznámka: 2 2 Věta platí i pro y~N n  , 2 I n  . Potom Q j  y ~ n  j . j

Ověření stability modelu: při změněných hodnotách regresorů – např. stabilita v čase 1) uvažujme n původních pozorování, tj. lineární model 1 y 1 = X 1 1  e1  , e 1 ~N n 0 , 2 I  n ×1 

RSČ:

n × p  p×1  n×1 2 1 T 1 R1

e = y 1T  I −P1  y 1

S =e

=:Q

 1

e = y −X  1 , kde Q1 je projekce: symetrická, idempotentní, h=n− p 1

1 

1

2 R1

2

n ×n

2 n− p

víme: S ~ 

(centrální)

2) přidáme m nových nezávislých pozorování při stejných regresorech, ale s jinými hodnotami, tj. model 2 y 2 = X  2  2 e 2   m× p 

m×1 2 

 p×1 2 m  2 T  2

 m×1

e ~N m 0 , I  , e 1 , e 2 jsou nezávislé RSČ: S2R2= e e = y 2 T  I −P 2  y  2 =: Q

kde Q

2

je projekce: symetrická, idempotentní, h=m− p

2

n ×n 2 R2 2 2 R1 R2

víme: S ~ 2 2m − p (centrální) S , S jsou nezávislé 3) oba modely sloučíme y 1 = X  1   e 1 y 2 X  2 p×1 e 2

     

n m×1

 nm ×p

nm×1

neboli y= X e e~N nm 0 ,  2 I nm  2 T T I −P y RSČ: S R= e e = y  kde

Q

=:Q

je projekce: symetrická, idempotentní, h=nm− p

n m×n m 2 2 2 R n m− p

víme: S ~ 

(centrální) 14

∗ .

platí: y , e jsou nezávislé, kolmé  y T e =0 y= y  e ∣ ∥⋅∥2 y T y = y T y e T e ... Pythagorova věta 2 2 2 neboli ST =S M S R ... rozklad variability  nezávislé 2 2 nm T

víme: S ~   , S2M ~ 2 2p  , S2R~ 2 2nm− p kde = E y   E y =T X T X  to je speciální případ Fisher-Cochranovy věty: y T y = y T y e T e = y T P y  y T  I−P y 2 T

Q

4) Test stability modelu: H 0 :1 = 2 tj. nemění se struktura modelu A) Test A S2T =S2M  S2R−S 2R1 S2R1 neboli pomocí kvadratických forem y T y = y T A1 y y T A 2 y y T A 3 y , kde A1 =P , symetrická, h= p (projekce) je třeba ověřit: - A2 , A 3 jsou symetrické - ? h A2  ,h  A3  - ∗ podmínka na hodnosti Potom (Fisher-Cochranova věta): máme 3 nezávislé 2 - rozdělení ad A3 : S2R1= y 1  T Q 1 y1 = y T A3 y n×n  n×1 



nm×nm nm ×1



Q 1 0 tj. A3 = . symetrická, h  A 3 =h Q1 =n− p 0 0 A ad 2 : S2R−S 2R1= y T Q1  y− y 1T Q 1 y 1 = y T A2 y A 2 =Q− A 3 symetrická kde n m×n m

h  A 2 =? , ukážeme, že A2 je idempotentní, potom st=h A22 =Q− A3 2=Q 2−Q A 3− A 3 Q A 23 Q , A 3 jsou idempotentní Q A 3= I −P A 3 P A 3= X  X T X −1 X T A 3=0





1  0 = X 1T Q 1 0=0 X T A 3= X 1T X 2T ⋅ Q 0 0 1  1T 1  X I −P =0 neboť P1  je projekce do L  X  tedy Q A 3= A 3= A 3 Q A22 =Q− A3 2=Q 2−Q A 3− A 3 Q A 23=Q− A3 − A3 A 3=Q− A 3 tedy A2 je idempotentní h  A 2 =st  A 2 =st Q− A 3 =st Q−st  A 3 =h Q−h A 3 =nm− p−n− p =m podmínka na hodnost: nm=h A 1h A 2h A 3= pmn−p=nm

15

tedy platí Fisher-Cochranova věta: S2T =S2M  S2R−S 2R1 S2R1 - nezávislé S2T ~ 2 2nm  S2M ~ 2 2p  S2R~ 2 2m S R1~ 2 2n− p Testová statistika A: S 2R−S 2R1 /m H F A= 2 ~ F m ,n− p S R1 /n− p F AF m ,n− p  ... zamítáme H 0 :1= 2 , tj. model není stabilní 0

B) Test B S2T =S2M  S2R−S 2R1−S 2R2 S 2R1S 2R2 neboli y T y = y T P y y T A '2 y y T A 3 y y T A 4 y  S 2 −S 2 −S2 / p H F B= 2 R 2 R1 R2 ~ F p ,n m−2 p  S R1S R2 /nm−2 p F B F p ,nm−2 p  ... zamítáme H 0 :1 = 2 , tj. model není stabilní 0

Poznámka: Test B má větší sílu, ale musí platit, že m p navíc k n p .

16

I.4. Míry vhodnosti modelu Úkol: – ověřit model jako celek – shoda modelu s daty Základní model: y = X   e n ×1 

n× p  p×1

+ předpoklad regularity

n×1

 ... MNČ odhad y = X  ... vyrovnané hodnoty e = y − y ... rezidua víme: y= y e y T e =0 ... kolmost cov  y , e =0 ... nekorelovanost y T y = y T y e T e ... Pythagorova věta Značení: y =Y ,... , Y T =Y 1 n n ×1 

 n×1 n

Y = 1×1 

1 ∑Y n i=1 i

S2R := y − y T  y − y  ... RSČ, reziduální (zbytková) variabilita S2T ... celková variabilita dat (celkový součet čtverců) S2T := y T y ... v modelu bez absolutního členu (BAČ) S2T := y− yT  y− y ... v modelu s absolutním členem (SAČ) S2M ... variabilita v modelu (součet čtverců v modelu) S2M := y T y ... (BAČ) S2M := y − y T  y − y  ... (SAČ) Věta: (Rozklad celkové variability) V lineárním modelu y= X e platí S2T =S2M S 2R v případě BAČ i SAČ. Důkaz: BAČ: viz Pythagorova věta SAČ: y= y e ∣− y y− y= y − y e ∣∥⋅∥2 y − y T  y − y  e  T e 2 y − y T e  y− yT  y− y= 2

2

ST

SM

2

SR

T

musíme ukázat, že e  y − y =0 víme e T y =0 ... kolmost e T y=[I −P y ]T 1 n Y =Y y T  I −P1n =∗ 17

P ... projekce do L  x  SAČ ⇒1 n je první sloupec X , tzn. 1n ∈L  x ⇒ P 1n=1n ∗=Y y T 1n −1n = 0 n×1 

Definice: (index determinace) S2 R2=1− R2 , je to mnohonásobný korelační koeficient mezi vysvětlovanou a vysvětlujícími ST proměnnými. Poznámka: i) R2 ∈〈0,1〉 ii) čím větší, tím lepší iii) Otázkou je, jak velké R2 je dostačující - subjektivní názor v technice a přírodě požadujeme, aby R20,6 ve společenských vědách stačí méně Věta: (vlastnosti indexu determinace) S2M 2 R= 2 i) ST  y− y T  y− y  ii)  R2= ... SAČ ∥ y− y∥⋅∥ y − y∥ T  R2=∥ y∥y ⋅∥yy ∥ ... BAČ Důkaz: S2T =S2M S 2R i) S 2 S 2 −S 2 S 2 R2=1− 2R = T 2 R = M2 ST ST ST ii) SAČ 2 ∥y − y∥  S M cos∢ y− y , y − y = = 2 = R2 ∥y − y∥  S T

víme: kosinus úhlu je roven skalárnímu součinu normovaných vektorů,  y− yT  y − y tj. cos ∢= ∥y − y∥⋅∥ y − y∥

Připomeňme: lineární model y= X e , kde vektor parametrů T =  1 , ... , k  ... TBAČ... k = p  0 , 1 , ... , k  ... SAČ ... k 1= p p ... dimenze modelu, počet parametrů k ... počet vlastních regresorů

{

18

Věta: Nechť e~N n 0 ,  2 I n . Potom F=

R 2 n− p ⋅ ~F k , n− p  . 1−R 2 k

Platí =0 ⇔  1=2=...= k =0 . parametry u vlastních regresorů

Důkaz: Je třeba dokázat, že F= 2

2 M 2 T

2 T 2 R

2k  / k 2 n− p



/ n− p

, 2k a 2n− p jsou nezávislé.

2 M 2 R T

S S S R = ⋅ = 2 1−R S S S 2 T S R= e e = y  I−P y ~2n− p a) y~N n  X ,  2 I n  h I −P=n− p I −P X =0 je centrální, neboť  := Ey T  I −P E y=T X T  =0

P je projekce do L  X ⇒ PX =X

b) BAČ: S2M = y T y = y T P y ~2P  h P=p , p=k = Ey T P Ey =T X T P X =T X T X  T X T X =d T d=0 ⇔ d=0 tj. když X =0 X má plnou hodnost ⇒ sloupce jsou lineárně nezávislé X =0 ⇔ =0 1 ,... , k =0 ,... , 0 SAČ: obdobně c) nezávislost BAČ: víme, že y , e jsou nekorelované N ⇒ nezávislost ⇒ S 2M , S 2R jsou nezávislé SAČ: cov  y − y , e =∗



y − y=P y − 1 1Tn y 1n =P y− 1 1n 1 Tn y= P− 1 1n 1Tn y n 

n

n

Y

∗=cov





P− 1 1n 1Tn n

 y , I −P y =

n×n

P− 1 1 n 1Tn n



T = 2  P−P2− 1 1n 1 Tn  1 1n 1 n P =0  =0

n

n

T

=1n

1n ... první sloupec X ⇒ P 1 n=1n , 1 Tn P=1Tn Pokračujeme stejně jako výše. Test kvality regrese: H 0 :1=2=...= k =0 H 1 : ∃ j :  j≠0 R 2 n− p F= ⋅ F k , n− p  ... zamítám H 0 1−R 2 k H 0 ... regresory nemají vliv, model je špatný

19

 I  I −P =  P− 2

2

n

1 1 1T n n n

 I −P=

Poznámka: Zvyšováním dimenze modelu se zvyšuje index determinace, ale komplikuje se model. Pro spravedlivé posouzení je potřeba penalizovat nadbytečné regresory. Například pomocí Akaikeho informačního kritéria S 2R 2 p AIC=ln  n n nebo pomocí upraveného koeficientu determinace nk − p R2a =1−1−R 2 ⋅ . n− p

 

Poznámka: (verifikace modelu) test významnosti vektorů /složek regresních parametrů F−test , t−test Máme dvě metody . vysoký index determinace  test kvality regrese Bohužel někdy mohou tyto metody vyjít rozporuplně.

{

Čemu dát přednost: – testům parametrů při analýze vztahů v modelu – indexům determinace při předpovědích Co dělat, pokud nejsme s modelem spokojeni: – zvětšit rozsah výběru – přidat další regresory – změnit model Poznámka: Při p regresorech existuje 2 p možností jejich zařazení do modelu. Nastává otázka, které zařadit a které ne: Horší je podurčení než přeurčení, tj. horší důsledky má nezařazení důležitého regresoru než zařazení nedůležitého. Podmodel 1 : y= X 1   1e 1 Nadmodel 2 : y= X 1   1 X 2  2e2 Podurčení: ve skutečnosti platí model 2 , ale my pracujeme s modelem 1 Přeurčení: ve skutečnosti platí model 1 , ale my pracujeme s modelem 2 Věta: (o podurčení modelu) Nechť pro y platí nadmodel 2 . Potom MNČ odhad   1 získaný z podmodelu 1 je nestranným odhadem  1 pouze tehdy, je-li 2=0 nebo X 1T X 2 =0 . Podobně  2 získaný z podmodelu 1 je nestranný pouze tehdy, když  2=0 nebo L  X 2 ⊂L  X 1 .

20

I.5 Kolinearita – také multikolinearita – problém lineární závislosti regresorů – vadí situace, kdy regresory jsou lineárně závislé nebo téměř lineárně závislé Nepříznivý vliv na MNČ-odhad  X T X −1 X T y = 2  var =  X T X −1 – X T X nemá plnou hodnost a nelze invertovat . – X T X má sice plnou hodnost, ale det  X T X = 0  X T X −1 má velké prvky, tj.  má velký rozptyl, je nespolehlivý – malé změny v regresorech nebo pozorováních (např. přidání jednoho pozorování) mohou vést k velkým změnám odhadu  , dokonce ke změnám znamének jeho složek – nestabilita odhadu Při předpovědích nemusí vždy vadit p

det  X T X =∣X T X∣=∏  j , kde  j jsou vlastní čísla X T X j=1

X X je positivně semidefinitní ⇒  j≥0 ∀ j h  X T X =r ⇒ r čísel ≠0 p−r čísel =0 uspořádej: 1≥ 2≥...≥ p platí: ∣X T X∣=0 ⇔  p =0 vadí nám situace: ∣X T X∣=0 nebo ∣X T X∣=. 0 Bohužel pojem „ =. 0 “ se těžko konkretizuje T

I.5.1 Zjišťování kolinearity 1) index podmíněnosti  T  X X = 1 p 100 ... silná kolinearita  některé regresory vynechat nebo agregovat 10 až 30100 ... mírná kolinearita  metoda na odstranění kolinearity 2) testy významnosti parciálních korelačních koeficientů pro jednotlivé regresory neboli testy indexů determinace R2j v modelu, kde j-tý regresor je vysvětlovaná proměnná  y  x⋅j  a ostatní regresory jsou vysvětlující proměnné (zůstávají) Je nutné provést k testů kvality regrese, kde k je počet vlastních regresorů. R 2j /k −1 H F j= ~ F k−1 , n− p1 , j=1 ,2 , ... , k 2 1−R j /n− p1 H 0 : regresory nejsou lineárně závislé, tj. není kolinearita 2 2 Pokud většina F j je významných nebo pokud většina R jR , tak je kolinearita. 0

3)

R2 blízké jedničce, ale některé složky  jsou nevýznamné (podle t-testu) 21

4) Vysoké párové koeficienty mezi regresory pozor: kolinearita může nastat i při nízkých 5) Test nulovosti determinantu výběrové korelační matice regresorů Poznámka: Žádný test či měřítko kolinearity nedává absolutní odpověď, nejsou vhodné za všech okolností. Při závislých proměnných je těžké oddělit jejich jednotlivé vlivy. I.5.2 Hřebenová regrese (Ridge regression) – metoda na potlačení kolinearity – idea: zvýšit hodnoty diagonálních prvků X T X o kladnou konstantu: X T X  X T Xc I p , c0 Lemma: X T Xc I p je regulární. Důkaz: Spektrální rozklad symetrické matice p

X X =Q Q =∑  j q j q Tj kde: T

T

 p × p

– – –

j=1

= Diag {1 ,... ,  p } , 1≥...≥ p jsou vlastní čísla X T X Q=q 1 ,... , q p  , q 1 , ... , q p jsou ortonormální vlastní vektory X T X QT Q=Q QT =I p

X T Xc I p =Q Q T c Q QT =Q⋅  c I p  ⋅QT ... spektrální rozklad Diag, vlastní čísla j c T

X X je positivně semidefinitní ⇒ j≥0⇒  jc 0 tj. jsou to nenulová vlastní čísla ⇔∣X T Xc I p∣≠0 Poznámka: Volbou c lze ovlivnit index podmíněnosti

1c .  pc

Definice: (hřebenový odhad)  R := X T X c I p −1 X T y  R=  R c , c0 Věta: Bias  R =−c  X T X c I p −1  MSE  R = X T Xc I p −1  2 X T X c 2  T  X T Xc I p −1 Důkaz: model: y= X e Bias  R =E  R−= X T X c I p −1 X T X −I p = X T Xc I p −1  X T X − X T X c I p = =−c  X T X c I p −1  22

MSE = var Bias⋅BiasT  p× p 

 p× p

 p×1 1× p

var  R = X T Xc I p −1 X T var y X  X T X c I p−1= 2  X T Xc I p −1 X T X  X T X c I p−1 Bias  R [Bias  R ]T =c 2  X T X c I p −1  T  X T X c I p −1 Věta: 2 2  Nechť 0c T . Potom var −MSE   R 0 (positivně semidefinitní).  

Věta: p

var  R = 2 ∑ j=1

j q qT 2 j j  j c 

Důkaz: Spektrální rozklad: T T X T Xc I p=Q c I p Q T , kde Q Q=Q Q =I p ... ortonormální vlastní vektory 1  X T Xc I p −1 =Q c I p −1 Q T ... spektrální rozklad s vlastními čísly  jc víme: var   R = 2  X T Xc I p −1 X T X  X T X c I p−1= 2 Q c I p −1 QT Q QT Q c I p −1 QT = j = 2 Q  c I p −1 c I p −1 QT ... spektrální rozklad, kde  j=  j c 2 p

Diag {1 ,... ,p }

= 2 ∑  j q j qTj j=1

Poznámka: p

1 R 2 T i) speciálně pro c=0 platí var  = ∑ q j q j  j 1 j 1 ii) pokud je  j malé, tak  je velké, ale je malé  jc 2 j Poznámka: (volba hřebenové konstanty c ) p  2 c= Například , kde  je MNČ-odhad, ale  nemusí jít spočítat.  T  Další metody na potlačení kolinearity – metoda hlavních komponent – metoda dodatečné informace, tj. omezení na  – transformace regresorů, např. podíly nebo rozdíly u časových řad – vynechání některých regresorů - vytipovat pomocí párových korelačních koeficientů

23

I.6 Umělé proměnné Umělé proměnné zastupují: – kvalitativní proměnné (pohlaví, region, sociální status) – kvantitativní proměnné, které nelze přímo měřit (vzrušivost centrální nervové soustavy) – kvantitativní proměnné agregované do skupin (věk 10-15, 15-20, ... ) – vícehodnotové – binární, speciálně alternativní (0-1) odhady parametrů nezávisí na hodnotách proměnných Příklad 1: (posun lineárního modelu v prostoru) Poptávka ve městě/na venkově Y tM =1  tt (město) Y Vt =2 tt (vesnice) t ... čas Modely lze sloučit: Y tM =1  2−1 q tt , kde q ... umělá proměnná (regresor) q= 0 ... údaj z města 1 ... údaj z venkova odhad parametrů z nové rovnice je lepší

{

Příklad 2: (posun lineárního modelu v čase) Y t =1 x tt , t∈T 1 Y t =2  x tt , t∈T 2 T 1 ... období s neuspokojenou poptávkou T 2 ... období s uspokojenou poptávkou x t ... příjem peněžní Y t ... spotřeba  ... mezní sklon ke spotřebě 21 skutečný model: Y t =1 q 12 q 2 x t t , t∈T 1∪T 2 q 1= 0 ... t∈T 2 , q 2= 0 ... t∈T 1 1 ... t∈T 1 1 ... t∈T 2 1 , 1 mají původní význam, ale pozor. Není možné do takového modelu přidat absolutní člen, protože pak by to byla kolinearita.

{

{

 

X=

1 ⋮ 1 0 ⋮ 0

0 ⋮ 0 1 ⋮ 1

x1 ⋮ ⋮ ⋮ ⋮ xn

Kdybychom uvažovali absolutní člen, přidali bychom sloupec jedniček, ale ten by byl součtem prvních dvou sloupců.

nebo: model s absolutním členem Y t =1 2−1 q x t  t q= 0 ... t∈T 1 1 ... t∈T 2

{

24

Příklad 3: (agregace kvantitativní proměnné věk) 0 ... 0−10 let q= 1 ... 11−20 let 2 ... 21−30 let 3 ...≥31 let nebo: q 1= 1 ...0−10 let 0 ... jinak q 2= 1 ...11−20 let 0 ... jinak q 3= 1 ...21−30 let 0 ... jinak q 4= 1 ...≥31 let 0 ... jinak

{

{ { { {

Příklad 4: (popis sezónnosti časových řad) 4 sezóny - čtvrtletí Y t =01 x t1 q12 q23 qQ t , kde t je čas q 1= 1... 1. sezóna 0 ... jinak q 2 , q 3 obdobně V modelu s absolutním členem nelze zahrnout umělou proměnnou pro 4. sezónu.

{

Příklad 5: (změna regresních parametrů v čase či prostoru) Y 1 t =11 x 1 t 1 t , t∈T 1 Y 2 t =22 x 2 t  2 t , t ∈T 2 sloučíme:



1 y 1 = 1 ⋮ 2−1 y2 1



       0 ⋮ 0 1 ⋮ 1

x 11 ⋮ x1 T 1 x 21 ⋮ x2 T

1

 2 −1 

2

0 ⋮ 0 x 21 ⋮ x2 T

 1 2

2

neboli: Y t =1 2−1 q 11 x t 2−1 q2 t t q 1= 0 ... t∈T 1 , q 2 t= 0 ... t ∈T 1 1 ... t∈T 2 x 2 t ... t∈T 2

{

{

Poznámka: Použitím umělých proměnných se zvyšuje počet parametrů a klesá přesnost jejich odhadu.

25

II. Zobecněný lineární model (ZLM) y = X n ×1 

  e

n× p  p×1

n×1 T i i⋅

po složkách: Y = x E i , i=1 , ... ,n Předpoklady: n p i) ii) h  X = p ... plná hodnost iii) vlastnosti chyb: E e=0 – – zobecnění ... var e =  ,  je symetrická, pozitivně definitní (tj. regulární) n ×n

Značení:  = j k  n ×n

 j k =cov E j , E k , j≠k  j j=var  E j

}

závislé chyby s nestejnými rozptyly

E y= X  var y=var e=

Platí:

II.1 Odhad parametrů Definice: Zobecněný odhad metodou nejmenších čtverců:  Z := X T −1 X −1 X T −1 y Odvození: 2

= V kde

{

 20 ... konstanta, společný rozptyl V ... positivně definitní, regulární, symetrická

n×n 

−1

−2

 = V

−1

kde V −1 ... positivně definitní, regulární, symetrická

Spektrální rozklad: T

1 2

1 2

V =P  P =P   P T =U U T , kde = Diag {1 , ... , n } ... vlastní čísla 0 – P ... ortonormální vlastní vektory – U ... regulární – Transformace: y= X e ∣U T zleva U T y=U T X U T e neboli: y ∗=X ∗ e∗ ∗ , kde y ∗=U T y , X ∗=U T X , e ∗=U T e Vlastnosti modelu ∗ : n p – – h  X ∗=h X = p E e∗ =0 – var e ∗=U T var e U =U T  2 V U = 2 U T U U T −1 U = 2 U T U T −1 U −1 U= 2 I n – −1

26

⇒∗ splňuje podmínky regularity, tj. je to regulární lineární regresní model. Optimální odhad je tedy MNČ-odhad:  X ∗T X ∗−1 X ∗T y∗= X T U U T X −1 X T U U T y= X T V −1 X −1 X T V −1 y = X T −1 X −1 X T −1 y=  Z = Výraz nezávisí na 2 . Vlastnosti: 1) E  Z = 2) var  z = X T −1 X −1 3)  z je NNLO 4) pokud navíc e~N n , pak: —  Z ~N p  , X T  −1 X −1 — je eficientní  X T X −1 X T y zůstává nevychýlený, ale není nejlepší, 5) „klasický“ odhad =  X T X −1  X T  X  X T X −1 var = Definice: (zobecněná rezidua) e Z = y− X  Z Problém: Většinou neznáme  , proto musíme:  – odhadnout ...  – zjednodušit její strukturu, neboť obsahuje příliš mnoho parametrů: n n−1 n rozptylů + n = kovariancí 2 2



jednodušší struktura  :

1)



=

2 2a 0 ⋮ 0

 2a 0 ⋯ 0  2  2a ⋱ ⋮  2a ⋱ ⋱ 0 ⋱ ⋱ ⋱  2a ⋯ 0 2a  2



markovské fluktuace

2)

=2 V , V je známá  Z nezávisí na  2 e∗ T e∗  e Z T V −1 e Z  2 = =...= n− p n− p 2 2 platí: E  = ... nestranný

3)

=Diag{21 , ... , 2n } 2i obecně různé... heteroskedasticita ZMNČ vede na model

Yi x E , x ∗i⋅= i⋅ E∗i = i i i i ... vážená MNČ: pozorování s malým rozptylem mají větší váhu

∗ ∗ Y ∗i =x ∗T i=1 ,... , n , kde Y i = i⋅ E i ,

MNČ na Y ∗i 4)

= 2 Diag {v 21 , ... , v 2n } , kde v i2 jsou známé  Z nezávisí na 2

27

II.2. Testy homoskedasticity a odhady rozptylů Uvažujeme zobecněný lineární model (ZLM) var e=0 Předpoklady:  je diagonální, tj. =Diag {21 , ... , 2n } H 0 : 21 = 22=...= 2n ... homoskedasticita, tj. = 2 I n (regulární regresní model) H 1 :∃i , j : 2i ≠2j ... heteroskedasticita Například rozptyl 2i =var Y i závisí na nějakém regresoru. Zjednodušený odhad  2i : 1. obyčejný MNČ odhad y = X  T rezidua e = y − y = E 1 , ... , E n  2.  2i = E i2 Test Goldfeldův- Quandtův: H 0 vs. H 1 Předpokládejme: 1. normalita rozdělení 2. pozorování lze uspořádat podle rostoucího rozptylu např. pokud je rozptyl úměrný j-tému regresoru Y i  x i , j , i=1 ,... , n x i , j≤x i , j≤...≤x i , j 1

2

n

2 2 2 tj.  i ≤ i ≤...≤ i Y i Y i ... Y i Y i Y i ... Y i Y i 1 ... Y i − s Y i −s1 ... Y i   1

1

2

n

1

2

n

2

s

s

n

n

n

počet =s

počet =s

 2 S1

 2 S2

RSČ při obyčejné MNČ, lineární model dimenze p testová statistika: S2 H GQ= 22 ~ F s− p , s− p S1 GQF s −p ,s −p  ... zamítáme H 0 ... uspořádání rozptylů vede na pravostranný test ⋅ za H 0 :GQ=1 ⋅ 3 volíme s= n , s je celé číslo, tj. vynechává se přibližně čtvrtina pozorování 8 0

28

Glejserův test: Předpoklady: 1. normalita 2. rozptyly jsou úměrné j-tému regresoru Pro chyby v ZLM se sestaví pomocný model, například: ∣E i∣=01 x i j  i , i=1 ,... , n , kde E  i=0 , var i =2 , i jsou nezávislé potom chyby Ei lze také modelovat jako: Ei =Fi 01 x i j  , kde F i jsou nezávislé, E F i=0 , var Fi =2 potom E  Ei =0 , var Ei=2 0 1 x i j 2 , Ei jsou nezávislé var e== 2 Diag {0 1 x i j 2}= 2 V , kde V závisí na parametrech 0 , 1 pokud 1=0 :  = 2 20 I n ... homoskedasticita 1≠0 : ... heteroskedasticita H 0 :1=0 vs. H 1 :0≠0 Postup: 1. MNČ rezidua e = E 1 , ... , E n T 2. MNČ odhady 0 , 1 v modelu ∣E i∣=01 x i j i   0 , 1 3.

H 0 :1=0 pomocí t-testu  H t= 2 1 2 2 ~ t n−2 kde:  S q n 1 — S2 = ∑ ∣E ∣−0−1 x i j 2 n−2 i=1 i — q 2 2=prvek2,2 matice Q−1 O

— —

Q= X T X= q 2 2=



n

∑ xi j i

∑ xi j i ∑ x 2i j i



1 ∑ x −n x j2 2 ij

4. pokud platí H 0 ... obyčejná MNČ  pokud neplatí H 0 ... ZMNČ  Z 2   = V =2 Diag { 0 1 x i j 2 } i

 z = X T V −1 X −1 X T V −1 y , nezávisí na  2

29

Spearmanův test: Předpoklad: rozptyly úměrné j-tému regresoru Y j  x i j , E i  x i j , i=1 , ... , n Postup: 1. MNČ rezidua e = E 1 , ... , E n T 2. uspořádej dvojice  E i , x i j  dle velikosti absolutní hodnoty reziduí ∣E i ∣≤∣Ei ∣≤...≤∣Ei ∣ xi j xi j xi j 1

2

1

2

n

n

3. pořadí dle velikosti regresorů x i j mezi x 1 j , ... , x n j r1 r2 r n r 1 ,... , r n je permutací 1,... , n 4. testová statistika n

6 ∑ i−r i 

2

r s=1− 5.

1

n n2−1

r s≥c ... zamítám H 0 c ... kritická hodnota pro Spearmanův korelační koeficient test je jednostranný

II.3. Test nezávislosti náhodných chyb Poznámka: Rezidua e jsou vždy alespoň slabě korelovaná, neboť: var e = 2  I − P , P= X  X T X −1 X T ... projekce Myšlenka: Modelovat chyby pomocí AR(1) procesu Ei = E i−1F i , i∈ℤ ∣∣1 ... podmínka stacionarity F i~WN 0 ,  2  + F i nezávislé H 0 :=0 ,tj. Ei splňují podmínky regularity: var e== 2 I n H 1 :≠0 , tj. závislé chyby Ei ∞

Ei =Fi  F i−12 F i−2...=∑ k F i−k k =0

2 var Ei=∑ 2 k  2= 1−2 k=0  2 l cov  Ei , E i−l =...= ... nezávisí na i 1−2 cor  Ei , Ei−l =l ... nezávisí na i cor  Ei , Ei−1 = ... korelační koeficient mezi dvěma sousedními chybami ∞

30



1  2  1  2 2 var e== ⋅   ⋱ 1−2 ⋮ ⋱ ⋱ n −1 ⋯ 2



1  2 1−2  1  −1 = 2 ⋅ 2  ⋱  ⋮ ⋱ ⋱ n−1 ⋯ 2

⋯  n−1 ⋱ ⋮ ⋱ 2 ⋱   1

⋯ n −1 ⋱ ⋮ ⋱ 2 ⋱   1





−1

2

=...=

1− 1 ⋅ 2  1−2



1 − 0 ⋯ 0 − 12 − ⋱ ⋮ 0 − ⋱ ⋱ 0 ⋮ ⋱ ⋱ 12 − 0 ⋯ 0 − 1

 A  n×n

A  je singulární pro =±1 . A  je regulární, když ∣∣1 . Pro ZMNČ je nutno odhadnout  . Pro odhad  z je nutno odhadnout  , není třeba znát  2 . Odhad  z modelu pro MNČ - rezidua: E i = E i−1F i , i=2 , .. , n MNČ - odhad: n

∑ E i E i−1

 i=2n−1 =

2

∑ E i i =1

Zobecněný odhad  :  X −1 X T A    y  z = X T A   je možno iteračně zpřesňovat: E i=Y i−x Ti⋅  z n

∑ E i E i−1

 i=2 = n−1

2 ∑ E i



=

atd.

i =1

31

1 ⋅A  2

Asymptotický test: H 0 :=0 vs. H 1 :≠0 ⋅ 2 1 platí:  ~ N  , 1− 





n

U = n∣∣u  ... zamítáme H 0 , kde u  je kritická hodnota normovaného normálního 2 2 rozdělení Durbinův-Watsonův test: H 0 :=0 vs. H 1 :≠0 testová statistika: n

∑  E i −E i−1

DW = i=2

2

, kde E i jsou rezidua z obyčejné MNČ

n

2 ∑ E i i=1

platí: DW = – –

e T A e , kde e T e e = E 1 ,... , E n T



A = A 1= n ×n

1 −1 0 ⋯ 0 −1 2 −1 ⋱ ⋮ 0 −1 ⋱ ⋱ ⋮ ⋮ ⋱ ⋱ 2 −1 0 0 ⋯ −1 1



, víme že je singulární

e = I −P e=I − P y P= X  X T X −1 X T ... projekce eT  I −P A  I −P e DW = e T  I −P e I −P ... symetrická, idempotentní T . E e I −P A  I−P e rank  I−P A  I−P  E e e T   2 rank I−P A  E  DW = = = = E eT  I−P e E e T I −Pe  2 h I−P rank A −rank  P A  2 n−1−rank  P A = = ... závisí na X n− p n− p kde E e e T =var e=2 I n za platnosti H 0 .

za platnosti H 0 přibližně platí E  DW =2 Podobně i var  DW  závisí na X . DW ∈〈 0 , 4 〉

n−1 . =2 n−p

Hrubá aproximace (nejsou-li k dispozici tabulky): n

∑  E i −E i−1

DW = i=2

n

2

∑ E i i=1

2

n −1

n

i=2 n

i=2

 21 E  2n2 ∑ E  2i −2 ∑ E  i E i−1 E

=

2

.

n

n

1

i=2

 2i −2 ∑ E  i E i−1 2∑ E

=

∑ E i

n

2

∑ E i

i=1

i=1

kde  je výběrový korelační koeficient mezi sousedními chybami. DW  odhad  pomocí DW - statistiky: =1− 2

32

{

4  =−1  =21− = 2  =0 0  =1

Kritické hodnoty: Jsou založeny na aproximaci, aby se obešla jejich závislost na X .

z L ... dolní kritická hodnota z U ... horní kritická hodnota ? - oblast neprůkaznosti ... nelze rozhodnout

Poznámka: V oblasti neprůkaznosti je možné počítat přesné kritické hodnoty, které jsou závislé na X , ale jejich výpočet je velmi složitý a vyžaduje další speciální tabulky. Oblast neprůkaznosti se zužuje pro n ∞ (roste rozsah výběru). Pro zúžení oblasti existují různá vylepšení (modifikace původního testu). III. Zdánlivě nesouvisející rovnice (SUR - Seemingly Unrelated Regression) Uvažujme q lineárních regulárních modelů: y  j = X  j  j   e j  , j=1 , ... , q n ×1 

n × pj   p j ×1 

n×1 

E e j =0, var e j= j j I n cov  Ei j , Ei k = j k ... zde je ta souvislost i -tá pozorování v každém modelu jsou korelovaná i -té a i ' -té pozorování jsou nezávislá cov e j  , e  k = j k I n q modelů shrneme do jednoho: y  1 X  1 0 ⋯ 0  1 e1  y  2 = 0 X 2  ⋯ ⋮  2  e 2  ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ y  q 0 0 ⋯ X  q  q e q    e neboli y = X

 

n q ×1

   

 n q× p j    p j ×q

n q×1 



1 1 I n ⋯ 22 I n var e =var y= I n= ⋮ n q ×n q ⋮ ⋮ q 1 I n ⋯ nebo lze zapsat „vedle sebe“ Y 11 Y 12 Y = y  1 y  2 ... y q = Y 2 1 Y 2 2 n ×q ⋮ ⋮ Y n1 Y n2



⋯  1q I n ⋯ ⋮ ⋱ ⋮ ⋯  qq I n

⋯ Y 1q ⋯ Y 2q ⋱ ⋮ ⋯ Y nq





řádky ... q - rozměrná nezávislá pozorování sloupce ... jednotlivé proměnné, v rámci jednoho pozorování závislé například:

i=1,... , n −uchazeči j=1 , ..., q −zkoušené předměty 33

var y i⋅=  = j k   q×q 

var y⋅j = j j I n cov  y i⋅, y i⋅=0 , i≠i' cov  y⋅j , y⋅k = j k I n '

Odhad parametrů

  1

= ⋮

 q

zobecněná metoda nejmenších čtverců (ZMNČ):  = I n =var e=var y  z = X T −1 X −1 X T −1 y , kde n q ×n q

postup při neznámém  (tj. neznámé  ): 1. obyčejné MNČ - odhady  j z jednotlivých rovnic   j= X Tj  X  j −1 X T j y  j , j=1 ,... , q 2. odhad = j k  1  j k =  y j − X  j   j T  y k − X k    k  n− p p=min p j , p k  , j , k =1 ,... , q 3. „dvojstupňový“ zobecněný odhad    In  −1 X −1 X T   −1 y , kde =  z = X T  Poznámka: Nechť X 1= X 2 =...= X q = X

 n× p

y  1 y 2  y  q  = X   1   q  E   n× p  n×q  vedle sebe , n×q 

 p×q 

neboli

Y = X n ×q

B  E

n× p  p× q

 n×q 

Platí: ZMNČ = MNČ  1  z  = ⋮ stačí odhadovat  jako MNČ z každé rovnice zvlášť  q 



34

- vícerozměrná regrese

IV. Simultánní rovnice Příklad: Modelujeme nabídku a poptávku: V ... vyměňované množství zboží U ... cena zboží x ... příjem spotřebitelů

U , V ... náhodné veličiny, endogenní x ... nenáhodné, exogenní, predeterminovaná proměnná V ... vysvětlovaná proměnná U , x ... vysvětlující proměnné (regresory) U ... náhodný regresor Pro jednoduchost uvažujme lineární model ve tvaru: V i=1 11 2 x i11 U i Ei 1  P ... rovnice poptávky V i=2 121 U i Ei 2  N  ... rovnice nabídky kde i=1 , ... , n jsou pozorování  P ... poptávka  N  ... nabídka Ekonomická interpretace parametrů a omezení na parametry: 1 2≥0 1 1≤0 ... čím vyšší cena, tím nižší poptávka 2 1≥0 ... čím vyšší cena, tím vyšší nabídka Maticový zápis: V1 1 x1 U 1 11 E 11 ⋮ = ⋮ ⋮ ⋮ 1 2  ⋮ Vn 1 x n U n 11 E n1

             

V1 1 U1 E1 2 21  ⋮ ⋮ =⋮ ⋮ 2 1 Vn 1 Un En 2 neboli v =X  1 1 e 1  P v =X  2 2 e 2 N

 P

N

+ předpoklady o chybách: E e 1 =E e 2 =0 – var Ei 1= 1 1 , E i1 jsou nezávislé – var Ei 2= 2 2 , E i 2 jsou nezávislé – +vazba: cov  Ei 1 , E i 2= 1 2 ∀ i

35

Matice chyb: E =e1 , e 2  n ×2

var e i⋅=  = 2×2 



1 1  1 2 1 2  2 2



cov e i⋅ , ei ⋅=0, i≠i ' tj. SUR (zdánlivě nesouvisející rovnice), q=2 s náhodným regresorem U . Strukturní tvar rovnic  P, N  se převede na tvar redukovaný, tj. U , V doleva. '

 N  dosaď do  P : 2 12 1 U iE i 2=1 11 2 x i1 1 U iE i1 1 Ui=  −  x E i1 −Ei 2  2 1− 11 1 1 2 1 1 2 i dosaď do  N  : 1 1 V i=2 121 1 1−2 11 2 x iEi 1− Ei 2 Ei 2=    −   2 1−1 1 2 1−1 1 21 2 1 2 1 1 1 11 2 1−2 1 2 11 2 2 1 xi 2 1 Ei 1−1 1 E i2  Napočítejme kovariance: E −Ei 2 1 cov U i , E i 1=cov i1 , E i1 =  − 1 2 21 −1 1 2 1−1 1 1 1 1 cov U i , E i 2 =  − 2 2  2 1−11 1 2 tyto kovariance jsou obecně nenulové, tedy U a chyby E1 , E2 jsou závislé  problém pro metodu nejmenších čtverců. Odhady parametru  ,  pomocí MNČ ze strukturních rovnic  P, N  by nebyly konzistentní ani nestranné, proto přecházíme na redukovaný tvar: U i =1 11 2 x iF i 1 V i=2 12 2 x iF i 2 , i=1 , ... , n , kde  − 1 1= 1 1 21 , 12=... atd. – 2 1−11 E i 1−E i 2 F i 1= , F i 2=... nové chyby – 2 1−11 E −E i2 2 1 Ei 1−1 1 E i 2 cov F i 1 , F i 2 =cov i 1 , =...≠0 2 1−11 2 1−1 1 ⇒ redukované rovnice jsou provázány skrze kovarianci chyb.









Maticově (redukovaný tvar): u=X  1 1 f 1 v =X  2 2f 2 

  1 x1

kde X 1= X 2 = X = ⋮ ⋮ n×2 

1 xn

SUR pro q=2 . Pro nejlepší odhady  je obecně nutno použít ZMNČ. Nicméně víme, že pro X  1= X 2  stačí MNČ pro každou rovnici zvlášť. (Konec příkladu) 36

IV.1 Simultánní rovnice obecně Proměnné vystupují v některých rovnicích jako vysvětlující, v jiných jako vysvětlované. q nezpožděných endogenních proměnných Y 1 , ... ,Y q , získaných během n pozorování. Y 11 ⋯ Y 1 q Y = ⋮ ⋱ ⋮ =Y i j  , kde i=1 ,... ,n ... pozorování n ×q j=1 , ... , q ... proměnné Y n1 ⋯ Y n q





{

p exogenních proměnných x 1 ,... , x p x1 1 ⋯ x1 p X = ⋮ ⋱ ⋮ = x i k  , kde i=1 , ... , n ... pozorování n × p k=1 ,... , p ... proměnné xn 1 ⋯ xn p





{

Tyto dvě skupiny proměnných jsou vázány prostřednictvím q rovnic (lineárních) s parametry/koeficienty:  1 1 ⋯ 1 q  = 1) ⋮ ⋱ ⋮ = j k  q ×q  q 1 ⋯ q q  j k ... koeficienty u endogenních proměnných ⋅j ... koeficienty u j-té proměnné  j⋅ ... koeficienty u j-té rovnice









1 1 ⋯ 1 p B = ⋮ ⋱ ⋮ =  j k  2) q × p q 1 ⋯ q p  j k ... koeficienty u exogenních proměnných ⋅k ... koeficienty u k-té proměnné  j⋅ ... koeficienty u j-té rovnice  , B ... strukturní parametry Model ve strukturním tvaru: Y  T  X BT = E , kde E= E i j  je matice chyb n ×q  q×q   n× p  p×q   n×q Předpoklady: E E =0 – – cov e i⋅ , ei ⋅= 0 '

i≠i '

q ×q

–

var e j⋅=  = j k  q×q 

Model pro i-té pozorování:  y i⋅B x i⋅=e i⋅, i=1 , ... , n Model pro j-tou rovnici: Y  j⋅ X  j⋅=e⋅j , j=1 ,... , q 37

Poznámka: V j-té strukturní rovnici vystupuje nalevo jediná proměnná Y j . Bez újmy na obecnosti předpokládejme, že  j j =1 (jinak znormujeme), tj. v každé rovnici nejvýše q−1 p neznámých parametrů. Poznámka: (terminologie)  je diagonální ... SUR  je blokově diagonální ... neintegrovaná struktura  je trojúhelníková ... rekurzivní systém rovnic  je obecná ... obecná integrovaná struktura Model převedeme do redukovaného tvaru: Y  T X BT =E ∣ T −1 zprava Y =−X B T   T −1 E  T −1= X  T  F  n× p  p×q 

 n×q 

kde

−1

 =− B

–

q × p

F = E T −1

–

n ×q

= j k ... neomezené koeficienty, přímé multiplikátory

–

Pro i-té pozorování: y i⋅= x i⋅f i⋅, i=1 , ... , n f i⋅=−1 e i⋅ platí: – –

E f i⋅=0 −1 var f i⋅=   −1T nezávislé na i  q ×q

f i⋅ nekorelované – tj. Y = X  T  F ... SUR, kde X  1=...=X q =X víme: Pro nejlepší odhad  nám stačí MNČ:  = X T X −1 X T Y ... nejlepší nestranný lineární odhad Příklad: (pokračování) q=2 , Y =U , V  p=2 , X =1, x   = 2×2 

B = 2×2 

 

−1 1 1 −2 1 1



−1 1 −1 2 −2 1 0

 P N



případně rovnici  P znormuj pomocí

1 −1 1

(konec příkladu) 38

IV. 2 Problém identifikace Strukturní tvar: Y  T  X BT = E n ×q  q×q 

 n× p  p×q 

 n×q

Redukovaný tvar: Y = X  T F n ×q

 n× p  p×q 

n×q 

Známe-li  , jak můžeme zpětně vyjádřit  a  ? −1 B Platí:   =−  #pq

2

# q  p q 

Některé  ,  mohou být nulové 1−1 #   #  ,  ... přesná identifikace přeurčení - identifikace jinak podurčení Ověříme pro jednotlivé rovnice nebo pro soustavu jako celek.

{

Příklad: (pokračování) V ... vyměňované množství zboží U ... cena zboží x ... příjem spotřebitele Redukovaný tvar: U i =111 2 x iF i 1 V i=2 12 2 x iF i 2

i=1 , ... ,n

Dosaď do strukturního tvaru:  P  2 12 2 x iF i 2=1 11 1  11  12 x iF i 1 1 2 x i Ei 1  Vi

Ui

 N  2 12 2 x iF i 2=2 12 1 1 11 2 x iF i 1 Ei 2

Porovnej koeficienty: P 2 1=11 1 1 1 1 2 2=1 1 1 21 2  N  2 1=21 2 1 1 1 2 2=2 1 1 2

} }

2 rovnice pro 3 neznámé  , 

 rovnice je podurčená

2 rovnice pro 2 neznámé  , 

 rovnice je přesně identifikovaná

2 2  , 2 1=2 1−1 1 2 2 1 2 1 2 celkem 4 rovnice pro 5 neznámých  soustava je podurčená (konec příkladu) 2 1=

39

Problém identifikace obecně =−−1 B neboli   =− B q ×q q × p

q× p

Uvažuj j-tou rovnici: × Tj⋅=−Tj⋅, j=1 , ... , q Bez újmy na obecnosti:  j j =1 , j=1 , ... , q Značení: q j ... počet nenulových  v j-té rovnici, počet přítomných endogenních proměnných q−q j ... počet nulových  v j-té rovnici, počet chybějících endogenních proměnných p j ... počet nenulových  v j-té rovnici, počet přítomných exogenních proměnných p− p j ... počet nulových  v j-té rovnici, počet chybějících exogenních proměnných T  j 1 ,... ,  j q , 0 ,... , 0  a zároveň Přeskládej proměnné v j-té rovnici tak, aby  j⋅=  j

# q j nenulových T j⋅

# q− q j

 = j 1 , ... ,  j p , 0 , ... , 0 j

Potom: =

q × p



11  1 2 2 1   2 2 pj



qj q−q j

p− p j

přepíšeme × jako: ∗   j 1 , ... ,  j q  1 1 =−  j 1 ,... ,  j p  ... p j rovnic ∗∗  j 1 , ... ,  j q   1 2=0 , ... , 0 ... p− p j rovnic j

j

j

V j-té rovnici je q j−1 neznámých  . Ty odhadneme z ∗∗ , ale musí být dostatek rovnic.  podmínka na počet parametrů: p− p j ≥q j−1 (tj. dostatečný počet nulových  ). Podmínka není postačující, neboť rovnice ∗∗ mohou být lineárně závislé.  1 2 musí mít dostatečnou hodnost h 1 2≥q j−1 Rozměr  1 2 : q j× p− p j při splnění 1. podmínky ⇒ h  1 2 ≤q j kdyby h  1 2=q j , tak ∗∗ má pouze triviální řešení  podmínka na hodnost: h  1 2=q j−1 Tabulka počet parametrů

h    12  

p− p j q j−1

=q j−1

přeurčení

p− p j =q j−1

=q j−1

přesná identifikace

p− p j ≥q j−1

q j−1

podurčení

p− p j q j−1

libovolné

podurčení 40

Poznámka: Podurčení lze odstranit: 1) vynulováním některých strukturních parametrů  ,  2) lineárními podmínkami, čili omezeními na  ,  3) podmínkami na varianční matici  Příklad: (pokračování) q=2 , Y =U , V  p=2 , X =1, x 



=

−11 1 −2 1 1



, B=



−1 1 −1 2 −2 1 0



1. rovnice  P : j =1 q 1=2 , p1=2 0= p− p 1q 1−1=1   P je podurčená 2. rovnice  N  : j=2 q 2=2 , p2=1 1= p− p2 =q 2−1=1 ? h 1 2  rozměr: q 2× p− p 2⇒ 2×1   1 2= 1 2 , h  1 2=1=q2−1 2 2 tedy  N  je přesně identifikovaná (konec příkladu)

 

IV.3 Metody odhadu parametrů IV.3.1 Nepřímá metoda nejmenších čtverců Používá se při přesné identifikaci, tj. p− p j =q j−1 a h  1 2=q j−1 . Z ∗∗ vyjádříme  a dosadíme do ∗  Jednoznačné řešení  ,  budou konzistentní, ale obecně vychýlené Postup: MNČ  1.  R Y = X T F    2.  =−B   , B

41

IV.3.2 Dvoustupňová metoda nejmenších čtverců Používá se pro přeurčené soustavy, při přesné identifikaci dá tytéž odhady jako nepřímá MNČ. Odvození: S  Y  T  X B T =E  R Y = X T F Uvažuj j-tou rovnici a nechť  j j =1 . Strukturní tvar: j-tý sloupec Y  j⋅ X  j⋅=e⋅j neboli  y⋅1 , y⋅2 ,... , y⋅j , ... , y⋅q 

 j 1 ⋮  jj =1 ⋮ j q

X  j⋅=e⋅j

Vybereme j-tý sloupec y⋅j : 1⋅y⋅j−Y ∗ j ∗j⋅jX  j⋅=e⋅j , kde operátor ∗j : – z matice vyjme j-tý sloupec – z vektoru vyjme j-tý prvek y⋅j=−Y ∗ j ∗j⋅j− X  j⋅e⋅j Problém: Y ∗j korelované s chybami e⋅j , tedy MNČ odhady  j⋅,  j⋅ by nebyly ani konzistentní.  ... nevychýlené, konzistentní Z  R odhadneme MNČ ...  T  Y = X  ∗ j  T ∗ j= X    T ∗ j Y = X  Dosadíme:  T ∗ j ∗j⋅j −X  j⋅g⋅j y⋅j=−X  

♥

MNČ odhady  j⋅ ,  j⋅ jsou konzistentní, obecně vychýlené (asymptoticky nevychýlené) 2-stupňové odhady. Postup:  1. Y = X  T  F MNČ  2.

 T ∗ j ∗j⋅ j− X  j⋅g⋅j MNČ ♥ y⋅j =−X     j⋅ ,  j⋅

42

j=1 ,... , q

IV. 3. 3 Trojstupňová metoda nejmenších čtverců Chyby g⋅j v rovnici ♥ mají tuto strukturu G1 1 ⋯ G 1 q G = ⋮ ⋱ ⋮ nezávislé řádky (pozorování) n ×q Gn 1 ⋯ G n q korelované sloupce (proměnné) cov g i⋅ , g i⋅=0 , i≠i' cov g⋅j , g⋅k = j k I n var  gi⋅= T = j k  ∀ i





'

q×q 

tedy SUR – s různými maticemi plánu – s variační maticí  =T  I n n q ×n q

Postup:  1. Y = X  T  F MNČ  2.

MNČ

 T ∗ j ∗j⋅ j− X  j⋅g⋅j   j⋅ ,  j⋅ ♥ y⋅j =−X  

j=1 ,... , q

3. odhad kovariancí 1  j k = g ⋅jT g ⋅k , kde g ⋅j rezidua z j-té rovnice ♥ h h=max n− q j−1− p j , n−q k −1− p k  q j ... počet nenulových endogenních proměnných v j-té rovnici p j ... počet nenulových exogenních proměnných v j-té rovnici  = T I n  nq ×n q

4. ZMNČ  = ZT   −1 Z −1 Z T   −1 y   −1 ∗1 X 



kde

Z

=

n q ×[ q q −1 p q ]



0 ⋮ 0

0 ⋯ 0 −1 ∗2   X ⋯ ⋮ ⋯ ⋱ 0  ⋯ 0 X  −1∗q

T

= ⋅1∗1 T , ... , ⋅q∗q T  ... q q−1×1 = T1⋅ ,... , Tq⋅T ... p q×1 y= y⋅1T , ... , y⋅qT T ... n q×1

43

X 0 0 X ⋮ ⋮ 0 ⋯

⋯ ⋱ ⋱ 0

0 ⋮ 0 X



IV. 4 Konečný tvar simultánních rovnic Uvažujme dynamický model se zpožděnými proměnnými t ... čas Strukturní tvar: Y t  T Y t−1  T1 ... Y t −s  Ts  X

T t n× p   p×q 

n ×q q×q 

B X t−1 B T1 ... X t −r BTr = E

t  n×q 

Převedeme na redukovaný tvar: ∣ T −1 zleva Y t =Y t−1  T1 ...Y t−s  Ts X t  T0 X t−1  Ts1...X t−r Ts rF T n ×q

 p×q 

q ×q

 p×q 

kde  0=−−1 B ,  1=− −1  1 atd... Zjednodušený redukovaný tvar 1. řádu: s=1 , r=0 Y t =Y t −1 T1  X t  T0 F t=Y t −2 T1  X t−1  T0 F t−1  T1 X t T0 F t =...= T t 1

t −1

T l 1

t −1

l

=Y 0    ∑ X t−l     ∑ Ft −l   T1  ... konečný tvar l=0

T 0

l=0

Y 0 ... výchozí hodnoty Odtud předpovědi: v čase T o h kroků dopředu 0 T , t h h−1

 h1 y T ∑    1 l   0 x PThl kde: y TPh=   q×1

l=0

y T ... průměrná hodnota v čase T (průměr i=1 , ... , n ) – x PTh −l dané budoucí hodnoty exogenních proměnných – speciální případ: h=1 ... krátkodobá předpověď  1 y T   0 x TP1 y TP1=  Odhady parametrů redukovaného tvaru: 1. nepřímo, pomocí konzistentních odhadů   , B : =−  −1 B nebo  2. přímo pomocí MNČ...  Poznámka: Při přesné identifikaci je to ekvivalentní.

44

V. Dynamické modely Předpoklady: Y t ... 1-rozměrná náhodná veličina x t ... 1-rozměrný nenáhodný regresor t ... čas Idea: Změny v závislé proměnné se projevují postupně v čase. V. 1 Model rozdělených zpoždění Y t =0 x t 1 x t−1...k x t −k E t + předpoklady regulárního regresního modelu k

Y t =∑  j x t− jE t , kde k je maximální zpoždění nezávislé proměnné x j=0

V.1.1 Konečně rozdělené zpoždění Nastává, pokud k ∞ , většinou k neznáme. – předepíšeme – určíme pomocí testů významnosti  j – určíme podle indexů determinace v různě zpožděných modelech Problémy: – matice X bývá kolineární – málo pozorování vzhledem k počtu parametrů k 1 Počet parametrů lze snížit speciální volbou  j : – Lineárně rozdělené zpoždění  j=k 1− j , j=0 , 1 ,... , k – Trojúhelníkově rozdělené zpoždění k  j= j , j=0 , 1 , ... , 2 k  j=k − j   , j= 1, ... , k 2 – Polynomicky rozdělené zpoždění  j= 01 j... r j r , r ≪k =J  y= X e=X J e

45

V.1.2 Nekonečně rozdělené zpoždění Nastává, pokud k =∞ . ∞

∞

j=0

j= 0

Y t =∑  j x t− jE t=∑  j Z j  xt Et kde Z j  x t =x t − j je operátor zpoždění – Geometricky rozdělené zpoždění (Koyckův přístup)  j=w j , j=0 , 1 , ... w j =1−  j ~Geom1− , ∈0,1 tedy:  j=1− j , j=0 ,1 , ... Dosaď do modelu: ∞

Y t =∑ 1−  j Z j  x t E t j=0

Trik: považuj Z za reálnou proměnnou a sečti jako geometrickou řadu 1− Y t= x Et ∣1− Z  1− Z t 1− Z Y t =1− x t 1− Z Et Y t =Y t −11− x t E t − E t −1 ... AR tvar modelu  =: F t

Náhodný regresor Y t −1 korelovaný s chybami  MNČ odhady jsou nekonzistentní. Přidávají se další předpoklady o chybách, např. F t i.i.d. . V.2 Model částečného přizpůsobení 0

Y t = 01 x t Y t ... optimální očekávaná (požadovaná) hodnota (nenáhodná) a dále Y t −Y t −1=  0Y t −Y t −1 Et , kde ∈  0,1 〉 ... koeficient přizpůsobení 0

Skutečná změna se přizpůsobuje (přibližuje) očekávané změně, ale nemusí jí dosáhnout. Obě části modelu sloučíme: Y t −Y t −1= 01 x t −Y t −1 Et Y t =1− Y t −1  0  1 x t Et ... AR tvar je to Koyckův model s absolutním členem a s nezávislými chybami

46

V.3 Model adaptivního očekávání Y t =01 0 x t Et 0 x t optimální očekávaná nebo průměrná hodnota x t 0 x t −0 x t−1= x t −0 x t−1  , kde ∈  0,1 〉 ... koeficient očekávání Očekávaná změna se přizpůsobuje skutečné hodnotě 0

∞

x t = x t 1− 0 x t−1= x t 1−[ x t 11− 0 xt −2 ]=...= ∑ 1− j x tj− j= ∞

j=0

 = ∑ 1− Z x t = x 1−1− Z t j=0 j

j

Dosaď do 1. části: 1  Y t =0 x E t ∣1−1− Z  1−1− Z t Y t =0 1  x t 1− Y t−1 Et −1− E t −1 ... AR tvar Koyckův model s absolutním členem V.4 Model racionálně rozděleného zpoždění Y t 1 Y t −1...r Y t −r=x t 1 x t−1 ...s x t−s Et neboli  Z Y t =Z  x t E t , kde  Z , Z  jsou operátory zpoždění

47

EKONOMETRIE. Univerzita Palackého v Olomouci

Recommend Documents