EKONOMETRIE Univerzita Palackého v Olomouci
Úvod Ekonometrie je hraniční disciplína, která čerpá ze tří oblastí: – ekonomie – matematika – statistika Další „meziobory“: – matematická ekonomie (všechny ekonomické procesy je možné redukovat na směnu a modelovat je matematicky, 1850 – 1940) – ekonomická statistika (základní statistické postupy aplikované na ekonomická data, především získávání a třídění dat + základní popis dat z oblasti ekonomie) – matematická statistika (teorie statistické indukce založená na teorii pravděpodobnosti) Předmětem zkoumání ekonometrie je vyhledávání, měření a matematická formulace ekonomických vztahů a zákonitostí. Pomocí matematických metod se vyvozují kvantitativní závislosti hospodářského života. Historie: – v roce 1930 vznikla ekonometrická společnost – v roce 1933 se začal vydávat časopis Econometrica (vydává se dodnes) – mezi nejvýznamnější osoby ekonometrie patří Frisch, Schumpeter, Cobb, Douglas Ekonometrické modelování (=výstavba ekonometrického modelu)
Model = zjednodušení Ekonomický model obsahuje: •
(A)+ (B) – proměnné a jejich typ Dělení z různých hledisek: 1) Regrese ‒ nezávislé proměnné (regresory) ‒ závislé proměnné (odezvy) 2) Dle formy zápisu ‒ vysvětlující (napravo) ‒ vysvětlované (nalevo) 3) Dle času ‒ nezpožděné ‒ zpožděné 1
4) Simultánní rovnice (subjektivní, záleží na cíli analýzy a na dostupných datech) ‒ endogenní (jsou předmětem zkoumání, jsou generovány modelem, jsou vysvětlující i vysvětlované) ‒ exogenní (nejsou zkoumaným systémem ovlivňovány, ale působí na něj, jsou pouze vysvětlující) 5) Simultánní rovnice ‒ nezpožděné endogenní ‒ predeterminované 6) Stochasticky ‒ náhodné (C) ‒ nenáhodné Parametry: – konstanty, které nám dolaďují vztah mezi proměnnými – jsou neznámé – apriorní omezení (ve formě znamének) •
(B) – rovnice Dělení z různých hledisek: 1) Počet rovnic ‒ jednorovnicový model ‒ vícerovnicový model −zdánlivě nesouvisející rovnice (přes kovarianční strukturu) −simultánní rovnice 2) Podle typu rovnic ‒ lineární modely − v proměnných − v parametrech (lze užít MNČ) ‒ nelineární modely
•
(C) – specifikace náhodných proměnných Zajímá nás rozdělení pravděpodobnosti, momenty, kovarianční struktura. 1) Systematické 2) Chybové (chyby měření, chyby z funkčního zjednodušení)
•
(D) – kvantifikace (odhad parametrů) Parametry – strukturní, koeficienty u proměnných – stochastické, např. rozptyl chyb – volba vhodné odhadovací metody (např. MNČ) – ověření předpokladů metody (např. typ rozdělení, nezávislost, rozsah výběru, stejné rozptyly, kolinearita, identifikace simultánních rovnic,...) – verifikace, ověření modelu – ekonometrická - kontrola omezení a znamének parametrů – statistická – významnost parametrů nebo celkového modelu, t-testy, F-testy, index determinace
2
Využití modelu: – analýza závislostí – jedná se o pochopení generujícího mechanismu – předpovědi (predikce, prognózy) – na základě modelu se snažíme uhodnout, jak se vše bude vyvíjet dál – je zde předpoklad, že funkční závislosti zůstávají stejné – řízení a optimalizace – jak zvolit vstupy, abychom dostali optimální výstupy Typy ekonometrických modelů: – strukturní (desagregované) - proměnné dle odvětví, území apod. – agregátní - souhrnné proměnné – makroekonomické - popisují celé hospodářství nebo odvětví – mikroekonomické - popis podniků, domácností, jednotlivých subjektů – statické – dynamické - časová proměnná a časové zpoždění proměnné
3
Model obecně: Y j t=f j ( Y 1 t , Y 1,t −1 ,... , Y 1,t −z , ... , Y j ,t−1 , ... ,Y j , t− z , ... , Y q t , Y q ,t −1 , ... , Y q , t− z , x 1 t , ... , x 1,t −z , ... , 1
x p t , x p ,t −1 , ... , x p ,t −z , E j t ) , ' p
j
q
' 1
j=1 , ... , q
dynamický model, ve strukturním tvaru
q rovnic pro q endogenních proměnných Y j t - závislé proměnné f - funkce známá (až na parametry) Y - endogenní proměnné (náhodné) x - exogenní proměnné (nenáhodné) t - čas z , z ' - zpoždění proměnných Predeterminované proměnné jsou všechny Y a x kromě Y 1 t , ... , Y q t , tj. všechny x a nezpožděné Y . Zobecnění: 1) X ... náhodné veličiny náhodné regresory nosiče předpokládáme nezávislost X , E 2) opakovaná pozorování j=1 ,... , q endogenní proměnné/rovnice Y j t i kde t čas i=1, ... , n pozorování nezávislá
{
Speciální případy: 1) q=1 ... jednorovnicový model 2) f lineární v parametrech i proměnných statický model (bez vlivu času) Y 1=1 2 Y 21 3 Y 3...1 q Y q1 1 x 1...1 p x pE 1 Y 2=2 1 Y 1 23 Y 3...2 q Y q2 1 x 1...2 p x p E2 ......................................................................................... Y q = q 1 Y 1 q 2 Y 2...q q−1 Y q −1 q 1 x 1...q p x p Eq soustava simultánních rovnic ve strukturním tvaru
lze přepsat maticově y B x = e q×q q ×1
q× p q ×1
q×1
, B ... matice strukturních parametrů =I ... prosté modely, mezi endogenními proměnnými není žádný vztah =trojúhelníková ... rekurzivní modely, jednosměrné vazby mezi Y =obecná ... obecné modely, jsou zde také zpětné vazby
4
I. Lineární regresní model Vícenásobná lineární regrese Y i=01 x i 12 x i 2...k x i k Ei , i=1 , ... , n model statický, jednorovnicový, lineární s absolutním členem Y ... vysvětlovaná, závislá proměnná, odezva (endogenní proměnná) x ... vysvětlující, nezávislá proměnná, regresor, nosič, (exogenní proměnná) E ... náhodná proměnná, chyba, fluktuace n ... rozsah výběru, počet pozorování maticový zápis: y = X e n ×1
n× p p×1
n×1
y=Y 1 , ... ,Y n T ... vektor pozorování, náhodný
1 x 11 X =⋮ ⋮ n × p 1 xn 1 respektive x11 ⋯ X = ⋮ ⋱ n × p xn1 ⋯
⋯ x1k ⋱ ⋮ ⋯ xnk x1 k ⋮ xn k
dizajnová matice, nenáhodná
... dizajnová matice bez absolutního členu
p ... počet parametrů, dimenze modelu p= k+ 1 s absolutním členem k bez absolutníhočlenu k ... počet vlastních regresorů n− p ... počet stupňů volnosti =0 , 1 ,... , k T ... regresní parametry, nenáhodné
{
p ×1
e = E1 , ... , E nT ... chyby, náhodné
n ×1
Předpoklady regularity: 1) n> p ... kladné stupně volnosti, více pozorování než parametrů 2) h( X )= p ... plná hodnost, lineárně nezávislé regresory 3) E e= 0 ... nulová střední hodnota n×1 2
var e= I n ... konstantní rozptyly Ei jsou nezávislé
Alternativy k bodu 3) Ei jsou nekorelované Ei tvoří náhodný výběr (náhodný výběr znamená nezávislé a stejně rozdělené veličiny) Poznámka: a) regulární model splňuje 1) – 3) b) normální regulární model splňuje navíc Ei ∼N ( Ei má normální rozdělení)
5
Zobecnění 1) y Y n ×1
Y = X n ×q
2) 3)
, tj. q vysvětlovaných proměnných
n×q
B E
n× p p ×q
n×q
- vícerozměrná lineární regrese
h( X )< p ... model s neúplnou hodností h( X )= p ... plná hodnost, ale regresory jsou „téměř“ lineárně závislé... kolinearita
Nechť jsou splněny předpoklady regularity, pak platí: E y= X – var y= 2 I n – Y i jsou nezávislé –
6
I.1 Odhad regresních parametrů Metoda nejmenších čtverců (MNČ) kritérium kvality odhadu = střední čtvercová chyba n
min ∑ Y i−x Ti⋅ 2=min y− X T y −X =min∥y− X ∥
i=1
T
T
řešení splňuje normální rovnice X X =X y v regulárním modelu platí: X T X −1 X T y ... jednoznačné řešení = v modelu s neúplnou hodností, tj. h( X )< p X T X − X T y ... řešení není jednoznačné = X T X −1 X T y ... MNČ odhad, náhodný vektor = = n ... spočtený z dat o rozsahu n p ×1
Vlastnosti - MNČ odhadu: 1. lineární odhad =M y , kde M=(X T X )−1 X T , matice = lineární transformace 2. nevychýlený, nestranný E = , ∀n ,∀ 3. rozptyl 2 var = X T X −1 4.
y = X ... vyrovnané hodnoty y … projekce y do L X , lineárního prostoru sloupců X y je nejbližší prvek z L X k y platí: y= y e ... y ⊥ e ∈L X
y =P y , kde
∈ ⊥ L X
P = X X T X −1 X T je projekční matice, která je n ×n
symetrická, idempotentní P2=P , h P=h X = p 5. pokud navíc e~N n , tak 2 T −1 ~N p , X X y ~N n X , 2 P 6.
je NNLO (BLUE) tzn. má nejmenší rozptyl mezi všemi nestrannými lineárními odhady ve smyslu var −var ≥0 (pozitivně semidefinitní) p× p
7
Důkaz: Nechť je nestranný lineární odhad, tj. =L y , =E =L E y=L X ⇒ L X=I p var =L var y LT =L 2 I n LT = 2 L LT víme: = X T X −1 X T y =M y 2 T −1 var = X X T −1 T
T
M M = X X X X X T X −1= X T X −1 L M T= L X X T X −1= X T X −1=M L T =M M T Ip 2 var −var = L LT − 2 M M T = 2 L−M L−M 2 T
T
T
p.s.d.
2
∀ c : c L−M L−M c=d d=∥d∥ ≥0 ⇒ L− M L−M T je p.s.d. (pozitivně semidefinitní) dle definice 7. silná konzistence 1 T platí: X X omezená pro n ∞ n p× p ⇒ n skoro jistě 8. (slabá) konzistence P ∞ tj. n n (plyne ze silné konzistence) 9. asymptotická normalita 1 T X X Q regulární platí: n ∞ n D ⇒ n n− n N p 0 , 2 Q−1 ∞ neboli n n−~ A N p 0 , 2 Q−1 10. eficience, vydatnost Definice: T Nechť f n y , je sdružená hustota náhodného výběru y=Y 1 , ... ,Y n ,kde d ln f n y , ∈⊆ℝ p je parametr. Označ y ,= d p ×1 T Potom J :=E [ y , y , ] se nazývá Fisherova informační matice o parametru p× p
. Lemma: Nechť {f n y ,, ∈⊆ℝ p } je regulární systém hustot (tj. splňuje jistá omezení). Potom: E y ,=0 i) ii) var y , =J iii) Nechť n je nestranný odhad parametru , tj. E n= ∀ n . Potom platí var n −J −1 ≥0 (p.s.d.)
8
Poznámka: Rovnosti v bodě iii) je dosažené, pokud n=J −1 y , , ale vzorec je použitelný jen pokud pravá strana nezávisí na . Definice: Nestranný odhad n se nazývá eficientní (vydatný), jestliže var n =J −1 , tj. jeho rozptyl dosahuje Raovy-Cramérovy spodní meze. (Má nejmenší rozptyl mezi všemi nestrannými odhady.) Platí: je eficientní ⇔
e~N n
Důkaz: ' ⇐' Y i~N x Ti⋅ , 2 , i=1 , ... , n nezávislé sdružená hustota 1 n n n − − 1 1 T 2 2 2 f n y , =∏ 2 2 2 exp − y−x =2 exp − y i−x Ti⋅ 2 = i⋅ 2 2∑ i=1 2 2 i=1 −n 1 =2 2 2 exp − 2 y− X T y− X 2 d d n 1 y , = ln f n y , = − ln2 2 − y−X T y− X = 2 d d 2 2 1 1 =− 2 −2 X T y− X = 2 X T y −X 2 1 1 1 J = E T =E 4 X T y −X y− X T X= 4 X T E [ y− X y− X T ] X= 2 X T X
{
}
{
{
}
}
[
]
2
= var y= I n
Víme: var = X X =J ⇒ eficience 2
T
−1
−1
9
I.2. Odhad rozptylu chyb 2 Regulární lineární regresní model: y = X e n ×1
n× p p×1
n×1
- odhad metodou nejmenších čtverců E e=0 , var e= 2 I n y = X ... vyrovnané hodnoty y =P y , kde P= X X T X −1 X , jedná se o projekci do L X P je symetrická, idempotentní, h P=p e = y − y = y−X ... rezidua n ×1
e = y −P y= I −P y , Q :=I−P je projekce do ⊥ L X , je symetrická, idempotentní, h Q=n− p n ×n
y= y e platí: y ⊥ e , tj. y T e =0 Důkaz: y T e = P y T I −P y= y T P I −P y= y T P− P 2 y =0 =P
Lemma: cov y , e =0 i) ii) cov , e =0 Pokud navíc e~N n , tak iii) y , e jsou nezávislé iv) , e jsou nezávislé v) e ~N n 0 , 2 I −P Důkaz: i) cov P y , I −P y =P cov y , y I −P=P var y I −P= 2 P I −P= 0 n×n
ii) dle i) 0=cov y , e =cov X , e =X cov , e ⇒ cov , e = 0 p×n
iii) + iv) nezávislost ⇒ cov=0 u normálního rozdělení platí: nezávislost ⇔ cov=0 v) lineární transformace zachovává normalitu e = I −P y , y ~N n X , 2 I Lemma: Nechť máme regulární lineární model y= X e , E e =0, var e =2 I n , E i jsou nezávislé. 4 Označ 4 :=E E i . Nechť A je symetrická. Potom: n ×n
i) E y T A y =T X T A X 2 trace A ii) pokud A X =0 , tak E y T A y =E e T A e= 2 trace A n
var y T A y=var e T A e=4 −3 4 ∑ a 2ii 2 4 trace A 2 1
10
Nechť navíc e~N n , A je idempotentní, h A =r . Pak iii) y T A y ~ 2 2r , kde =T X T A X E y T A y =r 2 iv) pokud A X =0 , tak y T A y ~2 2r centrální E y T A y =r⋅ 2 var y T A y =2r 4 Definice: (Reziduální součet čtverců - RSČ) T y −X = e T e S2R := y −X n
2= y T S2R=∑ Y i−x Ti⋅ I −P y= y T Q y i=1
projekce
Definice: (Standardní odhad 2 ) 1 1 T y −X , kde p=h X ... počet regresních parametrů 2 := RSČ= y− X n− p n− p Vlastnosti standardního odhadu: 2 1. kvadratický odhad =
1 y T I −P y n− p
2. nevychýlený, tj. E 2 = 2 3.
2 je nejlepší nestranný kvadratický odhad (NNKO, MINQUE), pokud špičatost chyb 4 := 44 =3 , anebo pokud diagonální prvky pi i projekční matice P jsou konstantní
Poznámka: 4 =3 například pro normální rozdělení. 4 4 = 44 , 4=E Ei −E Ei =0
[
[
]
n
1 1 y T I−P y = 4−3 4 ∑ 1−p i i 22 4 n− p 2 n− p n− p 1 viz. Lemma ii) A=Q=I −P , X je regresní matice A X =I −P X =X −P X =X −X X T X −1 X T X=0 ! P X =P , neboť X ∈L X ! h I −P=trace I −P =n−p
2=var 4. rozptyl var
Pokud navíc e~N n 5.
, 2 jsou nezávislé Důkaz: víme, že , e jsou nezávislé 1 T 2 = e e n− p
11
]
6. rozdělení viz. Lemma iv) n− p 2 ~2n− p ... centrální 2 7.
var 2=
2n− p 4 2 4 = n− p n− p2
8. sdružené rozdělení j a 2 j− j ~t n− p , kde q j j je j-tý diagonální prvek matice Q= X T X −1 2 jj ⋅q 9. sdružené rozdělení a 2 T T − X X − ~F p ,n −p p 2 Poznámka: Pomocí Studentova a Fisherova rozdělení můžeme testovat významnost regresních parametrů, a sice po složkách nebo vcelku. I.3. Intervaly spolehlivosti a testy hypotéz = 0 , ... , k ... MNČ odhad
p ×1 2
... standardní odhad předpokládáme: e~N n 0 , 2 I n Interval pro j : 〈 j± 2 q j j t n− p 〉 ... pokryje j s pravděpodobností 1− test hypotézy H 0j : j=0j : ∣ j−0j∣ t n − p 2 q j j oblast spolehlivosti pro vektor : T T p −b X X −b b∈ℝ : ≤F p ,n− p p 2
{
}
test H 0 :=0 : 0 T 0 − X T X − F p , n− p ... zamítám H 0 2 p
12
Interval spolehlivosti pro vysvětlovanou proměnnou Y 0 : x 0 ... zadané regresory vysvětlující proměnné p ×1
Předpokládáme stejný lineární model Y 0 =x T0 E0 , kde E0 ~N 0 , 2 nezávislé na E1 , ... , E n , tj. Y 0 nezávisí na , 2 interval 〈 xT0 ± 2 1 xT0 X T X −1 x 0 ⋅t n− p 〉 Interval spolehlivosti pro E Y 0 =x T0 : 〈 x T0 ± 2 x T0 X T X −1 x 0 ⋅t n− p 〉 Pás spolehlivosti pro všechna x T pro všechna x ∈ℝ p současně: 〈 xT ± 2⋅p⋅F p , n− p ⋅x T X T X −1 x 〉 S pravděpodobností 1− pokrývá skutečnou hodnotu x T ∀ x ∈ℝ p současně. Poznámka: 1) Pás spolehlivosti je na okraji dat širší než v jejich středu. 2) Pás spolehlivosti je širší než interval spolehlivosti pro každé jednotlivé x 0 .
13
Věta: (Fisher-Cochran, věta o rozdělení kvadratických forem) Nechť y=Y 1 , ... ,Y nT je náhodný vektor s nezávislými složkami, y~N n , I n , =1 , ... , nT . Nechť Q j y := y T A j y jsou kvadratické formy, kde A j je symetrická, m
h A j =n j , j=1 , ..., m . Nechť y T y =∑ Q j y . Potom Q j y jsou nezávislé, j=1
2 nj
m
Q j y ~ j , kde j= A j , právě tehdy , když n=∑ n j podmínka na hodnosti T
j=1
n
m
∑ =∑ j
Dále platí
2 i
i=1
.
j =1
Poznámka: 2 2 Věta platí i pro y~N n , 2 I n . Potom Q j y ~ n j . j
Ověření stability modelu: při změněných hodnotách regresorů – např. stabilita v čase 1) uvažujme n původních pozorování, tj. lineární model 1 y 1 = X 1 1 e1 , e 1 ~N n 0 , 2 I n ×1
RSČ:
n × p p×1 n×1 2 1 T 1 R1
e = y 1T I −P1 y 1
S =e
=:Q
1
e = y −X 1 , kde Q1 je projekce: symetrická, idempotentní, h=n− p 1
1
1
2 R1
2
n ×n
2 n− p
víme: S ~
(centrální)
2) přidáme m nových nezávislých pozorování při stejných regresorech, ale s jinými hodnotami, tj. model 2 y 2 = X 2 2 e 2 m× p
m×1 2
p×1 2 m 2 T 2
m×1
e ~N m 0 , I , e 1 , e 2 jsou nezávislé RSČ: S2R2= e e = y 2 T I −P 2 y 2 =: Q
kde Q
2
je projekce: symetrická, idempotentní, h=m− p
2
n ×n 2 R2 2 2 R1 R2
víme: S ~ 2 2m − p (centrální) S , S jsou nezávislé 3) oba modely sloučíme y 1 = X 1 e 1 y 2 X 2 p×1 e 2
n m×1
nm ×p
nm×1
neboli y= X e e~N nm 0 , 2 I nm 2 T T I −P y RSČ: S R= e e = y kde
Q
=:Q
je projekce: symetrická, idempotentní, h=nm− p
n m×n m 2 2 2 R n m− p
víme: S ~
(centrální) 14
∗ .
platí: y , e jsou nezávislé, kolmé y T e =0 y= y e ∣ ∥⋅∥2 y T y = y T y e T e ... Pythagorova věta 2 2 2 neboli ST =S M S R ... rozklad variability nezávislé 2 2 nm T
víme: S ~ , S2M ~ 2 2p , S2R~ 2 2nm− p kde = E y E y =T X T X to je speciální případ Fisher-Cochranovy věty: y T y = y T y e T e = y T P y y T I−P y 2 T
Q
4) Test stability modelu: H 0 :1 = 2 tj. nemění se struktura modelu A) Test A S2T =S2M S2R−S 2R1 S2R1 neboli pomocí kvadratických forem y T y = y T A1 y y T A 2 y y T A 3 y , kde A1 =P , symetrická, h= p (projekce) je třeba ověřit: - A2 , A 3 jsou symetrické - ? h A2 ,h A3 - ∗ podmínka na hodnosti Potom (Fisher-Cochranova věta): máme 3 nezávislé 2 - rozdělení ad A3 : S2R1= y 1 T Q 1 y1 = y T A3 y n×n n×1
nm×nm nm ×1
Q 1 0 tj. A3 = . symetrická, h A 3 =h Q1 =n− p 0 0 A ad 2 : S2R−S 2R1= y T Q1 y− y 1T Q 1 y 1 = y T A2 y A 2 =Q− A 3 symetrická kde n m×n m
h A 2 =? , ukážeme, že A2 je idempotentní, potom st=h A22 =Q− A3 2=Q 2−Q A 3− A 3 Q A 23 Q , A 3 jsou idempotentní Q A 3= I −P A 3 P A 3= X X T X −1 X T A 3=0
1 0 = X 1T Q 1 0=0 X T A 3= X 1T X 2T ⋅ Q 0 0 1 1T 1 X I −P =0 neboť P1 je projekce do L X tedy Q A 3= A 3= A 3 Q A22 =Q− A3 2=Q 2−Q A 3− A 3 Q A 23=Q− A3 − A3 A 3=Q− A 3 tedy A2 je idempotentní h A 2 =st A 2 =st Q− A 3 =st Q−st A 3 =h Q−h A 3 =nm− p−n− p =m podmínka na hodnost: nm=h A 1h A 2h A 3= pmn−p=nm
15
tedy platí Fisher-Cochranova věta: S2T =S2M S2R−S 2R1 S2R1 - nezávislé S2T ~ 2 2nm S2M ~ 2 2p S2R~ 2 2m S R1~ 2 2n− p Testová statistika A: S 2R−S 2R1 /m H F A= 2 ~ F m ,n− p S R1 /n− p F AF m ,n− p ... zamítáme H 0 :1= 2 , tj. model není stabilní 0
B) Test B S2T =S2M S2R−S 2R1−S 2R2 S 2R1S 2R2 neboli y T y = y T P y y T A '2 y y T A 3 y y T A 4 y S 2 −S 2 −S2 / p H F B= 2 R 2 R1 R2 ~ F p ,n m−2 p S R1S R2 /nm−2 p F B F p ,nm−2 p ... zamítáme H 0 :1 = 2 , tj. model není stabilní 0
Poznámka: Test B má větší sílu, ale musí platit, že m p navíc k n p .
16
I.4. Míry vhodnosti modelu Úkol: – ověřit model jako celek – shoda modelu s daty Základní model: y = X e n ×1
n× p p×1
+ předpoklad regularity
n×1
... MNČ odhad y = X ... vyrovnané hodnoty e = y − y ... rezidua víme: y= y e y T e =0 ... kolmost cov y , e =0 ... nekorelovanost y T y = y T y e T e ... Pythagorova věta Značení: y =Y ,... , Y T =Y 1 n n ×1
n×1 n
Y = 1×1
1 ∑Y n i=1 i
S2R := y − y T y − y ... RSČ, reziduální (zbytková) variabilita S2T ... celková variabilita dat (celkový součet čtverců) S2T := y T y ... v modelu bez absolutního členu (BAČ) S2T := y− yT y− y ... v modelu s absolutním členem (SAČ) S2M ... variabilita v modelu (součet čtverců v modelu) S2M := y T y ... (BAČ) S2M := y − y T y − y ... (SAČ) Věta: (Rozklad celkové variability) V lineárním modelu y= X e platí S2T =S2M S 2R v případě BAČ i SAČ. Důkaz: BAČ: viz Pythagorova věta SAČ: y= y e ∣− y y− y= y − y e ∣∥⋅∥2 y − y T y − y e T e 2 y − y T e y− yT y− y= 2
2
ST
SM
2
SR
T
musíme ukázat, že e y − y =0 víme e T y =0 ... kolmost e T y=[I −P y ]T 1 n Y =Y y T I −P1n =∗ 17
P ... projekce do L x SAČ ⇒1 n je první sloupec X , tzn. 1n ∈L x ⇒ P 1n=1n ∗=Y y T 1n −1n = 0 n×1
Definice: (index determinace) S2 R2=1− R2 , je to mnohonásobný korelační koeficient mezi vysvětlovanou a vysvětlujícími ST proměnnými. Poznámka: i) R2 ∈〈0,1〉 ii) čím větší, tím lepší iii) Otázkou je, jak velké R2 je dostačující - subjektivní názor v technice a přírodě požadujeme, aby R20,6 ve společenských vědách stačí méně Věta: (vlastnosti indexu determinace) S2M 2 R= 2 i) ST y− y T y− y ii) R2= ... SAČ ∥ y− y∥⋅∥ y − y∥ T R2=∥ y∥y ⋅∥yy ∥ ... BAČ Důkaz: S2T =S2M S 2R i) S 2 S 2 −S 2 S 2 R2=1− 2R = T 2 R = M2 ST ST ST ii) SAČ 2 ∥y − y∥ S M cos∢ y− y , y − y = = 2 = R2 ∥y − y∥ S T
víme: kosinus úhlu je roven skalárnímu součinu normovaných vektorů, y− yT y − y tj. cos ∢= ∥y − y∥⋅∥ y − y∥
Připomeňme: lineární model y= X e , kde vektor parametrů T = 1 , ... , k ... TBAČ... k = p 0 , 1 , ... , k ... SAČ ... k 1= p p ... dimenze modelu, počet parametrů k ... počet vlastních regresorů
{
18
Věta: Nechť e~N n 0 , 2 I n . Potom F=
R 2 n− p ⋅ ~F k , n− p . 1−R 2 k
Platí =0 ⇔ 1=2=...= k =0 . parametry u vlastních regresorů
Důkaz: Je třeba dokázat, že F= 2
2 M 2 T
2 T 2 R
2k / k 2 n− p
/ n− p
, 2k a 2n− p jsou nezávislé.
2 M 2 R T
S S S R = ⋅ = 2 1−R S S S 2 T S R= e e = y I−P y ~2n− p a) y~N n X , 2 I n h I −P=n− p I −P X =0 je centrální, neboť := Ey T I −P E y=T X T =0
P je projekce do L X ⇒ PX =X
b) BAČ: S2M = y T y = y T P y ~2P h P=p , p=k = Ey T P Ey =T X T P X =T X T X T X T X =d T d=0 ⇔ d=0 tj. když X =0 X má plnou hodnost ⇒ sloupce jsou lineárně nezávislé X =0 ⇔ =0 1 ,... , k =0 ,... , 0 SAČ: obdobně c) nezávislost BAČ: víme, že y , e jsou nekorelované N ⇒ nezávislost ⇒ S 2M , S 2R jsou nezávislé SAČ: cov y − y , e =∗
y − y=P y − 1 1Tn y 1n =P y− 1 1n 1 Tn y= P− 1 1n 1Tn y n
n
n
Y
∗=cov
P− 1 1n 1Tn n
y , I −P y =
n×n
P− 1 1 n 1Tn n
T = 2 P−P2− 1 1n 1 Tn 1 1n 1 n P =0 =0
n
n
T
=1n
1n ... první sloupec X ⇒ P 1 n=1n , 1 Tn P=1Tn Pokračujeme stejně jako výše. Test kvality regrese: H 0 :1=2=...= k =0 H 1 : ∃ j : j≠0 R 2 n− p F= ⋅ F k , n− p ... zamítám H 0 1−R 2 k H 0 ... regresory nemají vliv, model je špatný
19
I I −P = P− 2
2
n
1 1 1T n n n
I −P=
Poznámka: Zvyšováním dimenze modelu se zvyšuje index determinace, ale komplikuje se model. Pro spravedlivé posouzení je potřeba penalizovat nadbytečné regresory. Například pomocí Akaikeho informačního kritéria S 2R 2 p AIC=ln n n nebo pomocí upraveného koeficientu determinace nk − p R2a =1−1−R 2 ⋅ . n− p
Poznámka: (verifikace modelu) test významnosti vektorů /složek regresních parametrů F−test , t−test Máme dvě metody . vysoký index determinace test kvality regrese Bohužel někdy mohou tyto metody vyjít rozporuplně.
{
Čemu dát přednost: – testům parametrů při analýze vztahů v modelu – indexům determinace při předpovědích Co dělat, pokud nejsme s modelem spokojeni: – zvětšit rozsah výběru – přidat další regresory – změnit model Poznámka: Při p regresorech existuje 2 p možností jejich zařazení do modelu. Nastává otázka, které zařadit a které ne: Horší je podurčení než přeurčení, tj. horší důsledky má nezařazení důležitého regresoru než zařazení nedůležitého. Podmodel 1 : y= X 1 1e 1 Nadmodel 2 : y= X 1 1 X 2 2e2 Podurčení: ve skutečnosti platí model 2 , ale my pracujeme s modelem 1 Přeurčení: ve skutečnosti platí model 1 , ale my pracujeme s modelem 2 Věta: (o podurčení modelu) Nechť pro y platí nadmodel 2 . Potom MNČ odhad 1 získaný z podmodelu 1 je nestranným odhadem 1 pouze tehdy, je-li 2=0 nebo X 1T X 2 =0 . Podobně 2 získaný z podmodelu 1 je nestranný pouze tehdy, když 2=0 nebo L X 2 ⊂L X 1 .
20
I.5 Kolinearita – také multikolinearita – problém lineární závislosti regresorů – vadí situace, kdy regresory jsou lineárně závislé nebo téměř lineárně závislé Nepříznivý vliv na MNČ-odhad X T X −1 X T y = 2 var = X T X −1 – X T X nemá plnou hodnost a nelze invertovat . – X T X má sice plnou hodnost, ale det X T X = 0 X T X −1 má velké prvky, tj. má velký rozptyl, je nespolehlivý – malé změny v regresorech nebo pozorováních (např. přidání jednoho pozorování) mohou vést k velkým změnám odhadu , dokonce ke změnám znamének jeho složek – nestabilita odhadu Při předpovědích nemusí vždy vadit p
det X T X =∣X T X∣=∏ j , kde j jsou vlastní čísla X T X j=1
X X je positivně semidefinitní ⇒ j≥0 ∀ j h X T X =r ⇒ r čísel ≠0 p−r čísel =0 uspořádej: 1≥ 2≥...≥ p platí: ∣X T X∣=0 ⇔ p =0 vadí nám situace: ∣X T X∣=0 nebo ∣X T X∣=. 0 Bohužel pojem „ =. 0 “ se těžko konkretizuje T
I.5.1 Zjišťování kolinearity 1) index podmíněnosti T X X = 1 p 100 ... silná kolinearita některé regresory vynechat nebo agregovat 10 až 30100 ... mírná kolinearita metoda na odstranění kolinearity 2) testy významnosti parciálních korelačních koeficientů pro jednotlivé regresory neboli testy indexů determinace R2j v modelu, kde j-tý regresor je vysvětlovaná proměnná y x⋅j a ostatní regresory jsou vysvětlující proměnné (zůstávají) Je nutné provést k testů kvality regrese, kde k je počet vlastních regresorů. R 2j /k −1 H F j= ~ F k−1 , n− p1 , j=1 ,2 , ... , k 2 1−R j /n− p1 H 0 : regresory nejsou lineárně závislé, tj. není kolinearita 2 2 Pokud většina F j je významných nebo pokud většina R jR , tak je kolinearita. 0
3)
R2 blízké jedničce, ale některé složky jsou nevýznamné (podle t-testu) 21
4) Vysoké párové koeficienty mezi regresory pozor: kolinearita může nastat i při nízkých 5) Test nulovosti determinantu výběrové korelační matice regresorů Poznámka: Žádný test či měřítko kolinearity nedává absolutní odpověď, nejsou vhodné za všech okolností. Při závislých proměnných je těžké oddělit jejich jednotlivé vlivy. I.5.2 Hřebenová regrese (Ridge regression) – metoda na potlačení kolinearity – idea: zvýšit hodnoty diagonálních prvků X T X o kladnou konstantu: X T X X T Xc I p , c0 Lemma: X T Xc I p je regulární. Důkaz: Spektrální rozklad symetrické matice p
X X =Q Q =∑ j q j q Tj kde: T
T
p × p
– – –
j=1
= Diag {1 ,... , p } , 1≥...≥ p jsou vlastní čísla X T X Q=q 1 ,... , q p , q 1 , ... , q p jsou ortonormální vlastní vektory X T X QT Q=Q QT =I p
X T Xc I p =Q Q T c Q QT =Q⋅ c I p ⋅QT ... spektrální rozklad Diag, vlastní čísla j c T
X X je positivně semidefinitní ⇒ j≥0⇒ jc 0 tj. jsou to nenulová vlastní čísla ⇔∣X T Xc I p∣≠0 Poznámka: Volbou c lze ovlivnit index podmíněnosti
1c . pc
Definice: (hřebenový odhad) R := X T X c I p −1 X T y R= R c , c0 Věta: Bias R =−c X T X c I p −1 MSE R = X T Xc I p −1 2 X T X c 2 T X T Xc I p −1 Důkaz: model: y= X e Bias R =E R−= X T X c I p −1 X T X −I p = X T Xc I p −1 X T X − X T X c I p = =−c X T X c I p −1 22
MSE = var Bias⋅BiasT p× p
p× p
p×1 1× p
var R = X T Xc I p −1 X T var y X X T X c I p−1= 2 X T Xc I p −1 X T X X T X c I p−1 Bias R [Bias R ]T =c 2 X T X c I p −1 T X T X c I p −1 Věta: 2 2 Nechť 0c T . Potom var −MSE R 0 (positivně semidefinitní).
Věta: p
var R = 2 ∑ j=1
j q qT 2 j j j c
Důkaz: Spektrální rozklad: T T X T Xc I p=Q c I p Q T , kde Q Q=Q Q =I p ... ortonormální vlastní vektory 1 X T Xc I p −1 =Q c I p −1 Q T ... spektrální rozklad s vlastními čísly jc víme: var R = 2 X T Xc I p −1 X T X X T X c I p−1= 2 Q c I p −1 QT Q QT Q c I p −1 QT = j = 2 Q c I p −1 c I p −1 QT ... spektrální rozklad, kde j= j c 2 p
Diag {1 ,... ,p }
= 2 ∑ j q j qTj j=1
Poznámka: p
1 R 2 T i) speciálně pro c=0 platí var = ∑ q j q j j 1 j 1 ii) pokud je j malé, tak je velké, ale je malé jc 2 j Poznámka: (volba hřebenové konstanty c ) p 2 c= Například , kde je MNČ-odhad, ale nemusí jít spočítat. T Další metody na potlačení kolinearity – metoda hlavních komponent – metoda dodatečné informace, tj. omezení na – transformace regresorů, např. podíly nebo rozdíly u časových řad – vynechání některých regresorů - vytipovat pomocí párových korelačních koeficientů
23
I.6 Umělé proměnné Umělé proměnné zastupují: – kvalitativní proměnné (pohlaví, region, sociální status) – kvantitativní proměnné, které nelze přímo měřit (vzrušivost centrální nervové soustavy) – kvantitativní proměnné agregované do skupin (věk 10-15, 15-20, ... ) – vícehodnotové – binární, speciálně alternativní (0-1) odhady parametrů nezávisí na hodnotách proměnných Příklad 1: (posun lineárního modelu v prostoru) Poptávka ve městě/na venkově Y tM =1 tt (město) Y Vt =2 tt (vesnice) t ... čas Modely lze sloučit: Y tM =1 2−1 q tt , kde q ... umělá proměnná (regresor) q= 0 ... údaj z města 1 ... údaj z venkova odhad parametrů z nové rovnice je lepší
{
Příklad 2: (posun lineárního modelu v čase) Y t =1 x tt , t∈T 1 Y t =2 x tt , t∈T 2 T 1 ... období s neuspokojenou poptávkou T 2 ... období s uspokojenou poptávkou x t ... příjem peněžní Y t ... spotřeba ... mezní sklon ke spotřebě 21 skutečný model: Y t =1 q 12 q 2 x t t , t∈T 1∪T 2 q 1= 0 ... t∈T 2 , q 2= 0 ... t∈T 1 1 ... t∈T 1 1 ... t∈T 2 1 , 1 mají původní význam, ale pozor. Není možné do takového modelu přidat absolutní člen, protože pak by to byla kolinearita.
{
{
X=
1 ⋮ 1 0 ⋮ 0
0 ⋮ 0 1 ⋮ 1
x1 ⋮ ⋮ ⋮ ⋮ xn
Kdybychom uvažovali absolutní člen, přidali bychom sloupec jedniček, ale ten by byl součtem prvních dvou sloupců.
nebo: model s absolutním členem Y t =1 2−1 q x t t q= 0 ... t∈T 1 1 ... t∈T 2
{
24
Příklad 3: (agregace kvantitativní proměnné věk) 0 ... 0−10 let q= 1 ... 11−20 let 2 ... 21−30 let 3 ...≥31 let nebo: q 1= 1 ...0−10 let 0 ... jinak q 2= 1 ...11−20 let 0 ... jinak q 3= 1 ...21−30 let 0 ... jinak q 4= 1 ...≥31 let 0 ... jinak
{
{ { { {
Příklad 4: (popis sezónnosti časových řad) 4 sezóny - čtvrtletí Y t =01 x t1 q12 q23 qQ t , kde t je čas q 1= 1... 1. sezóna 0 ... jinak q 2 , q 3 obdobně V modelu s absolutním členem nelze zahrnout umělou proměnnou pro 4. sezónu.
{
Příklad 5: (změna regresních parametrů v čase či prostoru) Y 1 t =11 x 1 t 1 t , t∈T 1 Y 2 t =22 x 2 t 2 t , t ∈T 2 sloučíme:
1 y 1 = 1 ⋮ 2−1 y2 1
0 ⋮ 0 1 ⋮ 1
x 11 ⋮ x1 T 1 x 21 ⋮ x2 T
1
2 −1
2
0 ⋮ 0 x 21 ⋮ x2 T
1 2
2
neboli: Y t =1 2−1 q 11 x t 2−1 q2 t t q 1= 0 ... t∈T 1 , q 2 t= 0 ... t ∈T 1 1 ... t∈T 2 x 2 t ... t∈T 2
{
{
Poznámka: Použitím umělých proměnných se zvyšuje počet parametrů a klesá přesnost jejich odhadu.
25
II. Zobecněný lineární model (ZLM) y = X n ×1
e
n× p p×1
n×1 T i i⋅
po složkách: Y = x E i , i=1 , ... ,n Předpoklady: n p i) ii) h X = p ... plná hodnost iii) vlastnosti chyb: E e=0 – – zobecnění ... var e = , je symetrická, pozitivně definitní (tj. regulární) n ×n
Značení: = j k n ×n
j k =cov E j , E k , j≠k j j=var E j
}
závislé chyby s nestejnými rozptyly
E y= X var y=var e=
Platí:
II.1 Odhad parametrů Definice: Zobecněný odhad metodou nejmenších čtverců: Z := X T −1 X −1 X T −1 y Odvození: 2
= V kde
{
20 ... konstanta, společný rozptyl V ... positivně definitní, regulární, symetrická
n×n
−1
−2
= V
−1
kde V −1 ... positivně definitní, regulární, symetrická
Spektrální rozklad: T
1 2
1 2
V =P P =P P T =U U T , kde = Diag {1 , ... , n } ... vlastní čísla 0 – P ... ortonormální vlastní vektory – U ... regulární – Transformace: y= X e ∣U T zleva U T y=U T X U T e neboli: y ∗=X ∗ e∗ ∗ , kde y ∗=U T y , X ∗=U T X , e ∗=U T e Vlastnosti modelu ∗ : n p – – h X ∗=h X = p E e∗ =0 – var e ∗=U T var e U =U T 2 V U = 2 U T U U T −1 U = 2 U T U T −1 U −1 U= 2 I n – −1
26
⇒∗ splňuje podmínky regularity, tj. je to regulární lineární regresní model. Optimální odhad je tedy MNČ-odhad: X ∗T X ∗−1 X ∗T y∗= X T U U T X −1 X T U U T y= X T V −1 X −1 X T V −1 y = X T −1 X −1 X T −1 y= Z = Výraz nezávisí na 2 . Vlastnosti: 1) E Z = 2) var z = X T −1 X −1 3) z je NNLO 4) pokud navíc e~N n , pak: — Z ~N p , X T −1 X −1 — je eficientní X T X −1 X T y zůstává nevychýlený, ale není nejlepší, 5) „klasický“ odhad = X T X −1 X T X X T X −1 var = Definice: (zobecněná rezidua) e Z = y− X Z Problém: Většinou neznáme , proto musíme: – odhadnout ... – zjednodušit její strukturu, neboť obsahuje příliš mnoho parametrů: n n−1 n rozptylů + n = kovariancí 2 2
jednodušší struktura :
1)
=
2 2a 0 ⋮ 0
2a 0 ⋯ 0 2 2a ⋱ ⋮ 2a ⋱ ⋱ 0 ⋱ ⋱ ⋱ 2a ⋯ 0 2a 2
markovské fluktuace
2)
=2 V , V je známá Z nezávisí na 2 e∗ T e∗ e Z T V −1 e Z 2 = =...= n− p n− p 2 2 platí: E = ... nestranný
3)
=Diag{21 , ... , 2n } 2i obecně různé... heteroskedasticita ZMNČ vede na model
Yi x E , x ∗i⋅= i⋅ E∗i = i i i i ... vážená MNČ: pozorování s malým rozptylem mají větší váhu
∗ ∗ Y ∗i =x ∗T i=1 ,... , n , kde Y i = i⋅ E i ,
MNČ na Y ∗i 4)
= 2 Diag {v 21 , ... , v 2n } , kde v i2 jsou známé Z nezávisí na 2
27
II.2. Testy homoskedasticity a odhady rozptylů Uvažujeme zobecněný lineární model (ZLM) var e=0 Předpoklady: je diagonální, tj. =Diag {21 , ... , 2n } H 0 : 21 = 22=...= 2n ... homoskedasticita, tj. = 2 I n (regulární regresní model) H 1 :∃i , j : 2i ≠2j ... heteroskedasticita Například rozptyl 2i =var Y i závisí na nějakém regresoru. Zjednodušený odhad 2i : 1. obyčejný MNČ odhad y = X T rezidua e = y − y = E 1 , ... , E n 2. 2i = E i2 Test Goldfeldův- Quandtův: H 0 vs. H 1 Předpokládejme: 1. normalita rozdělení 2. pozorování lze uspořádat podle rostoucího rozptylu např. pokud je rozptyl úměrný j-tému regresoru Y i x i , j , i=1 ,... , n x i , j≤x i , j≤...≤x i , j 1
2
n
2 2 2 tj. i ≤ i ≤...≤ i Y i Y i ... Y i Y i Y i ... Y i Y i 1 ... Y i − s Y i −s1 ... Y i 1
1
2
n
1
2
n
2
s
s
n
n
n
počet =s
počet =s
2 S1
2 S2
RSČ při obyčejné MNČ, lineární model dimenze p testová statistika: S2 H GQ= 22 ~ F s− p , s− p S1 GQF s −p ,s −p ... zamítáme H 0 ... uspořádání rozptylů vede na pravostranný test ⋅ za H 0 :GQ=1 ⋅ 3 volíme s= n , s je celé číslo, tj. vynechává se přibližně čtvrtina pozorování 8 0
28
Glejserův test: Předpoklady: 1. normalita 2. rozptyly jsou úměrné j-tému regresoru Pro chyby v ZLM se sestaví pomocný model, například: ∣E i∣=01 x i j i , i=1 ,... , n , kde E i=0 , var i =2 , i jsou nezávislé potom chyby Ei lze také modelovat jako: Ei =Fi 01 x i j , kde F i jsou nezávislé, E F i=0 , var Fi =2 potom E Ei =0 , var Ei=2 0 1 x i j 2 , Ei jsou nezávislé var e== 2 Diag {0 1 x i j 2}= 2 V , kde V závisí na parametrech 0 , 1 pokud 1=0 : = 2 20 I n ... homoskedasticita 1≠0 : ... heteroskedasticita H 0 :1=0 vs. H 1 :0≠0 Postup: 1. MNČ rezidua e = E 1 , ... , E n T 2. MNČ odhady 0 , 1 v modelu ∣E i∣=01 x i j i 0 , 1 3.
H 0 :1=0 pomocí t-testu H t= 2 1 2 2 ~ t n−2 kde: S q n 1 — S2 = ∑ ∣E ∣−0−1 x i j 2 n−2 i=1 i — q 2 2=prvek2,2 matice Q−1 O
— —
Q= X T X= q 2 2=
n
∑ xi j i
∑ xi j i ∑ x 2i j i
1 ∑ x −n x j2 2 ij
4. pokud platí H 0 ... obyčejná MNČ pokud neplatí H 0 ... ZMNČ Z 2 = V =2 Diag { 0 1 x i j 2 } i
z = X T V −1 X −1 X T V −1 y , nezávisí na 2
29
Spearmanův test: Předpoklad: rozptyly úměrné j-tému regresoru Y j x i j , E i x i j , i=1 , ... , n Postup: 1. MNČ rezidua e = E 1 , ... , E n T 2. uspořádej dvojice E i , x i j dle velikosti absolutní hodnoty reziduí ∣E i ∣≤∣Ei ∣≤...≤∣Ei ∣ xi j xi j xi j 1
2
1
2
n
n
3. pořadí dle velikosti regresorů x i j mezi x 1 j , ... , x n j r1 r2 r n r 1 ,... , r n je permutací 1,... , n 4. testová statistika n
6 ∑ i−r i
2
r s=1− 5.
1
n n2−1
r s≥c ... zamítám H 0 c ... kritická hodnota pro Spearmanův korelační koeficient test je jednostranný
II.3. Test nezávislosti náhodných chyb Poznámka: Rezidua e jsou vždy alespoň slabě korelovaná, neboť: var e = 2 I − P , P= X X T X −1 X T ... projekce Myšlenka: Modelovat chyby pomocí AR(1) procesu Ei = E i−1F i , i∈ℤ ∣∣1 ... podmínka stacionarity F i~WN 0 , 2 + F i nezávislé H 0 :=0 ,tj. Ei splňují podmínky regularity: var e== 2 I n H 1 :≠0 , tj. závislé chyby Ei ∞
Ei =Fi F i−12 F i−2...=∑ k F i−k k =0
2 var Ei=∑ 2 k 2= 1−2 k=0 2 l cov Ei , E i−l =...= ... nezávisí na i 1−2 cor Ei , Ei−l =l ... nezávisí na i cor Ei , Ei−1 = ... korelační koeficient mezi dvěma sousedními chybami ∞
30
1 2 1 2 2 var e== ⋅ ⋱ 1−2 ⋮ ⋱ ⋱ n −1 ⋯ 2
1 2 1−2 1 −1 = 2 ⋅ 2 ⋱ ⋮ ⋱ ⋱ n−1 ⋯ 2
⋯ n−1 ⋱ ⋮ ⋱ 2 ⋱ 1
⋯ n −1 ⋱ ⋮ ⋱ 2 ⋱ 1
−1
2
=...=
1− 1 ⋅ 2 1−2
1 − 0 ⋯ 0 − 12 − ⋱ ⋮ 0 − ⋱ ⋱ 0 ⋮ ⋱ ⋱ 12 − 0 ⋯ 0 − 1
A n×n
A je singulární pro =±1 . A je regulární, když ∣∣1 . Pro ZMNČ je nutno odhadnout . Pro odhad z je nutno odhadnout , není třeba znát 2 . Odhad z modelu pro MNČ - rezidua: E i = E i−1F i , i=2 , .. , n MNČ - odhad: n
∑ E i E i−1
i=2n−1 =
2
∑ E i i =1
Zobecněný odhad : X −1 X T A y z = X T A je možno iteračně zpřesňovat: E i=Y i−x Ti⋅ z n
∑ E i E i−1
i=2 = n−1
2 ∑ E i
=
atd.
i =1
31
1 ⋅A 2
Asymptotický test: H 0 :=0 vs. H 1 :≠0 ⋅ 2 1 platí: ~ N , 1−
n
U = n∣∣u ... zamítáme H 0 , kde u je kritická hodnota normovaného normálního 2 2 rozdělení Durbinův-Watsonův test: H 0 :=0 vs. H 1 :≠0 testová statistika: n
∑ E i −E i−1
DW = i=2
2
, kde E i jsou rezidua z obyčejné MNČ
n
2 ∑ E i i=1
platí: DW = – –
e T A e , kde e T e e = E 1 ,... , E n T
A = A 1= n ×n
1 −1 0 ⋯ 0 −1 2 −1 ⋱ ⋮ 0 −1 ⋱ ⋱ ⋮ ⋮ ⋱ ⋱ 2 −1 0 0 ⋯ −1 1
, víme že je singulární
e = I −P e=I − P y P= X X T X −1 X T ... projekce eT I −P A I −P e DW = e T I −P e I −P ... symetrická, idempotentní T . E e I −P A I−P e rank I−P A I−P E e e T 2 rank I−P A E DW = = = = E eT I−P e E e T I −Pe 2 h I−P rank A −rank P A 2 n−1−rank P A = = ... závisí na X n− p n− p kde E e e T =var e=2 I n za platnosti H 0 .
za platnosti H 0 přibližně platí E DW =2 Podobně i var DW závisí na X . DW ∈〈 0 , 4 〉
n−1 . =2 n−p
Hrubá aproximace (nejsou-li k dispozici tabulky): n
∑ E i −E i−1
DW = i=2
n
2
∑ E i i=1
2
n −1
n
i=2 n
i=2
21 E 2n2 ∑ E 2i −2 ∑ E i E i−1 E
=
2
.
n
n
1
i=2
2i −2 ∑ E i E i−1 2∑ E
=
∑ E i
n
2
∑ E i
i=1
i=1
kde je výběrový korelační koeficient mezi sousedními chybami. DW odhad pomocí DW - statistiky: =1− 2
32
{
4 =−1 =21− = 2 =0 0 =1
Kritické hodnoty: Jsou založeny na aproximaci, aby se obešla jejich závislost na X .
z L ... dolní kritická hodnota z U ... horní kritická hodnota ? - oblast neprůkaznosti ... nelze rozhodnout
Poznámka: V oblasti neprůkaznosti je možné počítat přesné kritické hodnoty, které jsou závislé na X , ale jejich výpočet je velmi složitý a vyžaduje další speciální tabulky. Oblast neprůkaznosti se zužuje pro n ∞ (roste rozsah výběru). Pro zúžení oblasti existují různá vylepšení (modifikace původního testu). III. Zdánlivě nesouvisející rovnice (SUR - Seemingly Unrelated Regression) Uvažujme q lineárních regulárních modelů: y j = X j j e j , j=1 , ... , q n ×1
n × pj p j ×1
n×1
E e j =0, var e j= j j I n cov Ei j , Ei k = j k ... zde je ta souvislost i -tá pozorování v každém modelu jsou korelovaná i -té a i ' -té pozorování jsou nezávislá cov e j , e k = j k I n q modelů shrneme do jednoho: y 1 X 1 0 ⋯ 0 1 e1 y 2 = 0 X 2 ⋯ ⋮ 2 e 2 ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ y q 0 0 ⋯ X q q e q e neboli y = X
n q ×1
n q× p j p j ×q
n q×1
1 1 I n ⋯ 22 I n var e =var y= I n= ⋮ n q ×n q ⋮ ⋮ q 1 I n ⋯ nebo lze zapsat „vedle sebe“ Y 11 Y 12 Y = y 1 y 2 ... y q = Y 2 1 Y 2 2 n ×q ⋮ ⋮ Y n1 Y n2
⋯ 1q I n ⋯ ⋮ ⋱ ⋮ ⋯ qq I n
⋯ Y 1q ⋯ Y 2q ⋱ ⋮ ⋯ Y nq
řádky ... q - rozměrná nezávislá pozorování sloupce ... jednotlivé proměnné, v rámci jednoho pozorování závislé například:
i=1,... , n −uchazeči j=1 , ..., q −zkoušené předměty 33
var y i⋅= = j k q×q
var y⋅j = j j I n cov y i⋅, y i⋅=0 , i≠i' cov y⋅j , y⋅k = j k I n '
Odhad parametrů
1
= ⋮
q
zobecněná metoda nejmenších čtverců (ZMNČ): = I n =var e=var y z = X T −1 X −1 X T −1 y , kde n q ×n q
postup při neznámém (tj. neznámé ): 1. obyčejné MNČ - odhady j z jednotlivých rovnic j= X Tj X j −1 X T j y j , j=1 ,... , q 2. odhad = j k 1 j k = y j − X j j T y k − X k k n− p p=min p j , p k , j , k =1 ,... , q 3. „dvojstupňový“ zobecněný odhad In −1 X −1 X T −1 y , kde = z = X T Poznámka: Nechť X 1= X 2 =...= X q = X
n× p
y 1 y 2 y q = X 1 q E n× p n×q vedle sebe , n×q
p×q
neboli
Y = X n ×q
B E
n× p p× q
n×q
Platí: ZMNČ = MNČ 1 z = ⋮ stačí odhadovat jako MNČ z každé rovnice zvlášť q
34
- vícerozměrná regrese
IV. Simultánní rovnice Příklad: Modelujeme nabídku a poptávku: V ... vyměňované množství zboží U ... cena zboží x ... příjem spotřebitelů
U , V ... náhodné veličiny, endogenní x ... nenáhodné, exogenní, predeterminovaná proměnná V ... vysvětlovaná proměnná U , x ... vysvětlující proměnné (regresory) U ... náhodný regresor Pro jednoduchost uvažujme lineární model ve tvaru: V i=1 11 2 x i11 U i Ei 1 P ... rovnice poptávky V i=2 121 U i Ei 2 N ... rovnice nabídky kde i=1 , ... , n jsou pozorování P ... poptávka N ... nabídka Ekonomická interpretace parametrů a omezení na parametry: 1 2≥0 1 1≤0 ... čím vyšší cena, tím nižší poptávka 2 1≥0 ... čím vyšší cena, tím vyšší nabídka Maticový zápis: V1 1 x1 U 1 11 E 11 ⋮ = ⋮ ⋮ ⋮ 1 2 ⋮ Vn 1 x n U n 11 E n1
V1 1 U1 E1 2 21 ⋮ ⋮ =⋮ ⋮ 2 1 Vn 1 Un En 2 neboli v =X 1 1 e 1 P v =X 2 2 e 2 N
P
N
+ předpoklady o chybách: E e 1 =E e 2 =0 – var Ei 1= 1 1 , E i1 jsou nezávislé – var Ei 2= 2 2 , E i 2 jsou nezávislé – +vazba: cov Ei 1 , E i 2= 1 2 ∀ i
35
Matice chyb: E =e1 , e 2 n ×2
var e i⋅= = 2×2
1 1 1 2 1 2 2 2
cov e i⋅ , ei ⋅=0, i≠i ' tj. SUR (zdánlivě nesouvisející rovnice), q=2 s náhodným regresorem U . Strukturní tvar rovnic P, N se převede na tvar redukovaný, tj. U , V doleva. '
N dosaď do P : 2 12 1 U iE i 2=1 11 2 x i1 1 U iE i1 1 Ui= − x E i1 −Ei 2 2 1− 11 1 1 2 1 1 2 i dosaď do N : 1 1 V i=2 121 1 1−2 11 2 x iEi 1− Ei 2 Ei 2= − 2 1−1 1 2 1−1 1 21 2 1 2 1 1 1 11 2 1−2 1 2 11 2 2 1 xi 2 1 Ei 1−1 1 E i2 Napočítejme kovariance: E −Ei 2 1 cov U i , E i 1=cov i1 , E i1 = − 1 2 21 −1 1 2 1−1 1 1 1 1 cov U i , E i 2 = − 2 2 2 1−11 1 2 tyto kovariance jsou obecně nenulové, tedy U a chyby E1 , E2 jsou závislé problém pro metodu nejmenších čtverců. Odhady parametru , pomocí MNČ ze strukturních rovnic P, N by nebyly konzistentní ani nestranné, proto přecházíme na redukovaný tvar: U i =1 11 2 x iF i 1 V i=2 12 2 x iF i 2 , i=1 , ... , n , kde − 1 1= 1 1 21 , 12=... atd. – 2 1−11 E i 1−E i 2 F i 1= , F i 2=... nové chyby – 2 1−11 E −E i2 2 1 Ei 1−1 1 E i 2 cov F i 1 , F i 2 =cov i 1 , =...≠0 2 1−11 2 1−1 1 ⇒ redukované rovnice jsou provázány skrze kovarianci chyb.
Maticově (redukovaný tvar): u=X 1 1 f 1 v =X 2 2f 2
1 x1
kde X 1= X 2 = X = ⋮ ⋮ n×2
1 xn
SUR pro q=2 . Pro nejlepší odhady je obecně nutno použít ZMNČ. Nicméně víme, že pro X 1= X 2 stačí MNČ pro každou rovnici zvlášť. (Konec příkladu) 36
IV.1 Simultánní rovnice obecně Proměnné vystupují v některých rovnicích jako vysvětlující, v jiných jako vysvětlované. q nezpožděných endogenních proměnných Y 1 , ... ,Y q , získaných během n pozorování. Y 11 ⋯ Y 1 q Y = ⋮ ⋱ ⋮ =Y i j , kde i=1 ,... ,n ... pozorování n ×q j=1 , ... , q ... proměnné Y n1 ⋯ Y n q
{
p exogenních proměnných x 1 ,... , x p x1 1 ⋯ x1 p X = ⋮ ⋱ ⋮ = x i k , kde i=1 , ... , n ... pozorování n × p k=1 ,... , p ... proměnné xn 1 ⋯ xn p
{
Tyto dvě skupiny proměnných jsou vázány prostřednictvím q rovnic (lineárních) s parametry/koeficienty: 1 1 ⋯ 1 q = 1) ⋮ ⋱ ⋮ = j k q ×q q 1 ⋯ q q j k ... koeficienty u endogenních proměnných ⋅j ... koeficienty u j-té proměnné j⋅ ... koeficienty u j-té rovnice
1 1 ⋯ 1 p B = ⋮ ⋱ ⋮ = j k 2) q × p q 1 ⋯ q p j k ... koeficienty u exogenních proměnných ⋅k ... koeficienty u k-té proměnné j⋅ ... koeficienty u j-té rovnice , B ... strukturní parametry Model ve strukturním tvaru: Y T X BT = E , kde E= E i j je matice chyb n ×q q×q n× p p×q n×q Předpoklady: E E =0 – – cov e i⋅ , ei ⋅= 0 '
i≠i '
q ×q
–
var e j⋅= = j k q×q
Model pro i-té pozorování: y i⋅B x i⋅=e i⋅, i=1 , ... , n Model pro j-tou rovnici: Y j⋅ X j⋅=e⋅j , j=1 ,... , q 37
Poznámka: V j-té strukturní rovnici vystupuje nalevo jediná proměnná Y j . Bez újmy na obecnosti předpokládejme, že j j =1 (jinak znormujeme), tj. v každé rovnici nejvýše q−1 p neznámých parametrů. Poznámka: (terminologie) je diagonální ... SUR je blokově diagonální ... neintegrovaná struktura je trojúhelníková ... rekurzivní systém rovnic je obecná ... obecná integrovaná struktura Model převedeme do redukovaného tvaru: Y T X BT =E ∣ T −1 zprava Y =−X B T T −1 E T −1= X T F n× p p×q
n×q
kde
−1
=− B
–
q × p
F = E T −1
–
n ×q
= j k ... neomezené koeficienty, přímé multiplikátory
–
Pro i-té pozorování: y i⋅= x i⋅f i⋅, i=1 , ... , n f i⋅=−1 e i⋅ platí: – –
E f i⋅=0 −1 var f i⋅= −1T nezávislé na i q ×q
f i⋅ nekorelované – tj. Y = X T F ... SUR, kde X 1=...=X q =X víme: Pro nejlepší odhad nám stačí MNČ: = X T X −1 X T Y ... nejlepší nestranný lineární odhad Příklad: (pokračování) q=2 , Y =U , V p=2 , X =1, x = 2×2
B = 2×2
−1 1 1 −2 1 1
−1 1 −1 2 −2 1 0
P N
případně rovnici P znormuj pomocí
1 −1 1
(konec příkladu) 38
IV. 2 Problém identifikace Strukturní tvar: Y T X BT = E n ×q q×q
n× p p×q
n×q
Redukovaný tvar: Y = X T F n ×q
n× p p×q
n×q
Známe-li , jak můžeme zpětně vyjádřit a ? −1 B Platí: =− #pq
2
# q p q
Některé , mohou být nulové 1−1 # # , ... přesná identifikace přeurčení - identifikace jinak podurčení Ověříme pro jednotlivé rovnice nebo pro soustavu jako celek.
{
Příklad: (pokračování) V ... vyměňované množství zboží U ... cena zboží x ... příjem spotřebitele Redukovaný tvar: U i =111 2 x iF i 1 V i=2 12 2 x iF i 2
i=1 , ... ,n
Dosaď do strukturního tvaru: P 2 12 2 x iF i 2=1 11 1 11 12 x iF i 1 1 2 x i Ei 1 Vi
Ui
N 2 12 2 x iF i 2=2 12 1 1 11 2 x iF i 1 Ei 2
Porovnej koeficienty: P 2 1=11 1 1 1 1 2 2=1 1 1 21 2 N 2 1=21 2 1 1 1 2 2=2 1 1 2
} }
2 rovnice pro 3 neznámé ,
rovnice je podurčená
2 rovnice pro 2 neznámé ,
rovnice je přesně identifikovaná
2 2 , 2 1=2 1−1 1 2 2 1 2 1 2 celkem 4 rovnice pro 5 neznámých soustava je podurčená (konec příkladu) 2 1=
39
Problém identifikace obecně =−−1 B neboli =− B q ×q q × p
q× p
Uvažuj j-tou rovnici: × Tj⋅=−Tj⋅, j=1 , ... , q Bez újmy na obecnosti: j j =1 , j=1 , ... , q Značení: q j ... počet nenulových v j-té rovnici, počet přítomných endogenních proměnných q−q j ... počet nulových v j-té rovnici, počet chybějících endogenních proměnných p j ... počet nenulových v j-té rovnici, počet přítomných exogenních proměnných p− p j ... počet nulových v j-té rovnici, počet chybějících exogenních proměnných T j 1 ,... , j q , 0 ,... , 0 a zároveň Přeskládej proměnné v j-té rovnici tak, aby j⋅= j
# q j nenulových T j⋅
# q− q j
= j 1 , ... , j p , 0 , ... , 0 j
Potom: =
q × p
11 1 2 2 1 2 2 pj
qj q−q j
p− p j
přepíšeme × jako: ∗ j 1 , ... , j q 1 1 =− j 1 ,... , j p ... p j rovnic ∗∗ j 1 , ... , j q 1 2=0 , ... , 0 ... p− p j rovnic j
j
j
V j-té rovnici je q j−1 neznámých . Ty odhadneme z ∗∗ , ale musí být dostatek rovnic. podmínka na počet parametrů: p− p j ≥q j−1 (tj. dostatečný počet nulových ). Podmínka není postačující, neboť rovnice ∗∗ mohou být lineárně závislé. 1 2 musí mít dostatečnou hodnost h 1 2≥q j−1 Rozměr 1 2 : q j× p− p j při splnění 1. podmínky ⇒ h 1 2 ≤q j kdyby h 1 2=q j , tak ∗∗ má pouze triviální řešení podmínka na hodnost: h 1 2=q j−1 Tabulka počet parametrů
h 12
p− p j q j−1
=q j−1
přeurčení
p− p j =q j−1
=q j−1
přesná identifikace
p− p j ≥q j−1
q j−1
podurčení
p− p j q j−1
libovolné
podurčení 40
Poznámka: Podurčení lze odstranit: 1) vynulováním některých strukturních parametrů , 2) lineárními podmínkami, čili omezeními na , 3) podmínkami na varianční matici Příklad: (pokračování) q=2 , Y =U , V p=2 , X =1, x
=
−11 1 −2 1 1
, B=
−1 1 −1 2 −2 1 0
1. rovnice P : j =1 q 1=2 , p1=2 0= p− p 1q 1−1=1 P je podurčená 2. rovnice N : j=2 q 2=2 , p2=1 1= p− p2 =q 2−1=1 ? h 1 2 rozměr: q 2× p− p 2⇒ 2×1 1 2= 1 2 , h 1 2=1=q2−1 2 2 tedy N je přesně identifikovaná (konec příkladu)
IV.3 Metody odhadu parametrů IV.3.1 Nepřímá metoda nejmenších čtverců Používá se při přesné identifikaci, tj. p− p j =q j−1 a h 1 2=q j−1 . Z ∗∗ vyjádříme a dosadíme do ∗ Jednoznačné řešení , budou konzistentní, ale obecně vychýlené Postup: MNČ 1. R Y = X T F 2. =−B , B
41
IV.3.2 Dvoustupňová metoda nejmenších čtverců Používá se pro přeurčené soustavy, při přesné identifikaci dá tytéž odhady jako nepřímá MNČ. Odvození: S Y T X B T =E R Y = X T F Uvažuj j-tou rovnici a nechť j j =1 . Strukturní tvar: j-tý sloupec Y j⋅ X j⋅=e⋅j neboli y⋅1 , y⋅2 ,... , y⋅j , ... , y⋅q
j 1 ⋮ jj =1 ⋮ j q
X j⋅=e⋅j
Vybereme j-tý sloupec y⋅j : 1⋅y⋅j−Y ∗ j ∗j⋅jX j⋅=e⋅j , kde operátor ∗j : – z matice vyjme j-tý sloupec – z vektoru vyjme j-tý prvek y⋅j=−Y ∗ j ∗j⋅j− X j⋅e⋅j Problém: Y ∗j korelované s chybami e⋅j , tedy MNČ odhady j⋅, j⋅ by nebyly ani konzistentní. ... nevychýlené, konzistentní Z R odhadneme MNČ ... T Y = X ∗ j T ∗ j= X T ∗ j Y = X Dosadíme: T ∗ j ∗j⋅j −X j⋅g⋅j y⋅j=−X
♥
MNČ odhady j⋅ , j⋅ jsou konzistentní, obecně vychýlené (asymptoticky nevychýlené) 2-stupňové odhady. Postup: 1. Y = X T F MNČ 2.
T ∗ j ∗j⋅ j− X j⋅g⋅j MNČ ♥ y⋅j =−X j⋅ , j⋅
42
j=1 ,... , q
IV. 3. 3 Trojstupňová metoda nejmenších čtverců Chyby g⋅j v rovnici ♥ mají tuto strukturu G1 1 ⋯ G 1 q G = ⋮ ⋱ ⋮ nezávislé řádky (pozorování) n ×q Gn 1 ⋯ G n q korelované sloupce (proměnné) cov g i⋅ , g i⋅=0 , i≠i' cov g⋅j , g⋅k = j k I n var gi⋅= T = j k ∀ i
'
q×q
tedy SUR – s různými maticemi plánu – s variační maticí =T I n n q ×n q
Postup: 1. Y = X T F MNČ 2.
MNČ
T ∗ j ∗j⋅ j− X j⋅g⋅j j⋅ , j⋅ ♥ y⋅j =−X
j=1 ,... , q
3. odhad kovariancí 1 j k = g ⋅jT g ⋅k , kde g ⋅j rezidua z j-té rovnice ♥ h h=max n− q j−1− p j , n−q k −1− p k q j ... počet nenulových endogenních proměnných v j-té rovnici p j ... počet nenulových exogenních proměnných v j-té rovnici = T I n nq ×n q
4. ZMNČ = ZT −1 Z −1 Z T −1 y −1 ∗1 X
kde
Z
=
n q ×[ q q −1 p q ]
0 ⋮ 0
0 ⋯ 0 −1 ∗2 X ⋯ ⋮ ⋯ ⋱ 0 ⋯ 0 X −1∗q
T
= ⋅1∗1 T , ... , ⋅q∗q T ... q q−1×1 = T1⋅ ,... , Tq⋅T ... p q×1 y= y⋅1T , ... , y⋅qT T ... n q×1
43
X 0 0 X ⋮ ⋮ 0 ⋯
⋯ ⋱ ⋱ 0
0 ⋮ 0 X
IV. 4 Konečný tvar simultánních rovnic Uvažujme dynamický model se zpožděnými proměnnými t ... čas Strukturní tvar: Y t T Y t−1 T1 ... Y t −s Ts X
T t n× p p×q
n ×q q×q
B X t−1 B T1 ... X t −r BTr = E
t n×q
Převedeme na redukovaný tvar: ∣ T −1 zleva Y t =Y t−1 T1 ...Y t−s Ts X t T0 X t−1 Ts1...X t−r Ts rF T n ×q
p×q
q ×q
p×q
kde 0=−−1 B , 1=− −1 1 atd... Zjednodušený redukovaný tvar 1. řádu: s=1 , r=0 Y t =Y t −1 T1 X t T0 F t=Y t −2 T1 X t−1 T0 F t−1 T1 X t T0 F t =...= T t 1
t −1
T l 1
t −1
l
=Y 0 ∑ X t−l ∑ Ft −l T1 ... konečný tvar l=0
T 0
l=0
Y 0 ... výchozí hodnoty Odtud předpovědi: v čase T o h kroků dopředu 0 T , t h h−1
h1 y T ∑ 1 l 0 x PThl kde: y TPh= q×1
l=0
y T ... průměrná hodnota v čase T (průměr i=1 , ... , n ) – x PTh −l dané budoucí hodnoty exogenních proměnných – speciální případ: h=1 ... krátkodobá předpověď 1 y T 0 x TP1 y TP1= Odhady parametrů redukovaného tvaru: 1. nepřímo, pomocí konzistentních odhadů , B : =− −1 B nebo 2. přímo pomocí MNČ... Poznámka: Při přesné identifikaci je to ekvivalentní.
44
V. Dynamické modely Předpoklady: Y t ... 1-rozměrná náhodná veličina x t ... 1-rozměrný nenáhodný regresor t ... čas Idea: Změny v závislé proměnné se projevují postupně v čase. V. 1 Model rozdělených zpoždění Y t =0 x t 1 x t−1...k x t −k E t + předpoklady regulárního regresního modelu k
Y t =∑ j x t− jE t , kde k je maximální zpoždění nezávislé proměnné x j=0
V.1.1 Konečně rozdělené zpoždění Nastává, pokud k ∞ , většinou k neznáme. – předepíšeme – určíme pomocí testů významnosti j – určíme podle indexů determinace v různě zpožděných modelech Problémy: – matice X bývá kolineární – málo pozorování vzhledem k počtu parametrů k 1 Počet parametrů lze snížit speciální volbou j : – Lineárně rozdělené zpoždění j=k 1− j , j=0 , 1 ,... , k – Trojúhelníkově rozdělené zpoždění k j= j , j=0 , 1 , ... , 2 k j=k − j , j= 1, ... , k 2 – Polynomicky rozdělené zpoždění j= 01 j... r j r , r ≪k =J y= X e=X J e
45
V.1.2 Nekonečně rozdělené zpoždění Nastává, pokud k =∞ . ∞
∞
j=0
j= 0
Y t =∑ j x t− jE t=∑ j Z j xt Et kde Z j x t =x t − j je operátor zpoždění – Geometricky rozdělené zpoždění (Koyckův přístup) j=w j , j=0 , 1 , ... w j =1− j ~Geom1− , ∈0,1 tedy: j=1− j , j=0 ,1 , ... Dosaď do modelu: ∞
Y t =∑ 1− j Z j x t E t j=0
Trik: považuj Z za reálnou proměnnou a sečti jako geometrickou řadu 1− Y t= x Et ∣1− Z 1− Z t 1− Z Y t =1− x t 1− Z Et Y t =Y t −11− x t E t − E t −1 ... AR tvar modelu =: F t
Náhodný regresor Y t −1 korelovaný s chybami MNČ odhady jsou nekonzistentní. Přidávají se další předpoklady o chybách, např. F t i.i.d. . V.2 Model částečného přizpůsobení 0
Y t = 01 x t Y t ... optimální očekávaná (požadovaná) hodnota (nenáhodná) a dále Y t −Y t −1= 0Y t −Y t −1 Et , kde ∈ 0,1 〉 ... koeficient přizpůsobení 0
Skutečná změna se přizpůsobuje (přibližuje) očekávané změně, ale nemusí jí dosáhnout. Obě části modelu sloučíme: Y t −Y t −1= 01 x t −Y t −1 Et Y t =1− Y t −1 0 1 x t Et ... AR tvar je to Koyckův model s absolutním členem a s nezávislými chybami
46
V.3 Model adaptivního očekávání Y t =01 0 x t Et 0 x t optimální očekávaná nebo průměrná hodnota x t 0 x t −0 x t−1= x t −0 x t−1 , kde ∈ 0,1 〉 ... koeficient očekávání Očekávaná změna se přizpůsobuje skutečné hodnotě 0
∞
x t = x t 1− 0 x t−1= x t 1−[ x t 11− 0 xt −2 ]=...= ∑ 1− j x tj− j= ∞
j=0
= ∑ 1− Z x t = x 1−1− Z t j=0 j
j
Dosaď do 1. části: 1 Y t =0 x E t ∣1−1− Z 1−1− Z t Y t =0 1 x t 1− Y t−1 Et −1− E t −1 ... AR tvar Koyckův model s absolutním členem V.4 Model racionálně rozděleného zpoždění Y t 1 Y t −1...r Y t −r=x t 1 x t−1 ...s x t−s Et neboli Z Y t =Z x t E t , kde Z , Z jsou operátory zpoždění
47