Acta oeconomica pragensia 6: (2), str. 7-11, VŠE Praha, 1998. ISSN 0572-3043 (Rukopis)
Časové řady typu I(0) a I(1) Josef Arlt Úvod Při analýze ekonomických časových řad má smysl rozlišovat stacionární a nestacionární časové řady. Stacionární časové řady se označují také jako časové řady s krátkou pamětí, nestacionární časové řady se označují jako řady s dlouhou pamětí. Zatímco u řad s krátkou pamětí se vliv šoku z minulého období časem postupně vytrácí, u řad s dlouhou pamětí se projevuje neustále. Odlišnosti v charakteru těchto časových řad jsou dány zásadními rozdíly v jejich generujících procesech. Při zkoumání vztahů mezi časovými řadami je v praxi snaha používat klasickou regresní analýzu. Velmi důležitým předpokladem konvenční asymptotické teorie pro odhady metodou nejmenších čtverců je stacionarita vysvětlujících proměnných. Při praktických aplikacích se často na posouzení tohoto předpokladu zapomíná. Někdy si však analytici uvědomují, že jejich časové řady nejsou stacionární, provedou tedy „nějakou“ transformaci (obvykle odstraní lineární deterministický trend) bez ohledu na charakter generujícího procesu a s takto transformovanými časovými řadami pracují jako by byly stacionární. V obou případech může vzniknout problém, který se označuje jako zdánlivá regrese. Zdrojem zdánlivé regrese jsou rozdílné stochastické trendy vysvětlované a vysvětlující proměnné. Hlavním cílem tohoto článku je vysvětlit základní rozdílnosti ve stacionárních generujících procesech I(0) a nestacionárních generujících procesech I(1). V této souvislosti jsou uvedeny základní problémy vznikající při modelování časové řady obsahující stochastický pomocí funkce s časovou proměnnou. 1. Časové řady typu I(0) Uvažujme nejprve autoregresivní proces prvního řádu (označuje se jako AR(1)) Yt = ρYt-1 + e1t, (1) kde {e1t} je proces bílého šumu, tj. proces s nulovou autokorelační funkcí, nulovými středními hodnotami a konstantními rozptyly σ12. Stručně lze tyto vlastnosti zapsat jako {e1t} ∼ IID(0, σ12) („IID“ znamená „Identicaly Independentely Distributed“)
(2)
Předpokládejme dále že |ρ| < 1. Předpokládejme, že proces má počátek v čase t = 0 a že Y0 je deterministická počáteční podmínka. Obecné řešení diferenční rovnice má potom formu t −1
Yt = ρ t Y0 + ∑ ρ i e1t −i . i =0
(3)
Střední hodnota tohoto procesu je E(Yt) = ρtY0. Budeme-li uvažovat čas t+s, bude mít střední hodnota formu E(Yt+s) = ρt+sY0.
(4) (5)
Porovnáme-li střední hodnoty (4) a (5), je zřejmé, že se s časem mění, takže proces (1) nemůže být stacionární. Avšak s růstem t do nekonečna výraz ρtY0 konverguje k nule, takže ∞
lim Yt = ∑ ρ i e1t −i . i =0
(6)
Pro t = ∞, prakticky pro dostatečně vysoké t platí, že proces (1) má následující vlastnosti: (AI) E(Yt) = 0, tj. nepodmíněná střední hodnota je nulová, (AII) D(Yt) = E(Yt -µ)2 = E[(e1t + ρe1t-1+ ρ2e1t-2+ ... )2] = σ12[1+ρ2+ρ4+ ...] = σ12/(1-ρ2), tj. nepodmíněný rozptyl je konstantní a nezávislý na čase, (AIII) E[(Yt -µ)(Yt-s -µ)] = E[(e1t + ρe1t-1+ ρ2e1t-2+ ...)(e1t-s + ρe1t-s-1+ ρ2e1t-s-2+ ...)] = σ12ρs[1+ρ2+ρ4+ ...] = σ12ρs/(1-ρ2), tj. autokorelační funkce nezávisí na čase t a s rostoucím posunutím s její hodnoty klesají, proces má dočasnou paměť, Budeme-li uvažovat v procesu (1), který má počátek v t = 0 ještě konstantu, tj. Yt = a + ρYt-1 + e1t,
(7)
obecným řešením je vztah t −1
t −1
i =0
i =0
Yt = a ∑ ρi + ρ t Y0 + ∑ ρ i e1t −i .
(8)
Při t→∞ ∞
lim Yt = a / (1 − ρ) + ∑ ρi e1t −i , i =0
(9)
takže nepodmíněná střední hodnota procesu je rovna výrazu a/(1-ρ) a je tedy rovněž nezávislá na čase. Rozptyl a autokorelační funkce se nemění. Je tedy zřejmé, že pro dané deterministické Y0 a |ρ| < 1 je třeba aby bylo t dostatečně vysoké, jinak časová řada generovaná procesem (1) nemusí být stacionární. Příčinou nestacionarity je tedy v tomto případě deterministická počáteční podmínka. Při praktické činnosti je vhodné při nebezpečí tohoto případu vynechat několik počátečních pozorování. Pokud neexistuje deterministická počáteční podmínka Y0, obecné řešení jako součet homogenního a partikulárního řešení má tvar ∞
Yt = a / (1 − ρ) + ∑ ρi e1t −i + A ρ t , i =0
(10)
kde A je libovolná konstanta. Proces (10) je stacionární když je výraz Aρt roven nule. Taková situace nastane v případě, že t = ∞ nebo konstanta A = 0. Tuto konstantu lze interpretovat jako odchylku od rovnovážného stavu resp. ekvilibria. Pokud je konstanta A nulová, proces je v ekvilibriu. Stejné podmínky stacionarity platí pokud je počáteční podmínkou náhodná veličina se střední hodnotou rovnou nule resp. a/(1-ρ) a rozptylem σ12/(1-ρ2). Výše uvedené podmínky stacionarity lze zobecnit na procesy ARMA(p, q). Stacionární procesy se nazývají integrovanými procesy řádu nula a označují se jako I(0). Jimi generované časové řady se označují jako řady typu I(0).
8
Příklad 1 Na obr. 1 je zachycena časová řada generovaná procesem Yt = 5,0 + 0,6Yt-1 + e1t. Tento proces je stacionární, tj. I(0), takže i časová řada je typu I(0). Obrázek 1
Časové řady typu I(1) Uvažujme nyní proces Yt = Yt-1 + e2t,
(11)
kde {e2t} ∼ IID(0, σ22). Tento proces se označuje jako náhodná procházka („random walk“). Jde o zvláštní případ procesu AR(1), kde ρ = 1. Předpokládejme, že má počátek v čase t = 0 a Y0 je počáteční deterministická podmínka. Potom obecné řešení (diferenční rovnice (11)) je t
Yt = Y0 + ∑ e2 j . j =1
(12)
Náhodná procházka má následující vlastnosti: (BI) E(Yt) = Y0, tj. nepodmíněná střední hodnota je konstantní a nezávislá na čase, (BII) D(Yt) = E[(e2t+e2t-1+...+e21)(e2t+e2t-1+...+e21)] = tσ22, tj. nepodmíněný rozptyl závisí na čase t, (BIII) E[(Yt-Y0)(Yt-s-Y0)] =E[(e2t+e2t-1+...+e21)(e2t-s+e2t-s-1+...+e21)] = =E[(e2t-s)2+(e2t-s-1)2+...+ (e21)2] = (t-s)σ22, nepodmíněný rozptyl v čase (t-s) je D(Yt-s) = (t-s)σ22, korelační koeficient má tedy tvar
ρs = (t - s)/ (t − s)t = (t − s) / t = 1 − s / t , tj. korelační koeficient závisí na čase t a s t → ∞ při daném posunutí s konverguje k jedné. Z výše uvedených vlastností vyplývá, že náhodná procházka je nestacionární proces. t Zdrojem její nestacionarity je stochastický trend ∑ j =1 e2 j . Za předpokladu t veličin procesu {e2t} má podmíněná střední hodnota Yt+1 tvar Et(Yt+1) = Et(Yt + e2t+1) = Yt. (13) Podmíněnou střední hodnotu Yt+s získáme ze vztahu
9
s
Yt+s = Yt + ∑ e2 t +i , i =1
(14)
tj. s
Et(Yt+s) = Yt + Et ∑ e2 t +i = Yt. i =1
(15)
Podmíněné střední hodnoty Yt+s pro všechna kladná s se rovnají Yt. Avšak šoky e2t mají neklesající vliv. Zahrneme-li do procesu (11) konstantu, tj. Yt = µ + Yt-1 + e2t, potom za předpokladu počáteční podmínky Y0 jej lze vyjádřit jako t
Yt = Y0 + µ t + ∑ e2 j . j =1
(16)
(17)
Kromě stochastického trendu tento proces obsahuje ještě lineární deterministický trend Y0 + µt. Nepodmíněná střední hodnota má formu E(Yt) = Y0 + µ t. (18) Rozptyl a autokorelační funkce se nemění. Vzhledem k vlastnostem (nulová střední hodnota, konstantní rozptyl, nulová autokorelační funkce) je proces bílého šumu procesem typu I(0). Jestliže {e2t} bude nějaký stacionární proces AR, invertibilní proces MA nebo stacionární a invertibilní proces ARMA, potom proces (11) bude mít vzhledem k vlastnostem (AI) - (AIII) obdobné vlastnosti jako náhodná procházka. Je zřejmé, že nestacionární procesy tohoto typu lze stacionarizovat jejich první diferencí. Tyto procesy se nazývají integrované řádu jedna a označují se jako I(1). Jimi generované časové řady se označují jako řady typu I(1). Příklad 2 Na obr. 2 je zachycena časová řada generovaná procesem Yt = Yt-1+ e2t. Jedná se o integrovaný proces řádu jedna, takže i časová řada je typu I(1). Obrázek 2
10
3. Modelování časových řad typu I(1) pomocí modelů s časovou proměnnou Řešení problémů spjatých s integrovanými časovými řadami často vychází z představy, že jejich nestacionarita by mohla být dobře zachycena pomocí nějaké deterministické funkce časové proměnné. Kdyby tato představa byla reálná, stačilo by pomocí dané funkce odstranit „zdroj“ nestacionarity a pracovat dále pouze s rezidui. Bohužel jak analytické, tak i simulační studie ukazují, že tento postup nelze volit. Předpokládejme časovou řadu Yt, která je generována procesem „náhodné procházky“ Yt = Yt-1 + e2t. (19) Úkolem je odstranit trend z této nestacionární časové řady (typ generujícího procesu neznáme) pomocí lineární funkce časové proměnné. Za tímto účelem se nabízí použít následující regresní model Yt = α + βt + ut. (20) Ve studii Durlauf, Phillips (1988) bylo dokázáno, že za předpokladu α = β = 0 má odhad β$ limitní rozdělení, které degeneruje v nule (viz např. Likeš, Machek (1981)) a α$ má divergentní rozdělení tzn., že rozptyl odhadu α$ roste se zvětšujícím se rozsahem výběru. Výsledky t-testu jsou nespolehlivé (indikují významnost přítomnosti časové proměnné v modelu, ve kterém ve skutečnosti tato proměnná není), i když odhad β$ konverguje ke své skutečné nulové hodnotě, neboť t-statistika (také F-statistika) při platnosti hypotézy H0: β = 0 nekonverguje k nule, ale je s pravděpodobností jedna asymptoticky neohraničena (což je důsledek degenerovaného limitního rozdělení β$ ). Literatura: Arlt, J.: Regresní analýza nestacionárních ekonomických časových řad, Politická ekonomie, 1997, č. 2 Arlt, J.: Kointegrace v jednorovnicových modelech. Politická ekonomie, 1997, č. 5 Durlauf, S.N. - Phillips, P. C. B.: Trends versus Random Walks in Time Series Analysis, Econometrica, 56, 1988 Likeš, J. - Machek, J.: Počet pravděpodobnosti, SNTL, Praha, 1981
11