Politická ekonomie 45: (2), str. 281-289, VŠE Praha, 1997. ISSN 0032-3233. (Rukopis)
REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD Josef ARLT, Vysoká škola ekonomická, Praha
1. Úvod Pro modelování vztahů mezi ekonomickými veličinami se v ekonometrii často používají jednorovnicové regresní modely. V této třídě modelů je vysvětlovaná proměnná modelována pomocí jednoduché funkce vysvětlujících proměnných. Vysvětlovaná a vysvětlující proměnné mohou být prostorově nebo časově uspořádaná data. Díky specifickým vlastnostem časově uspořádaných dat vznikají často při konstrukci regresních modelů, odhadu a interpretaci jejich parametrů značné problémy. Jedním z nich je zdánlivá regrese. Lze ji ilustrovat situací, ve které jsou k dispozici dvě časové řady, které spolu nesouvisí. Pokud se jedna bude považovat za vysvětlovanou a druhá za vysvětlující proměnnou, může se stát, že metodou nejmenších čtverců získáme statisticky významné odhady parametrů dané regresní funkce. Tato skutečnost v praxi často vede k mylným závěrům o vztahu ekonomických veličin. Problém zdánlivé regrese je statistikům a ekonometrům znám již dlouho. Důkladně se jím však zabývali až v 70. a 80. letech. V této době se začaly detailněji zkoumat stochastické vlastnosti ekonomických časových řad a vliv těchto vlastností na odhady regresních parametrů. Cílem předkládaného článku je vysvětlit problematiku integrovaných procesů a stochastického trendu jako zdroje zdánlivé regrese a objasnit způsob zjišťování tohoto jevu. Článek se skládá ze dvou částí. První část obsahuje popis a objasnění vlastností stacionárních a nestacionárních generujících procesů časových řad. Druhá část se zabývá zdánlivou regresí, obsahuje nejnovější poznatky o této problematice získané na základě simulačních studií. Je zde rovněž naznačen způsob rozlišení zdánlivé a pravé regrese. 2. Časové řady typu I(d) Uvažujme nejprve autoregresivní proces prvního řádu (označuje se jako AR(1)) Yt = ρYt-1 + e1t, (2.1) kde {e1t} je proces bílého šumu, tj. proces s nulovou autokorelační funkcí, nulovými středními hodnotami a konstantními rozptyly σ12. Stručně lze tyto vlastnosti zapsat jako {e1t} ∼ IID(0, σ12) („IID“ znamená „Identicaly Independentely Distributed“)
(2.2)
Jestliže |ρ| < 1, potom je proces (1.1) stacionární a lze jej přepsat do tvaru Yt = e1t + ρ e1t-1 + ρ2 e1t-2 + ... , který se nazývá lineárním procesem.
(2.3)
Má-li proces (1.1) počátek v čase t = 0, potom je při |ρ| < 1 stacionární tehdy, jestliže Y0 je náhodná veličina, která má stejné nepodmíněné rozdělení jako veličina Yt, s nulovou střední hodnotou a rozptylem σ12/(1 - ρ2). Stacionární proces AR(1) má následující vlastnosti: (AI) E(Yt) = 0, tj. nepodmíněná střední hodnota je nulová, (AII)
D(Yt) = σ12/(1 - ρ2), tj. nepodmíněný rozptyl je konstantní,
(AIII)
ρk = ρk, k ≥ 0, tj. autokorelační funkce nezávisí na čase t a s rostoucím posunutím k její hodnoty klesají, proces má dočasnou paměť, Očekávaná doba překročení nulové hodnoty je konečná.
(AIV)
Budeme-li uvažovat v procesu (2.1), který má počátek v t = 0, ještě konstantu, tj. Yt = µ + ρYt-1 + e1t, potom nepodmíněná střední hodnota má formu
(2.4)
(2.5) E(Yt) = µ(1 + ρ + ρ2 + ... + ρt-1). Rozptyl a autokorelační funkce se nemění. Obdobné vlastnosti (ad (AI) - (AIV)) jako stacionární proces AR(1) má obecný stacionární proces AR, obecný invertibilní proces MA a obecný stacionární a invertibilní proces ARMA (lze jej vyjádřit ve formě AR, viz Kozák, Hindls, Arlt (1994)). Tyto procesy se nazývají integrovanými procesy řádu nula a označují se jako I(0). Jimi generované časové řady se označují jako řady typu I(0). Příklad 1 Na obr. 1 je zachycena časová řada generovaná procesem Yt = 5,0 + 0,6Yt-1 + e1t. Tento proces je stacionární, tj. I(0), takže i časová řada je typu I(0). Obrázek 1
Uvažujme nyní proces Yt = Yt-1 + e2t,
(2.6)
σ22).
Tento proces se označuje jako náhodná procházka („random walk“). kde {e2t} ∼ IID(0, Předpokládejme, že má počátek v čase t = 0 a Y0 = 0. Lze jej přepsat do tvaru t
Yt =
∑ e2 j
.
(2.7)
j =1
Náhodná procházka je nestacionární proces, neboť obsahuje stochastický trend
∑ j =1e 2 j . t
Náhodná procházka má následující vlastnosti: (BI) E(Yt) = 0, tj. nepodmíněná střední hodnota je nulová, (BII)
D(Yt) = tσ22, tj. nepodmíněný rozptyl závisí na čase t a diverguje s t → ∞,
(BIII)
ρi =
1 − ( i / t ) → 1 ∀ i , při t → ∞, tj. autokorelační funkce závisí na čase t a s t → ∞
konverguje k jedné, (BIV) Očekávaná doba překročení nulové hodnoty je nekonečná. Zahrneme-li do procesu (2.6) konstantu, tj. Yt = µ + Yt-1 + e2t,
(2.8)
potom jej lze vyjádřit jako Yt = µ t +
2
t
∑ e2 j j =1
.
(2.9)
Kromě stochastického trendu tento proces obsahuje ještě lineární deterministický trend µt. Nepodmíněná střední hodnota má formu E(Yt) = µ t.
(2.10)
Rozptyl a autokorelační funkce se nemění. Vzhledem k vlastnostem (nulová střední hodnota, konstantní rozptyl, nulová autokorelační funkce) je proces bílého šumu procesem typu I(0). Jestliže {u2t} bude nějaký stacionární proces AR, invertibilní proces MA nebo stacionární a invertibilní proces ARMA, potom proces (2.6) bude mít vzhledem k vlastnostem (AI) - (AIV) obdobné vlastnosti jako náhodná procházka (v případě procesu (2.8) se střední hodnota (2.10) nemění). Je zřejmé, že nestacionární procesy tohoto typu lze stacionarizovat jejich první diferencí. Tyto procesy se nazývají integrované řádu jedna a označují se jako I(1). Jimi vygenerované časové řady se označují jako řady typu I(1). Obecně lze integrované procesy definovat následujícím způsobem: Procesy, které neobsahují po d-té diferenci žádnou deterministickou složku a je možné popsat je stacionární a invertibilní representací ARMA, se nazývají integrovanými procesy d-tého řádu a značí se jako I(d). Integrované procesy vyšších řádů než jedna mají obdobné důležité vlastnosti jako procesy I(1), tj. nepodmíněná střední hodnota je nulová nebo je funkcí časové proměnné, nepodmíněný rozptyl diverguje s t → ∞, autokorelační funkce s t → ∞ konverguje k jedné, očekávaná doba překročení nulové hodnoty je nekonečná. Časové řady generovaná procesy I(d) se označují jako řady typu I(d). Příklad 2 Na obr. 2 je zachycena časová řada generovaná procesem Yt = Yt-1+ e2t. Jedná se o integrovaný proces řádu jedna, takže i časová řada je typu I(1). Obrázek 2
3. Zdánlivá regrese Při zkoumání vztahů mezi časovými řadami je v praxi snaha používat klasickou regresní analýzu. Tato skutečnost je mimo jiné podmíněna tím, že v současnosti je k dispozici množství statistických paketů, které tuto analýzu standardně obsahují. Základním předpokladem konvenční asymptotické teorie pro odhady metodou nejmenších čtverců je stacionarita vysvětlujících proměnných. Při praktických aplikacích se často na posouzení tohoto předpokladu zapomíná. Někdy si však analytici uvědomují, že jejich časové řady nejsou stacionární, provedou tedy „nějakou“ transformaci (obvykle odstraní lineární deterministický trend) bez ohledu na charakter generujícího procesu a s takto transformovanými řadami potom pracují jako by byly stacionární.
3
V obou případech může vzniknout problém, který již ve dvacátých letech nazval Yule nesmyslnou regresí („nonsense regression“) nebo později Granger a Newbold (1974) nepravou regresí („spurious regression“), u nás se často používá termín zdánlivá regrese. Lze jej ilustrovat situací, ve které máme k dispozici dvě integrované časové řady, které spolu vůbec nesouvisí, pokud se jedna bude považovat za vysvětlovanou a druhá za vysvětlující proměnnou, může se stát, že metodou nejmenších čtverců získáme statisticky významné odhady parametrů dané regresní funkce. Standardní důkaz konzistence odhadů získaných metodou nejmenších čtverců vychází z předpokladu, že plim(1/T)(Z´Z) = Q, kde Z je matice obsahující vysvětlující proměnné a Q je pevná matice. To znamená, že s rostoucím rozsahem výběru výběrové momenty konvergují k momentům základního souboru. Aby byly k dispozici pevné momenty základního souboru, musí být časové řady stacionární. Pokud tato podmínka není splněna (to je případ integrovaných časových řad), s rostoucím rozsahem výběru dochází ke stálé změně momentů a neexistují tedy žádné pevné momenty. Nyní uvedeme výsledky simulační studie publikované v Banerjee a kol. (1993) (navazující na studii Granger, Newbold (1974)), které dobře objasňují tento problém. Uvažujme nejprve následující procesy: ∆Yt = α + εt,
εt ∼ IID(0, σε2),
(3.1)
∆Zt = γ + vt,
σv2),
(3.2)
vt ∼ IID(0,
kde E(εt vs) = 0 ∀ t, s. Předpokládejme, že počáteční hodnoty Y0 a Z0 jsou nulové. Dále předpokládejme, že α = γ = 0. Je zřejmé, že procesy (3.1) a (3.2) jsou nezávislé. Vztah mezi procesy {Yt} a {Zt} může být vyjádřen modelem (3.3) Yt = c + β Zt + ut. Parametry tohoto modelu jsou obvykle odhadovány prostřednictvím metody nejmenších čtverců. Předpokladem použití této metody je, že {ut} je proces IID, který je nezávislý na procesu {Zt}. Vzhledem k tomu, že procesy (3.1) a (3.2) jsou nezávislé, očekáváme, že β = 0, tj. že platí vztah Yt = c + ut. Když je ale proces {Yt} ∼ I(1), musí být také proces {ut} ∼ I(1). To znamená nesplnění podmínek kladených na proces {ut}, tedy podmínek klasického lineárního regresního modelu, což při odhadu parametru β vede ke zdánlivé regresi. Na základě simulační studie Monte Carlo, při které byly generovány na základě procesů (3.1) a (3.2) při volbě α = γ = 0, Y0 = X0 = 0 a reziduích typu IIN(0,1) (nezávislá normovaná normální rozdělení) různě dlouhé časové řady, byly zjištěny mimo jiné následující důležité skutečnosti: a)
$ v regresi (2.3) je různá od nuly a s rostoucí délkou časových řad toto střední hodnota odhadu β vychýlení roste, b) rozdělení statistiky t závisí na délce časových řad, střední hodnota se sice s jejich rostoucí délkou mění nevýrazně, avšak směrodatná odchylka roste rychle, c) t-testy regrese obsahující nezávislé integrované časové řady indikují jejich závislost mnohem častěji než by na dané hladině významnosti měly. Tento problém s rostoucí délkou časových řad nemizí, právě naopak, zamítnutí nulové hypotézy, že procesy {Yt} a {Xt} jsou nezávislé, se stává pravděpodobnější variantou. Je důležité poznamenat, že ke stejným výsledkům analyticky dospěl Phillips (1986), ve stejné práci dále analyticky dokázal, že tyto výsledky jsou platné i v lineární regresi více než dvou časových řad typu „náhodná procházka“. Metodu Monte Carlo používal ve svých výzkumech i Yule používal metodu Monte Carlo; uvažoval tři odlišné situace: (a) obě řady Yt a Xt jsou generovány procesy IID s nulovou střední hodnotou; (b) řady Yt a Xt jsou generovány jednou integrovanými procesy IID s nulovou střední hodnotou (po první diferenci jsou IID s nulovou střední hodnotou); (c) řady Yt a Xt jsou generovány dvakrát integrovanými procesy IID s nulovou střední hodnotou (po druhé diferenci jsou IID s nulovou střední hodnotou). Simulační studií byly zjištěny následující skutečnosti: Případ (a): Pokud jsou oba regresory typu I(0) a IID, potom korelační koeficient bude mít téměř symetrické rozdělení blízké normálnímu rozdělení s nulovou střední hodnotou. Případ (b): Pokud jsou oba regresory typu I(1) a jejich první diference jsou typu IID, potom rozdělení korelačního koeficientu je blízké symetrickému rozdělení s nulovou střední hodnotou, avšak toto
4
rozdělení má podstatně větší variabilitu a je plošší než rozdělení předešlé. Hodnoty výrazně odlišné od nuly jsou téměř stejně pravděpodobné jako hodnoty blízké nule. Případ (c): Pokud jsou oba regresory typu I(2) a jejich druhé diference jsou typu IID, rozdělení korelačního koeficientu má tvar U, kdy nejpravděpodobnější jsou hodnoty -1 a 1. Nejméně pravděpodobná je nulová hodnota. Simulačně byly zkoumány i vztahy různě integrovaných regresorů. Bylo zjištěno, že problémy se neomezují pouze na stejně integrované regresory. Pokud jsou regresory typu I(2) a I(1), rozdělení korelačního koeficientu má tvar U, který podobný, jako když jsou oba regresory typu I(2). Když je např. závisle proměnná typu I(2) a nezávisle proměnná typu I(1), není rozdělení odhadu regresního koeficientu normální, je výrazně špičaté, což zásadně mění standardní vypovídací schopnost t-testu. Menší problémy vznikají, je-li jeden z regresorů typu I(0). Rozdělení korelačního koeficientu se potom blíží rozdělení této statistiky při obou regresorech typu I(0). Phillips (1986) ukázal, že Durbin-Watsonova (dále DW) statistika počítaná na základě reziduí modelu (2.3) při rozsahu výběru rostoucím do nekonečna konverguje k nule. Při pravé regresi (mezi proměnnými existuje skutečná závislost) statistika DW konverguje k nenulové hodnotě. Statistiku DW by bylo tedy možné použít k odlišení zdánlivé a pravé regrese. Bylo však prokázáno, že test založený na této statistice je pro malé výběry slabý. Granger a Newbold (1974) při odhalování zdánlivé regrese vycházeli ze vztahu indexu korelace a statistiky DW. Navrhli považovat regresi, ve které R2 > DW za pravděpodobně zdánlivou, neboť tento vztah může znamenat, že rezidua mají nestacionární charakter. Příklad 3 Na základě procesů (3.1) a (3.2) s σε2 = σv2= 1 byly generovány časové řady Yt a Xt, o délce 150 hodnot, které jsou zachyceny na obrázku 3a). Obrázek 3a)
Tyto časové řady jsou nezávislé a vzhledem k tomu, že byly generovány procesem náhodné procházky, jsou nestacionární, obě vykazují trend. Z obrázku je také patrné, že je možné vysledovat v jejich průběhu jisté podobnosti. Metodou nejmenších čtverců odhadneme parametry přímky (3.4) Yt = 2,9509 + 1,0066 Xt. Pomocí t-testů zjistíme, že oba parametry jsou statisticky významné (na 5% hladině významnosti). Na základě F-testu zjistíme, že použitý lineární model je vhodný pro zachycení vztahu mezi těmito časovými řadami (na 5% hladině významnosti). Index determinace je R2 = 0,5423. Durbin-Watsonův test však indikuje silnou autokorelaci reziduí (DW = 0,2459). Protože je index determinace vyšší, než hodnota Durbin-Watsonovy statistiky, můžeme konstatovat, že mezi časovými řadami je vztah zvaný zdánlivá regrese. Tato skutečnost je také zřejmá z obr. 3b), na kterém je zachycena časová řada reziduí a z obr. 3c), na kterém je jejich autokorelační (ACF) a parciální autokorelační funkce (PACF). První hodnoty obou funkcí jsou blízké jedné, takže rezidua jsou pravděpodobně typu I(1).
5
Obrázek 3b)
Obrázek 3c)
Obdobné výsledky lze získat i v případě, že generující procesy (3.1) a (3.2) obsahují konstanty. Příklad 4 Máme měsíční časové řady indexu cen průmyslových výrobců (ICPV) a indexu cen stavební výroby (ICSP) České republiky od února roku 1992 do března roku 1996. Průběh obou časových řad je zachycen na obrázku 4a). Obrázek 4a)
Na první pohled se může zdát, že časové řady obsahují deterministický lineární trend. Jejich důkladnějším prozkoumáním (charakter reziduí modelu s lineárním deterministickým trendem) jsme zjistili, že tomu tak není a že obě řady obsahují stochastický trend a jsou typu I(1).
6
Pokusíme se ověřit, zda časová řada ICPV lineárně závisí na časové řadě ICSP. Metodou nejmenších čtverců odhadneme parametry přímky ICPVt = 49.7762 + 0.5106 ICSPt. (3.5) Pomocí t-testů zjistíme, že jednotlivé parametry jsou statisticky významné (na 5% hladině významnosti), rovněž F-test indikuje, že daný model je vhodný (5% hladina významnosti). To potvrzuje i index determinace R2 = 0.9732. Na obrázku 4b) je zachycen průběh reziduí našeho modelu. Je zřejmé, že vykazují jistý systematický pohyb, takže je možné očekávat, že jsou autokorelovaná. Tuto skutečnost potvrzuje velmi nízká hodnota Durbin-Watsonovy statistiky (DW=0,2793). Protože jsou první hodnoty autokorelační (ACF) a parciální autokorelační funkce (PACF), které jsou zachyceny na obrázku 4c), blízké jedné, lze předpokládat, že rezidua mají charakter I(1), tzn. jsou nestacionární. Index determinace je výrazně vyšší, než hodnota Durbin-Watsonovy statistiky, takže vztah (3.5) je zdánlivou regresí. Obrázek 4b)
Obrázek 4c)
4. Závěr Z výše uvedeného je zřejmé, že zdrojem existence zdánlivé regrese je přítomnost stochastických trendů v generujících procesech časových řad obsažených v regresním modelu. Může ovšem nastat následující situace: Předpokládejme dva generující procesy Yt = ARt + εt, Zt = Rt + vt, kde {Rt} ∼ I(1), {εt} ∼ I(0), {vt} ∼ I(0), {Yt} ∼ I(1) a {Zt} ∼ I(1). Potom existuje lineární kombinace ut = Yt - AZt = εt - Avt.
7
Tato lineární kombinace je stacionární proto, že existuje společný faktor (stochastický trend) v obou nestacionárních procesech. Takové procesy se označují jako kointegrované. Je zřejmé, že o pravé regresi časových řad typu I(1) můžeme hovořit pouze za předpokladu, že jejich generující procesy jsou kointegrované. Problematika kointegrovaných procesů začala být důkladně zpracovávána na přelomu 80. a 90. let a dá se říci, že výrazně změnila charakter ekonometrické analýzy časových řad. Literatura Banerjee, A.-Dolado, J.J.-Galbraith, J.W.-Hendry, D.F.: Cointegration, Error Correction and the Econometric Analysis of Non-stationary Data, Oxford University Press 1993. Cipra, T.: Analýza časových řad s aplikacemi v ekonomii, SNTL/ALFA, Praha 1986. Granger, C. W. J.-Newbold, P.: Spurious Regression in Econometrics, Journal of Econometrics, 1974, 2, 111-120. Kozák, J.-Hindls, R.-Arlt, J.: Úvod do analýzy ekonomických časových řad, VŠE Praha 1994. Phillips, P. C. B.: Understanding Spurious Regressions in Econometrics, Journal of Econometrics, 1986, 33, 311340. Statistické přehledy, ČSÚ Praha.
8