Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod do analýzy časových řad Přednáška STATISTIKA II - EKONOMETRIE
Jiří Neubauer Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:
[email protected]
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod Posloupnost náhodných veličin {Yt , t = 0, ±1, ±2 . . . } se nazývá stochastický proces. Pomocí něho budeme modelovat pozorované časové řady. Střední hodnota stochastického procesu {Yt } je funkce µt daná vztahem µt = E (Yt ), t == 0, ±1, ±2 . . . . Autokovarianční funkce je definována jako γt,s = C (Yt , Ys ),
t, s = 0, ±1, ±2 . . . ,
kde C (Yt , Ys ) = E [(Yt − µt )(Ys − µs )] = E [Yt , Ys ] − µt µs . Autokorelační funkce je dána vztahem γt,s C (Yt , Ys ) =√ . ρt,s = p γ D(Yt )D(Ys ) t,t γs,s
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod
Jestliže funkce γs,t závisí na svých argumentech pouze prostřednictvím jejich rozdílů k = s − t, pak říkáme, že proces je kovariančně stacionární. Autokovarianční funkcí takového procesu budeme rozumět funkci jedné proměnné γk = γs−t = γs,t . Je-li navíc střední hodnota procesu µt konstantní pro všechna t (µt = µ), proces {Yt } označujeme za slabě stacionární. V dalším budeme místo slabě stacionární proces psát jen krátce proces stacionární.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod
Autokovarianční funkce stacionárního stochastického procesu je definována jako γk = C (Yt , Yt−k ) = E [(Yt − µ)(Yt−k − µ)], a autokorelační funkce (ACF) je dána vztahem ρk = p
C (Yt , Yt−k ) D(Yt )D(Yt−k )
Jiří Neubauer
=
γk . γ0
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod
Korelace mezi dvěma náhodnými veličinami je často způsobena tím, že obě veličiny jsou korelovány s veličinou třetí. Parciální autokorelace podávají informaci o korelaci veličin Yt a Yt−k očištěnou o vliv veličin ležících mezi nimi. Parciální autokorelaci se zpožděním k vyjadřuje parciální regresní koeficient φkk v autoregresi k-tého řádu Yt = φk1 Yt−1 + φk2 Yt−2 + · · · + φkk Yt−k + et , kde et je veličina nekorelovaná s Yt−j , j ≥ 1. Je to funkce zpoždění k a nazývá se parciální autokorelační funkce (PACF).
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod Po vynásobení obou stran předchozí rovnice veličinou Yt−1 má střední hodnota této rovnice tvar γj = φk1 γj−1 + φk2 γj−2 + · · · + φkk γj−k , takže platí ρj = φk1 ρj−1 + φk2 ρj−2 + · · · + φkk ρj−k . Pro j = 1, 2, . . . , k potom dostáváme ρ1 = φk1 ρ0 + φk2 ρ1 + · · · + φkk ρk−1 ρ2 = φk1 ρ1 + φk2 ρ0 + · · · + φkk ρk−2 ··· ρk = φk1 ρk−1 + φk2 ρk−2 + · · · + φkk ρ0 .
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod Řešením této soustavy (Cramerovým pravidlem) pro k postupně dostáváme φ =ρ , 11 1 1 ρ1 ρ1 ρ2 ρ − ρ21 = 2 , φ22 = 1 − ρ21 1 ρ1 ρ1 1 1 ρ1 ρ2 · · · ρk−2 ρ1 1 ρ · · · ρk−3 1 .. .. .. .. .. . . . . . ρk−1 ρk−2 ρk−3 · · · ρ1 φkk = 1 ρ1 ρ2 · · · ρk−2 ρ1 1 ρ1 · · · ρk−3 .. .. .. .. .. . . . . . ρk−1 ρk−2 ρk−3 · · · ρ1 Jiří Neubauer
= 1, 2, . . .
ρ1 ρ2 .. . ρk ρk−1 ρk−2 .. . 1
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod Obecně jsou parametry µ, γ0 a ρk neznámé, za předpokladu stacionarity použijeme odhady µ ˆ=Y =
T T 1 X 1 X Yt , γˆ0 = (Yt − Y )2 . T t=1 T t=1
kde T je počet hodnot (délka) časové řady. Odhad ρk je dán výběrovou autokorelací PT (Yt − Yt )(Yt−k − Yt ) ρˆk = t=k+1PT , k = 1, 2, . . . , T − 1. 2 t=1 (Yt − Y ) (V programu R lze spočítat pomocí funkce acf)
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod
Výběrovou parciální korelační funkci získáme nahrazením ρi jejím odhadem ρˆi v odpovídajícím vzorci. Byl však odvozen rekurzivní vztah, který výpočet zjednoduší φˆkk =
Pk−1
ˆ ˆk−j j=1 φk−1 ρ , Pk−1 ˆ 1 − j=1 φk−1 ρˆj
ρˆk −
φˆkj = φˆk−1 − φˆkk φˆk−1k−j ,
j = 1, 2, . . . , k − 1.
(V programu R lze spočítat pomocí funkce pacf)
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Úvod
Důležitý stacionárním stochastickým procesem je tzv. proces bílého šumu. Jedná se o posloupnost nezávislých náhodných veličin se stejným rozdělením s nulovou střední hodnotou a konstantním rozptylem. Pro bílý {t } platí ( 1 k =0 ρk = 0 k 6= 0 ( 1 k =0 φkk = 0 k 6= 0 Gaussovský bílý šum – posloupnost nezávislých náhodných veličin s rozdělením N(0, σ2t ).
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Klouzavé průměry
Dekompozice časových řad Základem klasické analýzy časové řady Yt je její rozklad na trend Tt , sezónní složku St a složku reziduální (zbytkovou, náhodnou) et . V aditivním modelu má dekompozice tvar Yt = Tt + St + et , v multiplikativním modelu potom tvar Yt = Tt · St · et . Obvyklou metodou, jak získat trend je využití lineárních filtrů Tt =
∞ X
λi Yt+i .
i=−∞
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Klouzavé průměry
Klouzavé průměry Jednoduchým příkladem lineárních filtrů jsou klouzavé průměry s konstantními váhami Tt =
a X 1 Yt+i . 2a + 1 i=−a
Vyrovnanou hodnotu časové řady v čase τ získáme jako průměr hodnot {yτ −a , . . . , yτ , . . . , yτ +a }. Například pro a = 2, 12 a 40 dostáváme a = 2, λi = { 51 , 51 , 15 , 15 , 15 } 1 1 a = 12,λi = { , . . . , } | 25 {z 25 } 25 krát
1 1 a = 40,λi = { , . . . , } | 81 {z 81 } 81 krát
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Klouzavé průměry
Dekompozice časových řad
Klouzavé průměry (v R je možné je počítat pomocí funkce filter) jsou základem klasické dekompozice, kterou v programu R provádí funkce decompose. Poněkud sofistikovanější metodu dekompozice nabízí funkce stl. Dekompozici časové řady lze také provádět pomocí lineární regrese (funkce lm – viz regresní analýza). Mimo trendu (lineárního, kvadratického atd.) je často vhodné do regresního modelu přidat buď sezónní složky, nebo periodické funkce s vhodnými periodami.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Exponenciální vyrovnávání Chceme-li predikovat (předpovídat) hodnotu časové řady v čase t = τ , je přirozené vzít v úvahu předcházející hodnoty a onu predikci určit jako vážený součet předchozích pozorování. yˆt=τ = λ0 yτ + λ1 yτ −1 + λ2 yτ −2 + · · · . zdá se být rozumné dát nedávným pozorováním větší váhu než pozorováním v čase hodně vzdáleným. Jedna z možností je použití následujících vah λi = α(1 − α)i , 0 < α < 1, potom yˆt=τ = αyτ + (1 − α)yτ −1 + (1 − α)2 yτ −2 + · · · .
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Exponenciální vyrovnávání
Exponenciální vyrovnávání (název pochází z faktu, že váhy klesají exponenciálně) v tomto základním tvaru může být použito pouze pro časové řady bez trendu a sezónní složky. Zobecněním uvedené procedury je tzv. Holt-Wintersovo vyrovnávání, které již uvažuje i trend a sezónní složku. Obsahuje tři parametry: α pro úroveň, β pro trend a γ pro sezónní složku (funkce HoltWinters).
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Autoregresní model řádu 1 – AR(1) Model je dán rovnicí Yt = φ1 Yt−1 + t , kde φ1 je reálné číslo a {t } je bílý šum. Pomocí operátoru zpětného posunutí B, pro který platí BYt = Yt−1 , B 2 Yt = Yt−2 a obecně B s Yt = Yt−s , můžeme model zapsat ve tvaru (1 − φ1 B)Yt = t . Za podmínky |φ1 | < 1 jej lze vyjádřit ve formě Yt = (1−φ1 B)−1 t = (1+φ1 B+φ21 B 2 +· · · )t = t +φ1 t−1 +φ21 t−2 +· · · , což je tzv. stacionární lineární proces.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Model AR(1) Autokorelační funkce AR(1) procesu je rovna ρk = φk1 ,
k = 0, 1, 2, . . . .
Jestliže φ1 > 0, hodnoty ACF klesají exponenciálně k nule, jestliže φ1 < 0, hodnoty klesají k nule oscilačně. Pokles hodnot ACF je pomalý, blíží-li se φ k hodnotám +1 nebo −1. Parciální autokorelační funkce AR(1) procesu je rovna ( ρ1 = φ1 k = 1, φkk = 0 k ≥ 2.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Autoregresní model řádu p – AR(p)
Model je dán rovnicí Yt = φ1 Yt−1 + · · · + φp Yt−p t , pomocí operátoru zpětného posunutí (1 − φ1 B − · · · − φp B p )Yt = t ,
tj. φp (B)Yt = t ,
kde φp (B) = (1 − φ1 B − · · · − φp B p ). Za podmínky stacionarity lze proces AR(1) vyjádřit ve tvaru lineárního procesu. Tato podmínka je splněna, leží-li kořeny polynomiální rovnice (1 − φ1 B − · · · − φp B p ) = 0 vně jednotkového kruhu.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Model AR(p)
Hodnoty ACF tvoří kombinace exponenciálně klesajících pohybů (v případě reálných kořenů polynomiální rovnice) a exponenciálně klesajících sinusoidních pohybů (v případě komplexních kořenů). Hodnoty PACF pro zpoždění k = 1, 2, . . . , p jsou různé od nuly, pro další hodnoty jsou potom rovny nule.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Proces klouzavých průměrů řádu 1 – MA(1)
Model je dán vztahem Yt = t + θ1 t−1 ,
neboli
Yt = (1 + θ1 B)t .
Tento model, stejně jako všechny MA modely, je stacionární. Je-li možné MA proces vyjádřit ve formě konvergující AR(∞), tj. P∞ (1 + π1 B + π2 B 2 + · · · )Yt = t , kde j=1 < ∞, potom se označuje jako invertibilní.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Proces MA(1)
Hodnoty ACF procesu MA(1) jsou dány vztahem ( θ1 k = 1, 2 . ρk = 1+θ1 0 k > 1. Pozn.: Stejnou ACF mají vždy dva MA(1) procesy, s parametrem θ1 a 1/θ1 . Je-li |θ1 | < 1, potom |1/θ1 | > 1 a tento proces není invertibilní. Hodnoty PACF pro θ1 < 0 přibližují se exponenciálně k nule. Jestliže θ1 > 0, oscilují s klesající amplitudou.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Proces klouzavých průměrů řádu q – MA(q) Model je dán vztahem Yt = t + θ1 t−1 + · · · + θq t−q ,
neboli
Yt = (1 + θ1 B + · · · + θq B q )t .
Proces je invertibilní, leží-li kořeny polynomiální rovnice (1 + θ1 B + · · · + θq B q = 0) vně jednotkového kruhu. ACF má tvar ( θk +θ1 θk+1 +···+θq−k θk k = 1, 2, . . . , q, 1+θ12 +···+θq2 ρk = 0 k > q. Hodnoty PACF tvoří kombinace exponenciálně klesajících pohybů (v případě reálných kořenů polynomiální rovnice) a exponenciálně klesajících sinusoidních pohybů (v případě komplexních kořenů).
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Smíšený proces ARMA(1,1)
Nejjednodušší smíšený proces má tvar Yt = φ1 Yt−1 + t + θ1 t−1 ,
tj. (1 − φ1 B)Yt = (1 + θ1 B)t .
ACF je podobná ACF procesu AR(1), je charakteristická exponenciálně klesajícími (příp. oscilujícími) hodnotami. Exponenciální pokles začíná od hodnoty ρ1 , na rozdíl od procesu AR(1),kde začínal již od hodnoty ρ0 = 1. Tvar PACF je podobný jako u procesu MA(1). Po počáteční hodnotě φ11 = ρ1 je tato funkce charakteristická exponenciálním (resp. oscilujícím) poklesem.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Smíšený proces ARMA(p, q)
Rovnice modelu je Yt = φ1 Yt−1 + · · · + φp Yt−p t + θ1 t−1 + · · · + θq t−q (1 − φ1 B − · · · − φp B p )Yt = (1 + θ1 B + · · · + θq B q )t . ACF je podobná ACF procesu AR(p), je charakteristická exponenciálně klesajícími (příp. oscilujícími) hodnotami. Tento tvar však bude následovat až po prvních q − p hodnotách (pro q > p). Hodnoty ρ0 , ρ1 , . . . , ρq−p tento tvar mít nebudou. Pro k > p − q a p > q se PACF bude chovat stejně jako procesu MA(q). Pro k ≤ p − q je však tento tvar odlišný.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Proces náhodné procházky – Random Walk Process
Proces Yt = Yt−1 + t je označuje jako proces náhodné procházky. Pomocí operátoru zpětného posunutí lze vyjádřit jako (1 − B)Yt = t . ACF tohoto procesu klesá pomalu, PACF hodnotu φ11 = 1, ostatní hodnoty jsou nulové.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Procesy ARIMA
Diferenci ∆Yt = Yt − Yt−1 lze pomocí operátoru zpětného posunutí zapsat jako ∆Yt = Yt − Yt−1 = Yt − BYt = (1 − B)Yt . Pro diferenci 2. řádu ∆2 Yt = ∆(Yt − Yt−1 ) = ∆Yt − ∆Yt−1 = Yt − Yt−1 − (Yt−1 − Yt−2 ) = Yt − 2Yt−1 + Yt−2 lze pomocí operátoru zpětného posunutí zapsat jako ∆2 Yt = (1 − B)2 Yt . Diferencování časové řady v R-ku provedeme funkcí diff.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Procesy ARIMA
Pro některý procesy platí, že po transformaci pomocí diference řádu d, je lze popsat jako proces ARMA(p, q). Takový model označujeme jako model ARIMA(p, d, q) (1 − φ1 B − · · · − φp B p )∆d Yt = (1 + θ1 B + · · · + θq B q )t , (1 − φ1 B − · · · − φp B p )(1 − B)d Yt = (1 + θ1 B + · · · + θq B q )t . Odhady parametrů ARIMA modelů získáme v R-ku pomocí funkce arima, základní diagnostiku vhodnosti modelu dává funkce tsdiag, předpovědi určíme s využitím funkce predict.
Jiří Neubauer
Úvod do analýzy časových řad
Úvod Dekompozice časových řad Exponenciální vyrovnávání Modely ARIMA
Modely AR, MA a ARMA Modely ARIMA
Procesy ARIMA Některá kritéria pro volbu modelu (hledá se model s nejmenší hodnotou kritéria) Akaikeho kritérium AIC: AIC = ln σ ˆ2 + 2M/T , kde M = p + q, σ ˆ2 je reziduální rozptyl a T je počet pozorování (počet reziduí). Schwartzovo kritérium SC: SC = ln σ ˆ2 +
2MT . 1 − (M + 1)/T
Hannanovo-Quinnova kritérium HQ: HQ = ln σ ˆ2 + 2M(ln(ln T ))/T . Jiří Neubauer
Úvod do analýzy časových řad