Stochastický proces Trend Dekompozice časových řad
Časové řady, typy trendových funkcí a odhady trendů Statistika II
Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:
[email protected]
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Stochastický proces
Posloupnost náhodných veličin {Yt , t = 0, ±1, ±2 . . . } se nazývá stochastický proces. Pomocí něho budeme modelovat pozorované časové řady. Střední hodnota stochastického procesu {Yt } je funkce µt daná vztahem µt = E (Yt ),
t = 0, ±1, ±2 . . . .
Autokovarianční funkce je definována jako γt,s = C (Yt , Ys ),
t, s = 0, ±1, ±2 . . . ,
kde C (Yt , Ys ) = E [(Yt − µt )(Ys − µs )] = E [Yt Ys ] − µt µs . Autokorelační funkce je dána vztahem C (Yt , Ys ) γt,s ρt,s = p = √ . γ t,t γs,s D(Yt )D(Ys )
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Stacionarita
Jedním z důležitých vlastností stochastických procesů je stacionarita, což znamená, že pravděpodobnostní rozdělení, které řídí chování stochastického procesu je v čase neměnné, proces je ve „statistickém ekvilibriuÿ. O procesu {Yt } řekneme, že je striktně stacionární, jestliže simultánní rozdělení Yt1 , Yt2 , . . . , Ytn je stejné jako simultánní rozdělení Yt1 −k , Yt2 −k , . . . , Ytn −k pro všechna t a všechna možná zpoždění k. Jestliže funkce γs,t závisí na svých argumentech pouze prostřednictvím jejich rozdílů k = s − t, pak říkáme, že proces je kovariančně stacionární. Autokovarianční funkcí takového procesu budeme rozumět funkci jedné proměnné γk = γs−t = γs,t . Je-li navíc střední hodnota procesu µt konstantní pro všechna t (µt = µ), proces {Yt } označujeme za slabě stacionární. V dalším budeme místo slabě stacionární proces psát jen krátce proces stacionární.
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Stacionarita – autokovarianční a autokorelační funkce
Autokovarianční funkce γk stacionárního stochastického procesu je definována jako γk = C (Yt , Yt−k ) = E [(Yt − µ)(Yt−k − µ)], a autokorelační funkce (ACF) ρk je dána vztahem ρk = p
C (Yt , Yt−k ) γk . = γ0 D(Yt )D(Yt−k )
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Parciální autokorelační funkce
Korelace mezi dvěma náhodnými veličinami je často způsobena tím, že obě veličiny jsou korelovány s veličinou třetí. Parciální autokorelace podávají informaci o korelaci veličin Yt a Yt−k očištěnou o vliv veličin ležících mezi nimi. Parciální autokorelaci se zpožděním k stacionárního procesu {Yt } vyjadřuje parciální regresní koeficient φkk v autoregresi k-tého řádu Yt = φk1 Yt−1 + φk2 Yt−2 + · · · + φkk Yt−k + et , kde et je veličina nekorelovaná s Yt−j , j ≥ 1. Je to funkce zpoždění k a nazývá se parciální autokorelační funkce (PACF) ρkk .
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Parciální autokorelační funkce Předpokládejme, že stacionární proces {Yt } má nulovou střední hodnotu. Po vynásobení obou stran předchozí rovnice veličinou Yt−j má střední hodnota této rovnice tvar γj = φk1 γj−1 + φk2 γj−2 + · · · + φkk γj−k , takže platí ρj = φk1 ρj−1 + φk2 ρj−2 + · · · + φkk ρj−k . Pro j = 1, 2, . . . , k potom dostáváme ρ1 = φk1 ρ0 + φk2 ρ1 + · · · + φkk ρk−1 ρ2 = φk1 ρ1 + φk2 ρ0 + · · · + φkk ρk−2 ··· ρk = φk1 ρk−1 + φk2 ρk−2 + · · · + φkk ρ0 . Tyto rovnice se nazývají Yule-Walkerovy rovnice.
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Parciální autokorelační funkce Řešením této soustavy (Cramerovým pravidlem) pro k = 1, 2, . . . postupně dostáváme ρ11 = φ11 = ρ1 , 1 ρ1 ρ 1 ρ 2 ρ2 − ρ21 ρ22 = φ22 = , = 1 ρ1 1 − ρ21 ρ 1 1 1 ρ1 ρ2 · · · ρk−2 ρ1 ρ1 1 ρ1 · · · ρk−3 ρ2 . . . .. .. .. .. .. .. . . . ρk−1 ρk−2 ρk−3 · · · ρ1 ρk ρkk = φkk = 1 ρ1 ρ2 · · · ρk−2 ρk−1 ρ1 1 ρ1 · · · ρk−3 ρk−2 . . . .. .. .. .. .. .. . . . ρk−1 ρk−2 ρk−3 · · · ρ1 1 Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Odhady
Obecně jsou parametry µ, γ0 a ρk neznámé, za předpokladu stacionarity použijeme odhady µ b=Y =
n n 1X 1X Yt , γ b0 = (Yt − Y )2 . n t=1 n t=1
kde n je počet hodnot (délka) časové řady. Odhad ρk je dán výběrovou autokorelací Pn t=k+1 (Yt − Yt )(Yt−k − Yt ) , k = 1, 2, . . . , n − 1. ρbk = Pn 2 t=1 (Yt − Y ) (V programu R lze spočítat pomocí funkce acf)
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Odhady
Výběrovou parciální korelační funkci získáme nahrazením ρi jejím odhadem ρˆi v odpovídajícím vzorci. Byl však odvozen rekurzivní vztah, který výpočet zjednoduší ρb11 = ρb1 ρbkk =
ρˆk −
Pk−1
bk−1,j ρbk−j j=1 ρ , Pk−1 1 − j=1 ρbk−1,j ρbj
ρbkj = ρbk−1,j − ρbkk ρbk−1,k−j ,
j = 1, 2, . . . , k − 1.
(V programu R lze spočítat pomocí funkce pacf)
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Proces bílého šumu – white noise
Důležitý stacionárním stochastickým procesem je tzv. proces bílého šumu. Jedná se o posloupnost nezávislých náhodných veličin se stejným rozdělením s nulovou střední hodnotou a konstantním rozptylem. Pro bílý {t } platí ( 1 k=0 ρk = 0 k 6= 0 ρkk
( 1 = 0
k=0 k 6= 0
Gaussovský bílý šum – posloupnost nezávislých náhodných veličin s rozdělením N(0, σ2t ).
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Deterministický trend
Např. proces Yt = Y0 + at, t = 1, . . . n obsahuje deterministický lineární trend. Y0 označuje počáteční hodnotu. Pro n = 100, Y0 = 0, a = 1 proces zobrazený v grafu.
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Stochastický trend
Např. proces („náhodná procházkaÿ nebo „random walkÿ) Yt = Yt−1 + t , t = 1, . . . n, kde t ∼ WN(0, σ 2 ) lze psát ve tvaru Yt = Yt−1 + t = (Yt−2 + t−1 ) + t = = (Yt−3 + t−2 ) + t−1 + t = · · · = = Y0 + 1 + · · · + t = Y0 +
t X
i
i=1
Y0 značí počáteční hodnotu. Dvě z možných realizací procesu (simulací) pro n = 100, Y0 = 0, t ∼ WN(0, 1) jsou zobrazeny v grafech.
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Stochastický trend Např. proces („náhodná procházkaÿ s driftem) Yt = Yt−1 + a + t , t = 1, . . . n, kde t ∼ WN(0, σ 2 ) lze psát ve tvaru Yt = Yt−1 + a + t = (Yt−2 + a + t−1 ) + a + t = (Yt−3 + a + t−2 ) + 2a + t−1 + t = · · · = = Y0 + at +
t X
i
i=1
Y0 značí počáteční hodnotu. Jedna z možných realizací procesu (simulace) pro n = 100, Y0 = 0, t ∼ WN(0, 1) je zobrazena v grafu.
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Dekompozice časových řad
Základem klasické analýzy časové řady Yt je její rozklad na trend Tt , sezónní složku St a složku reziduální (zbytkovou, náhodnou) et . V aditivním modelu má dekompozice tvar Yt = Tt + St + et , v multiplikativním modelu potom tvar Yt = Tt · St · et . Obvyklou metodou, jak získat trend je využití lineárních filtrů Tt =
∞ X
λi Yt+i .
i=−∞
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Klouzavé průměry
Jednoduchým příkladem lineárních filtrů jsou klouzavé průměry délky 2m + 1 s konstantními váhami m X 1 ˆt = T Yt+i . 2m + 1 i=−m Vyrovnanou hodnotu časové řady v čase t získáme jako průměr hodnot Yt−m , . . . , Yt−1 , Yt , Yt+1 . . . , Yt+m . Například pro m = 1 dostáváme klouzavý průměr délky 3 ˆt = 1 (Yt−1 + Yt + Yt+1 ). T 3 V programu R lze klouzavé průměry určit pomocí funkce filter nebo funkce ma z balíčku forecast.
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Klouzavé průměry Graf zobrazuje obsahuje měsíční produkci piva v Austrálii od ledna 1956 do srpna 1995
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Klouzavé průměry Grafy zobrazují klouzavé průměry délky 5 (a = 2), 25 (a = 12), 81 (a = 20).
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Klouzavé průměry Délka filtru ovlivňuje stupeň vyhlazení. Čím větší je délka klouzavého průměru, tím větší je vyhlazení časové řady. Délku klouzavého průměru obvykle volíme tak, aby odpovídala periodě sezónních nebo cyklických fluktuací. Při zpracování ekonomických časových řad se často zpracováváme čtvrtletní případně měsíční údaje, jež často obsahují sezónní složku opakující po sudém počtu pozorování (po čtyřech příp. dvanácti hodnotách). Pro tyto případy lze použít tzv. centrované klouzavé průměry. Pro případ čtvrtletních měření určíme vyrovnanou hodnotu ze vztahu 1 1 1 ˆ Tt = (Yt−2 + Yt−1 + Yt + Yt+1 ) + (Yt−1 + Yt + Yt+1 + Yt+2 ) = 2 4 4 1 = (Yt−2 + 2Yt−1 + 2Yt + 2Yt+1 + Yt+2 ) . 8 Jedná je o klouzavý průměr délky 5 s váhami 81 , 41 , 14 , 41 , 18 . Analogicky pro měsíční použijeme klouzavé průměry délky 13 typu ˆt = 1 (Yt−6 + 2Yt−5 + · · · + 2Yt+5 + Yt+6 ) . T 24 Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Dekompozice časových řad
Klouzavé průměry (v R je možné je počítat pomocí funkce filter) jsou základem klasické dekompozice, kterou v programu R provádí funkce decompose. Poněkud sofistikovanější metodu dekompozice nabízí funkce stl. Dekompozici časové řady lze také provádět pomocí lineární regrese (funkce lm – viz regresní analýza). Mimo trendu (lineárního, kvadratického atd.) je často vhodné do regresního modelu přidat buď sezónní složky, nebo periodické funkce s vhodnými periodami.
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Použití regresní analýzy Na obrázku je znázorněn vývoj hrubé měsíční mzdy v ČR v období 2000–2012, jedná se o čtvrtletní data.
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Použití regresní analýzy Trend odhadneme pomocí přímkové regrese, pro numerickou stabilitu výpočtu provedeme transformaci časové proměnné t = rok − 1999, takže t = 1 . . . , 13. konstanta t
Odhad 11875,9388 1051,1374
Sm. chyba 286,5841 34,6343
Jiří Neubauer
t-test 41,44 30,35
p-hodnota 0,0000 0,0000
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Použití regresní analýzy
Periodickou složku odhadneme pomocí „dummyÿ proměnných q1 , q2 , q3 , q4 . Trend potom pomocí polynomu 3. stupně. konstantu do modelu nezahrneme, vznikne vlastně součtem „dummyÿ proměnných q1 , q2 , q3 , q4 . q1 = (1, 0, 0, 0, 1, 0, 0, 0, . . . , 1, 0, 0, 0)0 q2 = (0, 1, 0, 0, 0, 1, 0, 0, . . . , 0, 1, 0, 0)0 q3 = (0, 0, 1, 0, 0, 0, 1, 0, . . . , 0, 0, 1, 0)0 q4 = (0, 0, 0, 1, 0, 0, 0, 1, . . . , 0, 0, 0, 1)0 t t2 t3 q1 q2 q3 q4
Odhad 484,4349 111,4610 −5,7907 11684,2530 12457,0559 12138,0542 13921,6368
Sm. chyba 152,8450 23,3280 1,0430 282,8990 287,3388 291,5674 295,6681
Jiří Neubauer
t-test 3,17 4,78 −5,55 41,30 43,35 41,63 47,09
p-hodnota 0,0027 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Použití regresní analýzy
Jiří Neubauer
Časové řady, typy trendových funkcí a odhady trendů
Stochastický proces Trend Dekompozice časových řad
Klouzavé průměry Regrese
Použití regresní analýzy Vyjdeme-li z uvedeného regresního modelu, dostaneme predikce da rok 2013 spolu s 95% intervaly spolehlivosti 2013, 2013, 2013, 2013,
1. 2. 3. 4.
čtvrtletí čtvrtletí čtvrtletí čtvrtletí
predikce 24423,14 25237,73 24943,50 26734,30
Jiří Neubauer
dolní 24008,05 24777,01 24431,21 26164,51
horní 24838,23 25698,44 25455,79 27304,09
Časové řady, typy trendových funkcí a odhady trendů