Masarykova Univerzita Přírodovědecká fakulta BAKALÁŘSKÁ PRÁCE Karolína Mladá Jednoduché strukturální modely časových řad Vedoucí práce: RNDr. Marie Forbelská, Ph.D. Studijní program: Aplikovaná matematika Studijní obor: Statistika a analýza dat 2010
Poděkování Děkuji paní RNDr. Marii Forbelské, Ph.D. za odborné vedení mé bakalářské práce, čas strávený na konzultacích a za nadhled nad danou problematikou, který mi celou dobu pomáhala udržet.
Prohlašuji, že jsem svou bakalářskou práci napsala samostatně a výhradně s použitím citovaných pramenů. V Brně dne 4.6.2010
Karolína Mladá
Název práce: Jednoduché strukturální modely časových řad Autor: Karolína Mladá Ústav matematiky a statistiky Přírodovědecké fakulty MU Vedoucí bakalářské práce: RNDr. Marie Forbelská, Ph.D. Abstrakt: Tématem bakalářské práce jsou jednoduché strukturální modely časových řad. Práce je rozdělena do čtyř kapitol. První kapitola představuje teoretický základ obsahující pojmy a vztahy používané v dalších částech práce. Druhá kapitola popisuje jednotlivé typy přístupů k analýze časových řad. Třetí kapitola se zaměřuje na vysvětlení dynamického přístupu při modelování časových řad a způsobu jejich zápisu pomocí stavově - prostorových modelů. Ve čtvrté kapitole jsou uvedeny jednoduché strukturální modely časových řad, a to konkrétně modely trendu a sezónní složky. Klíčová slova: časové řady, stavově - prostorové modely, strukturální dynamické modely, trend, sezónnost
Title: Simple structural time series models Author: Karolína Mladá Department of Mathematics and Statistics, Faculty of Science, MU Supervisor: RNDr. Marie Forbelská, Ph.D. Abstract: The theme of the bachelor thesis are the simple structural models of time series. The paper is divided into four chapters. The first one represents the theoretical basis and contains terminology and equations used in the following sections of the thesis. The second chapter describes various ways of analysing time series. The third chapter explains the dynamic way of modeling time series and how to write them using the state - space models. In the fourth chapter are introduced the simple structural models of time series, concretely models with trend and seasonal components. Keywords: time series, state - space models, structural dynamic models, trend, seasonal components
Obsah Úvod
2
1 Základní pojmy z teorie náhodných procesů 1.1 Definice náhodného procesu . . . . . . . . . . . . . . . . . . . . . 1.2 Stochastické procesy druhého řádu . . . . . . . . . . . . . . . . . 1.3 Procesy nestacionární ve střední hodnotě . . . . . . . . . . . . . .
3 3 5 10
2 Analýza časových řad 2.1 Časové řady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Základní přístupy k analýze časových řad . . . . . . . . . . . . . . 2.3 Klasická dekompozice časových řad . . . . . . . . . . . . . . . . .
11 11 11 12
3 Dynamické lineární modely 3.1 Motivační příklad . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Stavově - prostorové modely . . . . . . . . . . . . . . . . . . . . .
13 13 16
4 Jednoduché strukturální modely časových řad 4.1 Trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Sezónnost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17 17 22
Závěr
24
Seznam použité literatury
25
1
Úvod Analýza časových řad je velmi důležitou disciplínou matematické statistiky. Tématem bakalářské práce jsou jednoduché strukturální modely časových řad. Práce je rozdělena do čtyř kapitol. První kapitola představuje teoretický základ obsahující pojmy a vztahy používané v dalších částech práce. Druhá kapitola popisuje jednotlivé typy přístupů k analýze časových řad. Třetí kapitola se zaměřuje na vysvětlení dynamického přístupu při modelování časových řad a způsobu jejich zápisu pomocí stavově - prostorových modelů. Ve čtvrté kapitole jsou uvedeny jednoduché strukturální modely časových řad, a to konkrétně modely trendu a sezónní složky. V prvních třech kapitolách jsem čerpala především ze skript Stochastické modelování jednorozměrných časových řad od RNDr.Forbelské Ph.D, jejích učebních materiálů k předmětu Lineární statistické modely a ze skript Základní statistické metody od RNDr.Budíkové, PhD. Ve čtrvté kapitole jsem vycházela především z druhé kapitoly anglické knihy od A.C.Harveyho Forecasting, structural series and the Kalman filter a knihy Dynamic Linear Models with R od G.Petris, S.Petrone a P.Campagnoli.
2
Kapitola 1 Základní pojmy z teorie náhodných procesů 1.1
Definice náhodného procesu
Definice 1.1.1. Nechť je dán pravděpodobnostní prostor (Ω, A, P ), indexová množina T ⊆ R a reálná funkce Y : Ω × T → R definovaná pro ∀ω ∈ Ω a ∀t ∈ T . Jestliže pro ∀t ∈ T je Y (ω, t) borelovsky měřitelná funkce vzhledem k A (tj. pro ∀B ∈ B a ∀t ∈ T platí Y −1 (B) = {ω ∈ Ω : Y (ω, t) ∈ B} ∈ A, kde B je σ-algebra borelovských podmnožin), pak tuto funkci nazýváme (n- rozměrným) náhodným procesem. Náhodný proces Y (ω, t) při pevném ω ∈ Ω se nazývá realizace (trajektorie) procesu. Pravěpodobnostní míru PY (B) = P (Y −1 (B)) nazýváme rozdělení pravděpodobností náhodného procesu Y (ω, t). Poznámka. Obdobně jako u náhodných veličin, kde místo Y (ω), ω ∈ Ω píšeme pouze Y , u náhodných procesů budeme místo {Y (ω, t), ω ∈ Ω, t ∈ T } psát {Yt , t ∈ T }. Definice 1.1.2. Pokud indexová množina T = Z = 0, ±1, ±2, . . . nebo T ⊂ Z, mluvíme o procesu s diskrétním časem či o náhodné posloupnosti.
3
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ Poznámka. Později budeme u náhodného procesu {Yt , t ∈ T } indexovou množinu T interpretovat jako čas a pokud T = Z, budeme tento proces nazývat pouze časovou řadou. Definice 1.1.3. Pokud indexová množina T = ht1 , t2 i, kde −∞ ≤ t1 ≤ t2 ≤ ∞, říkáme, že Yt , t ∈ T je náhodný proces se spojitým časem. Dvojice (S, S), kde S je množina hodnot náhodných veličin Yt a S je σ-algebra podmnožin S, se nazývá stavový prostor procesu {Yt , t ∈ T }. Pokud náhodné veličiny Yt nabývají pouze diskrétních hodnot, říkáme, že jde o proces s diskrétními stavy. Nabývají-li hodnot z nějakého intervalu, mluvíme o procesu se spojitými stavy. Definice 1.1.4. Nechť T n je množina všech vektorů T n = t = (t1 , . . . , tn )0 : t1 ≤ t2 ≤ · · · ≤ tn ;
ti ∈ T ;
i = 1, . . . , n.
Pak (konečně dimenzionální) distribuční funkcí náhodného procesu rozumíme funkci Ft (y) = Ft1 ,...,tn (y1 , . . . , yn ) = P (Yt1 ≤ y1 , . . . , Ytn ≤ yn ) = PYt ((−∞, y1 >, . . . , (−∞, yn >) pro ∀t = (t1 , . . . , tn )0 ∈ T n a ∀y = (y1 , . . . , yn )0 ∈ Rn .
4
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ
1.2
Stochastické procesy druhého řádu
Definice 1.2.1. Jestliže pro ∀t = (t1 , . . . , tn ) ∈ T n a pro ∀τ = (t1 + h, . . . , tn + h) ∈ T n platí Ft (y) = Ft1 ,...,tn (y1 , . . . , yn ) = Fτ1 ,...,τn (y1 , . . . , yn ) = Fτ (y), pak řekneme, že náhodný proces {Yt , t ∈ T } je striktně stacionární. Rovnost lze interpretovat tak, že základní pravděpodobnostní charakteristiky procesu se nemění přo posunutí v čase. Definice 1.2.2. Existuje-li pro ∀t ∈ T střední hodnota E(Yt ), pak nazýváme funkci µ = E(Yt ) střední hodnotou náhodného procesu. Definice 1.2.3. Jestliže pro ∀t ∈ T platí E(Yt2 ) < ∞, pak náhodný proces {Yt , t ∈ T } nazýváme procesem druhého řádu a říkáme, že náhodný proces má konečné druhé momenty. Definice 1.2.4. Náhodný proces {Yt , t ∈ T } nazýváme stacionární ve střední hodnotě, pokud pro ∀t ∈ T je střední hodnota konstantní, tj. E(Yt ) = µ. Pokud E(Yt ) = 0, nazýváme náhodný proces centrovaným. Definice 1.2.5. Uvažujeme náhodný proces {Yt , t ∈ T }, který má konečné druhé momenty. Pak funkci γ(s, t) = C(Ys , Yt ) = E(Ys − E(Ys ))(Yt − E(Yt )) nazveme autokovarianční funkcí. Poznámka. Tato reálná funkce dvou proměnných dává informaci o lineárním vztahu mezi jakoukoliv dvojicí náhodných veličin Ys a Yt . Definice 1.2.6. Náhodný proces {Yt , t ∈ T } se nazývá kovariančně stacionární, pokud pro ∀t, s ∈ T platí γ(s, t) = γ(0, | s − t |), což budeme také psát ve formě γ(s, t) = γ(s − t), tj.autokovarianční funkce závisí na svých argumentech pouze prostřednictvím jejich rozdílů. 5
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ
Definice 1.2.7. Náhodný proces {Yt , t ∈ T } se nazývá (slabě) stacionární, je-li kovariančně stacionární, tj. γ(s, t) = γ(s − t) pro
∀t, s ∈ T,
a navíc stacionární ve střední hodnotě, tj. E(Yt ) = µ pro
∀t ∈ T.
Poznámka. Přívlastek ”slabě” se většinou vynechává. Lze snadno ukázat, že je-li proces striktně stacionární, je také stacionární. Opačná implikace však neplatí. Definice 1.2.8. Nechť náhodný proces {Yt , t ∈ T } je stacionární. Označme γ(0) = σ 2 a zaveďme funkci %(t) =
γ(t) γ(t) = . 2 σ γ(0)
Tuto funkci nazveme autokorelační funkcí stacionárního náhodného procesu. Nyní definujme náhodné procesy, které budou hrát důležitou roli v aplikacích. Definice 1.2.9. Řekneme, že náhodný proces {εt , t ∈ T } je bílým šumem (White Noise), jestliže εt jsou nekorelované náhodné veličiny s nulovou střední hodnotou, tj. E(εt ) = 0,
D(εt ) = σ 2 ,
C(εt , εs ) = 0
(s 6= t),
značíme εt ∼ W N(0, σ 2 ). Pokud jsou navíc nejen nekorelované, ale i nezávislé, značíme je symbolem IID (independent identical defined), píšeme εt ∼ IID(0, σ 2 ). Poznámka. Bílý šum je nejjednodušší specifikace náhodné fluktuace. Je to posloupnost náhodných nekorelovaných proměnných s konstantní střední hodnotou (v tomto případě 0) a konstantním rozptylem.
6
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ
Věta 1.1. Náhodné procesy εt ∼ W N(0, σ 2 ) a εt ∼ IID(0, σ 2 ) jsou stacionárními náhodnými procesy Důkaz. Zřejmý. Definice 1.2.10. Náhodný proces {Yt , t ∈ T } se nazývá gaussovským (normálním), jestliže pro každé přirozené n a libovolná čísla tj ∈ T, j = 1, . . . , n, je jeho n-rozměrná distribuční funkce Ft1 ,...,tn (y1 , . . . , xn ) distribuční funkcí n-rozměrného normálního rozdělení. Věta 1.2. Gaussův náhodný proces {Yt , t ∈ T } je stacionární, právě když je striktně stacionární. Důkaz. Triviální, plyne z vlastností normálního rozdělení. Definice 1.2.11. Řekneme, že náhodný proces {Yt , t ∈ T } splňuje lineární regresní model, pokud pro jeho střední hodnotu platí ∀t ∈ T : E(Yt ) = µt =
m X
βj fj (t),
j=0
kde f0 , . . . , fm jsou známé funkce definované na T, β= (β0 , . . . , βn )0 je neznámý vektor regresních parametrů. Pro lepší představu o lineárním regresním modelu předpokládejme, že mezi nějakými nenáhodnými veličinami y, x1 , . . . , xk platí lineární vztah y = β1 x1 + . . . + βk xk , ve kterém jsou β1 , . . . , βk neznámými parametry. Informace o těchto parametrech můžeme získávat pomocí experimentu, a to tak, že budeme opakovaně měřit hodnoty veličin y při vybraných hodnotách proměnných x1 , . . . , xk . Při měření však vznikají chyby, což lze modelovat takto Y = β1 x1 + . . . + βk xk + εt , kde εt je náhodná chyba měření. Opakované hodnoty sledovaných veličin se pro i = 1, . . . , n značí Yi , xi1 , . . . , xik . Celkově jsme tedy dostali model Y1 = β1 x11 + . . . + βk x1k + ε1 .. . Yn = β1 xn1 + . . . + βk xnk + εn 7
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ
vyjádřený maticově jako Y1 x11 . . . x1k β1 ε1 .. .. . . .. .. + ... . = . xn1 . . . xnk Yn βk εn | {z } | {z } | {z } | {z } Y
X(matice plánu)
β
ε
Klasickým konkrétním příkladem lineárního modelu je jednoduchá lineární regrese, kde předpokládáme, že nezávislé náhodné veličiny Yi pro (i = 1, . . . , n) mají normální rozdělení Yi ∼ N(µi = β0 + β1 xi , σ 2 ), kde xi jsou dané konstanty, které nejsou všechny stejné. Rozptyly Yi jsou stejné, zatímco střední hodnoty lze vyjádřit jako lineární funkci známých konstant xi pomocí neznámých parametrů β0 a β1 . Y1 .. V tomto případě zapíšeme vektor závisle proměnných ve tvaru Y = . , Yn 1 x1 β0 .. .. matici plánu X = . . , vektor regresních koeficientů β = β1 1 xn ε1 .. a vektor chyb ε = . , přičemž ε ∼ Nn (0, σ 2 I n ). εn Definice 1.2.12. Nechť {Yt , t ∈ Z} je posloupnost náhodných veličin. Operátor zpětného posunutí (backshift operator) je definován pomocí výrazu BYt = Yt−1 , přičemž jej lze aplikovat několikanásobně jako B j Yt = Yt−j
8
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ
Tzv. diferenční operátor zavádíme pomocí vztahu: ∆Yt = Yt − Yt−1 = (1 − B)Yt ∆2 Yt = ∆(∆Yt ) = ∆(Yt − Yt−1 ) = (Yt − Yt−1 ) − (Yt−1 − Yt−2 ) = Yt − 2Yt−1 + Yt−2 = (1 − B)2 Yt .. . ∆d Yt = (1 − B)d Yt . Definice 1.2.13. Definujme ARMA proces řádu p,q vztahem Yt − ϕ1 Yt−1 − . . . − ϕp Yt−p = εt + θ1 εt−1 + . . . + θq εt−q , kde
εt ∼ W N(0, σ 2 ),
přičemž pomocí operátoru zpětného chodu lze psát Yt ∼ ARMA(p, q) : φ(B)Yt = Θ(B)εt , kde φ(B) = 1 − ϕ1 B − . . . − ϕp B p
(ϕ0 ≡ 1)
Θ(B) = 1 + θ1 B + . . . + θq B q
(θ0 ≡ 1).
a Řekneme, že {Yt , t ∈ Z} je ARMA(p,q) se střední hodnotou µ, jestliže {Yt − µ} je ARMA(p,q) proces. Speciální případy ARMA procesů nazýváme: Autoregresní model (AR proces): Yt ∼ AR(p) ∼ ARMA(p, 0), tj. q = 0 Proces klouzavých součtů (MA proces): Yt ∼ MA(q) ∼ ARMA(0, q), tj. p = 0 V reálných situacích se však se stacionárními procesy setkáváme pouze zřídka. Obecně rozlišujeme dva druhy nestacionarity: nestacionaritu ve střední hodnotě a nestacionaritu v rozptylu. Z důvodu dalších aplikací se nyní budeme věnovat pouze případu nestacionarity ve střední hodnotě.
9
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ
1.3
Procesy nestacionární ve střední hodnotě
Nyní je třeba vysvětlit a odlišit pojmy: Deterministický trend, tj. případ, kdy nestacionaritu ve střední hodnotě chápeme jako funkci času. K jeho modelování použijeme například polynomický trend
E(Yt ) = f (t) = β0 + β1 t + . . . + βd td ,
případně periodický trend
E(Yt ) = f (t) = µ +
p X
(αj cos λj t + βj sin λj t)
j=1
Stochastický trend : U ARMA procesů požadujeme, aby všechny kořeny polynomu φ(z) = 1 − ϕ1 z − . . . − ϕp z p ležely vně jednotkové kružnice, tj. aby proces byl kauzální. Pokud však nějaký kořen leží na jednotkové kružnici, mluvíme o procesu nestacionárním se stochastickým trendem. V případě, že kořen leží uvnitř jednotkové kružnice, mluvíme o procesu nestacionárním explozivního typu. Nestacionární proces se stochastickým trendem nazýváme integrovaným smíšeným modelem a značíme ARIMA(p,d,q) Formálně jej zapíšeme pomocí operátoru zpětného chodu takto: ARIMA(p, d, q) : φ(B)(1 − B)d Yt = Θ(B)εt a položíme-li Wt = (1 − B)d Yt , pak Wt je stacionární ARMA(p,q). Poznámka. Velice důležitým ARIMA modelem je náhodná procházka Yt = Yt−1 + εt , kterou značíme také I(1). 10
Kapitola 2 Analýza časových řad 2.1
Časové řady
Pod pojmem časová řada rozumíme realizaci (konečné délky) náhodné posloupnosti. Jde o n-tici hodnot yt1 , . . . , ytn uspořádanou podle přirozené časové posloupnosti t1 , . . . , tn . Od této chvíle budeme uvažovat pouze případy, kdy jsou časové intervaly mezi pozorováními (t1 , t2 ), . . . , (tn−1 , tn ) stejně dlouhé (tj. jsou ekvidistantní) a zápis zjednodušíme na y1 , . . . , yn . Máme-li k dispozici hodnoty určitého ukazatele za více období ve formě časové řady, je nám umožněno rozpoznat určité zákonitosti ve vývoji tohoto ukazatele. Časové řady vznikají v přírodních vědách nebo technice (např.seismický záznam v geofyzice, údaje o průměrných ročních teplotách v klimatologii), v bilogických vědách (četnosti výskytu určitého škůdce v několika po sobě jdoucích letech, v ekonomii (vývoj směnného kurzu) atd.
2.2
Základní přístupy k analýze časových řad
V analýze časových řad se nejčastěji setkáváme s těmito základními přístupy: • Klasická dekompozice časových řad, která je založena na regresní analýze • Neoklasická dekompozice časových řad (tzv. Box-Jenkinsonova metodologie), jejímž základem je korelační analýze • Spektrální analýza časových řad založená na Fourierově analýze 11
KAPITOLA 2. ANALÝZA ČASOVÝCH ŘAD
• Dynamické lineární modely - v praxi se často setkáváme s tím, že hodnoty určité časové řady nejsou jen funkcí času, či předchozích pozorování, ale jsou vysvětlovány pomocí dalších časových řad, kterým říkáme faktorové časové řady a mluvíme o tzv. příčinných (kauzálních, faktorových) modelech, které jsou konstruovány na základě teoretických předpokladů.
2.3
Klasická dekompozice časových řad
Klasická dekompozice časových řad vychází z předpokladu, že náhodný proces, který časovou řadu generuje, je závislý pouze na čase. Samotnou dekompozicí časové řady pak rozumíme rozklad časové řady na deterministickou a náhodnou složku. Deterministická složka se dále rozkládá na trend (T rt ) a sezónní složku (Szt ). Náhodnou složku představují náhodné fluktuace(εt ), které modelují drobné a v jednotlivostech nepostižitelné příčiny kolísání časových řad. Proces εt je bílý šum s nulovou střední hodnotou. Při klasické dekompozici časových řad se používají především tyto modely: Aditivní modely, které lze zapsat rovnicí Yt = T rt + Szt + εt , a multiplikativní modely ve tvaru Yt = T rt · Szt · εt , které se transformují logaritmováním na aditivní modely. Klíčovým nástrojem klasické dekompozice časových řad je regresní analýza, která využívá regresních modelů. Neznámé parametry v těchto modelech bývají odhadovány pomocí metody nejmenších čtverců.
12
Kapitola 3 Dynamické lineární modely Dynamické lineární modely jsou narozdíl od klasické dekompozice časových řad založeny na myšlence, že hodnoty určité časové řady nejsou jen funkcí času či předchozích pozorování, ale jsou ovlivňovány i dalšími faktory.
3.1
Motivační příklad
K lepší představě o myšlence dynamických lineárních modelů nám může posloužit jednoduchý ilustrační příklad. Představme si, že jsme se ocitli na ostrově a snažíme se odhadnout naší vzdálenost od pobřeží. Tuto vzdálenost budeme značit x a je pro nás tedy neznámým stavem. Nejprve předpokládejme, že během tohoto odhadování stojíme stále na stejném místě, což znamená, že x je konstatní. Hrubou představu o naší pozici máme, neboť čas od času máme možnost zahlédnout pobřeží skrze stromy. O naší vzdálenosti od pobřeží se však chceme dozvědět víc, proto provádíme průběžná měření. Tato měření označíme Yt a budeme je modelovat takto: Yt = x + εt ,
εt ∼ N(0, σ 2 ),
t = 0, 1, 2, . . . , n
kde εt a x jsou nezávislá a pro jednoduchost σ 2 je známá konstanta.
13
KAPITOLA 3. DYNAMICKÉ LINEÁRNÍ MODELY
Měření Yt jsou nezávislá a mají stejné normální rozdělení pravděpodobností, tedy Yi ∼ N(x, σ 2 ), kde t = 0, 1, . . . , n 1. Pomocí hvězd odhadneme v čase 0 naši pozici jako Y0 s určitou nepřesností C0 . Na základě dosavadních znalostí známe hustotu pozice x, kterou označíme d 2 p1|0 (x) = p(x | Y0 ), se střední hodnotou x b1|0 = Y0 a rozptylem σ 1|0 = C0 , tedy x ∼ N(Y0 , C0 ). 2. Mraky se rozestoupí a jasněji vidíme hvězdy. Proto upřesníme náš odhad jako Y1 s větší jistotou C1 < C0 . Na základě širších znalostí dostáváme novou hustotu pozice x jako p1|1 (x) = p(x | Y0 , Y1) d 2 se střední hodnotou x b1|1 a rozptylem σ 1|1 .
Tuto střední hodnotu vypočteme jako vážený průměr pozorování Y0 a Y1 , kde váha je o to větší, oč je pozorování přesnější, tj.má menší rozptyl (přitom součet vah je roven 1) x b1|1 =
1 C0 1 C0
+
1 C1
Y0 +
1 C1 1 C0
+
1 C1
Y1 =
C1 C0 Y0 + Y1 = (1−K)Y0 +KY1 C0 + C1 C0 + C1 | {z } | {z } =K
=(1−K)
Pozorování Y0 a Y1 jsou nezávislá, proto rozptyl váženého průměru je roven 2 2 C0 C0 C1 d 2 C0 + C1 = C1 = KC1 = (1−K)C0 σ1|1 = C0 + C1 C0 + C1 C0 + C1 d 2 tj. σ 1|1 < C1
Celkově tedy dostaneme tyto rekurentní vztahy: x b1|1 = x b1|0 + K(Y1 − x b1|0 )
a
d 2 d 2 σ 1|1 = (1 − K)σ1|0
Tedy x b1|1 jsme získali jako nejlepší odhad v čase 0, x b1|0 , opravený 0 předpovědní chybou (Y1 − x b1|0 ) a vážený faktorem K = C0C+C . 1 Využili jsme tedy informace z prvního i druhého měření. 14
KAPITOLA 3. DYNAMICKÉ LINEÁRNÍ MODELY
3. Nyní náš příklad zdynamizujeme (rozpohybujeme). • Představme si, že v čase 2 se začneme pohybovat, tzn.vzdálenost x už není konstantní, ale mění se v čase. Tuto změnu mezi dvěma měřeními můžeme modelovat jako1 : kde wt ∼ N(0, σw2 ),
xt = xt−1 + ν + wt ,
(3.1)
a kde ν je známá rychlost našeho pohybu a wt náhodná chyba se střední hodnotou 0 a známou nepřesností σw2 . Před tím, než provedeme další měření (v čase 2), uděláme predikci x b2|1 = F1 x b1|1 na základě informací, které zatím známe, tzn. na základě předchozího stavu x b1|1 a dynamického modelu d 2 (nějaké funkce přechodu F1 ) s určitou dávkou nepřesnosti σ 2|1 .
• Nyní provedeme další měření polohy, tj. Y2 s nepřesností C2 . 4. Všechny předchozí informace shrneme do odhadu polohy x b2|2 = x b2|1 +K(Y2 −b x2|1 )
s vahou K =
d 2 d 2 σ 2|2 = (1 − K)σ2|1
1
d 2 σ 2|1
d 2 σ 2|1 + C2
(též tzv. Kalmanův zisk)
K rovnici (3.1) můžeme dojít z jednoduchého dynamického modelu dx = dt
ν |{z}
konstantnní posun
+
náhodná složka
resp.rovnice xti = xti−1 + ν(ti − ti−1 ) + wti (ti − ti−1 ), kde bereme jednotkové časové intervaly, tzn.(ti − ti−1 ) = 1
15
w |{z}
KAPITOLA 3. DYNAMICKÉ LINEÁRNÍ MODELY
3.2
Stavově - prostorové modely
Stavově - prostorové modely jsou způsobem, jak pohodlně sestavit formální zápis lineárních dynamických modelů. Místo jednorozměrné náhodné posloupnosti {Yt , t ∈ Z} uvažujme posloupnost w-rozměrných náhodných vektorů {Yt , t ∈ Z}, Yt ∈ Rw , které splňují tzv. datové a stavové rovnice: Datová rovnice popisuje vztah mezi (nepozorovatelnými) stavovými veličinami vektoru Xt a naměřenými (pozorovatelnými) veličinami vektoru Yt ; je určena zápisem: Yt = Gt Xt + Wt
kde t = 1, 2, 3, . . .
Stavová rovnice popisuje vývoj stavu procesu popsaného v časovém okamžiku t vektorem stavových proměnných Xt tak, že je definována souvislost mezi stavovým vektorem v okamžiku t a v následujícím okamžiku t + 1, tj. Xt+1 = Ft Xt + Vt+1
kde t = 1, 2, 3, . . . ,
Xt je tzv. stavový v-rozměrný náhodný vektor, Wt je šum měření (w-rozměrný náhodný vektor chyb), Vt+1 je šum procesu (v-rozměrný náhodný vektor chyb), Gt je posloupnost matic typu w × v (popisují vztah pozorování ke stavu) a Ft je posloupnost matic typu v × v (tzn. matic přechodu modelujících dynamiku) Předpokládejme, že všechny náhodné vektory mají konečné druhé momenty a platí E(Vt ) = 0 E(Wt ) = 0
Rt S t Wt , = D S0t Qt Vt
E(Wt W0t ) = Rt tj.
E(Vt V0t ) = Qt E(Wt V0t ) = St
a C(Xt , (W0t , V0t )0 ) = 0, (tj. stavový vektor a chybové vektory jsou nekorelované). 16
Kapitola 4 Jednoduché strukturální modely časových řad Strukturálními modely časových řad budeme rozumět takové modely, které jednoduchým rekurentním způsobem popisují stochastické chování časových řad. Dále se budeme věnovat elementárním modelům, které dovolují modelovat trend a sezónnost.
4.1
Trend
Trend v časové řadě představuje dlouhodobou tendenci vývoje zkoumaného jevu. Je výsledkem dlouhodobého působení vnějších faktorů a podmínek. Nejjednodušší strukturální modely časových řad se skládají právě z trendu a náhodné fluktuace. Trendové modely zapisujeme ve tvaru: Y t = T rt + ε t
t = 1, . . . , T
kde složky T rt a εt jsou obě stochastické, T rt představuje trend a εt bílý šum. Přitom předpokládáme, že obě složky jsou stochasticky nezávislé. Všimněme si postupně jednotlivých typů trendu, resp. trendových funkcí. a) KONSTANTNÍ TREND Nejjednodušším modelem trendu je T rt = α. 17
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD
V tomto případě platí
T rt+1 = α = T rt .
Pokud chceme, aby se parametry měnily v čase, přidáme náhodnou chybu ηt , která je bílým šumem s nulovou hodnotou a rozptylem ση2 , tj. ηt ∼ W N(0, ση2 ) a dostaneme tzv. model s lokálním konstantním trendem (anglicky local level model). T rt+1 = T rt + ηt+1 . Model můžeme přepsat do datových a stavových rovnic takto: Datová rovnice Y t = T rt + ε t , tj. Gt = 1 |{z} |{z} Xt
Wt
Stavová rovnice
T rt+1 = T rt + ηt+1 | {z } |{z} |{z} X t+1
Xt
tj. také F t = 1
Vt
b) LINEÁRNÍ TREND Pokud nevystačíme s konstantním lokálním trendem a přidáme další složku, pak T rt = α + βt. V tomto případě T rt+1 = α + β(t + 1) = α + βt +β = T rt + β | {z } T rt
Vidíme tedy, že nepotřebujeme znát hodnotu parametru α.
Pokud budeme opět chtít, aby se i parametr β mohl měnit v čase, budeme uvažovat model s náhodnými fluktuacemi ηt a ξt , které jsou bílými šumy s nulovou střední hodnotou a rozptylem ση2 a σξ2 , tj. platí ηt ∼ W N(0, ση2 ) ξt ∼ W N(0, σξ2 ),
18
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD
a dostaneme modely T rt+1 = T rt + βt + ηt+1 βt+1 = βt + ξt+1 kde t = . . . , −1, 0, 1, . . . . Fluktuace ηt dovoluje hladině trendu pohybovat se nahoru a dolů, zatímco fluktuace ξt dovoluje změnu parametru β. Čím větší jsou rozptyly těchto fluktuací, tím větší jsou stochastické pohyby v trendu. Všimněme si, že βt je náhodnou procházkou, tj. modelem I(1). Celkový model můžeme opět vyjádřit pomocí stavově - prostorových modelů, tzn. pomocí stavových a datových rovnic, a to takto Datová rovnice T rt ε + t Yt = 1 0 0 | {z } βt | {z } Gt =G | {z } Xt
Wt
Stavová rovnice
1 1 T rt ηt+1 T rt+1 = + 0 1 βt ξt+1 βt+1 | {z } | {z } | {z } | {z }
F t =F
Xt+1
Xt
Vt
c) CYKLICKÝ TREND v časové řadě vyjadřuje dlouhodobé kolísání okolo trendu, ve kterém se střídají fáze růstu a poklesu. V posledních letech se věnuje pozornost zejména technologickým, inovačním či demografickým cyklům. Cyklický trend předpokládá, že T rt = ψt , kde ψt je cyklická složka s frekvencí λc , kterou lze vyjádřit dvojím způsobem. Zápisem pomocí funkce kosinus: ψt = A cos(λc t − θ),
19
kde
t = 1, . . . , T
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD
nebo jako kombinaci funkcí sinus a kosinus: ψt = α cos λc t + β sin λc t, kde t = 1, . . . , T, p přičemž A = α2 + β 2 je amplituda a
θ = arctan
β α
je fáze.
Abychom dostali rekurentní vztah jako u lineárního trendu, uvažujme nejprve ψt = α cos λc t + β sin λc t. Pak ψt+1 = α cos λc (t + 1) + β sin λc (t + 1) = = α[cos λc t cos λc − sin λc t sin λc ] + β[sin λc t cos λc + cos λc t sin λc ] = = cos λc [α cos λc t + β sin λc t] + sin λc [−α sin λc t + β cos λc t] | {z } {z } | ψt
ψ∗
Při značení
ψt∗ = −α sin λc t + β cos λc t počítejme dále ∗ ψt+1 = −α sin λc (t + 1) + β cos λc (t + 1) =
= −α[sin λc t cos λc + cos λc t sin λc ] + β[cos λc t cos λc − sin λc t sin λc ] = = cos λc [−α sin λc t + β cos λc t] − sin λc [α cos λc t + β sin λc t]. Takže můžeme psát ψt+1 = cos λc ψt + sin λc ψt∗ ∗ ψt+1 = − sin λc ψt∗ + cos λc ψt∗ , což lze vyjádřit maticově takto: ψt+1 cos λc sin λc ψt = ∗ ψt+1 − sin λc cos λc ψt∗
20
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD
Nyní předchozí vztahy doplníme o náhodné fluktuace κt a κ∗t , které jsou nezávislé bílé šumy, tj. κt ∼ W N(0, σκ2 ) κ∗t ∼ W N(0, σκ2∗ ). Dostaneme tedy datovou rovnici ψt + εt Yt = 1 0 |{z} | {z } ψt∗ Wt Gt =G | {z } Xt
a stavovou rovnici
ψt κt+1 cos λc sin λc ψt+1 + ∗ = ∗ ψt∗ κt+1 − sin λc cos λc ψt+1 {z } | {z } | {z } | {z } | X t+1
Ft
Xt
Vt
kde funkce označené hvězdičkami jsou pouze pomocné, umožňující rekurzivní přepis.
21
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD
4.2
Sezónnost
Sezónní složka Szt popisuje v lineárních modelech krátkodobé periodické změny, tj. pravidelné kolísání okolo trendu v rámci kalendářního roku, které je kratšího rázu, např. vliv střídání ročních období, svátků, dovolených apod. Nejprve uvažujme jednoduchý sezónní model se šumem. Předpokládejme, že délka sezóny je s. Sezónní komponenty (výkyvy) označme γ1 , γ2 , . . . , γs a předpokládejme, že pro ně platí vztahy γt+s = γt , tj. vliv výkyvu se po uplynutí celé sezóny neliší, a γ1 + . . . + γs = 0, tj. celkový vliv výkyvů za sezónu je nulový. Odtud dostaneme jednoduché vztahy γt+1 = γt+1−s γt+1 + γt + . . . + γt+1−s+1 = 0, tj. γt+1 = −γt − γt−1 − . . . − γt+2−s Doplníme-li předchozí vztah o náhodné fluktuace ωt , které jsou bílým šumem, tj. ωt ∼ W N(0, δω2 ), dostaneme γt+1 = −γt − γt−1 − . . . − γt+2−s + ωt+1 , neboli obecně γt = −
s−1 X
γt−j + ωt
j=1
a maticově
−1 −1 . . . −1 1 0 ... 0 .. .. . 1 . = 0 . . . .. . . . . 0 γt+2−s 0 ... 0 1 γt+1 γt γt−1 .. .
22
ωt+1 0 γt γt−1 0 0 .. γt−2 .. . + . .. . 0 . .. γt+1−s 0 0
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD
Abychom sezónní složky mohli zakomponovat do modelu časové řady Yt = Szt + εt , zavedeme pomocné proměnné zjt definované pro j = 1, . . . , s − 1 následujícím způsobem: 1, t = j, j + s, j + 2s, . . . zjt = 0, t 6= j, j + s, j + 2s, . . . −1, t = s, 2s, 3s, . . . Pak
Szt =
X
γj zjt .
j
Zápis sezónnosti pomocí stavově - prostorových modelů bude vypadat takto: Datová rovnice
Yt = ztt zt−1,t |
γt γt−1 γt−2 .. .
zt−2,t . . . zt+1−s,t εt + |{z} {z } Wt Gt γt+1−s | {z } Xt
Stavová rovnice −1 −1 . . . −1 γt+1 γt 1 0 ... 0 .. .. γt−1 . 1 . = 0 .. . . . .. . . . . . 0 γt+2−s 0 ... 0 1 | {z } | {z X t+1
Ft
23
ωt+1 0 γt γt−1 0 0 . .. . γt−2 + .. .. . 0 . .. γt+1−s 0 0 } | {z } | {z } Xt
V t+1
Závěr Jedním ze způsobů analýzy časových řad je klasická dekompozice založená na regresní analýze. Při tomto přístupu je konstruován model pro všechna data a jeho parametry se nemění. Regresní modely jsou výhodné především z hlediska interpretace, předpokládají však vzájemnou nekorelovanost (nezávislost) dat z minulosti. Tento předpoklad časové řady nesplňují, proto byla snaha najít lepší způsob, který by se vypořádal i s daty, která se navzájem ovlivňují. Tímto způsobem je Box-Jenkinsova metodologie, která celou časovou řadu považuje za řadu stochastického charakteru. Avšak z hlediska interpretace a vyhodnocování je Box-Jenkinsova metoda ”černou skřínkou”, neboť současná hodnota je lineární kombinací předchozích hodnot a lineární kombinací náhodných fluktuací. Strukturální přístup k analýze časových řad navržený A.C.Harveyem (1990) je jistou kombinací dvou předešlých metod. Využívá předchozích dat a jejich vzájemné závislosti, pracuje však pouze s informací, kterou jsou získali o jeden krok dříve. Díky tomuto postupu jsou strukturální dynamické modely při výpočtech méně náročné na paměť, objevuje se v nich méně parametrů a parametry, které se v nich používají, jsou lépe interpretovatelné, než tomu je v Box-Jenkinsově metodě. Navíc se parametry mohou měnit v čase, čímž jsou modely více flexibilní. V bakalářské práci jsou popsány nejjednodušší strukturální dynamické modely časových řad a jsou zapsány pomocí stavově-prostorových modelů. Tyto jednoduché strukturální modely jsou základními kameny dynamického přístupu k analýze časových řad a mohou se dál různě kombinovat a vytvářet tak modely složitější.
24
Seznam použité literatury [1] Budíková M., Lerch T., Mikoláš Š. Základní statistické metody, Brno 2006 [2] Forbelská, M. Stochastické modelování jednorozměrných časových řad, Brno 2009 [3] Forbelská M. učební materiály k předmětu Lineární statistické modely, M5120 [4] Harvey, A.C. Forecasting, structural series models and the Kalman filter, Cambridge 1990 [5] Petris, G., Petrone, S., Campagnoli, P. Dynamic Linear Models with R, Springer 2009
25