Lineární systémy a modely časových řad
Daniel Schwarz
Investice do rozvoje vzdělávání
Cíl, motivace Popis a identifikace systémů
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Cíl, motivace Popis a identifikace systémů
BLACK BOX
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Cíl, motivace Popis a identifikace systémů
z-1
z-1 c1
z-1 c2
z-1 cq-11
cq +
Analýza, Simulace, Predikce, Monitoring, Diagnostika, Řízení
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Co nás čeká •
Systémy obecně a jejich důležité vlastnosti.
•
Princip superpozice superpozice, konvoluce konvoluce, impulsní charakteristika systémů
•
Fourierovy řady, DTFT, frekvenční charakteristika systémů
•
Z transformace transformace, přenosová funkce, funkce nulové body a póly
•
FIR, IIR AR, MA, ARMA a překryvy v terminologii
•
Modely časových řad – Boxova Boxova-Jenkinsova Jenkinsova metodologie pro tvorbu „předpovědí „předpovědí“
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
;
ffgf
1. Lineární systémy
6 Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy: definice
SSystém té je j množinou ži prvků, ků které jsou spolu ve vzájemných vztazích a které tvoří určitý celek.
vstupní signál
Systém
výstupní signál
Za systém považujeme jakoukoli sadu procesů, které ovlivňují povahu signálu.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Příklad systému Hranový detektor
„druhá diference“
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů
vstupní signál
Systém
výstupní signál
kauzální - nekauzální časově invariantní - časově proměnné linearní - nelineární
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: kauzalita Systém je kauzální, pokud jeho výstup závisí pouze na minulých a současných vstupních hodnotách hodnotách. • Všechny fyzikální systémy v reálném čase jsou kauzální, protože „čas čas běží pouze dopředu“ dopředu“. • Kauzalita se netýká systémů s prostorově závislými proměnnými. • Kauzalita se netýká systémů zpracovávající nahrané signály.
• Pozn.: derivace signálu v čase t je přirozeně nekauzálním výpočtem.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: kauzalita kauzální x nekauzální
kauzální
nekauzální
nekauzální
kauzální Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: časová invariantnost Neformálně: Systém je časově invariantní (time invariant - TI), pokud jeho chování nezávisí na tom, „kolik je zrovna hodin“. Matematicky: Systém x[n] ->> y[n] je časově invariantní, invariantní když pro jakýkoli vstupní signál x[n] a jakékoli časové posunutí n0 platí:
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: časová invariantnost časově invariantní x časově proměnné systémy :
časově invariantní
časově proměnný
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: linearita Lineární systém je takový systém, v němž lze uplatnit princip superpozice.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
LTI systémy Lineární časově invariantní systémy (LTI): • disponují elegantními matematickými vztahy mezi jejich vstupy a výstupy. • lze určit výstupní odezvu systému na jakýkoli vstup • lze také určit vstup systému při pozorování jeho výstupu
Selský rozum: „Znám-li odezvu LTI systému na velmi krátký vstupní signál, mohu pomocí těchto velmi krátkých signálů seskládat libovolný vstupní signál a odezvu LTI systému na něj pak seskládat ze známé odezvy na velmi krátký signál.“
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
LTI systémy lineární systém
Hledáme bázové signály tak, aby: bylo možné reprezentovat libovolné signály jako lineární kombinaci těchto bázových signálů odezva LTI systémů na tyto bázové signály byla jednoduchá a zároveň á ň aby b umožňovala žň l d dostatečně č ě hluboký hl b ký vhled hl d
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Reprezentace DT signálů jednotkovými impulsy
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Reprezentace DT signálů jednotkovými impulsy
Pozn.: Filtrační vlastnost Diracovy distribuce (jednotkového impulsu):
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Odezva systému systému na jednotkový impuls x[n]
LTI systém
y[n]
Lineární systém: … je odezvou systému na:
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Odezva systému systému na jednotkový impuls x[n]
LTI systém
y[n]
Lineární a časově invariantní systém s odezvou h[n] na jednotkový impuls:
konvoluční suma Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
LTI systémy: konvoluce x[n]
LTI systém
y[n]
IMPULSNÍ CHARAKTERISTIKA SYSTÉMU
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Periodické signály a LTI systémy Fourierova reprezentace diskrétních signálů
x[n] – periodický signál se základní periodou N.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Periodické signály a LTI systémy
„zesílení“
amplituda
fáze
LTI systém nevytváří nové frekvenční složky, ale pouze zesiluje nebo potlačuje frekvenční komponenty existující ve vstupním signálu signálu. Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Periodické signály a LTI systémy
Frekvenční charakteristika:
G(ω) =
…… je periodická funkce vyjádřena Fourierovou řadou s koeficienty h.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Frekvenční charakteristika PŘÍKLAD: vyhlazovací systém
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace
• z je komplexní proměnná. • nejčastěji uvažujeme jednostrannou transformaci: sumace od n=0.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace - vlastnosti Linearita: Posun: Útlum: Konvoluce: Subst: m=n-i
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce
pro
platí, že H(z) = H(jω)
Přenosová (systémová) funkce vyjadřuje na jednotkové kružnici |z|=1 frekvenční charakteristiku diskrétní soustavy.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce Přenosová (systémová) funkce vyjadřuje na jednotkové kružnici |z|=1 kmitočtovou charakteristiku diskrétní soustavy. soustavy
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce H(z) vyjádřená pomocí racionálně lomené funkce:
bi .z-i ,
A=b0/a0.
ai .z-i zi jsou NULY racionálně lomené funkce pi jsou PÓLY racionálně lomené funkce
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce
|A| .
n – vzdálenosti mezi bodem ωT na jednotkové kružnici a NULAMI přenosové funkce. r – vzdálenosti dálenosti me mezii bodem ωT na kr kružnici žni i a PÓLY přenoso přenosovéé ffunkce. nk e |A| – zesílení systému Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce n – vzdálenosti mezi bodem ωT na jednotkové kružnici a NULAMI přenosové funkce. r – vzdálenosti mezi bodem ωT na kružnici a PÓLY přenosové funkce.
. |A|
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Popis diskrétní soustavy s ZZ-transformací Mějme LTI systém s přenosovou funkcí ve tvaru racionálně lomené funkce:
bi .z-ii ai .z-i kde A = a0/b0, zi jsou nuly a pi jsou póly racionálně lomené funkce.
ai .z-i
bi .z-i
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i Lineární systémy a modely časových řad
zpětná Z transformace Z-transformace, věta o linearitě a posunu, a0=1. =1
© Institute of Biostatistics and Analyses
Popis diskrétní soustavy s ZZ-transformací M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i Interpretace rovnice: diskrétní soustava / systém uchovává v paměti starší vzorky vstupního i výstupního signálu.
Klouzavý průměr MA
Autoregresní člen AR
Ovlivňuje rychlost odezvy, charakter jejího zanikání, zanikání stabilitu soustavy. Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Popis diskrétní soustavy s ZZ-transformací M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i Zpoždění p o jeden vzorek
Realizace soustavy / filtru / programu přímou formou:
b0
b1
-a aL
Lineární systémy a modely časových řad
b2
-a aL-1 L1
bM-1
bM
-a a1
© Institute of Biostatistics and Analyses
Systémy s konečnou impulsní charakteristikou FIR – finite impulse response
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i pouze člen MA (moving average)
Lineární systémy a modely časových řad
nerekurzivní k i í realizace li (většinou, ale nemusí vždy)
© Institute of Biostatistics and Analyses
Systémy s konečnou impulsní charakteristikou FIR PŘÍKLAD: hranový detektor
h[n] = -1
{δ [n − 1] − 2δ [n] + δ [n + 1]} 0
1
n
FIR PŘÍKLAD: „vyhlazovací“ systém
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy s konečnou impulsní charakteristikou FIR – finite impulse response
bi .z-k
M −1
yn = b0 . xn + b1 . xn −1 + b2 . xn − 2 + ... + bM −1 . xn − M +1 = ∑ bk . xn − k k =0
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy s nekonečnou impulsní charakteristikou IIR – infinite impulse response
Autoregresní člen AR
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i
vždy žd rekurzivní k i í realizace li Klouzavý průměr MA Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy s nekonečnou impulsní charakteristikou IIR PŘÍKLAD: „vyhlazovací“ systém
z-1
H(z) = az/(z-a). Pro a>1 je filtr nestabilní.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy s nekonečnou impulsní charakteristikou IIR : smyčku, jsou vždy rekurzivní - vyžadují alespoň jednu zpětnovazební smyčku - přenosová funkce = podíl polynomů
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Terminologie: IIR, IIR, FIR, FIR, MA, MA, AR M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i FIR filtry: ai=0, pro všechna i. Označovány také jako „moving average“ nebo „all-zero“ filtry. IIR filtry: fil ai<>0, 0 pro alespoň l ň jjedno d i.i Zahrnují: • autoregresivní (AR) filtry • moving-average, moving average autoregresivní (ARMA) filtry AR filtry: bi=0, kromě b0 . Výstup závisí pouze na aktuální hodnotě na vstupu a na konečném počtu starších vzorků výstupního signálu. O načovány také jako: Označovány „all-pole“, „purely recursive“, „autoregressive“ Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Terminologie: IIR, IIR, FIR, FIR, MA, MA, AR M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i FIR filtry: ai=0, pro všechna i. Označovány také jako „moving average“ nebo „all-zero“ filtry. IIR filtry: fil ai<>0, 0 pro alespoň l ň jjedno d i.i Zahrnují: • autoregresivní (AR) filtry • moving-average, moving average autoregresivní (ARMA) filtry ARMA filtry: ai , bi nenulové Označovány také jako: „pole-zero“, „pole ero , „autoregressive, moving moving-average average “
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Terminologie: IIR, IIR, FIR, FIR, MA, MA, AR M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i DOPORUČENÍ: • pro filtry a lineární systémy používat označení FIR, IIR • označení AR, MA, ARMA používat pro popis či modely stochastických procesů, které generují data náhodné povahy
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
;
ffgf
2. Modely časových řad
46 Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Časové řady Definice časové řady: uspořádaná posloupnost hodnot závislé proměnné měřené v ekvidistantních časových intervalech. intervalech 355
350
koncen ntrace CO2
345
340
335
330
325 1974
1976
1978
1980
1982
1984
1986
1988
č čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Signály vs. časové řady
1-D DISKRÉTNÍ SIGNÁLY ≈ ČASOVÉ ŘADY
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Časové řady Definice časové řady: uspořádaná posloupnost hodnot závislé proměnné měřené v ekvidistantních časových intervalech. intervalech Využití modelů časových řad je dvojí: 1. porozumění procesu, který vyprodukoval pozorovaná data 2. předpovídání budoucích hodnot, případně i jejich ovlivňování -> řízení
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Stacionarita Stacionarita je obvyklým předpokladem většiny technik analýzy časových řad. Definice stacionárního procesu: jedná se o náhodný proces jehož rozdělení pravděpodobnosti p p se v čase nemění. V důsledku toho se nemění ani parametry jeho pravděpodobnostní funkce (např. střední hodnota, rozptyl). Autokorelační funkce stacionárního procesu závisí pouze na rozdílu svých argumentů.
Předpokladem stacionarity rozumějme ty časové řady či signály, které jsou bez trendu,, majíj s měnícím se časem stejný rozptyl a stejnou podobu autokorelační funkce.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Stacionarita V případě nestacionárních časových řad lze provést: 1 1. diferencování dxi = xi-xxi-1 2. odstranění trendu odečtením proloženého polynomu 3. stabilizace rozptylu logaritmizací čtverce řady. 355
350
koncentrace CO O2
345
340
335
330
325 1974
1976
1978
1980
1982
1984
1986
1988
čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Stacionarita V případě nestacionárních časových řad lze provést: 1 1. diferencování dxi = xi-xxi-1 2. odstranění trendu odečtením proloženého polynomu 3. stabilizace rozptylu logaritmizací čtverce řady. 2.5 2
dife erence koncentra ace CO2
1.5 1 0.5 0 -0.5 -1 -1.5 -2 -2.5 1974
1976
1978
1980
1982
1984
1986
1988
čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Stacionarita V případě nestacionárních časových řad lze provést: 1 1. diferencování dxi = xi-xxi-1 2. odstranění trendu odečtením proloženého polynomu 3. stabilizace rozptylu logaritmizací čtverce řady.
355
4 data 1 linear
y = 1.5*x - 2.5e+003
3
350
ressidua koncentrace C CO2
2
koncentrace CO2
345
340
335
1 0 -1 -2 -3
330
-4 325 1974
1976
1978
1980
1982
1984
čas
Lineární systémy a modely časových řad
1986
1988
-5 1974
1976
1978
1980
1982
1984
1986
čas
© Institute of Biostatistics and Analyses
1988
Sezónnost Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu. • Detekce periodické složky pomocí: pomocí • sezónní vizualizace v případě, že periodu složky známe • autokorelační funkce signálu • spektra signálu 355
koncentrace CO2
350 345 340 335 330 325 1974
1976
1978
1980 1982 čas
1984
Lineární systémy a modely časových řad
1986
1988
© Institute of Biostatistics and Analyses
Sezónnost Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu. • Detekce periodické složky pomocí: pomocí • sezónní vizualizace v případě, že periodu složky známe • autokorelační funkce signálu • spektra signálu 355
1
08 0.8
345 0.6 340
acf a
koncenttrace CO2
350
0.4 335 0.2
330 325 1974
1976
1978
1980 1982 čas
1984
Lineární systémy a modely časových řad
1986
1988
0 -200
-100
0 zpoždění
100
© Institute of Biostatistics and Analyses
200
Sezónnost Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu. • Detekce periodické složky pomocí: pomocí • sezónní vizualizace v případě, že periodu složky známe • autokorelační funkce signálu • spektra signálu 800
4
400 0
200 acf a
residua koncentrace CO2
600 2
-2
0 -200
-4
-6 1974
-400
1976
1978
1980 1982 čas
1984
Lineární systémy a modely časových řad
1986
1988
-600 -200
-100
0 zpoždění
100
© Institute of Biostatistics and Analyses
200
Sezónnost Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu. • Detekce periodické složky pomocí: pomocí • sezónní vizualizace v případě, že periodu složky známe • autokorelační funkce signálu • spektra signálu 1
2
0.5
0 acf a
residua koncentrace CO2
4
0
-2 -0.5
-4
-6 1974
1976
1978
1980 1982 čas
1984
Lineární systémy a modely časových řad
1986
1988
-1 -40
-20
0 zpoždění
20
© Institute of Biostatistics and Analyses
40
Sezónnost Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu. • Detekce periodické složky pomocí: pomocí • sezónní vizualizace v případě, že periodu složky známe • autokorelační funkce signálu • spektra signálu perioda 12 měsíců
Lineární systémy a modely časových řad
perioda 6 měsíců
© Institute of Biostatistics and Analyses
Modely časových řad Jakoukoli stacionární časovou řadu či signál s náhodnou složkou generuje stochastický proces, kterému lze přiřadit jeden z těchto modelů: • • • •
čistě rekursivní model nerekursivní model s klouzavým průměrem kombinovaný model bílý šum
Lineární systémy a modely časových řad
AR – autoregressive MA – moving average ARMA ν
© Institute of Biostatistics and Analyses
Bílý šum Náhodný proces označujeme za bílý šum, pokud jeho střední hodnota a autokorelační funkce splňují tyto podmínky: Diracova distribuce
μν = Ε{ν (t )} = 0 , Rνν (t1 , t 2 ) = Ε{ν (t1 )ν (t 2 )} =
N0 δ (t1 − t 2 ). 2
1000
0.4
800
0.2
600 Rww(t1 1,t2)
w(tt)
0.6
0 -0.2 -0.4
400 200 0
-0.6 0
20
40
60 t
Lineární systémy a modely časových řad
80
100
-200 -100
-50
0 t1-t2
50
© Institute of Biostatistics and Analyses
100
Autoregresní (AR) model
xn = a1xn−1 + a2 xn−2 + ...+ ap xn− p +ν n xn…………… časová řada / signál ν n……………bílý šum p …………… řád AR modelu
ai…………… parametry modelu 355
koncentrace CO2
350
Odhad parametrů
345 340 335 330 325 1974
1976
1978
1980 1982 čas
1984
xn
νn
+
z-1
z-1 a1
z-1 a2
xn 1986
1988
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ap
(MA) model s klouzavým průměrem
xn =ν n + c1ν n−1 + c2ν n−2 + ...+ cqν n−q xn…………… časová řada / signál ν n……………bílý šum q …………… řád MA modelu μ …………… střední hodnota náhodného procesu
ci…………… parametry modelu νn
355
koncentrace CO2
350
Odhad parametrů
345 340 335 330 325 1974
1976
1978
1980 1982 čas
1984
z-1
z-1 c1
z-1 c2
z-1 cq-11
xn 1986
+
1988
Lineární systémy a modely časových řad
cq
© Institute of Biostatistics and Analyses
xn
ARMA model ARMA(p, q) kombinuje AR(p) a MA(q) modely.
xn = a1xn−1 + a2 xn−2 + ...+ ap xn− p +ν n − − c1ν n−1 − c2ν n−2 − ...− cqν n−q Boxova-Jenkinsonova metodologie g zahrnuje: j • identifikaci modelu, • odhad modelu, • validaci modelu modelu.
Určení řádů p, q
Výpočet parametrů ai, ci Kontrola rozložení residuí Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace 1. 2.
Je časová řada / signál stacionární? Vykazuje časová řada / signál sezónnost? ANO
NE
zjištění periody T, T zahrnutí členu AR(T) nebo MA(T) do modelu, případně sezónní diference
ARIMA (autoregressive integrated moving average model) Identifikace, odhad, validace ARMA modelu na diferencovaných datech a následná úprava modelu. Př. model AR(2): yn = -0.406yn-1-0.146yn-2-0.00521 = xn-xn-1 xn-xn-1=-0406(xn-1-xn-2)-0.164(xn-2-xn-3)-0.00521 xn=0.594x =0 594xn-1+0.242x +0 242xn-2+0.164x +0 164xn-3-0.00521 0 00521 Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace Určení řádů p a q a) na základě zkušenosti a experimentování b) spektrum: každé výrazné maximum v rozsahu <0,fvz/2> / vyžaduje jeden pár pólů, což zvyšuje řád o 2. c) kritéria na základě autokorelační funkce (ACF) a parciální autokorelační funkce (PACF)
Srovnávání teoretických průběhů ACF, PACF procesů známých řádů s ACF ACF, PACF naměřených řad / signálů
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace xn
Příklad: AR(1) proces
νn
xn + axn −1 = ν n
z-1
+
-a1
xn = ν n − axn −1 =
= ν n − a (ν n −1 − axn − 2 ) = = ν n − aν n −1 + (− a ) ν n − 2 + ... + (− a )
n −1
2
(ν n−1 − ax0 ) a=+0.9
a=-0.9
2
1.5 1
1
x(n)
x(n)
0.5 0
0
-0.5 -1 -1 -1.5
0
50
100 n
Lineární systémy a modely časových řad
150
-2
0
50
100
150
n
© Institute of Biostatistics and Analyses
ARMA model: identifikace Příklad: AR(1) proces
xn + axn −1 = ν n xn = ν n − axn −1 =
= ν n − a (ν n −1 − axn − 2 ) = = ν n − aν n −1 + (− a ) ν n − 2 + ... + (− a )
n −1
2
(ν n−1 − ax0 )
|a|<1:
1 − (− a ) E{xn } = μ = μν , 1+ a 1 ≈ μν 1+ a n
Lineární systémy a modely časových řad
{ }
D{xn } = E xn2 − μ 2 =
{
}
σ ν2
1− a
,
2
Rxx ( k ) = E xn xn − k = (− a ) . k
© Institute of Biostatistics and Analyses
ARMA model: identifikace Příklad: AR(1) proces
{
}
Rxx ( k ) = E xn xn − k = (− a ) .
xn + axn −1 = ν n
k
1 a=+0.9 a=-0.9
0.8 0.6 0.4
Rxx(kk)
0.2 0 -0.2 -0.4 -0.6 -0.8 -1 1
0
Lineární systémy a modely časových řad
5
10
15 k
20
25
30
© Institute of Biostatistics and Analyses
ARMA model: identifikace
Tvar ACF Exponenciála klesající k nule. Změny kladných a záporných hodnot, postupný pokles k nule.
Model AR(p) model. Pro určení p se vychází z PACF.
Jeden nebo několik vrcholů, zbytek zanedbatelný nulový zanedbatelný, nulový.
MA model. Řád odpovídá hodnotě zpoždění od které je ACF nulová zpoždění, nulová.
Průběh klesající až po několika zpožděních
ARMA
Vše zanedbatelné, nulové
Data jsou náhodná.
Vysoké hodnoty ve stejných i t intervalech l h
Zahrnout AR člen s řádem odpovídajícím d íd jí í periodě. i dě
Neklesá k nule
Nejedná se o stacionární řadu / signál.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace 355
1
4 data 1 linear
y = 1.5*x - 2.5e+003
3
350
koncentrace CO2
345
340
335
0.5
1 0
acf
residua koncentrace CO2
2
-1
0
-2
-0.5 05
-3 330
-4 325 1974
1976
1978
1980
1982
1984
1986
1988
-5 1974
čas
1976
1978
1980
1982 čas
1984
1986
1988
-1 -40
-20
0 zpoždění
20
Perioda 12 vzorků
Zbývá identifikovat ještě nesezónní komponenty signálu / řady.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
40
ARMA model: identifikace Zbývá identifikovat ještě nesezónní komponenty signálu / řady.
Sezónní Se ó d diferencování: e e co á sezónní diference nad detrendovanou řadou 1000 800 600 400
d12(rx(n)))
200 0 -200 -400 400 -600 -800 -1000 1974
1976
1978
1980
1982
1984
1986
1988
čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace Zbývá identifikovat ještě nesezónní komponenty signálu / řady.
Sezónní Se ó d diferencování: e e co á Výběrová ACF sezónně diferencované řady 1 0.8 0.6 0.4
Rxx
0.2 0 -0.2 -0.4 -0.6 -0.8 -1
0
50
100
150
k
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace Zbývá identifikovat ještě nesezónní komponenty signálu / řady.
Sezónní Se ó d diferencování: e e co á
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model ARMA(p, q) kombinuje AR(p) a MA(q) modely.
xn = a1xn−1 + a2 xn−2 + ...+ ap xn− p +ν n − − c1ν n−1 − c2ν n−2 − ...− cqν n−q Odhad p parametrů modelu - iterační algoritmy: - nelineární metoda nejmenších čtverců - odhad na základě maximální věrohodnosti (MLE) Vhodnější tvar rovnice (pro SW nástroje):
xn + a1xn−1 + a2 xn−2 + ...+ ap xn− p =ν n + c1ν n−1 + c2ν n−2 + ...+ cqν n−q
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model ARMA(p, q) kombinuje AR(p) a MA(q) modely.
xn = a1xn−1 + a2 xn−2 + ...+ ap xn− p +ν n − − c1ν n−1 − c2ν n−2 − ...− cqν n−q Odhad p parametrů modelu - iterační algoritmy: - nelineární metoda nejmenších čtverců - odhad na základě maximální věrohodnosti (MLE) Výsledný AR(2) model (pro detrendovaná a sezónně diferencovaná data)
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA modely Validace modelu
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n sezónní diference nad detrendovanou řadou 1000
-Zpětné ověření předpokladů kladených na náhodné chyby, tj. analýza residuí
800 600 400
RESIDUA = CHYBY PREDIKCE
d12(rx(n n))
200 0 -200 -400 -600
- Residua byy měla p představovat bílýý šum.
-800 -1000 1974
1976
1978
1980
1982
1984
čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
1986
1988
ARMA modely Validace modelu AR(2)
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n
Validace modelu AR(4)
xn + 2.943⋅ xn−1 + 3.765⋅ xn−2 + 2.494⋅ xn−3 + 0.728⋅ xn−4 =ν n
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA modely Validace modelu AR(2)
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n
Validace modelu ARMA(4,4)
xn + 2.345⋅ xn−1 + 2.581⋅ xn−2 +1.645⋅ xn−3 + 0.5163⋅ xn−4 = =ν n − 3.789⋅ν n−1 + 5.397⋅ν n−2 − 3.425⋅ν n−3 + 0.8168⋅ν n−4
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA modely Posouzení kvality předpovídání - aplikace modelu na řadu zkrácenou o m pozorování, - předpověď hodnot xn-m+1, xn-m+2,…,xn - porovnání
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n yy1. ((1-step pp pred)) dat; measured arx2; fit: 82.14%
800 600 400
y1
200
Model: AR(2) H i Horizont predikce: dik 1 Shoda: 82.1 %
0 -200 -400 -600 -800 -1000
20
40
60
80
100
120
Lineární systémy a modely časových řad
140
© Institute of Biostatistics and Analyses
ARMA modely Posouzení kvality předpovídání - aplikace modelu na řadu zkrácenou o m pozorování, - předpověď hodnot xn-m+1, xn-m+2,…,xn - porovnání
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n yy1. ((5-step pp pred)) dat; measured arx2; fit: -0.8268%
800 600 400
y1
200
Model: AR(2) H i Horizont predikce: dik 5 Shoda: <1%
0 -200 -400 -600 -800 20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
ARMA modely Posouzení kvality předpovídání - aplikace modelu na řadu zkrácenou o m pozorování, - předpověď hodnot xn-m+1, xn-m+2,…,xn - porovnání
xn + 2.943⋅ xn−1 + 3.765⋅ xn−2 + 2.494⋅ xn−3 + 0.728⋅ xn−4 =ν n yy1. (1-step ( pp pred)) dat; measured arx4; fit: 91.95%
800 600 400
y1
200
Model: AR(4) H i Horizont predikce: dik 1 Shoda: 92.0 %
0 -200 -400 -600 -800 20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
ARMA modely Posouzení kvality předpovídání - aplikace modelu na řadu zkrácenou o m pozorování, - předpověď hodnot xn-m+1, xn-m+2,…,xn - porovnání
xn + 2.943⋅ xn−1 + 3.765⋅ xn−2 + 2.494⋅ xn−3 + 0.728⋅ xn−4 =ν n yy1. ((5-step pp pred)) dat; measured arx4; fit: 3.26%
800 600 400
y1
200
Model: AR(4) H i Horizont predikce: dik 5 Shoda: 3.3 %
0 -200 -400 -600 -800 20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
ARMA modely Posouzení kvality předpovídání - aplikace modelu na řadu zkrácenou o m pozorování, - předpověď hodnot xn-m+1, xn-m+2,…,xn - porovnání x n + 2 . 345 ⋅ x n − 1 + 2 . 581 ⋅ x n − 2 + 1 . 645 ⋅ x n − 3 + 0 . 5163 ⋅ x n − 4 = =ν
n
− 3 . 789 ⋅ ν
n −1
+ 5 . 397 ⋅ ν
n−2
− 3 . 425 ⋅ ν
n−3
+ 0 . 8168 ⋅ ν
n−4
yy1. ((1-step pp pred)) dat; measured amx44; fit: 98.55%
800 600 400
y1
200
Model: ARMA(4,4) H i Horizont predikce: dik 1 Shoda: 98.6 %
0 -200 -400 -600 -800 20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
ARMA modely Posouzení kvality předpovídání - aplikace modelu na řadu zkrácenou o m pozorování, - předpověď hodnot xn-m+1, xn-m+2,…,xn - porovnání x n + 2 . 345 ⋅ x n − 1 + 2 . 581 ⋅ x n − 2 + 1 . 645 ⋅ x n − 3 + 0 . 5163 ⋅ x n − 4 = =ν
n
− 3 . 789 ⋅ ν
n −1
+ 5 . 397 ⋅ ν
n−2
− 3 . 425 ⋅ ν
n−3
+ 0 . 8168 ⋅ ν
n−4
yy1. ((5-step pp pred)) dat; measured amx44; fit: 23.86%
800 600 400
y1
200
Model: ARMA(4,4) H i Horizont predikce: dik 5 Shoda: 23.9 %
0 -200 -400 -600 -800 20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
LTI systém a jeho popis yn = xn −1.745⋅ yn−1 − 0.8745⋅ yn−2 yn xn
+
z-1
z-1 -1.7
-0.9
Magnitude (dB) M
40 20 0
-20
0
0.2
0.4
0.6 0.8 1 1.2 1.4 1.6 Normalized Frequency (×π rad/sample)
1.8
2
0
0.2
0.4
0.6 0.8 1 1.2 1.4 1.6 Normalized Frequency (×π rad/sample)
1.8
2
Phase (degrees)
200 100 0 -100 -200
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Shrnutí Popis a identifikace systémů a procesů
z-1
z-1 c1
z-1 c2
z-1 cq-11
cq +
Analýza, Simulace, Predikce, Monitoring, Diagnostika, Řízení
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
;
ffgf
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
5. letní škola Matematické biologie je podporována projektem ESF č. CZ.1.07/2.2.00/07.0318 „VÍCEOBOROVÁ INOVACE STUDIA MATEMATICKÉ BIOLOGIE“
Otázky ?
87 Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses