Část IV. – Analýza časových řad
Ing. Michal Dorda, Ph.D.
1
Analýza časových řad • Časovou řadou rozumíme posloupnost věcně a prostorově srovnatelných pozorování (dat), která jsou jednoznačně uspořádána z hlediska času ve směru minulost – přítomnost. • Časovou řadou v oblasti dopravy může být např. počet dopravních nehod v jednotlivých letech, počet registrovaných vozidel v jednotlivých letech apod. Ing. Michal Dorda, Ph.D.
2
Analýza časových řad
Ing. Michal Dorda, Ph.D.
3
Analýza časových řad
Ing. Michal Dorda, Ph.D.
4
Analýza časových řad • Časové řady lze členit podle různých kritérií: 1. 2. 3. 4.
Podle rozhodného časového hlediska. Podle periodicity, s jakou jsou údaje sledovány. Podle druhu sledovaných ukazatelů. Podle způsobu vyjádření údajů.
Ing. Michal Dorda, Ph.D.
5
Analýza časových řad 1) Podle rozhodného časového hlediska rozlišujeme: – Časové řady intervalové (resp. časové řady intervalových ukazatelů). – Časové řady okamžikové (resp. časové řady okamžikových ukazatelů).
Ing. Michal Dorda, Ph.D.
6
Analýza časových řad • Intervalovou časovou řadou rozumíme řadu takového ukazatele, jehož velikost závisí na délce intervalu, za který je sledován. – Pro ukazatele tohoto typu má smysl tvořit součty, ukázkou intervalové časové řady může být řada zobrazující vývoj počtu dopravních nehod v jednotlivých letech.
Ing. Michal Dorda, Ph.D.
7
Analýza časových řad – Sledované údaje se mají vztahovat ke stejně dlouhým časovým intervalům, provádíme tzv. očištění časových řad od vlivů kalendářních variací (sledované údaje přepočítáváme na jednotkový časový interval)
Ing. Michal Dorda, Ph.D.
8
Analýza časových řad • Údaje očištěné na kalendářní dny získáme podle vztahu: kt , (o ) yt = yt ⋅ kt
kde: yt je hodnota očišťovaného ukazatele, kt je počet kalendářních dní v daném období, kt je průměrný počet kalendářních dní v daném období. Ing. Michal Dorda, Ph.D.
9
Analýza časových řad n
kt = =
∑k t =1
n
t
=
366 = 30,5 12
Měsíc Počet dní měsíce k t Počet nehod y t Očištěný počet nehod y t (0) Leden 31 18 939 18 634 Únor 29 16 137 16 972 Březen 31 17 849 17 561 Duben 30 15 724 15 986 Květen 31 17 694 17 409 Červen 30 17 914 18 213 Červenec 31 16 699 16 430 Srpen 31 17 386 17 106 Září 30 16 829 17 109 Říjen 31 19 105 18 797 Listopad 30 18 644 18 955 Prosinec 31 18 596 18 296
např. y1(0) = y1 ⋅
kt 30,5 = 18939⋅ =& 18634 k1 31
Ing. Michal Dorda, Ph.D.
10
Analýza časových řad • Údaje očištěné na pracovní dny získáme podle vztahu: pt , (o ) yt = yt ⋅ pt
kde: yt je hodnota očišťovaného ukazatele, pt je počet pracovních dní v daném období, pt je průměrný počet pracovních dní v daném období. Ing. Michal Dorda, Ph.D.
11
Analýza časových řad • Okamžikové časové řady jsou tvořeny z údajů, které se vztahují k určitému okamžiku. – Příkladem může být počet evidovaných vozidel v ČR k 31. 12. každého roku. – U těchto řad nemá smysl stanovovat součty. – Řady tohoto typu se shrnují pomocí chronologického průměru.
Ing. Michal Dorda, Ph.D.
12
Analýza časových řad • V případě, že je délka mezi jednotlivými časovými okamžiky stejná, počítáme prostý chronologický průměr: y1 + y2 y2 + y3 y + yn y1 y + + ... + n −1 + y2 + ... + yn −1 + n 2 2 2 2 , y= = 2 n −1 n −1 kde: y1 , y2 ,..., yn−1 , yn jsou jednotlivé hodnoty
okamžikového ukazatele.
Ing. Michal Dorda, Ph.D.
13
Analýza časových řad • V případě, že délka mezi jednotlivými časovými okamžiky není konstantní, počítáme vážený chronologický průměr: y1 + y2 y 2 + y3 yn −1 + yn ⋅ d1 + ⋅ d 2 + ... + ⋅ d n −1 2 2 2 y= , d1 + d 2 + ... + d n −1
kde:
jsou jednotlivé hodnoty okamžikového ukazatele, d1 , d 2 ,..., d n −1 jsou délky jednotlivých časových intervalů. y1 , y2 ,..., yn −1 , yn
Ing. Michal Dorda, Ph.D.
14
Analýza časových řad Datum Počet zaměstnanců y t Délka časové mezery d t 1.1.2009 152 31 1.2.2009 164 28 1.3.2009 158 31 1.4.2009 174 30 1.5.2009 176 31 1.6.2009 171 152 + 164 164 + 158 158 + 174 174 + 176 176 + 171 ⋅ 31 + ⋅ 28 + ⋅ 31 + ⋅ 30 + ⋅ 31 2 2 2 2 2 y= =& 167 31 + 28 + 31 + 30 + 31
Ing. Michal Dorda, Ph.D.
15
Analýza časových řad 2) Podle periodicity, s jakou jsou údaje sledovány, rozlišujeme: – Krátkodobé časové řady (periodicita je kratší než 1 rok) – zpravidla 1 měsíc. – Roční (dlouhodobé) časové řady (periodicita je roční nebo ještě delší).
Ing. Michal Dorda, Ph.D.
16
Analýza časových řad 3) Podle druhu sledovaných ukazatelů rozlišujeme: – Časovou řadu absolutních hodnot (zpravidla časová řada očištěná od kalendářních variací). – Časovou řadu odvozených charakteristik – vznikají na základě absolutních údajů, např. časové řady součtové (např. časová řada klouzavých ročních úhrnů)
Ing. Michal Dorda, Ph.D.
17
Analýza časových řad • Klouzavým ročním úhrnem rozumíme hodnotu intervalového ukazatele za celé roční období, které končí sledovaným měsícem.
Ing. Michal Dorda, Ph.D.
18
Analýza časových řad Měsíc Leden Únor Březen Duben Květen Červen Červenec Srpen Září Říjen Listopad Prosinec ∑
Počet nehod 2005 2006 16 961
17 219
16 375
16 789
15 527
17 748
14 168
15 598
16 827
17 031
16 707
17 996
15 937
11 746
17 065
13 595
16 536
13 854
16 721
15 841
17 693
15 632
18 745
14 916
Rozdíl roku 2006 - 2005 258 414 2 221 1 430 204 1 289 -4 191 -3 470 -2 682 -880 -2 061 -3 829
Klouzavé roční úhrny 199 262 + 258 = 199 520 199 520 + 414 = 199 934 199 934 + 2 221 = 202 155 202 155 + 1 430 = 203 585 203 585 + 204 = 203 789 203 789 + 1 289 = 205 078 205 078 - 4 191 = 200 887 200 887 - 3 470 = 197 417 197 417 - 2 682 = 194 735 194 735 - 880 = 193 855 193 855 - 2 061 = 191 794 191 794 - 3 829 = 187 965
199 262 187 965 Ing. Michal Dorda, Ph.D.
19
Analýza časových řad 4) Podle způsobu vyjádření údajů rozlišujeme časové řady: – Naturálních ukazatelů (hodnoty příslušného ukazatele jsou vyjádřeny naturálním kritériem). – Peněžních ukazatelů (hodnoty ukazatele jsou vyjádřeny v peněžní formě).
Ing. Michal Dorda, Ph.D.
20
Analýza časových řad • Mezi základní charakteristiky časových řad zařazujeme: 1. Diference jednotlivých řádů (zejména 1. a 2. řádu). 2. Tempa růstu (řetězové indexy). 3. Průměrné tempo růstu. 4. Průměry hodnot časové řady.
Ing. Michal Dorda, Ph.D.
21
Analýza časových řad Mějme hodnoty sledovaného ukazatele yt pro t = 1,2,..., n . 1) Diferenci 1. řádu stanovíme dle vztahu: D1t = yt − yt −1 pro t = 2,..., n . Diferenci 2. řádu určíme podle vztahu: D 2t = D1t − D1t −1 pro t = 3,..., n .
Ing. Michal Dorda, Ph.D.
22
Analýza časových řad 2) Tempa růstu určíme dle vztahu: yt kt = pro t = 2,..., n . yt −1
Pokud potřebujeme tempo růstu vyjádřit v procentech, potom: yt k = 100 ⋅ − 1 = 100 ⋅ (kt − 1) pro t = 2,..., n [%] . yt −1 % t
Ing. Michal Dorda, Ph.D.
23
Analýza časových řad 3) Průměrné tempo růstu se stanoví jako geometrický průměr jednotlivých temp růstu: 1 k = (k 2 ⋅ k3 ⋅ ... ⋅ k n )n −1 . Průměrné tempo růstu vyjádřené v % získáme podle vztahu: k % = 100 ⋅ (k − 1) [%]
Ing. Michal Dorda, Ph.D.
24
Analýza časových řad 4) V případě intervalové řady očištěné od vlivu kalendářních variací stanovíme průměr všech hodnot ukazatele jako aritmetický průměr: n
y=
∑y t =1
n
t
.
V případě okamžikové řady použijeme vztahy pro výpočet chronologického průměru (viz dříve). Ing. Michal Dorda, Ph.D.
25
Analýza časových řad Měsíc
t
Leden Únor Březen Duben Květen Červen Červenec Srpen Září Říjen Listopad Prosinec ∑
1 2 3 4 5 6 7 8 9 10 11 12
78
Počet nehod D1 t 2006 17 219 16 789 -430 17 748 959 15 598 -2 150 17 031 1 433 17 996 965 11 746 -6 250 13 595 1 849 13 854 259 15 841 1 987 15 632 -209 14 916 -716 187 965
D2 t 1 389 -3 109 3 583 -468 -7 215 8 099 -1 590 1 728 -2 196 -507
k t [-] k t % [%]
např.
0,9750 1,0571 0,8789 1,0919 1,0567 0,6527 1,1574 1,0191 1,1434 0,9868 0,9542
D12 = y2 − y1 =
-2,50 5,71 -12,11 9,19 5,67 -34,73 15,74 1,91 14,34 -1,32 -4,58
Ing. Michal Dorda, Ph.D.
= 16789 − 17219 = = −430 D 23 = D13 − D12 = = 959 − 959 = = 1389
26
Analýza časových řad např. y2 16789 k2 = = =& 0,98 y1 17219
y2 16789 k = 100 ⋅ − 1 = 100 ⋅ − 1 =& −2,50% 17219 y1 % 2
k = (k 2 ⋅ k3 ⋅ ... ⋅ k12 )
1 12 −1
= (0,9750 ⋅1,0571⋅ ... ⋅ 0,9542 )
1 12 −1
=& 0,9870
k % = 100 ⋅ (0,9870 − 1) =& −1,30% Ing. Michal Dorda, Ph.D.
27
Analýza časových řad • Za základní princip modelu časové řady se používá jednorozměrný model: yt = f (t , ε t ) , kde yt je hodnota ukazatele v čase t, kde t = 1,2,..., n a εt je hodnota náhodné složky v čase t.
Ing. Michal Dorda, Ph.D.
28
Analýza časových řad • K tomuto modelu lze přistupovat více způsoby, zpravidla se užívá klasický (formální) model, který dekomponuje časovou řadu na složku: – Trendovou (Tt). – Sezónní (St). – Cyklickou (Ct). – Náhodnou (εt).
Ing. Michal Dorda, Ph.D.
29
Analýza časových řad • Vlastní rozklad časové řady v aditivním tvaru potom vypadá: yt = Tt + St + Ct + ε t = Yt + ε t , kde Yt se nazývá teoretická (deterministická) složka. • Trendem rozumíme hlavní tendenci dlouhodobého vývoje sledovaného ukazatele v čase – rostoucí trend, klesající trend, řada bez trendu. Ing. Michal Dorda, Ph.D.
30
Analýza časových řad • Sezónní složka je pravidelně se opakující odchylka od trendové složky vyskytující se u časových řad s periodicitou menší než 1 rok. • Cyklickou složkou rozumíme kolísání okolo trendu v důsledku dlouhodobého cyklického vývoje s délkou vlny delší než 1 rok.
Ing. Michal Dorda, Ph.D.
31
Analýza časových řad • Náhodná složka je složka, kterou nelze popsat žádnou funkcí času, jejím zdrojem jsou drobné a nepopsatelné příčiny. • Nyní nás bude zajímat popis trendové složky pomocí trendových funkcí.
Ing. Michal Dorda, Ph.D.
32
Analýza časových řad • Nejčastěji se využívají tyto trendové funkce: 1. 2. 3. 4. 5. 6.
Lineární trend. Parabolický trend. Exponenciální trend. Modifikovaný (posunutý) exponenciální trend. Logistický trend. Gompertzova křivka.
Ing. Michal Dorda, Ph.D.
33
Analýza časových řad 1) Lineární trend • Mějme hodnoty sledovaného ukazatele yt pro t = 1,2,..., n . • Skutečný průběh Yt = β 0 + β1 ⋅ t neznáme, provádíme pouze odhad tohoto trendu ve tvaru: ) yt = b0 + b1 ⋅ t . Ing. Michal Dorda, Ph.D.
34
Analýza časových řad • Pro odhad parametrů lze použít metodu nejmenších čtverců, tedy: n ) 2 n ϕ = ∑ ( yt − yt ) = ∑ ( yt − b0 − b1 ⋅ t )2 → min. t =1
t =1
• Položíme-li parciální derivací rovny nule a upravíme, dostaneme: n
n
t =1
t =1
1) ∑ yt − nb0 − b1 ∑ t = 0, n
n
n
t =1
t =1
t =1
2) ∑ t ⋅ yt − b0 ∑ t − b1 ∑ t 2 = 0. Ing. Michal Dorda, Ph.D.
35
Analýza časových řad • Z první rovnice vyjádříme: n
b0 =
∑y t =1
n
n
t
− b1 ⋅
∑t t =1
n
= yt − b1 ⋅ t .
• Dosazením do druhé rovnice a algebraickými úpravami dostaneme: n
b1 =
∑t ⋅ y t =1
n
t
− yt ∑ t t =1
n
n
t =1
t =1
2 t ∑ − t ∑t
.
Ing. Michal Dorda, Ph.D.
36
Analýza časových řad • Jelikož platí: n
yt =
∑y t =1
n
t
n
a ∑t = n ⋅t , t =1
můžeme psát: n
b1 =
∑t ⋅ y t =1
n
t
− yt ∑ t t =1
n
n
t =1
t =1
2 t ∑ − t ∑t
n
=
∑t ⋅ y t =1
n
t
− t ∑ yt t =1
n
2 2 t − n ⋅ t ∑
.
t =1
Ing. Michal Dorda, Ph.D.
37
Analýza časových řad • Uvedené vztahy pro výpočet odhadů parametrů modelu lze zjednodušit následující úpravou. • Počátek časové proměnné, tedy t = 1 umisťujeme tam, kde máme z chronologického hlediska první pozorování. • Zaveďme si proměnnou t’ tak, aby platilo:
∑ t′ = 0. t′
Ing. Michal Dorda, Ph.D.
38
Analýza časových řad • Pro sudý počet pozorování např. leden
únor
březen
duben
květen červen
t
1
2
3
4
5
6
t’
-3
-2
-1
1
2
3
• Pro lichý počet pozorování např. leden
únor
březen
duben
květen
t
1
2
3
4
5
t’
-2
-1
0
1
2
Ing. Michal Dorda, Ph.D.
39
Analýza časových řad • Jelikož platí: k ′ ( ) t ∑ = 0 pro k = 1,3,5,... a t = 0 , t′
dostaneme zjednodušené vztahy pro odhad parametrů modelu ve tvaru: b0 = yt ′
a
b1
∑ t′ ⋅ y = ∑ (t ′) t′
t′
2
.
t′
Ing. Michal Dorda, Ph.D.
40
Analýza časových řad • Př.: Byly sledovány počty prodaných automobilů v jednom roce. Stanovte rovnici lineárního trendu pro tuto časovou řadu. Dále proveďte předpověď počtu prodaných automobilů pro další dva nadcházející měsíce.
Ing. Michal Dorda, Ph.D.
41
Analýza časových řad Měsíc
t'
y t'
t '∙yt' (t ')2
Leden
-6
529
-3174 36
b0
919,42
Únor
-5
621
-3105 25
b1
70,36
Březen -4
689
-2756 16
Duben
-3
692
-2076
9
Květen -2
785
-1570
4
820 898 950 1050 1158 1320 1521 11033
-820 898 1900 3150 4632 6600 9126 12805
1 1 4 9 16 25 36 182
Červen Červenec Srpen Září Říjen Listopad Prosinec ∑
-1 1 2 3 4 5 6 0
y)t ′ = 919,42 + 70,36t ′
Ing. Michal Dorda, Ph.D.
42
Analýza časových řad Počet prodaných automobilů 1600 1400
y = 70,357x + 919,42
1200 1000 800 600 400 200 0 -6
-5
-4
-3
-2
-1
0
Ing. Michal Dorda, Ph.D.
1
2
3
4
5
6 43
Analýza časových řad • Předpověď pro první následující měsíc získáme dosazením t ′ = 7 : y)t ′ = 919,42 + 70,36 ⋅ 7 = 1411 automobilů
• Předpověď pro druhý následující měsíc získáme dosazením t ′ = 8 : y)t ′ = 919,42 + 70,36 ⋅ 8 = 1482 automobilů
Ing. Michal Dorda, Ph.D.
44
Analýza časových řad • Př.: Na základě předchozích sčítání intenzit je známa hodnota RPDI pro předcházející období. Odhadněte rovnici lineárního trendu pro RPDI a extrapolací odhadněte předpokládanou hodnotu RPDI v příštím období.
Ing. Michal Dorda, Ph.D.
45
Analýza časových řad Rok
t
yt
1980
1
11523
1985
2
12201
1990
3
12948
1995
4
13578
2000
5
14987
2005 2010
6 7
16012 17065
b0 = yt − b1 ⋅ t n
b1 =
∑t ⋅ y
R2 =
t =1
n
t
− yt ⋅ ∑ t t =1
n
n
t =1 n
t =1
2 t ∑ −t ⋅∑t
.
2 ˆ ( ) y − y ∑ t t t =1 n
2 ( ) y − y ∑ t t t =1
Ing. Michal Dorda, Ph.D.
46
Analýza časových řad 2
2
2
Rok
t
yt
t ∙y t
1980
1
11523
11523
1 11228 7932471,07 6359763,45
1985
2
12201
24402
4 12167 3525542,70 3399809,16
1990
3
12948
38844
9 13106 881385,67
1995
4
13578
54312 16 14045
2000
5
14987
74935 25 14984 881385,67
2005 2010 ∑ Průměr
6 7 28 4
16012 17065
96072 36 15923 3525542,70 3869651,02 119455 49 16861 7932471,07 9121262,88 419543 140 24678798,89 25059170,86
t
ŷt
(ŷt -yp )
(y t -y p )
0,00
1203095,59 217955,59 887633,16
14044,86
b0
10289,57
b1
938,82
R Vývoj RPDI
2
0,98
yˆ t = 10289,57 + 938,82 ⋅ t
18000 17000 16000 RPDI
15000
y = 938,82x + 10290 R² = 0,9848
14000 13000 12000 11000 10000 1
2
3
4
5
6
7
t
Ing. Michal Dorda, Ph.D.
47
Analýza časových řad • Předpověď pro první následující období (rok 2015) získáme dosazením t=8 do rovnice trendu: yˆ 8 = 10289,57 + 938,82 ⋅ 8 =& 17800 vozidel ⋅ den -1 .
Ing. Michal Dorda, Ph.D.
48
Analýza časových řad 2) Parabolický trend • Pro odhad průběhu trendu lze psát: ) yt = b0 + b1 ⋅ t + b2 ⋅ t 2 ,
resp. po provedení transformace časové proměnné: 2 y)t ′ = b0 + b1 ⋅ t ′ + b2 ⋅ (t ′) .
Ing. Michal Dorda, Ph.D.
49
Analýza časových řad • Aplikací metody nejmenších čtverců dostaneme: 2 2 2 ) ϕ = ∑ ( yt ′ − yt ′ ) = ∑ [yt ′ − b0 − b1 ⋅ t ′ − b2 ⋅ (t ′) ] → min . t′ t′ • Položíme-li parciální derivací rovny nule a upravíme, dostaneme: 2 ′ ′ ( ) y nb b t b t − − − ∑ t′ 0 1 ∑ 2 ∑ = 0, t′
t′
t′
∑ t ′ ⋅ yt′ − b0 ∑ t ′ − b1 ∑ (t ′) − b2 ∑ (t ′) = 0, 2
t′
t′
t′
3
t′
2 2 3 4 ′ ′ ′ ′ ( ) ( ) ( ) ( ) t ⋅ y − b t − b t − b t = 0. ∑ t′ 0∑ 1∑ 2∑ t′
t′
t′
Ing. Michal Dorda, Ph.D.
t′
50
Analýza časových řad • Úpravami získáme: 4 2 2 ′ ′ ′ ( ) ( ) ( ) y ⋅ t − t ⋅ y ⋅ t ∑ t′ ∑ ∑ ∑ t′ b0 =
b1
t′
t′
t′
t′
4 2 n∑ (t ′) − ∑ (t ′) t′ t′
∑ t′ ⋅ y = ∑ (t ′) t′
,
2
t′
,
2
t′
n∑ (t ′) ⋅ yt ′ − ∑ yt ′ ⋅ ∑ (t ′) 2
b2 =
2
t′
t′
t′
2 n∑ (t ′) − ∑ (t ′) t′ t′
2
.
4
Ing. Michal Dorda, Ph.D.
51
Analýza časových řad • Př.: Byly sledovány počty prodaných automobilů v jednom roce. Stanovte rovnici parabolického trendu pro tuto časovou řadu.
Ing. Michal Dorda, Ph.D.
52
Analýza časových řad t '∙y t' (t ')2 (t ') 4 (t ')2∙y t'
b0
828,97
625 15525
b1
14,92
Březen -4 689 -2756 16
256 11024
b2
-5,69
Duben
Měsíc
t ' y t'
Leden
-6 529 -3174 36 1296 19044
Únor
-5 621 -3105 25 -3 692 -2076
9
81
6228
Květen -2 785 -1570
4
16
3140
1 1 4 9 16 25 36 182
1 1 16 81 256 625 1296 4550
820 898 3284 7164 12128 19050 26676 124981
Červen Červenec Srpen Září Říjen Listopad Prosinec ∑
-1 1 2 3 4 5 6 0
820 898 821 796 758 762 741 8912
-820 898 1642 2388 3032 3810 4446 2715
2 y)t ′ = 828,97 + 14,92t ′ − 5,69(t ′)
Ing. Michal Dorda, Ph.D.
53
Analýza časových řad Počet prodaných automobilů 1000 900 800 700 600 500 400 300 200 100 0
y = -5,6906x2 + 14,918x + 828,97
-6
-5
-4
-3
-2
-1
0
Ing. Michal Dorda, Ph.D.
1
2
3
4
5
6 54
Analýza časových řad • Pro posouzení kvality modelu se opět používá index determinace, který je definován stejně jako u lineárního trendu.
Ing. Michal Dorda, Ph.D.
55
Analýza časových řad 3) Exponenciální trend • Pro odhad průběhu trendu lze psát: ) yt = b0 ⋅ b1t pro b1 > 0. • Tento model není lineární v parametrech, nelze přímo použít metodu nejmenších čtverců.
Ing. Michal Dorda, Ph.D.
56
Analýza časových řad • Odhad parametrů modelu lze získat: a) Metodou linearizující transformace a aplikací metody nejmenších čtverců. b) Metodou linearizující transformace a aplikací vážené metody nejmenších čtverců.
• K odhadu parametrů lze použít i jiných metod než metoda nejmenších čtverců – Metoda vybraných bodů. Ing. Michal Dorda, Ph.D.
57
Analýza časových řad a) Nejdříve provedeme linearizující transformaci (budeme pracovat s transformovanou proměnnou t’):
(
)
log y)t ′ = log b0 ⋅ b1t ′ , log y)t ′ = log b0 + t ′ ⋅ log b1.
Označme A = log b0 , B = log b1 , potom můžeme psát: log y)t ′ = A + t ′ ⋅ B. Ing. Michal Dorda, Ph.D.
58
Analýza časových řad • Nyní lze aplikovat metodu nejmenších čtverců v logaritmickém tvaru, tedy: ϕ = ∑ (log yt ′ − log y)t ′ )2 = ∑ (log yt ′ − A − B ⋅ t ′)2 → min . t′
t′
• Známým postupem dostaneme:
∑ log yt′ − n log b0 − log b1 ⋅ ∑ t ′ = 0 ⇒ log b0 = t′
t′
∑ log y t′
n
∑ t ′ ⋅ log yt′ − log b0 ⋅ ∑ t ′ − log b1 ⋅ ∑ (t ′) = 0 ⇒ log b1 2
t′
t′
t′
t′
,
∑ t ′ ⋅ log y = ∑ (t ′) t′
2
t′
Ing. Michal Dorda, Ph.D.
59
t′
.
Analýza časových řad • Jelikož jsme použili metodu nejmenších čtverců v logaritmické formě, je nutno přistoupit ke stanovení indexu determinace rovněž v logaritmické formě:
∑ (log yˆ n
R2 =
t =1 n
∑ (log y t =1
t
t
− log yt
)
− log yt
)
2
.
2
Ing. Michal Dorda, Ph.D.
60
Analýza časových řad b) Odhad parametrů touto metodou nemá příliš dobré statistické vlastnosti, vhodnější je použít váženou metodu nejmenších čtverců: ϕ = ∑ wt ′ ⋅ (log yt ′ − log y)t ′ )2 = ∑ wt ′ ⋅ (log yt ′ − A − B ⋅ t ′)2 → min , t′
t′
kde wt ′ = yt2′ .
Ing. Michal Dorda, Ph.D.
61
Analýza časových řad • Známým postupem dostaneme: 2 2 2 ′ y ⋅ log y − log b ⋅ y − log b ⋅ t ⋅ y ∑ t′ t′ t ′ = 0, 0 ∑ t′ 1 ∑ t′
t′
t′
2 2 2 ′ ′ ′ ( ) y ⋅ t ⋅ log y − log b ⋅ t ⋅ y − log b ⋅ t ⋅ y ∑ t′ t′ 0 ∑ t′ 1 ∑ t ′ = 0. 2
t′
t′
Ing. Michal Dorda, Ph.D.
t′
62
Analýza časových řad • Řešením bychom získali vztahy pro odhad parametrů ve tvaru: 2 2 2 2 2 ′ ′ ′ ( ) y ⋅ log y ⋅ t ⋅ y − t ⋅ y ⋅ t ⋅ y ∑ t′ ∑ t′ ∑ t′ ⋅ log yt′ t′ ∑ t′ log b0 =
t′
t′
t′
,
2
2 ∑t′ y ⋅ ∑t′ (t ′) ⋅ y − ∑t′ t ′ ⋅ yt′ 2 2 2 2 ′ ′ y ⋅ t ⋅ y ⋅ log y − y ⋅ log y ⋅ t ⋅ y ∑ t′ ∑ t′ ∑ t′ t′ t′ ∑ t′ 2
2 t′
log b1 =
t′
t′
t′
2 t′
t′
2 ∑t′ y ⋅ ∑t′ (t ′) ⋅ y − ∑t′ t ′ ⋅ yt′ 2 t′
2
t′
2
.
2 t′
Ing. Michal Dorda, Ph.D.
63
Analýza časových řad • Př.: Byly sledovány počty prodaných automobilů v jednom roce. Stanovte rovnici exponenciálního trendu metodou nejmenších čtverců a váženou metodou nejmenších čtverců pro tuto časovou řadu a dosažený výsledky porovnejte.
Ing. Michal Dorda, Ph.D.
64
Analýza časových řad t '∙logy t' (t ') 2 (y t' - ŷ t' )2
Měsíc
t'
y t'
logy t'
Leden
-6
52
1.72
-10.30
36
17290.54
Únor
-5 258
2.41
-12.06
25
84.28
Březen -4 529
2.72
-10.89
16
19590.38
Duben
-3 985
2.99
-8.98
9
175173.17
Květen -2 1524
3.18
-6.37
4
3.33 3.42 3.51 3.65 3.79 3.99 4.18 38.91
-3.33 3.42 7.01 10.96 15.17 19.96 25.09 29.70
1 1 4 9 16 25 36 182
Červen Červenec Srpen Září Říjen Listopad Prosinec ∑
-1 1 2 3 4 5 6 0
2152 2654 3215 4502 6215 9821 15214 47121
logb 0
3,24
logb 1
0,16
b0
1748,73
488863.18
b1
1,46
904422.84 11603.65 242628.46 803718.29 2708077.41 2639502.72 2107511.80 8513042.34
lnb 1
0,38
Ing. Michal Dorda, Ph.D.
log a x = y ⇒ ⇒ x = ay
65
Analýza časových řad Měsíc
t ' (t ')2
y t'
(y t' )
2
logy t'
t '∙(y t' )
2
Leden
-6 36
52
2704
1.72
-16224
Únor
-5 25
258
66564
2.41
Březen -4 16
529
279841
Duben
2
t '∙(y t' ) ∙logy t'
2
(y t' ) ∙logy t'
(y t' - ŷ t' )
97344
-27840.44
4640.07
32153.93
-332820
1664100
-802635.27
160527.05
4708.77
2.72
-1119364
4477456
-3048538.23
762134.56
4597.79
(t ') ∙(y t' )
2
2
2
-3
9
985
970225
2.99
-2910675
8732025
-8712920.00
2904306.67
111414.83
Květen -2
4
1524
2322576
3.18
-4645152
9290304
-14785448.99
7392724.49
365395.78
1 1 4 9 16 25 36 182
2152 2654 3215 4502 6215 9821 15214 47121
4631104 7043716 10336225 20268004 38626225 96452041 231465796 412465021
3.33 3.42 3.51 3.65 3.79 3.99 4.18 38.91
-4631104 7043716 20672450 60804012 154504900 482260205 1388794776 2100424720
4631104 7043716 41344900 182412036 618019600 2411301025 8332768656 11621782266
-15434739.15 24116985.68 72502023.39 222141711.30 586105242.91 1925257831.60 5808277802.43 8595589475.23
15434739.15 24116985.68 36251011.70 74047237.10 146526310.73 385051566.32 968046300.41 1660698483.93
728673.34 4266.06 193830.52 434656.05 1150923.38 220428.55 467394.42 3718443.43
Červen Červenec Srpen Září Říjen Listopad Prosinec ∑
-1 1 2 3 4 5 6 0
Ing. Michal Dorda, Ph.D.
logb 0
3,26
logb 1
0,15
b0
1833,33
b1
1,41
lnb 1
0,35
66
Analýza časových řad • Metodou nejmenších čtverců jsme získali: 2 ) ϕ = ∑ ( yt ′ − yt ′ ) =& 8513042,34 . t′
• Váženou metodou nejmenších čtverců jsme získali: ϕ = ∑ ( yt ′ − y)t ′ )2 =& 3718443,43. t′
• Vidíme, že reziduální součet čtverců je v druhém případě podstatně nižší, proto bychom za odhad parametrů zvolili tyto výsledky. Ing. Michal Dorda, Ph.D.
67
Analýza časových řad Počet prodaných automobilů 20000 18000 16000 14000 12000 10000 8000 6000 4000 2000 0
y = 1748,7e 0,3757x
-6
-5
-4
-3
-2
-1
0
Ing. Michal Dorda, Ph.D.
1
2
3
4
5
6 68
Analýza časových řad 4) Modifikovaný exponenciální trend • Pro odhad průběhu trendu lze psát: ) yt = k + b0 ⋅ b1t pro b1 > 0 . • Odhad parametrů je již složitější, protože trendovou funkci nemůžeme linearizovat pro použití metody nejmenších čtverců.
Ing. Michal Dorda, Ph.D.
69
Analýza časových řad yt
yt
k > 0, b0 < 0
k > 0, b0 < 0
0 < b1 < 1
b1 > 1 t
yt
t yt
k > 0, b0 > 0 0 < b1 < 1
k > 0, b0 > 0 b1 > 1
t Ing. Michal Dorda, Ph.D.
t 70
Analýza časových řad • Metody, které se používají pro odhad parametrů modifikované exponenciální trendové funkce, jsou: a) Metoda částečných součtů. b) Metoda dílčích průměrů. c) Metoda vybraných bodů.
Ing. Michal Dorda, Ph.D.
71
Analýza časových řad a) Metoda částečných součtů je založena na vytvoření tří na sebe navazujících a současně disjunktních součtů S1, S2 a S3 o délce m, přičemž platí, že n=3m, kde n je počet pozorování. Platí tedy: S1 =
n−2m
∑ y ,S
t t = n − 3 m +1
2
=
n−m
∑ y ,S
t t = n − 2 m +1
3
=
n
∑y .
t = n − m +1
Ing. Michal Dorda, Ph.D.
t
72
Analýza časových řad • Není-li počet pozorování dělitelný 3, potom se vynechává potřebný počet pozorování na začátku časové řady – pro potřeby odhadu parametrů vynecháme prvních n-3m pozorování, zbývajícím pozorováním potom přiřadíme pořadí 1 až 3m. • Nyní dosadíme do částečných součtů předpisy pro odhad modifikované exponenciální trendové funkce. Ing. Michal Dorda, Ph.D.
73
Analýza časových řad S1 = S2 = S3 =
n−2 m
∑ yt =
∑ (k + b ⋅ b ) = m ⋅ k + b ⋅ ∑ b
∗
∑ (k + b ⋅ b ) = m ⋅ k + b ⋅ ∑ b
∗
n−2m
t = n −3 m +1
t = n −3 m +1
n−m
n−m
∑ yt =
t = n − 2 m +1 n
∑ yt =
t = n − m +1
0
t 1
n−2 m
0
t 1 t = n −3 m +1 n−m
t 1
0
t = n − 2 m +1
0
t 1 t = n − 2 m +1
∑ (k + b ⋅ b ) = m ⋅ k + b ⋅ ∑ b n
t = n − m +1
n
0
t 1
0
, ,
∗
t 1 t = n − m +1
.
* Je třeba si uvědomit, že tyto výrazy reprezentují součet m členů geometrické posloupnosti. Pro tento součet obecně platí: qm −1 S m = a1 ⋅ . q −1 Ing. Michal Dorda, Ph.D.
74
Analýza časových řad • Využijeme-li znalostí o součtu prvních m členů geometrické posloupnosti, dostaneme: m m b − 1 b −1 S1 = m ⋅ k + b0 ⋅ b1n −3m +1 ⋅ 1 = m ⋅ k + b0 ⋅ b1 ⋅ 1 , b1 − 1 b1 − 1 m m b − 1 b n − 2 m +1 m +1 1 1 −1 S 2 = m ⋅ k + b0 ⋅ b1 ⋅ = m ⋅ k + b0 ⋅ b1 ⋅ , b1 − 1 b1 − 1 m m 1 b − b n − m +1 2 m +1 1 1 −1 S3 = m ⋅ k + b0 ⋅ b1 ⋅ . = m ⋅ k + b0 ⋅ b1 ⋅ b1 − 1 b1 − 1
Ing. Michal Dorda, Ph.D.
75
Analýza časových řad • Máme soustavu 3 rovnic o 3 neznámých, kterými jsou odhady parametrů modifikovaného exponenciálního trendu. • Vynásobme první rovnici (-1) a přičtěme ji k druhé rovnici. Po menších úpravách dostaneme:m m b1 − 1 m +1 b1 − 1 S 2 − S1 = b0 ⋅ ⋅ b1 − b1 = b0 ⋅ ⋅ b1 ⋅ b1m − 1 = b1 − 1 b1 − 1
(
( b =b ⋅
(
)
)
2
−1 ⋅ b1 . b1 − 1 m 1
0
)
Ing. Michal Dorda, Ph.D.
76
Analýza časových řad • Z tohoto výrazu již můžeme vyjádřit: b0 =
b1 − 1
(
)
b1 ⋅ b − 1 m 1
2
⋅ (S 2 − S1 ).
• Nyní vynásobme druhou rovnici (-1) a přičtěme ji ke třetí rovnici. Po menších úpravách dostaneme:
b1m − 1 2 m +1 m +1 b1m − 1 m +1 m S3 − S 2 = b0 ⋅ ⋅ b1 − b1 = b0 ⋅ ⋅ b1 ⋅ b1 − 1 = b1 − 1 b1 − 1
(
= b0 ⋅
(b
(
)
)
2
−1 ⋅ b1m +1 . b1 − 1 m 1
)
Ing. Michal Dorda, Ph.D.
77
Analýza časových řad • Dosadíme-li do získaného výrazu vztah pro výpočet parametru b0, dostaneme: S3 − S 2 =
b1 − 1
(
)
b1 ⋅ b − 1 m 1
2
( b − 1) ⋅ (S − S ) ⋅ b −1 m 1
2
1
2
⋅ b1m +1 .
1
• Po úpravách můžeme vyjádřit b1 ve tvaru 1 m
(S 3 − S 2 ) b1 = . (S 2 − S1 )
Ing. Michal Dorda, Ph.D.
78
Analýza časových řad • Poslední parametr k můžeme potom vyjádřit např. z první rovnice. Dostaneme: b1m − 1 S1 − b0 ⋅ b1 ⋅ b1 − 1 k= . m
Ing. Michal Dorda, Ph.D.
79
Analýza časových řad • Př.: Je zadána časová řada čítající 9 pozorování. Metodou částečných součtů proveďte odhad parametrů posunutého exponenciálního trendu. t y t
1 2 3 4 5 6 7 8 9 Ing. Michal Dorda, Ph.D.
3 10 15 21 35 42 58 81 110 80
Analýza časových řad • Odvodili jsme si, že odhady parametrů získáme podle vztahů: b1 − 1 b0 = ⋅ (S 2 − S1 ), 2 m
(
)
b1 ⋅ b1 − 1
1 m
(S 3 − S 2 ) b1 = , (S 2 − S1 )
b1m − 1 S1 − b0 ⋅ b1 ⋅ b1 − 1 ak= . m Ing. Michal Dorda, Ph.D.
81
Analýza časových řad • Dosazením do těchto vztahů dostaneme následující výsledky. m S1
3 28
S2
98
S3
249
b0
11,82
b1 k
1,29 -10,83
t 1 2 3 4 5 6 7 8 9
yt 3 10 15 21 35 42 58 81 110
ŷt 4,44 8,90 14,66 22,11 31,73 44,16 60,22 80,98 107,80
ˆyt = −10,83 + 11,82 ⋅1,29t Ing. Michal Dorda, Ph.D.
82
Analýza časových řad Pozorování
Trend
4
6
120 100
yt
80 60 40 20 0 0
2
8
10
t
Ing. Michal Dorda, Ph.D.
83
Analýza časových řad b) Metoda dílčích průměrů je modifikací metody předchozí. Tato metoda zavádí dolní dílčí součet Sd, horní dílčí součet Sh a prostřední součet Sp. Pro první dva součty platí: 1 5 S d = ⋅ ∑ yt , 5 t =1 1 n S h = ⋅ ∑ yt . 5 t =n−4 Ing. Michal Dorda, Ph.D.
84
Analýza časových řad • Máme-li lichý počet pozorování n, potom pro prostřední součet platí: ( n +1) + 2
1 2 S p = ⋅ ∑ yt , 5 t = (n +1) − 2 2
je-li n sudé, potom platí: n +3 2
1 S p = ⋅ ∑ yt . 6 t = n −2 2
Ing. Michal Dorda, Ph.D.
85
Analýza časových řad • Parametr trendu b1 potom stanovíme dle vztahu: Sh − S p b1 = S −S d p
2 ( n −5 )
• Známe-li parametr trendu b1, potom lze trendovou funkci považovat za lineární v parametrech a můžeme použít metodu nejmenších čtverců. Ing. Michal Dorda, Ph.D.
86
Analýza časových řad • Můžeme tedy psát: ϕ = ∑ ( yt − k − b0 ⋅ b n
)
t 2 1
t =1
→ min .
• Známým postupem dostaneme: n
n
t =1
t =1
t y − n ⋅ k − b ⋅ b ∑ t 0 ∑ 1 = 0, n
∑ y ⋅b t =1
t
t 1
n
n
( )
− k ⋅ ∑ b − b0 ⋅ ∑ b t =1
t 1
t =1
t 2 1
= 0.
Ing. Michal Dorda, Ph.D.
87
Analýza časových řad • Z první rovnice můžeme vyjádřit b0 ve tvaru: n
b0 =
∑y t =1
t
− n⋅k .
n
t b ∑1 t =1
• Dosadíme-li tento výraz do druhé rovnice, dostaneme po úpravách:
∑ y ⋅ b ⋅ ∑ b − ∑ y ⋅ ∑ (b ) n
k=
t =1
n
t
t 1
n
t 1
t =1
2
t =1
n
t
t =1
( )
n n t ∑ b1 − n ⋅ ∑ b1t t =1 t =1
t 2 1
.
2
Ing. Michal Dorda, Ph.D.
88
Analýza časových řad c) Metoda vybraných bodů je založena na výběru počátečního bodu t, který pro jednoduchost zpravidla volíme t=0. Další dva body volíme t+m a t+2m, kde opět platí, že: n m= . 3
Ing. Michal Dorda, Ph.D.
89
Analýza časových řad • Parametry trendové funkce potom stanovíme dle vztahů: 1 m
y t + 2 m − yt + m , b1 = yt + m + yt yt + m − yt b0 = t + m , b1 − 1 k = yt − b0 ⋅ b1 .
Ing. Michal Dorda, Ph.D.
90
Analýza časových řad 5) Logistický trend • Pro odhad průběhu trendu lze psát: ) yt =
k . −b1t 1 + b0 ⋅ e
• Tento funkční předpis je jeden z možných předpisů pro logistický trend. • Logistická křivka se někdy také nazývá S-křivka. Ing. Michal Dorda, Ph.D.
91
Analýza časových řad yt
5. fáze 4. fáze
3. fáze
1. fáze
2. fáze t Ing. Michal Dorda, Ph.D.
92
Analýza časových řad • Průběh logistického trendu lze rozdělit do 5 fází: – 1. fáze: vznik nových výrobků a inovací, které se začínají pozvolna prosazovat (rozvoj je zpomalován existencí starých výrobků, které si zatím zachovávají svůj vliv). – 2. fáze: dochází k výraznému prosazení nových výrobků a inovací.
Ing. Michal Dorda, Ph.D.
93
Analýza časových řad – 3. fáze: nové výrobky a inovace plně ovládly další vývoj, nicméně dochází k náznaku změny trendu – objevují se novější výrobky a další inovace (v této fázi se nachází inflexní bod). – 4. fáze: dochází k útlumu a postupnému nahrazování novějšími výrobky a inovacemi. – 5. fáze: dochází k úplnému útlumu a nahrazení novějšími výrobky a inovacemi.
Ing. Michal Dorda, Ph.D.
94
Analýza časových řad • Odhad parametrů logistického trendu lze provést více způsoby a to: a) Metodou částečných součtů. b) Metodou vybraných bodů.
Ing. Michal Dorda, Ph.D.
95
Analýza časových řad a) Při odhadu parametrů metodou částečných součtů zavedeme pro t=1,2,…,n substituci: 1 xˆt = . yˆ t
• Potom můžeme psát: xˆt =
1 1 b0 t = + ⋅ b1 , k k k 1 + b0 ⋅ b1t
což je zápis modifikované exponenciální trendové funkce. Ing. Michal Dorda, Ph.D.
96
Analýza časových řad • Dále tedy postupujeme jako u odhadu parametrů pro modifikovaný exponenciální trend. • Zaveďme následující značení: 1 K= , k b B0 = 0 . k
Ing. Michal Dorda, Ph.D.
97
Analýza časových řad • Pro funkci logistického trendu můžeme tedy psát: xˆt = K + B0 ⋅ b1t .
• Nyní vytvoříme 3 částečné součty, každý o délce m pozorování: n−2 m
n−m n 1 1 1 S1 = ∑ , S2 = ∑ , S3 = ∑ . t = n −3 m +1 yt t = n − 2 m +1 yt t = n − m +1 yt
Ing. Michal Dorda, Ph.D.
98
Analýza časových řad • Známými vztahy spočítáme odhady koeficientů modelu: b1 − 1 B0 = ⋅ (S 2 − S1 ), 2 m
(
)
b1 ⋅ b1 − 1
1 m
(S 3 − S 2 ) b1 = , (S 2 − S1 )
b1m − 1 S1 − B0 ⋅ b1 ⋅ b1 − 1 aK= . m Ing. Michal Dorda, Ph.D.
99
Analýza časových řad • Odhady původních parametrů modelu potom získáme zpětnou transformací: 1 , K b0 = k ⋅ B0 . k=
• Tento postup lze použít pouze tehdy, pokud je mají rozdíly S2-S1 a S3-S2 stejná znaménka. Ing. Michal Dorda, Ph.D.
100
Analýza časových řad • Př.: V tabulce je dána časová řada vývoje stupně automobilizace v ČR v letech 1990 – 2008. Nalezněte odhad logistické trendové funkce popisující tento vývoj a odhadněte stupeň automobilizace v roce 2015.
Ing. Michal Dorda, Ph.D.
101
Rok 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Počet osobních vozidel na 1000 obyvatel 233 241 250 266 283 295 309 329 339 335 335 345 358 363 374 387 399 412 424 Ing. Michal Dorda, Ph.D.
102
Analýza časových řad • Jelikož nemáme počet pozorování dělitelný 3, musíme vynechat 1. pozorování, potom budeme tvořit částečné součty o délce m=6 pozorování, pro potřeby těchto výpočtů zavedeme potřebnou transformaci a přečíslujeme si časovou proměnnou t.
Ing. Michal Dorda, Ph.D.
103
Analýza časových řad t 1 2
1/y t 0,00415 0,00400
3
0,00376
4 5 6
0,00353 0,00339 0,00324
7 8 9 10 11 12
0,00304 0,00295 0,00299 0,00299 0,00290 0,00279
13 14 15 16 17 18
0,00275 0,00267 0,00258 0,00251 0,00243 0,00236 Ing. Michal Dorda, Ph.D.
m S1
6 0,02207
S2
0,01765
S3
0,01530
104
Analýza časových řad • Odvozenými vztahy spočítáme odhady parametrů pro substituovaný trend: b1 − 1 B0 = ⋅ (S 2 − S1 ), 2 m B0
0,00224
b1 K
0,89996 0,00211
(
)
b1 ⋅ b1 − 1
1 m
(S 3 − S 2 ) b1 = , (S 2 − S1 )
b1m − 1 S1 − B0 ⋅ b1 ⋅ b1 − 1 aK= . m Ing. Michal Dorda, Ph.D.
105
Analýza časových řad • A nakonec zpětnou transformací získáme odhady parametrů logistického trendu: b0
1,06
b1 k
0,90 474,53
1 , K b0 = k ⋅ B0 . k=
• Dostáváme rovnici trendu ve tvaru: yˆ t =
474,53 . t 1 + 1,06 ⋅ 0,9 Ing. Michal Dorda, Ph.D.
106
Analýza časových řad Počet osobních vozidel na 1000 obyvatel
Pozorování
Trend
450 400 350 300 250 200 0
5
10
15
20
t
Ing. Michal Dorda, Ph.D.
107
Analýza časových řad • Odhad stupně automobilizace pro rok 2015 dostaneme dosazením za t=26: 474,53 yˆ 26 = = 444 automobilů na 1000 obyvatel. 26 1 + 1,06 ⋅ 0,9
Ing. Michal Dorda, Ph.D.
108
Analýza časových řad b) Při metodě vybraných bodů opět vybereme počáteční bod t, který pro jednoduchost volíme t=0. Další dva body volíme t+m a t+2m. • Dosazením do funkčního předpisu pro logistický trend dostaneme: k k k y0 = , ym = , y2 m = . m 2m 1 + b0 1 + b0 ⋅ b1 1 + b0 ⋅ b1
Ing. Michal Dorda, Ph.D.
109
Analýza časových řad • Z prvního vztahu vyjádříme b0: k − y0 b0 = . y0
• Dosazením do druhého vztahu a následnými úpravami můžeme vyjádřit b1 ve tvaru: 1 m
y0 ⋅ (k − ym ) b1 = . ym ⋅ (k − y0 )
Ing. Michal Dorda, Ph.D.
110
Analýza časových řad • Dosadíme-li oba parametry do poslední rovnice, můžeme vyjádřit parametr k: 2 y0 ⋅ ym ⋅ y2 m − ym2 ⋅ ( y0 + y2 m ) . k= y0 ⋅ y2 m − ym2
Ing. Michal Dorda, Ph.D.
111
Analýza časových řad • Odhad parametrů logistického trendu metodou vybraných bodů lze realizovat i dalším způsobem. Uvažujme opět body t, t+m a t+2m (pro jednoduchost opět zvolíme t=0).
Ing. Michal Dorda, Ph.D.
112
Analýza časových řad • Zaveďme pomocné veličiny: S1 = S2 =
1 yt + 2 m 1 yt + m
−
1 yt + m
1 + b0 ⋅ b1t + 2 m 1 + b0 ⋅ b1t + m , = − k k
1 1 + b0 ⋅ b1t + m 1 + b0 ⋅ b1t − = − , yt k k
yt + m 1 + b0 ⋅ b1t S3 = = . t +m yt 1 + b0 ⋅ b1
Ing. Michal Dorda, Ph.D.
113
Analýza časových řad • Dosadíme-li za t=0, můžeme psát: m ⋅ b b b0 1 + b0 ⋅ b12 m 1 + b0 ⋅ b1m m 0 1 − = b1 ⋅ − , S1 = k k k k 1 + b0 ⋅ b1m 1 + b0 b0 ⋅ b1m b0 S2 = − = − , k k k k 1 + b0 S3 = . m 1 + b0 ⋅ b1
Ing. Michal Dorda, Ph.D.
114
Analýza časových řad • Dosadíme-li do 1. rovnice 2. rovnici, dostaneme: S1 = b1m ⋅ S 2 ,
z čehož už snadno vyjádříme: 1 m
S1 b1 = . S2
Ing. Michal Dorda, Ph.D.
115
Analýza časových řad • Dosadíme-li b1 do 3. rovnice, můžeme psát: 1 + b0
1 + b0 S3 = = , m 1 S1 1 b + ⋅ m 0 S 1 S2 1 + b0 ⋅ S 2
z čehož vyjádříme b0: S3 − 1 b0 = . S1 ⋅ S3 1− S2 Ing. Michal Dorda, Ph.D.
116
Analýza časových řad • Známe-li parametry b0 a b1, můžeme parametr k vyjádřit z funkčního předpisu logistické trendové funkce, kde dosadíme t=0: k y0 = ⇒ k = y0 ⋅ (1 + b0 ). 0 1 + b0 ⋅ b1
Ing. Michal Dorda, Ph.D.
117
Analýza časových řad
Ing. Michal Dorda, Ph.D.
118
Analýza časových řad 6) Gompertzova křivka • Má podobný průběh jako logistická křivka, ale není symetrická. • Pro odhad průběhu trendu lze psát: ) b1t yt = k ⋅ b0 .
Ing. Michal Dorda, Ph.D.
119
Analýza časových řad yt k
t Ing. Michal Dorda, Ph.D.
120
Analýza časových řad • Chceme-li provést odhad parametrů Gompertzovy funkce, zlogaritmováním převedeme funkční předpis do podoby: ln yˆ t = ln k ⋅ b , b1t 0
ln yˆ t = ln k + b1t ⋅ ln b0 .
• Touto úpravou jsme v podstatě získali funkci modifikovaného exponenciálního trendu.
Ing. Michal Dorda, Ph.D.
121
Analýza časových řad • Zavedeme-li substituce K=lnk a B0=lnb0, můžeme parametry trendové funkce odhadnout stejnými metodami jako u modifikovaného exponenciálního trendu.
Ing. Michal Dorda, Ph.D.
122
Analýza časových řad • Nyní se zaměřme na to, na základě jakých kritérií zvolit vhodný typ trendu. Vhodný typ trendu lze volit: 1. Na základě analýzy grafu studované časové řady (zda jde o rostoucí či klesající trend, zda přichází v úvahu inflexní bod, zda jde o funkci rostoucí do nekonečna nebo rostoucí k nějaké konečné limitě apod.)
Ing. Michal Dorda, Ph.D.
123
Analýza časových řad 2) Dále lze vhodný typ trendové funkce vybrat na základě hodnoty reziduálního součtu čtverců, kdy z možných trendových funkcí vybereme tu s minimálním reziduálním součtem čtverců. Dalším kritériem může být index determinace známý z regresní analýzy, jako vhodný typ trendové funkce vybereme takový, u kterého je index determinace nejvyšší. Snahou je ale použít co nejjednodušší model trendové funkce.
Ing. Michal Dorda, Ph.D.
124
Analýza časových řad 3) Rozhodujeme-li se mezi lineárním, parabolickým nebo exponenciálním trendem, lze použít analýzu diferencí časové řady. Diference příslušných řádů definujeme: D1t = yt − yt −1 pro t = 2,..., n, D 2t = D1t − D1t −1 pro t = 3,..., n, D3t = D 2t − D 2t −1 pro t = 4,..., n, atd.
Ing. Michal Dorda, Ph.D.
125
Analýza časových řad – Pro lineární trend je typické, že diference prvního řádu jsou přibližně stejné a diference druhého řádu jsou přibližně nulové. t
yt = b0 + b1∙t
D1t
D2t
1
b0 + b1∙1
-
-
2
b0 + b1∙2
b1
-
3
b0 + b1∙3
b1
0
4
b0 + b1∙4
b1
0
Ing. Michal Dorda, Ph.D.
126
Analýza časových řad – Pro parabolický trend je typické, že diference prvního řádu vykazují lineární trend, diference druhého řádu jsou přibližně stejné a diference třetího řádu přibližně nulové. t
yt = b0 + b1∙t + b2∙t2
D1t
D2t
D3t
1
b0 + b1∙1 + b2∙12
-
-
-
2
b0 + b1∙2 + b2∙22
b1 + b2∙3
-
-
3
b0 + b1∙3 + b2∙32
b1 + b2∙5
b2∙2
-
4
b0 + b1∙4 + b2∙42
b1 + b2∙7
b2∙2
0
5
b0 + b1∙5 + b2∙52
b1 + b2∙9
b2∙2
0
Ing. Michal Dorda, Ph.D.
127
Analýza časových řad – Na exponenciální trend budeme usuzovat na základě relativních diferencí prvního řádu definovaných podílem: D1t pro t = 3,..., n D1t −1
a nebo na základě temp růstu definovaných: yt kt = pro t = 2,..., n . yt −1
Ing. Michal Dorda, Ph.D.
128
Analýza časových řad – Budou-li tyto charakteristiky kolísat kolem konstanty, lze pro popis trendové složky časové řady použít exponenciální trend.
Ing. Michal Dorda, Ph.D.
129
Analýza časových řad 4) Vhodný typ trendové funkce lze provést na základě analýzy růstových charakteristik. Předpokladem je očištění časové řady od náhodných výkyvů a výpočet průměrných růstových charakteristik. Očištění časové řady od nahodilého kolísání se nejčastěji provádí pomocí lineárních filtrů, nejčastěji pomocí klouzavých průměrů. Ing. Michal Dorda, Ph.D.
130
Analýza časových řad • Výpočet klouzavých průměrů: – Zvolme liché m < n , kde n je počet pozorování. – Postupně spočítáme průměr pro prvních m pozorování – tedy pro y1 , y2 ,..., ym , pak pro dalších m pozorování – tedy pro y2 , y3 ,..., ym+1 atd. Obecně můžeme psát: yt =
yt − p + yt − p +1 + ... + yt + p m
,
m −1 pro t = p + 1, p + 2,..., n − p, kde m = 2 p + 1⇒ p = . 2 Ing. Michal Dorda, Ph.D.
131
Analýza časových řad • Hodnotu p volíme zpravidla 2, 3 nebo 4. • Zaveďme dále průměrnou růstovou charakteristiku počítanou klouzavým způsobem z m pozorování: − ∆t =
m −1 m −1 ⋅ y m −1 ⋅ y m −1 − ... − yt −1 + yt +1 + ... + t− t+ 2 2 2 2 m m −1 m +1 ⋅ ⋅ 3 2 2
pro t = p + 1, p + 2,..., n − p . Ing. Michal Dorda, Ph.D.
132
Analýza časových řad • Pro m = 5 dostaneme: − 2 yt −2 − yt −1 + yt +1 + 2 yt + 2 ∆t = . 10
• Pro m = 7 dostaneme: − 3 yt −3 − 2 yt − 2 − yt −1 + yt +1 + 2 yt + 2 + 3 yt +3 ∆t = . 28
• Pro m = 9 dostaneme: − 4 yt − 4 − 3 yt −3 − 2 yt − 2 − yt −1 + yt +1 + 2 yt + 2 + 3 yt +3 + 4 yt + 4 ∆t = . 60 Ing. Michal Dorda, Ph.D.
133
Analýza časových řad • Vhodný typ trendu pak stanovíme na základě chování průměrných růstových a z nich odvozených charakteristik.
Ing. Michal Dorda, Ph.D.
134
Analýza časových řad Charakter změny růstové charakteristiky
Vhodný typ trendové funkce
∆t
Přibližně stejná
Lineární trend
∆t
Lineárně roste
Parabolický trend
∆t yt
Přibližně stejná
Exponenciální trend
log ∆ t
Lineárně klesá
Modifikovaný exponenciální trend
Lineárně klesá
Gompertzova křivka
Lineárně klesá
Logistický trend
Růstová charakteristika
∆ log t yt ∆t log 2 yt
Ing. Michal Dorda, Ph.D.
135
Analýza časových řad • Př.: V tabulce jsou uvedeny počty prodaných osobních automobilů značky X v tisících kusů za rok. Na základě rozboru růstových charakteristik vyberte vhodný typ trendové funkce.
Ing. Michal Dorda, Ph.D.
136
Analýza časových řad Rok 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
t 1 2 3 4 5 6 7 8 9 10 11 12 13
yt 23 38 33 50 51 57 85 88 106 140 152 200 225
yt 39,0 45,8 55,2 66,2 77,4 95,2 114,2 137,2 164,6 -
Studovanou časovou řadu nejprve očistíme od nahodilého kolísání pomocí pětičlenných klouzavých průměrů:
5 −1 m = 2 p + 1= 5 ⇒ p = = 2. 2 Pro výpočet klouzavých průměrů platí: yt =
yt − p + yt − p +1 + ... + yt + p m
Ing. Michal Dorda, Ph.D.
.
137
Analýza časových řad • Jednotlivé pětičlenné klouzavé průměry stanovíme: y1 + y2 + y3 + y4 + y5 23 + 38 + 33 + 50 + 51 = = 39 , 5 5 y2 + y3 + y4 + y5 + y6 38 + 33 + 50 + 51 + 57 = = 45,8 , y4 = 5 5 M y3 =
y9 + y10 + y11 + y12 + y13 106 + 140 + 152 + 200 + 225 y11 = = = 164,6 . 5 5
Ing. Michal Dorda, Ph.D.
138
Analýza časových řad Prodaných automobilů v [tis. Kč]
250
200
150
100
50
0 1
3
5
7
9
11
13
Časová proměnná t
Ing. Michal Dorda, Ph.D.
139
Analýza časových řad • Nyní provedeme výpočet průměrných růstových charakteristik počítaných z 5 pozorování dle vztahu: − 2 yt −2 − yt −1 + yt +1 + 2 yt + 2 ∆t = . 10
Ing. Michal Dorda, Ph.D.
140
Analýza časových řad • Postupně dostaneme: − 2 y1 − y2 + y4 + 2 y5 (− 2 ) ⋅ 23 − 38 + 50 + 2 ⋅ 51 ∆ = = = 6,8 , 3
10 10 − 2 y2 − y3 + y5 + 2 y6 (− 2 ) ⋅ 38 − 33 + 51 + 2 ⋅ 57 ∆4 = = = 5,6 , 10 10 M ∆11 =
− 2 y9 − y10 + y12 + 2 y13 (− 2 ) ⋅106 − 140 + 200 + 2 ⋅ 225 = = 29,8 . 10 10
Ing. Michal Dorda, Ph.D.
141
Analýza časových řad t 1 2 3 4 5 6 7 8 9 10 11 12 13
yt 23 38 33 50 51 57 85 88 106 140 152 200 225
yt
∆t
39,0 45,8 55,2 66,2 77,4 95,2 114,2 137,2 164,6 -
6,8 5,6 11,1 11,0 14,1 18,7 18,6 27,0 29,8 -
35,0 30,0 25,0
∆t
20,0 15,0 10,0 5,0 0,0 1
3
5
Ing. Michal Dorda, Ph.D.
7
9
11
13
142
Analýza časových řad • Z průběhu růstové charakteristiky vidíme, že její průběh zhruba lineárně roste, použití lineární trendové funkce se tedy nehodí, parabolická trendová funkce v úvahu přichází.
Ing. Michal Dorda, Ph.D.
143
Analýza časových řad t 1 2 3 4 5 6 7 8 9 10 11 12 13
yt 23 38 33 50 51 57 85 88 106 140 152 200 225
yt
∆t
39,0 45,8 55,2 66,2 77,4 95,2 114,2 137,2 164,6 -
6,8 5,6 11,1 11,0 14,1 18,7 18,6 27,0 29,8 -
0,17436 0,12227 0,20109 0,16616 0,18217 0,19643 0,16287 0,19679 0,18104 -
∆t yt 0,22
0,20
0,18
0,16
∆t yt
0,14
0,12
0,10 1
3
Ing. Michal Dorda, Ph.D.
5
7
9
11
13
144
Analýza časových řad • Z průběhu růstové charakteristiky vidíme, že její průběh zhruba kolísá kolem jedné hodnoty, použití exponenciálního trendu tedy přichází rovněž v úvahu.
Ing. Michal Dorda, Ph.D.
145
Analýza časových řad t 1 2 3 4 5 6 7 8 9 10 11 12 13
yt 23 38 33 50 51 57 85 88 106 140 152 200 225
yt 39,0 45,8 55,2 66,2 77,4 95,2 114,2 137,2 164,6 -
∆ t log ∆ t 6,8 5,6 11,1 11,0 14,1 18,7 18,6 27,0 29,8 -
0,83251 0,74819 1,04532 1,04139 1,14922 1,27184 1,26951 1,43136 1,47422 -
1,60 1,50 1,40 1,30 1,20 1,10 1,00
log ∆ t
0,90 0,80 0,70 1
3
Ing. Michal Dorda, Ph.D.
5
7
9
11
13
146
Analýza časových řad • Jelikož růstová charakteristika v tomto případě neklesá lineárně, nýbrž naopak roste, lze modifikovaný exponenciální trend vyloučit.
Ing. Michal Dorda, Ph.D.
147
Analýza časových řad t 1 2 3 4 5 6 7 8 9 10 11 12 13
yt 23 38 33 50 51 57 85 88 106 140 152 200 225
yt
∆t
39,0 45,8 55,2 66,2 77,4 95,2 114,2 137,2 164,6 -
6,8 5,6 11,1 11,0 14,1 18,7 18,6 27,0 29,8 -
-0,75856 -0,91268 -0,69662 -0,77947 -0,73952 -0,70680 -0,78815 -0,70599 -0,74221 -
∆t log yt 1
3
5
7
9
11
13
-0,60 -0,65 -0,70 -0,75 -0,80 -0,85 -0,90
∆t log yt
-0,95
Ing. Michal Dorda, Ph.D.
148
Analýza časových řad • Jelikož růstová charakteristika v tomto případě lineárně neklesá, lze vyloučit použití Gompertzovy křivky.
Ing. Michal Dorda, Ph.D.
149
Analýza časových řad t 1 2 3 4 5 6 7 8 9 10 11 12 13
yt 23 38 33 50 51 57 85 88 106 140 152 200 225
yt
∆t
39,0 45,8 55,2 66,2 77,4 95,2 114,2 137,2 164,6 -
6,8 5,6 11,1 11,0 14,1 18,7 18,6 27,0 29,8 -
-2,34962 -2,57354 -2,43856 -2,60032 -2,62826 -2,68543 -2,84582 -2,84334 -2,95864 -
∆t log 2 yt 1
3
5
7
9
11
13
-2,30 -2,40 -2,50 -2,60 -2,70 -2,80
∆t log 2 yt
-2,90 -3,00
Ing. Michal Dorda, Ph.D.
150
Analýza časových řad • Jelikož růstová charakteristika v tomto případě zhruba lineárně klesá, přichází rovněž v úvahu logistická trendová funkce. • Analýzou růstových charakteristik jsme jako možné trendové funkce vybrali parabolický, exponenciální a logistický trend.
Ing. Michal Dorda, Ph.D.
151
Analýza časových řad • Vhodnou křivku bychom vybrali na základě toho, zda modelovaný jev může růst do nekonečna, zda existuje nějaká hranice nasycení apod. • Dále bychom jako další kritérium mohli vzít součet čtverců reziduí, který chceme minimalizovat.
Ing. Michal Dorda, Ph.D.
152