VŠB – TU OSTRAVA, FEI, KATEDRA
APLIKOVANÉ
MATEMATIKY
Úvod do analýzy časových řad [Zadejte podtitul dokumentu.] Martina Litschmannová
2010
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD
Popis časových řad Časová řada je numerická proměnná, jejíž hodnoty podstatně závisí na čase, v němž byly získány (posloupnost chronologicky uspořádaných pozorování). Časové okamžiky, kdy byla data získána, jsou od sebe většinou stejně vzdáleny. Jde například o
počty vyrobených předmětů v jednotlivých měsících, počty automobilových nehod na Barandovském mostě v jednotlivých měsících, denní produkce mléka Veselé krávy.
Popis pomocí popisných statistik (krabicové grafy, stem & leaf) – poskytuje dobrou představu o vlastnostech časové řady jako jednoho celku dat, ale neposkytuje informace o jejím časovém vývoji (dojivost krávy Milky). Základní pojmy
Časové řady lze klasifikovat podle různých hledisek, např.: podle charakteru dat, jejichž hodnoty tvoří časovou řadu
časové řady intervalové - data závisí na délce intervalu, který je sledován (např. měsíční výroba cementu v ČR)
časové řady okamžikové - data se vztahují k určitému okamžiku (počet zaměst.v podniku v r. 1990 – 1995 (viz. Př. 1.3))
podle periodicity, s jakou jsou data sledována
časové řady údajů ročních
časové řady krátkodobé
podle druhu sledovaných dat
časové řady absolutních ukazatelů – měsíční výroba cementu
časové řady odvozených charakteristik – např. časová řada kumulativní (aktuální stav výroby cementu)
Martina Litschmannová
Strana 2
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Očištění časové řady o důsledky kalendářních variací
Chceme-li porovnávat jednotlivé hodnoty u intervalových krátkodobých časových řad, musí se tyto hodnoty vztahovat ke stejně dlouhým časovým intervalům. Očištění na měsíce
standardní měsíc o délce 30 dnů – údaj za každý měsíc se vydělí počtem dnů v měsíci a vynásobí se 30, součet měsíčních údajů za rok potom odpovídá „roku“ o délce 360 dní
standardní měsíc o délce 365/12 dnů – součet měsíčních údajů za rok odpovídá délce roku 365 dní
očištění na pracovní dny – provádí se obdobně jako očištění na měsíce
Shrnování údajů časových řad
intervalové řady – shrnování se provádí pomocí prostých součtů nebo aritmet. prům.
okamžikové řady – shrnování se provádí v případě stejných vzdálenosti mezi jednotlivými okamžiky pomocí prostého chronologického průměru, v případě nestejných vzdálenosti pomocí váženého chronologického průměru Nechť časovým okamžikům t1, t2, …, tn odpovídají hodnoty časové řady y1, y2 …, yn:
Prostý chronologický průměr:
y y1 y 2 ... y n 1 n 2 2 n 1
Vážený chronologický průměr:
𝑦1 + 𝑦2 𝑦 +𝑦 𝑦 +𝑦 𝑡2 − 𝑡1 + 2 2 3 𝑡3 − 𝑡2 + ⋯ + 𝑛 −12 𝑛 𝑡𝑛 − 𝑡𝑛−1 2 𝑡𝑛 − 𝑡𝑛−1
Martina Litschmannová
Strana 3
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Základní charakteristiky časových řad
Charakteristiky, které si dále uvedeme vyžadují stejnou délku časových intervalů v intervalových časových řadách nebo stejné vzdálenosti mezi okamžiky zjišťování v okamžikových časových řadách.
Absolutní přírůstky ∆ 1 𝑦𝑡 = 𝑦𝑡 − 𝑦𝑡−1 ,
𝑡 = 2,3, … , 𝑛
∆ 2 𝑦𝑡 = ∆ 1 𝑦𝑡 − ∆ 1 𝑦𝑡−1 ,
𝑡 = 3,4, , … , 𝑛
atd.
Průměrný absolutní přírůstek 1
∆= 𝑛−1
𝑦 𝑛 −𝑦1 𝑛−1
∆ 1 𝑦𝑡 𝑦 𝑡−1
=
𝑦 𝑡 −𝑦 𝑡−1 𝑦 𝑡−1
, 𝑡 = 2,3, … , 𝑛
Koeficienty růstu kt
𝑦𝑡 =
Relativní přírůstky 𝛿𝑡 =
𝑛 1 𝑡=2 ∆
yt yt 1
t 2,3,..., n
Průměrný koeficient růstu
k n1 k 2 k 3 ...k n n 1
yn y1
Př. 1: Měsíční výroba cementu v ČR během roku 1991 tvoří časovou řadu 536, 384, 727, 789, 817, 798, 817, 816, 817, 765, 675, 358 (v tis. tun). Pro účely srovnání měsíční produkce cementu sestavte časovou řadu produkcí pro standardní měsíc o délce 30 dnů a 365/12 dnů. Řešení: Pro očištěnou výrobu v lednu platí (výchozí i očištěné údaje jsou uvedeny v následující tabulce): a) standardní měsíc o délce 30 dnů 536 .30 518,71 31
Martina Litschmannová
Strana 4
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD b) standardní měsíc o délce 365/12 dnů 536 365 . 525,21 31 12
Pro další měsíce provedeme očištění podobně.
Měsíc Výroba Počet dní v měsíci Výroba za 30 dnů Výroba za 365/12 dnů Leden 536 31 519 526 Únor 384 28 411 417 Březen 727 31 704 713 Duben 789 30 789 800 Květen 817 31 791 802 Červen 798 30 798 809 Červenec 817 31 791 802 Srpen 816 31 790 801 Září 817 30 817 828 Říjen 765 31 740 751 Listopad 675 30 675 684 Prosinec 358 31 346 351
Př. 2: Na základě údajů následující tabulky určete průměrnou roční výrobu masa v ČR v letech 1986 – 1990: Rok Výroba masa (tis. tun)
1986
1987
1988
1989
1990
1217
1236
1273
1289
1255
Řešení: Jedná se o intervalovou časovou řadu. Pro výpočet průměrné výroby masa použijeme prostý aritmetický průměr: 1217 1236 1273 1289 1255 1254 tis.tun živé hmotnosti 5
V letech 1986 – 1990 se v ČR vyrobilo průměrně 1254 tis. tun masa ročně.
Martina Litschmannová
Strana 5
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Př. 3: V následující tabulce jsou uvedeny údaje o počtu zaměstnanců určitého podniku. Určete průměrný počet zaměstnanců v podniku v roce 1992. Datum Počet zaměstnanců 1.1.1992 280 1.4.1992 260 1.7.1992 250 1.10.1992 220 1.1.1993 200
Řešení: Jedná se o časovou řadu okamžikovou. Protože mezi jednotlivými okamžiky jsou stejně dlouhé čas. intervaly, použijeme pro výpočet prostý chronologický průměr.
280 200 260 250 220 2 2 242,5 5 1 Průměrný počet zaměstnanců v r. 1992 byl 242,5. Př. 4: Určete průměrný počet obyvatel ČR v letech 1981 – 1990, máte-li k dispozici následující údaje: Rok 1981 1985 1987 1989 1990 Počet obyv. (tis.) 10 303 10 337 10 349 10 362 10 363
Řešení: Jedná se o časovou řadu okamžikovou. Protože mezi okamžiky zjišťování jsou intervaly nestejné délky, použijeme pro výpočet průměrného počtu obyvatel vážený chronologický průměr.
10303 + 10337 10362 + 10363 1985 − 1981 + ⋯ + 1990 − 1989 2 2 = 10337,7 1990 − 1981
Průměrný počet obyvatel ČR v letech 1981 – 1990 byl cca. 10,3 miliónů.
Př. 5: Pro časovou řadu hodnot průměrné měsíční mzdy pracovníků státního a družstevního sektoru národního hospodářství v ČR v letech 1981 – 1990 (2692, 2757, 2808, 2858, 2901, 2944, 3005, 3138, 3247) vypočtěte: Martina Litschmannová
Strana 6
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD absolutní přírůstky a průměrný absolutní přírůstek, b) koeficienty růstu a průměrný koeficient růstu, c) druhé diference. a)
Řešení: t
yt
1 yt
kt
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990
2692 2757 2808 2858 2901 2944 3005 3070 3138 3247
65 51 50 43 43 61 65 68 109
1,024 1,018 1,018 1,015 1,015 1,021 1,022 1,022 1,035
2 yt
-14 -1 -7 0 18 4 3 41
ada) Absolutní přírůstky jsou uvedeny ve třetím sloupci tabulky (např. 1 y1982 2757 2692 65 ) Průměrný absolutní přírůstek:
y n y1 3247 2692 61,67 n 1 10 1
Průměrná měsíční mzda stoupala v letech 1981 – 1990 prům. o 62,-Kč za rok. adb) Koeficienty růstu jsou vypočteny ve čtvrtém sloupci tabulky (např. k1982
2757 1,024 ) 2692
Průměrný koeficient růstu: k n 1
y n 9 3247 1,021 y1 2692
Průměrná měsíční mzda stoupala v letech 1981 – 1990 v průměru o 2,1%. adc) Druhé diference (absolutní přírůstky 2. řádu) jsou vypočteny v pátém sloupci (např. ∆2 𝑦1983 = 51 − 65 = −14)
Martina Litschmannová
Strana 7
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD
Rozklad časových řad V této části bude naší snahou rozložit časovou řadu na součet (nebo součin) několika složek, z nichž každá bude podstatně jednodušší a bude mít jasnou interpretaci. Těmito složkami budou:
Trend Dt Sezónní složka St Cyklická složka Ct Náhodná složka Et
Budeme-li se snažit rozložit časovou řadu {Xt} na součet složek, budeme předpokládat, že ho lze zapsat ve tvaru: Xt = Dt + St + Ct + Et Tomuto způsobu rozkladu časové řady říkáme aditivní rozklad. Trend
Odráží dlouhodobý vývoj (obvykle růst nebo pokles, ale obecně nemusí být tato složka monotónní) daného procesu.
Co je dlouhodobé? (růst teploty během dne z pohledu lyžaře, zemědělce, meteorologa).
Sezónní složka
Odráží periodické změny, které se mohou v dané řadě projevovat, a jejich perioda je svázána s kalendářem (mají periodu jednu hodinu, jeden den, týden, měsíc, rok, století…).
Velký význam v ekonomii, meteorologii…
Cyklická složka
Odráží periodické změny, které se mohou v dané řadě projevovat, a jejichž perioda neodpovídá délce nějaké kalendářní jednotky.
V technických vědách se sezónní složka obvykle neuvažuje a všechny periodické jevy se zahrnují do cyklické složky.
Náhodná (reziduální) složka
Zbývá v časové řadě po odstranění trendu, sezónních a cyklických složek.
Martina Litschmannová
Strana 8
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD
Je tvořena náhodnými fluktuacemi, které nemají žádný systematický charakter.
Nadále budeme pracovat vždy s náhodným procesem a s některou jeho realizací. Pro odlišení budeme časové řady označovat velkými písmeny (např. Xt) a jejich konkrétní realizace malými písmeny (např. xt). Znalost každé jednotlivé složky nám umožní například lepší odhad vývoje daného procesu do budoucna (predikci).
Hledání trendu
Všechny metody hledání trendu vycházejí z podobné představy. Uvažujme časovou řadu Xt jako součet nějakého trendu a zbytkového (reziduálního) procesu. Tedy Xt = Dt + Et. Trendovou složku se budeme snažit vyjádřit pomocí nějaké křivky závislé na několika málo parametrech. Chceme-li odhadnout hodnotu trendu v nějakém časovém okamžiku t, musíme eliminovat vliv šumu.
Přehled nejběžnějších trendových křivek
Lineární trend Dt 0 1t
t 1,2,..., n
Odhady parametrů 0 ,1 získáme metodou nejmenších čtverců (viz. lineární regrese).
Kvadratický trend
Dt 0 1t 2 t 2
t 1,2,..., n
Odhady parametrů 0 ,1 , 2 získáme metodou nejmenších čtverců aplikovanou na rovnici transformovanou prostřednictvím substituce ti=ti.
Martina Litschmannová
Strana 9
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Exponenciální trend
Dt 0 .1
t 1,2,..., n 1 0
t
Odhad parametrů 0 ,1 získáme metodou nejmenších čtverců aplikovanou na rovnici linearizovanou prostřednictvím logaritmu.
Modifikovaný exponenciální trend
Dt 01
t
t 1,2,.., n
Odhad parametrů provádíme metodou částečných součtů. Soubor n pozorování rozdělíme na 3 stejné velké části o délce m (neplatí-li n = 3m, vynecháme 1 nebo 2 pozorování na začátku) a sečteme pozorování v jednotlivých částech. Odhady k, ai a b parametrů (Dt = k +a0a1t) modifikovaného exponenciálního trendu dostaneme řešením tří nelineárních rovnic: Každá realizace musí vyhovovat rovnici: yt = k + a0a1t m
m
t 1
t 1
yt mk a0 a1 2m
t m 1
yt mk a0
3m
t 2 m 1
t
2m
a
t m 1
yt mk a0
t
1
3m
a
t 2 m 1
t
1
Tyto rovnice upravíme na tvar: m
yt mk a0 a1 t 1
2m
t m 1
yt mk a0 a1
3m
a1 1 a1 1
t 2 m 1
m
m 1
yt mk a0 a1
a1 1 a1 1
2 m 1
m
a1 1 a1 1 m
a odtud:
Martina Litschmannová
Strana 10
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD n
a1
yt yt
t 2 m 1 m 2m t m 1
𝑎0 = 𝑎
2m
yt
1
y
t m 1 m
t
t 1
𝑎 1 −1 𝑎 1 𝑚 −1 2
2𝑚 𝑡=𝑚 +1 𝑦𝑡
−
𝑚 𝑡=1 𝑦𝑡
a 1 yt a0 a1 1 a1 1 k t 1 m m
m
Logistický trend Dt
t 1 01
Protože
t 1,2,..., n
transformací
0,1 0
logistického
trendu
modifikovaný exponenciální trend s parametry
na
tvar:
1 1 t 0 1 Dt
získáme
1 0 , a 1 , lze při odhadu parametru
aplikovat výše popsanou metodu částečných součtů.
Volba vhodného modelu trendu Při hledání nejvhodnějšího typu trendu vycházíme především z předpokládaných vlastností trendové funkce, vyplývajících z teoretického rozboru. Výběr usnadní grafické znázornění časové řady. Kromě toho lze využít testů založených na jednoduchých charakteristikách čas. řady (viz. níže uvedená tabulka). Trend Lineární Kvadratický Exponenciální Logistický
Test První diference přibližně konstantní Druhé diference přibližně konstantní Koeficienty růstu přibližně konstantní Křivka prvních diferencí se podobá křivce hustoty normálního rozdělení
Při rozhodování mezi několika typy trendových funkcí je vhodné porovnat hodnoty některých následujících charakteristik.
Martina Litschmannová
Strana 11
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD
Střední chyba odhadu neboli průměr hodnot reziduí 𝑀. 𝐸. =
𝑛 𝑡=1
𝑛
Střední kvadratická chyba odhadu neboli průměr čtverců reziduí 𝑛 𝑡=1
𝑀. 𝑆. 𝐸. =
𝑛 𝑡=1
2
𝑦 𝑡 −𝑌𝑡 𝑛
Střední chyba procentuální neboli průměr hodnot reziduí dělených odpovídající hodnotou časové řady (v procentech) 1
𝑀. 𝑃. 𝐸. = 𝑛
𝑦𝑡 − 𝑌𝑡 𝑛
Střední absolutní chyba odhadu neboli průměr absolutních hodnot reziduí 𝑀. 𝐴. 𝐸. =
𝑦 𝑡 −𝑌𝑡
𝑦 𝑡 −𝑌𝑡 𝑛 𝑡=1 𝑦 𝑡
∙ 100
Střední absolutní chyba procentuální neboli průměr absolutních hodnot reziduí dělených odpovídající hodnotou časové řady (v procentech) 1
𝑀. 𝑃. 𝐸. = 𝑛
𝑦 𝑡 −𝑌𝑡 𝑛 𝑡=1 𝑦 𝑡
∙ 100
Z uvedených kritérií se nejčastěji používá průměr čtverců reziduí M.S.E. Obecně dáváme přednost modelu, u něhož je hodnota M.S.E. nejnižší.
Př. 6: Pro časovou řadu hodnot spotřeby masa (v kg) na 1 obyvatele v ČR v letech 1982 až 1989 (viz. tab.) vypočtěte průměrný roční přírůstek spotřeby masa pomocí krajních hodnot časové řady, b) pomocí vyrovnání regresní přímkou. c) Odhadněte velikost spotřeby masa v r. 1990 za předpokladu, že se dosavadní charakter časové řady nezměnil. a)
Martina Litschmannová
Strana 12
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Řešení: Rok 1982 1983 1984 1985 1986 1987 1988 1989 součet
a)
t 1 2 3 4 5 6 7 8 36
yt 83,9 87,8 88,7 89,3 91,6 93,5 96,1 97,4 728,3
t2 1 4 9 16 25 36 49 64 204
tyt 83,9 175,6 266,1 357,2 458,0 561,0 672,7 779,2 3353,7
yt
3,9 0,9 0,6 2,3 1,9 2,6 1,3 x
97,4 83,9 1,93 7
Velikost spotřeby masa v r. 1990 lze odhadnout na 99,33 (97,40+1,93) kg/obyvatel. b) Vzhledem k tomu, že hodnoty prvních diferencí lze považovat za stálé (nevykazují ani rostoucí, ani klesající tendenci), můžeme použití lineárního modelu považovat za opodstatněné. Aplikujeme metodu nejmenších čtverců: 𝑦𝑡 − 𝑎0 − 𝑎1 𝑡 2 …. Součet čtverců reziduí
𝑡
Součet čtverců reziduí minimalizujeme: −2
𝑡
𝑦𝑡 − 𝑎0 − 𝑎1 𝑡 = 0
−2
𝑡
𝑦𝑡 − 𝑎0 − 𝑎1 𝑡 𝑡 = 0
Danou soustavu upravíme na tvar: 𝑡
𝑦𝑡 − 𝑛𝑎0 − 𝑎1
𝑡
𝑡𝑦𝑡 − 𝑎0
𝑡
𝑡
𝑡=0
𝑡 − 𝑎1
𝑡
𝑡2 = 0
Řešení nalezneme ve tvaru: 𝑡
𝑎0 = 𝑎1 =
𝑦𝑡
𝑛 𝑛
𝑡
𝑛
− 𝑎1
𝑡𝑦 𝑡 − 𝑡
𝑡2−
𝑡
𝑡
𝑡
𝑛 𝑡 𝑡
Martina Litschmannová
𝑦𝑡
𝑡
𝑡
2
Strana 13
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Po dosazení:
a1
8.3353,7 36.728,3 1,82 8.204 36 2
a0
728,3 36 1,82 82,86 8 8
Dt 82,86 1,82t
Spotřeba masa [kg]
100 95 90 85 80 1980
1982
1984
1986
1988
1990
Yˆ9 D9 82,86 1,82.9 99,22
Velikost spotřeby masa v roce 1990 lze odhadnout na 99,22 kg/obyvatele.
Martina Litschmannová
Strana 14
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Př. 7: Uvažujte časovou řadu (viz. tab.) udávající spotřebu másla (v kg) na 1 obyvatele ČSFR v letech 1980 – 1990. Vyrovnejte danou řadu prostřednictvím kvadratického trendu. Odhadněte spotřebu másla v roce 1991. Řešení: Použijeme metodu nejmenších čtverců aplikovanou na transformovaný model vícenásobné regrese. Rok
t = t1
yt
1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 součet
1 2 3 4 5 6 7 8 9 10 11 66
8,3 8,4 8,9 8,6 8,8 8,8 8,7 8,7 8,6 8,5 8,7 94,2
t2 = t12 = t2 t1t2 = t3 1 1 4 8 9 27 16 48 25 125 36 216 49 343 64 512 81 729 100 1000 121 1331 506 4340
t22 = t4 t1yt = tyt t2yt = t2yt 1 16 81 256 625 1296 2401 4096 6561 10000 14641 39974
8,3 16,8 26,7 34,4 44,0 52,8 60,9 69,6 77,4 85,0 95,7 598,6
8,3 33,6 79,2 137,6 220,0 316,8 426,3 556,8 696,6 850,0 1052,7 4377,9
Původní rovnice:
yt a0 a1t a2 t 2 Substituce: t1=t, t2=t2 yt a0 a1t1 a2 t 2
Součet čtverců reziduí: 𝑦𝑡 − 𝑎0 − 𝑎1 𝑡1 − 𝑎2 𝑡2
𝑡
2
Minimalizace: −2
𝑡
𝑦𝑡 − 𝑎0 − 𝑎1 𝑡1 − 𝑎2 𝑡2 = 0
−2
𝑡
𝑦𝑡 − 𝑎0 − 𝑎1 𝑡1 − 𝑎2 𝑡2 𝑡1 = 0
−2
𝑡
𝑦𝑡 − 𝑎0 − 𝑎1 𝑡1 − 𝑎2 𝑡2 𝑡2 = 0
Po úpravě: 𝑡
𝑦𝑡 − 𝑛𝑎0 − 𝑎1
Martina Litschmannová
𝑡
𝑡1 − 𝑎2
𝑡
𝑡2 = 0
Strana 15
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD 𝑡
𝑡1 𝑦𝑡 −
𝑡
𝑡1 𝑎0 − 𝑎1
𝑡
𝑡1 2 − 𝑎2
𝑡
𝑡2 𝑦𝑡 −
𝑡
𝑡2 𝑎0 − 𝑎1
𝑡
𝑡1 𝑡2 − 𝑎2
𝑡1 𝑡2 = 0
𝑡 𝑡
𝑡2 2 = 0
V řešení této soustavy (tři rovnice o třech neznámých) spočívá práce statistických programů určených k zpracování časových řad (přesněji, k hledání kvadratických trendů).
Spotřeba másla [kg]
9 8,9 8,8 8,7 8,6 8,5 8,4 8,3 8,2 1978 1980 1982 1984 1986 1988 1990 1992
Dt 8,23 0,16t 0,012t 2 Spotřebu másla v roce 1991 odhadneme prostřednictvím trendu jako D12. D12 = 8,23 + 0,16.12 --0,012.122 = 8,42 kg / obyvatele. V roce 1991 odhadujeme spotřebu másla 8,42kg/obyvatele.
Př. 8: Pro časovou řadu růstu zisku (v tis. dol.) důlní společnosti (viz. tab.) v prvních šesti letech, určete průměrný koeficient růstu: pomocí krajních hodnot časové řady, b) pomocí vyrovnání exponenciálním trendem. c) Odhadněte zisk společnosti v následujících dvou letech. a)
Martina Litschmannová
Strana 16
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD
t 1 2 3 4 5 6 součet 21
yt 112 149 238 354 580 867 2300
kt 1,330 1,597 1,487 1,638 1,495 x
t2 1 4 9 16 25 36 91
ln(yt) 4,72 5,00 5,47 5,87 6,36 6,77 34,19
t.ln(yt) 4,72 10,00 16,41 23,48 31,8 40,62 127,03
Řešení: 867 1,506 , to znamená že zisk společnosti se 112 každý rok zvýšil průměrně o 50,6%.
a) Průměrný koeficient růstu: k 5
Předpověď pro 7.rok: Y7 = 867 . 1,506 = 1305,702 Předpověď pro 8.rok: Y8 = 867 . (1,506)2 = 1966,387
b) Vyrovnání časové řady exponenciální funkcí: Koeficienty růstu nevykazují ani rostoucí ani klesající tendenci, můžeme je tedy považovat za konstantní, tj. můžeme použít exponenciální model trendu.
Dt a0 a1
t
Pro nalezení koeficientů a0 a a1 transformujeme daný model prostřednictvím logaritmu a použijeme metodu nejmenších čtverců. 𝑙𝑛 𝑦𝑡 = 𝑙𝑛 𝑎0 + 𝑡 ∙ 𝑙𝑛 𝑎1 𝑏0 = 𝑙𝑛 𝑎0
𝑏1 = 𝑙𝑛 𝑎1
Součet čtverců reziduí: 𝑡
ln 𝑦𝑡 − 𝑏0 − 𝑏1 𝑡
2
Minimalizace: −2
𝑡
ln 𝑦𝑡 − 𝑏0 − 𝑏1 𝑡 = 0
−2
𝑡
ln 𝑦𝑡 − 𝑏0 − 𝑏1 𝑡 𝑡 = 0
Martina Litschmannová
Strana 17
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Po úpravě: 𝑡
ln 𝑦𝑡 − 𝑛𝑏0 − 𝑏1
𝑡
t ∙ ln 𝑦𝑡 − 𝑏0
𝑡
𝑡=0
𝑡 − 𝑏1
𝑡
𝑡
𝑡2 = 0
Řešení soustavy:
𝑏1 =
ln 𝑦 𝑡 −𝑏1
𝑡
𝑏0 =
𝑡
𝑡
𝑡
𝑡
𝑛 𝑛
𝑡
𝑡∙ln 𝑦 𝑡 − 𝑛
𝑎0 = 𝑒 𝑏 0
𝑡
𝑡2−
𝑡
𝑡
𝑡 2
ln 𝑦 𝑡
𝑎1 = 𝑒 𝑏1
Řešení pro konkrétní případ: b1
6.127,03 21.34,19 0,42 6.91 212
b0
34,19 0,42.21 4,23 6
a0 e 4, 23 68,72 a1 e 0, 42 1,52
Dt 68,72.1,52 t
Zisk důlní společnosti [tis. $]
1000 800 600 400 200 0 0
2
4
6
8
Rok
Odhad zisku společnosti v 7. a 8. roce: D7 68,72.1,52 7 1288,21
D8 68,72.1,528 1958,09
Martina Litschmannová
Strana 18
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Př. 9: Objem dovozu ze zemí bývalého Sovětského svazu je dán časovou řadou (viz. tab.) udanou v miliardách Kč. Předpokládejte, že se jedná o modifikovaný exponenciální trend. Odhadněte jeho parametry a velikost dovozu v roce 1999.
Rok t 1990 1991 1992 1993 1994 1995 1996 1997 1998
1 2 3 4 5 6 7 8 9
yt 57,2 62,8 72,2 81,5 91,6 97,1 99,9 100,4 100,6
Řešení: Odhad parametrů metodou částečných součtů (odvození viz. Modifikovaný exponenciální trend):
Dt k a0 a1
n
a1
yt yt
t m 1
1
2m
yt
t 2 m 1 m 2m
𝑎0 = 𝑎
t
y
t m 1 m
t
t 1
𝑎 1 −1 𝑎 1 𝑚 −1 2
2𝑚 𝑡=𝑚 +1 𝑦𝑡
−
𝑚 𝑡=1 𝑦𝑡
a 1 yt a0 a1 1 a1 1 k t 1 m m
m
n9m3 3
y t 1
t
57,2 62,8 72,2 192,2
Martina Litschmannová
Strana 19
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD 6
y t 4
t
81,5 91,6 97,1 270,2
t
99,9 100,4 100,6 300,9
9
y t 7
a1 3
300,9 270,2 0,733 270,2 192,2 0,733−1
𝑎0 = 0,733
0,733 3 −1 2
270,2 − 192,2 = −77,322
192,2 77,322.0,733 k
0,7333 1 0,733 1
3
106,942
Objem dovozu [miliardy Kč]
120 100 80 60 40 20 0 1988 1990 1992 1994 1996 1998 2000 Rok
Dt 106,942 77,322.0,733t D10 106,942 77,322.0,73310 103,5
Odhad dovozu ze zemí bývalého Sovětského svazu v roce 1999 je 103,5 miliard Kč.
Martina Litschmannová
Strana 20
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Klouzavé průměry
Jinou metodou hledání trendu je vyhlazení původní časové řady, tj. odstranění šumu. Jednou z těchto metod je metoda klouzavých průměrů, kdy se řada původních pozorování nahradí řadou vypočtených klouzavých průměrů. Tato metoda je adaptivní, tzn. dokáže pracovat s trendem, který v čase mění svůj charakter a který tedy nelze popsat jedinou křivkou. Klouzavý průměr je určitou lineární kombinací 2p+1 členů původní řady. Čím větší je délka klouzavého průměru, tím větší je „vyhlazení“ časové řady. V případě, že zvolená délka klouzavého průměru je „lichá“, získáme jejich hodnoty jako obyčejné aritmetické průměry dané délky (prosté klouzavé průměry). Prosté klouzavé průměry Úseky časové řady o délce 2p+1 vyrovnáme tak, že je nahradíme prostým aritmetickým průměrem. yt
p yt p yt p 1 ... yt p 1 yt p 1 y t i 2 p 1 i p 2 p 1
t p 1, p 2,..., n p
p hodnot na začátku a p hodnot na konci časové řady zůstává nevyrovnáno. Sudá délka klouzavých průměrů se volí jen velmi zřídka. V případě, že délku klouzavých průměrů zvolíme rovnu 2p, používáme tzv. centrovaných klouzavých průměrů. Centrované klouzavé průměry 𝑦𝑡 =
1 𝑦 + 2𝑦𝑡−𝑝+1 + ⋯ + 2𝑦𝑡+𝑝−1 + 𝑦𝑡+𝑝 4𝑝 𝑡−𝑝
𝑡 = 𝑝 + 1, … , 𝑛 − 𝑝
Myšlenka tohoto vyrovnání je prostá. K tomu, aby vyrovnaná hodnota odpovídala danému období, potřebujeme lichý počet členů v klouzavém průměru. Ten získáme nejlépe tak, že místo prvního členu v klouzavém průměru vezmeme průměr první a poslední hodnoty dané periody.Tedy klouzavé průměry mají tvar 𝑦𝑡−𝑝 + 𝑦𝑡+𝑝 + 𝑦𝑡−𝑝+1 + ⋯ + 𝑦𝑡+𝑝+1 1 2 𝑦𝑡 = = 𝑦 + 2𝑦𝑡−𝑝+1 + ⋯ + 2𝑦𝑡+𝑝−1 + 𝑦𝑡+𝑝 2𝑝 4𝑝 𝑡−𝑝
Martina Litschmannová
Strana 21
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Př. 10: Časová řada (viz. tab.) udává roční objemy vývozu piv (v mil. l.) z ČSFR v letech 1980 až 1991. Vyrovnejte časovou řadu 3-člennými a 5-člennými klouzavými průměry. Řešení:
Rok
yt
1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
215 219 222 235 202 207 187 204 174 172 201 272
3-členné 5-členné klouzavé průměry klouzavé průměry 218,667 225,333 219,667 214,667 198,667 199,333 188,333 183,333 182,333 215
218,6 217 210,6 207 194,8 188,8 187,6 204,6
3-členný klouzavý průměr v roce 1981 =
215 219 222 218,667 3
3-členný klouzavý průměr v roce 1982 =
219 222 235 225,333 3
5-členný klouzavý průměr v roce 1982 =
215 219 222 235 202 218,6 5
atd.
Volba délky klouzavých průměrů
U neperiodických časových řad se nejčastěji používají průměry délky 3, 5, 7. Pokud chceme z naší časové řady odstranit sezónní vliv (např. kolísání hodnot během týdne, měsíce…), využíváme klouzavých průměrů s délkou rovnou délce sezónního období.
Martina Litschmannová
Strana 22
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD 550 500 450 400 350 300 0
5
10
15
20
25
Časová řada vyrovnána 3-člennými klouzavými průměry Př. 11: Časová řada 485, 477, 455, 471, 453, 450, 426, 436, 454, 485, 493, 454, 443, 428, 424, 449, 415, 393, 377, 369, 388, 362 představuje týdenní údaje poptávky po určitém výrobku. Znázorněte graficky vyrovnání 3-člennými a 5-člennými klouzavými průměry. Řešení: 500 480 460 440
Data
420
Kl. průměry délky3 Kl. průměry délky 5
400 380 360 0
5
10
15
20
25
Př. 12: V následující tabulce jsou měsíční údaje nákupu mléka v ČR (v mil. l) v letech 1987 – 1990. Vyrovnejte časovou řadu klouzavými průměry.
Martina Litschmannová
Strana 23
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD
1987 1988 1989 1990
I
II
III
IV
V
VI
335 333 354 352
312 315 327 327
352 340 367 366
354 339 368 367
398 383 408 408
400 396 405 406
VII VIII 404 404 412 414
405 399 402 392
IX
X
XI
XII
373 377 378 354
365 370 371 351
324 334 338 323
329 345 343 321
Řešení:
420 400 380 360
Data Kl. průměry délky 12
340 320 300 0
10
20
30
40
50
60
12-ti členné klouzavé průměry Jelikož se zřejmě jedná o časovou řadu se sezónní složkou s periodou 12, zvolíme k vyrovnání 12-ti členné klouzavé průměry. (p = 6)
Např. hodnotu y7 určíme jako
335+2 312+352+⋯+324+329 +333 24
= 362,5 atd.
Prvních 6 a posledních 6 hodnot zůstane nevyrovnaných.
Martina Litschmannová
Strana 24
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Metoda Končák (vyrovnávání konců čas. řad)
Jak jsme se již dříve dozvěděli, vyrovnáme-li časovou řadu klouzavými průměry (mediány) o délce 2p+1, prvních a posledních p hodnot zůstává nevyrovnaných. Jednou z možností jak konce časových řad vyrovnat je zkopírování posledních vyrovnaných hodnot.
1990
1988
1986
1984
1982
1980
1978
1976
1974
1972
1970
1968
1966
1964
1962
1960
1958
1956
1954
1952
1950
1948
1946
1944
1942
1940
1938
1936
1934
1932
1930
Počet absolventů oboru zemědělství
0 20
Klouzavé mediány délky 5 Data
40 60 80 100 120 140 160
Počet absolventů oboru zemědělství
160 140 120 100 80 60 40
Data
20
Klouzavé mediány délky 5 1930 1932 1934 1936 1938 1940 1942 1944 1946 1948 1950 1952 1954 1956 1958 1960 1962 1964 1966 1968 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990
0
Z uvedeného grafu je zřejmé, že tento způsob vyrovnávání konců není nejvhodnější. „Rozumnějším“ způsobem se ukazuje postup „KONČÁK“. Vyrovnaná hodnota v posledním časovém okamžiku (ta) by měla odrážet chování časové řady v minulosti i přítomnosti a předvídat její chování v budoucnosti. Reprezentantem přítomnosti je hodnota naměřená v čase ta (ya), reprezentantem minulosti je poslední vyrovnaná hodnota (v čase ta-1). Jako reprezentant budoucnosti se bere hodnota odhadující chování v čase n+1. To je například hodnota protažené úsečky spojující vyrovnané hodnoty v časech n-2 a n-1. Hodnota této úsečky se bere v čase n+1. Jako vyrovnanou hodnotu v čase n pak bereme průměr (median) z reprezentantů minulosti, přítomnosti a budoucnosti. Vyrovnávání počátku časových řad se provádí obdobně. (Ukažte!) Př. 13: Vyrovnejte konce časové řady z příkladu 1.10 metodou Končák. Použijte klouzavé mediány délky 5.
Martina Litschmannová
Strana 25
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD Řešení:
Rok
yt
1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
215 214 222 235 202 207 187 204 174 172 235 272
5-členné klouzavé mediany 218 218 218 216 211 207 195 189 194 211 235 272
a) Vyrovnání konce:
Reprezentant y1990=235
přítomnosti:
Reprezentant y,1989=211
minulosti:
211+2*17=245
211
211-194=17
194
Reprezentant budoucnosti: 245 1988
Reprezentant y1991=272
přítomnosti:
235+2*24=283
Reprezentant y,1990=235
minulosti:
235
1989
1990
1991
235-211=24
211
Reprezentant budoucnosti: 283 1989
Martina Litschmannová
1990
1991
1992
Strana 26
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD b) Vyrovnání počátku:
Reprezentant y1981=214
přítomnosti:
Reprezentant y,1982=218
minulosti:
218+2*2=222
218 218-216=2 216
Reprezentant budoucnosti: 222 1980
Reprezentant přítomnosti:
y1982=215
Reprezentant minulosti:
y,1981=218
1981
1982
1983
1981
1982
218
Reprezentant budoucnosti: 218
1979
1980
*
Vyrovnání konců časových řad 290 Data Kopírování konců Postup Končák
270 250 230 210 190 170 150
1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
Martina Litschmannová
Strana 27
ÚVOD DO ANALÝZY ČASOVÝCH ŘAD
*
Literatura:
1. J. Anděl: Statistická analýza časových řad, SNTL, Praha, 1976 2. Výukové materiály SPSS: Analýza a predikce časových řad, 2010 3. V. Rogalewicz: Stochastické procesy, ČVUT, Praha, 1993 4. E. Jarošová: Statistika B, VŠE, Praha, 1995 5. J. Hanousek, P. Charamza: Moderní metody zpracování dat,GRADA, Praha, 1992
Martina Litschmannová
Strana 28