8 Analýza časových řad – sezónní složka
8 ANALÝZA ČASOVÝCH ŘAD – SEZÓNNÍ SLOŽKA RYCHLÝ NÁHLED KAPITOLY Následující kapitolou pokračujeme v tématu analýza časových řad a blíže se budeme zabývat problematikou jich pravidelné kolísavost, která je modelována sezónní složkou. Jsou zde uvedeny metody sezónní dekompozice, které slouží k identifikaci sezónní složky a prognózování hodnot časové řady do budoucna. Při analýze časových řad s periodicitou kratší než jeden rok se setkáváme téměř vždy s existencí sezónních vlivů, reprezentovaných v modelu časové řady sezónní složkou. Tyto vlivy způsobují pravidelné výkyvy oproti normálnímu vývoji. Pokud se obdobné vlivy opakují v intervalu delším než jeden rok, hovoříme o cyklické složce. Sezónní a cyklická složka spolu tvoří periodickou složku. V této kapitole se zaměříme na praktické zadávání dat do SPSS a analýzu výsledků procedury, která modeluje sezónní dekompozici časové řady. Procedura Seasonal Decomposition slouží k rozkladu časové řady na jednotlivé složky: trendovou a cyklickou (nerozlišuje je od sebe), sezónní a reziduální. Tyto složky je možné přidat do datového souboru jako nové proměnné a doplnit k nim případně časovou řadu očištěnou od sezónnosti. Před použitím této procedury je nutné specifikovat sezónnost a tedy definovat příslušnou proměnnou v nabídce Data – Define Dates. Použitá časová řada nesmí obsahovat žádná chybějící pozorování. Chybějící pozorování předefinujeme pomocí Transform – Replace Missing Values. Proceduru sezónní dekompozice najdeme pod posloupností nabídek: Statistics – Time Series – Seasonal Decomposition. Objeví se dialogové okno: Obr. 8.1 Sezónní dekompozice v SPSS
Zdroj: Vlastní zpracování. Variables – do tohoto pole se zadávají analyzované proměnné. Model – tato část obsahuje dvě možnosti a to multiplikativní nebo aditivní model. Pokud se sezónní výkyvy zvyšují zároveň se zvyšující se úrovní časové řady, svědčí to ve prospěch multiplikativního modelu. Pokud sezónnost neroste s úrovní časové řady, je vhodnější aditivní model.
- 114 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Moving Average Weight – v této části se zadávají váhy pro použité klouzavé průměry. Tyto klouzavé průměry se aplikují na časovou řadu za účelem odstranění sezónnosti. All points equal – „všechny váhy stejné“. Tato procedura počítá klouzavé průměry, jejichž délka se rovná délce sezónní periody, přičemž všechna pozorování mají při výpočtech stejnou váhu. Endpoints weighted by 0,5 – koncové body vážené 0,5. Tato metoda počítá klouzavé průměry, jejichž délka se rovná délce sezónní periody +1. Kromě prvního a posledního pozorování, které mají váhu 0,5, mají všechna ostatní pozorování při výpočtech stejnou váhu. Uložení výsledků Uložení vyrovnaných hodnot, reziduí, případných předpovědí, intervalů spolehlivostí a směrodatných odchylek odhadnutých hodnot je možné zadat pomocí tlačítka Save. Je možno uložit následující proměnné:
SAF – Seasonal adjustment factor – „nastavení sezónního faktoru“. Pokud pracujeme s modelem aditivním, znamená absence sezónní složky pro tento faktor hodnotu 0. Pokud pracujeme s modelem multiplikativním, znamená absence sezónní složky pro tento faktor hodnotu 1. SAS – Seasonally adjusted series – „sezónně očištěná řada“. Jedná se o původní časovou řadu, ze které je odstraněna sezónní složka. Tato řada tedy obsahuje trendovou složku a náhodnou složku. STC – Smoothed trend-cycle component – „vyrovnané hodnoty trendové složky“ (včetně složky cyklické). ERR – Residual of error values – „rezidua (chyby)“. LCL – Lower confidence limits – „dolní hranice intervalu spolehlivosti“ pro odhadnuté hodnoty časové řady. Standardně se počítá 95% -ní interval spolehlivosti. Je však možno zvolit výpočet pro hodnoty 90% nebo 99%. UCL – Upper confidence limits – „horní hranice intervalu spolehlivosti“ pro odhadnuté hodnoty časové řady. Standardně se počítá 95%-ní interval spolehlivosti. Je však možno zvolit výpočet pro hodnoty 90% nebo 99%. SEP – Standard error of the predicted values – „odhady směrodatných chyb pro odhadnuté hodnoty“ časové řady.
Create Variables – Vytvoření nových proměnných Add to file – tato volba zabezpečí uložení výsledků ve formě nových proměnných v aktivním pracovním souboru. Replace existing – tato volba zabezpečí uložení výsledků ve formě dočasných proměnných v aktivním pracovním souboru, přičemž předchozí dočasné proměnné jsou zrušeny. Do not create – výsledky se neuloží. Použití výše uvedené procedury pro sezónní dekompozici časových si ukážeme v následujících řešených příkladech.
- 115 -
8 Analýza časových řad – sezónní složka
ŘEŠENÝ PŘÍKLAD 8.1 Tabulka zobrazuje čtvrtletní údaje o vývoji ukazatele konečná spotřeba veřejné správy a soukromých neziskových organizací v České republice v letech 2008 – 2011 v mld.Kč. 1. čtvrtletí 19,4 20,9 20,2 18,9
2008 2009 2010 2011 Určete:
2. čtvrtletí 22,4 22,5 20,4 20,5
3. čtvrtletí 22,2 22,7 22,7 20,3
4. čtvrtletí 27,2 25 25,7 25,5
a) sezónní faktory rozdílů za předpokladu použití modelu aditivní sezónnosti, b) sestavte časovou řadu sezónně očištěných dat, c) odhadněte hodnoty časové řady až do 4. čtvrtletí roku 2012, d) graficky znázorněte původní a odhadnutou časovou řadu včetně predikce, e) ověřte vlastnosti reziduální složky.
Řešení: Průběh časové řady je znázorněn na Obr. 8.2. Obr.8.2 Časová řada spotřeby veřejné správy v letech 2008 - 2011 v mld. Kč
Zdroj: Vlastní zpracování. a) Výstup SPSS je znázorněn v Tab. 8.1 Tabulka 8.1 Period 1 2 3 4
Seasonal index – 2,301 – 1,009 –0,198 3,508
- 116 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Součet sezónních indexů musí být nulový. Záporné hodnoty sezónních indexů znamenají, že v 1. – 3. čtvrtletí se hodnoty časové řady pohybují pod dlouhodobým normálem, ve 4. čtvrtletí je hodnota o 3,5 mld. Kč vyšší než je dlouhodobý průměr časové řady. Je to způsobeno tím, že se státní organizace snaží ve 4. čtvrtletí utratit zbývající prostředky, aby v novém roce nebyly odejmuty nebo aby jim nebyl objem prostředků snížen pro další rok. b) a c) Časová řada sezónně očištěných dat je uvedena ve čtvrtém sloupci Tab. 8.2 a odhady spotřeby veřejné správy v jednotlivých čtvrtletích roku 2012 jsou v předposledním sloupci Tab. 8.2 tučně zvýrazněny
Tabulka 8.2
Q1 2008 Q2 2008 Q3 2008 Q4 2008 Q1 2009 Q2 2009 Q3 2009 Q4 2009 Q1 2010 Q2 2010 Q3 2010 Q4 2010 Q1 2011 Q2 2011 Q3 2011 Q4 2011 Q1 2012 Q2 2012 Q3 2012 Q4 2012
Datová matice výpočtů SPSS
skutečné hodnoty
chyba
Yt
ERR
19,4 22,4 22,2 27,2 20,9 22,5 22,7 25 20,2 20,4 22,7 25,7 18,9 20,5 20,3 25,5
-0,64 0,91 -0,52 0,45 -0,06 0,41 0,19 -0,75 0,38 -0,67 0,72 0,23 -0,40 0,16 -0,83 0,75
sezónně očištěné hodnoty SAS = Yt-SAF 21,70 23,41 22,40 23,69 23,20 23,51 22,90 21,49 22,50 21,41 22,90 22,19 21,20 21,51 20,50 21,99
sezónní indexy
trendová složka
SAF
STC
-2,30 -1,01 -0,20 3,51 -2,30 -1,01 -0,20 3,51 -2,30 -1,01 -0,20 3,51 -2,30 -1,01 -0,20 3,51 -2,30 -1,01 -0,20 3,51
22,34 22,50 22,92 23,24 23,26 23,10 22,71 22,24 22,12 22,08 22,18 21,97 21,60 21,35 21,33 21,24
- 117 -
odhad model lineárního trendu FIT = SAF+FIT 23,25-0,11.t 23,14 20,84 23,02 22,01 22,91 22,71 22,79 26,30 22,67 20,37 22,55 21,55 22,44 22,24 22,32 25,83 22,20 19,90 22,09 21,08 21,97 21,77 21,85 25,36 21,73 19,43 21,62 20,61 21,50 21,30 21,38 24,89 21,27 18,97 21,15 20,14 21,03 20,83 20,92 24,42
rezidua modelu Yt-model -1,44 0,39 -0,51 0,90 0,53 0,95 0,46 -0,83 0,30 -0,68 0,93 0,34 -0,53 -0,11 -1,00 0,61
8 Analýza časových řad – sezónní složka
d) Obr.8.3 Původní a odhadnutá časová řada spotřeby veřejné správy (mld.Kč)
Zdroj: Vlastní zpracování. e) Hodnoty reziduí jsou vypočteny v posledním sloupci Tab. 8.1. Z Obr.8.4 autokorelační funkce reziduí vidíme, že všechny hodnoty jsou v přípustném intervalu, takže rezidua nejsou korelována. Obr.8.4 Autokorelační funkce reziduí pro časovou řadu spotřeby veřejné správy 1,0
,5
0,0
-,5 Confidence Limits
-1,0
Coefficient 1
2
3
4
5
6
7
8
9
Zdroj: Vlastní zpracování.
- 118 -
10
11
12
13
14
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
ŘEŠENÝ PŘÍKLAD 8.2 Tabulka zobrazuje čtvrtletní údaje časové řady bazických indexů (základ je průměr roku 2006) maloobchodního prodeje v České republice od 1. čtvrtletí roku 2008 do 3. čtvrtletí roku 2012. 2008 2009 2010 2011 2012
1. čtvrtletí 55,2 65,2 70,5 82,2 95,7
2. čtvrtletí 61,8 68,5 79,8 95,4 109,9
3. čtvrtletí 64,2 71,9 90 107,1 121,17
4. čtvrtletí 79,7 84,9 105,7 120
Určete: a) sezónní faktory rozdílů za předpokladu použití modelu multiplikativní sezónnosti, b) sestavte časovou řadu sezónně očištěných dat, c) odhadněte hodnoty časové řady do 4. čtvrtletí roku 2013, d) graficky znázorněte původní a odhadnutou časovou řadu včetně predikce. Řešení: Z grafu časové řady vidíme, že se sezónní výkyvy zvyšují s úrovní časové řady, proto volíme multiplikativní model. Obr.8.5 Časová řada bazických indexů maloobchodního prodeje
Zdroj: Vlastní zpracování. a) Výstup SPSS – sezónní dekompozice – multiplikativní model je v Tab.8.3 Tabulka 8.3 Period 1 2 3 4
Seasonal index (*100) 88,844 96,535 100,057 114,564
- 119 -
8 Analýza časových řad – sezónní složka
Součet sezónních indexů po vynásobení 100 dává 400. Hodnoty sezónních indexů, které jsou menší než 100, znamenají, že v 1. – 2. čtvrtletí se hodnoty časové řady pohybují pod dlouhodobým normálem, ve 4. čtvrtletí je hodnota o 14,6% vyšší než je dlouhodobý průměr časové řady. c) Časová řada sezónně očištěných dat je uvedena ve třetím sloupci Tabulky 8.4 a odhady bazických indexů maloobchodního prodeje v České republice v jednotlivých čtvrtletích roku 2013 jsou v posledním sloupci tabulky 8.3 tučně zvýrazněny Tabulka 8.4 Datová matice výpočtů SPSS období
Q1 2008 Q2 2008 Q3 2008 Q4 2008 Q1 2009 Q2 2009 Q3 2009 Q4 2009 Q1 2010 Q2 2010 Q3 2010 Q4 2010 Q1 2011 Q2 2011 Q3 2011 Q4 2011 Q1 2012 Q2 2012 Q3 2012 Q4 2012 Q1 2013 Q2 2013 Q3 2013 Q4 2013
skutečné hodnoty Yt 55,2 61,8 64,2 79,7 65,2 68,5 71,9 84,9 70,5 79,8 90 105,7 82,2 95,4 107,1 120 95,7 109,9 121,17
sezónně sezónní trendová odhad lineárního model očištěné indexy složka trendu hodnoty SAS=Yt / SAF SAF STC FIT=54,24 +3,21.t SAF*FIT 62,29 0,89 62,14 57,47 50,93 64,57 0,96 63,52 60,68 58,08 63,71 1,01 66,09 63,90 64,40 69,37 1,15 68,76 67,12 77,12 73,57 0,89 70,85 70,34 62,33 71,57 0,96 71,98 73,56 70,40 71,35 1,01 73,12 76,77 77,37 73,89 1,15 75,38 79,99 91,91 79,55 0,89 79,32 83,21 73,74 83,38 0,96 83,75 86,43 82,72 89,31 1,01 87,89 89,65 90,34 92,00 1,15 91,46 92,86 106,70 92,75 0,89 95,24 96,08 85,15 99,68 0,96 99,28 99,30 95,04 106,27 1,01 103,09 102,52 103,32 104,44 1,15 106,26 105,74 121,49 107,99 0,89 109,89 108,96 96,56 114,83 0,96 114,35 112,17 107,36 120,24 1,01 119,76 115,39 116,29 , 1,15 , 118,61 136,27 , 0,89 , 121,83 107,97 , 0,96 , 125,05 119,68 , 1,01 , 128,26 129,26 , 1,15 , 131,48 151,06
d) Z následujícího grafu vidíme, že odhadnutá časová řada kopíruje původní časovou řadu bazických indexů maloobchodního prodeje v České republice.
- 120 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Obr.8.6 Původní a odhadnutá časová řada bazických indexů maloobchodního prodeje
Zdroj: Vlastní zpracování. ___________________________________________________________________________
8.1 PŘÍKLADY K PROCVIČENÍ PŘÍKLAD 8.1 Jsou uvedená tvrzení pravdivá? a) V programu SPSS můžeme vybrat pro sezónní dekompozici multiplikativní nebo aditivní model. b) Pro aditivní model platí vztah Yt Tt .St . t . c) Platí vztah SAS Yt SAF ? d) Procedura Seasonal Decomposition rozlišuje trendovou, cyklickou, sezónní a reziduální složku. e) Platí vztah STC ERR SAS ? ___________________________________________________________________________ PŘÍKLAD 8.2 Doplňte následující věty: Jestliže se sezónní výkyvy zvyšují se zvyšující se úrovni časové řady, pak vybereme …………………..model. b) SPSS uloží po provedení sezónní dekompozice proměnnou SAS. Tato proměnná vyjadřuje …………………. …………………. ………….. c) Součet sezónních faktorů SAF u aditivního modelu je roven ……….. d) Jestliže v aditivním modelu pro sezónní dekompozici měsíční časové řady počtu dopravních nehod (v tis.) dostaneme hodnotu sezónního faktoru pro měsíc červenec 13,6; pak to znamená, že v červenci bylo o………………………………….. a)
- 121 -
8 Analýza časových řad – sezónní složka
Jestliže v multiplikativním modelu pro sezónní dekompozici časové řady počtu dopravních nehod (v tis.) dostaneme hodnotu sezónního faktoru pro měsíc duben 89, pak to znamená, že v dubnu bylo o ……………………………………….. ___________________________________________________________________________ e)
PŘÍKLAD 8.3 V multiplikativním modelu sezónní dekompozice čtvrtletní časové řady odbytu nealkoholického nápoje jsme dostali tyto hodnoty sezónních faktorů (indexů): 1.čtvrtletí 99,35 2.čtvrtletí 97,75 3.čtvrtletí ……. 4.čtvrtletí 90,6 Doplňte chybějící hodnotu. ___________________________________________________________________________ PŘÍKLAD 8.4 V aditivním modelu sezónní dekompozice čtvrtletní časové řady prodeje láhví sektu (v tis.ks) jsme dostali tyto hodnoty sezónních faktorů: 1.čtvrtletí …… 2.čtvrtletí – 12,41 3.čtvrtletí – 39,35 4.čtvrtletí 152,7 Doplňte chybějící hodnotu. ___________________________________________________________________________ PŘÍKLAD 8.5 Tabulka zobrazuje čtvrtletní údaje časové řady maloobchodního obratu restaurací a jídelen v České republice (v mil. Kč) v letech 2007 – 20011.
2007 2008 2009 2010 2011
1. čtvrtletí 3833 3930 4048 4233 4231
2. čtvrtletí 4429 4542 4620 4753 4816
3. čtvrtletí 4622 4716 4926 4983 5084
4. čtvrtletí 4178 4315 4438 4483 4549
Určete: a) sezónní faktory rozdílů za předpokladu použití modelu aditivní sezónnosti, b) odhadněte hodnoty časové řady do 4. čtvrtletí roku 2012, c) graficky znázorněte původní a odhadnutou časovou řadu včetně predikce.
- 122 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
8.2 ŘEŠENÍ PŘÍKLADŮ ŘEŠENÍ PŘÍKLADU 8.1 a) ano b) ne c) ano d) ne e) ano ___________________________________________________________________________ ŘEŠENÍ PŘÍKLADU 8.2 a) multiplikativní b) sezónní očištěnou řadu c) nule
d) 13 600 dopravních nehod více než je dlouhodobý průměr e) 11% dopravních nehod méně než je dlouhodobý průměr __________________________________________________________________________ ŘEŠENÍ PŘÍKLADU 8.3 400 99,35 97,75 90,6 112,3
__________________________________________________________________________ ŘEŠENÍ PŘÍKLADU 8.4 0 124,1 393,5 152,7 364,9
__________________________________________________________________________ ŘEŠENÍ PŘÍKLADU 8.5 a) 1. čtvrtletí = – 392,016 ; 2. čtvrtletí = 154,203; 3. čtvrtletí = 360,297; 4.čtvrtletí = – 122,484 b) Předpovědi: 1. čtvrtletí 2012 = 4 369,4 ; 2. čtvrtletí 2012 = 4 941,73; 3. čtvrtletí 2012 = 5 173,94; 4.čtvrtletí 2012 = 4 717,28 c) Obr. 8.7 Původní a odhadnutá časová řada maloobchodního obratu restaurací a jídelen 5400 5200 5000 4800 4600 4400 4200 4000 obrat
3800 3600 Q1 2007
MODEL Q1 2008
Q3 2007
Q1 2009
Q3 2008
Q1 2010
Q3 2009
Q1 2011
Q3 2010
Zdroj: Vlastní zpracování.
- 123 -
Q1 2012
Q3 2011
Q3 2012
8 Analýza časových řad – sezónní složka
8.3 PŘÍPADOVÉ STUDIE PŘÍPADOVÁ STUDIE 8.1 Tabulka zobrazuje čtvrtletní údaje časové řady tržeb (v tis.Kč) jednoho obchodu se sportovním zbožím v Krasnově v letech 2008 – 2011.
2008 2009 2010 2011
1. čtvrtletí 1,9 32,4 43,6 56,7
2. čtvrtletí 127,8 210,9 333,5 571,2
3. čtvrtletí 100,8 151,3 166,5 166,2
4. čtvrtletí 219,7 437,8 563,2 826,2
Určete: a) sezónní faktory rozdílů za předpokladu použití modelu multiplikativní sezónnosti, b) odhadněte hodnoty časové řady do 4. čtvrtletí roku 2012, c) graficky znázorněte původní a odhadnutou časovou řadu včetně predikce.
- 124 -