Prˇ´ıklady uzˇitı´ cˇasovy´ch rˇad k predikci rizikovy´ch jevu˚ 1
ˇR Ocˇeka´vana´ doba dozˇitı´ v C
Ma´me k dispozici cˇasovou rˇadu uda´vajı´cı´ ocˇeka´vanou dobu dozˇitı´ v Cˇeske´ republice od roku 1960 do roku 2011 (datovy´ soubor life expectancy CR.txt). Budeme predikovat vy´voj ocˇeka´vane´ doby dozˇitı´ pomocı´ • regresnı´ analy´zy, • exponencia´lnı´ho, resp. Holt-Wintersova vyrovna´va´nı´, • ARIMA modelu. Linea´rnı´ regrese
Odhady parametru˚ kvadraticke´ regresnı´ funkce (pro hodnoty cˇasove´ promeˇnne´ t = rok−1959 = 1, . . . , 52)
konst. t t2
Odhad 70.4349 -0.0907 0.0046
Sm. chyba 0.1312 0.0114 0.0002
t-test 536.70 -7.94 22.03
p-hodnota 0.0000 0.0000 0.0000
Predikce na 5 let doprˇedu spolu s 95% intervaly spolehlivosti jsou:
2012 2013 2014 2015 2016
predikce 78.56 78.96 79.37 79.79 80.22
dolnı´ 78.30 78.68 79.07 79.46 79.87
hornı´ 78.82 79.25 79.68 80.12 80.57
Operacˇnı´ program Vzdeˇla´va´nı´ pro konkurenceschopnost Na´zev projektu: Inovace magisterske´ho studijnı´ho programu Fakulty ekonomiky a managementu Registracˇnı´ cˇı´slo projektu: CZ.1.07/2.2.00/28.0326 ˇ TEM C ˇ ESKE´ REPUBLIKY. ´ LNI´M FONDEM A STA´TNI´M ROZPOC PROJEKT JE SPOLUFINANCOVA´N EVROPSKY´M SOCIA
Holt-Wintersovo vyrovna´va´nı´ Vy´sledky Holt-Wintersova vyrovna´va´nı´ jsou zachyceny na na´sledujı´cı´ obra´zku (cˇervena´ cˇa´ra)
2012 2013 2014 2015 2016
predikce 78.12 78.41 78.69 78.98 79.26
dolnı´ 78.71 79.21 79.70 80.19 80.69
hornı´ 77.54 77.61 77.68 77.76 77.84
2
ARIMA model
Grafy zna´zornˇujı´ pu˚vodnı´ cˇasovou rˇadu a cˇasove´ rˇady 1. a 2. diferencı´. Z jejich tvaru plyne, zˇe druhe´ diference jsou jizˇ staciona´rnı´.
3
Pro modelova´nı´ ocˇeka´vane´ doby dozˇitı´ pouzˇijeme model ARIMA(0,2,1). Analy´za reziduı´ je shrnuta v na´sledujı´cı´ch grafech.
2012 2013 2014 2015 2016
predikce 78.15 78.43 78.70 78.98 79.26
dolnı´ 77.57 77.56 77.59 77.63 77.67
hornı´ 78.73 79.29 79.82 80.34 80.85
4
2
Oxid uhlicˇity´
Ma´me k dipozici cˇasovou rˇadu koncentracı´ CO2 v atmosfe´rˇe. Jedna´ se o meˇsı´cˇnı´ cˇasovou rˇadu od roku 1959 do konce roku 1997, cozˇ je 468 pozorova´nı´. (data(co2, package=”datasets”)). Budeme predikovat vy´voj koncentrace • regresnı´ analy´zy, • exponencia´lnı´ho, resp. Holt-Wintersova vyrovna´va´nı´, • SARIMA modelu. Regresnı´ analy´za Pro u´cˇely regresnı´ analy´zy bude pouzˇ´ıvat cˇasovou promeˇnnou t = 1, 1 + 1/12, 1 + 2/12, . . . Trend lze popsat pomocı´ polynomu 3. stupneˇ.
konst. t 2 t t3
Odhad 315.9816 0.2701 0.0435 -0.0005
Sm. chyba 0.4679 0.0965 0.0054 0.0001
t-test 675.38 2.80 8.05 -5.76
p-hodnota 0.0000 0.0053 0.0000 0.0000
5
Periodickou slozˇku nejprve popı´sˇeme pomocı´ „dummy“ promeˇnny´ch. Jelikozˇ se jedna´ o cˇasovou rˇadu meˇsı´cˇnı´ch u´daju˚, pouzˇijeme v regresnı´m modelu celkem 12 „dummy“ promeˇnny´ch, konstantnı´ cˇlen jizˇ soucˇa´stı´ modelu nebude. m1=rep(c(1,0,0,0,0,0,0,0,0,0,0,0),39) m2=rep(c(0,1,0,0,0,0,0,0,0,0,0,0),39) m3=rep(c(0,0,1,0,0,0,0,0,0,0,0,0),39) m4=rep(c(0,0,0,1,0,0,0,0,0,0,0,0),39) ... m12=rep(c(0,0,0,0,0,0,0,0,0,0,0,1),39) Regresnı´ model se bude skla´dat z polynomu 3. stupneˇ bez konstanty a z promeˇnny´ch m1,. . . , m12. Vy´sledny´ fit a predikce na 12 hodnot doprˇedu jsou zachyceny na na´sledujı´cı´ch obra´zcı´ch.
Uvedena´ cˇasova´ rˇada vykazuje rocˇnı´ periodicitu. Pouzˇijeme periodicke´ funkce sinus a cosinus pro konstrukci alternativnı´ho regresnı´ho modelu. Ten bude obsahovat polynom 3. stupneˇ periodicke´ funkce cos(2πt)+sin(2πt). Vy´sledny´ fit a predikce na 12 hodnot doprˇedu jsou zachyceny na na´sledujı´cı´ch obra´zcı´ch. 6
Holt-Wintersovo vyrovna´va´nı´ Vy´sledky Holt-Wintersova vyrovna´va´nı´ spolu s predikcemi na na´sledujı´cı´ch 12 hodnot (jeden rok) jsou zachyceny na na´sledujı´cı´ch obra´zcı´ch.
SARIMA model Analyzovanou rˇadu budeme popisovat pomocı´ modelu SARIMA(0,1,1)(0,1,1) s periodou 12. Vy´sledky analy´zy reziduı´ a na´sledna´ predikce budoucı´ch 12 hodnot jsou zachyceny v na´sledujı´cı´ch grafech.
7
8
Prˇ´ıklady uzˇitı´ cˇasovy´ch rˇad k predikci rizikovy´ch jevu˚
Prˇ´ıklady k procvicˇenı´ 1. Datovy´ soubor population USA.txt zachycuje vy´voj pocˇtu obyvatel v USA v obdobı´ 1790 azˇ 1970. Pomocı´ vhodne´ho regresnı´ho modelu predikujte vy´voj populace v na´sledujı´cı´ch desetiletı´ch. Pro predikci pouzˇijte take´ metody exponencia´lnı´ho vyrovna´va´nı´. [Datovy´ soubor: population USA.txt] 2. Cˇasova´ rˇada Nile z balı´cˇku datasets obsahuje hodnoty meˇrˇenı´ rocˇnı´ho pru˚toku rˇeky Nilu v Asua´nu (1871–1970) v miliarda´ch kubicky´ch metru˚. Dı´ky vy´stavbeˇ prˇehrady na te´to rˇece dosˇlo ke zmeˇneˇ u´rovneˇ pru˚toku okolo roku 1998. Pomocı´ vhodne´ho regresnı´ho modelu odhadneˇte velikost te´to zmeˇny. Pokuste se identifikovat vy´znamne´ periody v te´to rˇadeˇ. [Prˇ´ıkaz v R: data(Nile)] 3. Cˇasova´ rˇada sunspots z balı´cˇku datasets obsahuje pru˚meˇrne´ meˇsı´cˇnı´ pocˇty slunecˇnı´ch skvrn od roku 1749 do roku 1983. Nalezneˇte vy´znamne´ periody v te´to cˇasove´ rˇadeˇ. [Prˇ´ıkaz v R: data(sunspots)] 4. Data v souboru prumerna mzda CR2000 2012.txt obsahuje vy´voj hrube´ meˇsı´cˇnı´ mzdy v CˇR v obdobı´ 2000–2012, jedna´ se o cˇtvrtletnı´ data. Popisˇte tuto cˇasovou rˇadu vhodny´m SARIMA modelem a spocˇ´ıtejte predikce na jeden rok doprˇedu. Vy´sledky srovnejte s prˇedpoveˇd’mi zı´skany´mi pomocı´ linea´rnı´ regrese s „dummy“ promeˇnny´mi a s Holt-Wintersovy´m vyrovna´va´nı´m. [Datovy´ soubor: prumerna mzda CR2000 2012.txt]
9