EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
PREDIKOVÁNÍ CEN AKCIÍ V KOMERČNÍ BANCE PREDICTING STOCK PRICES IN COMMERCIAL BANK
Robert Zeman Vysoká škola technická a ekonomická v Českých Budějovicích, Katedra ekonomiky a managementu
[email protected] Jaroslav Stuchlý Vysoká škola technická a ekonomická v Českých Budějovicích, Katedra přírodních věd
[email protected] Abstrakt: V článku jsou stručně popsány základní metody a modely používané pro predikci cen akcií v Komerční bance (dále KB) prováděných pomocí analýzy časových řad. Je použita časová řada 1588 konečných cen akcií KB na burze cenných papírů v Praze a jednotlivé modely jsou aplikovány na určení bodových i intervalových předpovědí cen těchto akcií na 12 následných obchodních dní. Výsledky jsou porovnány pomocí celkových a následných měr přesnosti a je vybrána optimální aplikace na vybranou časovou řadu. Klíčová slova: Analýza časových řad, předpovědi, predikční modely, ceny akcií, Komerční banka, porovnání předpovědí Abstract: The aim of the work is to describe the various ways of modeling the time series analysis that reflect the evolution of stock prices in Commercial Bank (further CB) in order to obtain effective predictive models. It is used the time series of 1588 final prices CB shares on stock exchanges in Prague and the models are applied to determine point and interval forecasts of the price of those shares on the successive12 trading days. The results are compared using total and successive rates of accuracy and it is selected optimum application on the selected time series. Key words: time series analysis, forecasting, predictive models, stock quotes, Commercial Bank, comparing predictions JEL: G1
2
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
1
Article
Úvod
Cílem práce bude popsat jednotlivé možnosti modelování časových řad popisujících vývoj cen akcií za účelem získání efektivních predikčních modelů, aplikovat tyto výsledky na časovou řadu konečných cen akcií KB z jednotlivých obchodních dnů na Pražské burze cenných papírů, porovnat přesnost předpovědí vypočítaných pomocí jednotlivých modelů, vybrat model, který bude dávat pro daná data nejpřesnější předpovědi a ověřovat splnění podmínek pro adekvátní použití těchto metod. 2
Metody - Materiály a metodika
Použijeme historická data z kurzovních listů KB za období od 2. 2. 2007 do 29. 4. 2013. Dostaneme odtud proměnné: konečná cena akcií (cena), celkový objem obchodů (objem), data obchodních dnů – očíslujeme je do proměnné obchodní dny (t = 1, 2,...,1588). Zde dny s chybějícími daty vynecháváme. Data s použitými proměnnými lze najít na webové stránce https://is.vstecb.cz/auth/dok/rfmgr.pl?upload_id=4380872 v datovém souboru koban.xlsx. Abychom mohli provést i následné hodnocení přesnosti předpovědí, doplníme data ještě o období od 30. 4. 2013 do 15. 5. 2013 (12 obchodních dní, t = 1589,...,1600). Znázornění doplněných dat je na grafu 1. Graf 1: Graf doplněné časové řady
K analýzám jsme použili obvyklou metodiku analýzy časových, která je obecně popsána např. v Arlt (2002). Numerické a grafické výsledky jsme získali použitím programu Statgraphics Plus pro Windows 3.0, PcGive 2.10 a Excel. Modely používané k získávání předpovědí můžeme třídit podle různých hledisek. Nejčastěji používané třídění je na ekonometrické modely, modely založené na trendové analýze, modely založené na časových řadách a kvalitativní předpovědní modely. Předpovědními modely založenými na trendových funkcích pro akcie Erste Bank jsme se zabývali v článku Stuchlý, Zeman (2013). Ukázali jsme, že při velké variabilitě dat jsou tyto předpovědi zatíženy velkými chybami. V tomto článku se budeme zabývat jen předpověďmi založenými na modelech časových řad, které dávají podstatně přesnější výsledky. Kvalitu modelu budeme posuzovat pomocí známých měr přesnosti předpovědí MSE (střední kvadratická chyba), MAE (střední absolutní chyba), MAPE (střední absolutní procentuální chyba) nebo i jiných měr, zavedených např. v Arlt (2002). Pro získávání předpovědí existují různé metody a modely. Neexistuje ale nic takového jako je nejlepší předpovědní model, použitelný ve všech situacích. Kvalita a vhodnost použitého modelu závisí na vlastnostech použité časové řady, tj. zejména na tom, kolik má řada členů, jaká je jejich variabilita, zda obsahuje trendovou složku (není stacionární), sezónní nebo cyklickou složku, je-li mezi členy řady sériová závislost (autokorelace), apod. Pro každou časovou řadu proto vybíráme nevhodnější předpovědní metodu, popř. můžeme také výsledky z jednotlivých modelů kombinovat.
3
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
Do programu Statgraphics jsme načetli výše zmíněná data a v nabídce Analýza časových řad – Předpovídání jsme v položce Porovnání modelů vybírali modely poskytující nejpřesnější výsledky. Jde o tyto modely: model neměnných hodnot (náhodné procházky), klouzavých průměrů, exponenciálního vyrovnávání, exponenciálně vážených klouzavých průměrů a nakonec Box-Jenkinsovy modely (ARIMA-modely). Uvedeme si stručný popis odpovídajících metod a jejich aplikační výsledky. Podrobnější popis těchto modelů a určování bodových a intervalových předpovědí najdeme např. v Cipra (1986), Stuchlý (2004), Arlt, Arltová (2003), Petrášková (2006), Makridatis, Wheelwright (1989), Grifits, Hill, Judge (1992). 3
Model neměnných hodnot
Předpovědi založené pouze na nejčerstvějších pozorováních proměnné jsou často označovány jako "naivní předpovědi". Naivní modely se vyznačují značnou jednoduchostí, proto je můžeme použít jako srovnávací odhady předpovědí, dříve než užijeme složitější model. Model neměnných hodnot (model náhodné procházky) je nejjednodušší naivní předpovědní model, používaný u časové řady, která nevykazuje trend (stacionární časová řada). Předpověď se uskutečňuje na i období dopředu a její hodnota je rovna poslední aktuální hodnotě (nejnovější hodnotě časové řady), tedy: Ft+i = Xt, kde Ft+i je předpověď na období t+i (tedy i období dopředu), Xt je poslední známá hodnota časové řady. Pro časovou řadu s lineárním trendem lze použít model s proporční změnou Ft+1 = Xt + p(Xt+1 - Xt), kde p je vhodně zvolená konstanta z intervalu (0;1), nebo časovou řadu očistit od trendu diferencováním. Pro časovou řadu s exponenciálním trendem lze použít model procentuální změny Ft+1 = (1+k) Xt, kde k = Xt / Xt-1. Z grafu 1 vidíme, že použitá časová řada přibližně nemá trend (je stacionární). Proto předpověď provedeme pomocí modelu neměnných hodnot na časové řadě konečných cen akcií Komerční banky (soubor koban.xlsx). Porovnání předpovědí se skutečnými 12 hodnotami a použití výše uvedených měr přesností je provedeno ve 2. sloupci tabulky 1. V posledním sloupci jsou míry přesnosti počítané pomocí programu Statgraphics z celé časové řady původních hodnot – míry označené hvězdičkou). Míry v levé části tabulky 1. představují následné hodnocení přesnosti předpovědí. Zde pro porovnání byly použity nové hodnoty časové řady neobsažené v původní časové řadě (získané z internetu). Uvedené hodnoty měr přesnosti mají samy o sobě jen malou vypovídací schopnost. Mohou být ovšem použity k porovnání s výsledky jiných metod a na jejich základě může pak být zvolena optimální předpovědní metoda pro konkrétní časovou řadu. Vzhledem k tomu, že nově získaných hodnot je použito jen omezené množství, mohou být výsledky takového porovnávání jednotlivých metod zkreslené. Častěji se proto používají míry přesnosti vypočtené z původní časové řady. Tyto míry založené na dlouhé původní časové řadě vypočtené pomocí programu Statgraphics (označené hvězdičkou) jsou v pravé části tabulky. Hvězdičkované míry přesností jsou nižší, což plyne z většího množství použitých dat pro jejich výpočet a ze značného kolísání následných hodnot cen akcií. Při vyhodnocování optimální předpovědní metody budeme proto více přihlížet k hvězdičkovaným mírám přesnosti.
4
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
Tabulka 1: Naivní předpověď metodou neměnných hodnot a míry přesnosti předpovědi Čas t
Datum 30. 4. 2013 2. 5. 2013 3. 5. 2013 6. 5. 2013 7. 5. 2013 9. 5. 2013 10. 5. 2013 13. 5. 2013 14. 5. 2013 15. 5. 2013 16. 5. 2013 17. 5. 2013 MAD MSE MAPE v %
Předpovězená hodnota
Skutečná hodnota
Absolutní chyba předpovědi
Absolutní chyba předpovědi2
Procentní chyba v %
3720 3720 3720 3720 3720 3720 3720 3720 3720 3720 3720 3720
3744 3825 3850 3838 3819 3700 3630 3693 3810 3785 3791 3782
24 105 130 118 99 20 90 27 90 65 71 62
576 11025 16900 13924 9801 400 8100 729 8100 4225 5041 3844 MAD* MSE* MAPE* v %
0,64102564 2,74509804 3,37662338 3,07451798 2,59230165 0,54054054 2,47933884 0,73111292 2,36220472 1,71730515 1,87285677 1,63934426
1589 1590 1591 1592 1593 1594 1595 1596 1597 1598 1599 1600 75,08333 6888,75 1,981022
58,3749 6769,68 1,67941
Statgraphics počítá pro předpovědi i predikční intervaly. Graf 2 znázorňuje bodové i intervalové predikce. Graf 2: Předpovědi pomocí modelu neměnných hodnot (náhodné procházky)
Time Sequence Plot for cena Random walk 4300 actual forecast 95,0% limits
4100
cena
3900 3700 3500 3300 3100 1540
4
1550
1560
1570
1580
1590
1600
Model klouzavých průměrů
Předpokládejme nejdříve, že uvažovaná časová řada nevykazuje trend ani sezónní složku. K předpovědi její hodnoty pro čas t+1 můžeme potom použít klouzavý průměr jejích posledních m pozorování, tj. y t +1 = MA(m) , kde MA(m) je prostý klouzavý průměr počítaný z m členů podle vzorce
5
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
1 ( y t + y t -1 + y t -2 +L+ y t -m+1 ) . m Stejnou předpověď můžeme použít i na další období dopředu. Určení klouzavé délky m je třeba provést zkusmo (s využitím nahoře uvedených měr). Má-li uvažovaná řada lineární trend, potom ho nejdříve odstraníme výpočtem prvních diferencí ∆yt = yt - yt-1. Časová řada 1. diferencí pak nemá trend a pro čas t+1 můžeme určit její předpověď ∆ y t +1 pomocí klouzavého průměru řady ∆yt. Předpověď původní řady pro čas t+1 je yt +1 = ∆ y t +1 + yt . Podobně, má-li uvažovaná časová řada kvadratický trend, použijeme řadu jejich druhých diferencí ∆2yt = ∆yt - ∆yt-1 = yt - 2yt-1 + yt-2, která již nevykazuje trend a pro čas t+1 lze pomocí jejího klouzavého průměru určit předpověď ∆2 yt +1. Předpovědí původní řady pro čas t+1 je yt +1 = ∆2 y t +1 + 2 yt − yt −1 . V Statgraphics se přesvědčíme, že při přepokládaném konstantním trendu nejlepší výsledky dávají trojčlenné klouzavé průměry. Předpovědi jsou opět konstantní a nabývají hodnoty 3697,33 Kč. Shrnutí výsledků provedeme do tabulky 2. a grafu 3. Toto vyrovnání je méně přesné a používáme ho obvykle, když počítáme jen jednu předpověď. MA(m) =
Tabulka 2: Předpovědi metodou trojčlenných klouzavých průměrů a míry přesnosti
Datum
Čas t
Předpovězená hodnota
Skutečná hodnota
Absolutní chyba předpovědi
Absolutní chyba předpovědi2
Procentní chyba v %
30. 4. 2013
1589
3697,33
3744
46,67
2178,0889
1,246527778
2. 5. 2013
1590
3697,33
3825
127,67
16299,6289
3,337777778
3. 5. 2013
1591
3697,33
3850
152,67
23308,1289
3,965454545
6. 5. 2013
1592
3697,33
3838
140,67
19788,0489
3,665190203
7. 5. 2013
1593
3697,33
3819
121,67
14803,5889
3,185912543
9. 5. 2013
1594
3697,33
3700
2,67
7,1289
0,072162162
10. 5. 2013
1595
3697,33
3630
67,33
4533,3289
1,854820937
18,7489
0,117248849
13. 5. 2013
1596
3697,33
3693
4,33
14. 5. 2013
1597
3697,33
3810
112,67
12694,5289
2,957217848
15. 5. 2013
1598
3697,33
3785
87,67
7686,0289
2,316248349
16. 5. 2013
1599
3697,33
3791
93,67
8774,0689
2,470852018
17. 5. 2013
1600
3697,33
3782
84,67
7169,0089
2,238762559
58,2828 6730,36 1,67561
MAD
86,863
MSE
9771,7
MAD* MSE*
MAPE v %
2,2857
MAPE* v %
6
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
Graf 3: Předpovědi pomocí modelu trojčlenných klouzavých průměrů
Time Sequence Plot for cena Simple moving average of 3 terms 4300 actual forecast 95,0% limits
4100
cena
3900 3700 3500 3300 3100 1540
5
1550
1560
1570
1580
1590
1600
Exponenciální vyrovnání
Nejjednodušší tvar má model, nemá-li časová řada trend. Potom používáme tzv. Brownovo prosté exponenciální vyrovnávání, kdy předpovídanou hodnotu y t +1 časové řady v čase t+1 dostaneme jako vážený průměr pozorované hodnoty yt řady v čase t a předcházející předpovědi yt této řady v čase t, tj. výpočet provádíme podle rekurentního vzorce y t +1 = α yt + (1-α) yt , kde α je tzv. vyrovnávací konstanta splňující podmínku 0 ≤ α ≤ 1. Tuto hodnotu můžeme použít i jako předpověď y t + T na T období dopředu. Za počáteční předpověď klademe obyčejně y1 = y1 . Optimální volbu vyrovnávací konstanty necháme na programu Statgraphics. Označíme-li vyrovnanou hodnotu řady v čase t symbolem St, potom platí St = α yt + (1-α) St-1, kde St-1 je vyrovnaná hodnota řady v čase t-1. Má-li uvažovaná časová řada lineární trend, potom používáme tzv. exponenciální vyrovnávání druhého stupně, které spočívá v tom, že vyrovnané hodnoty znovu vyrovnáváme. Má-li časová řada obecnější trend, potom používáme tzv. trojnásobné exponenciální vyrovnávání (viz např. Stuchlý 2004). Program Statgraphics vybírá jako optimální metodu exponenciálního vyrovnání prosté exponenciální vyrovnání s vyrovnávací konstantou 0,9999 a určí předpovědní hodnotu. Tabulka pro předpověď metodou prostého exponenciálního vyrovnání a následné míry přesnosti předpovědi jsou stejné jako v tabulce 1. Míry přesnosti předpovědi založené na původní časové řadě vypočtené pomocí programu Statgraphics jsou MAE* = 58,375, MSE* = 6774, MAPE* = 1,67941. Znamená to, že obecně by tyto předpovědi měli vyjít jen mírně přesnější než v modelu náhodné procházky.
7
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
Graf 4: Předpovědi pomocí modelu prostých klouzavých průměrů
Time Sequence Plot for cena Simple exponential smoothing with alpha = 0,9999 4300 actual forecast 95,0% limits
4100
cena
3900 3700 3500 3300 3100 1540
6
1550
1560
1570
1580
1590
1600
Exponencionálně vážené klouzavé průměry (Holtovo vyrovnání)
Jde o velmi efektivní předpovědní EWMA-metodu použitelnou pro proces se sezónními složkami. Je známa též pod názvem Wintersovo exponenciální vyrovnávání. Vychází z multiplikačního modelu časové řady s lineárním trendem násobeným sezónní složkou. V každém časovém bodě je zvlášť odhadována průměrná úroveň (absolutní člen) a přírůstek trendu (směrnice) a dále sezónní faktor a potom kombinací těchto složek dostaneme celkovou předpověď. Vzorce jsou uvedeny v Stuchlý (2004). Při určování vyrovnávacích konstant postupujeme podobně jako u Brownova exponenciálního vyrovnávání. Pokud se v časové řadě nevyskytuje sezónní složka (tj. Ft = 1), potom tato metoda je také známa pod názvem Holtovo exponenciální vyrovnávání. V našem případě se jedná o časovou řadu bez sezónní složky a výsledky získané Holtovým vyrovnáním v Statgraphics zapíšeme opět do tabulky 3. A grafu 5. Holtovo vyrovnání dává obecně přes svoji komplikovanost pro použitou časovou řadu méně přesnou předpověď než model náhodné procházky i než model prostého exponenciálního vyrovnání. Jen počítá více předpovědí, ale tyto jsou pro větší odlehlost od zadaných dat zatíženy velkou predikční chybou, která se rychle s časem zvyšuje. Následné hodnocení je však lepší než u modelu náhodné procházky. Tabulka 3: Předpověď metodou Holtova vyrovnání a míry přesnosti předpovědi
Datum
Čas t
Předpovězená hodnota
Skutečná hodnota
Absolutní chyba předpovědi
Absolutní chyba předpovědi2
Procentní chyba v %
30. 4. 2013
1589
3722,72
3744
21,28
452,8384
0,5683761
2. 5. 2013
1590
3725,44
3825
99,56
9912,1936
2,6028758
3. 5. 2013
1591
3728,17
3850
121,83
14842,5489
3,1644156
6. 5. 2013
1592
3730,89
3838
107,11
11472,5521
2,7907764
7. 5. 2013
1593
3733,61
3819
85,39
7291,4521
2,2359256
9. 5. 2013
1594
3736,34
3700
36,34
1320,5956
0,9821622
10. 5. 2013
1595
3739,06
3630
109,06
11894,0836
3,0044077
8
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
13. 5. 2013
1596
3741,78
3693
48,78
2379,4884
1,3208773
14. 5. 2013
1597
3744,51
3810
65,49
4288,9401
1,7188976
15. 5. 2013
1598
3747,23
3785
37,77
1426,5729
0,9978864
16. 5. 2013
1599
3749,95
3791
41,05
1685,1025
1,0828277
17. 5. 2013
1600
3752,67
3782
29,33
860,2489
0,7755156
60,467 7226,91 1,73671
MAD
66,9158
MSE
5652,22
MAD* MSE*
MAPE v %
1,77041
MAPE* v %
Graf 5: Předpovědi pomocí modelu Holtova vyrovnání
Time Sequence Plot for cena
cena
Holt's linear exp. smoothing with alpha = 0,9999 and beta = 0,1 4300 actual 4100 forecast 95,0% limits 3900 3700 3500 3300 3100 1540
7
1550
1560
1570
1580
1590
1600
Box-Jenkinsonovy modely (ARIMA-modely)
Box-Jenkinsova metodologie (BJ-metodologie) předpovídá budoucí hodnoty řady pouze z minulého vývoje časové řady. Klade důraz na pravděpodobnostní a stochastickou analýzu vlastní ekonomické časové řady založenou na filosofii "nechť data hovoří sama za sebe". BJ-metodologie používá různé předpovědní modely. Zavedeme si třídu nejčastěji používaných autoregresních integrovaných modelů klouzavého průměru označovanou jako ARIMA(p,d,q)-modely, která obsahuje všechny časové řady tvaru yt = φ0 + φ1yt-1 + φ2yt-2 + ...+ φpyt-p + εt - θ1εt-1 - θ2εt-2 - ...- θqεt-q, kde prvních p+1 členů nazýváme autoregresní část modelu, posledních q+1 členů nazýváme částí klouzavého průměru, εt, εt-1, ..., εt-q náhodné složky časové řady, φ0, φ1, φ2, ..., φp autoregresní parametry, θ1, θ2, ...θq parametry klouzavého průměru. Abychom vybrali nejlepší ARIMA-model pro daná data, musíme nejdříve odstranit z časové řady trend pomocí vhodné transformace. Nejčastěji stačí použít vhodný stupeň diferencování analyzované časové řady. Potřebný stupeň diferencování je zde označen d. Základním problémem při výběru ARIMA(p,d,q)-modelu je výběr parametrů p, d, q. Při d = 0 hovoříme o ARMA(p,q)-modelu (uvažovaná řada je stacionární, tj. trend se nemění s časem a není ji proto třeba diferencovat); při q = 0 hovoříme o autoregresním modelu AR(p,d) a při p = 0 o modelu čistého klouzavého průměru MA(d,q). Při používání ARIMA-modelu předpokládáme také, že v časové řadě není sezónnost. Existuje i obecnější BJ-model, který zahrnuje kromě trendu i sezónnost, známý pod názvem SARIMA.
9
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
Aplikace BJ-metodologie zahrnuje následující kroky: 1. 2. 3. 4.
Identifikace modelu. Odhad parametrů modelu. Diagnostika modelu. Výpočet předpovědí.
Identifikací modelu rozumíme výběr správné kombinace hodnot parametrů modelu p, d a q. Používáme k tomu autokorelační a parciální autokorelační funkce – ACF a PACF (viz Cipra 1986 nebo Arlt 2003)), jejich odhady a grafy (korelogramy). Při výběru modelu se zhruba řídíme těmito pravidly: a) Model klouzavého průměru MA(q) je charakterizovaný tím, že až po q posunutích ACF výrazně klesá a tím, že PACF postupně klesá k nule. b) Autoregresní model AR(p) je charakterizovaný tím, že až po p posunutích PACF výrazně klesá a postupným klesáním ACF. c) Je-li výsledek nejednoznačný v tom smyslu, že oba průběhy autokorelační i parciální autokorelační funkce vykazují významné hroty, použijeme smíšený ARMA nebo ARIMA model. Odhad autoregresních parametrů a parametrů klouzavého průměru provádíme např. v Statgraphics nelineární metodou nejmenších čtverců nebo pomocí jiného programu metodou maximální věrohodnosti. Při diagnostice modelu testujeme významnost odhadnutých parametrů, popř. modelu jako celku a zkoumáme pomocí reziduální analýzy rezidua odhadnutého modelu (jejich náhodnost a sériovou nezávislost, tj. zda rezidua představují tzv. bílý šum). Splňuje-li odhadnutý model všechny tyto požadavky, můžeme ho použit na předpovědi. V opačném případě se musíme vrátit k identifikaci a použitý model změnit. V případě naší časové řady se jedná o stacionární řadu bez sezónní složky. K identifikaci modelu znázorníme AFF a PACF v grafu 5. Z grafu vidíme, že můžeme použít model AR(1) nebo AR(3). Z porovnání výsledků v programu Statgraphics trochu lepší výsledky dává model AR(3). Odhadnutý model má tvar Graf 6: ACFa PACF pro časovou řadu konečných cen akcií Komerční banky
Estimated Autocorrelations for cena
Partial Autocorrelations
Estimated Partial Autocorrelations for cena
Autocorrelations
1 0,6 0,2 -0,2 -0,6 -1 0
5
10
15
20
25
lag
1 0,6 0,2 -0,2 -0,6 -1 0
5
10
15
lag
10
20
25
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
Sumář k modelu ARIMA Parametr odhad stand. chyba t - statistika p-hodnota -----------------------------------------------------------------------------------------------------AR(1) 1,00558 0,0250846 40,0870 0,000000 AR(2) -0,0753821 0,0360227 -2,09263 0,036382 AR(3) 0,0637005 0,0250883 2,53905 0,011115 Průměr 3158,45 80,3099 39,3283 0,000000 Konstanta 19,2755 ------------------------------------------------------------------------------------------------------Graf 7: Graf reziduální ACF
Residual Autocorrelations for cena ARIMA(3,0,0) with constant
Autocorrelations
1 0,6 0,2 -0,2 -0,6 -1 0
5
10
15
20
25
lag Všechny odhadnuté regresní parametry jsou statisticky významné. Provedeme ještě další diagnostiku modelu. Box-Pierceův test v programu Statgraphics (T = 56,59, p-hodnota = 0,000041) zamítá hypotézu o nevýznamné autokorelaci. Potvrzuje to i graf 7, kde některé hodnoty reziduálních autokorelačních koeficientů mírně převyšují meze konfidenčních oblastí. Jde o slabou (r11 = -0,0929), ale významnou lineární závislost původní na některých posunutých řadách reziduí. Test heteroskedasticity Statgraphics nezahrnuje. Proveďme proto tento test alespoň graficky. V grafu 8 je znázorněna závislost rezidují na pořadovém číslu měření a závislost reziduí na vyrovnaných hodnotách cen. Přesnější testování heteroskedasticity reziduí vzhledem k vyrovnaným hodnotám cen provedeme v Excelu pomocí Goldfeldova – Kvantova testu. Po vynechání asi 15% prostředních hodnot dostaneme F = 1,908 > F0.95(674.674) = 1,135 (p-hod. = 0). Znamená to, že v modelu byla prokázána významná heteroskedasticita reziduí. Znamená to, že odhady získané obyčejnou metodou nejmenších čtverců (OMNČ) ztrácí své optimální vlastnosti. Jsou jen asymptoticky nestranné a konzistentní, ale nejsou vydatné. Ale Statgraphics neodhadoval tento model OMNČ, ale byla použita obecná metoda nejmenších čtverců. Navíc prokázaná mírná autokorelace znamená, že zvolený model nemusí být zcela adekvátní. Avšak žádný jiný z BJ-modelů odhadnutých v Statgraphics nedává lepší výsledky a proto zůstáváme zatím při porovnání výsledků získaných pomocí Statgraphics u tohoto modelu.
11
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
Graf 8: Závislost reziduí na číslu měření a reziduí na vyrovnaných hodnotách
Residual Plot for cena on t
Plot of RESIDUALS vs FORECASTS
600
600
400
400
R E S ID U A L S
Residual
ARIMA(3,0,0) with constant
200 0 -200 -400 -600 0
400
800
1200
200 0 -200 -400 -600
1600
1500
2500
3500
4500
5500
FORECASTS
Předpovědi a míry jejich přesností uvádíme v tabulce 4. Tabulka 4. Předpovědi a jejich míry přesnosti pro vyrovnání modelem AR (3)
Datum
Čas t
Předpovězená hodnota
Skutečná hodnota
Absolutní chyba předpovědi
Absolutní chyba předpovědi2
Procentní chyba v %
30. 4. 2013
1589
3717,53
3744
26,47
700,6609
0,7069979
2. 5. 2013
1590
3711,67
3825
113,33
12843,6889
2,9628758
3. 5. 2013
1591
3708,38
3850
141,62
20056,2244
3,6784416
17593,3696
3,4559666
6. 5. 2013
1592
3705,36
3838
132,64
7. 5. 2013
1593
3702,19
3819
116,81
13644,5761
3,0586541
9. 5. 2013
1594
3699,03
3700
0,97
0,9409
0,0262162
10. 5. 2013
1595
3695,9
3630
65,9
4342,81
1,815427
13. 5. 2013
1596
3692,78
3693
0,22
0,0484
0,0059572
14. 5. 2013
1597
3689,68
3810
120,32
14476,9024
3,1580052
15. 5. 2013
1598
3686,6
3785
98,4
9682,56
2,5997358
16. 5. 2013
1599
3683,54
3791
107,46
11547,6516
2,8346083
17. 5. 2013
1600
3680,5
3782
101,5
10302,25
2,6837652
MAD
85,47
MSE
9599,31
MAD* MSE*
MAPE v %
2,24889
MAPE* v %
60,467 7226,91 1,73671
I když to následné hodnocení nepotvrzuje (míry jsou počítané jen z malého množství dat), obecně ze všech dat vychází všechny míry přesnosti nejnižší. Grafické znázornění bodových i intervalových předpovědí je na grafu 9.
12
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
Graf 9: Předpovědi počítané v Statgraphics pomocí modelu AR(3)
Time Sequence Plot for cena ARIMA(3,0,0) with constant 4300 actual forecast 95,0% limits
4100
cena
3900 3700 3500 3300 3100 1540
1550
1560
1570
1580
1590
1600
Pokusíme se ještě výsledky zlepšit tím, že odhadneme model AR(3) metodou RALS v programu PcGive 2.10 (popis používání programu – viz Lejnarová, Ráčková, Zouhar 2009). Pro odhadované parametry dostáváme: Coefficient 1.21504 -0.472218 0.246455 39.6017 -0.186138
cena_1 cena_2 cena_3 Konstanta ro_1
Stand.chyba 0.08832 0.07960 0.05083 15.49 0.08995
t-hod. 13.8 -5.93 4.85 2.56 -2.07
p-hod. 0.000 0.000 0.000 0.011 0.039
V posledním řádku jsou uvedeny údaje pro odhad aoutokorelačního koeficientu mezi cenou a 1x posunutou cenou. Autokorelace byla výrazně redukována. Test heteroskedasticity provedeme s využitím Whiteova testu v tomto programu. Dostáváme χ2(6) = 26.134, p-hod. = 0.0002. Znamená to, že multikolinearita byla mírně redukována. Vyrovnané hodnoty a předpovědi jsou znázorněný na grafu 10. Předpovědi jsou zde porovnány se skutečnými hodnotami cen akcií. Graf 10: Vyrovnané hodnoty a předpovědi modelu AR(3) získané zobecněnou metodou RALS
4500
cena
4000
Fitted
4000
1-step Forecasts
cena
3900
3500 3800
3000 3700 2500 3600 2000 3500 150
300
450
600
750
900
1050
1200
1350
1500
1590
13
1595
1600
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
V následující tabulce 5 jsou uvedeny v dříve použité formě předpovědi a jejich míry přesnosti. Vidíme, že kvalita zejména následných odhadů (na levé straně tabulky) se použitím metody RALS velmi výrazně zlepšila. Tabulka 5: Předpovědi a jejich míry přesnosti pro vyrovnání modelem AR(3) metodou RALS
Datum
Čas t
Předpovězená hodnota
Skutečná hodnota
Absolutní chyba předpovědi
Absolutní chyba předpovědi2
30. 4. 2013
1589
3724,322134
3744
19,67786579
387,218402
0,525584022
3825
82,51233552
6808,285513
2,157185242
778,4441939
0,724691241
2. 5. 2013
8
1590
3742,487664
Procentní chyba v %
3. 5. 2013
1591
3822,099387
3850
27,90061279
6. 5. 2013
1592
3844,081169
3838
6,08116872
36,980613
0,158446293
7. 5. 2013
1593
3828,931492
3819
9,931492182
98,63453697
0,260054784
9. 5. 2013
1594
3818,525585
3700
118,5255855
14048,31441
3,203394202
10. 5. 2013
1595
3698,139812
3630
68,1398118
4643,033952
1,877129802
13. 5. 2013
1596
3635,856075
3693
57,1439246
3265,428118
1,547357828
14. 5. 2013
1597
3708,330179
3810
101,6698214
10336,75258
2,668499249
674,408276
0,686112864
15. 5. 2013
1598
3810,969372
3785
25,96937188
16. 5. 2013
1599
3768,682575
3791
22,31742463
498,0674419
0,588694925
17. 5. 2013
1600
3784,629927
3782
2,629927316
6,916517688
0,069538004
58,4343188 6656,71078 1,68387887
MAD
45,2083
MSE
3465,21
MAD* MSE*
MAPE v % 1,20556
MAPE* v %
Porovnání přesnosti předpovědi získaných pomocí jednotlivých modelů Porovnání přesností modelů je v následujícím přehledu. ----------------------------Data proměnné: cena Počet pozorování = 1588 Modely -----------(A) Náhodná procházka (B) Prosté klouzavé průměry ze 3 členů (C) Prosté exponenciální vyrovnání s alfa = 0,9999 (D) Holtovo lineární vyrovnání s alfa = 0,9999 a beta = 0,1 (E) Model AR(3) odhadnutý zobecněnou MNČ v Statgraphics (F) Model AR(3) odhadnutý metodou RALS v PcGive
14
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
Míry přesnosti předpovědí Model MSE MAE MAPE ME -----------------------------------------------------------------------------------------(A) 6769,68 58,3749 1,67941 0,37870 (B) 6730,36 58,2828 1,67561 0,71251 (C) 6774,00 58,375 1,67941 0,37874 (D) 7226,91 60,467 1,73671 -0,03327 (E) 6730,36 58,2828 1,67561 3,43492 (F) 6656,71 58,4343 1,68388 0,00000 Tabulka porovnává výsledky z šesti různých předpovědních modelů. Podíváme-li se na chybové statistiky, nejmenší střední kvadratickou chybu (MSE) při odhadu ceny má model (F). Nejmenší střední absolutní chybou (MAE) má model (E). Nejmenší střední absolutní procentuální chyba (MAPE) má opět model (E). Podle těchto výsledků je optimálním modelem model (E) nebo model (F). V následném hodnocení přesnosti je výrazně lepší model (F). Všechny uvedené modely vykazují na 5% hladině významnosti významnou heteroskedasticitu a autokorelaci. Proto byla v posledním modelu použita k odhadu metoda, která redukuje autokorelaci. 9
Výsledky práce
Přínosem článku je aplikace předpovědních metod a postupů na konkrétních datech KB na burze cenných papírů v Praze. Zejména výsledky z posledního modelu velmi dobře kopírují skutečné hodnoty akcií. Jako nejoptimálnější model pro tato data se jeví model ARIMA(3,0,0), i když jeho použití není zcela bez problémů. Podle nejčastěji používané střední kvadratické míry přesnosti, bych jejich použití seřadil v tomto pořadí: • • • • •
ARIMA(3,0,0), model neměnných hodnot, model jednoduchého exponenciálního vyrovnání, model Holtova vyrovnání, model vyrovnání trojčlennými klouzavými průměry.
Model ARIMA je nekomplikovanější a vhodný i pro dlouhodobé předpovědi pomocí velmi dlouhých časových řad. Model neměnných hodnot (náhodné procházky) je nejjednodušší a vhodný jen pro krátkodobé předpovědi. 10
Diskuze
Při použití uvedených metod přihlížíme jen k minulosti časové řady a nezjišťujeme, proč takové hodnoty řada nabyla. Tyto hodnoty jsou obvykle ovlivňovány i množstvím dalších ekonomických, sociálních, společenských a jiných vlivů, které nejsou v použitých modelech brány do úvahy. Proto je třeba brát výsledky předpovědí vždy s určitou rezervou a porovnávat je s předpověďmi kvalitativními, získanými týmy kvalifikovaných a zkušených odborníků nebo s výsledky ekonometrických analýz, které zahrnují do modelu více vysvětlujících proměnných. Jako příklad zde uvádíme propad cen akcií v letech 2008-2009 a jejich návrat na předkrizové ceny patrný z grafu č. 1, který popisuje předseda představenstva KB Henri Bonnet. „Komerční banka čelila hospodářskému poklesu poprvé ve své historii jako banka plně soukromá. Svou schopnost odolat ekonomické krizi opírá o dobře nastavený obchodní 15
EMI, Vol. 5, Issue 2, 2013 ISSN: 1804-1299 (Print), 1805-353X (Online)
Article
model a strategii přijatou po privatizaci.“ Užitečné je i ze získaných předpovědí počítat průměry. Pokud by byla k dispozici data o těchto vlivech, bylo by vhodnější používat spíše ekonometrické modely založené na regresní analýze. Jako námět pro další výzkum bude užitečné řešit problémy s heteroskedasticitou, což znamená zabývat se některými modely volatility (např. ARCH nebo GARCH modely- viz Engle 1982).
Literatura ARLT, J. a kol. Analýza ekonomických časových řad a příklady. Praha: VŠE, 2002. ISBN 80-2450777-3. [2] ARLT, J., ARLTOVÁ, M. Finanční časové řady. Praha: Grada, 2003. ISBN 80-247-0333-0. [3] CIPRA, T. Analýza časových řad s aplikacemi v ekonomii. Praha: SNTL a Alfa, 1986. [4] ENGLE, R. F. Autoregressive Conditional Heteroskedasticity with Estimates of the Variace of UK Inflation. Econometrica 50, 987-1007, 1982. [5] GRIFFITS, W. E., HILL, R. C., JUDGE, G. G. Learning and Practicing Econometrics. N. York: John Wiley, 1992. ISBN 0-471-51364-4. [6] LEJNAROVÁ, Š., RÁČKOVÁ, A., ZOUHAR, J. Základy ekonometrie v příkladech. Praha: Nakladatelství Oeconomica, 2009. ISBN 978-80-245-1564-9. [7] MAKRIDATIS, S., WHEELWRIGHT, S. Forecasting Methods for Management. New York: John Wiley, 1989. ISBN 0-471-60063-6. [8] PETRÁŠKOVÁ, V. Prognostické modely v oblasti modelování finančních časových řad. Dizertační práce. Praha: Česká zemědělská univerzita, 2006. [9] STUCHLÝ, J. Statistické metody pro manažerské rozhodování. Jindřichův Hradec: VŠE, Fakulta managementu, 2004. ISBN 80-245-0153-8. [10] STUCHLÝ, J., ZEMAN, R. Analýza závislostí a předpovědi v modelech cenných papírů. Soubor příspěvků z celoškolského semináře „Tvůrčí činnost jako proces vnímání, poznání a seberealizace“. České Budějovice: Vysoká škola technická a ekonomická, 2013, s. 336 – 346. [11] Výroční zpráva Komerční banky, a.s. [online]. [cit. 2013-12-10]. Dostupné z: http://www.kb.cz/cs/o-bance/vztahy-s-investory/publikace/vyrocni-zpravy.shtml [1]
16