UNIVERZITA KARLOVA V PRAZE Matematicko–fyzik´ aln´ı fakulta
´ PRACE ´ DIPLOMOVA
Tom´ aˇ s Senft Predikce popt´ avky po obˇ eˇ zivu v ekonomice z hlediska centr´ aln´ı banky
Katedra pravdˇepodobnosti a matematick´e statistiky Vedouc´ı diplomov´e pr´ace: RNDr. Michael Koˇ na´k, PhD. Studijn´ı program: Matematika, Finanˇcn´ı a pojistn´a matematika
Na tomto m´ıstˇe bych r´ad podˇekoval RNDr. Michaelu Koˇ na´kovi, PhD. za veden´ı diplomov´e pr´ace, za cenn´e pˇripom´ınky a za ˇcas str´aven´ y na konzultac´ıch.
Prohlaˇsuji, ˇze jsem svou diplomovou pr´aci napsal samostatnˇe a v´ yhradnˇe s pouˇzit´ım citovan´ ych pramen˚ u. Souhlas´ım se zap˚ ujˇcov´an´ım pr´ace. V Praze dne 9. dubna 2006 Tom´aˇs Senft
Obsah ´ 1 Uvod
6
2 Modelov´ an´ı objemu obˇ eˇ ziva 8 2.1 Funkce penˇez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2 Centr´aln´ı bankovnictv´ı . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3 Modelov´an´ı objemu obˇeˇziva . . . . . . . . . . . . . . . . . . . . . . 10 3 ARIMA model 3.1 Z´aklady BJ metodologie . . . . . . . 3.2 ARIMA model popt´avky po obˇeˇzivu 3.2.1 Stabilizace ˇrady . . . . . . . . 3.2.2 Struktura modelu . . . . . . . 3.2.3 Odhad parametr˚ u modelu . . 3.3 Verifikace modelu . . . . . . . . . . . 3.4 Predikce . . . . . . . . . . . . . . . . 4 GARCH model 4.1 Z´akladn´ı principy . . . . . . . . . . . 4.2 GARCH model popt´avky po obˇeˇzivu 4.2.1 Stabilizace ˇrady . . . . . . . . 4.2.2 Struktura modelu . . . . . . . 4.2.3 Odhad parametr˚ u modelu . . 4.3 Verifikace modelu . . . . . . . . . . . 4.4 Predikce . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . .
5 STS model 5.1 Teorie stavov´ ych model˚ u ˇcasov´ ych ˇrad 5.1.1 Z´akladn´ı model . . . . . . . . . 5.1.2 Kalmanovy rekurze . . . . . . . 5.1.3 Inicializace Kalmanova filtru . . 5.1.4 Odhad parametr˚ u modelu . . . 5.2 STS model popt´avky po obˇeˇzivu . . . . 5.2.1 Modelovan´e sez´onnosti . . . . . 5.2.2 Konstrukce kubick´ ych splin˚ u. .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . .
12 12 13 13 14 15 17 20
. . . . . . .
23 23 25 25 26 27 27 29
. . . . . . . .
32 32 32 33 36 39 41 42 44
5.2.3 Alternativn´ı modelov´an´ı mˇes´ıˇcn´ı sez´onnosti . . . . . . . . . . 47 5.3 Verifikace modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 5.4 Predikce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 6 Kombinace model˚ u
54
7 Porovn´ an´ı model˚ u
57
8 Z´ avˇ er
60
Literatura
61
4
N´ azev pr´ ace: Predikce popt´avky po obˇeˇzivu v ekonomice z hlediska centr´aln´ı banky Autor: Tom´aˇs Senft Katedra: Katedra pravdˇepodobnosti a matematick´e statistiky Vedouc´ı diplomov´ e pr´ ace: RNDr. Michael Koˇ na´k, PhD. e-mail vedouc´ıho:
[email protected] Abstrakt: Tato diplomov´a pr´ace se zab´ yv´a modelov´an´ım a predikc´ı objemu obˇeˇziva, kter´e patˇr´ı mezi hlavn´ı autonomn´ı veliˇciny ovlivˇ nuj´ıc´ı likviditu trhu. V pr´aci jsou objasnˇeny potˇreby jeho modelov´an´ı a prezentov´any tˇri zkonstruovan´e stochastick´e modely. Jsou jimi ARIMA a GARCH model vych´azej´ıc´ı z Box-Jenkinsovy metodologie a STS model. STS model je strukturovan´ y model ˇcasov´e ˇrady vyuˇz´ıvaj´ıc´ı Kalmanovy rekurze. Pˇredpovˇedi jednotliv´ ych model˚ u jsou d´ale kombinov´any a statisticky porovn´any. V´ ysledky ukazuj´ı, ˇze nejvhodnˇejˇs´ım modelem pro pˇredpov´ıd´an´ı objemu obˇeˇziva je kombinace STS a ARIMA modelu, kter´ y dos´ahl stejn´e ˇ kvality pˇredpovˇed´ı jako expertn´ı odhad pouˇz´ıvan´ y v CNB. Lze jej tedy pouˇz´ıt ˇ pˇrinejmenˇs´ım jako podp˚ urn´ y prostˇredek pro ˇr´ızen´ı likvidity v CNB. Kl´ıˇ cov´ a slova: obˇeˇzivo, ARIMA, GARCH, STS model, Kalman˚ uv filtr
Title: Forecasting of the Demand of Currency in Circulation from the View of Central Bank Author: Tom´aˇs Senft Department: Department of Probability and Mathematical Statistics Supervisor: RNDr. Michael Koˇ na´k, PhD. Supervisor’s e-mail address:
[email protected] Abstract: This diploma thesis deals with modeling and forecasting of the daily series of currency in circulation, which is one of the main autonomous factors influencing the liquidity of financial markets. Reasons for its modeling are explained and three constructed stochastic models are presented. There are ARIMA and GARCH models based on Box-Jenkins methodology and STS model. STS model is structured time series model using Kalman equations. Forecasts of models are combined together and statistically compared. The results show that the combination of STS and ARIMA models is the best model for forecasting of the daily series of currency in circulation and it has the same forecasting performance as the current model-judgement practice in the Czech National Bank. The model might be also applied at least as a supportive tool for the liquidity management. Key words: currency in circulation, ARIMA, GARCH, STS model, Kalman filter
Kapitola 1 ´ Uvod Jedn´ım z hlavn´ıch u ´kol˚ u centr´aln´ı banky v ekonomick´em prostˇred´ı je dosaˇzen´ı a udrˇzen´ı cenov´e stability, tj. vytv´aˇren´ı n´ızkoinflaˇcn´ıho prostˇred´ı v ekonomice. Pˇri ˇ a n´arodn´ı banka (CNB) ˇ plnˇen´ı sv´eho c´ıle vyuˇz´ıv´a Cesk´ nˇekolik mˇenovˇepolitick´ ych n´astroj˚ u. Efektivita vyuˇzit´ı n´astroj˚ u mˇenov´e politiky z´avis´ı na kvalitˇe odhadu v´ yvoje popt´avky a nab´ıdky po penˇez´ıch (tzv. likvidita trhu). Celkov´a likvidita trhu se skl´ad´a z nˇekolika komponent, kter´e lze rozdˇelit na dvˇe skupiny podle moˇznost´ı jejich kontroly. Prvn´ı skupinu tvoˇr´ı veliˇciny, kter´e jsou pˇresnˇe pˇredpovˇediteln´e, respektive pˇredem zn´am´e, napˇr´ıklad vypl´ yvaj´ı z jiˇz sjednan´ ych obchod˚ u. Druhou skupinu tvoˇr´ı takzvan´e autonomn´ı veliˇciny, kter´e nejsou pod pˇr´ımou kontrolou centr´aln´ı banky. Jednou z nejh˚ uˇre predikovateln´ ych autonomn´ıch veliˇcin je pr´avˇe objem obˇeˇziva, tedy celkov´a hodnota bankovek a minc´ı v drˇzen´ı komerˇcn´ıch bank a nebankovn´ıch subjekt˚ u. Popt´avka po obˇeˇzivu se mˇen´ı v z´avislosti na cel´e ˇradˇe faktor˚ u. Zpravidla stoup´a pˇred v´ yplatami a kles´a koncem mˇes´ıce. Naopak v pr˚ ubˇehu t´ ydne popt´avka vzr˚ ust´a a nejvˇetˇs´ı b´ yv´a pˇred v´ıkendem. Tento efekt b´ yv´a umocnˇen pokud je v p´atek nebo v pondˇel´ı sv´atek. Faktor˚ u ovlivˇ nuj´ıc´ıch popt´avku po obˇeˇzivu je vˇsak mnohem v´ıce, napˇr´ıklad turistick´ y ruch, podm´ınky pro v´ ybˇer z bankomat˚ u atd. V souˇcasn´e dobˇe ˇ jsou denn´ı predikce objem˚ u obˇeˇziva v CNB realizov´any pomoc´ı tzv. expertn´ıch odhad˚ u. Jedn´a se o expertn´ı sledov´an´ı pˇredchoz´ıch hodnot a zmˇen v mˇenov´e b´azi a n´asledn´e vyhodnocen´ı. C´ılem pr´ace je vyˇreˇsen´ı tohoto u ´kolu aplikac´ı ekonometrick´ ych a statistick´ ych teori´ı. Jedn´a se pˇredevˇs´ım o podrobnou anal´ yzu ˇcasov´e ˇrady obˇeˇziva, nalezen´ı relevantn´ıch exogenn´ıch promˇenn´ ych a n´aslednˇe vytvoˇren´ı vhodn´eho stochastick´eho modelu v´ yvoje objemu obˇeˇziva pˇredevˇs´ım s d˚ urazem na jeho pˇredpov´ıdac´ı schopnost. V kapitole 2 pr´ace je struˇcnˇe shrnuta problematika penˇez, centr´aln´ıho bankovnictv´ı a d˚ uvody modelov´an´ı objemu obˇeˇziva. V kapitol´ach 3, 4 a 5 jsou prezentov´any sestaven´e stochastick´e modely objemu
6
obˇeˇziva. U kaˇzd´eho modelu jsou vysvˇetleny teoretick´e z´aklady a je pops´ano jeho sestaven´ı, vˇcetnˇe odhadu parametr˚ u. N´aslednˇe je provedena verifikace a testov´an´ı model˚ u. Na konci kaˇzd´e kapitoly je ˇca´st vˇenovan´a predikci pomoc´ı vytvoˇren´eho modelu a jsou shrnuty obdrˇzen´e v´ ysledky. Kapitola 6 je vˇenov´ana kombinovan´ ym model˚ um, kter´e d´ıky tomu, ˇze vyuˇz´ıvaj´ı informace obsaˇzen´e v d´ılˇc´ıch modelech, d´avaj´ı lepˇs´ı v´ ysledky pˇredpovˇed´ı. Porovn´an´ı model˚ u, vˇcetnˇe k tomu pouˇzit´ ych krit´eri´ı, je pops´ano v kapitole 7, kde je z´aroveˇ n vybr´an fin´aln´ı model. Pro pˇr´ıpravu dat byl pouˇzit program Microsoft Office Excel 2002. Model ARIMA byl zpracov´an v programu Matlab 6.5, pˇredevˇs´ım s pouˇzit´ım aplikaˇcn´ıho bal´ıˇcku System Identifacation Toolbox. Pro GARCH model byl pouˇzit bal´ıˇcek GARCH Toolbox ze stejn´eho programu. Nejvˇetˇs´ı ˇca´st pr´ace – STS model byl naprogramov´an v syst´emu Mathematica 5.0 s pouˇzit´ım aplikaˇcn´ıho bal´ıˇcku Time Series. Kombinov´an´ı model˚ u a jejich porovn´an´ı je zpracov´ano takt´eˇz v syst´emu Mathematica 5.0. Vˇsechna data, v´ ysledky a pouˇzit´e skripty jsou uloˇzen´e v CD pˇr´ıloze.
7
Kapitola 2 Modelov´ an´ı objemu obˇ eˇ ziva Obsah t´eto kapitoly je vˇenov´an vysvˇetlen´ı problematiky penˇez, centr´aln´ıho bankovnictv´ı a modelov´an´ı popt´avky po obˇeˇzivu. Podrobn´e a aktu´aln´ı informace ˇ lze nal´ezt na internetov´ ych str´ank´ach CNB.
2.1
Funkce penˇ ez
Pen´ıze pˇredstavuj´ı vˇseobecnˇe pˇrij´ıman´ y prostˇredek smˇeny. Za pen´ıze m˚ uˇzeme tedy povaˇzovat vˇse, co je v urˇcit´em ˇcase a m´ıstˇe vyuˇz´ıv´ano ekonomick´ ymi subjekty pˇri smˇenˇe statk˚ u. D´ale maj´ı funkci z´ uˇctovac´ı jednotky, tj. lze jimi vyj´adˇrit cenu ostatn´ıch statk˚ u, a slouˇz´ı jako uchovatel hodnoty. Nejstarˇs´ı pen´ıze se objevily zhruba pˇred jeden´acti tis´ıci lety, kdy funkci penˇez zast´aval dobytek a zemˇedˇelsk´e plodiny. Forma penˇez se bˇehem historie postupnˇe vyv´ıjela. Dneˇsn´ı pen´ıze jsou penˇezi nekryt´ ymi, neboli penˇezi s nucen´ ym obˇehem, kter´e jsou pˇrij´ım´any proto, ˇze jsou z´akonem pˇredepsan´ ym platidlem. Maj´ı dvˇe z´akladn´ı formy - hotovostn´ı a pˇrevl´adaj´ıc´ı bezhotovostn´ı. Pˇri tomto dˇelen´ı je nutn´e si uvˇedomit jejich velmi u ´zkou vz´ajemnou vazbu. V podstatˇe lze hotovostn´ı pen´ıze uloˇzen´ım do banky pˇremˇenit na bezhotovostn´ı a naopak. Obˇe formy jsou tak´e emitov´any v z´asadˇe stejnˇe, pˇredevˇs´ım u ´vˇerem. Jedin´ ym z´asadn´ım rozd´ılem je, ˇze hotovostn´ı pen´ıze, aˇz na drobn´e vyj´ımky v nˇekter´ ych zem´ıch, m˚ uˇze emitovat pouze centr´aln´ı banka. Bezhotovostn´ı pen´ıze oproti tomu mohou emitovat i jin´e instituce, napˇr´ıklad obchodn´ı banky.
8
2.2
Centr´ aln´ı bankovnictv´ı
Pod pojmem centr´aln´ı bankovnictv´ı rozum´ıme dvoustupˇ nov´ y bankovn´ı syst´em, kde prvn´ım stupnˇem je centr´aln´ı banka, tzv. banka bank, a druh´ ym stupnˇem obchodn´ı a dalˇs´ı banky, kter´e slouˇz´ı ostatn´ım subjekt˚ um a podnikaj´ı na rozd´ıl ˇ e republice je podle Ustavy ´ od centr´aln´ı banky za u ´ˇcelem zisku. V Cesk´ centr´aln´ı ˇ bankou CNB, v Evropsk´e mˇenov´e unii pln´ı tuto u ´lohu Evropsk´a centr´aln´ı banka ˇ (ECB). Hlavn´ım c´ılem CNB je cenov´ a stabilita, kter´a je d˚ uleˇzit´a pro spr´avn´ y chod ˇ ekonomiky. Podobnˇe jako ostatn´ı centr´aln´ı banky se i CNB zamˇeˇruje pˇredevˇs´ım na stabilitu spotˇrebitelsk´ ych cen. V praxi se stabilitou nerozum´ı nemˇennost cen, ale jejich m´ırn´ y r˚ ust. Pˇri plnˇen´ı sv´e z´akladn´ı mˇenovˇepolitick´e u ´lohy, tedy cenov´e stabiˇ lity, vol´ı centr´aln´ı banka jeden z nˇekolika moˇzn´ ych mˇenovˇepolitick´ ych reˇzim˚ u. CNB pouˇz´ıv´a poˇc´ınaje rokem 1998 reˇzim c´ılov´an´ı inflace, proto jsou tak´e v naˇsem modelu pouˇzita data aˇz od tohoto roku. Hlavn´ımi rysy c´ılov´an´ı inflace jsou stˇrednˇedobost t´eto strategie, vyuˇz´ıv´an´ı progn´ozy inflace a veˇrejn´e explicitn´ı vyhl´aˇsen´ı inflaˇcn´ıho ˇ c´ıle, ˇci posloupnosti c´ıl˚ u. Pro dosaˇzen´ı c´ıl˚ u m´a CNB k dispozici nˇekolik mˇenovˇepolitick´ ych n´astroj˚ u, kter´ ymi jsou operace na voln´em trhu, automatick´e facility a repo sazba a povinn´e minim´aln´ı rezervy. Pro t´ema t´eto diplomov´e pr´ace je d˚ uleˇzit´ y prvn´ı z nich. O operaci na voln´em trhu hovoˇr´ıme, je-li jednou ze dvou obchoduj´ıc´ıch stran centr´aln´ı banka a druhou dom´ac´ı bankovn´ı subjekt. Operace na voln´em trhu jsou ˇ vˇetˇsinou prov´adˇeny ve formˇe tzv. repo operac´ı, pˇri kter´ ych CNB pˇrij´ım´a od bank 1 pˇrebyteˇcnou likviditu a bank´am pˇred´av´a dohodnut´e cenn´e pap´ıry. Obˇe strany se z´aroveˇ n zavazuj´ı, ˇze po uplynut´ı doby splatnosti probˇehne zpˇetn´a transakce, v n´ıˇz ˇ CNB jako dluˇzn´ık vr´at´ı vˇeˇritelsk´e bance zap˚ ujˇcenou jistinu zv´ yˇsenou o dohodnut´ y ˇ u ´rok a vˇeˇritelsk´a banka vr´at´ı CNB poskytnut´e cenn´e pap´ıry. Tento hlavn´ı mˇenov´ y ˇ n´astroj se prov´ad´ı ve formˇe tendr˚ u2 , kde CNB pˇrij´ım´a nab´ıdky aˇz do v´ yˇse predikovan´eho pˇrebytku likvidity. Horizont predikce je jeden den, coˇz souvis´ı s t´ım, ˇze se vyhl´aˇsen´ı repo tendru prov´ad´ı kaˇzd´ y pracovn´ı den. 1
Obecnˇe mohou centr´aln´ı banky v reˇzimu c´ılov´an´ı inflace pen´ıze z obˇehu nejen stahovat, ale ˇ tak´e do obˇehu dod´avat. Stav, kdy pro udrˇzen´ı u ´rokov´ ych sazeb potˇrebuje CNB likviditu stahovat, ˇ je d´an v´ yvojem poˇc´atku 90. let, kdy CNB pustila do ekonomiky mnoˇzstv´ı penˇez za u ´ˇcelem udrˇzen´ı stability devizov´eho kurzu 2 Tendr je zp˚ usob operace, kdy banky neznaj´ı podm´ınky (objem, popˇr. ani cenu) nab´ızen´ ych, resp. popt´avan´ ych cenn´ ych pap´ır˚ u dalˇs´ıch bank a nemohou tak vlastn´ı nab´ıdky upravovat. Jedn´a ˇ se o tzv. ob´alkovou metodu. Nab´ıdky bank vypoˇr´ad´a CNB podle americk´e aukˇcn´ı procedury, tj. pˇrijme pˇrednostnˇe nab´ıdky poˇzaduj´ıc´ı nejniˇzˇs´ı u ´rokovou sazbu a to aˇz do v´ yˇse predikovan´eho pˇrebytku likvidity na dan´ y den. V pˇr´ıpadˇe, ˇze objem objednan´ y bankami pˇres´ahne predikovan´ y ˇ pˇrebytek likvidity, CNB nab´ıdky za nejvyˇsˇs´ı sazby bud’ zcela odm´ıtne, nebo proporcion´alnˇe zkr´ at´ı.
9
2.3
Modelov´ an´ı objemu obˇ eˇ ziva
V souvislosti s ˇr´ızen´ım likvidity se setk´av´ame s pojmem mˇenov´a b´aze. Mˇenov´a b´aze je tvoˇrena hotovostn´ımi penˇezi a bezhotovostn´ımi penˇezi. Jej´ı zdroje se dˇel´ı na autonomn´ı faktory a mˇenovˇepolitick´e faktory. Mezi autonomn´ı faktory patˇr´ı napˇr´ıklad vnˇejˇs´ı sektor, vl´adn´ı sektor a pohled´avky za nebankovn´ımi subjekty. Mezi mˇenovˇepolitick´e faktory ˇrad´ıme z´avazky z repo operac´ı, automatick´e facility a kr´atkodob´e u ´vˇery na zachov´an´ı likvidity. Jak je ˇr´ızena likvidita? Komerˇcn´ı ˇ banky maj´ı u CNB tzv. clearingov´e u ´ˇcty (CU), jejichˇz jednu ˇca´st tvoˇr´ı pevnˇe urˇcen´a v´ yˇse povinn´ ych minim´aln´ıch rezerv. Mnoˇzstv´ı penˇez pˇresahuj´ıc´ı tuto hodnotu, kter´e nen´ı nijak u ´roˇceno, naz´ yv´ame pˇrebytek likvidity. Pˇrebytek likvidity ˇ se do ekonomiky m˚ uˇze dostat napˇr. zv´ yˇsen´ım devizov´ ych rezerv CNB nebo st´atn´ı emis´ı. V ide´aln´ım pˇr´ıpadˇe by byl pˇrebytek likvidity nulov´ y, coˇz ale v praxi neplat´ı. Proto je z d˚ uvodu udrˇzen´ı kr´atkodob´ ych u ´rokov´ ych sazeb tˇreba tuto pˇrebyteˇcnou likviditu st´ahnout, coˇz se ˇreˇs´ı pomoc´ı repo tendr˚ u zm´ınˇen´ ych v pˇredchoz´ı kapitole. Objem obˇeˇziva je nejvˇetˇs´ı autonomn´ı veliˇcinou mˇenov´e b´aze a ovlivˇ nuje mnoˇzstv´ı penˇez na clearingov´ ych u ´ˇctech. Konkr´etnˇe tak, ˇze o kolik se zv´ yˇs´ı objem obˇeˇziva, o tolik se sn´ıˇz´ı mnoˇzstv´ı bezhotovostn´ıch penˇez na CU a naopak. Predikce objemu obˇeˇziva, jeˇz budou popt´avat komerˇcn´ı banky, je tedy nutn´a k urˇcen´ı v´ yˇse repo tendru na staˇzen´ı pˇrebyteˇcn´e likvidity. Tato popt´avka vykazuje sez´onn´ı charakter (Obr. 2.1) souvisej´ıc´ı napˇr´ıklad s vˇetˇs´ı popt´avkou po obˇeˇzivu v obdob´ı V´anoc. Dalˇs´ı vlivy jsou pops´any v n´asleduj´ıc´ıch kapitol´ach. ˇ V souˇcasn´e dobˇe jsou denn´ı predikce objem˚ u obˇeˇziva v CNB realizov´any pomoc´ı expertn´ıch odhad˚ u, tj. expertn´ıho sledov´an´ı pˇredchoz´ıch hodnot a zmˇen v mˇenov´e b´azi a n´asledn´eho vyhodnocen´ı. V t´eto pr´aci je pops´ano ˇreˇsen´ı tohoto u ´kolu aplikac´ı ekonometrick´ ych a statistick´ ych teori´ı, pˇriˇcemˇz denn´ı objemy obˇeˇziva jsou ch´ap´any jako prvky ˇcasov´e ˇrady. Jak jiˇz bylo naznaˇceno, z´akladem jsou data z let 1998 aˇz 2003, pˇriˇcemˇz data do roku 2002 jsou pouˇzita pro konstrukci model˚ u a data za rok ’ 2003 jsou ponech´ana zvl´aˇst na testov´an´ı jejich pˇredpov´ıdac´ı schopnosti.
10
280
260
240
220
m
200
180
160
140
120
200
400
600
800
1000
1200
1400
d
Obr´azek 2.1: Popt´avka po obˇeˇzivu v letech 1998 - 2003 • m - mld. Kˇc • d - denn´ı index
11
Kapitola 3 ARIMA model Prvn´ım modelem, kter´ y je pouˇzit pro modelov´an´ı popt´avky po obˇeˇzivu, je ARIMA model. Jeho z´akladem je kombinace stochastick´e ˇc´asti vych´azej´ıc´ı z Box-Jenkinsovy (BJ) metodologie s deterministickou regresn´ı komponentou. Tento model d´av´a z´akladn´ı pˇredstavu o chov´an´ı ˇcasov´e ˇrady obˇeˇziva a poskytuje v´ ychoz´ı bod pro dalˇs´ı modely. V prvn´ı ˇc´asti jsou nejdˇr´ıve struˇcnˇe nast´ınˇeny principy BJ metodologie a n´aslednˇe pops´an model. V tˇret´ı ˇca´sti je model ovˇeˇren a jsou pops´any k tomu pouˇzit´e statistiky. Nakonec je provedena predikce pomoc´ı sestaven´eho modelu.
3.1
Z´ aklady BJ metodologie
Box-Jenkinsova metodologie pracuje se stacion´arn´ımi n´ahodn´ ymi procesy. Podle Woldovy vˇety lze totiˇz kaˇzd´ y nedeterministick´ y stacion´arn´ı proces {yt } rozloˇzit na ˇcistˇe n´ahodnou sloˇzku a deterministickou ˇca´st yt =
∞ X
ψt εt−j + Dt ,
j=0
P 2 avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych kde ψ0 = 1, ∞ j=0 ψt < ∞, {εt } je proces nez´ 2 veliˇcin s rozdˇelen´ım N(0, σ ) a pro vˇsechna s a t plat´ı Cov(εs , Dt ) = 0, εt = Pt εt , Dt = Ps Dt a Dt jsou deterministick´e (Dt − Pt−1 Dt = 0 pro vˇsechny t). Pn znaˇc´ı oper´ator nejlepˇs´ı line´arn´ı predikce pˇri znalosti pozorov´an´ı yt , t ≤ n. N´ahodnou sloˇzku Woldovy dekompozice oznaˇcovanou jako MA(∞) proces, lze pˇri dostateˇcnˇe
12
velk´ ych p a q dobˇre aproximovat procesem y˜t =
p X
φi y˜t−i +
i=1
q X
θj εt−j + εt ,
j=1
ekvivalentnˇe zaps´ano φ(B)˜ yt = θ(B)εt , kde B je oper´ator zpˇetn´eho posunut´ı. {˜ yt } se naz´ yv´a ARMA(p,q) proces a je z´akladn´ım kamenem BJ metodologie. ARMA proces m´a nulovou stˇredn´ı hodnotu. Podm´ınka stacionarity je, ˇze vˇsechny koˇreny polynomu φ(B) leˇz´ı vnˇe jednotkov´eho kruhu a podm´ınka invertibility je totoˇzn´a pro polynom θ(B). Podrobnosti lze nal´ezt v [1].
3.2
ARIMA model popt´ avky po obˇ eˇ zivu
Pˇri konstrukci modelu je tˇreba nejdˇr´ıve ˇradu stabilizovat, pak nal´ezt vhodnou strukturu stochastick´e ˇca´sti a relevantn´ı vysvˇetluj´ıc´ı promˇenn´e a n´aslednˇe spr´avnˇe odhadnout jejich vliv na popt´avku po obˇeˇzivu. Jednotliv´e kroky jsou pops´any podrobnˇeji v podkapitol´ach. Model vych´az´ı z model˚ u popsan´ ych v [2] a [12].
3.2.1
Stabilizace ˇ rady
Pˇri pohledu na graf ˇcasov´e ˇrady obˇeˇziva (Obr. 2.1) je zˇrejm´e, ˇze se jedn´a o ˇradu silnˇe nestacion´arn´ı, kter´a obsahuje nejen trend, ale i ˇradu sez´onn´ıch vliv˚ u. Nestacionaritu potvrzuj´ı rovnˇeˇz korelogramy (Obr. 3.1 a 4.1). Protoˇze chceme pˇri modelov´an´ı vyuˇz´ıt BJ metodologie, kter´a pracuje se stacion´arn´ımi ˇradami, je tˇreba ˇradu vhodn´ ym zp˚ usobem stabilizovat. Jako nejvhodnˇejˇs´ı transformaci jsme vyhodnotili prvn´ı diferenci ytd = ∆yt = yt − yt−1 = (1 − B)yt ,
t = 2, . . . , n.
ˇ Radu ytd (Obr. 3.2) d´ale jiˇz neupravujeme, st´ale pˇr´ıtomnou nestacionaritu odstran´ıme pˇrid´an´ım relevantn´ıch vysvˇetluj´ıc´ıch promˇenn´ ych. Po odeˇcten´ı jejich vlivu je ˇcasov´a ˇrada jiˇz t´emˇeˇr stacion´arn´ı. Dalˇs´ı moˇznou transformac´ı by bylo dodateˇcn´e pouˇzit´ı diference se zpoˇzdˇen´ım jednoho roku, tj. 252 dn´ı, protoˇze ˇcasov´a ˇrada obˇeˇziva obsahuje urˇcitou meziroˇcn´ı z´avislost. Pak by ale bylo nutn´e pouˇz´ıt sez´onn´ı SARIMA model, coˇz software M atlab neumoˇznuje. Tato varianta byla zpracov´ana v [11].
13
Pˇri testov´an´ı stacionarity jsme tak´e pouˇzili Goldfeld-Quandt˚ uv test pro testov´an´ı konstantnosti rozptylu. V´ ysledn´e p-hodnoty (p13 = 0.5834 a p31 = 0.4166) hypot´ezu homoskedascity nezam´ıtaj´ı. Pˇresto lze pozorovat m´ırn´ y n´ar˚ ust variance ˇrady v pr˚ ubˇehu ˇcasu, kter´ y by se dal odstranit logaritmov´an´ım ˇrady, pˇr´ıpadnˇe ˇ adn´a z uveden´ Box-Coxovou transformac´ı. Z´ ych variant ale nepˇrinesla zlepˇsen´ı pˇredpov´ıdac´ı schopnosti modelu.
3.2.2
Struktura modelu
Zvolen´ y model popt´avky po obˇeˇzivu je kombinac´ı ARMA procesu diferencovan´e ˇcasov´e ˇrady a regresn´ıch promˇenn´ ych a je moˇzno jej zapsat ve tvaru φ(B)δ(B)yt = dt + θ(B)εt , P kde regresn´ı komponenta je sumou jednotliv´ ych kalend´aˇrn´ıch vliv˚ u dt = ki=1 dt,i a dt,i jsou funkc´ı pevn´eho vektoru nez´avisl´ ych ˇcasovˇe z´avisl´ ych“ promˇenn´ ych. Poly” nomy φ(B) a θ(B) urˇcuj´ı strukturu a ˇra´d stochastick´e ARMA komponenty, δ(B) je diferenˇcn´ı oper´ator a {εt } je proces nez´avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin s norm´aln´ım rozdˇelen´ım s nulovou stˇredn´ı hodnotou a rozptylem σ 2 . ARMA(p, q) proces d-kr´at diferencovan´e ˇcasov´e ˇrady naz´ yv´ame ARIMA(p, d, q) proces. V naˇsem pˇr´ıpadˇe je p = 11, d = 1, q = 1 a φ(B) = 1 − φ1 B − φ3 B 3 − φ4 B 4 − φ10 B 10 − φ11 B 11 , θ(B) = 1 − θ1 B 1 , δ(B) = 1 − B. ˇ ıseln´e hodnoty koeficient˚ C´ u polynom˚ u jsou uvedeny v CD pˇr´ıloze. Urˇcen´ı ˇra´d˚ up a q ARMA modelu jsme provedli na z´akladˇe pr˚ ubˇeh˚ u autokorelaˇcn´ı funkce (ACF) a parci´aln´ı autokorelaˇcn´ı funkce (PACF) diferencovan´e ˇcasov´e ˇrady a n´asledn´ ym porovn´an´ım v´ ysledk˚ uvu ´vahu pˇrich´azej´ıc´ıch model˚ u. Do modelu jsme zahrnuli pˇet r˚ uzn´ ych kalend´aˇrn´ıch vliv˚ u a konstantn´ı ˇclen ˇ ıseln´e hodnoty pro zachycen´ı nenulov´e stˇredn´ı hodnoty ˇrady prvn´ıch diferenc´ı. C´ regresn´ıch koeficient˚ u w jsou opˇet uvedeny v CD pˇr´ıloze. V´ ybˇer a formulace modelovan´ ych kalend´aˇrn´ıch vliv˚ u byla provedena na z´akladˇe zkuˇsenost´ı s modelov´an´ım ˇ popt´avky po obˇeˇzivu v CNB a ECB a d´ale anal´ yzou signifikantnosti parametr˚ ua struktury rezidu´ı.
ustu ˇcasov´e ˇrady obˇeˇziva je Konstatn´ı ˇ clen Konstatn´ı ˇclen ud´avaj´ıc´ı rychlost r˚ modelov´an regresn´ı promˇennou, kter´a je vektorem jedniˇcek, tedy dt,1 = w1 pro vˇsechna t.
14
ˇ Vliv dn˚ u v t´ ydnu Casov´ a ˇrada popt´avky po obˇeˇzivu vykazuje urˇcit´ y t´ ydenn´ı cyklus, napˇr´ıklad ve ˇctvrtek je nejvyˇsˇs´ı popt´avka po obˇeˇzivu z d˚ uvodu plnˇen´ı bankomat˚ u na v´ıkend. Pro zachycen´ı tohoto vlivu jsme pouˇzili ˇctyˇri v podut st ct statˇe indik´atorov´e promˇenn´e hpo ı z nich nab´ yv´a hodnoty 1, t , ht , ht , ht . Prvn´ je-li pondˇel´ı, -1 pro p´atek a 0 jinak. Dalˇs´ı promˇenn´e maj´ı analogick´e hodnoty pro u ´ter´ y, stˇredu a ˇctvrtek. Takto definovan´e promˇenn´e zajist´ı ˇcistou t´ ydenn´ı sezonalitu, tj. aby souˇcet vliv˚ u vˇsech dn˚ u v t´ ydnu byl nulov´ y. ut ut st st ct ct dt,2 = wpo hpo t + w ht + w ht + w ht .
Vliv poˇ rad´ı dne v mˇ es´ıci Z´avislost hodnot ˇrady na poˇrad´ı dne v mˇes´ıci je ovlivnˇena napˇr´ıklad term´ıny vypl´acen´ı mezd. Pˇri modelov´an´ı mˇes´ıˇcn´ıho vlivu jsme stejnˇe jako v ECB (viz [2]) pouˇzili trigonometrick´e funkce ve tvaru ¶ p µ X 2πjmt 2πjmt sin cos wj sin + wj cos , dt,3 = Mt Mt j=1 kde mk ud´av´a poˇrad´ı dne v mˇes´ıci a Mt je poˇcet dn´ı v dan´em mˇes´ıci. Hodnota p mus´ı b´ yt dostateˇcnˇe velk´a, aby dobˇre zachytila modelovanou sez´onnost. Bylo uk´az´ano v [13], ˇze p = 8 je dostaˇcuj´ıc´ı. Vliv st´ atn´ıch sv´ atk˚ u a dn˚ u volna Pr˚ ubˇeh popt´avky po obˇeˇzivu ovlivˇ nuj´ı tak´e st´atn´ı sv´atky a dny volna. Jsou to Nov´ y rok, Velikonoce, Sv´atek pr´ace, Den v´ıtˇezstv´ı nad faˇsismem, Den slovansk´ ych vˇerozvˇest˚ u Cyrila a Metodˇeje, Den up´alen´ı mistra Jana Husa, Den ˇcesk´e st´atnosti, Den vzniku samostatn´eho ˇceskoslovensk´eho st´atu, Den boje za svobodu a demokracii a V´anoce. Komponenty sv´atk˚ u maj´ı tvar dt = w(B)ht , kde w(B) je polynom ud´avaj´ıc´ı zpoˇzdˇen´ı, tj. o kolik ˇcasov´ ych index˚ u posuneme promˇennou vpˇred a vzad, a ht je indik´atorov´a promˇenn´a konkr´etn´ıho sv´atku. Tvary polynom˚ u w(B) jsou uvedeny v tabulce 3.1. Celkov´ y vliv vˇsech sv´atk˚ u a dn˚ u volna dostaneme seˇcten´ım d´ılˇc´ıch komponent. Vliv mimoˇ r´ adn´ ych ud´ alost´ı V historii v´ yznamnˇe ovlivnili ˇcasovou ˇradu popt´avky po obˇeˇzivu dvˇe mimoˇr´adn´e ud´alosti. Jsou to krach IPB a probl´em Y2K (probl´em roku 2000, jednalo se o obavu z nefunkˇcnosti nˇekter´ ych poˇc´ıtaˇcov´ ych program˚ u pˇri pˇrechodu z 31.12.1999 na 1.1.2000). Jejich formulace v modelu je stejn´a jako u st´atn´ıch sv´atk˚ u a dn˚ u volna, tvary polynom˚ u w(B) jsou takt´eˇz v tabulce 3.1.
3.2.3
Odhad parametr˚ u modelu
Protoˇze parametry modelu jsou nezn´am´e, je tˇreba je odhadnout. Nejvhodnˇejˇs´ı je pouˇz´ıt metodu maxim´aln´ı vˇerohodnosti. Parametry ARMA sloˇzky a regresn´ı
15
8
6
0.8
4 0.6
2 ACF
m
0.4
0 0.2
−2
0
−4
−0.2
0
50
100
150 l
200
250
300
−6
200
400
600
800
1000
1200
1400
d
Obr´azek 3.1: ACF ˇcasov´e ˇrady obˇeˇziva Obr´azek 3.2: Rada ˇ prvn´ıch diferenc´ı (ˇcervenˇe), hranice v´ yznamnosti • m - mld. Kˇc • d - denn´ı index (modˇre) • l - zpoˇzdˇen´ı 0.5
2
1.5
0.4
1 0.3 0.5 0.2 m
m
0
0.1 −0.5 0 −1
−0.1
−0.2
−1.5
1
2
3 d
4
−2
5
2
4
6
8
10
12
14
16
18
20
22
24
d
(a) Vliv dn˚ u v t´ ydnu • d - index dne v t´ ydnu (b) Vliv poˇrad´ı dne v mˇes´ıci • d - index dne v mˇes´ıci 1
12
10
0.5
8
m
m
0
6
4
2
−0.5 −3
−2
−1
0
1
2
3
4
d
0 −4
−3
−2
−1
0 d
1
2
3
4
(c) Vliv Dne v´ıtˇezstv´ı nad faˇsismem • d - index (d) Vliv krachu IPB • d - index dne od krachu dne od sv´atku IPB
Obr´azek 3.3: Pr˚ ubˇehy sez´onn´ıch vliv˚ u • m - mld. Kˇc
16
st´atn´ı sv´atky a dny volna krach IPB probl´em Y2K
Dn˚ u pˇred Dn˚ u po 4 4 4 4 10 4
Polynom posunut´ı (w0 + w1 B + . . . + w8 B 8 )B −4 (w0 + w1 B + . . . + w8 B 8 )B −4 (w0 + . . . + w14 B 14 )B −10
B je oper´ator zpˇetn´eho posunut´ı a wi jsou r˚ uzn´ a pro jednotliv´e sv´atky
Tabulka 3.1: Poˇcty dn˚ u modelovan´ ych pˇred a po sv´atc´ıch a ud´alostech
koeficienty se odhaduj´ı souˇcasnˇe. Vzhledem k pˇredpokladu norm´aln´ıho rozdˇelen´ı lze vˇerohodnostn´ı funkci vyj´adˇrit jako ½ ¾ 1 2 −n/2 −1/2 0 −1 L(w, φ, θ, σ ) = (2π) | Γn | exp − (Y − Yˆ ) Γn (Y − Yˆ ) , 2 kde Γn (φ, θ, σ2 ) je kovarianˇcn´ı matice procesu W = Y − Yˆ , Y znaˇc´ı pozorov´an´ı ˇcasov´e ˇrady a Yˆ odhad ˇrady modelem. Vzhledem k jej´ı sloˇzitosti je nutn´e vˇerohodnostn´ı funkci maximalizovat numericky. K tomu je pouˇzita funkce armax softwaru Matlab. Po odhadu parametr˚ u modelu je ovˇeˇrov´ano, zda nen´ı nˇekter´ y odhadnut´ y koeficient nesignifikantn´ı. K testov´an´ı je pouˇzita statistika ti =
ˆbi , si
kde ˆbi je odhad i-t´eho parametru a si jeho smˇerodatn´a odchylka, i = 1, 2, . . . , k. Nulov´a hypot´eza je, ˇze skuteˇcn´ y parametr je nulov´ y, a pˇri jej´ı platnosti m´a statistika ti t-rozdˇelen´ı o n−k stupn´ıch volnosti. Vybr´an je vˇzdy ten nejv´ıce nesignifikantn´ı parametr, fixov´an na 0 a znovu je proveden odhad ostatn´ıch parametr˚ u. Postupuje se stejnˇe, aˇz nen´ı ˇz´adn´ y koeficient nesignifikantn´ı. Zvolen´a hladina v´ yznamnosti je α = 10%.
3.3
Verifikace modelu
V t´eto kapitole je ovˇeˇrov´ana opr´avnˇenost pouˇzit´ı naˇseho modelu a testov´ana kvalita modelu. Pouˇzita je ˇrada statistik a test˚ u, bl´ıˇze jsou pops´any jen ty, kter´e nejsou standardnˇe zn´am´e. Hladinu v´ yznamnosti test˚ u vol´ıme α = 5%. Pˇredpokladem ARIMA modelu je, ˇze {εt } je posloupnost nez´avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin s norm´aln´ım rozdˇelen´ım. Pro testov´an´ı normality rezidu´ı jsme pouˇzili Kolmogorov-Smirnov˚ uv test, Lilliefors˚ uv test a Jarque-Ber˚ uv test. Souˇcasnˇe jsme analyzovali histogram (Obr. 3.7) a QQ-graf (Obr. 3.6). Pro pˇripomenut´ı uved’me, ˇze prvn´ı dva testy jsou zaloˇzeny na empirick´e distribuˇcn´ı
17
funkci, tˇret´ı na ˇsikmosti a ˇspiˇcatosti norm´aln´ıho rozloˇzen´ı. Vˇsechny testy hypot´ezu norm´aln´ıho rozloˇzen´ı zam´ıtaj´ı, rezidua maj´ı pˇredevˇs´ım v´ yraznou ˇspiˇcatost. Konstantnost rozptylu jsme ovˇeˇrovali Goldfeld-Quandtov´ym testem, kter´ y nulovou hypot´ezu konstantnosti rozptylu zam´ıt´a. Za nejd˚ uleˇzitˇejˇs´ı ukazatel povaˇzujeme vz´ajemnou nez´avislost rezidu´ı. Anal´ yza korelogram˚ u (Obr. 3.4 a 3.5) d´av´a uspokojiv´e v´ ysledky, drobnou korelovanost lze pozorovat pouze pro roˇcn´ı frekvence, coˇz potvrzuje i Ljung-Box˚ uv test. Pro u ´plnost uv´ad´ıme i v´ ysledky Ljung-Boxova testu pro kvadr´aty rezidu´ı a ovˇeˇren´ı stacionarity a invertibility procesu. Vˇsechny hodnoty statistik jsou uvedeny v tabulce 4.1. Principem Ljung-Boxova testu je, ˇze pˇri platnosti hypot´ezy nekorelovanosti jsou hodnoty autokorelaˇcn´ı funkce norm´alnˇe rozloˇzen´e. Statistika Ljung-Boxova testu m´a pak tvar L X Q = n(n + 2) ρˆ2 (j)/(n − j), j=1
kde n je d´elka ˇcasov´e ˇrady, L poˇcet frekvenc´ı autokorelaˇcn´ı funkce zahrnut´ ych do statistiky a ρˆ2 (j) v´ ybˇerov´a autokorelaˇcn´ı funkce na frekvenci j. Pˇri platnosti H0 m´a Q statistika ch´ı-kvadr´at rozloˇzen´ı o L stupn´ıch volnosti. Pro srovn´av´an´ı kvality alternativn´ıch model˚ u jsme pouˇzili vˇerohodnost modelu, AIC a BIC krit´erium. Z´aroveˇ n jsme prov´adˇeli anal´ yzu nenormovan´ ych rezidu´ı (Obr. 3.9), zvl´aˇstˇe odchylek pˇresahuj´ıc´ıch 1 mld. Kˇc. D˚ uleˇzit´a vlastnost je pˇredpov´ıdac´ı schopnost, mˇeˇren´a stˇredn´ı kvadratickou chybou pˇredpovˇedi. Pˇri jednokrokov´e pˇredpovˇedi za rok 2003 (Obr. 3.8) jsme zaznamenali pˇet odchylek v´ yraznˇe vˇetˇs´ıch neˇz 1 mld. Kˇc. Jedn´a se o 14.3.2003, 15.5.2003, 5.6.2003, 18.11.2003 a 12.12.2003. Nejzaj´ımavˇejˇs´ı z nich je 14.3.2003, protoˇze velk´a chyba predikce v tento den nast´av´a i u ostatn´ıch model˚ u. AIC (Akaike’s information criterion) a BIC (Bayes information criterion) jsou krit´eria urˇcen´a pro spr´avnou identifikaci modelu, hlavnˇe pro urˇcen´ı poˇctu parametr˚ u modelu, napˇr´ıklad ˇr´ad˚ u p a q u ARMA modelu. Vych´azej´ı z vˇerohodnosti modelu, ale penalizuj´ı vzr˚ ustaj´ıc´ı poˇcet parametr˚ u. BIC je historicky pozdˇejˇs´ı u ´pravou krit´eria AIC, u kter´eho doch´az´ı k tendenci pˇreurˇcen´ı modelu oproti skuteˇcnosti. Spoˇc´ıtaj´ı se jako AIC = −2 log L + 2 ppar a BIC = −2 log L + log(n) ppar, kde log L je logaritmick´a vˇerohodnost a ppar poˇcet parametr˚ u. C´ılem je minim´aln´ı hodnota tˇechto krit´eri´ı.
18
0.8
0.6
ACF
0.4
0.2
0
−0.2
0
50
100
150
200
250
300
l
Obr´azek 3.4: ACF rezidu´ı (ˇcervenˇe), hranice v´ yznamnosti (modˇre) • l - zpoˇzdˇen´ı
0.8
0.6
PACF
0.4
0.2
0
−0.2
0
50
100
150 l
200
250
300
Obr´azek 3.5: PACF rezidu´ı (ˇcervenˇe), hranice v´ yznamnosti (modˇre) • l - zpoˇzdˇen´ı 0.999 0.997 0.99 0.98 0.95 0.90 0.75 p
0.50 0.25 0.10 0.05 0.02 0.01 0.003 0.001 −5
−4
−3
−2
−1
0
1
data
Obr´azek 3.6: QQ-graf rezidu´ı
19
2
3
4
140
120
100
80
60
40
20
0 −6
−4
−2
0
2
4
6
Obr´azek 3.7: Histogram rezidu´ı
3.4
Predikce
Vzhledem k line´arn´ı struktuˇre modelu lze ARIMA modely snadno pˇredpov´ıdat. Mˇejme ARIMA proces {yt }, kter´ y lze diferencov´an´ım pˇrev´est na ARMA proces {ytd } (1 − B)d yt = ytd ,
t = 1, . . . , n.
Chceme-li vyj´adˇrit z pˇredchoz´ı rovnice yt v z´avislosti na ytd a minulosti ys , s < t dost´av´ame d µ ¶ X d d (−1)j yt−j , t = 1, . . . , n, yt = yt − j j=1 z ˇcehoˇz m˚ uˇzeme napsat nejlepˇs´ı line´arn´ı pˇredpovˇed’ yt+h pˇri znalosti pozorov´an´ı ˇcasov´e ˇrady do ˇcasu t. Znaˇc´ıme ji Pt yt+h a m´ame Pt yt+h =
d Pt yt+h
−
d µ ¶ X d j=1
j
(−1)j Pt yt+h−j ,
t = 1, . . . , n,
h > 0.
V naˇsem pˇr´ıpadˇe d = 1 a d Pt yt+h = Pt yt+h + Pt yt+h−1 .
N´aslednˇe vzhledem k tomu, ˇze {ytd } je ARMA proces s regresn´ı komponentou plat´ı d Pt yt+h = dt+h +
p X
d φi Pt yt+h−i +
i=1
q X
θj Pt εt+h−j .
j=1
Nyn´ı staˇc´ı rekurzivnˇe pokraˇcovat pro ˇcasov´e okamˇziky t + h, t + h − 1, . . . , t + 1, n Pt εs = 0, s > t a Pt εs = εˆs , s ≤ t, pˇriˇcemˇz vyuˇzijeme Pt ysd = ysd , s ≤ t a z´aroveˇ
20
kde εˆs =
ysd
− ds −
p X
d φi ys−i
−
i=1
q X
θj εˆs−j ,
s = 1, . . . , t
j=1
a εˆs = 0, ysd = 0 pro s ≤ 0. ˇ Popt´avka po obˇeˇzivu se v souˇcasn´e dobˇe v CNB pˇredpov´ıd´a vˇzdy na n´asleduj´ıc´ı den, tedy o jeden krok dopˇredu. V souvislosti s pˇrechodem na jednotnou evropskou ˇ e republiky do Evropsk´e mˇenov´e unie, mˇenu euro, a tedy uˇzˇs´ımu zapojen´ı Cesk´ ale bude nutno prov´adˇet pˇredpovˇed’ vˇzdy o jeden a dva t´ ydny dopˇredu, tedy o ’ 5, respektive 10 dn´ı vpˇred. Proto je provedena pˇredpovˇed s krokem h = 1, 5, 10. ˇ Kvalita pˇredpovˇedi je mˇeˇrena krit´eriem pouˇz´ıvan´ ym v CNB, tj. odmocninou stˇredn´ı kvadratick´e chyby pˇredpovˇedi (root mean squared error), za testovac´ı rok 2003, rP εˆ2t RMSE = , m kde εˆt jsou chyby predikce a m = 252 je poˇcet pozorov´an´ı ˇcasov´e ˇrady (pracovn´ıch dn´ı) v testovan´em roce. Stˇredn´ı kvadratick´a chyba se s velikost´ı kroku zvyˇsuje, ˇc´ıseln´e hodnoty jsou uvedeny v tabulce 4.1.
21
2
1.5
1
0.5
m
0
−0.5
−1
−1.5
−2
50
100
150
200
250
d
Obr´azek 3.8: Rezidua jednokrokov´e predikce v roce 2003 (ˇcernˇe), hranice ±1 mld. Kˇc (ˇcervenˇe) • m - mld. Kˇc • d - denn´ı index 2
1.5
1
0.5
0 m −0.5
−1
−1.5
−2
−2.5
100
200
300
400
500
600
700
d
Obr´azek 3.9: Rezidua transformovan´e ˇrady v letech 2000-2002 • m - mld. Kˇc • d - denn´ı index
22
Kapitola 4 GARCH model ˇ Casto pouˇz´ıvan´ ymi modely pro modelov´an´ı finanˇcn´ıch ˇcasov´ ych ˇrad, napˇr´ıklad cen akci´ı, jsou modely typu GARCH. Aˇckoliv ˇcasov´a ˇrada popt´avky po obˇeˇzivu nen´ı klasickou finanˇcn´ı ˇradou, obsahuje nˇekter´e jej´ı typick´e znaky, a proto jsme se rozhodli tento typ modelu pouˇz´ıt. N´aˇs model se skl´ad´a z ARMA sloˇzky, kter´a je z velk´e ˇc´asti totoˇzn´a s prvn´ım modelem popt´avky po obˇeˇzivu, a GARCH sloˇzky, jej´ıˇz principy jsou vysvˇetleny v prvn´ı ˇca´sti t´eto kapitoly. Na prvn´ı pohled se m˚ uˇze zd´at, ˇze se jedn´a pouze o rozˇs´ıˇren´ı ARIMA modelu. Protoˇze je vˇsak moˇzn´e GARCH sloˇzku pouˇz´ıt samostatnˇe a ˇcasov´a ˇrada se i jinak transformuje, jak je uk´az´ano v druh´e ˇc´asti t´eto kapitoly, povaˇzujeme tento model za samostatn´ y model. V tˇret´ı ˇc´asti kapitoly je model verifikov´an a ve ˇctvrt´e ˇca´sti je zm´ınˇen postup pˇri predikci.
4.1
Z´ akladn´ı principy
Jak jiˇz bylo naznaˇceno, finanˇcn´ı ˇcasov´e ˇrady maj´ı nˇekolik typick´ ych vlastnost´ı. Definujme nejdˇr´ıve v´ynos (return) od ˇcasu t − 1 do ˇcasu t jako rt =
st − 1, st−1
kde st je hodnota ˇcasov´e ˇrady v ˇcase t, napˇr´ıklad cena akcie, u kter´e se nevypl´ac´ı dividenda. Potom typick´e znaky pro finanˇcn´ı ˇcasov´e ˇrady jsou: ˇ a ˇrada nen´ı stacion´arn´ı, ale vykazuje lok´aln´ı trendy. • Casov´
23
• Hladina v´ ynos˚ u je pˇribliˇznˇe stabiln´ı. Extr´emn´ı hodnoty se vyskytuj´ı ve shluc´ıch nerovnomˇernˇe rozloˇzen´ ych v ˇcase. • V´ ynosy rt se zdaj´ı b´ yt nekorelovan´e, ale |rt | a rt2 vykazuj´ı v´ yznamnou korelovanost. • Rozdˇelen´ı rt je leptokurtick´e, tj. m´a ˇsikmost K > 3. Jestliˇze pˇredpokl´ad´ame hypot´ezu efektivn´ıho trhu (viz [7]), dostaneme, ˇze v´ ynosy nelze pˇredpov´ıdat. Napˇr´ıklad pokud bychom chtˇeli aplikovat AR(p) model na modelov´an´ı ceny akci´ı dostali bychom vˇsechny koeficienty φi = 0, i = 1, . . . , p. V praxi je vˇsak napˇr´ıklad kromˇe odhadu hodnoty tˇreba modelovat volatilitu ceny akci´ı. K tomu se daj´ı dobˇre vyuˇz´ıt modely typu ARCH a GARCH. N´ahodn´ y proces {yt } naz´ yv´ame ARCH (autoregressive conditional heteroscedastic process) proces ˇr´adu p, jestliˇze E(yt | Ft−1 ) = µ, Var(yt | Ft−1 ) =
σt2
= ω+
p X
2 αk yt−k ,
k=1
εt = σytt je proces nez´avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin, ω, α1 , . . . , αp > 0 a Ft−1 reprezentuje minulost, Ft−1 = σ{yk , k ≤ t − 1}. Bez omezen´ı obecnosti m˚ uˇzeme uvaˇzovat µ = 0. Jestliˇze druhou rovnici v pˇredchoz´ı definici nahrad´ıme rovnic´ı Var(yt | Ft−1 ) =
σt2
=ω+
p X
2 αk yt−k
+
q X
2 βk σt−k ,
k=1
k=1
dostaneme GARCH (generalized ARCH) proces ˇr´adu p, q. Znaˇc´ıme kr´atce ARCH(p), respektive GARCH(p,q). V n´asleduj´ıc´ıch dvou tvrzen´ıch uved’me nˇekolik z´akladn´ıch vlastnost´ı tˇechto proces˚ u, kter´e potvrzuj´ı spr´avnost jejich aplikace na finanˇcn´ı ˇcasov´e ˇrady. Tvrzen´ı 1. Necht’ {yt } je stacion´arn´ı GARCH(p,q) proces s σ 2 = Var(yt ) < ∞, potom ω σ2 = p q X X 1− αk − βk k=1
a je-li nav´ıc p = q = 1, L(εt ) = K =3+
N(0, 1), E(yt4 )
k=1
< ∞ a K ˇsikmost {yt }, plat´ı
6α2 > 3, 1 − 3α2 − 2αβ − β 2
24
pro
α > 0.
Tvrzen´ı 2. Necht’ {yt } je stacion´arn´ı GARCH(p,q) proces s E(yt4 ) < ∞ a mˇejme d´ ale m = max(p, q), αj = 0, j > p a βj = 0, j > q, potom je wt = yt2 − σt2 proces nez´avisl´ych stejnˇe N(0, konst.) rozdˇelen´ych n´ahodn´ych veliˇcin a yt2
=ω+
m X
2 γk yt−k
−
k=1
q X
βk wt−k + wt
k=1
ARMA(m,q) proces s γk = αk + βk . D˚ ukazy obou tvrzen´ı lze nal´ezt v [7]. Z prvn´ıho tvrzen´ı je moˇzno odvodit nutnou a z´aroveˇ n postaˇcuj´ıc´ı podm´ınku pro stacionaritu GARCH procesu, kter´a zn´ı p X k=1
αk +
q X
βk < 1
a
ω, α1 , . . . , αp , β1 , . . . , βq > 0.
k=1
Protoˇze vˇsak v praxi pˇredpoklad nez´avislosti hodnoty ˇcasov´e ˇrady na minulosti ˇcasto neplat´ı a tak´e se objevuj´ı r˚ uzn´e vnˇejˇs´ı vlivy, je tˇreba model vhodnˇe rozˇs´ıˇrit, napˇr´ıklad na ARMA(r,m)-GARCH(p,q) proces {yt } s nenulovou stˇredn´ı hodnotou µ a vysvˇetluj´ıc´ı exogenn´ı promˇennou {xt }, kter´ y m´a tvar yt = µ +
l X
γk xt−k +
r X
k=0
k=1
k=1
k=1
φk yt−k +
ηt = σt εt , q p X X 2 2 2 βk σt−k , σt = ω + αk yt−k +
m X
θk ηt−k + ηt ,
k=1
(4.1)
kde {εt } je proces nez´avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin.
4.2
GARCH model popt´ avky po obˇ eˇ zivu
Podobnˇe jako u ARIMA modelu je tˇreba ˇcasovou ˇradu popt´avky po obˇeˇzivu {yt } nejdˇr´ıve stabilizovat, pot´e nal´ezt vhodnou strukturu modelu a n´aslednˇe odhadnout jeho parametry, ˇcemuˇz obsahovˇe odpov´ıdaj´ı jednotliv´e podkapitoly.
4.2.1
Stabilizace ˇ rady
Jak jiˇz bylo naznaˇceno, u model˚ u typu GARCH se pouˇz´ıv´a pro stabilizaci nestacion´arn´ı ˇrady jej´ı prvn´ı relativn´ı diference, kterou jsme na stranˇe 23 u finanˇcn´ıch
25
ˇcasov´ ych ˇrad oznaˇcili jako v´ ynos. Alternativn´ım a n´ami pouˇzit´ ym zp˚ usobem je ale transformace yt y˜t = log . yt−1 D˚ uvodem pouˇzit´ı t´eto metody u finanˇcn´ıch ˇcasov´ ych ˇrad oproti klasick´emu diferencov´an´ı je sloˇzen´e u ´roˇcen´ı, a tedy hypotetick´ y souˇcinov´ y tvar ˇcasov´e ˇrady, kter´ y se pˇri pouˇzit´ı logaritmu pˇrevede do souˇctov´eho tvaru. Podrobnosti lze nal´ezt v [7]. 0.04
1
0.8
0.03
0.6
0.02
0.4
0.01 0.2
m
PACF
0
0
−0.01
−0.2
−0.02
−0.4
−0.6
−0.8
−0.03
0
50
100
150 l
200
250
300
−0.04
200
400
600
800
1000
1200
1400
d
Obr´azek 4.1: PACF ˇcasov´e ˇrady Obr´azek 4.2: Transformovan´a ˇrada obˇeˇziva (ˇcervenˇe), hranice v´ yznamnosti • m - mld. Kˇc • d - denn´ı index (modˇre) • l - zpoˇzdˇen´ı
4.2.2
Struktura modelu
N´ami zkonstruovan´ y model je model ARMA(11,1)-GARCH(1,1) s nˇekolika vysvˇetluj´ıc´ımi exogenn´ımi promˇenn´ ymi, jehoˇz matematick´ y z´apis odpov´ıd´a rovnic´ım (4.1). Nav´ıc jsme pˇredpokl´adali, ˇze veliˇciny {εt } maj´ı normovan´e norm´aln´ı rozdˇelen´ı. Pˇresn´e hodnoty vˇsech koeficient˚ u jsou uvedeny v CD pˇr´ıloze, zde pouze ’ uved me, ˇze v naˇsem modelu je µ 6= 0,
ω 6= 0
a AR polynom m´a tvar φ(B) = 1 − φ1 B − φ2 B 2 − φ4 B 4 − φ7 B 7 − φ10 B 10 − φ11 B 11 . Urˇcen´ı ˇra´d˚ u ARMA sloˇzky jsme provedli na z´akladˇe stejn´ ych krit´eri´ı jako u ARIMA ˇ ad GARCH komponenty odpov´ıd´a bˇeˇznˇe pouˇz´ıvan´emu ˇr´adu GARCH modelu. R´ model˚ u ˇcasov´ ych ˇrad.
26
Deterministickou ˇc´ast tvoˇr´ı exogenn´ı vysvˇetluj´ıc´ı promˇenn´e, kter´e jsme stejnˇe jako u ARIMA modelu vyuˇzili k zachycen´ı r˚ uzn´ ych sez´onn´ıch vliv˚ u, a tak´e jejich tvar z˚ ustal v podstatˇe stejn´ y. Jsou to Vliv dn˚ u v t´ ydnu, Vliv poˇrad´ı dne v mˇes´ıci, Vliv st´atn´ıch sv´atk˚ u a dn˚ u volna a Vliv mimoˇra´dn´ ych ud´alost´ı. Jedinou zmˇenou je slouˇcen´ı Nov´eho roku, Sv´atku pr´ace, Dne v´ıtˇezstv´ı nad faˇsismem, Dne slovansk´ ych vˇerozvˇest˚ u Cyrila a Metodˇeje, Dne up´alen´ı mistra Jana Husa, Dne ˇcesk´e st´atnosti, Dne vzniku samostatn´eho ˇceskoslovensk´eho st´atu a Dne boje za svobodu a demokracii a jejich implementace jako v´ıcen´asobn´e opakov´an´ı jednoho pevn´eho sv´atku. D˚ uvodem pro slouˇcen´ı byla velk´a v´ ypoˇcetn´ı n´aroˇcnost modelu.
4.2.3
Odhad parametr˚ u modelu
Parametry modelu jsme odhadli metodou maxim´aln´ı vˇerohodnosti s postupn´ ym vyˇrazov´an´ım nesignifikantn´ıch parametr˚ u stejn´ ym zp˚ usobem jako u ARIMA mode’ lu. Pro u ´plnost uved me vˇerohodnostn´ı funkci modelu GARCH(1,1), kter´a se pak zkombinuje s vˇerohodnostn´ı funkc´ı ARMA modelu, ˇc´ımˇz dostaneme vˇerohodnostn´ı funkci naˇseho modelu popt´avky po obˇeˇzivu. Tuto funkci je tˇreba numericky maximalizovat, my jsme pouˇzili funkci garchfit programu Matlab. Pˇri pˇredpokladu normovan´eho norm´aln´ıho rozloˇzen´ı veliˇcin {εt } m´a podm´ınˇen´a vˇerohodnostn´ı funkce procesu GARCH(1,1) {yt } tvar µ ¶ n Y 1 yt2 p L(ω, α, β| ε1 ) = exp − 2 , 2σt 2πσt2 t=2 pˇriˇcemˇz podm´ınˇen´a a nepodm´ınˇen´a vˇerohodnostn´ı funkce se liˇs´ı pˇri dostateˇcnˇe dlouh´e ˇcasov´e ˇradˇe zanedbatelnˇe. V´ıce o vˇerohodnostn´ıch funkc´ıch ARIMA a GARCH proces˚ u lze nal´ezt napˇr´ıklad v [7].
4.3
Verifikace modelu
V t´eto kapitole je uvedeno ovˇeˇren´ı platnosti pˇrijat´ ych pˇredpoklad˚ u. Z´akladn´ım pˇredpokladem je, ˇze veliˇciny ηt εt = σt jsou nez´avisl´e stejnˇe rozloˇzen´e s normovan´ ym norm´aln´ım rozdˇelen´ım. Nazvˇeme {εt } normovan´ ymi reziduii. Aplikujeme testy na normalitu Kolmogorov-Smirnov˚ uv test, Lillefors˚ uv test a Jarque-Ber˚ uv test a analyzujeme histogram (Obr. 4.5) a QQ - graf. I kdyˇz dva testy hypot´ezu norm´aln´ıho rozloˇzen´ı st´ale zam´ıtaj´ı, je zde zˇrejm´a vˇetˇs´ı evidence pro opr´avnˇenost pˇredpokladu normality oproti ARIMA modelu. Konstantnost rozptylu Goldfeld-Quandt˚ uv test zam´ıt´a, coˇz je zp˚ usobeno
27
0.8
0.6
ACF
0.4
0.2
0
−0.2
0
50
100
150 l
200
250
300
Obr´azek 4.3: ACF normovan´ ych rezidu´ı (ˇcervenˇe), hranice v´ yznamnosti (modˇre) • l - zpoˇzdˇen´ı
0.8
0.6
PACF 0.4
0.2
0
−0.2
0
50
100
150 l
200
250
300
Obr´azek 4.4: PACF normovan´ ych rezidu´ı (ˇcervenˇe), hranice v´ yznamnosti (modˇre) • l - zpoˇzdˇen´ı pˇredevˇs´ım vˇetˇs´ım rozptylem samotn´e transformovan´e ˇrady v roce 1998. Moˇzn´ ym ˇreˇsen´ım tohoto probl´emu by bylo zkr´acen´ı ˇcasov´e ˇrady pr´avˇe o tento rok. Pˇredpoklad nez´avislosti je pˇribliˇznˇe splnˇen, coˇz ukazuj´ı v´ ysledky Ljung-Boxova testu a korelogramy (Obr. 4.3 a 4.4). Ljung-Box˚ uv test pro kvadr´aty rezidu´ı poukazuje na typick´e vlastnosti finanˇcn´ıch ˇcasov´ ych ˇrad. Samozˇrejmˇe jsme tak´e ovˇeˇrili stacionaˇ ıseln´e v´ ritu modelu. C´ ysledky jsou uvedeny v tabulce 4.1. Kvalitu model˚ u jsme porovn´avali vˇerohodnost´ı modelu, AIC a BIC krit´eriem. Z´aroveˇ n jsme analyzovali graf nenormovan´ ych rezidu´ı (Obr. 4.7). D˚ uleˇzit´a vlastnost je samozˇrejmˇe pˇredpov´ıdac´ı schopnost, mˇeˇren´a stˇredn´ı kvadratickou chybou pˇredpovˇedi. Pˇri jednokrokov´e pˇredpovˇedi za rok 2003 (Obr. 4.6) jsme zaznamenali ˇctyˇri odchylky v´ yraznˇe vˇetˇs´ı neˇz 1 mld. Kˇc. Jedn´a se o 14.3.2003, 5.6.2003, 18.11.2003 a 12.12.2003.
28
140
120
100
80
60
40
20
0 −6
−5
−4
−3
−2
−1
0
1
2
3
4
Obr´azek 4.5: Histogram rezidu´ı
4.4
Predikce
Pˇredpovˇed’ budouc´ı hodnoty ˇcasov´e ˇrady pomoc´ı GARCH modelu z´avis´ı pouze na jeho ARMA sloˇzce, nebot’ podle pˇredpokladu je {εt } proces nez´avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin s normovan´ ym norm´aln´ım rozloˇzen´ım. Proto oznaˇcujeme ˇcist´e GARCH modely za nepˇredpov´ıdateln´e, nebot’ u nich plat´ı Pt−1 yt = E(yt |Ft−1 ) = Eyt = µ (= 0). Naopak moˇznost vyuˇzit´ı GARCH komponenty by byla pˇri odhadu volatility. Postup pˇredpov´ıd´an´ı ARMA procesu byl jiˇz pops´an na stranˇe 20. Opˇet jsme provedli pˇredpovˇed’ s krokem h = 1, 5, 10. Velikost stˇredn´ı kvadratick´e chyby se s rostouc´ım krokem znaˇcnˇe zvyˇsuje, ˇc´ıseln´e hodnoty jsou uvedeny ˇ sen´ım by mohlo b´ v tabulce 4.1. Reˇ yt zˇrejmˇe zv´ yˇsen´ı ˇra´du AR komponenty, coˇz plat´ı i u ARIMA modelu, zmˇena by ale z´aroveˇ n vedla ke zhorˇsen´ı chyby jednokrokov´e pˇredpovˇedi, kterou jsme zvolili za hlavn´ı krit´erium.
29
2
1.5
1
0.5
m
0
−0.5
−1
−1.5
−2
50
100
150
200
250
d
Obr´azek 4.6: Rezidua jednokrokov´e predikce v roce 2003 (ˇcernˇe), hranice ±1 mld. Kˇc (ˇcervenˇe) • m - mld. Kˇc • d - denn´ı index 0.01
0.008
0.006
0.004
0.002 m
0
−0.002
−0.004
−0.006
−0.008
−0.01
100
200
300
400
500
600
700
d
Obr´azek 4.7: Rezidua transformovan´e ˇrady v letech 2000-2002 • m - mld. Kˇc • d - denn´ı index
30
model Nenormovan´a rezidua Stˇredn´ı hodnota Rozptyl Normovan´a rezidua Stˇredn´ı hodnota Rozptyl ˇ Sikmost ˇ catost Spiˇ Kolmogorov-Smirnov test p-hodnota Lilliefors test p-hodnota Jarque-Bera test p-hodnota Goldfeld-Quandt test p13-hodnota p31-hodnota Ljung-Box test Q(5) p-hodnota Q(10) p-hodnota Q(22) p-hodnota Q(261) p-hodnota Ljung-Box test Q(5) p-hodnota Q(10) p-hodnota Q(22) p-hodnota Q(261) p-hodnota Log. vˇerohodnost AIC BIC Chyby pˇredpovˇed´ı RMSE krok 1 ˇ RMSE krok 1 v CNB RMSE krok 5 RMSE krok 10 Stacionarita Invertibilita
ARIMA
GARCH
0.00038733 0.20951
9.6617x10−5 9.2609x10−6
-6.185x10−17 1 -0.14759 5.7854 Zam´ıt´a H0 0.014344 Zam´ıt´a H0 NaN1 Zam´ıt´a H0 0 Zam´ıt´a H0 0.025101 0.9749 rezidua 0.72279 0.74724 0.63773 0.27431 kvadr´at rezidu´ı 0 0 0 2.7641x1010 75.7097 -1.4194 384.0551 [mld. Kˇc] 0.48066 0.43787 1.2867 1.8952 Ano Ano
0.012291 0.99186 -0.28308 5.2802 Nezam´ıt´a H0 0.14907 Zam´ıt´a H0 NaN1 Zam´ıt´a H0 0 Zam´ıt´a H0 3.2898x10−10 1 0.09926 0.13377 0.001668 5.0804x108 0 0 0 0 5645.7958 -11163.5917 -10834.6534
1 Procedura
0.50111 0.43787 1.5057 2.2858 Ano Ano
lillietest v Matlab v nˇekter´ ych pˇr´ıpadech nevrac´ı p-hodnotu, ale pouze ud´av´a v´ ysledek testu.
Tabulka 4.1: Tabulka v´ ysledk˚ u model˚ u
31
Kapitola 5 STS model Obsahem t´eto kapitoly je tˇret´ı model pouˇzit´ y pro modelov´an´ı ˇcasov´e ˇrady obˇeˇziva. Jedn´a se o strukturovan´ y model ˇcasov´e ˇrady (STS - structural time series model), tedy o jej´ı rozklad na trend, sez´onn´ı a nepravidelnou sloˇzku. Tento model se vyj´adˇr´ı jako stavov´ y model (state space model). Pomoc´ı Kalmanov´ ych rekurz´ı a metody maxim´aln´ı vˇerohodnosti se odhadnou jeho parametry a provede pˇredpovˇed’. V prvn´ı ˇc´asti t´eto kapitoly je pops´ana obecn´a teorie stavov´ ych model˚ u ˇcasov´ ych ˇrad, kter´a vych´az´ı z [6]. V druh´e je prezentov´an konkr´etn´ı pouˇzit´ y model pro modelov´an´ı ˇcasov´e ˇrady obˇeˇziva. Tˇret´ı a ˇctvrt´a ˇca´st je vˇenov´ana jeho verifikaci a pˇredpovˇedi ˇrady pomoc´ı modelu.
5.1 5.1.1
Teorie stavov´ ych model˚ uˇ casov´ ych ˇ rad Z´ akladn´ı model
Obecn´ y line´arn´ı Gaussovsk´ y stavov´ y model lze zapsat jako yt = Zt αt + εt , εt ∼ N(0, Ht ), αt+1 = Tt αt + Rt ηt , ηt ∼ N(0, Qt ), t = 1, . . . , n,
(5.1)
kde yt je p × 1 vektor pozorov´an´ı a αt je nepozorovan´ y m × 1 vektor naz´ yvan´ y stavov´y vektor. Principem modelu je, ˇze v´ yvoj modelu v ˇcase je urˇcen vektorem αt podle druh´e rovnice (5.1). Protoˇze ale αt nelze pozorovat pˇr´ımo, mus´ıme zaloˇzit anal´ yzu na pozorovan´em yt . Prvn´ı rovnice (5.1) se naz´ yv´a rovnice pozorov´ an´ı, druh´a se naz´ yv´a stavov´a rovnice. Matice Zt , Tt , Rt , Ht a Qt jsou povaˇzov´any za zn´am´e a chybov´e ˇcleny εt a ηt za seri´alnˇe nez´avisl´e a nez´avisl´e na sobˇe pro vˇsechna t.
32
Matice Zt a Tt−1 mohou z´aviset na y1 , . . . , yt−1 . D´ale pˇredpokl´ad´ame, ˇze poˇca´teˇcn´ı stavov´ y vektor α1 je N(a1 , P1 ) rozdˇelen´ y, nez´avisl´ y na ε1 , . . . , εn a η1 , . . . , ηn . Pro zaˇca´tek povaˇzujme a1 a P1 za zn´am´e. Jeden z nejjednoduˇsˇs´ıch stavov´ ych model˚ u je model lok´aln´ıho line´arn´ıho trendu (local linear trend model) yt = µt + εt , εt ∼ N(0, σε2 ), µt+1 = µt + νt + ξt , ξt ∼ N(0, σξ2 ), νt+1 = νt + ζt , ζt ∼ N(0, σζ2 ),
(5.2)
Kdyˇz σξ2 = σζ2 = 0, potom νt+1 = νt = ν0 a µt+1 = µt + ν0 . Trend je tedy pˇresnˇe line´arn´ı a model se redukuje do modelu deterministick´eho line´arn´ıho trendu s n´ahodn´ ym ˇsumem. Tvar (5.2) se σξ2 > 0 a σζ2 > 0 oproti tomu umoˇznuje zmˇeny hladiny a trendu v ˇcase. Rovnice (5.2) lze pˇrepsat do tvaru µ ¶ ¡ ¢ µt 1 0 yt = + εt , µ ¶ · ¸ µ νt ¶ µ ¶ µt+1 1 1 µt ξt = + , νt+1 0 1 νt ζt coˇz je speci´aln´ı pˇr´ıpad (5.1). V´ yhodou stavov´ ych model˚ u je moˇznost jejich spojov´an´ı v komplexnˇejˇs´ı modely. Jako stavov´ y model lze kromˇe lok´aln´ıho line´arn´ıho trendu totiˇz zapsat napˇr´ıklad mˇes´ıˇcn´ı sez´onnost modelovanou pomoc´ı kubick´ ych splin˚ u (kapitola 5.2.2). Tyto jednotliv´e stavov´e modely lze za pˇredpokladu vz´ajemn´e nez´avislosti α1i , {εt } a {ηti } , i = 1, 2 spojit do jednoho stavov´eho modelu ¡ 1 ¢0 (5.3) αt αt2 αt = a
Zt Tt Rt Qt
¡ 1 ¢ Zt ¡ Zt2 , = = diag ¡ Tt1 , Tt2 = diag ¡ Rt1 , Rt2 = diag Q1t , Q2t
¢ ¢, ¢, ,
(5.4)
kde αti je stavov´ y vektor, {ηti } n´ahodn´ y ˇclen a Zti , Tti , Rti a Qit jsou matice stavov´eho modelu lok´aln´ıho line´arn´ıho trendu (i = 1) a mˇes´ıˇcn´ı sez´onnosti (i = 2). Znaˇcen´ı odpov´ıd´a definici (5.1). Postup lze analogicky rozˇs´ıˇrit na libovoln´ y poˇcet stavov´ ych model˚ u, coˇz pouˇzijeme pˇri konstrukci STS modelu popt´avky po obˇeˇzivu.
5.1.2
Kalmanovy rekurze
Z´akladn´ı tˇri u ´lohy anal´ yzy ˇcasov´e ˇrady stavov´ ymi modely jsou filtrov´ an´ı, vyhlazov´ an´ı a predikce. Jde o probl´em nalezen´ı nejlepˇs´ıho (ve smyslu nejmenˇs´ı stˇredn´ı kvadratick´e chyby) line´arn´ıho odhadu stavov´eho vektoru αt pˇri znalosti pozorov´an´ı
33
• y1 , . . . , yt−1 • y1 , . . . , y t
pˇri predikci, pˇri filtrov´an´ı,
• y1 , . . . , y n , n > t
pˇri vyhlazov´an´ı.
Ve stavov´ ych modelech se tyto u ´lohy ˇreˇs´ı r˚ uzn´ ymi skupinami Kalmanov´ ych rekurz´ı. Ty vyuˇz´ıvaj´ı markovsk´e vlastnosti stavov´ ych model˚ u a jsou v´ ypoˇcetnˇe efektivn´ı. Z´akladem je Kalman˚ uv filtr. N´asleduje jeho odvozen´ı ([6]), znaˇcen´ı je stejn´e jako v z´akladn´ım tvaru (5.1). C´ılem bude odvodit podm´ınˇen´e rozdˇelen´ı αt+1 za podm´ınky Yt pro t = 1, . . . , n, kde Yt = {y1 , . . . , yt }, coˇz je jednokrokov´a predikce. Na z´avˇer drobn´ ym pˇreformulov´an´ım dostaneme z´aroveˇ n i v´ ysledek u ´lohy filtrov´an´ı. Jelikoˇz rozdˇelen´ı vˇsech n´ahodn´ ych veliˇcin je norm´aln´ı, podm´ınˇen´e rozdˇelen´ı podmnoˇziny veliˇcin podm´ınˇen´e jinou podmnoˇzinou tˇechto veliˇcin je tak´e norm´aln´ı. Poˇzadovan´e rozdˇelen´ı je tedy urˇceno znalost´ı at+1 = E(αt+1 | Yt ) a Pt+1 = Var(αt+1 | Yt ). Pˇredpokl´adejme, ˇze αt za podm´ınky Yt−1 m´a rozdˇelen´ı N(at , Pt ). Jelikoˇz αt+1 = Tt αt + Rt ηt , dost´av´ame at+1 = E(Tt αt + Rt ηt | Yt ) = Tt E(αt | Yt ),
(5.5)
Pt+1 = Var(Tt αt + Rt ηt | Yt ) = Tt Var(αt | Yt )Tt0 + Rt Qt Rt0 ,
(5.6)
pro t = 1, . . . , n. Oznaˇcme vt = yt − E(yt | Yt−1 ) = yt − E(Zt αt + εt | Yt−1 ) = yt − Zt at . Potom je vt chyba jednokrokov´e pˇredpovˇedi yt za podm´ınky Yt−1 . Kdyˇz Yt−1 a vt jsou zn´am´e, pak tak´e Yt je zn´am´e. Tedy E(αt | Yt ) = E(αt | Yt−1 , vt ). N´aslednˇe E(vt ) = 0 a Cov(yj , vt ) = E[yj E(vt | Yt−1 )0 ] = 0, pro j = 1, . . . , t−1. Z v´ıcerozmˇern´e norm´aln´ı regrese dost´av´ame E(αt |Yt ) = E(αt | Yt−1 , vt ) = E(αt | Yt−1 ) + Cov(αt , vt )[Var(vt )]−1 vt = at + Mt Ft−1 vt , kde Mt = Cov(αt , vt ) a Ft = Var(vt ). D´ale Mt = Cov(αt , vt ) = E[E{αt (Zt αt + εt − Zt at )0 | Yt−1 }] = E[E{αt (αt − at )0 Zt0 | Yt−1 }] = Pt Zt0 a Ft = Var(Zt αt + εt − Zt at ) = Zt Pt Zt0 + Ht .
34
(5.7)
Pˇredpokl´adejme, ˇze Ft je nesingul´arn´ı. Tato podm´ınka je bˇeˇznˇe splnˇena pro vˇsechny dobˇre formulovan´e modely, v´ıce v [6]. Substituc´ı v (5.5) a (5.7) vyjde at+1 = Tt at + Tt Mt Ft−1 vt = Tt at + Kt vt , t = 1, . . . , n,
(5.8)
kde Kt = Tt Mt Ft−1 = Tt Pt Zt0 Ft−1 . Tedy at+1 je line´arn´ı funkce at a vt . Podobnˇe m´ame Var(αt | Yt ) = = = =
Var(αt | Yt−1 , vt ) Var(αt | Yt−1 ) − Cov(αt , vt )[Var(vt )]−1 Cov(αt , vt )0 Pt − Mt Ft−1 Mt0 Pt − Pt Zt0 Ft−1 Zt Pt .
Substituc´ı do (5.6) dostaneme Pt+1 = Tt Pt L0t + Rt Qt Rt0 ,
t = 1, . . . , n,
(5.9)
kde Lt = Tt − Kt Zt . Rekurze (5.8) a (5.9) jsou z´akladem Kalmanova filtru pro model (5.1). Pro pˇrehlednost vˇsechny rovnice jsou vt = yt − Zt at , Ft = Zt Pt Zt0 + Ht , 0 −1 Kt = Tt Pt Zt Ft , L t = T t − K t Zt , t = 1, . . . , n, 0 0 at+1 = Tt at + Kt vt , Pt+1 = Tt Pt Lt + Rt Qt Rt ,
(5.10)
kde a1 je vektor stˇredn´ıch hodnot a P1 je varianˇcn´ı matice poˇc´ateˇcn´ıho stavov´eho vektoru α1 . Rekurze (5.10) naz´ yv´ame (standardn´ı) Kalman˚ uv filtr. Pˇreformulov´an´ım Kalmanova filtru lze nyn´ı lehce odvodit rekurentn´ı rovnice pro samotn´e filtrov´an´ı. Oznaˇcme odhad stavov´eho vektoru at|t = E(αt | Yt ) a jemu pˇr´ısluˇsn´e varianˇcn´ı matice Pt|t = Var(αt | Yt ). Dostaneme soubˇeˇzn´y Kalman˚ uv filtr vt = yt − Zt at , at|t at+1
Ft Mt −1 = at + Mt Ft vt , Pt|t = Tt at|t , Pt+1
= = = =
Zt Pt Zt0 + Ht , Pt Zt0 Pt − Mt Ft−1 Mt0 , t = 1, . . . , n, Tt Pt|t Tt0 + Rt Qt Rt0 .
Dalˇs´ı skupinou rekurentn´ıch rovnic je Kalman˚ uv filtr pro vyhlazov´an´ı. Jejich v´ ysledkem je odhad αt pˇri znalosti cel´e ˇcasov´e ˇrady. Oznaˇcme y = (y10 , . . . , yn0 )0 . Necht’ α bt = E(αt | y) a Vt = Var(αt − α bt ) = Var(αt | y) pro t = 1, . . . , n. Za podm´ınky zn´am´eho rozdˇelen´ı poˇca´teˇcn´ıho stavov´eho vektoru α1 ∼ N(a1 , P1 ) m´a Kalman˚ uv filtr pro vyhlazov´an´ı tvar rt−1 = Zt0 Ft−1 vt + L0t rt , Nt−1 = Zt0 Ft−1 Zt + L0t Nt Lt , α bt = at + Pt rt−1 , Vt = Pt − Pt Nt−1 Pt , 35
(5.11)
pro t = n, . . . , 1, s inicializac´ı rn = 0 a Nn = 0. Pˇri samotn´em v´ ypoˇctu postupujeme n´asledovnˇe. Nejdˇr´ıve projdeme ˇradu dopˇrednˇe standardn´ım Kalmanov´ ym filtrem, n´aslednˇe zpˇetnˇe Kalmanov´ ym filtrem pro vyhlazov´an´ı a t´ım z´ısk´ame odhady α bt a Vt . Pˇri dopˇredn´em pr˚ uchodu mus´ıme uloˇzit veliˇciny vt , Ft , Kt , at a Pt pro t = 1, . . . , n. Alternativnˇe lze uloˇzit pouze at a Pt a ostatn´ı veliˇciny dopoˇc´ıtat pˇri zpˇetn´em pr˚ uchodu, coˇz je pouˇzit´ y zp˚ usob v naˇsem modelu ˇcasov´e ˇrady obˇeˇziva. Tˇret´ı u ´loha, a to predikce pomoc´ı Kalmanova filtru je pops´ana v kapitole 5.4. Znaˇcnou v´ yhodou tohoto pˇr´ıstupu je moˇznost anal´ yzy ˇcasov´e ˇrady v pˇr´ıpadˇe, ˇze nen´ı kompletn´ı a jej´ı pozorov´an´ı v nˇekter´ ych ˇcasov´ ych okamˇzic´ıch chyb´ı. Pˇredpokl´adejme, ˇze m´ame obecn´ y stavov´ y model, kde pozorov´an´ı yj , j = τ, . . . , τ ∗ − 1, ∗ chyb´ı, pro 1 < τ < τ ≤ n. Pro filtrov´an´ı v ˇcasech t = τ, . . . , τ ∗ − 1 staˇc´ı pouˇz´ıt v Kalmanovˇe filtru vektor vt = 0 a matici Kt = 0 pro tyto ˇcasov´e okamˇziky. Dostaneme at+1 = Tt at , Pt+1 = Tt Pt Tt0 + Rt Qt Rt0 , t = τ, . . . , τ ∗ − 1. Podobnˇe pro zpˇetn´e vyhlazovac´ı rekurze m´ame rt−1 = Tt0 rt , Nt−1 = Tt0 Nt Tt , t = τ ∗ − 1, . . . , τ. Ostatn´ı rekurzivn´ı rovnice z˚ ustanou nezmˇenˇeny. Ovˇeˇren´ı tˇechto v´ ysledk˚ u lze nal´ezt v [6]. V naˇsem modelu byl vzhledem k jiˇz hotov´e implementaci Kalmanova filtru pouˇzit alternativn´ı pˇr´ıstup, kter´ y je s popsan´ ym ekvivalentn´ı. Byl pouˇzit pˇreformulovan´ y model ½ 0 t ∈ {τ, . . . , τ ∗ − 1}, ∗ yt = yt jinak, ½ ½ ∗ 0 t ∈ {τ, . . . , τ − 1}, δt t ∈ {τ, . . . , τ ∗ − 1}, Zt∗ = ε∗t = Zt jinak, εt jinak, kde {δt } je proces nez´avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin s δt ∼ N(0, I), nez´avisl´ ych na α1 , εs , ηs pro t, s = 1, . . . , n. Ostatn´ı ˇc´asti modelu z˚ ust´avaj´ı nezmˇenˇeny. V pˇr´ıpadˇe v´ıce chybˇej´ıc´ıch ˇca´st´ı pozorov´an´ı ˇcasov´e ˇrady se tyto pˇr´ıstupy analogicky rozˇs´ıˇr´ı.
5.1.3
Inicializace Kalmanova filtru
V pˇredch´azej´ıc´ıch dvou kapitol´ach jsme povaˇzovali rozdˇelen´ı poˇca´teˇcn´ıho stavu za zn´am´e, α1 ∼ N(a1 , P1 ), a1 a P1 zn´am´e. To vˇsak ve vˇetˇsinˇe praktick´ ych aplikac´ı, vˇcetnˇe modelu popt´avky po obˇeˇzivu, neplat´ı. Proces ˇreˇs´ıc´ı tento probl´em se naz´ yv´a inicializace. V obecn´em pˇr´ıpadˇe m´a poˇc´ateˇcn´ı stav modelu tvar α1 = a + A δ + R0 η0 ,
36
η0 ∼ N(0, Q0 ),
(5.12)
kde m × 1 vektor a je zn´am´ y, δ je q × 1 vektor nezn´am´ ych veliˇcin, m × q matice A a m × (m − q) matice R0 jsou selekˇcn´ı matice. Selekˇcn´ı matice jsou matice, jejichˇz sloupce jsou sloupce jednotkov´e matice Im a dan´e dohromady daj´ı mnoˇzinu g sloupc˚ u matice Im tak, ˇze g ≤ m a A0 R0 = 0. Matice Q0 je pozitivnˇe semidefinitn´ı a zn´am´a. Reprezentace konstantn´ı ˇc´asti je a, A δ pˇredstavuje nestacion´arn´ı ˇca´st a R0 η0 stacion´arn´ı ˇca´st. V modelu popt´avky po obˇeˇzivu je cel´ y poˇc´ateˇcn´ı stav nezn´am´ y a veliˇciny stavov´eho vektoru nestacion´arn´ı, tedy A = Im a α1 = δ. Vektor δ m˚ uˇze b´ yt povaˇzov´an za pevn´ y vektor nezn´am´ ych parametr˚ u, tedy δ ∼ N(konst., 0),
(5.13)
nebo jako vektor n´ahodn´ ych veliˇcin s norm´aln´ım rozdˇelen´ım s nulov´ ymi stˇredn´ımi hodnotami a nekoneˇcn´ ymi rozptyly. Prvn´ı zp˚ usob odvodil Rosenberg a je v´ıce diskutov´an v [6]. Druh´ ym zp˚ usobem se mimo jin´e zab´ yval De Jong v [4] a naz´ yv´a se difusn´ı inicializace. Vych´az´ı z pˇredpokladu δ ∼ N(0, κ Iq ),
(5.14)
kde κ → ∞. Pˇri modelov´an´ı popt´avky po obˇeˇzivu byly pouˇzity obˇe varianty. Ve fin´aln´ım modelu byla zvolena difusn´ı inicializace, aˇckoliv v´ ysledky obou variant byly v podstatˇe rovnocenn´e. Jednou moˇznost´ı ˇreˇsen´ı je rozˇs´ıˇren´y Kalman˚ uv filtr (augmented Kalman filter), jehoˇz z´akladem je rozˇs´ıˇren´ı pozorovan´eho vektoru ˇcasov´e ˇrady n´asleduj´ıc´ım zp˚ usobem. Pro dan´e δ aplikujme Kalman˚ uv filtr s a1 = E(α1 ) = a + A δ, 0 P1 = Var(α1 ) = P∗ = R0 Q0 R0 a oznaˇcme v´ yslednou hodnotu at jako aδ,t . Jelikoˇz aδ,t je line´arn´ı funkce pozorov´an´ı a a1 = a + A δ m˚ uˇzeme ps´at aδ,t = aa,t + AA,t δ, kde aa,t je hodnota at v´ ystupu Kalmanova filtru, u kter´eho je a1 = a, P1 = P∗ a kde j-t´ y sloupec AA,t je hodnota at v´ ystupu fitru, u kter´eho je vektor pozorov´an´ı nulov´ y a a1 = Aj , P1 = P∗ , kde Aj je j-t´ y sloupec matice A. Oznaˇcme hodnotu vt v´ ystupu Kalmanova filtru, u kter´eho je a1 = a + A δ, P1 = P∗ jako vδ,t . Podobnˇe jako pro aδ,t m˚ uˇzeme ps´at vδ,t = va,t + VA,t δ, kde va,t a VA,t jsou dan´e v´ ysledkem stejn´ ych filtr˚ u jako aa,t a AA,t . Matice (aa,t , AA,t ) a (va,t , VA,t ) mohou b´ yt spoˇcteny jedin´ ym pr˚ uchodem Kalmanova filtru, do nˇehoˇz vstupuje vektor pozorov´an´ı yt rozˇs´ıˇren´ y nulov´ ymi hodnotami. Toto je moˇzn´e, protoˇze v kaˇzd´em filtru produkuj´ıc´ım jednotliv´ y sloupec (aa,t , AA,t ) je pouˇzita stejn´a inicializaˇcn´ı varianˇcn´ı matice P1 = P∗ , a tedy v´ ystup t´ ykaj´ıc´ı se rozptylu, kter´ y oznaˇc´ıme jako Fδ,t , Kδ,t a Pδ,t+1 je stejn´ y. Nahrazen´ım rovnic Kalmanov´ ych filtr˚ u pro vt a at odpov´ıdaj´ıc´ımi rovnicemi pro matice (aa,t , AA,t ) a (va,t , VA,t ) dostaneme (va,t , VA,t ) = (yt , 0) − Zt (aa,t , AA,t ), (aa,t+1 , AA,t+1 ) = Tt (aa,t , AA,t ) + Kδ,t (va,t , VA,t ), 37
(5.15)
kde (aa,1 , AA,1 ) = (a, A). Rekurze pro Ft , Kt a Pt+1 z˚ ustanou stejn´e jako v klasick´em Kalmanovˇe filtru, tedy Fδ,t = Zt Pδ,t Zt0 + Ht , −1 Kδ,t = Tt Pδ,t Zt0 Fδ,t , Lδ,t = Tt − Kδ,t Zt , 0 0 Pδ,t+1 = Tt Pδ,t Lδ,t + Rt Qt Rt ,
(5.16)
pro t = 1, . . . , n a Pδ,1 = P∗ . Index δ je pˇrid´an proto, ˇze dan´a veliˇcina je vypoˇc´ıt´ana za pˇredpokladu dan´eho δ a nikoliv, ˇze na δ pˇr´ımo matematicky z´avis´ı. Jako rozˇs´ıˇren´ y Kalman˚ uv filtr budeme oznaˇcovat rovnice (5.15) a (5.16). Necht’ nyn´ı plat´ı (5.14). Pro dan´e κ m´ame at+1 = E(αt+1 | Yt ) = aa,t+1 + AA,t+1 δ¯t , kde δ¯t = E(δ| Yt ). D´ale log p(δ| Yt ) = log p(δ) + log p(Yt | δ) − log p(Yt ) t X = log p(δ) + log p(vδ,j ) − log p(Yt ) j=1
1 1 = − δ 0 δ − b0t δ − δ 0 SA,t δ + ˇcleny nez´avisl´e na δ, 2κ 2 kde bt =
t X
0 VA,j
−1 Fδ,j
va,j ,
SA,t =
j=1
t X
−1 0 VA,j Fδ,j VA,j .
(5.17)
j=1
Diferencov´an´ım vzhledem k δ a poloˇzen´ım rovno 0 dostaneme maxim´alnˇe vˇerohodn´ y odhad a pˇri norm´aln´ımu rozloˇzen´ı veliˇcin m´ame µ ¶−1 1 ¯ δt = − SA,t + Iq bt . (5.18) κ Tedy Pt+1 = E[(at+1 − αt+1 )(at+1 − αt+1 )0 ] = E[{aa,t+1 − αt+1 + AA,t+1 (δ − δ¯t )}{aa,t+1 − αt+1 + AA,t+1 (δ − δ¯t )}0 ] = Pδ,t+1 + AA,t+1 Var(δ| Yt )A0A,t+1 µ ¶−1 1 = Pδ,t+1 + AA,t+1 SA,t + Iq A0A,t+1 , κ jelikoˇz Var(δ| Yt ) = (SA,t + κ1 Iq )−1 . Pro κ → ∞ dost´av´ame −1 δ¯t = −SA,t bt , −1 Var(δ| Yt ) = SA,t ,
v pˇr´ıpadˇe, ˇze SA,t je nesingul´arn´ı. V´ ypoˇcet bt a SA,t lze snadno pˇridat k rozˇs´ıˇren´emu Kalmanovu filtru. Potom −1 bt , at+1 = aa,t+1 − AA,t+1 SA,t −1 0 AA,t+1 , Pt+1 = Pδ,t+1 + AA,t+1 SA,t
38
pˇri κ → ∞. Pro nedegenerativn´ı modely existuje d takov´e, ˇze pro t < d je SA,t singul´arn´ı, takˇze hodnoty at+1 a Pt+1 dan´e pˇredchoz´ımi rovnicemi neexistuj´ı. Naopak pro t ≥ d je SA,t nesingul´arn´ı, hodnoty ad+1 a Pd+1 existuj´ı a n´aslednˇe hodnoty at+1 a Pt+1 pro t > d mohou b´ yt vypoˇc´ıt´any standardn´ım Kalmanov´ ym filtrem. Obvykle je d menˇs´ı neˇz d´elka sez´ony modelovan´e ˇcasovou ˇradou, a tedy mnohem menˇs´ı neˇz d´elka pozorovan´e ˇcasov´e ˇrady. V modelu popt´avky po obˇeˇzivu je vˇsak potˇreba d = 828, coˇz jsou tˇri sez´ony (roky) a polovina pozorovan´e ˇcasov´e ˇrady. D˚ uvodem je zˇrejmˇe soubˇeh tˇr´ı modelovan´ ych vliv˚ u ve stejn´em obdob´ı, a to na konci kalend´aˇrn´ıho roku. Jedn´a se o roˇcn´ı sez´onnost, Nov´ y rok a probl´em Y2K. Takto dlouh´a inicializace znemoˇzn ˇuje pouˇzit´ı jinak v´ ypoˇcetnˇe efektivnˇejˇs´ıho pˇresn´eho inicializaˇcn´ıho Kalmanova filtru (exact initial Kalman filter), protoˇze u nˇej doch´az´ı k velk´ ym numerick´ ym chyb´am. Eventu´aln´ı moˇznost postupu by byla pouˇzit´ı jeho 0 verze s rozkladem varianˇcn´ıch matic na mocninn´ y souˇcin Pt = P˜t P˜t (square root filter), a zaruˇcit tak jejich pozitivn´ı semidefinitnost, podrobnosti lze nal´ezt v [6].
5.1.4
Odhad parametr˚ u modelu
Model popt´avky po obˇeˇzivu, stejnˇe jako vˇsechny praktick´e modely, z´avis´ı na nezn´am´ ych parametrech. V t´eto kapitole uk´aˇzeme, jak lze tyto parametry odhadnout metodou maxim´aln´ı vˇerohodnosti. Pro zˇrejmost uved’me, ˇze napˇr´ıklad u lok´aln´ıho line´arn´ıho modelu (5.2) jsou nezn´am´e parametry velikosti rozptyl˚ u σε2 , σξ2 a σζ2 . Nejdˇr´ıve odvod’me vˇerohodnostn´ı funkci v pˇr´ıpadˇe, ˇze rozdˇelen´ı poˇc´ateˇcn´ıho stavov´eho vektoru je zn´am´e, α1 ∼ E(a1 , P1 ), a1 a P1 jsou zn´am´e. Pak vˇerohodnost modelu je n Y L(y) = p(y1 , . . . , yn ) = p(y1 ) p(yt | Yt−1 ), t=2
kde Yt = {y1 , . . . , yt }. Pro praktick´ y v´ ypoˇcet pak pouˇzijeme logaritmickou vˇerohodnostn´ı funkci n X log L(y) = log p(yt | Yt−1 ), t=1
kde p(y1 | Y0 ) = p(y1 ). Pro model (5.1) m´ame E(yt | Yt−1 ) = Zt at , vt = yt − Zt at a Ft = Var(yt | Yt−1 ). Substituov´an´ım N(Zt at , Ft ) za p(yt | Yt−1 ) dostaneme n
np 1X log L(y) = − log 2π − (log |Ft | + vt0 Ft−1 vt ). 2 2 t=1
(5.19)
Hodnoty vt , Ft , a tedy cel´a log L(y), se vypoˇc´ıtaj´ı pomoc´ı Kalmanova filtru. Pˇredpokl´ad´ame jen, ˇze Ft je nesingul´arn´ı pro t = 1, . . . , n. Jestliˇze tato podm´ınka
39
nen´ı splnˇena automaticky, je obvykle moˇzn´e pˇredefinovat model tak, aby splnˇena byla. V naˇsem modelu popt´avky po obˇeˇzivu se ale tento probl´em nevyskytl. V difusn´ım pˇr´ıpadˇe ˇreˇsen´em rozˇs´ıˇren´ ym Kalmanov´ ym filtrem je sdruˇzen´a hustota δ a y pro dan´e κ p(δ, y) = p(δ)p(y| δ) n X = p(δ) p(vδ,t ) t=1
n Y = (2π)(np+q)/2 κ−q/2 | Fδ,t |−1/2 × t=1 µ ¶¸ · 1 δ0δ 0 0 + Sa,n + 2bn δ + δ SA,n δ , × exp − 2 κ
kde vδ,t , bn , SA,n jsou definov´any v pˇredch´azej´ıc´ı kapitole a Sa,n =
n X
−1 0 va,t Fδ,t va,t .
t=1 −1 Z (5.18) zn´ame δ¯n = − (SA,n + κ−1 Iq ) bn a exponent pˇredch´azej´ıc´ıho v´ yrazu m˚ uˇze b´ yt pˇreps´an jako
1 − [Sa,n + (δ + δ¯n )0 (SA,n + κ−1 Iq )(δ − δ¯n ) − δ¯n0 (SA,n + κ−1 Iq )δ¯n ]. 2 Odintegrov´an´ım δ dostaneme margin´aln´ı hustotu y. Logaritmick´a vˇerohodnostn´ı funkce m´a tvar np q 1 log L(y) = − log 2π − log κ − log | SA,n + κ−1 Iq | − 2 n 2 2 1X 1 − log |Fδ,t | − [Sa,n − δ¯n0 (SA,n + κ−1 Iq )δ¯n ]. 2 t=1 2 Pˇriˇcten´ım funkci
q 2
log κ a pro κ → ∞ dostaneme difusn´ı logaritmickou vˇerohodnostn´ı n
np 1 1X log Ld (y) = − log 2π − log | SA,n | − log | Fδ,t | 2 2 2 t=1 (5.20) 1 0 −1 = − (Sa,n − bn SA,n bn ). 2 V pˇredchoz´ı kapitole jsme uk´azali, ˇze rozˇs´ıˇren´ y Kalman˚ uv filtr m˚ uˇze b´ yt pˇreruˇsen v ˇcasov´em okamˇziku t = d. M˚ uˇzeme tedy pouˇz´ıt parci´aln´ı vˇerohodnost zaloˇzenou na Yd a n´aslednˇe pˇridat pˇr´ıspˇevky inovac´ı vd+1 , . . . , vn ze standardn´ıho Kalmanova filtru. Odhad parametr˚ u pak z´ısk´ame numerickou maximalizac´ı t´eto vˇerohodnostn´ı funkce. V naˇsem modelu popt´avky po obˇeˇzivu jsme pouˇzili funkci NMinimize programu Mathematica. Numerick´a maximalizace je znaˇcnˇe v´ ypoˇcetnˇe a ˇcasovˇe n´aroˇcn´a, moˇzn´ ym zrychlen´ım by bylo napˇr´ıklad pouˇzit´ı EM algoritmu, nebo pˇrevod probl´emu do spektr´ aln´ı dom´eny.
40
5.2
STS model popt´ avky po obˇ eˇ zivu
Pro modelov´an´ı popt´avky po obˇeˇzivu jsme pouˇzili STS model yt = µt + γt + εt , kde µt je model lok´aln´ıho line´arn´ıho trendu (5.2), γt je stochastick´a sez´onn´ı komponenta a nepravideln´a sloˇzka εt je proces nez´avisl´ ych n´ahodn´ ych veliˇcin s norm´aln´ım 2 rozdˇelen´ım s nulovou stˇredn´ı hodnotou a rozptylem σε . Sez´onn´ı komponenta je P sumou pˇeti subkomponent γt = 5i=1 γti , kter´e modeluj´ı rozd´ıln´e sez´onn´ı vlivy. Jedn´a se o sez´onnost dn˚ u v t´ydnu, mˇes´ıˇcn´ı sez´onnost, roˇcn´ı sez´onnost, st´atn´ı sv´atky a dny volna a mimoˇr´ adn´e ud´alosti. Kaˇzd´a subkomponenta m´a tvar γti = zti δti , kde zti je pevn´ y 1 × gi vektor nez´avisl´ ych ˇcasovˇe z´avisl´ ych“ promˇenn´ ych. Hodnoty ” u pro zti jsou definov´any vˇzdy pˇres cel´e obdob´ı kter´e modeluj´ı, napˇr´ıklad 5 dn˚ sez´onnost dne v t´ ydnu, a jejich hodnoty se periodicky opakuj´ı pro celou ˇcasovou ˇradu. Aby se zajistilo, ˇze γti je ˇcistˇe sez´onn´ı komponenta, mus´ı b´ yt souˇcet zti pˇres P i cel´e sez´onn´ı obdob´ı nulov´ y vektor, tedy u sez´onnosti dne v t´ ydnu t+4 k=t zk = 0. δti je ˇcasovˇe promˇenliv´ y parametr, kter´ y sleduje n´ahodnou proch´azku i δti = δt−1 + χit ,
kde χit je gi × 1 vektor s´eri´alnˇe nez´avisl´ ych norm´alnˇe rozdˇelen´ ych n´ahodn´ ych proces˚ u s nulovou stˇredn´ı hodnotou a kovarianˇcn´ı matic´ı E(χit χit ‘) = σi2 I. Ne vˇsechny sez´onn´ı komponenty v modelu jsou stochastick´e, nˇekter´e jsou uvaˇzov´any jako deterministick´e, a potom je σi2 = 0. Jednotliv´e komponenty se spoj´ı podle (5.3) a (5.4) a matice stavov´eho z´apisu modelu pak jsou Zt = (1 0 zt1 µ Tt =
zt2 1 1 0 1 0
zt3
zt4
¶
zt5 )
Ht = σε2
0 I
Rt = I
Qt = diag(σξ2 , σζ2 , σ12 , . . . , σ12 , σ22 , . . . , σ22 , σ32 , . . . , σ32 , 0, . . . , 0). Aby bylo moˇzn´e modelovat vˇsechny mˇes´ıce a roky, je nutn´e uv´aˇzit mˇes´ıc s 23 (pracovn´ımi) dny a tedy rok s 276 dny. Jestliˇze m´a nˇekter´ y mˇes´ıc m´enˇe neˇz 23 dn˚ u, povaˇzujeme tyto dny za chybˇej´ıc´ı pozorov´an´ı. Pro ilustraci uved’me 31. duben, nebo 29. u ´nor v nepˇrestupn´ ych letech, pokud se samozˇrejmˇe jedn´a o pracovn´ı dny.
41
5.2.1
Modelovan´ e sez´ onnosti
Sez´ onnost dn˚ u v t´ ydnu K zachycen´ı t´eto z´avislosti jsme pouˇzili model 1 1 1 γt = zt δt , kde zt1 je vektor 1 × 4 a jeho prvn´ı prvek nab´ yv´a 1, je-li den t pondˇel´ı, −1 p´atek a 0 pro ostatn´ı dny. Prvky 2, 3 a 4 nab´ yvaj´ı stejn´ ych hodPt+4 1 not pro u ´ter´ y, stˇredu a ˇctvrtek. Z definice je zˇrejm´e, ˇze k=t zk je nulov´ y 1 vektor. Sez´onnost dn˚ u v t´ ydnu je uvaˇzov´ana jako stochastick´a, a tedy δt je vektor sleduj´ıc´ı n´ahodnou proch´azku s rozptylem σ12 . Mˇ es´ıˇ cn´ı sez´ onnost Pro modelov´an´ı jsme zvolili kubick´e spliny promˇenliv´e v ˇcase, jejichˇz pˇresn´a konstrukce je pops´ana v dalˇs´ı kapitole. Nejd˚ uleˇzitˇejˇs´ım faktorem je zde urˇcen´ı poˇctu uzl˚ u a jejich spr´avn´e um´ıstˇen´ı v r´amci modelovan´eho obdob´ı. Na z´akladˇe korelogram˚ u, kvality proloˇzen´ı a pˇredpov´ıdac´ı schopnosti modelu jsme vybrali poˇcet ˇsesti uzl˚ u a rozm´ıstˇen´ı (0), 3, 9, 11, 15, 19, 23. Nula je zde uvedena pouze z d˚ uvodu objasnˇen´ı nav´az´an´ı dvou obdob´ı, jedn´a se vlastnˇe o uzel na pozici 23 pˇredch´azej´ıc´ı sez´ony. Vzhledem k periodicitˇe kubick´ ych splin˚ u mus´ı m´ıt spliny v deterministick´em pˇr´ıpadˇe v prvn´ım (0) a posledn´ım (23) uzlu stejnou hodnotu. Z tohoto d˚ uvodu je d˚ uleˇzit´e, aby ˇcasov´a ˇrada na zaˇca´tku modelovan´eho obdob´ı mˇela pˇribliˇznˇe stejn´e hodnoty a tedy ˇza´dn´ y prudk´ y trend. Proto prvn´ı den v modelovan´em mˇes´ıci neodpov´ıd´a prvn´ımu dni v kalend´aˇrn´ım mˇes´ıci, ale je posunut aˇz na 5. den kalend´aˇrn´ıho mˇes´ıce. Um´ıstˇen´ı chybˇej´ıc´ıch dn˚ u do celkov´eho poˇctu 23 dn˚ u za mˇes´ıc je zaloˇzeno na stejn´em principu. V modelu popt´avky po obˇeˇzivu jsme um´ıstili tyto chybˇej´ıc´ı pozorov´an´ı mezi 4. a 5. den v mˇes´ıci. Mˇes´ıˇcn´ı komponenta je rovnˇeˇz stochastick´a s parametrem σ22 . Roˇ cn´ı sez´ onnost Jako pˇr´ıklad z´avislosti popt´avky po obˇeˇzivu na roˇcn´ım obdob´ı uved’me letn´ı pr´azdniny, kde doch´az´ı k zv´ yˇsen´ı popt´avky z d˚ uvodu turistick´eho ruchu. Zde jsme stejnˇe jako u mˇes´ıˇcn´ı z´avislosti vyuˇzili kubick´e spliny. Rozm´ıstˇen´ı i poˇcet uzl˚ u jsme pouˇzili stejn´e jako v modelu ECB, tj. 16 uzl˚ u s um´ıstˇen´ım (0), 1, 23, 99, 121, 140, 166, 202, 207, 213, 220, 226, 231, 234, 239, 246 a 276. S poˇc´atkem modelovan´eho roku v posledn´ım u ´norov´em dnu. D˚ uleˇzit´a je zde velk´a koncentrace uzl˚ u okolo V´anoc a konce roku, aby se zachytil prudk´ y n´ar˚ ust popt´avky po obˇeˇzivu v tomto obdob´ı. Oproti tomu je jen nˇekolik uzl˚ u ve zb´ yvaj´ıc´ı ˇc´asti roku, kde kol´ıs´an´ı ˇrady je menˇs´ı. Zvˇetˇsen´ım poˇctu uzl˚ u se d´a sice dos´ahnout lepˇs´ı kvality proloˇzen´ı, ale z´aroveˇ n se zhorˇs´ı pˇredpov´ıdac´ı schopnost modelu. Parametr rozptylu stochastick´e ˇca´sti oznaˇc´ıme jako σ32 . St´ atn´ı sv´ atky a dny volna Vliv st´atn´ıch sv´atk˚ u a dn˚ u volna je modelov´an deterministick´ ymi vysvˇetluj´ıc´ımi promˇenn´ ymi. Tato komponenta m´a tvar γt = zt4 δt4 , kde zt4 je v podstatˇe indik´ator dan´eho sv´atku a δt4 je konstantn´ı vektor urˇcuj´ıc´ı samotnou velikost vlivu sv´atku na popt´avku po obˇeˇzivu. ych dn˚ u volna a modelovan´ ych Rozmˇer vektoru zt4 z´aleˇz´ı na poˇctu modelovan´
42
4 0.4
3
0.2
2 1
m
0
m
0 -1
-0.2
-2 -0.4 -3 1
2
4
3 d
5
(a) Sez´onnost dn˚ u v t´ ydnu • d - index dne v t´ ydnu
1
3
5
7
9 11 13 15 17 19 21 23 d
(b) Mˇes´ıˇcn´ı sez´onnost • d - index dne v mˇes´ıci
10 0.25 8 0.2 6 0.15 m
m 4 2
0.1
0
0.05
-2
0
-4 -4
1 25 50 75 100 125 150 175 200 225 250 275 d
(c) Roˇcn´ı sez´onnost • d - index dne v roce
-3
-2
-1 d
0
1
2
(d) Vliv pevn´eho sv´atku • d - index dne od sv´atku 15
15 12.5
10
10 m
m
7.5
5
5
0
2.5
-5
0 -4
-3
-2
-1
0 d
1
2
3
4
1 25 50 75 100 125 150 175 200 225 250 275 d
(e) Vliv krachu IPB • d - index dne od krachu (f) Celkov´ y vliv sez´onnost´ı • d - index dne IPB v roce
Obr´azek 5.1: Pr˚ ubˇehy sez´onn´ıch komponent • m - mld. Kˇc
43
dn˚ u pˇred, respektive po jednotliv´em sv´atku, v naˇsem pˇr´ıpadˇe 1 × 34. Hodnota na vˇsech pozic´ıch vektoru zt4 nab´ yv´a bud’ 1, jedn´a-li se o modelovan´ y den, nebo poˇcet v´ yskyt˚ u modelovan´eho dne v roce − , poˇcet zb´ yvaj´ıc´ıch dn˚ u v roce P 4 aby bylo zajiˇstˇeno t+275 ze zv´ yˇsen´a popt´avka pˇri k=t zk = 0. Interpretace je, ˇ sv´atku se rovnomˇernˇe rozloˇz´ı u ´bytkem popt´avky v pr˚ ubˇehu zbytku roku. Vzhledem k v´ ypoˇcetn´ı n´aroˇcnosti modelu jsou Sv´atek pr´ace, Den osvobozen´ı, Den slovansk´ ych vˇerozvˇest˚ u Cyrila a Metodˇeje a Den up´alen´ı mistra Jana Husa, Den ˇcesk´e st´atnosti, Den vzniku samostatn´eho ˇceskoslovensk´eho st´atu a Den boje za svobodu a demokracii uvaˇzov´any jako v´ıcen´asobn´e opakov´an´ı jednoho pevn´eho sv´atku. Sv´atek Nov´ y rok Velikonoce V´anoce pevn´ y sv´atek
Dn˚ u pˇred 4 4 4 4
Dn˚ u po 4 4 4 2
Polynom posunut´ı (w0 + w1 B + . . . + w8 B 8 )B −4 (w0 + w1 B + . . . + w8 B 8 )B −4 (w0 + w1 B + . . . + w8 B 8 )B −4 (w0 + w1 B + . . . + w6 B 6 )B −4
B je oper´ator zpˇetn´eho posunut´ı a wi jsou r˚ uzn´ a pro jednotliv´e sv´atky
Tabulka 5.1: Poˇcty dn˚ u modelovan´ ych pˇred a po jednotliv´ ych sv´atc´ıch
Mimoˇ r´ adn´ e ud´ alosti Stejnˇe jako v ARIMA a GARCH modelu jsme zahrnuli dvˇe mimoˇr´adn´e ud´alosti, krach IPB a probl´em Y2K, kter´e mˇely vliv na v´ yˇsi popt´avky po obˇeˇzivu. Zde ale vzhledem k rekurzivn´ı povaze modelu maj´ı tyto ud´alosti roku 2000 pouze minim´aln´ı vliv na souˇcasnost. Jejich forma v modelu je analogick´a st´atn´ım sv´atk˚ um a dn˚ um volna, pouze s rozd´ılem, ˇze 4 z´aporn´ y v´ yraz sloˇzek vektoru zt urˇcen´ y k vynulov´an´ı vlivu bˇehem roku se zde nahrad´ı 0, protoˇze nem´a ˇz´adn´ y re´aln´ y smysl. Oznaˇc´ıme zt5 a δt5 . Ud´alost IPB Y2K
Dn˚ u pˇred 4 10
Dn˚ u po 4 4
Polynom posunut´ı (w0 + w1 B + . . . + w8 B 8 )B −4 (w0 + w1 B + . . . + w14 B 14 )B −10
B je oper´ator zpˇetn´eho posunut´ı a wi jsou r˚ uzn´ a pro jednotliv´e sv´atky
Tabulka 5.2: Poˇcty dn˚ u modelovan´ ych pˇred a po mimoˇra´dn´ ych ud´alostech
5.2.2
Konstrukce kubick´ ych splin˚ u
C´ılem kubick´ ych splin˚ u je sestrojit funkci g(x), kter´a aproximuje nezn´amou funkci f (x) tak, ˇze je sloˇzen´ım polynomi´aln´ıch funkc´ı diferencovateln´ ych do ˇr´adu 3 a
44
m´a prvn´ı dvˇe derivace spojit´e. Funkce f (x) je zad´ana souˇradnicemi uzl˚ u (x†i , yi† ), i = 0, 1, . . . , k. Mnoˇzinu (x†0 , . . . , x†k ) nazveme rozm´ıstˇen´ım uzl˚ u. 4 3 2 1 m
0 -1 -2 -3 3
9
11
15
19
23
d
Obr´azek 5.2: Pouˇzit´e rozm´ıstˇen´ı uzl˚ u mˇes´ıˇcn´ı komponenty • m - mld. Kˇc • d - denn´ı index Nejdˇr´ıve pˇredpokl´adejme, ˇze souˇradnice uzl˚ u jsou zn´am´e, a tedy pevnˇe dan´e a rozm´ıstˇen´ı je v rostouc´ım poˇrad´ı x†0 < x†1 < · · · < x†k . Oznaˇcme hj = x†j − x†j−1 , dj (x) prvn´ı a d2j (x) druhou derivaci funkce splin˚ u g(x) na † † 2 † intervalu [xj−1 , xj ] a aj = dj (xj ), j = 1, . . . , k. Kubick´e spliny jsou smˇes´ı polynom˚ u † † tˇret´ıho ˇra´du, a tedy jejich druh´a derivace na intervalu [xj−1 , xj ] je line´arn´ı funkce d2j (x)
x − x†j−1 x†j − x aj−1 + aj , = hj hj
j = 1, . . . , k.
V´ yraz pro prvn´ı derivaci a samotnou funkci splin˚ u dostaneme integrac´ı s podm´ın† † † † kami g(xj ) = yj a g(xj−1 ) = yj−1 . Plat´ı " # " # † † 1 (xj − x)2 hj 1 (x − xj−1 )2 hj dj (x) = − − aj−1 + − aj 2 hj 6 2 hj 6 a
x†j − x † [(x†j − x)2 − h2j ] aj−1 + yj−1 gj (x) = − x) 6hj hj x − x†j−1 † [(x − x†j−1 )2 − h2j ] † aj + yj , +(x − xj−1 ) 6hj hj (x†j
(5.21)
kde x†j−1 ≤ x ≤ x†j , j = 1, . . . , k. Posledn´ı rovnici lze zapsat ve vektorov´em z´apisu gj (x) = rj (x)0 y † + sj (x)0 a,
45
kde a = (a0 , . . . , ak )0 , y † = (y0† , . . . , yk† ) a vektory rj (x) a sj (x) maj´ı na vˇsech pozic´ıch 0, kromˇe j-t´e a (j + 1)-v´e pozice, kter´e odpov´ıdaj´ı pˇr´ısluˇsn´ ym vah´am † v rovnici (5.21). Vyuˇzijeme podm´ınku spojitosti prvn´ı derivace dj (xj ) = dj+1 (x†j ) a dostaneme soustavu k − 1 rovnic hj hj+1 aj−1 + 2aj + aj+1 = hj + hj+1 hj + hj+1 † † 6yj−1 6yj† 6yj+1 − + , hj (hj + hj+1 ) hj hj+1 hj+1 (hj + hj+1 )
j = 1, 2, . . . , k − 1.
K soustavˇe k − 1 rovnic o k + 1 nezn´am´ ych je tˇreba pˇridat dalˇs´ı dvˇe podm´ınky, aby byla ˇreˇsiteln´a. Jelikoˇz chceme periodickou funkci splin˚ u, mus´ı b´ yt y0† = yk† ,
d21 (x†0 ) = d2k (x†k ).
d1 (x†0 ) = dk (x†k ),
Z druh´e podm´ınky plyne † 6yk−1 hk h1 6yk† 6y1† ak−1 + 2ak + a1 = + − . h1 + hk h1 + hk hk (h1 + hk ) h1 hk h1 (h1 + hk )
Posledn´ı podm´ınku pˇrep´ıˇseme jako a0 = ak , a t´ım m´ame soustavu k rovnic o k nezn´am´ ych, jej´ıˇz ˇreˇsen´ı v maticov´em tvaru je a = P −1 Q y † , kde
P = Q=
h2 h1 +h2
0 0 0 .. .
h3 h3 +h4
0 0 .. .
h4 h4 +h5
0 .. .
··· ··· ··· ··· ··· ...
0
0 0
0 0
··· ···
6 h2 (h1 +h2 ) − h26h3 6 h3 (h3 +h4 )
0
2 h2 h2 +h3
2
h1 h1 +hk
− h16h2
6 h2 (h2 +h3 )
0 0 0 .. . 0
6 h1 (h1 +hk )
0 0 .. .
0 0
0 h3 h2 +h3
2
0 0 0 0 0 .. .
h1 h1 +h2
2
hk hk−1 +hk
0 0 0 0 .. .
hk h1 +hk
2 0 0 0 0 0 .. .
6 h1 (h1 +h2 )
0 .. .
··· ··· ··· ··· ··· ...
0 0
··· ···
6 − hk−1 hk
6 hk (hk−1 +hk ) − h16hk
6 h3 (h2 +h3 ) − h36h4 6 h4 (h4 +h5 )
6 hk (h1 +hk )
0 0 0 0 .. .
Nyn´ı m˚ uˇzeme vyj´adˇrit funkci splin˚ u jako line´arn´ı funkci y † gj (x) = wj (x)0 y˜† ,
46
(5.22)
kde x†j−1 ≤ x ≤ x†j ,
wj (x)0 = r˜j (x)0 + s˜j (x)0 P −1 Q,
j = 1, . . . , k
a k × 1 vektory y˜† , r˜j a s˜j jsou upraven´e vektory y † , rj a sj vzhledem k y0† = yk† . Parametr x je bod, ve kter´em chceme funkci g(x) vypoˇc´ıtat, a j znaˇc´ı, mezi kter´ ymi dvˇema uzly tento bod leˇz´ı. Rovnici(5.22) pˇrep´ıˇseme do tvaru sez´onn´ı komponenty stavov´eho modelu γt = wt0 γ † , kde t je ˇcasov´ y okamˇzik, ve kter´em se model nach´az´ı. Parametr t urˇcuje, ve kter´e ˇc´asti obdob´ı (napˇr. kter´ y den v roce) se ˇcasov´a ˇrada nach´az´ı, a j d´ale nep´ıˇseme, protoˇze je zˇrejm´e, mezi kter´ ymi uzly t leˇz´ı. D´ale potˇrebujeme zajistit, ˇze celkov´ y † vliv sez´onnosti za obdob´ı bude nula. Proto vypust´ıme posledn´ı prvek vektoru γ a v´ ysledn´ y vektor oznaˇc´ıme δ. N´aslednˇe i-t´ y prvek 1 × (k − 1) vektoru zt vypoˇcteme jako zti = wti − wtk w∗i /w∗k , i = 1, . . . , k − 1, pro vˇsechny dny t v modelovan´em obdob´ı, a kde w∗i je i-t´ y prvek vektoru w∗ =
X
wl ,
napˇr. pro rok
w∗ =
276 X
wl .
l=1
obdob´ı
Nakonec pˇrestaneme uvaˇzovat souˇradnice uzl˚ u za pevn´e, ale umoˇzn´ıme jejich promˇenlivost v ˇcase. Pˇredpokl´adejme, ˇze sleduj´ı n´ahodnou proch´azku † γt† = γt−1 + χt ,
kde χt je vektor seri´alnˇe nekorelovan´ ych n´ahodn´ ych veliˇcin s nulovou stˇredn´ı hodnotou a kovarianˇcn´ı matic´ı Var(χt ) = σχ2 (I − (1/w∗0 w∗ )w∗ w∗0 ). Parametr σχ2 ud´av´a rychlost s jakou se spline m˚ uˇze mˇenit a cel´a kovarianˇcn´ı matice 0 zaruˇcuje, ˇze w∗ χt = 0. Stejnˇe jako u splinu nemˇenn´eho v ˇcase oznaˇc´ıme vektor γt† zkr´acen´ y o posledn´ı prvek δt a dostaneme definitivn´ı tvar periodick´eho kubick´eho splinu promˇenn´eho v ˇcase γt = zt δt .
5.2.3
Alternativn´ı modelov´ an´ı mˇ es´ıˇ cn´ı sez´ onnosti
Jako alternativn´ı zp˚ usob zachycen´ı vlivu dne v mˇes´ıci jsme m´ısto proloˇzen´ı kubick´ ych splin˚ u pouˇzili trigonometrick´e funkce. Sez´onn´ı komponenta pˇri d´elce sez´ony s m´a pak tvar bs/2c X γt = γjt , j=1
47
kde
∗ γj,t+1 = γjt cos λj + γjt sin λj + ωjt , ∗ ∗ ∗ γj,t+1 = −γjt sin λj + γjt cos λj + ωjt ,
j = 1 . . . , bs/2c,
∗ λj = 2πj a ωjt , ωjt jsou nez´avisl´e n´ahodn´e veliˇciny s rozdˇelen´ım N(0, σω2 ). V modelu s popt´avky po obˇeˇzivu je s = 23 a bylo by tedy tˇreba k = 11 subkomponent γjt , ale lze uk´azat (viz [13]), ˇze k = 8 plnˇe postaˇcuje. Pˇredchoz´ı rovnice zap´ıˇseme do stavov´eho modelu se stavov´ ym vektorem ∗ ∗ αt = (γ1t , γ1t , γ2t , . . . , γ8t )
a maticemi Zt = (1, 0, 1, 0, . . . , 1, 0), Tt = diag(C1 , C2 , . . . , C8 ), Rt = I16 , Qt = σω2 I16 , kde
µ Cj =
cos λj sin λj − sin λj cos λj
¶ ,
j = 1, . . . , 8.
Pˇripojen´ı komponenty do modelu popt´avky po obˇeˇzivu se provede zn´am´ ym zp˚ usobem. 4 3 2 1 m
0 -1 -2 -3 1
3
5
7
9
11 13 15 17 19 21 23 d
Obr´azek 5.3: Mˇes´ıˇcn´ı sez´onnost - trigonometrick´e funkce • m - mld. Kˇc • d - denn´ı index
5.3
Verifikace modelu
Pˇri testov´an´ı spr´avnosti a kvality modelu jsme pouˇzili ˇradu n´astroj˚ u, jejichˇz ˇc´ıseln´e hodnoty jsou uvedeny v souhrnn´e tabulce na konci kapitoly vˇenovan´e STS modelu.
48
Protoˇze se ve velk´e ˇca´sti jedn´a o jiˇz popsan´a krit´eria u ARIMA a GARCH model˚ u, je uveden pouze jejich v´ yˇcet. Hladinu v´ yznamnosti u test˚ u mˇejme α = 5%. Pˇredpokladem stavov´eho modelu je, ˇze chybov´e ˇcleny εt a ηt jsou norm´alnˇe rozdˇelen´e a seri´alnˇe nez´avisl´e s konstantn´ımi rozptyly. Vzhledem k tˇemto pˇredpoklad˚ um mus´ı b´ yt standardizovan´e chyby jednokrokov´e pˇredpovˇedi vt et = √ , Ft
t = 1, . . . , n,
tak´e norm´alnˇe rozdˇelen´e a seri´alnˇe nez´avisl´e s jednotkov´ ym rozptylem. Normalitu jsme testovali pomoc´ı Kolmogorov-Smirnovova testu, Lillieforsova testu, JarqueBerova testu a vykreslen´ım histogramu a QQ - grafu (Obr. 5.7 a 5.6). Vˇsechny testy, podobnˇe jako u ostatn´ıch model˚ u, hypot´ezu norm´aln´ıho rozloˇzen´ı zam´ıtaj´ı. Pro ovˇeˇren´ı nemˇennosti rozptylu jsme pouˇzili Goldfeld-Quandt˚ uv test, kter´ y nulovou hypot´ezu nezam´ıt´a. Seri´aln´ı nekorelovanost jsme analyzovali pomoc´ı korelogram˚ u (Obr. 5.4 a 5.5) a Ljung-Boxova testu pro rezidua a tak´e pro jejich druh´e mocniny. V´ ysledky lze charakterizovat jako uspokojiv´e, v´ yznamnˇejˇs´ı korelovanost se objevuje jen u roˇcn´ıch frekvenc´ı. Pˇri srovn´av´an´ı kvality jednotliv´ ych model˚ u jsme pouˇzili vˇerohodnost modelu, AIC a BIC krit´erium. Z´aroveˇ n jsme prov´adˇeli anal´ yzu grafu nenormovan´ ych rezidu´ı jednokrokov´e predikce (Obr. 5.8 a 5.9), zvl´aˇstˇe odchylek pˇresahuj´ıc´ıch 1 mld. Kˇc. D˚ uleˇzit´a vlastnost je samozˇrejmˇe pˇredpov´ıdac´ı schopnost, mˇeˇren´a stˇredn´ı kvadratickou chybou pˇredpovˇedi. Pˇri jednokrokov´e pˇredpovˇedi za rok 2003 jsme zaznamenali tˇri odchylky v´ yraznˇe vˇetˇs´ı neˇz 1 mld. Kˇc. Jedn´a se o 14.3.2003, 9.5.2003 a 7.11.2003. Posledn´ı dvˇe zˇrejmˇe souvis´ı s urˇcitou ztr´atou informace zp˚ usobenou vloˇzen´ım chybˇej´ıc´ıch dn´ı, prvn´ı z nich se nepodaˇrilo uspokojivˇe vysvˇetlit. Vˇsechny testy, histogram a QQ-graf byly provedeny na normovan´ ych rezidu´ıch {et }. Normovan´a rezidua uvaˇzujeme bez nulov´ ych rezidu´ı v ˇcasov´ ych okamˇzic´ıch vloˇzen´ ych chybˇej´ıc´ıch dn´ı, protoˇze by doˇslo k neˇza´douc´ımu zkreslen´ı v´ ysledk˚ u. Ostatn´ı statistiky prov´ad´ıme na nenormovan´ ych rezidu´ıch {vt } vˇcetnˇe nul na m´ıstech vloˇzen´ ych chybˇej´ıc´ıch dn´ı, protoˇze zde jde bud’ pouze o relativn´ı vztah mezi veliˇcinami, nebo tato varianta nab´ız´ı vˇetˇs´ı pˇrehlednost v´ ystup˚ u.
5.4
Predikce
Po zkonstruov´an´ı a ovˇeˇren´ı modelu nyn´ı chceme ˇcasovou ˇradu popt´avky po obˇeˇzivu pˇredpov´ıdat. Pˇresnˇeji formulov´ano naj´ıt nejlepˇs´ı odhad yn+j , j > 0, za pˇredpokladu znalosti y1 , . . . , yn , ve smyslu stˇredn´ı kvadratick´e chyby. Oznaˇcme jej y n+j a ze standardn´ıch znalost´ı v´ıme, ˇze y n+j = E(yn+j | y). Pro j = 1 se jedn´a o v´ ystup
49
0.8
0.6
ACF
0.4
0.2
0
−0.2
0
50
100
150 l
200
250
300
Obr´azek 5.4: ACF rezidu´ı (ˇcervenˇe), hranice v´ yznamnosti (modˇre) • l - zpoˇzdˇen´ı
0.8
0.6
PACF
0.4
0.2
0
−0.2
0
20
40
60
80
100
120
140
160
180
200
l
Obr´azek 5.5: PACF rezidu´ı (ˇcervenˇe), hranice v´ yznamnosti (modˇre) • l - zpoˇzdˇen´ı 0.999 0.997 0.99 0.98 0.95 0.90 0.75 p
0.50
0.25 0.10 0.05 0.02 0.01 0.003 0.001 −3
−2
−1
0
1
2
data
Obr´azek 5.6: QQ-graf rezidu´ı
50
3
4
70
60
50
40
30
20
10
0 −4
−3
−2
−1
0
1
2
3
4
5
Obr´azek 5.7: Histogram rezidu´ı Kalmanova filtru, uvaˇzme tedy j > 1. Jelikoˇz yn+j = Zn+j αn+j + εn+j , dost´av´ame y n+j = Zn+j E(αn+j | y). Oznaˇcme an+j = E(αn+j | y) a P n+j = E[(an+j − αn+j )(an+j − αn+j )0 | y]. Souˇcasnˇe odvod´ıme F n+j = E[(y n+j − yn+j )(y n+j − yn+j )0 | y] = E[{Zn+j (an+j − αn+j ) − εn+j }{Zn+j (an+j − αn+j ) − εn+j }0 ] 0 = Zn+j P n+j Zn+j + Hn+j . D´ale staˇc´ı urˇcit rekurze pro v´ ypoˇcet an+j a P n+j . Z αn+j = Tn+j−1 αn+j−1 + Rn+j−1 ηn+j−1 plyne an+j = Tn+j−1 E(αn+j−1 | y) = Tn+j−1 an+j−1 a
P n+j = E[(an+j − αn+j )(an+j − αn+j )0 | y] 0 = Tn+j−1 E[(an+j−1 − αn+j−1 )(an+j−1 − αn+j−1 )0 | y]Tn+j−1 0 0 +Rn+j−1 E(ηn+j−1 ηn+j−1 )Rn+j−1 0 0 = Tn+j−1 Pn+j−1 Tn+j−1 + Rn+j−1 Qn+j−1 Rn+j−1 .
Takto m˚ uˇzeme postupovat pro n + j, n + j − 1, . . . , n + 2, aˇz an+1 = an+1 a P n+1 = Pn+1 . Vˇsimneme si, ˇze odvozen´e rovnice jsou rovnice Kalmanova filtru, jestliˇze vk = 0 a Kk = 0 pro k = n + 1, . . . , j − 1. Pro predikci lze tedy pouˇz´ıt standardn´ı Kalman˚ uv filtr, u kter´eho povaˇzujeme pozorov´an´ı yt , t > n za chybˇej´ıc´ı. V naˇsem modelu popt´avky po obˇeˇzivu jsme provedli pˇredpovˇedi s krokem j = 1, 5, 10, tj. stejnˇe jako u ostatn´ıch model˚ u. Stˇredn´ı kvadratick´a chyba pˇredpovˇedi se s velikost´ı kroku zvyˇsuje, ˇc´ıseln´e hodnoty jsou uvedeny v tabulce 5.3. Vzhledem k lepˇs´ım v´ ysledk˚ um uvaˇzujeme v dalˇs´ıch kapitol´ach jen STS model s mˇes´ıˇcn´ı sez´onnost´ı modelovanou kubick´ ymi spliny.
51
2 1 m
0 -1 -2 50
100
150 d
200
250
Obr´azek 5.8: Rezidua jednokrokov´e predikce v roce 2003 (ˇcernˇe), hranice ±1 mld. Kˇc (ˇcervenˇe) • m - mld. Kˇc • d - denn´ı index
2 1 m
0 -1 -2 200
400 d
600
800
Obr´azek 5.9: Rezidua jednokrokov´e predikce v letech 2001-2003 (ˇcernˇe), hranice ±1 mld. Kˇc (ˇcervenˇe) • m - mld. Kˇc • d - denn´ı index
52
Model Nenormovan´a rezidua Stˇredn´ı hodnota Rozptyl Normovan´a rezidua Stˇredn´ı hodnota Rozptyl ˇ Sikmost ˇ catost Spiˇ Kolmogorov-Smirnov test p-hodnota Lilliefors test p-hodnota Jarque-Bera test p-hodnota Goldfeld-Quandt test p13-hodnota p31-hodnota Ljung-Box test Q(5) p-hodnota Q(10) p-hodnota Q(22) p-hodnota Q(261) p-hodnota Ljung-Box test Q(5) p-hodnota Q(10) p-hodnota Q(22) p-hodnota Q(261) p-hodnota Log. vˇerohodnost AIC BIC Chyby pˇredpovˇed´ı RMSE krok 1 ˇ RMSE krok 1 v CNB RMSE krok 5 RMSE krok 10
s kubick´ ymi spliny
s trigon. funkcemi
-0.01422 0.25276
-0.01317 0.27983
0.02114 0.76767 0.10879 4.73427 Zam´ıt´a H0 0.00857 Zam´ıt´a H0 0.048 Zam´ıt´a H0 2.6312x10−14 Nezam´ıt´a H0 0.64623 0.35377 rezidua 0.08078 0.03555 0.01281 0 kvadr´at rezidu´ı 7.2217x10−6 0.0004 0.01707 0.66782 -1.79053x106 6487.77 6488.47 [mld. Kˇc] 0.47018 0.43787 1.0122 1.45305
0.00041 0.59438 -0.01544 5.39046 Zam´ıt´a H0 0.00053 Zam´ıt´a H0 NaN1 Zam´ıt´a H0 0 Nezam´ıt´a H0 0.79926 0.20074 0.00024 0.00039 0.00011 0 0.00032 0.00578 0.13595 0.96007 730.341 -2.3201 -1.6168 0.50443 0.43787 1.22207 1.56971
1 Procedura
lillietest v Matlab v nˇekter´ ych pˇr´ıpadech nevrac´ı p-hodnotu, ale pouze ud´av´a v´ ysledek testu.
Tabulka 5.3: Tabulka v´ ysledk˚ u model˚ u
53
Kapitola 6 Kombinace model˚ u V pˇredch´azej´ıc´ıch kapitol´ach jsme zkonstruovali tˇri r˚ uzn´e modely pro predikci popt´avky po obˇeˇzivu. Nyn´ı bychom mohli podle urˇcit´eho krit´eria, napˇr. velikosti stˇredn´ı kvadratick´e chyby pˇredpovˇedi, nebo kombinac´ı v´ıce krit´eri´ı rozhodnout, kter´ y model povaˇzujeme za nejlepˇs´ı a ten d´ale pouˇz´ıvat pro predikci ˇrady. T´ım bychom ale ˇza´dn´ ym zp˚ usobem nevyuˇzili dodateˇcnou informaci obsaˇzenou v ostatn´ıch modelech, danou jinou strukturou tˇechto model˚ u, ˇci pouˇzit´ım jin´ ych vysvˇetluj´ıc´ıch exogenn´ıch promˇenn´ ych. Zvl´aˇstˇe pokud by chyby pˇredpovˇed´ı dvou model˚ u byly negativnˇe korelovan´e, mohli bychom jejich kombinac´ı dos´ahnout v´ yraznˇe lepˇs´ı pˇredpovˇedi ˇcasov´e ˇrady oproti pˇredpovˇedi obou jednotliv´ ych model˚ u. N´ami pouˇzit´a metoda kombinac´ı model˚ u je zaloˇzen´a na regresn´ı metodˇe navrˇzen´e v [8]. Pro pozorovanou ˇcasovou ˇradu yt , t = 1, . . . , T mˇejme dvˇe alternativn´ı pˇredpovˇedi fta a ftb , t = 1, . . . , T . Kombinovan´e pˇredpovˇedi konstruujeme ve tvaru yˆt = αfta + (1 − α)ftb , pro t = 1, . . . , T . V´ahy alternativn´ıch model˚ u nalezneme pomoc´ı metody nejmenˇs´ıch ˇctverc˚ u. Vzhledem ke skuteˇcnosti dlouh´e inicializace Kalmanova filtru u STS modelu a jeho n´asledn´e adaptace po pˇrechodu z rozˇs´ıˇren´eho na standardn´ı Kalman˚ uv filtr hled´ame optim´aln´ı v´ahy pouze na ˇc´asti ˇcasov´e ˇrady pˇripadaj´ıc´ı na rok 2002. Model/Pˇredpovˇed’ 1 krok vpˇred 5 krok˚ u vpˇred sts - arima 0.434918 0.904458 sts - garch 0.448697 0.901731 arima - garch 0.476364 1.24903
10 krok˚ u vpˇred 1.23999 1.29987 1.84795
Tabulka 6.1: RMSE pˇredpovˇed´ı kombinovan´ ych model˚ u v mld. Kˇc
54
RMSE krok 1
sts - arima 0.435519
sts - garch 0.449314
arima - garch 0.480947
Tabulka 6.2: RMSE pˇredpovˇed´ı kombinovan´ ych model˚ u po ˇctvrtlet´ıch v mld. Kˇc
Vzhledem k tomu, ˇze ˇcasov´a ˇrada vykazuje sezonn´ı vlivy, nab´ız´ı se moˇznost nestanovovat v´ahy pˇredpovˇed´ı model˚ u stejn´e pro vˇsechna t = 1, . . . , T , ale promˇenliv´e po obdob´ıch, a t´ım vyuˇz´ıt pˇr´ıpadn´e lepˇs´ı vlastnosti jednotliv´ ych model˚ u v tˇechto obdob´ıch. My jsme provedli dˇelen´ı na ˇctvrtlet´ı, a tedy urˇcili v´ahy α1Q , . . . , α4Q . Kvalita predikce se ovˇsem nezv´ yˇsila. Podrobnˇejˇs´ı dˇelen´ı na mˇes´ıce jako v ECB jsme neaplikovali, protoˇze pro anal´ yzu pouˇz´ıv´ame pouze hodnoty roku 2002 a v jednotliv´ ych mˇes´ıc´ıch nem´ame dostatek pozorov´an´ı. Kvalita pˇredpovˇed´ı mˇeˇren´a odmocninou stˇredn´ı kvadratick´e chyby se kombinac´ı jednotliv´ ych model˚ u ˇ zlepˇsila, v´ ysledky uv´ad´ıme v tabulce 6.1 a 6.2. C´ıseln´e hodnoty koeficient˚ u α a dalˇs´ı statistiky regresn´ı anal´ yzy lze nal´ezt v CD pˇr´ıloze.
2 1.5 1 0.5 m
0 -0.5 -1 -1.5 50
100
150
200
250
d Obr´azek 6.1: Rezidua jednokrokov´e predikce sts-arima modelu v roce 2003 (ˇcernˇe), hranice ±1 mld. Kˇc (ˇcervenˇe) • m - mld. Kˇc • d - denn´ı index
55
260
250
m 240
230
220 50
100
150
200
250
d
Obr´azek 6.2: Jednokrokov´a pˇredpovˇed’ sts-arima modelu (ˇcervenˇe) a skuteˇcnost (ˇcernˇe) v roce 2003 • m - mld. Kˇc • d - denn´ı index
265
260
255
m 250
245
240
10
20
30 d
40
50
60
Obr´azek 6.3: Jednokrokov´a pˇredpovˇed’ sts-arima modelu (ˇcervenˇe) a skuteˇcnost (ˇcernˇe) v 4. ˇctvrtlet´ı 2003 • m - mld. Kˇc • d - denn´ı index
56
Kapitola 7 Porovn´ an´ı model˚ u Jak jiˇz bylo naznaˇceno v pˇredch´azej´ıc´ıch ˇc´astech pr´ace, hlavn´ım krit´eriem pro porovn´an´ı model˚ u bude jejich pˇredpov´ıdac´ı schopnost. Pouˇzit´ ymi statistikami jsou odmocnina stˇredn´ı kvadratick´e chyby pˇredpovˇedi, Diebold-Marian˚ uv test pro porovn´an´ı pˇresnosti pˇredpovˇed´ı a poˇcet odchylek pˇredpovˇedi vˇetˇs´ıch neˇz 1 mld. Kˇc. Nelze nav´ıc ˇr´ıci, ˇze by nˇekter´ y z model˚ u byl statisticky v´ıce spr´avn´ y. Probl´emy s nenormalitou rezidu´ı nastaly u vˇsech model˚ u, ˇreˇsen´ım by mohl b´ yt pˇredpoklad jin´eho rozdˇelen´ı rezidu´ı, napˇr´ıklad t-rozdˇelen´ı. Zam´ıtnut´ı konstantnosti rozptylu rezidu´ı u ARIMA a GARCH modelu nepovaˇzujeme za velk´ y probl´em, nebot’ k nˇemu doch´az´ı v d˚ usledku vˇetˇs´ıho rozptylu ˇcasov´e ˇrady obˇeˇziva v roce 1998, kdy ˇ pravdˇepodobnˇe doch´azelo k adaptaci na nov´ y mˇenovˇepolitick´ y reˇzim CNB. Zkr´acen´ı ˇcasov´e ˇrady jsme neprovedli z d˚ uvodu zachov´an´ı konzistence podklad˚ u jednotliv´ ych model˚ u. Stˇredn´ı kvadratick´a chyba, vˇcetnˇe v´ ysledn´ ych hodnot, jiˇz byla uvedena u jednotliv´ ych model˚ u, zb´ yv´a tedy objasnit Diebold-Marian˚ uv test. Tento test je urˇcen pro testov´an´ı nulov´e hypot´ezy stejn´e pˇredpov´ıdac´ı schopnosti dvou model˚ u a vych´az´ı z centr´aln´ı limitn´ı vˇety pro stacion´arn´ı n´ahodn´e procesy. Diebold a Mariano pracuj´ı s obecnou chybovou funkc´ı (loss function), my jsme pouˇzili kvadratickou chybovou funkci. Testov´a statistika m´a pak tvar SDM = s
d¯ 2π fˆd (0) T
d
→ N(0, 1),
P kde d¯ = T1 Tt=1 dˆi , dˆi = eˆ2A,i − eˆ2B,i , i = 1, . . . , T , eˆA,i jsou chyby predikce modelu A, eˆB,i jsou chyby predikce modelu B, T je d´elka predikovan´eho intervalu a fˆd (0) je konzistentn´ı odhad spektr´aln´ı hustoty procesu {di } na frekvenci 0. Pˇredpokladem je zde stacionarita procesu {di }. Odhad 2π fˆd (0) dostaneme jako v´aˇzenou sumu
57
Modely/Pˇredpovˇed’ STS vs ARIMA GARCH sts-arima sts-garch arima-garch ARIMA vs GARCH sts-arima sts-garch arima-garch GARCH vs sts-arima sts-garch arima-garch sts-arima vs sts-garch arima-garch sts-garch vs arima-garch
1 krok vpˇred 0.362 0.000 0.977 0.984 0.421 0.000 0.998 0.891 0.938 1.000 1.000 1.000 0.158 0.006 0.143
5 krok˚ u vpˇred 10 krok˚ u vpˇred 0.063 0.063 0.001 0.000 0.995 0.992 0.990 0.979 0.094 0.070 0.006 0.011 0.980 0.974 0.980 0.966 0.842 0.891 1.000 1.000 1.000 1.000 1.000 0.999 0.532 0.049 0.030 0.026 0.028 0.034
Tabulka 7.1: V´ ysledky Diebold-Marianova testu
dostupn´ ych v´ ybˇerov´ ych autokovarianc´ı γˆd (τ ), µ ¶ (T −1) X τ l 2π fˆd (0) = γˆd (τ ), S(T ) τ =−(T −1)
τ kde funkce l( S(T ) pˇriˇrazuje v´ahy autokovarianˇcn´ı funkci na jednotliv´ ych zpoˇzdˇe) n´ıch a je naz´ yv´ana j´adrem (kernel) a St ud´av´a zpoˇzdˇen´ı, po kter´em autokovariance zanedb´av´ame (truncation lag). Stejnˇe jako Diebold a Mariano jsme pouˇzili jednotkov´e (obd´eln´ıkov´e) j´adro ¶ ½ µ τ 1 pro | S(T |≤1 τ ) = l 0 jinak S(T )
a S(T ) = (k − 1) v pˇr´ıpadˇe k-krokov´e pˇredpovˇedi, nebot’ dle teoretick´ ych v´ ysledk˚ u jsou chyby optim´aln´ı k-krokov´e pˇredpovˇedi nejv´ yˇse (k − 1)-z´avisl´e. V praxi toto sice z mnoha d˚ uvod˚ u nemus´ı platit, pˇresto pouˇzit´ı t´eto hodnoty S(T ) d´av´a dobr´e v´ ysledky, podrobnosti lze naj´ıt v [5]. Vypoˇcten´e hodnoty Diebold-Marianova testu, pˇreveden´e na pravdˇepodobnosti, jsou uvedeny v tabulce 7.1. Jestliˇze je hodnota mal´a, napˇr´ıklad pro hladinu testu α = 5% menˇs´ı neˇz 0.025, potom zam´ıt´ame nulovou hypot´ezu ve prospˇech modelu A, tj. pˇredpovˇed’ modelem A je statisticky pˇresnˇejˇs´ı neˇz modelem B. Je-li naopak hodnota velk´a, zam´ıt´ame nulovou hypot´ezu ve prospˇech modelu B. V tabulce 7.2 n´asleduj´ı ˇcetnosti pˇrekroˇcen´ı hranice 1 mld. Kˇc u chyb pˇredpovˇed´ı jednotliv´ ymi modely. Z v´ ysledk˚ u je patrn´e, ˇze nejlepˇs´ım modelem je sts-arima model, a to pro vˇsechny proveden´e horizonty pˇredpovˇed´ı. Pˇri jednokrokov´e pˇredpovˇedi je pˇredpovˇed’
58
Model/Pˇredpovˇed’ 1 krok vpˇred 5 krok˚ u vpˇred STS 11 63 ARIMA 9 95 GARCH 44 122 sts-arima 10 59 sts-garch 8 62 arima-garch 10 96
10 krok˚ u vpˇred 98 130 185 89 87 138
Tabulka 7.2: Poˇcet chyb predikce vˇetˇs´ıch neˇz 1 mld. Kˇc
sts-arima modelem statisticky v´ yznamnˇe pˇresnˇejˇs´ı neˇz vˇsechny ostatn´ı modely, s vyj´ımkou sts-garch modelu. Nejhorˇs´ım modelem je samotn´ y model GARCH, kter´ y je signifikantnˇe horˇs´ı neˇz ostatn´ı modely a tak´e poˇcet chyb predikce pˇresahuj´ıc´ıch 1 mld. Kˇc je v´ yraznˇe vˇetˇs´ı neˇz u ostatn´ıch model˚ u. Vˇsechny kombinace model˚ u vykazuj´ı lepˇs´ı v´ ysledky neˇz pˇr´ısluˇsn´e samostatn´e modely. Nejvˇetˇs´ı pˇr´ınos z kombinace model˚ u lze pozorovat u sts-garch a sts-arima modelu. Naopak u kombinace arima-garch je zlepˇsen´ı pˇredpovˇedi minim´aln´ı, nebot’ struktura obou model˚ u je velmi podobn´a. Budeme tedy povaˇzovat sts-arima za n´aˇs fin´aln´ı model. Pˇri anal´ yze predikce (Obr. 6.1) je zaj´ımav´e, ˇze k nejvˇetˇs´ım odchylk´am predikce od skuteˇcnosti nedoch´az´ı v obdob´ı V´anoc, ale v kvˇetnu a ˇcervnu, nebot’ pr´avˇe kvalita zachycen´ı vlivu obdob´ı V´anoc se podaˇrila zv´ yˇsit kombinac´ı model˚ u. Nejvˇetˇs´ı odchylka, t´emˇeˇr 2 mld. Kˇc, nastala 14.3.2003 a je v t´eto ˇca´sti roku zcela ojedinˇel´a. V ostatn´ıch mˇes´ıc´ıch je predikce modelem velmi pˇresn´a. Srovn´ame-li fin´aln´ı model s trivi´aln´ı pˇredpovˇed´ı, kdy jako pˇredpovˇed’ yt+1 pˇri znalosti y1 , . . . , yt bereme yt , kter´a m´a RMSE jednokrokov´e pˇredpovˇedi 1.09739, sn´ıˇzili jsme chybu predikce na necel´ ych 40% oproti t´eto trivi´aln´ı pˇredpovˇedi.
59
Kapitola 8 Z´ avˇ er C´ılem t´eto pr´ace bylo vytvoˇren´ı stochastick´eho modelu, kter´ y by mohl b´ yt pouˇzit pro pˇredpov´ıd´an´ı nejv´ yznamnˇejˇs´ıho autonomn´ıho faktoru ovlivˇ nuj´ıc´ıho likviditu ˇ T´ımto faktorem je objem obˇeˇziva, neboli objem hotovostn´ıch penˇeˇzn´ıho trhu v CR. penˇez drˇzen´ ych mimo centr´aln´ı banku. Jak jiˇz bylo zm´ınˇeno, tato ˇcasov´a ˇrada vykazuje velk´e mnoˇzstv´ı sez´onn´ıch z´avislost´ı, kter´e se navz´ajem kombinuj´ı a zp˚ usobuj´ı ˇcetn´e komplikace pˇri tvorbˇe modelu. Pˇri nalezen´ı relevantn´ıch vysvˇetluj´ıc´ıch promˇenn´ ych jsme vych´azeli ze ˇ zkuˇsenost´ı expert˚ u CNB, pˇredchoz´ıch model˚ u ([2] a [12]) a vlastn´ı anal´ yzy ˇcasov´e ˇrady. N´aroˇcnost spr´avn´eho zachycen´ı sez´onnost´ı potvrzuje napˇr´ıklad 75 nenulov´ ych parametr˚ u u ARIMA modelu. Zkonstruovali jsme tˇri r˚ uzn´e modely. Jsou jimi ARIMA model, zaloˇzen´ y na Box-Jenkinsovˇe metodologii, GARCH model, kter´ ym jsme se snaˇzili postihnout nˇekter´e rysy rezidu´ı ARIMA modelu a STS model zaloˇzen´ y na zcela odliˇsn´em pˇr´ıstupu k ˇcasov´ ym ˇrad´am pomoc´ı stavov´ ych prostor˚ u a Kalmanov´ ych rekurz´ı. Vˇsechny tˇri modely d´avaj´ı dobr´e v´ ysledky. Nejlepˇs´ı z nich je STS model, kter´ y po zkombinov´an´ı s ARIMA modelem vytv´aˇr´ı fin´aln´ı model. Oproti tomu aplikace GARCH modelu nesplnila oˇcek´av´an´ı. Fin´aln´ı sts-arima model dos´ahl nepatrnˇe ˇ menˇs´ı chyby jednokrokov´e predikce neˇz expertn´ı odhad prov´adˇen´ y v CNB. V pr´aci byl zkonstruov´an stochastick´ y model obˇeˇziva, kter´ y d´av´a v´ ysledky na u ´rovni dosud pouˇz´ıvan´ ych odhad˚ u. Pˇrid´a-li se k v´ ysledk˚ um modelu expertn´ı ’ zkuˇsenost, zkoriguje se pˇredpovˇed modelem v kritick´ ych obdob´ıch roku a pˇri mimoˇra´dn´ ych ud´alostech. Vznikne tak lepˇs´ı odhad popt´avky po penˇez´ıch, kter´ y ˇ umoˇzn´ı efektivnˇejˇs´ı aplikaci mˇenovˇepolitick´ ych n´astroj˚ u CNB. Vytvoˇren´ y model nab´ız´ı z´aroveˇ n predikci s delˇs´ım ˇcasov´ ym horizontem, kter´a bude nutn´a v souvislosti se zaveden´ım jednotn´e evropsk´e mˇeny euro.
60
Literatura [1] Brockwell, P.J., Davis, R.A. (2001): Introduction to Time Series and Forecasting. Springer-Verlag, New York. [2] Cabrero, A., Camba-Mendez, G., Hirsch, A. (2001): Modeling the Daily Series of Banknotes in Circulation in the Context of the Liquidity Management Operations of the ECB. ECB Working Paper no. 142. [3] Cipra, T. (1986): Anal´ yza ˇcasov´ ych ˇrad s aplikacemi v ekonomii. SNTL, Praha. [4] De Jong, P. (1991): The Diffuse Kalman Filter. The Annals of Statistics 19, 1073-1083. [5] Diebold, F.X., Mariano, R.S. (1995): Comparing Predictive Accuracy. Journal of Business and Economic Statistics 13, 253-263. [6] Durbin, J., Koopman, S.J. (2001): Time Series Analysis by State Space Methods. Oxford University Press. [7] Franke, J., H¨ardle, W., Hafner, C. (2001): Einf¨ uhrung in die Statistik der Finanzm¨arkte. Springer-Verlag, Heidelberg. [8] Granger, C.V.J., Ramanathan, R. (1984): Improved Methods of Forecasting. Journal of Forecasting 3, 197-204. [9] Harvey, A.C. (1989): Forecasting, Structural Time Series Models and the Kalman Filter. Cambridge University Press. [10] Harvey, A.C., Koopman, S.J., Riani M. (1997): The Modeling and Seasonal Adjustment of Weekly Observations. Journal of Business and Economic Statistics 15, 354-368. [11] Hlav´aˇcek, M. (2005): The Application of Structured Feedforward Neural Networks to the Modeling of the Daily Series of Currency in Circulation. Lecture Notes In Computer Science, Springer-Verlag, New York.
61
[12] Hlav´aˇcek, M. (2004): Modelov´an´ı objemu obˇeˇziva. Bakal´aˇrsk´a pr´ace, FJFI ˇ CVUT, Praha. [13] Pierce, D.A., Grupe, M.R., Cleveland, W.P. (1984): Seasonal Adjustment of the Weekly Monetary Aggregates: A Model-Based Approach. Journal of Business & Economic Statistics 2, 260-270.
62