4ST432 Modely ekonomických a finančních časových řad Kamil Kladívko Zadání úkolů a data najdete v souboru zadani432.xlsx. Výpočty jsou v souboru solution432.xlsx.
Obsah 1 Cena a výnos aktiva, volatilita 1.1
2
Odhad očekávaného výnosu, interval spolehlivosti, test hypotézy . . . . . . . . .
2
2 Předpoklad normality, Jarque-Bera test
3
3 Kovariance, korelace, autokovariance, autokorelace
3
4 Regrese
4
5 Naivní stochastický proces: vlastnosti, Monte Carlo simulace
4
5.1
Teoretické výpočty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
5.2
Monte Carlo simulace procesu . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
5.3
Úprava parametrů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
6 Vlastnosti střední hodnoty, rozptylu a kovariance
5
7 Stacionární modely ARMA
5
7.1
Odhad a implementace modelu AR(p) . . . . . . . . . . . . . . . . . . . . . . . .
5
7.2
Práce s modelem AR(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
7.3
Model MA(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
8 Nestacionární modely.
7
8.1
Model náhodné procházky (Random Walk) . . . . . . . . . . . . . . . . . . . . .
7
8.2
Trendově stacionární versus Random Walk s driftem . . . . . . . . . . . . . . . .
8
9 Identifikace a odhad modelů ARIMA 9.1
8
Simulované časové řady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
8
9.2
Reálné časové řady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10 Zdánlivá regrese, Vektorová autoregrese, Kointegrace
9
10.1 Zdánlivá regrese (Spurious Regression) . . . . . . . . . . . . . . . . . . . . . . . . A Testování hypotéz
1
9
9 9
Cena a výnos aktiva, volatilita 1. Cenu aktiva, např. akcie v čase t označíme Pt . Uspořádáním cen v čase zavedeme stochastický proces {Pt , t = 1, 2, . . .} nebo také jenom {Pt }, či (Pt ). Realizací stochastického procesu je časová řada. 2. Hrubý výnos (gross return nebo také koeficient růstu) 1 + Rt =
Pt Pt−1 .
3. Čistý výnos (net return, arithmetic return, simple return, míra zisku nebo také relativní t−1 přírůstek) Rt získáme odečtením 1 od hrubého výnosu, tedy Rt = PtP−P . t−1 Q t 4. Výnos za k období označíme Rt [k] a platí (odvoďte) 1 + Rt [k] = PPt−k = k−1 j=0 (1 + Rt−j ). Průměrný koeficient růstu) spočteme jako geometrický průměr (proč?), Q výnos (průměrný 1/k . tedy ( k−1 (1 + R )) t−j j=0 t 5. Logaritmický výnos (log return, logaritmická míra zisku) rt = ln PPt−1 = ln(1+Rt ). Ukažte, že platí rt [k] = rt + rt−1 + · · · + rt−k+1 . A tedy průměrný log výnos spočteme aritmetickým průměrem.
6. Spojité úročení (continuous compounding) jako limita složeného úročení: limm→∞ (1 + r m = er , kde r je úroková sazba (v desetinné podobě) per annum a m je frekvence m) připisování úroku. Z definice log výnosu dostaneme Pt = Pt−1 ert , nebo-li log výnos představuje spojitě úročený výnos. Vyzkoušejte si v Excelu jak roste připisovaný úrok s rostoucí frekvencí připisování úroku. 7. Taylorovým rozvojem (první řád) funkce ln(P ) v bodě Pt−1 ukažte, že log výnos je přibližně rovný čistému výnosu, tj.: rt = ln
Pt Pt ≈ − 1 = Rt . Pt−1 Pt−1
Přesně platí ln(Rt + 1) = rt . Což je také vzoreček pro převod spojitého úročení úrokovou sazbou r na roční úročení sazbou R, kdy za rok bude připsána stejná korunová výše úroku. √ 8. Anualizace volatility: Jak a za jakých předpokladů odvodíme poučku σa = 12σm , kde σa je roční volatilita a σm je měsíční volatilita.
1.1
Odhad očekávaného výnosu, interval spolehlivosti, test hypotézy
b t] = 1. Odhad očekávaného výnosu: E[r
1 T
PT
i=1 ri = r;. q q 1 PT 2 d t] = 2. Volatilita výnosu a její odhad: σ br = Var[r i=1 (ri − r) . T −1
3. Interval spolehlivosti pro očekávaný výnos. Test hypotézy, zda je očekávaný výnos různý od nuly. 2
2
Předpoklad normality, Jarque-Bera test • Pro cenu Pt standardně předpokládáme log-normální rozdělení, z čehož plyne, že log výnos má normální rozdělení (proč?). Pracovat s čistým výnosem je obtížnější (proč?). • Špičatost (kurtosis) a šikmost (skewness) výnosů. Test normality výnosů pomocí JarqueBera (JB) testu, viz např. http://en.wikipedia.org/wiki/Jarque-Bera test.
Úkoly 1. Odhadněte špičatost (kurtosis) log výnosů Microsoftu. Co z odhadnuté hodnoty můžete usuzovat? 2. Odhadněte šikmost (skewness) log výnosů Microsoftu. 3. Proveďte Jarque Bera test normality log výnosů Microsoftu.
3
Kovariance, korelace, autokovariance, autokorelace • Kovariance mezi dvěma náhodnými veličinami X a Y : Cov[X, Y ] = E[(X − E[X])(Y − E[Y ])]. • Korelace: %XY = √
Cov[X,Y ] √ . Var[X] Var[Y ]
• Ve výběrové kovarianci, nebo-li odhadu kovariance se střední hodnoty nahradí aritmetickými průměry. Ve výběrové korelaci se dále nahradí rozptyly výběrovými rozptyly. Cov[Xt ,Xt−l ] • Autokorelace o zpoždění l pro proces {Xt }: %Xt Xt−l = √
je stacionární, potom je autokorelace: %l =
Var[Xt ]Var[Xt−l ] Cov[Xt ,Xt−l ] = γγ0l . Var[Xt ]
. V případě, že {Xt }
• Odhad autokorelace, nebo-li výběrová autokorelace se spočte PT (Xt − X)(Xt−l − X) %ˆl = t=l+1 , PT 2 t=1 (Xt − X) kde l je zpoždění, T je počet pozorování časové řady a X je průměr hodnot časové řady.
Úkoly 1. Upravte definici kovariance do tvaru: Cov[X, Y ] = E[XY ] − E[X]E[Y ]. 2. Odhadněte kovarianci a korelaci mezi log výnosy S&P500 a log výnosy Microsoftu. 3. Odhadněte autokorelaci log výnosů S&P500 pro l = 1, 2, 3, 4, 5. Testujte zda je autokorelace statisticky významná. 4. Odhadněte autokorelaci ceny Microsoftu pro l = 1, 2, 3, 4, 5. 5. Definujte stacionaritu stochastického procesu 6. Určete (odvoďte) autokovarianci a autokorelaci pro stochastický proces log výnosů daný rovnicí (1) v sekci 5. 3
4
Regrese 1. Regrese napříč výnosovou křivkou v modelu Diebold-Li je dána rovnicí 1 − e−λτ 1 − e−λτ + β3t − e−λτ , yt (τ ) = β1t + β2t λτ λτ přičemž λ je zafixována na hodnotě 0, 0609. Odhadněte β1t , β2t , β3t metodou nejmenších čtverců pro první pozorování, tj k 31.01.1985. 2. Capital Asset Pricing Model (CAPM) říká následující: E[ri ] − rf = βi (E[rm ] − rf ), kde ri je výnos akcie i, rf je bezriziková úroková sazba, rm je výnos market portfolia i ,r m ] i m dělená rozptylem r m ). Model zapíšeme jako a βi = Cov[r Var[rm ] (kovariance mezi r a r regresní model rti − rf = αi + βi (rtm − rf ) + εt , t = 1, . . . , T, kde ε je náhodný šok nekorelovaný s rm (představuje nesystematické, idiosynkratické nebo také diverzifikovatelné riziko). Porovnáním obou rovnic je zřejmé, že CAPM implikuje αi = 0 (testujeme standardním t-testem). αi je také označováno jako Jensenovo α, viz http://en.wikipedia.org/wiki/Jensen’s alpha.
Úkoly (a) Testujte CAPM pro Microsoft, nebo-li proveďte OLS regresy log excess výnosů Microsoftu na log excess výnosech S&P500 (market portfolio). Testujte významnost parametrů αMS a βMS . (b) Proveďte regresi log výnosů Microsoftu na čase, tj. vysvětlující proměnnou je čas, který běží 1, 2, . . . , T (znáte jako lineární deterministický trend). Zhodnoťte použitelnost takového modelu. (c) Proveďte regresi logaritmu ceny Microsoftu na čase. Zhodnoťte použitelnost takového modelu.
5
Naivní stochastický proces: vlastnosti, Monte Carlo simulace
Logaritmický výnos r ceny aktiva je generován procesem rt = α + σεt ,
t = 1, . . .
kde α = 0, 08, σ = 0, 6 a εt je náhodný šok, který nabývá hodnoty hodnoty − 21 s pravděpodobností 0, 5 pro všechny t.
5.1
(1) 1 2
s pravděpodobností 0, 5 a
Teoretické výpočty
1. Očekávanou hodnotu a rozptyl náhodného šoku. 2. Očekávanou hodnotu, rozptyl a volatilitu log-výnosu. 3. Očekávanou hodnotu ceny aktiva v čase t podmíněnou znalostí Pt−1 , tj. Pt za podmínky Pt−1 = 80 Kč. Poznámka: Uvědomte si, že logaritmický výnos znamená Pt = Pt−1 ert . 4. Vyjádřete Pt pomocí α, σ, procesu {εt , t = 1, 2, . . . , t} a P0 (což je nenáhodná cena aktiva v čase 0). 4
5.2
Monte Carlo simulace procesu
Simulace najdete v listu NaivniProces. 1. Simulujte náhodné šoky pro 1000 period a následně generujte proces výnosu {rt , t = 1, . . . , 1000}. 2. Ze simulovaných hodnot odhadněte očekávanou hodnotu a rozptyl náhodného šoku a logvýnosu a porovnejte je s teoretickými hodnotami, které jste určili výše. 3. Sestavte 95% konfidenční interval (interval spolehlivosti) pro očekávanou hodnotu šoku a log-výnosu.
5.3
Úprava parametrů
Hodnoty parametrů α a σ jsou nastaveny tak, že implikují roční očekávaný výnos a roční volatilitu běžně pozorovanou na americkém trhu. To znamená, že perioda modelu je jeden rok, a simulovali jste tak proces na 1000 let. 1. Upravte α a σ tak, aby očekávaný výnos a volatilita výnosu odpovídala odhadu výnosu a odhadu volatility, kterou získáme z měsíční časové řady Exxon Mobile. Konkrétně pozob t ] = 0, 00309 a σ rujeme E[r br = 0, 052. 2. Simulujte log-výnosy s upravenými parametry. 3. Simulujte proces ceny akcie {Pt , t = 1, . . . , 240}, tj. na 20 let, přičemž P0 = 40, 8 USD. Vykreslete graf procesu ceny (v Excelu je připraveno 5 replikací) a porovnejte s pozorovanou cenou Exxon mobile.
6
Vlastnosti střední hodnoty, rozptylu a kovariance 1. Zopakujte si definici očekávané hodnoty pro diskrétní a spojitou náhodnou veličinu. Argumentujte (ukažte), že očekávaná hodnota je lineární operátor, tj. platí: (a) E[a + bX] = a + bE[X], kde a, b ∈ R 2. Ukažte, že platí: (a) Var[a + bX] = b2 Var[X], kde a, b ∈ R (b) Cov[a + bX, c + dY ] = bdCov[X, Y ], kde a, b, c, d ∈ R 3. Ukažte, že platí Var[X + Y ] = Var[X] + Var[Y ] + 2Cov[X, Y ]. (Využijte např. výpočtové tvary rozptylu a kovariance, tj. Var[X] = E[X 2 ]−E[X]2 a Cov[X, Y ] = E[XY ]−E[X]E[Y ].)
7 7.1
Stacionární modely ARMA Odhad a implementace modelu AR(p)
V listu SDD najdete spotové sazby český státních domácích dluhopisů (SDD). Sazby jsou odhadnuté z tržních cen SDD, 5Y označuje maturitu 5 let, 1M označuje maturitu 1 měsíc, 6M 5
6 měsíců. 1. Vyberte vhodný model pro sazbu 5Y pro měsíční časovou řadu. • Potřebujeme v modelu konstantu? • Co říkají odhady ACF a PACF? • Testy významnosti parametrů vybraného modelu. • Analýza reziduí (předpoklad normality, autokorelace). 2. Zřejmě dospějete k modelu AR(1) s konstantou. 3. Model odhadněte jako regresní přímku v Excelu nebo EViews a porovnejte s výstupem, kdy do EViews zadáte jako AR(1), tj. 5Y c ar(1). 4. V Excelu zkonstruujte pro odhadnutý model řadu reziduí a porovnejte s EViews. 5. V Excelu vypočtěte předpovědi pro 1.10.1999 (první pozorování) na následujících 120 měsíců a zakreslete do grafu. Předpovědi jsou dány jako podmíněné střední hodnoty, viz sekce 7.2. Konkrétně předpověď na jedno období Xt (1) = E[Xt+1 |Xt ] = α + φXt a obecně pro h období Xt (h) = E[Xt+h |Xt ] = α
1 − φh + φh Xt . 1−φ
K čemu konverguje předpověď pro h jdoucí k nekonečnu? 6. Sazbu 5Y simulujte na příštích 30 let a porovnejte průměr a rozptyl simulací s nepodmíněnou střední hodnotou a rozptylem, které odvodíte níže. 7. Testujte stacionaritu úrokových sazeb pomocí DF testů (EViews: Unit Root Test) . 8. Určete interval spolehlivosti pro odhadnuté parametry (EViews: Coefficient Diagnostics).
7.2
Práce s modelem AR(1)
Model AR(1) je dán rovnicí Xt = α + φXt−1 + at ,
X0 = x,
(2)
kde at je gausovský proces bílého šumu s rozptylem σa2 a X0 = x je počáteční deterministická podmínka. 1. Určete podmíněnou střední hodnotu a podmíněný rozptyl modelu AR(1) 2. Určete nepodmíněnou střední hodnotu modelu AR(1) a označte ji jako µ. 3. Ukažte, že model AR(1), můžete také zapsat jako (Xt − µ) = φ(Xt−1 − µ) + at ,
X0 = x.
4. Vyřešte stochastickou diferenční rovnici (2). Řešte rekurentně a vyjádřete Xt jako explicitní funkci času, počáteční hodnoty x, parametrů modelu a procesu bílého šumu. 5. Určete podmínku za které bude proces Xt stacionární. Zdůvodněte. 6
6. Určete nepodmíněný rozptyl modelu AR(1). 7. Určete nepodmíněnou autokovarianci a autokorelaci modelu AR(1) a zakreslete do grafu jako funkci zpoždění l. Porovnejte s korelogramem, který jste získali pro úrokovou sazbu sazbu 5Y výše. 8. Pomocí Monte Carlo simulací zkoumejte vliv parametrů α, φ a σa2 na chování modelu.
7.3
Model MA(1)
Model MA(1) je dán rovnicí Xt = α + θat−1 + at ,
X0 = x,
(3)
kde at je gausovský proces bílého šumu s rozptylem σa2 a X0 = x je počáteční deterministická podmínka. 1. Určete podmíněnou střední hodnotu a podmíněný rozptyl modelu MA(1) 2. Určete nepodmíněnou střední hodnotu modelu MA(1). 3. Určete podmínku za které bude proces MA(1) stacionární. Zdůvodněte. 4. Určete nepodmíněný rozptyl modelu MA(1). 5. Určete nepodmíněnou autokovarianci a autokorelaci modelu MA(1) a zakreslete do grafu jako funkci zpoždění l.
8
Nestacionární modely.
8.1
Model náhodné procházky (Random Walk)
Nestacionární model RW je dán jako Xt = α + Xt−1 + at ,
X0 = x,
(4)
kde α se označuje jako drift modelu, at je gausovský proces bílého šumu s rozptylem σa2 a X0 = x je počáteční deterministická podmínka. 1. Vyjádřete Xt jako explicitní funkci času, počáteční hodnoty x, parametru α a procesu bílého šumu. 2. Určete střední hodnotu podmíněnou počáteční podmínkou, tj. E[Xt |x]. 3. Určete rozptyl podmíněný počáteční podmínkou, tj. Var[Xt |x]. 4. Vysvětlete proč je model nestacionární. 5. Určete autokorelaci o zpoždění l. 6. Simulujte proces RW.
7
Model RW je základním modelem pro modelování ceny aktiva (akcie). Ukažte, že pokud předpokládáme, že logaritmický výnos je proces rt = α + at , potom logaritmus ceny aktiva, pt = ln Pt , sleduje RW s driftem α, a cena aktiva v čase t je t X Pt = P0 exp αt + aj . j=1
Ve spojitém čase znáte tento proces jako geometrický Brownův pohyb.
8.2
Trendově stacionární versus Random Walk s driftem
Porovnejte model náhodné procházky s driftem a trendově stacionární model. RW s driftem: Xt = α + Xt−1 + at ,
X0 = x
Trendově stacionární: Xt = x + αt + at . 1. Určete střední hodnotu (v případě RW podmíněnou počáteční podmínkou X0 = x, viz 8.1). 2. Určete rozptyl (v případě RW podmíněný počáteční podmínkou X0 = x, viz 8.1). Proč je RW nestacionární a trendově stacionární model je po odstranění deterministického trendu stacionární? 3. Porovnejte MC simulace obou procesů. 4. Model RW se stacionarizuje pomocí prvních diferencí: ∆Xt = Xt − Xt−1 = α + at . Model trendově stacionární pomocí lineární trendové regrese (znáte ze základníko kurzu). V případě, že použijeme první diference na trendově stacionární model dostaneme: ∆Xt = Xt − Xt−1 = α − at−1 + at . O jaký model je jedná? Jaká bude autokorelační struktura ∆Xt ?
9
Identifikace a odhad modelů ARIMA
9.1
Simulované časové řady
V listu MCData najde simulované časové řady z třídy modelů ARIMA. 1. Pokuste se určit procesy (AR, MA, ARMA, RW), z kterých byly časové řady simulovány. (a) Nejprve rozhodněte o stacionaritě: průběh ACF, DF testy. A případně proveďte potřebnou transformaci. (b) Zvolte vhodný ARMA model: ACF, PACF, hladiny významnosti (p-values) odhadů, R-squared, Akaike a Schwartz kriteria. (c) Analyzujte rezidua: JB test normality, přítomnost autokorelace (Ljung-Box). 2. Sledujte směrodatné chyby odhadu parametrů a vytvořte intervaly spolehlivosti pro odhady. 8
9.2
Reálné časové řady
V listu RealData najde 1) čtvrtletní časovou řadu US GDP, 2) měsíční časovou řadu ceny akcie ČEZ a 3) denní časovou řadu SP500. 1. Analyzujte řadu a testujte stacionaritu. 2. Navrhněte vhodný model. 3. Ověřte vhodnost modelu.
10 10.1
A
Zdánlivá regrese, Vektorová autoregrese, Kointegrace Zdánlivá regrese (Spurious Regression)
Testování hypotéz Možné situace při statistickém testování hypotéz skutečnost rozhodnutí H0 platí H0 neplatí zamítnutí H0 chyba prvního druhu OK α = P (t ∈ W |H0 platí) nezamítnutí H0 OK chyba druhého druhu β = P (t ∈ V |H0 neplatí)
Chyba I. druhu Chybné zamítnutí platné H0 , P (t ∈ W |H0 platí) = α. Chyba II. druhu Nezamítnutí neplatné H0 , P (t ∈ V |H0 neplatí) = β. Síla testu Správné zamítnutí neplatné H0 , P (t ∈ W |H0 neplatí) = 1 − β. p-value Dosažená hladina testu, tj. nejmenší hladina významnosti α, při které bychom ještě hypotézu zamítli. Je-li p-value < α, potom zamítáme H0 . Je-li p-value > α, potom H0 nezamítáme.
9