7th International Scientific Conference Managing and Modelling of Financial Risks VŠB-TU of Ostrava, Faculty of Economics, Finance Department
Ostrava 8th – 9th September 2014
Money - Models of "Time" and Distance Between Risk Events František Vávra, Patrice Marek 1 Abstract When doing risk management it is necessary to use some effective method that determines times or otherwise measured distances between risk events. Current probability models usually work with an exponential distribution of times between risk events. This is connected with Poisson distribution of a number of events until a given time. In some cases, this approach offers results that are not acceptable. This paper deals with models that use connection between a distribution of number of events until a given time (or otherwise measured distance) and a distribution of a time (distance) between consecutive events. The main goal of this paper is a demonstration of a fact that time in given models can be substituted by another quantity that have similar “cumulative” properties. The procedure based on nonparametric models of distribution functions is presented. Key words Time to failure, renewal processes, time turnover analogy, balance of payments JEL classification: C10, G32
1. Úvod V klasických modelech časových následností rizikových událostí (Aven a Jensen, 1999) je základní veličinou standardní fyzikální čas vyjádřený tím či oním zavedeným kalendářem. Samo odvození základních vtahů a pojmů nepotřebuje všechny atributy fyzikálního času. Pro modelování jsou důležité obecnější pojetí času následujících vlastností: jedná se o kladnou veličinu a jedná se o v čase neklesající veličinu2, viz (Aven a Jensen, 1999). To splňují i některé „nečasové“ ekonomické veličiny. Jako příklad lze uvést hodnoty na účtech „311 – Pohledávky z obchodních vztahů, strana MD“ a „321 – Závazky z obchodních vztahů, strana D“ v době od otevření do uzavření účtů3. Jiným příkladem mohou být „strany“ dílčích ukazatelů platební bilance státu (Česká národní banka, 2014). Dalším možným využitím je modelování poruchových stavů v závislosti na „produkci“. Např. u automobilu je „vzdálenost“ poruch v relaci k ujetému počtu kilometrů. Podobných příkladů lze nalézt celou řadu.
1
Doc. Ing. František Vávra, CSc.,
[email protected], Katedra matematiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni, Univerzitní 22, 306 14 Plzeň. Ing. Patrice Marek, PhD.,
[email protected], NTIS – Nové technologie pro informační společnost, Fakulta aplikovaných věd, Západočeská univerzita v Plzni, Univerzitní 22, 306 14 Plzeň. 2 Pro fyzikální nebo kalendářový čas se v definičním zobrazení jedná o identitu. 3 Za předpokladu, že v účetnictví nejsou chyby „opravované odečtením“. 850
7th International Scientific Conference Managing and Modelling of Financial Risks VŠB-TU of Ostrava, Faculty of Economics, Finance Department
Ostrava 8th – 9th September 2014
2. Model 2.1 Klasický časový model Mějme nezáporné náhodné veličiny T1 , T2 ,... , ne nutně nezávislé, ne nutně stejně rozdělené. Tyto veličiny, v klasickém pojetí, modelují časy mezi (rizikovými) událostmi. Někdy vzniká problém s interpretací T1 . Budeme předpokládat, že se jedná o čas od některé referenční n
(nulové) události do události, kterou budeme považovat za první. Dále označíme Sn Ti , i 1
čas, který uplyne od referenční události do nté události. Využijeme také (čítací) veličinu N t maxn : Sn t, která reprezentuje počet událostí, které nastaly po nulté (referenční) události až do času t . V dalším textu budeme užívat následující „modelové symboliky“:
FTi x PTi x je distribuční funkce náhodné veličiny Ti a
Fn x PSn x je distribuční funkce náhodné veličiny Sn .
Při tomto označení a za uvedených předpokladů pak platí
PN t n Fn t Fn 1 t a
(1)
PN t 0 F0 t F1t ,
(2)
kde F0 t 1 t 0 a F0 t 0 t 0 , F1 t FT1 t a dále
EN t Fi t .
(3)
i 1
Důkazy lze nalézt např. v (Aven a Jensen, 1999). Odtud triviálně plyne:
PN t n Fn t ,
(4)
PN t 0 1 t 0 a
(5)
PN t 0 0 t 0 .
(6)
i n
i n
Důkaz: PN t n PN t i Fi (t ) Fi 1 (t ) Fn (t ) . Za výše uvedených předpokladů, je problémem zjistit Fn x PSn x , pokud budou
T1 , T2 ,... nezávislé, pak Fn 1 t Fn t z f n 1 z dz; n 0,1,... , kde fn z je hustota náhodné 0
proměnné Tn . Odvození této konvoluce lze nalézt např. v (Rényi, 1972). Konvoluce je dnes již poměrně dobře numericky zvládnutelná. Statistické postupy nám dávají i jiný prostředek pro odhady Fn1 t . Zde musíme ale předpokládat, že máme k dispozici dostatečně velké náhodné výběry z veličin T1 , T2 ,... Označíme ti , j ; j 1,..., ni , kde ti , j je jtý prvek náhodného výběru z náhodné veličiny Ti a ni je rozsah tohoto výběru, tj. počet pozorování náhodné proměnné T . Pak poměrně kvalitním odhadem (ozn. Fˆ t ) distribuční funkce F t bude k 1
i
851
k 1
7th International Scientific Conference Managing and Modelling of Financial Risks VŠB-TU of Ostrava, Faculty of Economics, Finance Department
1 nk 1 ˆ Fˆk 1 t Fk t tk 1,i . nk 1 i 1
Ostrava 8th – 9th September 2014
(7)
Odvození tohoto vztahu, založené na neparametrických jádrových odhadech hustot s Parzenovým (obdélníkovým) jádrem (viz Devroye a Györfi, 1985), včetně vlastností a kvality lze nalézt v (Ťoupal, 2014). Elegantnější tvar vzorce (7) dostaneme pro T1 , T2 ,... , které jsou nezávislé a zároveň stejně rozdělené. Pak pro takový náhodný výběr t j ; j 1,..., m
1 m platí Fˆk 1 t Fˆk t ti . Oba dva vztahy mají své vlastnosti odvozené od operace, kterou m i 1 jsou tvořeny, tj. od průměru. Praktické využití vztahu (7) omezuje potřeba mít náhodné výběry z každé „časové“ proměnné Ti . To lze v některých úlohách nahradit postupy stacionarizace pozorovaných dat. Jedna z možností bude uvedena dále. 2.2 Obecnější model „Náhrada“ času jinou veličinou má dvě základní skupiny. První, události jsou jak v klasickém čase, tak i v dané veličině od sebe náhodně vzdáleny. Příkladem může být počet ujetých kilometrů u automobilu mezi poruchami daného typu. Náhodnost je zde jak v čase mezi poruchami, tak i v počtu ujetých kilometrů mezi poruchami. Druhá skupina je tvořena takovými modely, u kterých jsou události v čase determinovány, ale jejich vzdálenosti měřené jinou veličinou jsou, v této měřené veličině, náhodné. Jako příklad můžeme uvést některé, dílčí, údaje platební bilance. Takovou konkrétní úlohou se budeme zabývat detailněji dále. Za události budeme považovat konce „sledovacích“ období (měsíc, čtvrtletí, rok, …). Evidentně jejich vzdálenosti měřené časem jsou determinovány. Jejich vzdálenosti měřené měsíčním „obratem daného údaje“ mají pak náhodný charakter. Problém je znázorněn následujícím obrázkem. Obrázek 1: Obchodní bilance vývozu roku 2012. Jednotlivé události jsou konce měsíců. Vzdálenosti mezi nimi jsou měsíční hodnoty vývozu v mld. CZK. Referenční událost je konec prosince předchozího roku.
Problematika daných „záměn“ není ani tak v základní statistické a pravděpodobnostní teorii, ale ve správných interpretacích a formulacích pro aplikační oblast. 2.3 Příklad využití Předchozí teorii budeme demonstrovat na položce „Obchodní bilance – vývoz“ v mld. CZK a její časové řadě (2003/01 – 2014/05, měsíční údaje). Průběh této položky je zobrazen na následujícím obrázku.
852
7th International Scientific Conference Managing and Modelling of Financial Risks VŠB-TU of Ostrava, Faculty of Economics, Finance Department
Ostrava 8th – 9th September 2014
Obrázek 2: Obchodní bilance vývozu v mld. CZK, měsíční hodnoty, na ose X je čas měřený v měsících
Evidentně se jedná o nestacionární veličinu a proto je namístě využití některé transformace, která takovou nestacionaritu v přijatelné míře kompenzuje. Jednou z možností je model t středního objemového a měnového růstu (inflace, kurzy, …) ve tvaru Y t Y0 1 m , kde t je klasický čas v měsících, m je střední meziměsíční růst (index), Y0 je střední hodnota veličiny na počátku sledování (zde 2003/01). Logaritmováním byla úloha převedena na úlohu lineární regrese. Výsledné parametry byly m=0,49 %, tomu odpovídá meziroční (p. a.) růst 5,99 % a Y0=123. Průběh vlastní veličiny a jemu odpovídající růstová čára jsou na následujícím obrázku 3. Obrázek 3: Obchodní bilance vývozu a odpovídající růstová čára, v mld. CZK, měsíční hodnoty, na ose X je čas měřený v měsících
Tomuto pojetí odpovídá zpětná transformace na „hladinu“ počátku (zde na 2003/01). Ta bude X t X ' t . Údaj po transformaci je na obrázku 4. 1 mt
853
7th International Scientific Conference Managing and Modelling of Financial Risks VŠB-TU of Ostrava, Faculty of Economics, Finance Department
Ostrava 8th – 9th September 2014
Obrázek 4: Obchodní bilance vývozu, transformováno k 2003/01, v mld. CZK, měsíční hodnoty, na ose X je čas měřený v měsících
Tento průběh je již vhodnější pro statistickou inferenci. Uvedený stacionarizační postup je patrně nejjednodušším z několika možných postupů. Dokonalejší lze nalézt např. v (Ťoupal, 2013). Transformovaná data umožňují poměrně snadno nalézt parametrický nebo neparametrický model FX ' x P X1' x ; X1' X1 (užito označení X1 pro hodnotu údaje 1
v prvním období a Xi v itém období, jedná se o analogie T1 a Ti v v modelech s fyzikálním časem). Taková empirická distribuční funkce (EDF) a modelová normální (gaussovská) distribuční funkce (MDF) jsou na obrázku 5. Obrázek 5: Empirická a modelová distribuční funkce obchodní bilance – vývoz, v mld. Kč po korekci k počátku roku 2003
Transformací k počátku (pro možnost statistické inference), došlo ke zkreslení hodnot a pravděpodobnostních modelů v dalších obdobích. Proto následuje „zpětná“ transformace: x FX i1 x FX i ; FX 1 x FX 1' x . Odtud lze bez problémů odvodit transformace 1 m 854
7th International Scientific Conference Managing and Modelling of Financial Risks VŠB-TU of Ostrava, Faculty of Economics, Finance Department
Ostrava 8th – 9th September 2014
ostatních modelových popisů (hustota, …) a parametrů (střední hodnota, rozptyl, …). To je demonstrováno na obrázku 6. Obrázek 6: Modelové distribuční funkce – zpětná transformace distribučních funkcí, ukázka FX 1 , FX 6 , FX 1 2 pro obchodní bilanci vývozu korigovanou na počátek roku 2003
Ze základních pozorování x1' , x2' ,..., xN' korigovaných k počátku roku 2003 lze vytvořit odhady n
pravděpodobnostních modelů kumulací Sn X i takto i 1
n 1 1 N n Fn 1 x PSn 1 x P X i x Fn x 1 m xi' . i 1 N j 1 Jejich příklady jsou na obrázku 7. Obrázek 7: Modelové distribuční funkce – příklady distribučních funkcí pro kumulace od počátku, ukázka F1, F2 , F6 , F12 pro obchodní bilanci vývozu korigovanou na počátek roku 2003
855
(8)
7th International Scientific Conference Managing and Modelling of Financial Risks VŠB-TU of Ostrava, Faculty of Economics, Finance Department
Ostrava 8th – 9th September 2014
Příklady a interpretace PN t n, přesněji PN x n Obrázek 8:Příklady pravděpodobností dosažení počtu
Výraz P( N ( x) 0) znamená, jaká je pravděpodobnost toho, že neuplyne ani jeden celý měsíc od počátku, pokud byla celková hodnota (v tomto případě) obchodní bilance – vývoz rovna x . Analogicky P( N ( x) 6) je pravděpodobnost toho, že uplyne celých šest měsíců (po šesti a před koncem sedmého) od počátku, pokud byla celková hodnota (v tomto případě) obchodní bilance – vývoz rovna x . Obdobně lze modelů tohoto typu využívat ke konstrukci předpovědí toho, jak se sledovaný údaj bude vyvíjet v blízké následující době. Příklad pro předpověď na rok 2014 počítaná z dat od počátku roku 2003 do konce roku 2013 je na obrázku 9. Obrázek 9: Obchodní bilance vývozu – předpověď na rok 2014 počítaná z dat 2003 až 2013 (meze ve vzdálenosti tří směrodatných odchylek), srovnání se známou skutečností
856
7th International Scientific Conference Managing and Modelling of Financial Risks VŠB-TU of Ostrava, Faculty of Economics, Finance Department
Ostrava 8th – 9th September 2014
3. Závěr V předchozím textu jsme se pokusili ukázat, že klasický „rizikový“ aparát dob mezi událostmi lze využít i pro jiné veličiny (údaje). Ve spojení s vhodnými statistickými prostředky stacionarizace a parametrického nebo neparametrického modelování, dostáváme prakticky přijatelné výsledky. Prezentovaná metodika je vhodná pro celou, poměrně širokou, třídu kumulačních procesů nad nezápornými veličinami. Další rozvoj této metodologie je možný v mnoha směrech. Jedním, je využití aparátu „intenzit poruch“, dalším, ne posledním, zobecnění i pro veličiny, které před kumulací mohou být záporné.
Literatura [1]
Aven T., Jensen U., (1999). Stochastic Models in Reliability. Springer-Verlag, New York, Inc.
[2]
Devroye L., Györfi L., (1985). Nonparametric Density Estimation, the L1 view. John Wiley & Sons, Inc.
[3]
Platební bilance – měsíční. Česká národní banka [online]. 2014 [cit. 2014-08-04]. Dostupné z: http://www.cnb.cz/cs/statistika/platebni_bilance_stat/platebni_bilance_m/index.html
[4]
Rényi A., (1972). Teorie pravděpodobnosti. ACADEMIA, Praha.
[5]
Ťoupal T., (2013). Neparametrický odhad spolehlivosti a odhad trendové složky. Disertační práce. ZČU v Plzni, Fakulta aplikovaných věd.
857