Univerzita Karlova v Praze Matematicko-fyzik´aln´ı fakulta
´ PRACE ´ DIPLOMOVA
Ludmila Obdrˇz´alkov´a Modelov´ an´ı v´ yˇ se ˇ skod v ˇ case pomoc´ı kopul Katedra pravdˇepodobnosti a matematick´e statistiky
ˇ ab, Ph.D. (Kooperativa) Vedouc´ı diplomov´e pr´ace: Mgr. Jan Sv´ Studijn´ı program: Matematika, Finanˇcn´ı a pojistn´a matematika
2009
Na tomto m´ıstˇe bych r´ada podˇekovala vedouc´ımu diplomov´e pr´ace Mgr. Janu ˇ abovi, PhD. za cenn´e rady, pˇripom´ınky a za vstˇr´ıcn´ Sv´ y pˇr´ıstup pˇri psan´ı t´eto ’ diplomov´e pr´ace. M˚ uj d´ık d´ale patˇr´ı pojiˇst ovnˇe Kooperativa za poskytnut´a data k v´ ypoˇct˚ um. A v neposledn´ı ˇradˇe m´ ym rodiˇc˚ um, rodinˇe a pˇr´atel˚ um za podporu a trpˇelivost, kterou mi bˇehem psan´ı t´eto pr´ace vˇenovali.
Prohlaˇsuji, ˇze jsem svou diplomovou pr´aci napsala samostatnˇe a v´ yhradnˇe s pouˇzit´ım citovan´ ych pramen˚ u. Souhlas´ım se zap˚ ujˇcov´an´ım pr´ace a jej´ım zveˇrejˇ nov´an´ım. V Praze dne 10.7.2009
Ludmila Obdrˇz´alkov´a
2
Obsah ´ Uvod
5
1 Kopuly 1.1 Definice . . . . . . . . . . . . 1.2 Sklarova vˇeta . . . . . . . . . 1.3 Vlastnosti kopul . . . . . . . . 1.4 M´ıry z´avislosti . . . . . . . . . 1.5 Z´akladn´ı rodiny kopul . . . . 1.5.1 Gaussova kopula . . . 1.5.2 Studentova t kopula . 1.5.3 Fr´echetova rodina . . . 1.5.4 Archim´edovsk´e kopuly
. . . . . . . . .
. . . . . . . . .
7 7 8 9 10 13 13 13 14 15
2 Modelov´ an´ı v´ yˇ se ˇ skod, v´ ypoˇ cet rozdˇ elen´ı IBNR rezervy 2.1 Vstupn´ı data . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Urˇcen´ı margin´aln´ıch rozdˇelen´ı . . . . . . . . . . . . . . . . 2.3 V´ ybˇer kopuly . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Simulace . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Urˇcen´ı poˇctu vznikl´ ych ˇskod . . . . . . . . . . . . . . . . . 2.6 Urˇcen´ı poˇctu nenahl´aˇsen´ ych ˇskod . . . . . . . . . . . . . . 2.7 V´ ypoˇcet rozdˇelen´ı IBNR rezervy . . . . . . . . . . . . . . .
. . . . . . .
19 19 21 24 28 30 40 41
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
Z´ avˇ er
45
Literatura
47
3
N´ azev pr´ ace: Modelov´an´ı v´ yˇse ˇskod v ˇcase pomoc´ı kopul Autor: Ludmila Obdrˇz´alkov´a Katedra: Katedra pravdˇepodobnosti a matematick´e statistiky Vedouc´ı diplomov´ e pr´ ace: ˇ ab, Ph.D., Kooperativa pojiˇst’ovna, a.s., VIG Mgr. Jan Sv´ E-mail vedouc´ıho:
[email protected] Abstrakt: V pˇredloˇzen´e pr´aci je navrˇzen a pops´an stochastick´ y pˇr´ıstup v´ ypoˇctu IBNR rezervy zaloˇzen´ y na modelov´an´ı v´ yˇs´ı ˇskod v ˇcase pomoc´ı kopul. Prvn´ı kapitola vymezuje z´akladn´ı pojmy teorie kopul a d´av´a ucelen´ y pˇrehled o jejich nejzn´amˇejˇs´ıch rodin´ach. Druh´a kapitola se vˇenuje jednotliv´ ym krok˚ um v´ ypoˇctu IBNR rezervy. V´ ypoˇcet je demonstrov´an numericky na datech havarijn´ıho pojiˇstˇen´ı. V´ ysledn´e rozdˇelen´ı je porovn´ano s rozdˇelen´ım z´ıskan´ ym z Mackova modelu pro metodu Chain ladder. Kl´ıˇ cov´ a slova: kopula, Archim´edovsk´a kopula, IBNR rezerva, zobecnˇen´e line´arn´ı modely
Title: Modelling the Loss Development in Time with Aid of Copulas Author: Ludmila Obdrˇz´alkov´a Department: Department of Probability and Mathematical Statistics Supervisor: ˇ ab, Ph.D., Kooperativa pojiˇst’ovna, a.s., VIG Mgr. Jan Sv´ Supervisor’s e-mail address:
[email protected] Abstract: There is proposed and described stochastic approach of calculation of IBNR reserve based on modelling loss development in time using copulas in this thesis. The first chapter determinates basic terms of copula theory and gives compact summary of most widely known copula families. Particular steps of calculation of IBNR reserve follow in the second chapter. The calculation is demonstrated numerically over the casco insurance. The resultant distribution is compared with distribution obtained by Mack’s model for the Chain ladder method. Keywords: copula, Archimedean copula, IBNR reserve, general linear models
4
´ Uvod Z´akonnou povinnost´ı kaˇzd´e pojiˇst’ovny je vytv´aˇret technick´e rezervy v takov´e v´ yˇsi, aby byla schopn´a dost´at z´avazk˚ um vypl´ yvaj´ıc´ıch z pˇrevzat´ ych rizik. Jednou z povinn´ ych rezerv je i rezerva na pojistn´a plnˇen´ı (nˇekdy naz´ yvan´a ˇskodn´ı rezervou). Rezerva na pojistn´a plnˇen´ı m´a jak v ˇzivotn´ım, tak v neˇzivotn´ım pojiˇstˇen´ı dvˇe hlavn´ı sloˇzky: rezervu na pojistn´a plnˇen´ı z pojistn´ ych ud´alost´ı do rozvahov´eho dne nahl´aˇsen´ ych, ale doposud nezlikvidovan´ ych (reported but not settled, RBNS), a rezervu na pojistn´a plnˇen´ı z pojistn´ ych ud´alost´ı, kter´e nastaly do rozvahov´eho dne, ale doposud nebyly nahl´aˇseny (incurred but not reported, IBNR). V´ yˇse IBNR rezervy se ˇcasto stanovuje pomoc´ı metod pracuj´ıc´ıch s v´ yvojov´ ymi troj´ uheln´ıky (napˇr. metodou Chain ladder). C´ılem t´eto pr´ace ovˇsem bude navrhnout a popsat stochastick´ y pˇr´ıstup stanoven´ı IBNR rezervy zaloˇzen´ y na modelov´an´ı v´ yˇse ˇskod v ˇcase pomoc´ı kopul. Kopuly jsou n´astrojem, kter´ y slouˇz´ı ke konstrukci sdruˇzen´ ych distribuˇcn´ıch funkc´ı z jejich distribuˇcn´ıch funkc´ı margin´aln´ıch. To vˇse pˇri zachov´an´ı z´avislostn´ı struktury. Ve finanˇcn´ı a pojistn´e matematice se kopuly zaˇcaly pouˇz´ıvat hlavnˇe v posledn´ım desetilet´ı a i za tuto kr´atkou dobu naˇsly velk´e mnoˇzstv´ı uplatnˇen´ı. Napˇr. Frees a Valdez [2] pouˇzili kopuly k modelov´an´ı v´ yˇs´ı ˇskod a likvidaˇcn´ıch n´aklad˚ u a n´aslednˇe uk´azali, jak pomoc´ı odhadnut´e kopuly spoˇc´ıst v´ yˇsi zajistn´eho; Cherubini [4] pouˇzil kopuly k oceˇ nov´an´ı opc´ı a Pettere a Kollo [10], jejichˇz ˇcl´anek byl podnˇetem pro vznik t´eto pr´ace, pouˇzili kopuly k modelov´an´ı ˇskodn´ı rezervy lotyˇssk´e pojiˇst’ovny. V prvn´ı kapitole se sezn´am´ıme s teori´ı kopul, od definice pojmu, z´akladn´ıch vlastnost´ı, aˇz po pˇr´ıklady bˇeˇznˇe pouˇz´ıvan´ ych kopul. D˚ uraz bude kladen na Archim´edovsk´e kopuly. V druh´e kapitole se jiˇz budeme vˇenovat stanoven´ı v´ yˇse IBNR rezervy. Kapitola bude rozˇclenˇena do sedmi ˇc´ast´ı koresponduj´ıc´ıch s jednotliv´ ymi kroky n´ami n´avrˇzen´eho postupu. V prvn´ıch dvou ˇc´astech se sezn´am´ıme s modelovan´ ymi dvourozmˇern´ ymi daty (v´ yˇse ˇskody a doba mezi vznikem a nahl´aˇsen´ım ˇskody) a urˇc´ıme jejich margin´aln´ı rozdˇelen´ı. Tˇret´ı ˇc´ast bude vˇenov´ana identifikaci Archim´edovsk´e kopuly, kter´a nejl´epe popisuje zkouman´a data. Z t´eto kopuly budou ve ˇctvrt´e ˇc´asti nasimulov´any v´ yˇse ˇskod odpov´ıdaj´ıc´ı dan´ ym zpoˇzdˇen´ım v nahl´aˇsen´ı. V p´at´e ˇc´asti se budeme vˇenovat
5
poˇct˚ um vznikl´ ych ˇskod. K odhadu parametr˚ u jejich rozdˇelen´ı budou pouˇzity zobecnˇen´e line´arn´ı modely. Postup, kter´ ym z nagenerovan´ ych poˇct˚ u vznikl´ ych ˇskod z´ısk´ame poˇcet ˇskod nenahl´aˇsen´ ych, bude uveden v ˇsest´e ˇc´asti. Z´avˇereˇcn´a sedm´a ˇc´ast pouˇzije v´ ysledky ˇc´ast´ı pˇredchoz´ıch a sezn´am´ı n´as se vzorcem, kter´ y jsme navrhli pro stanoven´ı v´ yˇse IBNR rezervy. Stanoven´a hodnota IBNR rezervy bude porovn´ana s hodnotou z´ıskanou metodou Chain ladder a tak´e s re´aln´ ymi daty. Porovn´ana budou tak´e rozdˇelen´ı IBNR rezervy z´ıskan´a obˇema metodami. K v´ ypoˇct˚ um v t´eto pr´aci bude pouˇzit program Matlab verze 7.1 (R14).
6
Kapitola 1 Kopuly Pojem kopula poch´az´ı z latinsk´eho slova copula, kter´ ym se oznaˇcuje pouto, provaz, ˇremen nebo h´ak. V gramatice je v´ yrazem pro jazykovou sponu.1 V matematick´em v´ yznamu jej poprv´e pouˇzil A. Sklar roku 1959 ve sv´e korespondenci s M. Fr´echetem. Pojmenoval takto funkci spojuj´ıc´ı sdruˇzenou distribuˇcn´ı funkci s jej´ımi jednorozmˇern´ ymi margin´aln´ımi distribuˇcn´ımi funkcemi. Aˇz do roku 1976 byly kopuly zkoum´any hlavnˇe v souvislosti s pravdˇepodobnostn´ımi metrick´ ymi prostory. Teprve pozdˇeji (hlavnˇe v posledn´ım desetilet´ı) se teorie kopul a jejich aplikace zaˇcala pouˇz´ıvat ve financ´ıch a pojiˇst’ovnictv´ı. Pˇrestoˇze jsou kopuly v tomto oboru v poˇc´atc´ıch v´ yzkumu a jeˇstˇe zde existuje mnoˇzstv´ı nedoˇreˇsen´ ych ot´azek, tˇeˇs´ı se st´ale rostouc´ı oblibˇe. Kromˇe financ´ı a pojiˇst’ovnictv´ı naˇsly kopuly uplatnˇen´ı tak´e v teorii rizika, enviroment´aln´ıch studi´ıch (hydrologie, geologie,...) atd. O historii kopul lze v´ıce nal´ezt v [9], [12].
1.1
Definice
V t´eto pr´aci se budeme zab´ yvat pouze dvourozmˇern´ ym pˇr´ıpadem. Definice 1 Kopula je funkce C : [0, 1]2 → [0, 1], pro niˇz plat´ı: 1. C(u, 0) = 0 = C(0, v), ∀u, v ∈ [0, 1]; 2. C(u, 1) = u, C(1, v) = v, ∀u, v ∈ [0, 1]; 3. C(u2 , v2 ) − C(u2 , v1 ) − C(u1 , v2 ) + C(u1 , v1 ) ≥ 0, pro kaˇzd´e u1 , u2 , v1 , v2 z [0, 1] takov´e, ˇze u1 ≤ u2 , v1 ≤ v2 . 1
Definice ze Slovn´ıku lingvistick´ ych term´ın˚ u pro filology (Edvarda Lotka, 2005): kopula = sponov´e sloveso typu b´yt (je, nen´ı), st´ at se vyjadˇruj´ıc´ı v´ıce ˇci m´enˇe jen predikaˇcn´ı vztah mezi subjektem a nomin´aln´ı ˇc´ast´ı predik´atu v kategorick´em soudu, spona.
7
Z definice vypl´ yv´a, ˇze m´ame-li dvojici n´ahodn´ ych veliˇcin (U, V ) s rovnomˇern´ ym rozdˇelen´ım na [0, 1], pak kopula C je jejich sdruˇzenou distribuˇcn´ı funkc´ı: C(u, v) = P (U ≤ u, V ≤ v). Necht’ X a Y jsou n´ahodn´e veliˇciny s distribuˇcn´ı funkc´ı FX resp. FY . FX (X) a FY (Y ) jsou rovnomˇernˇe rozloˇzen´e, tedy FX (X) = U a FY (Y ) = V . Protoˇze kopuly jsou sdruˇzen´e distribuˇcn´ı funkce rovnomˇernˇe rozloˇzen´ ych distribuˇcn´ıch funkc´ı, m˚ uˇzeme snadno uk´azat, ˇze kopula spoˇcten´a v FX (x), FY (y) d´av´a sdruˇzenou distribuˇcn´ı funkci FX,Y (x, y): C(FX (x), FY (y))
1.2
= P (U ≤ FX (x), V ≤ FY (y)) = P (FX−1 (U ) ≤ x, FY−1 (V ) ≤ y) = P (X ≤ x, Y ≤ y) = FX,Y (x, y)
(1.1)
Sklarova vˇ eta
Sklarova vˇeta je jednou z nejd˚ uleˇzitˇejˇs´ıch vˇet teorie kopul. Ukazuje nejenom, ˇze kopuly jsou sdruˇzen´ ymi distibuˇcn´ımi funkcemi (viz vztah (1.1)), ale tak´e, ˇze ke kaˇzd´e sdruˇzen´e distribuˇcn´ı funkci existuje kopula zapsan´a pomoc´ı margin´aln´ıch distribuˇcn´ıch funkc´ı, kter´a zachov´av´a z´avislostn´ı strukturu. Vˇ eta 1 (Abe Sklar, 1959) Necht’ FX,Y je sdruˇzen´a distribuˇcn´ı funkce s margin´aln´ımi distribuˇcn´ımi funkcemi FX a FY . Potom existuje kopula C : [0, 1]2 → [0, 1] takov´a, ˇze FX,Y (x, y) = C(FX (x), FY (y))
(1.2)
pro kaˇzd´e (x, y) ∈ R∗2 . Pokud jsou FX (x), FY (y) spojit´e, kopula je urˇcena jednoznaˇcnˇe. V opaˇcn´em pˇr´ıpadˇe je kopula urˇcena jednoznaˇcnˇe pro kaˇzd´e (x, y) ∈ (obor hodnot FX × obor hodnot FY ). Obr´acenˇe, je-li C kopula a FX , FY jsou margin´aln´ı distribuˇcn´ı funkce, pak funkce FX,Y urˇcen´a vztahem (1.2) je sdruˇzenou distribuˇcn´ı funkc´ı s dan´ymi margin´alami FX a FY . D˚ ukaz:
uveden v [9], str. 21 ¤
D˚ usledek 1 Za platnosti pˇredpoklad˚ u Sklarovy vˇety je (jednoznaˇcn´ a) kopula C urˇcena vztahem C(u, v) = F (FX−1 (u), FY−1 (v)).
8
1.3
Vlastnosti kopul
Zezdola i zeshora je kaˇzd´a kopula omezena Fr´echetovou mez´ı: W (u, v) = max(u + v − 1, 0) ≤ C(u, v) ≤ min(u, v) = M (u, v) kde (u, v) ∈ [0, 1]2 . Doln´ı Fr´echetova mez (tzv. minim´aln´ı kopula) W (u, v) b´ yv´a tak´e oznaˇcov´ana C − . Reprezentuje perfektn´ı negativn´ı z´avislost mezi promˇenn´ ymi. Perfektn´ı pozitivn´ı z´avislost je naopak pˇredstavov´ana horn´ı Fr´echetovou mez´ı (tzv. maxim´aln´ı kopulou) M (u, v), kter´a se tak´e oznaˇcuje C + . Grafick´e zn´azornˇen´ı maxim´aln´ı a minim´aln´ı kopuly je uvedeno na obr´azku 1.1. 1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0 1
0 1 0.5
0.5 0
0
0.2
0.4
0.6
0.8
1 0
0
0.2
0.4
0.6
0.8
1
Obr´azek 1.1: Maxim´aln´ı a minim´aln´ı kopula (zleva). Existence horn´ıch a doln´ıch mez´ı n´as pˇriv´ad´ı k definici konkordaˇcn´ıho uspoˇr´ad´an´ı, kter´e je uspoˇr´ad´an´ım ˇc´asteˇcn´ ym: Definice 2 (Konkordanˇ cn´ı uspoˇ r´ ad´ an´ı) Kopula C1 je menˇs´ı neˇz kopula C2 - p´ıˇseme C1 ≺ C2 , pokud C1 (u, v) ≤ C2 (u, v) pro kaˇzd´e (u, v) ∈ [0, 1]2 . Dalˇs´ı d˚ uleˇzitou vlastnost´ı kopul´ı je, ˇze jsou invariantn´ı v˚ uˇci striktnˇe rostouc´ım transformac´ım n´ahodn´ ych veliˇcin: Vˇ eta 2 (Schweizer & Wolf, 1976, 1981) Necht’ X, Y jsou spojit´e n´ahodn´e veliˇciny s margin´aln´ımi distribuˇcn´ımi funkcemi F1 , F2 a kopulou C. Pokud jsou α1 , α2 striktnˇe rostouc´ı funkce, pak n´ahodn´e veliˇciny α1 (X), α2 (Y ) s margin´aln´ımi distribuˇcn´ımi funkcemi H1 = F1 (α1−1 ), H2 = F2 (α2−1 ) a sdruˇzenou distribuˇcn´ı funkc´ı H H(u, t) = P (α1 (X) ≤ u, α2 (Y ) ≤ t) maj´ı tak´e kopulu C: H(u, t) = C(H1 (u), H2 (t)). 9
Kopuly b´ yvaj´ı ˇcasto naz´ yv´any z´avislostn´ımi funkcemi (poprv´e Deheuvels, 1978). Vztahy mezi kopulami a nˇekter´ ymi m´ırami z´avislosti jsou pops´any v n´asleduj´ıc´ı ˇc´asti t´eto kapitoly. D´ale budeme pˇredpokl´adat, ˇze X a Y jsou spojit´e n´ahodn´e veliˇciny.
1.4
M´ıry z´ avislosti
Nejzn´amˇejˇs´ı m´ırou z´avislosti je Pearson˚ uv korelaˇ cn´ı koeficient: cov(X, Y ) ρX,Y = p var(X)var(Y )
Ten mˇeˇr´ı line´arn´ı z´avislost mezi veliˇcinami. Pearson˚ uv korelaˇcn´ı koeficient nelze vyj´adˇrit pouze pomoc´ı kopuly, protoˇze z´avis´ı i na margin´aln´ım rozdˇelen´ı. Pod´ıvejme se proto na dvˇe jin´e robustnˇejˇs´ı m´ıry z´avislosti, kter´e jdou vyj´adˇrit pouze pomoc´ı kopuly a kter´e jsou nav´ıc invariantn´ı v˚ uˇci striktnˇe rostouc´ı neline´arn´ı transformaci. Jedn´a se o Kendallovo τ a Spearmanovo ρS . Obˇe mˇeˇr´ı z´avislost ve formˇe zvan´e konkordance: Definice 3 Dvˇe pozorov´an´ı (x1 , x2 ), (xe1 , xe2 ) z n´ahodn´eho vektoru (X1 , X2 ) jsou konkordantn´ı pr´avˇe tehdy, kdyˇz q = (x1 − xe1 )(x2 − xe2 ) > 0. Pokud plat´ı obr´acen´a nerovnost, jsou diskordantn´ı. P´ar n´ahodn´ ych veliˇcin je tedy konkordantn´ı, pokud se velk´e (resp. mal´e) hodnoty jedn´e promˇenn´e zpravidla objevuj´ı s velk´ ymi (resp. mal´ ymi) hodnotami druh´e promˇenn´e.
Kendallovo τ je definov´ano jako rozd´ıl mezi pravdˇepodobnost´ı konkordance a pravdˇepodobnost´ı diskordance: τ (X, Y ) = P [(X1 − X2 )(Y1 − Y2 ) > 0] − P [(X1 − X2 )(Y1 − Y2 ) < 0], kde (X1 , Y1 ), (X2 , Y2 ) jsou dva nez´avisl´e vektory se stejn´ ym rozdˇelen´ım, jak´e m´a vektor (X, Y ). Odhad Kendallova koeficientu pro n nez´avisl´ ych pozorov´an´ı (X11 , X21 ), . . . , (X1n , X2n ) z dvourozmˇern´eho n´ahodn´eho vektoru (X, Y ) z´ısk´ame ze vztahu: µ ¶−1 X n τbn = sign [(X1i − X1j ) (X2i − X2j )] , (1.3) 2 i<j kter´ y odpov´ıd´a intuitivn´ı pˇredstavˇe: τb =
# poˇcet konkordantn´ıch p´ar˚ u − # poˇcet diskordantn´ıch p´ar˚ u . # poˇcet vˇsech p´ar˚ u 10
Jak bylo uvedeno v´ yˇse, jednou z v´ yhod pouˇzit´ı Kendallova koeficientu k mˇeˇren´ı z´avislosti je moˇznost jeho zaps´an´ı pouze pomoc´ı kopule. Necht’ X, Y jsou n´ahodn´e veliˇciny s kopulou C, pak Kendallovo τ je d´ano vztahem: Z 1Z 1 C(u, v)dC(u, v) − 1. (1.4) τ =4 0
0
Spearmanovo ρS je definov´ano jako korelace mezi U a V, kde U = FX (X) a V = FY (Y ): ρS (X, Y ) = ρ(U, V ) =
E(U V ) − E(U )E(V ) p var(U )var(V )
Protoˇze stˇredn´ı hodnota rovnomˇern´ ych rozdˇelen´ı U a V je 1 , m˚ uˇzeme d´ale ps´at: 12 ρS (X, Y )
=
E(U V ) −
= 12 = 12
Z
Z
0
1 12 1Z 1 0
1 0
Z
0
1 4
= 12E(U V ) − 3
uv dC(u, v) − 3 = 12
1
Z
1 0
Z
0
1 2
a jejich rozptyl
1
C(u, v) du dv − 3
[C(u, v) − uv] du dv
Souvislost pravdˇepodobnosti konkordance a diskordance se Spearmanov´ ym koeficientem je uk´az´ana v n´asleduj´ıc´ı alternativn´ı definici ρS : Definice 4 Necht’ (X1 , Y1 ), (X2 , Y2 ), (X3 , Y3 ) jsou nez´avisl´e stejnˇe rozdˇelen´e vektory s kopulou C. Spearmanovo ρS (X, Y ) je d´ano vztahem: ρS (X, Y ) = 3[P ((X1 − X2 )(Y1 − Y3 ) > 0) − P ((X1 − X2 )(Y1 − Y3 ) < 0)]. ρS (X, Y ) je tedy definov´ano jako trojn´asobek rozd´ılu pravdˇepodobnosti konkordance a pravdˇepodobnosti diskordance vektor˚ u (X1 , Y1 ), (X2 , Y3 ), tj. p´aru vektor˚ u se stejn´ ymi margin´aln´ımi rozdˇelen´ımi, ale r˚ uzn´ ymi sdruˇzen´ ymi distribuˇcn´ımi funkcemi. Zat´ımco prvn´ı vektor m´a sdruˇzenou distribuˇcn´ı funkci urˇcenou kopulou C, komponenty druh´eho vektoru jsou nez´avisl´e a sdruˇzen´a distribuˇcn´ı funkce je rovna souˇcinu margin´aln´ıch rozdˇelen´ı F (X)G(Y ). Odhad Spearmanova ρS je d´an vztahem: Pn (rank(Xi ) − rank(Yi ))2 ρbS = 1 − 6 i=1 . n(n2 − 1)
Pod´ıvejme se nyn´ı na nˇekter´e vlastnosti Kendallova τ a Spearmanova ρS : 11
1. τ (X, Y ) = τ (Y, X); ρS (X, Y ) = ρS (Y, X); 2. pokud jsou X a Y nez´avisl´e, pak τ (X, Y ) = ρS (X, Y ) = 0; 3. τ, ρS ∈ [−1, 1]; 4. τ (X, Y ) = ρS (X, Y ) = 1 ⇔ C = C + ⇔ Y = T (X), T striktnˇe rostouc´ı, tj. X a Y jsou komonotick´e; 5. τ (X, Y ) = ρS (X, Y ) = −1 ⇔ C = C − ⇔ Y = T (X), T striktnˇe klesaj´ıc´ı, tj. X a Y jsou kontramonotick´e; 6. τ, ρS jsou invariantn´ı v˚ uˇci striktnˇe monot´onn´ım transformac´ım. Dalˇs´ım pˇr´ıkladem konkordaˇcn´ıch mˇer je koncov´ a z´ avislost (tail dependence). Nahl´ıˇz´ı na konkordanci ve chvostech neboli extr´emn´ıch hodnot´ach X a Y. Definice 5 Necht’ existuje koneˇcn´a limita © ª lim− P X > F −1 (v) | Y > G−1 (v) = λU v→1
ˇ Rekneme, ˇze kopula C m´a z´avislost horn´ıch chvost˚ u, pokud λU ∈ (0, 1] a ˇze kopula nem´a z´avislost horn´ıch chvost˚ u, pokud λU = 0. Analogicky, necht’ existuje koneˇcn´a limita © ª lim+ P X < F −1 (v) | Y < G−1 (v) = λL v→0
ˇ Rekneme, ˇze kopula C m´a z´avislost doln´ıch chvost˚ u, pokud λL ∈ (0, 1] a ˇze kopula nem´a z´avislost doln´ıch chvost˚ u, pokud λL = 0.
Uved’me jeˇstˇe definici pozitivn´ı kvadrantov´ e z´ avislosti (PQD, positive quadrant dependency): Definice 6 Dvˇe n´ahodn´e veliˇciny X a Y jsou pozitivnˇe kvadrantovˇe z´avisl´e pokud C(u, v) ≥ uv, pro kaˇzd´e (u, v) ∈ I 2 . Alternativnˇe, za pouˇzit´ı konkordaˇcn´ıho uspoˇr´ad´an´ı, X a Y jsou PQD, pokud: C(u, v) ≻ C ⊥ . C ⊥ v definici 6 oznaˇcuje tzv. souˇcinovou kopulu C ⊥ (u, v) = uv (jin´e oznaˇcen´ı Π(u, v)). Plat´ı, ˇze veliˇciny X a Y jsou nez´avisl´e, pokud maj´ı souˇcinovou kopulu. Proto tak´e b´ yv´a souˇcinov´a kopula velmi ˇcasto oznaˇcov´ana jako nez´avisl´a kopula.
12
1.5
Z´ akladn´ı rodiny kopul
V t´eto ˇc´asti budou pˇredstaveny z´akladn´ı rodiny (tˇr´ıdy) dvourozmˇern´ ych kopul. Nejvˇetˇs´ı pozornost bude vˇenov´ana Archim´edovsk´ ym kopul´am. Doposud jsme se sezn´amili se tˇremi z´akladn´ımi kopulami. Minim´aln´ı, nez´avislou a maxim´aln´ı kopulou. Kaˇzdou rodinu kopul, kter´a bude obsahovat tyto tˇri z´akladn´ı kopuly, budeme naz´ yvat komprehensivn´ı. Rodiny kopul se liˇs´ı formou z´avislosti, kterou reprezentuj´ı.
1.5.1
Gaussova kopula
Definice 7 Gaussova kopula je definov´ana vztahem: C Ga (u, v) = ΦρXY (Φ−1 (u), Φ−1 (v)), kde ΦρXY je sdruˇzen´a distribuˇcn´ı funkce dvourozmˇern´eho standardn´ıho norm´aln´ıho vektoru s line´arn´ım korelaˇcn´ım koeficientem ρXY a Φ−1 je inverze standardn´ı distribuˇcn´ı funkce norm´aln´ıho rozdˇelen´ı. Odtud µ ¶ Z Φ−1 (u) Z Φ−1 (v) 2ρXY st − s2 − t2 1 Ga p exp C (u, v) = ds dt. 2(1 − ρ2XY ) 2π 1 − ρ2XY −∞ −∞
Gaussovˇe kopuli se ˇcasto ˇr´ık´a norm´aln´ı kopula, protoˇze pro veliˇciny se standardn´ım norm´aln´ım rozdˇelen´ım generuje sdruˇzenou standardn´ı norm´aln´ı distribuˇcn´ı funkci. Pro veliˇciny s jin´ ym margin´aln´ım rozdˇelen´ım neˇz norm´aln´ım tato vlastnost neplat´ı. Gaussova kopula patˇr´ı mezi komprehensivn´ı kopuly. Nav´ıc je pozitivnˇe uspoˇr´adan´a vzhledem k line´arn´ımu korelaˇcn´ımu koeficientu: Ga Ga Ga Ga Ga C − = Cρ=−1 ≺ Cρ<0 ≺ Cρ=0 = C ⊥ ≺ Cρ>0 ≺ Cρ=1 = C +.
Pokud ρ 6= 1, nem´a Gaussova kopula ani horn´ı ani doln´ı z´avislost chvost˚ u: ½ 0 ρ<1 λU = λL = 1 ρ = 1. Vliv korelaˇcn´ıho koeficientu na hodnoty Gaussovy kopuly ukazuje obr´azek 1.2 na stranˇe 14.
1.5.2
Studentova t kopula
Podobnˇe jako je Gaussova kopula odvozena od norm´aln´ıho rozdˇelen´ı, je Studentova kopula zaloˇzena na Studentovˇe t rozdˇelen´ı o ν stupn´ıch volnosti. To m´a distribuˇcn´ı funkci: Z x Γ((ν + 1)/2) s2 ν+1 √ tν (x) = (1 + )− 2 ds. ν πνΓ(ν/2) −∞ 13
rho = 0.9
rho = −0.3
1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
0.5
1
0
0
0.5
1
Obr´azek 1.2: N´ahodn´ y vzorek 500 dvojic (u, v) z Gaussovy kopuly pro ρ = 0.9 a ρ = −0.3. S Definice 8 Studentova kopula Cρ,ν je definovan´a: S Cρ,ν (u, v)
−1 = tρ,ν (t−1 ν (u), tν (v)) ¶− ν+2 µ Z t−1 Z t−1 ν (v) ν (u) 2 1 s2 + t2 − 2ρst p ds dt, = 1+ ν(1 − ρ2 ) 2π 1 − ρ2 −∞ −∞
kde ρ ∈ I a tρ,ν je dvourozmˇern´a distribuce odpov´ıdaj´ıc´ı tν .
Studentova kopula je pozitivnˇe uspoˇr´adan´a vzhledem k ρ (pro dan´e ν). S S Dosahuje horn´ı a doln´ı hranice Fr´echetov´ ych mez´ı (C−1,ν = C − , C1,ν = C + ), S ⊥ ale pro koneˇcn´ y poˇcet stupˇ n˚ u volnosti neplat´ı C0,ν = C . Koncov´a z´avislost (tail dependency) Studentovy kopuly se mˇen´ı s poˇctem stupˇ n˚ u volnosti ν. Pro n´ızk´e hodnoty ν (napˇr. ν = 3) je koncov´a z´avislost velk´a, ale s rostouc´ımi hodnotami kles´a. Pro ν → ∞ kopula konverguje ke ˇ m´a Studentova kopula s ν = 1 mnohem v´ıce pozorov´an´ı Gaussovˇe kopule. Ze ve chvostech neˇz Gaussova kopula, lze vidˇet srovn´an´ım obr´azk˚ u 1.2 a 1.3.
1.5.3
Fr´ echetova rodina
Definice 9 Dvouparametrick´a rodina kopul: C F (u, v) = pC − + (1 − p − q)C ⊥ + qC + = p max(u + v − 1, 0) + (1 − p − q)uv + q min(u, v), kde p, q ∈ I, p + q ≤ 1, se naz´yv´a Fr´echetova. Fr´echetova tˇr´ıda je negativnˇe uspoˇr´adan´a vzhledem k p, pozitivnˇe uspoˇr´adan´a vzhledem ke q. Je komprehensivn´ı, protoˇze pro p = 1, q = 0 dostaneme doln´ı Fr´echetovu mez C − , pro p = q = 0 z´ısk´ame souˇcinovou kopulu C ⊥ a p = 0, q = 1 d´av´a horn´ı Fr´echetovu mez C + . 14
rho = −0.3
rho = 0.9 1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
0.5
0
1
0
0.5
1
Obr´azek 1.3: N´ahodn´ y vzorek 500 dvojic (u, v) ze Studentovy kopuly s jedn´ım stupnˇem volnosti pro ρ = 0.9 a ρ = −0.3.
1.5.4
Archim´ edovsk´ e kopuly
D˚ uleˇzitou tˇr´ıdu kopul s ˇsirok´ ym uplatnˇen´ım pˇredstavuj´ı Archim´edovsk´e kopuly. Jejich v´ yhodou je snadn´a zkonstruovatelnost. Umoˇzn ˇuj´ı totiˇz vyj´adˇrit v´ıcerozmˇernou Archim´edovskou kopulu pomoc´ı jednorozmˇern´e funkce, tzv. gener´atoru. D´ıky tomu, ˇze gener´ator urˇcuje Archim´edovskou kopulu jednoznaˇcnˇe, je tato tˇr´ıda velmi rozmanit´a na rodiny kopul se spoustou hezk´ ych vlastnost´ı. Definice 10 Necht’ φ je spojit´a, klesaj´ıc´ı a konvexn´ı funkce φ : [0, 1] → [0, ∞], φ(1) = 0 a necht’ φ[−1] je pseudo-inverze φ: ½ −1 φ (u), 0 ≤ u ≤ φ(0) [−1] φ (u) = 0, φ(0) ≤ u ≤ ∞ Pak funkci Cφ (u, v) = φ[−1] (φ(u) + φ(v)), kde u, v ∈ (0, 1], nazveme Archim´edovskou kopulou. Funkce φ se naz´ yv´a gener´ator kopuly Cφ . Pokud φ(0) = ∞, funkce φ je striktn´ı gener´ator. V tomto pˇr´ıpadˇe plat´ı, ˇze φ[−1] = φ−1 a Cφ (u, v) = φ−1 (φ(u) + φ(v)) se naz´ yv´a strikn´ı Archim´edovsk´a kopula. Archim´edovsk´e kopuly jsou symetrick´e, asociativn´ı, tj. Cφ (Cφ (u, v), w) = Cφ (u, Cφ (v, w)) pro vˇsechna u, v, w ∈ [0, 1], a plat´ı, ˇze pro libovolnou konstantu c > 0 je cφ tak´e gener´atorem kopuly Cφ .2 2
D˚ ukaz: Necht’ u, v, w ∈ [0, 1], c > 0 je libovoln´a konstanta. Pak: (a) symetrie: Cφ (u, v) = φ−1 (φ(u) + φ(v)) = φ−1 (φ(v) + φ(u)) = Cφ (v, u)
15
Pod´ıvejme se nyn´ı na Archim´edovsk´e kopuly z hlediska z´avislosti. Zat´ımco k vyj´adˇren´ı Kendallova τ je obecnˇe zapotˇreb´ı urˇcit hodnotu dvojn´eho integr´alu ze vztahu 1.4, pro Archim´edovskou kopulu je situace mnohem jednoduˇsˇs´ı. Kendallovo τ m˚ uˇze b´ yt vyj´adˇreno pˇr´ımo z gener´atoru kopuly jako: Z 1 φ(t) dt + 1 (1.5) τ =4 ′ 0 φ (t) Vztah 1.5 dostaneme ze vztahu 1.4 n´asledovnˇe: Z 1Z 1 Cφ (u, v)dCφ (u, v) − 1 = 4 E(Cφ (U, V )) − 1 = τ =4 0 0 Z 1 Z 1 per partes =4 t dKφ (t) − 1 = 3−4 Kφ (t) dt = 0 0 ¸ Z 1 Z 1· φ(t) φ(t) t− ′ dt = 4 =3−4 dt + 1 ′ φ (t) 0 φ (t) 0 V odvozen´ı vztahu 1.5 byla pouˇzita Kendallova distribuˇcn´ı funkce Kφ (t) = ˇ je Archim´edovsk´a kopula Cφ urˇcena Kendallovou kopuly Cφ . Ze t − φφ(t) ′ (t) distribuˇcn´ı funkc´ı Kφ jednoznaˇcnˇe, plyne z vˇety 3. T´eto vlastnosti pozdˇeji vyuˇzijeme k v´ ybˇeru nejlepˇs´ı Archim´edovsk´e kopuly. Vˇ eta 3 (Genest a Rivest, 1993) Necht’ X a Y jsou rovnomˇernˇe rozloˇzen´e n´ahodn´e veliˇciny se z´avislostn´ı funkc´ı C(x, y) tvaru φ−1 (φ(x) + φ(y)) a φ je konvexn´ı klesaj´ıc´ı funkce definovan´a na (0, 1] s vlastnost´ı φ(1) = 0. Necht’ ′ U = φ(X)/ {φ(X) + φ(Y )} , V = C(X, Y ) a λ(v) = φ(v)/φ (v), kde 0 < v ≤ 1. Pak (a) U je rovnomˇernˇe rozloˇzen´e na (0, 1); (b) V m´a na (0, 1) rozdˇelen´ı dan´e distribuˇcn´ı funkc´ı K(v) = v − λ(v); (c) U a V jsou nez´avisl´e n´ahodn´e veliˇciny. D˚ ukaz:
uveden v [3], str. 1041 ¤
Gener´ator Archim´edovsk´e kopuly urˇcuje tak´e jej´ı koncovou z´avislost (tail dependency). Necht’ φ je gener´ator kopuly Cφ (u, v) = φ−1 (φ(u) + φ(v)). Pak koeficienty koncov´e z´avislosti jsou dle Nelsena [9] urˇceny vztahy: 1 − Cφ (v, v) 1 − φ[−1] (2φ(v)) = 2 − lim− v→1 v→1 1−v 1−v [−1] 1 − φ (2x) = 2 − lim+ x→0 1 − φ[−1] (x)
λU = 2 − lim−
(b) asociativnost: Cφ (Cφ (u, v), w) = φ−1 (φ[φ−1 (φ(u) + φ(v))] + φ(w)) = φ−1 (φ(u) + φ(v) + φ(w)) = φ−1 (φ(u) + φ[φ−1 (φ(v) + φ(w))]) = Cφ (u, Cφ (v, w)) (c) Ccφ (u, v) = φ−1 ( 1c [cφ(u) + cφ(v)]) = φ−1 ( 1c [c(φ(u) + φ(v))]) = φ−1 (φ(u) + φ(v)) = Cφ (u, v).
16
Cφ (v, v) φ[−1] (2x) φ[−1] (2φ(v)) = lim+ = lim . x→+∞ φ[−1] (x) v→0 v→0 v v Volbou gener´atoru urˇcujeme rodinu nebo podtˇr´ıdu Archim´edovsk´ ych kopul. Nejzn´amˇejˇs´ı jednoparametrick´e Archim´edovsk´e rodiny a jejich gener´atory jsou uvedeny v tabulce 1.1.3 N´ahodn´ y vzorek z nich pak na obr´azku 1.4 na stranˇe 18. λL = lim+
Rodina
Gener´ ator φ(t)
Parametr α
Nez´avisl´a
−ln(t)
-
Claytonova
t−α − 1
α>1
Gumbelova Frankova
(− ln t)α αt
−1 ln eeα −1
Dvourozmˇ ern´ a kopula Cφ (u, v) uv
α≥1 −∞ < α < ∞
(u−α + v −α − 1)−1/α © ª α α exp −[(− ln u) + (− ln v) ]1/α ³ ´ (eαu −1)(eαv −1) 1 ln 1 + α α e −1
Tabulka 1.1: Archim´edovsk´e kopuly a jejich gener´atory.
Claytonova kopula v limitn´ım pˇr´ıpadˇe α → ∞ nab´ yv´a horn´ı Fr´eche+ tovy meze C . M´a doln´ı z´avislost chvost˚ u s koeficientem λL = 2−1/α . Vztah Kendallova τ a parametru α Claytonovy kopuly je definov´an jako: α (1.6) τ= α+2 Za povˇsimnut´ı stoj´ı, ˇze d´ıky hodnot´am parametru α a jeho pevnˇe dan´emu vztahu s Kendallov´ ym τ nepoˇc´ıt´a Claytonova kopula s negativn´ı z´avislost´ı ani s nez´avislost´ı. Dalˇs´ı kopulou z tabulky 1.1 je Gumbelova kopula. Jej´ımi speci´aln´ımi pˇr´ıpady jsou C1 = C ⊥ , C∞ = C + . Vid´ıme tedy, ˇze volbou parametru α m˚ uˇzeme interpolovat mezi nez´avislost´ı a perfektn´ı pozitivn´ı z´avislost´ı. S negativn´ı z´avislost´ı se opˇet nepoˇc´ıt´a. Gumbelova kopula m´a z´avislost horn´ıch chvost˚ u s koeficientem λU = 2 − 21/α . Vztah Kendallova τ a parametru α Gumbelovy kopuly je definov´an jako: 1 τ =1− (1.7) α Frankova kopula je narozd´ıl od pˇredchoz´ıch dvou kopul radi´alnˇe symetrick´a, tj. C(u, v) = C(1 − u, 1 − v) + u + v − 1. Je komprehensivn´ı: C−∞ = C − , C0 = C ⊥ , C∞ = C +
Dovoluje jak pozitivn´ı tak negativn´ı z´avislost a nem´a ani horn´ı ani doln´ı koncovou z´avislost. Vztah Kendallova τ a parametru α Frankovy kopuly je definov´an jako: 4 τ = 1 − {D1 (−α) − 1} , α 3
Ucelen´ y pˇrehled v´ıce neˇz 20 jednoparametrick´ ych Archim´edovsk´ ych kopul lze nal´ezt v [6] nebo [9].
17
kde D1 oznaˇcuje tzv. Debye funkci definovanou jako: Z k x tk Dk (x) = dt, pro k = 1, 2. x 0 et − 1 Pro z´aporn´e argumenty Debye funkce Dk plat´ı (Frees a Valdez [2]): Dk (−x) = Dk (x) +
kx . k+1
Pomoc´ı Debye funkce se d´a vyj´adˇrit tak´e vztah Spearmanova ρS pro Frankovu kopulu jako: ρS = 1 −
12 {D2 (−α) − D1 (−α)} . α Frankova kopula, α = 11.41 1
0.8
0.8
0.6
0.6
U2
U2
Claytonova kopula, α = 4.67 1
0.4
0.4
0.2
0.2
0
0
0.5 1 U1 Gumbelova kopula, α = 3.33 1
0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
0.5 U1
0.5 U1 Nezavisla kopula
1
0.5 U1
1
1
U2
U2
0
0
1
0
Obr´azek 1.4: N´ahodn´ y vzorek 500 dvojic (u, v) z Archim´edovsk´ ych kopul. Uveden´e parametry α byly spoˇcteny pro τ = 0.7.
18
Kapitola 2 Modelov´ an´ı v´ yˇ se ˇ skod, v´ ypoˇ cet rozdˇ elen´ı IBNR rezervy Ne vˇsechny ˇskody, kter´e vzniknou v urˇcit´em obdob´ı, jsou v tomto obdob´ı tak´e nahl´aˇseny. Rezerva, kter´a slouˇz´ı ke kryt´ı pojistn´ ych plnˇen´ı z takov´ ychto ˇskod se naz´ yv´a IBNR rezerva. V t´eto kapitole bude pops´an postup, kter´ y jsme pouˇzili k stanoven´ı jej´ı v´ yˇse s vyuˇzit´ım teorie o Archim´edovsk´ ych kopul´ach. V prvn´ı ˇc´asti t´eto kapitoly se sezn´am´ıme s daty, kter´a jsme mˇeli k dispozici, definujeme dvˇe zkouman´e veliˇciny - v´ yˇsi ˇskod a dobu mezi vznikem a nahl´aˇsen´ım ˇskody - a stanov´ıme datum, ke kter´emu jsme v´ yˇsi IBNR rezervy odhadovali. V druh´e ˇc´asti uvedeme postup vedouc´ı k urˇcen´ı margin´aln´ıch rozdˇelen´ı zkouman´ ych veliˇcin. Tˇret´ı a ˇctvrt´a ˇc´ast t´eto kapitoly jsou vˇenov´any identifikaci nejvhodnˇejˇs´ı Archim´edovsk´e kopuly a n´asledn´emu nasimulov´an´ı odpov´ıdaj´ıc´ıch dvourozmˇern´ ych v´ ystup˚ u. P´at´a ˇc´ast se zab´ yv´a poˇcty ˇskod, kter´e vznikly v jednotliv´ ych dnech zkouman´eho obdob´ı, ˇsest´a ˇc´ast pak poˇcty v tomto obdob´ı nenahl´aˇsen´ ych ˇskod. Z´avˇereˇcn´a sedm´a ˇc´ast pracuje s v´ ysledky z ˇc´ast´ı pˇredchoz´ıch a pouˇz´ıv´a je ke stanoven´ı v´ yˇse IBNR rezervy ve sledovan´em obdob´ı. Z´ıskan´a hodnota je n´aslednˇe porovn´ana s hodnotou IBNR rezervy spoˇctenou pomoc´ı metody Chain ladder a s re´aln´ ymi daty. Srovn´ana jsou tak´e rozdˇelen´ı IBNR rezervy z´ıskan´a obˇema metodami.
2.1
Vstupn´ı data
K dispozici jsme mˇeli data o ˇskod´ach z havarijn´ıho pojiˇstˇen´ı spoleˇcnosti Kooperativa1 z let 1991-2007, tedy o ˇskod´ach na motorov´em vozidle zp˚ usoben´e 1
Kooperativa pojiˇst’ovna, a.s., Vienna Insurance Group.
19
M´ıra inflace (%) Koeficient
M´ıra inflace (%) Koeficient
1991
1992
1993
1994
1995
1996
1997
1998
1999
56,6
11,1
20,8
10,0
9,1
8,8
8,5
10,7
2,1
4,118
2,629
2,367
1,959
1,781
1,633
1,500
1,383
1,249
2000
2001
2002
2003
2004
2005
2006
2007
2008
3,9
4,7
1,8
0,1
2,8
1,9
2,5
2,8
1,224
1,178
1,125
1,105
1,104
1,074
1,054
1,028
1,000
Tabulka 2.1: M´ıra inflace vyj´adˇren´a pˇr´ır˚ ustkem pr˚ umˇern´eho roˇcn´ıho indexu spotˇrebitelsk´ ych cen a koeficient m´ıry inflace vztaˇzen´ y k 1.1.2008. ´ hav´ari´ı, ˇzivelnou ud´alost´ı, kr´adeˇz´ı nebo napˇr. vandalismem. Udaje obsahovaly datum vzniku ˇskody, datum jej´ıho nahl´aˇsen´ı, datum registrace ˇskody (tj. uloˇzen´ı do syst´emu spoleˇcnosti) a tak´e u ´daj o v´ yˇsi vyplacen´e ˇc´astky za ˇskodu spoleˇcnˇe s aktu´aln´ı v´ yˇs´ı rezervy. Kaˇzdou ˇskodu v naˇsem modelu jsme charakterizovali dvˇemi n´ahodn´ ymi veliˇcinami: v´ yˇs´ı ˇskody a dobou mezi vznikem a nahl´aˇsen´ım ˇskody ve dnech. V´ yˇ se ˇ skody ˇ Pracovali jsme s tzv. nenulov´ ymi ˇskodami. Skody s nulovou v´ yˇs´ı v´ yplaty (napˇr. bezpˇredmˇetn´a pojistn´a ud´alost nesplˇ nuj´ıc´ı pojistn´e podm´ınky nebo nahl´aˇsen´a a doposud nevyˇr´ızen´a pojistn´a ud´alost) jsme nevybrali. Protoˇze u ´daje o v´ yˇs´ıch ˇskod poch´azely z nˇekolikalet´eho horizontu, zohlednili jsme inflaci. V tabulce 2.1 lze nal´ezt roˇcn´ı m´ıru inflace stanovenou ˇ ym statistick´ Cesk´ ym u ´ˇradem a tak´e koeficient, kter´ ym jsme pˇren´asobili v´ yˇse ˇskod registrovan´e v pˇr´ısluˇsn´em roce. Veˇsker´e v´ ypoˇcty byly d´ale prov´adˇeny s hodnotami vztaˇzen´ ymi k 1.1.2008. Inflace jiˇz nebyla znovu zahrnuta. Doba mezi vznikem ˇ skody a jej´ım nahl´ aˇ sen´ım Tuto veliˇcinu jsme definovali jako poˇcet dn´ı mezi datem nahl´aˇsen´ı ˇskody a datem jej´ıho vzniku. Protoˇze 99,9 % ˇskod bylo nahl´aˇseno do 649 dn´ı (necel´e dva roky), pracovali jsme s pˇredpokladem, ˇze je kaˇzd´a ˇskoda nahl´aˇsena do tˇr´ı let (1095 dn´ı) od sv´eho vzniku. Abychom mohli v´ yˇsi IBNR rezervy na z´avˇer porovnat nejen s v´ ysledkem spoˇcten´ ym metodou Chain ladder, ale tak´e s re´aln´ ymi daty, byla IBNR rezerva poˇc´ıt´ana k 31.12.2004. Tedy pro ˇskody vznikl´e v obdob´ı od 1.1.2002 do 31.12.2004 a k 31.12.2004 nenahl´aˇsen´e. Pro lepˇs´ı aproximaci margin´aln´ıho rozdˇelen´ı veliˇciny doby mezi vznikem ˇskody a jej´ım nahl´aˇsen´ım jsme pˇridali u ´daje o ˇskod´ach s jiˇz ukonˇcen´ ym v´ yvojem a pracovali tak s daty z let 2000 aˇz 2004.
20
V´ yˇ se ˇ skody
Doba mezi vznikem a nahl´ aˇ sen´ım ˇ skody
Poˇcet
247 498
247 498
Stˇredn´ı hodnota
55 671
27
Medi´an
17 866
12
Smˇerodatn´a odchylka
115 592.59 10
Rozptyl ˇ Sikmost
1.3362 · 10
ˇ catost Spiˇ
51.51 2 654
7.6773
7.5038
126.7071
98.1386
Minimum
1
0
Maximum
5 539 501
1 696
25. percentil
7 894
5
75. percentil
53 454
28
95. percentil
233 898
96
Tabulka 2.2: Souhrn charakteristik obou zkouman´ ych veliˇcin.
2.2
Urˇ cen´ı margin´ aln´ıch rozdˇ elen´ı
Prvn´ım krokem naˇseho postupu bylo urˇcen´ı margin´aln´ıch rozdˇelen´ı obou zkouman´ ych veliˇcin. Veliˇcinu popisuj´ıc´ı v´ yˇse ˇskod jsme oznaˇcili X. Jak lze vidˇet z tabulky 2.2, kter´a popisuje z´akladn´ı charakteristiky obou veliˇcin, v´ yˇse ˇskod se vyznaˇcuj´ı velkou ˇsikmost´ı (koeficient ˇsikmosti m´a hodnotu 7.6773) a ˇcetnost´ı menˇs´ıch ˇskod. Veliˇcinu X jsme modelovali pomoc´ı n´asleduj´ıc´ıch rozdˇelen´ı: exponenci´aln´ıho, Gama, Weibullova a logaritmicko-norm´aln´ıho. Vyuˇzili jsme dfittool programu Matlab, kter´ y odhaduje parametry jednotliv´ ych rozdˇelen´ı pomoc´ı metody maxim´aln´ı vˇerohodnosti a nav´ıc umoˇzn ˇuje grafick´e srovn´an´ı fitovan´ ych distribuˇcn´ıch funkc´ı s empirickou distribuˇcn´ı funkc´ı. Nejvhodnˇejˇs´ı rozdˇelen´ı jsme vybrali pr´avˇe na z´akladˇe tohoto grafick´eho porovn´an´ı. Ze zkouman´ ych rozdˇelen´ı data nejl´epe aproximuje logaritmicko-norm´aln´ı rozdˇelen´ı s parametry µ = 9.9345 a σ = 1.3898 , kter´e m´a hustotu tvaru: f (x|µ, σ) = √
1 2 2 e−(ln x−µ) /2σ , x > 0. 2πσx
Na obr´azku 2.1(a) je pravdˇepodobnostn´ı graf vˇsech uvaˇzovan´ ych rozdˇelen´ı. Obr´azek 2.1(b) srovn´av´a empirickou distribuˇcn´ı funkci v´ yˇse ˇskod s distribuˇcn´ı funkc´ı zvolen´eho logaritmicko-norm´aln´ıho rozdˇelen´ı. D´ıky typick´emu rysu havarijn´ıho pojiˇstˇen´ı, tj. vˇetˇs´ı ˇcetnosti menˇs´ıch ˇskod, uv´ad´ıme srovn´an´ı empirick´e a teoretick´e distribuˇcn´ı funkce pouze pro hodnoty do 350 000 Kˇc (pro vyˇsˇs´ı hodnoty jsou rozd´ıly obou distribuˇcn´ıch funkc´ı zanedbateln´e). Veliˇcinu charakterizuj´ıc´ı zpoˇzdˇen´ı v nahl´aˇsen´ı jsme oznaˇcili Y . Podobnˇe jako v´ yˇse ˇskod i doba mezi vznikem a nahl´aˇsen´ım ˇskod se vyznaˇcuje velkou 21
X data Exponencialni Weibullovo Gama Log−normalni
0.0001
0
1
2
3
4
5
Data
6
x 10
(a) Pravdˇepodobnostn´ı graf pro modelovan´a rozdˇelen´ı 1 0.9 0.8 0.7 Distribucni funkce
Pravdepodobnost
0.9999 0.999 0.99 0.95 0.9 0.75 0.5 0.25 0.1 0.05
0.6 0.5 0.4 0.3 0.2 Empiricka distribucni funkce Teoreticka distribucni funkce
0.1 0
0
0.5
1
1.5
2
2.5
3
Data
(b) Srovn´an´ı empirick´e a teoretick´e distribuˇcn´ı funkce
Obr´azek 2.1: Fitov´an´ı v´ yˇse ˇskod. 22
3.5 5
x 10
Y data Exponencialni Weibullovo Gamma Log−normalni
0.0001
0
200
400
600
800 1000 Data
1200
1400
1600
(a) Pravdˇepodobnostn´ı graf pro modelovan´a rozdˇelen´ı 1 0.9 0.8 0.7 Distribucni funkce
Pravdepodobnost
0.9999 0.999 0.99 0.95 0.9 0.75 0.5 0.25 0.1 0.05
0.6 0.5 0.4 0.3 0.2 Empiricka distribucni funkce Teoreticka distribucni funkce
0.1 0
0
20
40
60
80
100
Data
(b) Srovn´an´ı empirick´e a teoretick´e distribuˇcn´ı funkce
Obr´azek 2.2: Fitov´an´ı doby mezi vznikem a nahl´aˇsen´ım ˇskody. 23
ˇsikmost´ı (koeficient ˇsikmosti je 7.5038) a velkou ˇcetnost´ı mal´ ych hodnot. Modelovali jsme ji pomoc´ı stejn´ ych rozdˇelen´ı jako veliˇcinu X. Opˇet bylo zvoleno logaritmicko-norm´aln´ı rozdˇelen´ı, tentokr´at s parametry µ = 2.5240 a σ = 1.2164. Grafy odpov´ıdaj´ıc´ı fitov´an´ı doby mezi vznikem ˇskody a jej´ım nahl´aˇsen´ım jsou na obr´azku 2.2.
2.3
V´ ybˇ er kopuly
V druh´em kroku naˇseho postupu jsme nalezli Archim´edovskou kopulu, kter´a nejl´epe modelovala zkouman´a dvourozmˇern´a data (X, Y ). Pouˇzili jsme k tomu proceduru popsanou p´any Genest a Rivest v roce 1993 [3]. Pˇred t´ım, neˇz uvedeme konkr´etn´ı v´ ysledky t´eto procedury, seznamme se s n´ı teoreticky. Pˇredpokl´adejme, ˇze m´ame nez´avisl´a pozorov´an´ı (X1 , Y1 ), . . . , (Xn , Yn ) z dvourozmˇern´eho rozdˇelen´ı se sdruˇzenou distribuˇcn´ı funkc´ı HX,Y (x, y), margin´aln´ımi distribuˇcn´ımi funkcemi F (x), G(y) a kopulou C. D´ale pˇredpokl´adejme, ˇze kopula C je tvaru C(u, v) = φ−1 (φ(u) + φ(v)), kde φ je spojit´a, klesaj´ıc´ı a konvexn´ı funkce definovan´a na (0, 1], φ(1) = 0. Pˇredpokl´ad´ame tedy Archim´edovskou kopulu s gener´atorem φ. Procedura Genest-Rivest identifikuje Archim´edovskou kopulu C, kter´a je sv´ ymi hodnotami nejbl´ıˇze sdruˇzen´e distribuˇcn´ı funkci HX,Y , ve tˇrech kroc´ıch a pracuje s nepozorovatelnou veliˇcinou Zi = HX,Y (Xi , Yi ), i = 1, ..., n. Distribuˇcn´ı funkce t´eto veliˇciny K(z) = P (Zi ≤ z) je s gener´atorem φ Archim´edovsk´e kopuly spojena vztahem K(z) = z − φφ(z) , kter´ y plyne z vˇety 3. ′ (z) Procedura Genest-Rivest (1993) 1. Spoˇcteme neparametrick´ y odhad Kendallova korelaˇcn´ıho koeficientu: µ ¶−1 X n τn = sign [(Xi − Xj ) (Yi − Yj )] 2 i<j 2. Zkonstruujeme neparametrick´ y odhad empirick´e distribuˇcn´ı funkce K: (a) V prvn´ım kroku zadefinujeme pseudopozorov´an´ı Zi : Zi = # {(Xj , Yj ); Xj < Xi ∧ Yj < Yi } /(n − 1), i = 1, . . . , n (b) Ve druh´em kroku odhadneme distribuˇcn´ı funkci K n´asleduj´ıc´ım zp˚ usobem: # {Zi ; Zi ≤ z} Kn (z) = . n
24
3. Urˇc´ıme parametrick´ y odhad distribuˇcn´ı funkce K pouˇzit´ım vztahu: Kφ (z) = z −
Rodina
φ(z) φ′ (z)
(2.1)
Vztah mezi τ a α
Claytonova
α=
2τ 1−τ
Gumbelova
α=
1 1−τ
Frankova
4 α
τ =1−
+
4 α2
Kφ (z, α) z−
Rα
z 0 ez −1
dz
z−
ln
z α+1 −z α
z − z lnαz
e−αz −1 e−α −1
α
(eαz − 1)
Tabulka 2.3: Vztahy pro z´ısk´an´ı parametru α z Kendallova τ a vztahy pro parametrick´e odhady distribuˇcn´ı funkce K pro r˚ uzn´e rodiny Archim´edovsk´ ych kopul. Tvary funkce Kφ (z) pro Claytonovu, Gumbelovu a Frankovu kopulu jsou uvedeny v tabulce 2.3. Krok 3 opakujeme pro r˚ uzn´e volby gener´atoru φ. Kaˇzd´ y parametrick´ y odhad Kφ (z) pot´e porovn´av´ame s neparametrick´ ym odhadem Kn (z) zkonstruovan´ ym ve druh´em kroku. Na z´avˇer vybereme takovou kopulu, a tedy gener´ator φ, pro kterou je parametrick´ y odhad Kφ (z) nejbliˇzˇs´ı neparametrick´emu odhadu Kn (z). Bl´ızkost m˚ uˇzeme porovnat n´asleduj´ıc´ımi zp˚ usoby: 1. Graficky: (a) vykreslen´ım grafu Kn (z) a Kφ (z) proti z, (b) vykreslen´ım pˇr´ısluˇsn´ ych Q-Q graf˚ u. 2. Numericky: (a) Frees a Valdez [2]Rnavrhuj´ı zvolit takovou kopulu, kter´a minima1 lizuje vzd´alenost 0 [Kφ (z) − Kn (z)]2 dKn (z),
(b) Pettere P a Kollo [10] pˇrid´avaj´ı srovn´an´ı hodnoty z (a) spoˇcten´e jako ni=1 [Kφ (z) − Kn (z)]2 s hodnotou funkce |Kφ (z) − Kn (z)|.
Nejprve jsme tedy spoˇcetli neparametrick´ y odhad Kendallova korelaˇcn´ıho koeficientu zkouman´ ych dat (X, Y ) a z´ıskali hodnotu τ = −0.0376. Pro srovn´an´ı hodnota Spearmanova korelaˇcn´ıho koeficientu zkouman´ ych dat je ρS = −0.0568 a Pearson˚ uv line´arn´ı korelaˇcn´ı koeficient je roven ρX,Y = −0.0147. Protoˇze n´am odhad Kendallova τ vyˇsel z´apornˇe a jak Claytonova, tak Gumbelova kopula nedovoluj´ı pracovat s negativn´ı z´avislost´ı, pouˇzili jsme 25
pro u ´ˇcely v´ ybˇeru nejvhodnˇejˇs´ı kopuly v druh´em a tˇret´ım kroku procedury Genest-Rivest kladnou hodnotu τ = 0.0376, tj. pracovali jsme s veliˇcinami −X a Y . Neparametrick´ y odhad Kn (z) druh´eho kroku procedury jsme se rozhodli porovnat s parametrick´ ymi odhady Kφ (z) Claytonovy, Gumbelovy a Frankovy kopuly. Bylo proto tˇreba urˇcit hodnoty parametru α jednotliv´ ych kopul odpov´ıdaj´ıc´ı τ = 0.0376. U Claytonovy a Gumbelovy kopuly jsme je z´ıskali ze vztah˚ u 1.6 a 1.7. U Frankovy kopuly z funkce copulaparam(’Frank’,tau) programu Matlab. Hodnoty byly n´asleduj´ıc´ı: Claytonova kopula Gumbelova kopula Frankova kopula
0.0782 1.0391 0.3390
Dosazen´ım tˇechto hodnot do vztah˚ u pro Kφ (z, α) uveden´ ych v tabulce 2.3 jsme pak jiˇz snadno spoˇcetli parametrick´e odhady distribuˇcn´ı funkce K. V´ ybˇer nejvhodnˇejˇs´ı Archim´edovsk´e kopuly byl proveden jak na z´akladˇe grafick´eho, tak i numerick´eho porovn´an´ı parametrick´ ych odhad˚ u Kφ (z) distribuˇcn´ı funkce K s jej´ım neparametrick´ ym odhadem Kn (z). Ke tˇrem zkouman´ ym Archim´edovsk´ ym kopul´am jsme u grafick´eho porovn´an´ı pˇridali tak´e nez´avislou kopulu. Grafy jsou uvedeny na obr´azku 2.3. Z grafick´eho srovn´an´ı vyˇsly nejl´epe Gumbelova a Frankova kopula, nebylo ale moˇzno jednoznaˇcnˇe rozhodnout, kter´a z nich l´epe popisuje zkouman´a data. K numerick´emu posouzen´ı bl´ızkosti odhad˚ u jsme pouˇzili vztahy: Ψ=
n X i=1
[Kφ (z) − Kn (z)]2
LM = max |Kφ (z) − Kn (z)| Hodnoty Ψ a LM pro n´ami uvaˇzovan´e kopuly jsou uvedeny v tabulce 2.3. Numerick´ ym srovn´an´ım bychom volili nez´avislou nebo Gumbelovu kopulu. Jako nejlepˇs´ı volba k modelov´an´ı zkouman´ ych dat byla nakonec vybr´ana Gumbelova kopula s parametrem 1.0391.
26
Nezavisla kopula
Gumbelova kopula
1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
0.5
0
1
0
0.5
Claytonova kopula
Frankova kopula
1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
1
0.5
0
1
0
0.5
1
0.02 0.01 0 −0.01 −0.02 −0.03 0 Kn−nezavisla
−0.04
Kn−Gumbelova Kn−Claytonova
−0.05
Kn−Frankova −0.06
0
0.2
0.4
0.6
0.8
1
Obr´azek 2.3: Srovn´an´ı neparametrick´eho odhadu Kn (z) s parametrick´ ymi odhady Kφ (z) distribuˇcn´ı funkce K. 27
Ψ Claytonova kopula
LM
74.7692 0.0559
Gumbelova kopula 42.2323 0.0461 Frankova kopula
48.1458 0.0466
Nez´avisl´a kopula
42.0219 0.0415
Tabulka 2.4: Hodnoty Ψ a LM uvaˇzovan´ ych kopul.
2.4
Simulace
Dalˇs´ım krokem po v´ ybˇeru nejvhodnˇejˇs´ı Archim´edovsk´e kopuly2 bylo nagenerov´an´ı v´ yˇs´ı ˇskod odpov´ıdaj´ıc´ıch dan´ ym zpoˇzdˇen´ım v nahl´aˇsen´ı. Jin´ ymi slovy z n´ami vybran´e kopuly bylo tˇreba nagenerovat n´ahodn´e veliˇciny X, Y se zn´amou distribuˇcn´ı funkc´ı HX,Y (x, y) = Cφ (F (x), G(y))), kde Cφ oznaˇcuje vybranou nejvhodnˇejˇs´ı Archim´edovskou kopulu. Ke generov´an´ı (simulaci) dat z kopuly jsme pouˇzili algoritmus, kter´ y pracuje s podm´ınˇenou distribuˇcn´ı funkc´ı jedn´e veliˇciny druhou veliˇcinou. Tento algoritmus byl uveˇrejnˇen v [2], opˇet se s n´ım nejprve sezn´am´ıme teoreticky. ´ n´ı vy ´ stup˚ ´dovske ´ kopuly Algoritmus pro generova u z Archime 1. Generujme U1 , U2 nez´avisl´a n´ahodn´a ˇc´ısla z rovnomˇern´eho rozdˇelen´ı (0, 1). 2. Poloˇzme X = F −1 (U1 ). 3. Y spoˇcteme jako ˇreˇsen´ı U2 = G(Y |X) =
φ−1(1) (φ(F (X) + φ(G(Y ))) . φ−1(1) (φ(F (X))
(2.2)
φ−1(1) ve vztahu 2.2 oznaˇcuje prvn´ı derivaci inverzn´ı funkce gener´atoru φ. Odvod’me ji nyn´ı pro Claytonovu, Gumbelovu a Frankovu kopulu. Claytonova kopula je urˇcena gener´atorem φ(t) = t−α −1 pro α > 1, jehoˇz inverzn´ı funkce m´a tvar φ−1 (s) = (1 + s)−1/α , a tedy φ−1(1) (s) = −α−1 (1 + s)−(1/α)−1 . 2
(2.3)
Za povˇsimnut´ı stoj´ı, ˇze k urˇcen´ı nejvhodnˇejˇs´ı Archim´edovsk´e kopuly popisuj´ıc´ı zkouman´a data nebylo tˇreba zn´at jejich margin´aln´ı rozdˇelen´ı.
28
Gumbelova kopula je urˇcena gener´atorem φ = (− ln t)α pro α ≥ 1, jehoˇz inverzn´ı funkce m´a tvar φ−1 (s) = exp(−s1/α ), a tedy φ−1(1) (s) = −α−1 s1/α−1 exp(−s1/α ).
(2.4)
αt
−1 Frankova kopula je urˇcena gener´atorem ln eeα −1 pro −∞ < α < ∞, jehoˇz inverzn´ı funkce m´a tvar φ−1 (s) = α−1 ln[1 + es (eα − 1)], a tedy
φ−1(1) (s) =
es (eα − 1) . α(1 + es (eα − 1))
(2.5)
Pod´ıvejme se podrobnˇeji na tˇret´ı krok v´ yˇse popsan´eho algoritmu. Pro Claytonovu kopulu dosazujeme vztah 2.3 do rovnice 2.2 a hled´ame Y , kter´e je ˇreˇsen´ım: U2 =
−α−1 (1 + G(Y )−α − 1 + U1−α − 1)−(1/α)−1 . −α−1 (1 + U1−α − 1)−(1/α)−1
Postupn´ ymi u ´pravami dost´av´ame: U2 U2 −α/(1+α)
U2
−α/(1+α)
U2
−α−1 (1 + G(Y )−α − 1 + U1−α − 1)−(1/α)−1 = −α−1 (1 + U1−α − 1)−(1/α)−1 (G(Y )−α + U1−α − 1)−(1/α)−1 = (U1−α )−(1/α)−1 G(Y )−α + U1−α − 1 = U1−α = G(Y )−α U1α + 1 − U1α −α/(1+α)
G(Y )−α − 1 = U1−α (U2
− 1)
−α/(1+α)
G(Y ) = [1 + U1−α (U2
def
− 1)]−1/α = U2∗
Hledan´e Y pak spoˇcteme jako Y = G−1 (U2∗ ). Podobn´ ym zp˚ usobem, jak´ ym jsme spoˇcetli Y Claytonovy kopuly, se postupuje u Frankovy kopuly. Hled´ame Y , kter´e je ˇreˇsen´ım rovnice: U2 = e−αU1 (
e−α − e−αG(Y ) + 1)−1 . e−αG(Y )−1
Nalezen´e ˇreˇsen´ı m´a tvar Y = G−1 (U2∗ ), kde U2∗ =
U2 e−α − e−αU1 (1 − U2 ) . U2 + e−αU1 (1 − U2 ) 29
ˇ sen´ı Y z rovnice 2.2 pro Gumbelovu kopulu nem´a uzavˇren´ Reˇ y tvar. Je tˇreba jej hledat numericky. Ke generov´an´ı n´ahodn´ ych promˇenn´ ych z Gumbelovy kopuly je moˇzno pouˇz´ıt napˇr. funkci copularnd(’Gumbel’,α,N) programu Matlab, kde α je parametr Gumbelovy kopuly a N je poˇcet dvojic generovan´ ych z Gumbelovy kopuly. Vrat’me se nyn´ı zpˇet k naˇsemu pˇr´ıkladu. Jako kopula nejl´epe popisuj´ıc´ı zkouman´a data (−X, Y ) byla v pˇredchoz´ı ˇc´asti vybr´ana Gumbelova kopula s parametrem 1.0391. Naˇs´ım c´ılem bylo z t´eto kopuly nasimulovat v´ yˇse ˇskod odpov´ıdaj´ıc´ı zpoˇzdˇen´ım v nahl´aˇsen´ı 0 aˇz 1095 dn´ı (potˇrebn´e pozdˇeji pˇri urˇcov´an´ı v´ yˇse IBNR rezervy). Jak jiˇz bylo ˇreˇceno, ke generov´an´ı dat z kopuly se pouˇz´ıv´a v´ yˇse uveden´ y algoritmus. Speci´alnˇe u Gumbelovy kopuly je na nˇem zaloˇzena funkce copularnd(’Gumbel’,α,N) programu Matlab. Jej´ım v´ ystupem je N dvojic U1 a U2∗ (znaˇcen´ı odpov´ıd´a v´ yˇse uveden´e teorii), z nichˇz se X a Y z´ıskaj´ı jako X = F −1 (U1 ) a Y = G−1 (U2∗ ). V naˇsem pˇr´ıpadˇe jsme ovˇsem pro dan´a Y generovali −X. Narozd´ıl od pr´avˇe uveden´e teorie jsme podmiˇ novali z´aporn´e v´ yˇse ˇskod zpoˇzdˇen´ım v nahl´aˇsen´ı, tj. veliˇcinu −X veliˇcinou Y . Zformulujme proto algoritmus odpov´ıdaj´ıc´ı naˇsemu pˇr´ıpadu: 1. Definujme U1 = G(Y ), kde G oznaˇcuje distribuˇcn´ı funkci logaritmickonorm´aln´ıho rozdˇelen´ı s parametry µ = 2.5240 a σ = 1.2164 a Y nab´ yv´a hodnot 0,...,1095. Hodnoty zpoˇzdˇen´ı v nahl´aˇsen´ı dostaneme jako Y = G−1 (U1 ). 2. Generujme U2 jako nez´avisl´a n´ahodn´a ˇc´ısla z rovnomˇern´eho rozdˇelen´ı (0, 1). 3. Hledan´e −X jsme spoˇcteme jako −X = −F −1 (1 − U2∗ ). U2∗ z´ısk´ame z funkce copularnd(’Gumbel’,1.0391,1096) upraven´e pro pr´aci s hodnotami U1 definovan´ ymi v prvn´ım kroku. D´ale jsme pracovali s kladn´ ymi hodnotami v´ yˇs´ı ˇskod. Na obr´azku 2.4 je graf pr˚ umˇern´ ych v´ yˇs´ı ˇskod odpov´ıdaj´ıc´ıch jednotliv´ ym zpoˇzdˇen´ım v nahl´aˇsen´ı.
2.5
Urˇ cen´ı poˇ ctu vznikl´ ych ˇ skod
K stanoven´ı IBNR rezervy naˇs´ım postupem bylo tak´e tˇreba zn´at poˇcet ˇskod, kter´e ve zkouman´em obdob´ı vznikly, ale nebyly nahl´aˇseny. Abychom tento poˇcet urˇcili, modelovali jsme nejprve poˇcet ˇskod, kter´e v jednotliv´ ych dnech zkouman´eho obdob´ı vznikly. 30
4
6.5
x 10
6
X
5.5
5
4.5
4
3.5
0
200
400
600 Y
800
1000
1200
Obr´azek 2.4: Pr˚ umˇern´e v´ yˇse ˇskod X odpov´ıdaj´ıc´ı zpoˇzdˇen´ım Y nagenerovan´e z Gumbelovy kopuly s parametrem 1.0391. Uvaˇzovali jsme kolektivn´ı model rizika, ve kter´em je u ´hrn ˇskod Si vyj´adˇren souˇctem Ni X Xij , Si = j=1
kde n´ahodn´a veliˇcina Ni pˇredstavuje poˇcet ˇskod vznikl´ ych ve dni i a Xij znaˇc´ı v´ yˇse jednotliv´ ych ˇskod j vznikl´ ych v it´em dni. Pˇredpokl´ad´a se, ˇze Ni a Xij jsou vz´ajemnˇe nez´avisl´e. K nalezen´ı rozdˇelen´ı veliˇciny N jsme opˇet vyuˇzili funkci dfittool programu Matlab. Aplikovali jsme ji na poˇcty nahl´aˇsen´ ych ˇskod od poˇc´atku roku 2000 do 4. ˇctvrtlet´ı roku 2003,3 Z graf˚ u na obr´azku 2.5 lze vidˇet, ˇze poˇcty vznikl´ ych ˇskod nejl´epe modeluje negativnˇe binomick´e rozdˇelen´ı (pˇr´ıpadnˇe Gama rozdˇelen´ı). Pˇred t´ım neˇz uvedeme zp˚ usob, jak´ ym jsme predikovali poˇcty vznikl´ ych ˇskod ve zkouman´em obdob´ı a nalezli parametry negativnˇe binomick´eho rozdˇelen´ı, seznamme se se zobecnˇen´ ymi line´arn´ımi modely, kter´e jsme pˇri tom vyuˇz´ıvali. Zobecnˇen´e line´arn´ı modely (Generalized Linear Models, GLM) patˇr´ı mezi tˇr´ıdu statistick´ ych model˚ u, kterou v roce 1972 pˇredstavili John Nelder a Robert Wedderburn. Zat´ımco v klasick´em line´arn´ım regresn´ım modelu pozorujeme n´ahodnou veliˇcinu Y s pˇredpokl´adan´ ym norm´aln´ım rozdˇelen´ım se 3
Konkr´etnˇe jsme pracovali s u ´daji z 1400 po sobˇe n´asleduj´ıc´ıch dn˚ u. Tento rozsah byl zvolen proto, ˇze si poˇcty nahl´aˇsen´ ych ˇskod a poˇcty skuteˇcnˇe vznikl´ ych ˇskod v tomto obdob´ı s 99,9% pravdˇepodobnost´ı odpov´ıdaj´ı.
31
Pocty skod Normalni Gama Negativne binomicke Poissonovo
0.02
Hustota
0.015
0.01
0.005
Pravdepodobnost
0
100
200
300
400 Data
500
600
700
0.9999 0.9995 0.999 0.995 0.99 0.95 0.9 0.75 0.5 0.25 0.1 0.05 0.01 0.005 0.001 0.0005 0.0001 Pocty skod Normalni Gama Negativne binomicke Poissonovo 100
200
300
400 Data
500
600
700
Obr´azek 2.5: Fitov´an´ı poˇct˚ u ˇskod vznikl´ ych za den. 32
stˇredn´ı hodnotou µ, zobecnˇen´e line´arn´ı modely rozˇsiˇruj´ı pˇredpoklad rozdˇelen´ı veliˇciny Y na libovoln´e rozdˇelen´ı z tzv. exponenci´aln´ı rodiny rozdˇelen´ı. Rozdˇelen´ı z t´eto rodiny maj´ı hustotu pravdˇepodobnosti pro pozorov´an´ı yi d´anu vztahem: yi θi − b(θi ) f (yi ; θi , φ) = exp( + c(yi , φ)), ai (φ) kde θi je pˇrirozen´ y parametr souvisej´ıc´ı se stˇredn´ı hodnotou, φ je disperzn´ı parametr, ai (φ) je spojit´a kladn´a funkce, b(θi ) je kumulantov´a funkce se spojitou druhou derivac´ı a c(yi , φ) je funkce normuj´ıc´ı f . Funkce ai (φ) m´a zpravidla tvar ai (φ) = φ/wi , kde wi je apriorn´ı v´aha i-t´eho pozorov´an´ı. V t´eto pr´aci jsme pouˇzili wi = 1 pro kaˇzd´e pozorov´an´ı i. Pro rozdˇelen´ı z t´eto rodiny d´ale plat´ı: db(θi ) ′ = b (θi ) dθi 2 d b(θi ) ′′ = ai (φ)b (θi ) = ai (φ)V (µi ) Var(yi ) = ai (φ) 2 dθi E(yi ) = µi =
(2.6) (2.7)
kde V (µi ) je tzv. varianˇcn´ı funkce. Mezi v´ yznamn´e ˇcleny exponenci´aln´ı rodiny patˇr´ı norm´aln´ı, Poissonovo, binomick´e, gamma nebo inverzn´ı Gaussovo rozdˇelen´ı. Bl´ızk´ ymi pˇr´ıbuzn´ ymi jsou napˇr. negativnˇe binomick´e a Weibullovo rozdˇelen´ı. Lognorm´aln´ı rozdˇelen´ı do t´eto rodiny nepatˇr´ı. Dalˇs´ım d˚ uleˇzit´ ym aspektem zobecnˇen´ı v GLM je existence line´arn´ıho prediktoru a spojovac´ı funkce. Necht’ y1 , ...yn jsou nez´avisl´a pozorov´an´ı se stˇredn´ımi hodnotami µ1 , ..., µn a necht’ pozorov´an´ı yi m´a rozdˇelen´ı z exponenci´aln´ı rodiny. Line´arn´ı kombinace vektoru vysvˇetluj´ıch promˇenn´ ych ′ x = (x1 , ..., xk ) a vektoru nezn´am´ ych parametr˚ u β se naz´ yv´a line´arn´ı prediktor η: k X η = x′ β = β0 + βi xi . i=1
Line´arn´ı prediktor ηi je se stˇredn´ı hodnotou µi spojen prostˇrednictv´ım prost´e diferencovateln´e spojovac´ı funkce (link function): ηi = g(µi ), i = 1, ..., n.
Plat´ı tedy: E(yi ) = µi = g −1 (ηi ) = g −1 (x′i β). V t´eto pr´aci budeme uvaˇzovat pouze kanonickou spojovac´ı funkci.4 Spojovac´ı funkce je kanonick´a, pokud se line´arn´ı prediktor rovn´a kanonick´emu parametru, tj. pokud ηi = θi . Spojovac´ı funkce g(µi ) je v tomto pˇr´ıpadˇe funkc´ı 4
Pˇrehled ostatn´ıch spojovac´ıch funkc´ı je moˇzno nal´ezt v [7].
33
inverzn´ı k b′ (θi ). Kanonick´e spojovac´ı funkce bˇeˇznˇe pouˇz´ıvan´ ych rozdˇelen´ı z exponenci´aln´ı rodiny jsou spoleˇcnˇe s jejich charakteristikami shrnuty v tabulce 2.5 na stranˇe 35. Parametry zobecnˇen´eho line´arn´ıho modelu se odhaduj´ı metodou maxim´aln´ı vˇerohodnosti (Maximum Likelihood Estimate, MLE). Logaritmick´a vˇerohodnostn´ı funkce m´a tvar: n X yi θi − b(θi ) ℓ(y, β) = ( + c(yi , φ)) ai (φ) i=1
Derivaci logaritmick´e vˇerohodnostn´ı funkce lze za pouˇzit´ı kanonick´e spojovac´ı funkce vyj´adˇrit jako: · ¸ n n n X X ∂ℓ db(θi ) yi − µi ∂ℓ ∂θi X 1 yi − xi = = = xi . ∂β ∂θ ∂β a (φ) dθ a (φ) i i i i i=1 i=1 i=1 Maxim´alnˇe vˇerohodn´ y odhad parametr˚ u β je pak ˇreˇsen´ım soustavy: n X yi − µi i=1
ai (φ)
xi = 0.
(2.8)
K nalezen´ı ˇreˇsen´ı soustavy 2.8 vzhledem k parametru β se pouˇz´ıv´a iteraˇcnˇe v´aˇzen´a metoda nejmenˇs´ıch ˇctverc˚ u (Iteratively Reweighted Least Squares, IRLS). Algoritmus t´eto metody, stejnˇe jako vyj´adˇren´ı odhad˚ u parametru β, jsou uvedeny v [7]. V t´eto pr´aci jsme k odhadu parametr˚ u vyuˇzili funkci, kter´a je na iteraˇcnˇe v´aˇzen´e metodˇe nejmenˇs´ıch ˇctverc˚ u zaloˇzen´a - funkci glmfit programu Matlab. Mezi nejˇcastˇeji pouˇz´ıvan´e testov´e statistiky slouˇz´ıc´ı k posouzen´ı kvality zobecnˇen´ ych line´arn´ıch model˚ u a jejich vz´ajemn´emu srovn´an´ı patˇr´ı ˇsk´alovan´a deviance (scaled deviance) a ˇsk´alovan´a Pearsonova X 2 (ch´ı-kvadr´at) statistika. ˇ alovan´a deviance porovn´av´a skuteˇcnou hodnotu logaritmick´e vˇerohodSk´ nostn´ı funkce s jej´ı maxim´aln´ı moˇznou hodnotou. Pro pevnou hodnotu disperzn´ıho parametru φ je ˇsk´alovan´a deviance d´ana vztahem: b − ℓ(y, µ)). D∗ = 2(ℓ(y, β)
Maxim´aln´ı moˇzn´e hodnoty logaritmick´e vˇerohodnostn´ı funkce lze dos´ahnout, pokud je poˇcet odhadovan´ ych parametr˚ u v modelu stejn´ y jako poˇcet mˇeˇren´ı. Tedy pokud m´a kaˇzd´e pozorov´an´ı vlastn´ı parametr. Takov´ yto model naz´ yv´ame saturovan´y. Vektor β lze v tomto pˇr´ıpadˇe ztotoˇznit s vektorem µ a vyhlazen´a stˇredn´ı hodnota µbi je rovna pˇr´ımo pororov´an´ı yi . 34
Tabulka 2.5: Charakteristiky nˇekter´ ych bˇeˇznˇe pouˇz´ıvan´ ych rozdˇelen´ı z exponenci´aln´ı rodiny. Zdroj [7].
35
Norm´aln´ı
Poissonovo
Binomick´e
Gamma
Inverzn´ı Gaussovo
Oznaˇcen´ı
N (µ, σ 2 )
P (µ)
Bi(m, π)/m
G(µ, ν)
IG(µ, σ 2 )
Definiˇcn´ı obor y
(−∞, ∞)
0, 1, 2, ..., ∞
0,1,2,...,∞ m
(0, ∞)
(0, ∞)
σ2
1
1 m
1 ν
σ2
θ2 /2
exp(θ)
ln(1 + eθ )
− ln(−θ)
√ − −2θ
Disperzn´ı parametr φ Kumulantov´a funkce b(θ) c(y, φ)
2 − 21 ( yφ
+ ln(2πφ))
− ln(y!)
ln
¡m¢ my
ln( φy )−ln(y) − 12 (ln(2πφy 3 ) + − ln(Γ( φ1 )) 1 φ
µ(θ) = E(Y, θ)
θ
exp(θ)
eθ 1+eθ
− 1θ
√1 −2θ
Kanonick´ y link η = θ(µ)
µ
ln(µ)
µ ln( 1−µ )
1 µ
1 µ2
Varianˇcn´ı funkce V (µ)
1
µ
µ(1 − µ)
µ2
µ3
1 ) φy
Vyn´asoben´ım ˇsk´alovan´e deviance D∗ disperzn´ım parametrem φ dostaneme devianci : D = φD∗ . Pro nejˇcastˇeji pouˇz´ıvan´a rozdˇelen´ı v zobecnˇen´ ych line´arn´ıch modelech je deviance d´ana vztahy uveden´ ymi v tabulce 2.6. Rozdˇ elen´ı Norm´aln´ı Poissonovo Binomick´e Gamma Inverzn´ı Gaussovo
Deviance Pn bi )2 i=1 (yi − µ P 2 ni=1 [yi ln( µybii ) − (yi − µbi )] P mi −yi 2 ni=1 [yi ln( µybii ) + (mi − yi ) ln( m )] bi i −µ Pn 2 i=1 [− ln( µybii ) + ( yi −µbiµbi ) ] Pn (yi −µbi )2 i=1
µbi 2 yi
Tabulka 2.6: Deviance nˇekter´ ych rozdˇelen´ı v GLM modelech. Druhou nejˇcastˇejˇs´ı m´ırou kvality vyhlazen´ı v zobecnˇen´ ych line´arn´ıch modelech je Pearsonova X 2 statistika, resp. ˇsk´alovan´a Pearsonova X 2 statistika, definovan´a jako: n X (yi − µbi )2 2 X = , resp. X 2 /φ. V (µbi ) i=1
Pokud nen´ı disperzn´ı parametr φ zn´am, je k jeho odhadu moˇzn´e pouˇz´ıt jak Pearsonovu X 2 statistiku, tak devianci: φb =
D X2 , φb = , n−k n−k
kde n je poˇcet pozorov´an´ı a k poˇcet odhadovan´ ych parametr˚ u v modelu. Jmenovatel n − k souvis´ı s t´ım, ˇze obˇe ˇsk´alovan´e verze v´ yˇse uveden´ ych statistik maj´ı za urˇcit´ ych podm´ınek asymptoticky ch´ı-kvadr´at rozdˇelen´ı s n − k stupni volnosti. Disperzn´ı parametr φ lze ovˇsem odhadnout tak´e metodou maxim´aln´ı vˇerohodnosti, viz [7]. Software pracuj´ıc´ı se zobecnˇen´ ymi line´arn´ımi modely d´av´a jako v´ ystup mimo jin´e tzv. scale parametr. Tento parametr je odhadnut pomoc´ı MLE, souvis´ı s konstantn´ım koeficientem rozptylu a d´a se pouˇz´ıt k odhadu φ. √ Pro gamma rozdˇelen´ı plat´ı scale = 1/φ, pro ostatn´ı rozdˇelen´ı je pak scale = φ. Pod´ıvejme se jeˇstˇe na rezidua, kter´a umoˇzn ˇuj´ı vizualizaci kvality modelu ve vztahu k dat˚ um, pro neˇz byl model vytvoˇren. Rezidua bˇeˇznˇe pouˇz´ıvan´a v standardn´ı line´arn´ı regresi, tj. yi − µbi , nejsou pro GLM pˇr´ıliˇs vhodn´a, protoˇze rozptyl yi nen´ı konstantn´ı. Intuintivnˇejˇs´ımi typy rezidu´ı jsou Pearsonova rezidua, kter´a vych´azej´ı z Pearsonovy X 2 statistiky (ovˇsem pro jin´a 36
neˇz norm´aln´ı rozdˇelen´ı mohou b´ yt zeˇsikmen´a): n yi − µbi X 2 , rpi = X 2 rpi = p V (µbi ) i=1
a devianˇcn´ı rezidua, kter´a nesou stejn´a znam´enka jako yi − µbi a souvis´ı s devianc´ı: s Z n n yi X X p yi − s 2 ds, rdi = rdi = sign(yi −µbi ) di = sign(yi −µbi ) 2 di = D. µi V (s) i=1 i=1 Vrat’me se nyn´ı zpˇet k naˇsemu pˇr´ıkladu. Uk´azali jsme, ˇze poˇcty vznikl´ ych ˇskod za den maj´ı negativnˇe binomick´e rozdˇelen´ı. Naˇs´ım c´ılem bylo d´ale urˇcit parametry tohoto rozdˇelen´ı pro kaˇzd´ y den zkouman´eho obdob´ı a predikovat poˇcty vznikl´ ych ˇskod. Negativnˇe binomick´e rozdˇelen´ı vylouˇcilo pouˇzit´ı klasick´eho line´arn´ıho regresn´ıho modelu, protoˇze nesplˇ nuje z´akladn´ı pˇredpoklad o normalitˇe rozdˇelen´ı. Vhodnou alternativou n´am byly pr´avˇe popsan´e zobecnˇen´e line´arn´ı modely. Pˇrestoˇze negativnˇe binomick´e rozdˇelen´ı pˇr´ımo nepatˇr´ı do exponenci´aln´ı rodiny rozdˇelen´ı, je s touto rodinou pˇr´ıbuzn´e. Lze jej odvodit z Poissonova rozdˇelen´ı, jehoˇz parametr je n´ahodn´a veliˇcina s Gama rozdˇelen´ım.5 K modelov´an´ı poˇct˚ u vznikl´ ych ˇskod jsme pouˇzili zobecnˇen´ y line´arn´ı model s Gama rozdˇelen´ım G(µ, ν) a odpov´ıdaj´ıc´ı kanonickou spojovac´ı funkc´ı 1/µ, kter´ y byl vybr´an na z´akladˇe srovn´an´ı ˇsk´alovan´ ych devianc´ı, 2 Pearsonovy X statistiky a grafick´eho srovn´an´ı Pearsonov´ ych rezidu´ı model˚ u s norm´aln´ım, Poissonov´ ym a inverznˇe-gaussov´ ym rozdˇelen´ım. Grafy Pearsonov´ ych rezidu´ı Gama modelu jsou na obr´azku 2.6. Jako vysvˇetluj´ıc´ı promˇennou jsme v GLM modelu s Gama rozdˇelen´ım volili ˇcas, tj. vektor t = (1, ..., 1400)′ . Parametry β = (0.008227, −0.000001) jsme nalezli pomoc´ı funkce glmfit programu MATLAB, jej´ımˇz v´ ystupem byl tak´e parametr scale = 9.2586 a deviance D = 148.345654. Odtud φ = 1/scale = 0.1080 (pˇr´ıpadnˇe φ = 0.1061, pokud bychom k odhadu D disperzn´ıho parametru pouˇzili devianci D, tj. vztah φb = n−k ) a D∗ = D/φ = 1373.4729 (pˇr´ıpadnˇe D∗ = 1398.1682). Line´arn´ı prediktor byl tedy tvaru ηi = 0.008227 − 0.000001ti . Ze vztahu µi = g −1 (ηi ) jsme odvodili 1 µi = . 0.008227 − 0.000001ti K dispozici jsme tak mˇeli dostateˇcn´e mnoˇzstv´ı podklad˚ u k stanoven´ı parametr˚ u negativnˇe binomick´eho rozdˇelen´ı definovan´eho pravdˇepodobnostmi: ¶ µ n+h−1 h p (1 − p)n , h > 0, 0 < p < 1, n = 0, 1, ... P (N = n) = n 5
Odvozen´ı lze nal´ezt v [5], str. 12-14.
37
Pearson Residuals (Gamma) vs Fitted Values
6
6
5
5
4
4 Pearson Residuals
Pearson Residuals
Pearson Residuals vs Response (y)
3 2 1
2 1
0
0
−1
−1 100
200
300 400 500 600 Response Variable (y): pocty skod
700
120
125
130
135 140 Fitted Values
Pearson Residuals (Gamma) vs
Normal Probability Plot
2 log( Fitted Values )
Pearson Residuals (Gamma)
145
150
6
6
5
5
4
4
3
3
Residuals
Pearson Residuals
3
2
2 1
1
0
0
−1
−1
Normal Distribution (same mean, variance) 9
9.5 10 2 log( Fitted Values )
10.5
−2 −4
11
−3
−2
−1 0 1 Standard Normal Deviate
2
3
4
Obr´azek 2.6: Pearsonova rezidua GLM modelu s Gama rozdˇelen´ım. Pˇripomeˇ nme, ˇze pro veliˇcinu modelovanou pomoc´ı GLM s Gama rozdˇelen´ım plat´ı vztahy: E(yi ) = µi , Var(yi ) = µ2i /scale. Parametry h a p negativnˇe binomick´eho rozdˇelen´ı jsme z´ıskali jako ˇreˇsen´ı soustavy rovnic, kterou jsme sestavili porovn´an´ım vztah˚ u pro stˇredn´ı hodnotu a rozptyl veliˇciny poˇct˚ u vznikl´ ych ˇskod z´ıskan´ ych z GLM modelu na stranˇe lev´e a z negativnˇe binomick´eho rozdˇelen´ı na stranˇe prav´e: µ = h(1 − p)/p µ /scale = h(1 − p)/p2 2
ˇ sen´ı je tvaru h = µ · scale/(µ − scale), p = scale/µ. Poˇcty vznikl´ Reˇ ych ˇskod za den byly generov´any z negativnˇe binomick´eho rozdˇelen´ı s pr´avˇe odvozen´ ymi parametry. Pˇr´ıklad jednoho takov´eho generov´an´ı pro n´ami zkouman´e obdob´ı (tj. pro t = 732, ..., 1827) je na obr´azku 2.7. Obr´azek 2.8 zn´azorˇ nuje skuteˇcnˇe vznikl´e poˇcty ˇskod, z kter´ ych jsme vych´azeli pˇri modelov´an´ı rozdˇelen´ı, a tak´e stˇredn´ı hodnotu µ poˇctu vznikl´ ych ˇskod z´ıskanou z GLM s Gama rozdˇelen´ım.
38
400 350
Pocet vzniklych skod
300 250 200 150 100 50 0 2002
2003
2004
2005
Obr´azek 2.7: Pˇr´ıklad generovan´ ych poˇct˚ u ˇskod ve zkouman´em obdob´ı.
800 700
Pocet vzniklych skod
600 500 400 300 200 100 0 2000
2001
2002
2003
2004
Obr´azek 2.8: Skuteˇcnˇe vznikl´e poˇcty ˇskod za den s ˇcervenˇe zn´azornˇenou stˇredn´ı hodnotou µ z´ıskanou z GLM s Gama rozdˇelen´ım. 39
2.6
Urˇ cen´ı poˇ ctu nenahl´ aˇ sen´ ych ˇ skod
Zat´ımco v pˇredch´azej´ıc´ı ˇc´asti jsme se zab´ yvali poˇcty ˇskod vznikl´ ymi v jednotliv´ ych dnech zkouman´eho obdob´ı, nyn´ı si uk´aˇzeme, jak stanovit, kolik z nich nebylo ke dni v´ ypoˇctu IBNR rezervy (tj. k 31.12.2004) nahl´aˇseno. Pravdˇepodobnost, ˇze bude konkr´etn´ı ˇskoda nahl´aˇsena v it´em dni od sv´eho vzniku, je d´ana logaritmicko norm´aln´ım rozdˇelen´ım n´ami definovan´e veliˇciny Y (doby mezi vznikem a nahl´aˇsP en´ım ˇskody). Oznaˇcme ji pi = 1095 P (i − 1 < Y ≤ i). Pˇredpokl´ad´ame, ˇze epodobnost, i=0 pi = 1. Pravdˇ ˇze bude dan´a ˇskoda nahl´ Paˇsena do j dn´ı od sv´eho vzniku, je moˇzno vyj´adˇrit jako p′j = P (Y ≤ j) = ji=0 pi . N´ami generovan´e poˇcty ˇskod, kter´e vznikly j dn´ı pˇred dnem v´ ypoˇctu IBNR rezervy, oznaˇcme nj ; mj oznaˇcme poˇcet ˇskod z nj , kter´e nebyly ke dni v´ ypoˇctu IBNR rezervy nahl´aˇseny. M´ame nj ˇskod, z nichˇz kaˇzd´a je nahl´aˇsena s pravdˇepodobnost´ı p′k . Poˇcet nenahl´aˇsen´ ych ˇskod je n´ahodn´a veliˇcina, kter´a je souˇctem nj alternativnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin (s parametrem 1 − p′k ), a m´a tedy binomick´e rozdˇelen´ı s parametry nj a 1−p′k . Hledan´e realizace mj z´ısk´ame generov´an´ım z tohoto rozdˇelen´ı. V horn´ı ˇc´asti obr´azku 2.9 je zn´azornˇena jedna z moˇzn´ ych realizac´ı poˇct˚ u nenahl´aˇsen´ ych ˇskod odpov´ıdaj´ıc´ı poˇct˚ um vznikl´ ych ˇskod z obr. 2.7. V doln´ı ˇc´asti obr´azku 2.9 je pak poˇcet skuteˇcnˇe nenahl´aˇsen´ ych ˇskod k 31.12.2004. 250 200 150 100 50 0 2002
2003
2004
2005
2003
2004
2005
250 200 150 100 50 0 2002
Obr´azek 2.9: Moˇzn´a realizace poˇctu nenahl´aˇsen´ ych ˇskod odpov´ıdaj´ıc´ı poˇct˚ um vznikl´ ych ˇskod z obr. 2.7(nahoˇre), skuteˇcnˇe nenahl´aˇsen´e poˇcty ˇskod (dole).
40
2.7
V´ ypoˇ cet rozdˇ elen´ı IBNR rezervy
Z´avˇereˇcn´a ˇc´ast t´eto kapitoly a tak´e posledn´ı krok naˇseho postupu se vˇenuje v´ ypoˇctu rozdˇelen´ı IBNR rezervy, a tedy i v´ ypoˇctu v´ yˇse IBNR rezervy pro ˇskody vznikl´e v obdob´ı od 1.1.2002 do 31.12.2004, ale do 31.12.2004 nenahl´aˇsen´e. Hodnoty IBNR rezervy byly z´ısk´any na z´akladˇe simulace ˇskodn´ıho pr˚ ubˇehu ve zkouman´em obdob´ı: 1. Pro kaˇzd´ y den j, kde j = 0, ..., 1095 oznaˇcuje poˇcet dn´ı mezi zkouman´ ym dnem a dnem, ke kter´emu poˇc´ıt´ame IBNR rezervu, jsme nagenerovali poˇcet vznikl´ ych ˇskod nj . Generovali jsme z n´ahodn´e veliˇciny s rozdˇelen´ım N B(µj · scale/(µj − scale), scale/µj ), jehoˇz parametry scale = 9.2586, µj = 1/(0.008227 − 0.000001(1827 − j)) byly odhadnuty s vyuˇzit´ım zobecnˇen´ ych line´arn´ıch model˚ u. Podrobnˇeji viz ˇc´ast 2.5. 2. Poˇcet nenahl´aˇsen´ ych ˇskod vznikl´ ych v jt´em dni (tj. mj ) jsme pot´e generovali z n´ahodn´e veliˇciny Mj ∼ Bi(nj , 1 − p′j ), kde p′j
= P (Y ≤ j) =
j X
j X
pi =
i=0
i=0
P (i − 1 < Y ≤ i),
1095 X
pi = 1.
i=0
3. Pravdˇepodobnost, ˇze ˇskoda bude nahl´aˇsena v it´em dni od sv´eho vzniku za podm´ınky, ˇze od vzniku ˇskody jiˇz uplynulo j dn´ı, je definov´ana jako: pi pi,j = P (Y = i|Y ≥ j) = P1095 i=j
pi
= 0
, i = j, ..., 1095 , i = 0, ..., j − 1
Z t´eto podm´ınˇen´e pravdˇepodobnosti jsme pro kaˇzdou nenahl´aˇsenou ˇskodu z mj simulovali den i, ve kter´em bude nahl´aˇsena. 4. Algoritmem popsan´ ym v ˇc´asti 2.4 jsme pak pro kaˇzdou ˇskodu z mj nahl´aˇsenou se zpoˇzdˇen´ım i vygenerovali odpov´ıdaj´ıc´ı v´ yˇsi ˇskody x. Hodnotu IBNR rezervy pr´avˇe popsan´e simulace ˇskodn´ıho pr˚ ubˇehu zkouman´eho obdob´ı (oznaˇcme ji s) jsme spoˇcetli jako: s
IBN R =
Mj 1095 X X j=0 k=1
41
xsj,k .
8
2.7
x 10
2.6 2.5
Vyse IBNR rezervy
2.4 2.3 2.2 2.1 2 1.9 1.8 1.7
0
200
400
600
800
1000
Simulace
Obr´azek 2.10: V´ yˇse IBNR rezerv z´ıskan´ ych simulac´ı ˇskodn´ıho pr˚ ubˇehu ve zkouman´em obdob´ı. Provedli jsme tis´ıc simulac´ı ˇskodn´ıho pr˚ ubˇehu a z´ıskali tak 1000 hodnot v´ yˇse IBNR rezervy. Jejich grafick´e zn´azornˇen´ı je moˇzno nal´ezt na obr´azku 2.10. Minim´aln´ı hodnota v´ yˇse IBNR rezervy simulovan´ ych ˇskodn´ıch pr˚ ubˇeh˚ u byla v naˇsem pˇr´ıpadˇe 173.78 mil. Kˇc, maxim´aln´ı pak 262.07 mil. Kˇc. V´ yslednou v´ yˇsi IBNR rezervy jsme stanovili jako stˇredn´ı hodnotu ze z´ıskan´ ych hodnot, tj. 205.94 mil. Kˇc. Smˇerodatn´a odchylka hodnot byla 12.22 mil. Kˇc. Vzhledem k principu simulace a tvaru histogramu z´ıskan´ ych hodnot (obr. 2.11) jsme se domn´ıvali, ˇze rozdˇelen´ı IBNR rezervy z´ıskan´e simulac´ı je norm´aln´ı. Normalitu jsme ovˇeˇrili pomoc´ı Lillieforsova testu. Lillieforsova testov´a statistika 0.0250 byla menˇs´ı neˇz kritick´a hodnota 0.0280 na 5% hladinˇe v´ yznamnosti, takˇze hypot´ezu o normalitˇe jsme na dan´e hladinˇe nezam´ıtli. P-hodnota tohoto testu byla 0.1193. Rozdˇelen´ı IBNR rezervy z´ıskan´e pomoc´ı simulace jsme porovn´avali s rozdˇelen´ım IBNR rezervy stanoven´ ym pomoc´ı metody Chain ladder. V´ ypoˇcet ’ touto metodou provedla pojiˇst ovna Kooperativa, pouˇzit´ım Mackova modelu pro Chain ladder. Dodala n´am stˇredn´ı hodnotu 223.91 mil. Kˇc. a smˇerodatnou odchylku rovnou 14.03 mil. Kˇc. Pojiˇst’ovna Kooperativa pouˇz´ıv´a pro grafick´e zn´azornˇen´ı rozdˇelen´ı IBNR rezervy arbitr´arnˇe norm´aln´ı (pˇr´ıpadnˇe logaritmicko norm´aln´ı) rozdˇelen´ı. Gra42
−8
x 10
IBNR Normalni Log−normalni
3.5 3
Hustota
2.5 2 1.5 1 0.5 0
1.8
1.9
2
2.1
2.2 Data
2.3
2.4
2.5
2.6 8
x 10
Obr´azek 2.11: Histogram v´ yˇs´ı IBNR rezervy. 1 0.9 0.8
Distribucni funkce
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1.5
metoda Chain ladder nami navrzena metoda 2
2.5 Data
3 8
x 10
Obr´azek 2.12: Srovn´an´ı distribuˇcn´ıch funkc´ı rozdˇelen´ı IBNR rezervy z´ıskan´ ych r˚ uzn´ ymi metodami. 43
fick´e srovn´an´ı empirick´e distribuˇcn´ı funkce rozdˇelen´ı IBNR rezervy z´ıskan´e simulac´ı a distribuˇcn´ı funkce norm´aln´ıho rozdˇelen´ı s parametry z´ıskan´ ymi pomoc´ı Mackovy metody pro Chain ladder lze nal´ezt na obr´azku 2.12. Obˇe metody tedy vybraly za rozdˇelen´ı IBNR rezervy norm´aln´ı rozdˇelen´ı. V naˇsem pˇr´ıpadˇe jsou norm´aln´ı rozdˇelen´ı posunuta ve stˇredn´ı hodnotˇe. Pomoc´ı testu o rovnosti rozptyl˚ u norm´aln´ıho rozdˇelen´ı (viz [1], str. 82-84) jsme testovali hypot´ezu, zda se rozptyl σ 2 z´ıskan´ y simulac´ı rovn´a rozptylu σ02 z´ıskan´emu pomoc´ı metody Chain ladder, proti alternativˇe, ˇze jsou tyto rozptyly r˚ uzn´e. Oboustrann´ y interval spolehlivosti pro σ 2 s koeficientem spolehlivosti 0.95 byl (136.96 biliard, 163.23 biliard). Jak je zˇrejm´e, neobsahuje hodnotu σ02 rovnou 196.78 biliard´am. Hypot´ezu o rovnosti rozptyl˚ u jsme na 5% hladinˇe v´ yznamnosti zam´ıtli. Ve skuteˇcnosti nebylo do 31.12.2004 nahl´aˇseno 4314 ˇskod vznikl´ ych v obdob´ı od 1.1.2002 do 31.12.2004, za nˇeˇz bylo vyplaceno 195.91 mil. Kˇc. Pˇrestoˇze jsou tedy hodnoty IBNR rezervy stanoven´e obˇema metodami r˚ uzn´e a maj´ı r˚ uzn´a rozdˇelen´ı, v obou pˇr´ıpadech je jimi stanoven´a IBNR rezerva postaˇcuj´ıc´ı.
44
Z´ avˇ er C´ılem diplomov´e pr´ace bylo prostudovat moˇznost aplikace teorie kopul na v´ ypoˇcet IBNR rezervy v neˇzivotn´ım pojiˇstˇen´ı. V prvn´ı kapitole jsme se zab´ yvali teori´ı kopul. Z´akladn´ı vlastnosti kopul jsme doplnili pˇrehledem jejich nejzn´amˇejˇs´ıch rodin. Vˇenovali jsme se zejm´ena Archim´edovsk´ ym kopul´am, protoˇze Claytonovu, Gumbelovu a Frankovu kopulu, kter´e do t´eto rodiny patˇr´ı, jsme pro jejich snadnou zkonstruovatelnost vybrali k modelov´an´ı v´ yˇse ˇskod v ˇcase. Modelov´an´ı v´ yˇse ˇskod v ˇcase a v´ ypoˇctu rozdˇelen´ı IBNR rezervy byla vˇenov´ana druh´a kapitola. Pracovali jsme s daty o ˇskod´ach havarijn´ıho pojiˇstˇen´ı z let 1991-2007, kter´a n´am poskytla pojiˇst’ovna Kooperativa. N´ahodnou veliˇcinu popisuj´ıc´ı v´ yˇse ˇskod jsme aproximovali logaritmicko norm´aln´ım rozdˇelen´ım s parametry µ = 9.9345 a σ = 1.3898. Veliˇcinu charakterizuj´ıc´ı dobu mezi vznikem a nahl´aˇsen´ım ˇskody pak logaritmicko norm´aln´ım rozdˇelen´ım s parametry µ = 2.5240 a σ = 1.2164. Ke konstrukci sdruˇzen´e distribuˇcn´ı funkce obou veliˇcin jsme pouˇzili proceduru Genest-Rivest (1993) [3], kter´a identifikuje Archim´edovskou kopulu, jeˇz je sv´ ymi hodnotami nejbl´ıˇze sdruˇzen´e distribuˇcn´ı funkci obou veliˇcin. V naˇsem pˇr´ıpadˇe byla vybr´ana Gumbelova kopula s parametrem 1.0391. V´ yˇsi IBNR rezervy jsme stanovovali pro ˇskody vznikl´e v obdob´ı od 1.1.2002 do 31.12.2004 a k 31.12.2004 nenahl´aˇsen´e. V´ yslednou hodnotu jsme z´ıskali z 1000 simulac´ı ˇskodn´ıho v´ yvoje. Simulovali jsme nejen poˇcty vznikl´ ych a nenahl´aˇsen´ ych ˇskod, ale tak´e zpoˇzdˇen´ı, s jak´ ym byly ˇskody nahl´aˇseny, a v´ yˇsi tˇechto ˇskod. Poˇcty vznikl´ ych ˇskod jsme simulovali z negativnˇe binomick´eho rozdˇelen´ı s parametry promˇenn´ ymi v ˇcase, kter´e jsme nalezli pomoc´ı zobecnˇen´ ych line´arn´ıch model˚ u. Poˇcty nenahl´aˇsen´ ych ˇskod jsme pro kaˇzd´ y den j zkouman´eho obdob´ı generovali z binomick´eho rozdˇelen´ı s parametry nj a 1 − p′j , kde nj odpov´ıd´a nasimulovan´emu poˇctu vznikl´ ych ˇskod ve dni j a 1 − p′j vyjadˇruje pravdˇepodobnost nenahl´aˇsen´ı ˇskody do 31.12.2004. Zpoˇzdˇen´ı v nahl´aˇsen´ı jsme pro nenahl´aˇsen´e ˇskody generovali z logaritmicko norm´aln´ıho rozdˇelen´ı veliˇciny doby mezi vznikem a nahl´aˇsen´ım ˇskody, kter´e jsme podm´ınili poˇctem jiˇz uplynul´ ych dn˚ u mezi vznikem ˇskody a 31.12.2004. A koneˇcnˇe v´ yˇsi ˇskody jsme generovali z Gumbelovy kopuly s parametrem 1.0391 po-
45
moc´ı simulaˇcn´ıho algoritmu popsan´eho na str. 27, ve kter´em jsme vyuˇzili nasimulovan´ ych hodnot zpoˇzdˇen´ı v nahl´aˇsen´ı. V´ ysledn´a v´ yˇse IBNR rezervy byla stanovena na 205.94 mil. Kˇc. Pro srovn´an´ı hodnota spoˇcten´a metodou Chain ladder byla 223.91 mil. Kˇc a skuteˇcn´a ˇskodn´ı potˇreba re´alnˇe nenahl´aˇsen´ ych ˇskod byla 195.91 mil Kˇc. Hodnota spoˇcten´a n´ami navrˇzenou metodou byla tedy v tomto pˇr´ıpadˇe pˇresnˇejˇs´ı neˇz hodnota stanoven´a metodou Chain ladder. Zkoumali jsme tak´e rozdˇelen´ı IBNR rezervy. Obˇe metody vybraly za rozdˇelen´ı IBNR rezervy norm´aln´ı rozdˇelen´ı. N´ami navrˇzen´a metoda s parametry µ = 205.94 mil. Kˇc a σ = 12.22 mil. Kˇc., metoda Chain ladder s parametry µ = 223.91 mil. Kˇc a σ = 14.03 mil. Kˇc. Zda d´av´a obecnˇe lepˇs´ı v´ ysledky n´ami navrˇzen´a metoda nebo metoda Chain ladder, nebylo moˇzn´e jednoznaˇcnˇe rozhodnout. K tomu by bylo zapotˇreb´ı aplikovat metodu na v´ıce r˚ uzn´ ych obdob´ı ˇskodn´ıho v´ yvoje, pˇr´ıpadnˇe tak´e na jin´ y druh pojiˇst’ˇen´ı (napˇr. s vyˇsˇs´ı m´ırou z´avislosti mezi v´ yˇs´ı ˇskody a zpoˇzdˇen´ım v jej´ım nahl´aˇsen´ı). Navrˇzen´ y stochastick´ y pˇr´ıstup nicm´enˇe nab´ıdl zaj´ımavou alternativu standardn´ım metod´am v´ ypoˇctu IBNR rezervy, kter´e ovˇsem mohou b´ yt v praxi preferov´any pro rychlejˇs´ı realizovatelnost.
46
Literatura [1] Andˇel, J.: Statistick´e metody, Matfyzpress; 2003. [2] Frees, E.W., Valdez, E.A.: Understanding Relationships Using Copulas, North American Actuarial Journal 2; 1998. 1-25. [3] Genest, C., Rivest, L.: Statistical Inference Procedures for Bivariate Archimedean Copulas, Journal of the American Statistical Association, 88; 1993. 1034–1043. [4] Cherubini, U., Luciano, E., Vecchiato, W.: Copula Methods in Finance, The Wiley Finance Series, New York: Wiley; 2004. [5] Mandl, P., Mazurov´a, L.: Matematick´e z´aklady neˇzivotn´ıho pojiˇstˇen´ı, Matfyzpress; 1999. [6] De Matteis R.: Fitting Copulas to Data, Diploma Thesis, Institute of Mathematics of the University of Zurich; 2001. [7] McCullagh, P., Nelder, J.A.: Generalized Linear Models, Second Edition, Chapman & Hall/CRC; 1989. [8] Myers, R.H., Montgomery, D.C., Vining, G.G.: Generalized Linear Models: With Applications in Engineering and the Sciences, Wiley, John & Sons, Inc., 2002. [9] Nelsen, R.B.: An Introduction to Copulas, Second Edition, SpringerVerlag New York, Inc.; 2006. [10] Pettere, G., Kollo, T.: Modelling Claim Size in Time via Copulas, http://papers.ica2006.com/1A.html; 2006. [11] Pettere, G.: Modelling Incured but not reported claim reserve using copulas, http://www.uclm.es/actividades0506/congresos/icmsm2006/ /articles/Pettere06.pdf; 2006. [12] Schweizer, B.: Thirty years of copulas, In: Dall’Aglio G, Kotz S, Salinetti G. , editor. Advances in Probability Distributions with Given Marginals. Kluwer Academic Publishers; 1991. 13–50. 47
ˇ [13] Simurda, M.: Zobecnˇen´y line´arn´ı model: od z´aklad˚ u k aplikaci v anal´yze chov´an´ı pojistn´eho kmene a ˇskodn´ych ud´alost´ı, Semin´aˇr z aktu´arsk´ ych vˇed 2007/2008, Matfyzpress; 2008. 94–109.
48