Eötvös Loránd Tudományegyetem Természettudományi Kar
Kopulák alkalmazása a nem-élet biztosításokban
Biró Bianka
Alkalmazott matematikus BSc
Témavezet®:
Dr. Zempléni András
egyetemi docens
Valószín¶ségelméleti és Statisztika Tanszék
Budapest, 2016
Tartalomjegyzék
1. A kétdimenziós összefügg®ség modellezése 1.1. Mér®számok az összefügg®ség vizsgálatára . . . . . . . 1.1.1. Pearson-féle korrelációs együttható . . . . . . . 1.1.2. Rangkorrelációs együtthatók . . . . . . . . . . . 1.1.3. Farok-összefüggés . . . . . . . . . . . . . . . . . 1.2. A kopulák és tulajdonságaik . . . . . . . . . . . . . . . 1.3. A kopulák f®bb fajtái . . . . . . . . . . . . . . . . . . . 1.3.1. Elliptikus kopulák . . . . . . . . . . . . . . . . . 1.3.2. Arkhimédeszi kopulák . . . . . . . . . . . . . . 1.3.3. A kopulafajták összehasonlítása . . . . . . . . . 1.4. A kopulák és a rangkorrelációs együtthatók kapcsolata
7 . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
2. Módszerek kopulák illesztésére
8 8 8 9 10 12 12 13 17 19
22
2.1. A paraméterek maximum likelihood becslése . . . . . . . . . 2.2. Kopula illesztése rangszámok segítségével . . . . . . . . . . . 2.2.1. Empirikus kopulák . . . . . . . . . . . . . . . . . . . 2.3. A megfelel® kopula kiválasztása és az illeszkedés pontossága 2.4. Szimuláció Arkhimédeszi kopulákból . . . . . . . . . . . . .
3. Kopula illesztése a vizsgált adatokra
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
22 23 23 24 25
27
3.1. Az adatok bemutatása . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.2. Kopula illesztése . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4. Alkalmazás viszontbiztosítások díjkalkulációjára
32
4.1. A viszontbiztosítások . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 4.1.1. A matematikai modell . . . . . . . . . . . . . . . . . . . . . . 33 2
4.2. Peremeloszlások . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 4.3. Viszontbiztosítások árazása . . . . . . . . . . . . . . . . . . . . . . . 35
5. Összefoglalás
41
3
Köszönetnyilvánítás Ezúton szeretnék köszönetet mondani témavezet®mnek, Zempléni Andrásnak, aki mindvégig gyelemmel kísérte a munkám, hasznos tanácsokkal látott el, és segített egy olyan téma kiválasztásában, aminek feldolgozására sokszor kikapcsolódásként tekinthettem. Hálás vagyok családomnak a tanulmányaim alatt nyújtott sok-sok biztatásért és támogatásért, valamint barátaimnak, amiért végtelen türelemmel mellettem álltak a legnehezebb napokban is. Közülük külön köszönet illeti Rácz Nórit, aki lelkesedésével mindvégig motivált, és olykor szinte jobban várta a szakdolgozatom elkészültét, mint jómagam. Végül, de nem utolsó sorban, köszönettel tartozom Banáné Gyuró Juliannának, Szauer Anitának és Kiss Zoltánnak, akik nélkül ma 1-valószín¶séggel olyan dologgal foglalkoznék, ami kevésbé érdekel, mint a matematika.
4
Bevezetés A biztosítás alapait már az ókorban lefektették a kínai keresked®k, akik a szállítani kívánt árut több hajóra osztották szét, csökkentve ezzel a kockázatot, hogy egy esetleges hajótörés során a teljes árukészlet kárbavesszen, továbbá közös pénzalapot hoztak létre a veszteségek enyhítésére. Id®vel a díjak mértékét függ®vé tették többek közt a szállított árutól, valamint az út hosszától, viszont matematikai-statisztikai alapjai nem voltak még a díjszámításnak. A biztosításmatematika kialakulása a valószín¶ségszámítás és statisztika fejl®désével vonható párhuzamba, melynek kezdete a XVII. századra datálható. Az id®közben létrejött biztosítótársaságok különböz® kockázattípusok alapján hozták létre termékeiket, a díjak számításában pedig egyre nagyobb szerepet játszottak különböz® statisztikák és az egyes kockázatok eloszlásai is. Mára már számos terméket találunk a piacon, a biztosítók pedig különböz® kockázatfügg® modellek és alapos elemzések segítségével törekednek az optimális díjkalkulációra, és tartanak lépést a kockázatok folyamatos változásával és a tudomány fejl®désével. A modern biztosításokat két nagy csoportba, az élet- és nem-életbiztosítások közé sorolhatjuk. Az életbiztosítási szerz®dések jellemz®en hosszútávúak, melyek során a halálozás kockázata folyamatosan n®. A nem-életbiztosításokhoz általában egy éves, lejáratkor hosszabbítható szerz®dések tartoznak, a kockázatok pedig lényegében állandónak mondhatók. Ebbe az ágba soroljuk többek közt a felel®sség-, baleset- és lakásbiztosításokat. Nem nehéz meggondolni, hogy a két ágnál jelent®sen eltér®ek mind a tartalékképzés, mind a díjkalkuláció módszerei. A dolgozatban els®ként kétdimenziós összefügg®séget szeretnénk modellelzni, amiben a kopulafüggvények lesznek segítségünkre, melyek a XX. század végén kezdtek teret hódítani a biztosításmatematikán túl többek között pénzügyi matematikában, biológiában, valamint hidrológiában is. A széleskör¶ alkalmazhatóság nem meglep®, ugyanis számos területen van szükség arra, hogy összefügg® valószín¶5
ségi változók együttes eloszlását becsüljük, ez pedig kopulák segítségével egyszer¶en megtehet® akár magasabb dimenzióban is. A modellt alkalmazva szeretnénk viszontbiztosítások árazásába betekintést nyerni, melyhez felel®sségbiztosítások kárkizetési összegei, valamint a hozzájuk tartozó kárrendezési költségek állnak rendelkezésünkre. Sejthet®, hogy ezek nem függetlenek egymástól, továbbá mivel a költségek nem-életbiztosításoknál igen magasak lehetnek, a díjkalkuláció során sem mondhatók elhanyagolandónak. Az els® fejezetben látni fogjuk, hogy miként jellemezhet® két valószín¶ségi változó kapcsolata, és bemutatjuk magát a kétdimenziós összefügg®ségi modellt is. Ezután a második fejezetben különböz® módszereket ismertetünk kopulák illesztésére, majd a harmadik fejezetben alkalmazva mindezt az általunk vizsgált adatsorokra, eredményként a kárkizetések és költségek együttes eloszlására kapunk becslést. A negyedik fejezetben megvizsgáljuk az egyes peremeloszlásokat, majd összehasonlítjuk az összefügg®ségi modell alapján számolt viszontbiztosítási díjakat a függetlennek tekintett változók eloszlása alapján számoltakkal.
6
1. fejezet A kétdimenziós összefügg®ség modellezése Amikor több valószín¶ségi változó együttes viselkedését szeretnénk vizsgálni, az el®ször felmerül® kérdések egyike, hogy milyen kapcsolat áll fenn köztük. Amennyiben függetlenek egymástól, az együttes eloszlásfüggvényük felírható az egyes változók eloszlásfüggvényeinek szorzataként, ezek pedig a gyakorlatban is különböz® statisztikai módszerekkel egyszer¶en becsülhet®k. Sok esetben viszont nincs ennyire egyszer¶ dolgunk. Gyakran van szükség ugyanis arra, hogy olyan változók együttes eloszlására adjunk becslést, melyek nem függetlenek egymástól. Összefügg® változók esetén ez lényegesen bonyolultabb lehet, és a dimenziószám növekedésével is egyre több akadályba ütközhetünk. Ebben lesznek segítségünkre a kopulafüggvények, melyek az egydimenziós peremeloszlásokat kapcsolják össze az együttes eloszlással egy, a változók közti összefüggésen alapuló paraméteren keresztül. Els®ként az összefügg®ség leírásához használatos mér®számokat mutatjuk be, majd bevezetjük a kopulák denícióját és ismertetjük a leggyakrabban használt fajtáikat [7] és [8] alapján. Mivel a dolgozatban szerepl® alkalmazásban két változó közti kapcsolatot vizsgáljuk, a következ® deníciókat és tételeket a kétdimenziós esetre mondjuk ki, de magasabb dimenzióra is analóg módon kiterjeszthet®k.
7
1.1.
Mér®számok az összefügg®ség vizsgálatára
A megfelel® kopula kiválasztásához alapvet® fontosságú, hogy ismerjük a változók közti kapcsolatot, melyet különböz® mér®számokkal jellemezhetünk attól függ®en, hogy lineáris kapcsolatot, konkordanciát vagy az eloszlás szélein jelentkez® farokösszefüggést szeretnénk vizsgálni. 1.1.1.
Pearson-féle korrelációs együttható
A Pearson-féle korrelációs együttható a leginkább elterjedt mér®szám, ami két változó közti lineáris kapcsolat er®sségét, valamint irányát mutatja meg.
1.1.1. Deníció. Az X1 és X2 valószín¶ségi változók Pearson-féle korrelációs együtthatója a R(X1 , X2 ) =
cov(X1 , X2 ) , D(X1 )D(X2 )
ahol cov(X1 , X2 ) = E(X1 X2 ) − E(X1 )E(X2 ), továbbá D(X1 ), D(X2 ) > 0 rendre X1 és X2 szórásai, E pedig a várható értéket jelöli.
Amennyiben R(X1 , X2 ) = 0, X1 -et és X2 -t korreálatlannak nevezzük. Normális eloszlású valószín¶ségi változók esetében a korreálatlanság ekvivalens a függetlenséggel, ellenben más eloszlásoknál ez nincs így. Ha a változók függetlenek, akkor korreálatlanok, viszont a korreálatlanságból nem következtethetünk függetlenségre. A Pearson-féle korrelációs együttható további hátránya, hogy érzékeny a kiemelked®en nagy, illetve kicsi értékekre, valamint mivel nem invariáns a monoton transzformációra, az eredeti és a kopulából generált változókra kiszámolva is más-más értéket kapunk. 1.1.2.
Rangkorrelációs együtthatók
A Pearson-féle korrelációs együttható hátrányainak kiküszöböléséhez érdemes bevezetnünk a rangkorrelációs együtthatók fogalmát. Ha X1 -et és X2 -t egy-egy mintának tekintjük, ezek nagyság szerinti sorbarendezésével minden adatnak megfeleltethetünk egy-egy ún. rangszámot, ami azt mutatja meg, hogy a szóbanforgó adat hányadik legnagyobb érték a rendezett mintában. Ezeket a rangszámokat használva nem kell attól tartanunk, hogy a kiugró értékek 8
torzítanak az eredményen. A Spearman- és a Kendall-féle rangkorrelációs együtthatókkal a változók együttmozgását vizsgálhatjuk, utóbbi segítségével pedig egyszer¶en kifejezhetjük az Arkhimédeszi kopulák összefügg®ségi paraméterét is.
Kendall-féle
τ
1.1.2. Deníció. Legyen (X11 , X21 ) és (X12 , X22 ) két független koordinátapár F-b®l. Ekkor ρτ (X1 , X2 ) = P [(X11 − X12 )(X21 − X22 ) > 0] − P [(X11 − X12 )(X21 − X22 ) < 0]
a Kendall-féle rangkorrelációs együttható.
A denícióban szerepl® P [(X11 − X12 )(X21 − X22 ) > 0] az egyez® (konkordáns ) párok valószín¶sége, míg P [(X11 − X12 )(X21 − X22 ) < 0] az ellentétes (diszkordáns ) pároké. A konkordanciából arra következtethetünk, hogy az egyes változók nagy értékei állnak összefüggésben, míg a diszkordancia arra utal, hogy az egyik változó nagy, és a másik kis értékei között tapasztalhatunk összefüggést.
Spearman-féle ρ A Spearman-féle rangkorrelációs együttható a rangszámok közti Pearson-féle korreláció.
1.1.3. Deníció. Jelölje di az X1i - és X2i -hez tartozó rangszámok különbségét i = 1, 2, ..., n-re n-dimenziós vektorváltozók esetén. Ekkor a Spearman-féle rangkorrelá-
ciós együttható a
∑ 6 d2i ρS = 1 − . n(n2 − 1)
Hasonlóan Pearson korrelációs együtthatójához, ρS és ρτ értékei is -1 és 1 között helyezkednek el, szimmetrikusak, valamint 0-val való egyenl®ségük esetén egymástól függetlennek tekintjük a változókat. 1.1.3.
Farok-összefüggés
A gyakorlatban sokszor f®ként az extrém-értékek között fennálló konkordancia kérdése az érdekes. Ennek vizsgálata azon a feltételes valószín¶ségen alapul, hogy 9
az egyik változó meghalad-e egy rögzített küszöbértéket azon feltétel mellett, hogy a másikról tudjuk, hogy igen. Jelölje S a változók együttes túlélésfüggvényét, azaz v ∈ [0, 1]-re S(v, v) = P (F1−1 (X1 ) > v, F2−1 (X2 ) > v).
Ekkor λL -el jelölve az alsó és λU -val a fels® farok-összefüggést, λL = lim P (F1−1 (X1 ) < v|F2−1 (X2 ) < v), v→0
λU = lim P (F1−1 (X1 ) > v|F2−1 (X2 ) > v). v→1
Amennyiben λL = 0, nem tapasztalhatunk bal oldali, λU = 0 esetén jobb oldali farok-összefüggést az adatok közt. Az extrém-érték elmélet biztosítási alkalmazásaiban λU vizsgálata széles körben elterjedt, ugyanis segítségével felmérhet® annak a valószín¶sége, hogy egy nagy káresemény bekövetkezése más egyéb hasonló mérték¶ károkat von maga után. 1.2.
A kopulák és tulajdonságaik
1.2.1. Deníció. Legyen
U egy tetsz®leges [0, 1]2 -beli vektorváltozó, melynek U1
és U2 marginálisai a [0, 1] intervallumonn egyenletes eloszlást követnek. Azon C : [0, 1]2 → [0, 1] függvényeket, melyek felírhatók C(u1 , u2 ) = P (U1 ≤ u1 , U2 ≤ u2 )
(1.1)
alakban, (kétdimenziós) kopuláknak nevezzük.
Mivel C egy kétdimenziós eloszlásfüggvényt deniál, minden kopulára teljesülnek az alábbi tulajdonságok: 1. C (0, u) = C (u, 0) = 0 2. C (1, u) = C (u, 1) = u, ∀u ∈ [0, 1] 3. C (v1 , v2 ) + C (u1 , u2 ) ≥ C (v1 , u2 ) + C (u1 , v2 ) , ∀(u1 , u2 ) ∈ [0, 1]2 ; (v1 , v2 ) ∈ [0, 1]2 ], 0 ≤ u1 ≤ v1 ≤ 1; 0 ≤ u2 ≤ v2 ≤ 1
10
Vegyük észre, hogy minden kétdimenziós eloszlásfüggvényhez rendelhetünk kopulát. Ismeretes ugyanis, hogy tetsz®leges folytonos valószín¶ségi változót integráltranszformációval [0, 1] intervallumon egyenletes eloszlásúvá transzformálhatunk, azaz véve egy F1 eloszlásfüggvény¶ X1 és egy F2 eloszlásfüggvény¶ X2 változót, j = 1, 2-re: P (Fj (Xj ) ≤ u) = P (Xj ≤ (Fj−1 )(u)) = Fj (Fj−1 (u)) = u.
1.2.2. Megjegyzés. Amennyiben Fj nem invertálható, Fj−1 az általánosított inverzet jelöli.
Továbbá C(u1 , u2 ) = P (F1 (x1 ) ≤ u1 , F2 (x2 ) ≤ u2 ) = = P (X1 ≤ F1−1 (u1 ), X2 ≤ F2−1 (u2 )) = = F (F1−1 (u1 ), F2−1 (u2 )),
amib®l adódóan C(F1 (x1 ), F2 (x2 )) = F (x1 , x2 )
(1.2)
egy kétváltozós eloszlásfüggvényt deniál F1 és F2 marginálisokkal. Ezáltal tehát a kopulák lehet®vé teszik számunkra, hogy a peremeloszlásokat külön vizsgáljuk az együttes eloszlástól, valamint magasabb dimenzióban is kényelmes eszközként szolgálnak a változók együttes viselkedésének tanulmányozására. A kopulák elméleti alapjait Wassily Hoeding fektette le 1940-ben, majd Maurice Fréchet kezdte vizsgálni a kapcsolatot többdimenziós eloszlások és azok peremeloszlásai között. Mindezek után Abe Sklar 1959-ben mutatta meg, hogy bármely többváltozós eloszlásfüggvény felírható az (1.2) alakban, továbbá a peremeloszlások folytonossága esetén a kopula egyértelm¶. Ezt az eredményt foglalja össze az alábbi tétel:
1.2.3. Tétel (Sklar). Legyenek
X1 és X2 valószín¶ségi változók, melyek eloszlás-
függvényei rendre F1 és F2 , együttes eloszlásfüggvényüket pedig jelölje F . Ekkor létezik egy C kopula, melyre F (x1 , x2 ) = C(F1 (x1 ), F2 (x2 )). F1 és F2 folytonossága esetén C egyértelm¶.
11
1.3.
A kopulák f®bb fajtái
A leggyakrabban használt kopulákat két nagy családba, az elliptikus és Arkhimédeszi kopulák közé sorolhatjuk. A következ®kben ezen kopulacsaládok, és az ezekbe tartozó nevezetes kopulák kerülnek bemutatásra. 1.3.1.
Elliptikus kopulák
Az elliptikus kopulák sajátosságai, hogy valamely elliptikus eloszlásból származtatjuk ®ket, ezáltal hasonlóan könnyen tudunk szimulálni is bel®lük, mint az elliptikus eloszlásokból. Az elliptikus eloszlások a többváltozós normális eloszlások általánosításai, melyek számos biztosítási és pénzügyi alkalmazásban jelentenek hatékony eszközt különböz® kockázatok eloszlásainak vizsgálatára.
1.3.1. Deníció. Az
X = (X1 , X2 ) valószín¶ségi vektorváltozót (µ, Σ, ζ) paramé-
ter¶ elliptikus eloszlásúnak mondjuk, ha karakteriszikus függvénye φX (t) = exp(itT µ)ζ(tT Σt)
alakú, ahol µ egy kétdimenziós oszlopvektor, Σ egy 2 × 2-es pozitív denit mátrix, ζ pedig az ún. karakterisztikus generátorfüggvény.
A legfontosabb példa elliptikus eloszlásokra a normális és t-eloszlás. Az alábbiakban az ezekb®l származtatott kopulákat mutatjuk be.
Gauss-kopula 1.3.2. Deníció. Jelölje Φ az egy-, ΦR a kétdimenziós, R korrelációmátrixú standard normális eloszlás eloszlásfüggvényét. Ekkor a CG (u1 , u2 ) = ΦR (Φ−1 (u1 ), Φ−1 (u2 ))
a kétdimenziós normális eloszlás kopuláit, a Gauss-kopulákat határozza meg.
A pozitív, illetve negatív paraméter¶ Gauss-kopulák közti különbséget az 1.1. ábra szemlélteti, valamint az is jól látszik, hogy az összefügg®ség az eloszlás szélein jelentkezik er®sebben. 12
1.1. ábra. Gauss-kopula pozitív és negatív paraméterrel
Student-féle t-kopula 1.3.3. Deníció. A Student-féle t-kopula a a kétdimenziós t-eloszlásból származtatott kopula, azaz CR,ν (u1 , u2 ) = tR,ν (tν−1 (u1 ), t−1 ν (u2 )),
ahol ν a t-eloszlás szabadságfokát, R a változók korrelációmátrixát jelöli.
A kopula szélein az összefügg®ség er®ssége a korrelációtól és ν értékét®l függ, valamint ahogy a paraméter ∞-hez közelít, CR,ν (u1 , u2 ) → ΦR (u1 , u2 ). A t-eloszlás sajátossága továbbá, hogy az eloszlás szabadságfokával megegyez®, vagy annál magasabb rend¶ momentumai nem léteznek. 1.3.2.
Arkhimédeszi kopulák
1.3.4. Deníció. Legyen ψ : [0, 1] → [0, ∞] folytonos, szigorúan monoton csökken® konvex függvény, melyre ψ(1) = 0, ψ(0) = ∞. A ψ [−1] : [0, ∞] → [0, 1] függvényt ψ pszeudo-inverzének nevezzük, ha {
ψ [−1] (t) =
ψ −1 , ha 0 ≤ t ≤ ψ(0) 0, ha ψ(0) ≤ t ≤ ∞.
1.3.5. Lemma. Legyen ψ a fenti deníció feltételeinek eleget tev® függvény, melynek pszeudo-inverze ψ [−1] . Ekkor ha C felírható C(u1 , u2 ) = ψ [−1] (ψ(u1 ) + ψ(u2 ))
13
(1.3)
alakban, akkor C teljesíti a kopulák határaira vonatkozó feltételeket, azaz ∀u ∈ [0, 1] C (0, u) = C (u, 0) = 0 C (1, u) = C (u, 1) = u.
Bizonyítás. A határokon vizsgálva (1.3) képlettel felírt függvényt, C(u1 , 0) = ψ [−1] (ψ(u1 ) + ψ(0)) = 0, C(u1 , 1) = ψ [−1] (ψ(u1 ) + ψ(1)) = ψ [−1] (ψ(u1 )) = u1 .
A szimmetrikusságot kihasználva pedig adódik, hogy C(0, u2 ) = 0 és C(1, u2 ) = u2 , ez pedig pontosan az, amit be szerettünk volna látni. Az alábbi tételben szükséges és elégséges feltételt kapunk annak igazolására, hogy ψ egy, a [0, 1] intervallumon egyenletes eloszlású marginálisokkal rendelkez® kétdimenziós eloszlásfüggvényt generál, és az (1.3) alakban felírt C valóban egy kopulát határoz meg.
1.3.6. Tétel. Legyen
ψ : [0, 1] → [0, ∞] folytonos, szigorúan csökken® függvény,
melyre ψ(1) = 0, és legyen ψ pszeudo-inverze ψ [−1] . Ekkor C : [0, 1]2 → [0, 1], melyre C(u1 , u2 ) = ψ [−1] (ψ(u1 ) + ψ(u2 )) pontosan akkor deniál egy kétdimenziós kopulát, ha ψ konvex.
Bizonyítás. Láttuk, hogy
C teljesíti a kopulák határaira vonatkozó feltételeket,
továbbá belátható, hogy C(v2 , u2 ) − C(v1 , u2 ) ≤ v2 − v1 .
(1.4)
pontosan ψ konvexitása esetén áll fenn. Vegyük észre, hogy ezzel a felírással ekvivalens v1 ≤ v2 -re a v1 + ψ [−1] (ψ(v2 ) + ψ(u2 )) ≤ v2 + ψ [−1] (ψ(v1 ) + ψ(u2 )),
ami a = ψ(v1 ), b = ψ(v2 ) és c = ψ(u2 ) helyettesítéssel ψ [−1] (a) + ψ [−1] (b + c) ≤ ψ [−1] (b) + ψ [−1] (a + c),
14
(1.5)
ahol a ≥ b és c ≥ 0. Tegyük fel, hogy (1.4) fennáll és ψ [−1] teljesíti (1.5)-öt. Válasszunk egy tetsz®leges s és t számot a [0, ∞] intervallumból, melyekre 0 ≤ s < t. Ha a = s+t , b = s és c = t−s , akkor 2 2 ψ [−1] (
s+t ψ [−1] (s) + ψ [−1] (t) )≤ . 2 2
Mivel ψ [−1] így teljesíti a konvexitás feltételeit, a tétel egyik irányát ezzel beláttuk. A másik irány bizonyításához tegyük fel, hogy ψ [−1] konvex. Rögzítsük a, b és c a−b értékét a [0, 1] intervallumban úgy, hogy a ≥ b és c ≥ 0, továbbá legyen γ = a−b+c . Így a = (1 − γ)b + γ(a + c) és b + c = γb + (1 − γ)(a + c), amib®l ψ [−1] (a) ≤ (1 − γ)ψ [−1] (b) + γψ [−1] (a + c), ψ [−1] (b + c) ≤ γψ [−1] (b) + (1 − γ)ψ [−1] (a + c).
Az egyenl®tlenségeket összeadva pont (1.5)-öt kapjuk, amivel a tétel másik felét is igazoltuk. A ψ által generált, C(u1 , u2 ) = ψ [−1] (ψ(u1 ) + ψ(u2 )) alakban el®álló kopulákat nevezzük Arkhimédeszi kopuláknak, melyek összefügg®ségi paraméterét a generátorfüggvény határozza meg. Az Arkhimédeszi kopulák általában - szemben az elliptikusok családjával - felírhatók zárt alakban, valamint nem valamely többváltozós eloszlásból származnak. Alapvet® tulajdonságaik közé tartozik a szimmetria és az asszociativitás is, azaz: 1. C(u, v) = C(v, u) 2. C(C(u, v), z) = C(u, C(v, z)) Az Arkhimédeszi kopulákat a generátorfüggvény választásától függ®en különböztethetjük meg egymástól, ψ tulajdonságai pedig jelent®sen befolyásolják a kopula szélein jelentkez® bal és jobb oldali farok-összefüggését. Az alábbiakban a Frank-, Clayton- és Gumbel-kopulákat fogjuk jellemezni és illusztrálni.
Frank-kopula 1.3.7. Deníció. Az α ∈ (−∞, ∞) összefügg®ségi paraméter és ψ(t) = log generátorfüggvény által meghatározott Frank-kopula: CF r (u1 , u2 ) = −
1 (e−αu1 − 1)(e−αu2 − 1) · log(1 + ). α e−α − 1
15
(
eαt −1 eα −1
)
Mivel α ∈ (−∞, ∞), el®fordulhat a marginálisok között negatív összefüggés is, valamint meggyelhet®, hogy az eloszlás közepe nem szóródik. A Frank-kopula a gyakorlatban olyan adatsorokra alkalmazható, melyeknél mind a kis, és mind a nagy értékek közti összefüggés gyenge.
1.2. ábra. Frank-kopula pozitív és negatív paraméterrel
Clayton-kopula 1.3.8. Deníció. Az α ∈ (0, ∞) összefügg®ségi paraméter¶ Clayton-kopula generátorfüggvénye a ψ(t) = t−α − 1, így a kopulát a következ® alakban íthatjuk fel: −α −1/α CCl (u1 , u2 ) = (u−α . 1 + u2 − 1)
Mivel α a pozitív félegyenesen helyezkedik el, nem tapasztalhatunk negatív összefüggést a változók közt, továbbá ahogy α 0-hoz közelít, a marginálisok közti összefügg®ség mértéke is csökken. A Clayton-kopulánál a bal oldali farok-összefüggés igen er®s, míg ehhez képest a jobb oldali gyenge. Éppen ezért a gyakorlatban jól alkalmazható egymással korreáló kockázatok vizsgálatára, többek között két életre szóló életbiztosítások árazásánál is. Életbiztosításokkal foglalkozó szakemberek számára ugyanis ismert jelenség az ún. "broken heart syndrom", azaz az összetört szív szindróma. Statisztikai eredmények mutatják, hogy egy házaspár egyik tagjának elhalálozása után egy bizonyos id®intervallumban a másikuk halálozási valószín¶sége is megn®, ez pedig a két életre szóló életbiztosítások díjkalkulációjánál nem elhanyagolandó tényez®, kopulák segítségével pedig jól modellezhet®. 16
Gumbel-kopula 1.3.9. Deníció. Ha akkor
α ∈ [1, ∞) és a generátorfüggvény ψ(t) = (− log(t))α alakú,
{ } CGu (u1 , u2 ) = exp −[(− log(u1 ))α + (− log(u2 ))α ]1/α
a Gumbel-kopulát deniálja.
Hasonlóan a Clayton-kopulához, nem tapasztalhatunk negatív összefüggést a marginálisok között, viszont vele ellentétben er®s a farok-összefüggés a jobb, és gyenge a bal oldalon. Éppen ezért, ha az általunk vizsgált adatsorok nagy értékei er®sen korreálnak, míg a kisebbek kevésbé, a Gumbel-kopula jó választásnak bizonyulhat. 1.3.3.
A kopulafajták összehasonlítása
Láthattuk, hogy különböz® kopulához eltér® tulajdonságú paraméterek tartoznak, valamint el®állításuk is többféleképp történhet. Az alábbi ábrákon ugyanolyan összefügg®ségi paraméter mellett ábrázoljuk a bemutatott kopulákat, a Gauss- és t-kopuláknak pedig a ν = 3 szabadságfokot választottuk. Minden típusnál meggyelhet®, hogy milyen értékek között jelentkezik az er®sebb összefügg®ség, valamint az eredeti peremeloszlások által okozott eltérés is. Az 1.3. ábrán már τ = 0.4 esetén is jól látszik az összefüggés er®ssége a Clyaton-kopulán a kicsi, míg a Gumbel-kopulán a nagy értékek közt, a Frank-, Gauss- és t-kopulánál viszont magasabb korrelációnál jelentkezik ez szemléletesebben, ahogy azt a további ábrák mutatják.
1.3. ábra. Arkhimédeszi kopulák ρτ = 0.4 rangkorrelációs együtthatóval
17
1.4. ábra. Arkhimédeszi kopulák ρτ = 0.6 rangkorrelációs együtthatóval
1.5. ábra. Elliptikus kopulák ρτ = 0.4 mellett, a t-kopula ν = 3 szabadságfokkal A Gauss- és a t-kopula közti különbség f®ként a farok-összefüggésben nyilvánul meg. A t-kopula rugalmas, mert amellett, hogy az eloszlás szélein fellép® összefügg®séget is mutathatja, az eloszlás közepén fellép® összefügg®ség modellezésére is alkalmas.
1.6. ábra. Elliptikus kopulák ρτ = 0.6 mellett, a t-kopula ν = 3 szabadságfokkal
18
1.4.
A kopulák és a rangkorrelációs együtthatók kapcsolata
Korábban már láttuk, hogy az összefügg®ségi mér®számok közül a Pearson-féle korrelációs együttható nem invariáns a monoton transzformációra, így nem-elliptikus eloszlású változókra alkalmazva félrevezet® eredményeket kaphatunk. Ennek elkerülése érdekében vezettük be a rangkorrelációs együtthatókat. A Spearman-féle ρ és a a Kendall-τ kopulákkal való kapcsolatát ismertetjük a következ®kben [8] segítségével, ugyanis mindkét együttható kifejezhet® a kopulákból, továbbá utóbbi segítségével az Arkhimédeszi kopulák paramétere is kiszámolható.
1.4.1. Állítás. Tetsz®leges C kopulából a Spearman-féle ρ értékét a ∫
1
∫
1
C(u1 , u2 )du1 du2 − 3
ρS (X1 , X2 ) = 12 0
0
integrál kiszámításával kaphatjuk meg.
Tegyük fel, hogy X1 eloszlásfüggvénye F1 , X2 -é pedig F2 , és legyen F1 (X1 )∼U1 , F2 (X2 )∼U2 . Ebb®l adódóan ∫
1
∫
1
C(u1 , u2 )du1 du2 − 3 = 12E(U1 , U2 ) − 3 =
ρS (X1 , X2 ) = 12 0
=
0
E(U1 , U2 ) −
1 4
=√
1 12
Cov(U1 , U2 ) √ = D(U1 ) D(U2 )
= ρ(F1 (X1 ), F2 (X2 )).
Tehát ρS nem más, mint az X1 -b®l és X2 -ból integráltranszformációval kapott F1 (X1 ) és F2 (X2 ) közti korrelációs együttható. Nézzük most meg, mit mondhatunk el a kopulák és a Kendall-τ kapcsolatáról!
1.4.2. Állítás. A Kendall-τ a
∫
1
∫
1
C(u1 , u2 )dC(u1 , u2 ) − 1
ρτ (X1 , X2 ) = 4 0
0
formula segítségével fejezhetjük ki tetsz®leges C kopulából.
19
Bizonyítás. Láttuk, hogy
ρτ az X1 és X2 közti konkordancia és diszkordancia
valószín¶ségének különbsége, azaz ρτ (X1 , X2 ) = P [(X11 − X12 )(X21 − X22 ) > 0] − P [(X11 − X12 )(X21 − X22 ) < 0].
Mivel X1 és X2 folytonos, P [(X11 − X12 )(X21 − X22 ) < 0] = 1 − P [(X11 − X12 )(X21 − X22 ) > 0],
így ρτ felírható ρτ (X1 , X2 ) = 2P [(X11 − X12 )(X21 − X22 ) > 0] − 1 alakban, melyb®l átalakítással P [(X11 − X12 )(X21 − X22 ) > 0] = = P [(X11 > X12 ), (X21 > X22 )] + P [(X11 < X12 ), (X21 < X22 )].
Ebb®l P [(X11 > X12 ), (X21 > X22 )] = P [(X12 < X11 ), (X22 < X21 )] = ∫
+∞
∫
+∞
P [(X12 ≤ x1 ), (X22 ≤ x2 )]dC(F1 (x1 ), F2 (x2 )) =
= −∞
−∞
∫
∫
+∞
−∞
+∞
C(F1 (x1 ), F2 (x2 ))dC(F1 (x1 ), F2 (x2 )),
−∞
ahol u1 = F1 , u2 = F2 transzformációval ∫
1
∫
1
P [(X11 > X12 ), (X21 > X22 )] =
C(u1 , u2 )dC(u1 , u2 ). 0
0
Hasonlóan, P [(X11 < X12 ), (X21 < X22 )] = ∫
+∞
∫
+∞
= −∞
∫
+∞
∫
+∞
= −∞
P [(X12 > x1 ), (X22 > x2 )]dC(F1 (x1 ), F2 (x2 )) =
−∞
−∞
[1 − F1 (x1 ) − F2 (x2 ) + C(F1 (x1 ), F2 (x2 ))]dC(F1 (x1 ), F2 (x2 )) = ∫
1
∫
1
[1 − u1 − u2 + C(u1 , u2 )]dC(u1 , u2 ).
= 0
0
Tudjuk, hogy C a [0, 1] intervallumon egyenletes eloszlású U1 és U2 változók együttes eloszlása, így E(U1 ) = E(U2 ) = 21 , amib®l P [(X11 < X12 ), (X21
1 1 < X22 )] = 1 − − + 2 2
20
∫
1
∫
1
C(u1 , u2 )dC(u1 , u2 ) = 0
0
∫
1
∫
1
=
C(u1 , u2 )dC(u1 , u2 ). 0
0
Tehát P [(X11 < X12 ), (X21 < X22 )] + P [(X11 < X12 ), (X21 < X22 )] = ∫
1
∫
1
P [(X11 − X12 )(X21 − X22 ) > 0] = 2
C(u1 , u2 )dC(u1 , u2 ), 0
0
amib®l következik, hogy ρτ (X1 , X2 ) = 2P [(X11 − X12 )(X21 − X22 ) > 0] − 1 = ∫ 1∫ 1 =4 C(u1 , u2 )dC(u1 , u2 ) − 1. 0
0
Ez pedig pontosan az, ami be szerettünk volna látni. Ahogy már korábban említettük, a Kendall-τ segítségével meghatározhatjuk az Arkhimédeszi kopulák összefügg®ségi paraméterét is. Ezt az alábbi táblázat foglalja össze, ahol a Frank-kopula paraméterét kifejez® képletben D1 (−α) = D1 (α) + α2 , 1 D1 (α) = α
∫
α 0
et
t dt. −1
Kopulacsalád ρτ α Clayton α+2 Frank 1 − α4 (D1 (−α) − 1) Gumbel 1 − α1 1.1. táblázat. α és ρτ közti kapcsolat
21
2. fejezet Módszerek kopulák illesztésére Ebben a fejezetben két jól alkalmazható módszert fogunk bemutatni a megfelel® kopula kiválasztására, majd teszteljük a becslések pontosságát is. 2.1.
A paraméterek maximum likelihood becslése
A kopula és a marginálisok paramétereinek becslésére a statisztika területén gyakran használt maximum likelihood (ML) módszert fogjuk alkalmazni, melyben [1] és [4] lesz segítségünkre. Legyen θ a becsülend® paraméterekb®l álló vektor. Az ML-becslés lényege, hogy adott mintarealizáció mellett a paraméter becsléseként azt a θˆ-ot fogadjuk el, mely esetén maximális annak a valószín¶sége, hogy az adott mintarealizációt kapjuk. A módszer az eme valószín¶séget tükröz® ún. likelihood-függvényt maximalizálja, mely alatt a mintaelemek együttes valószín¶ségét, illetve s¶r¶ségfüggvényét értjük. Sklar tételéb®l ismeretes, hogy egy 2-dimenziós F eloszlásfüggvény a hozzá tartozó F1 és F2 peremeloszlások, valamint a C kopula segítségével az F (x1 , x2 ) = C(F1 (x1 ), F2 (x2 ))
alakban írható fel, melyb®l adódik, hogy X1 és X2 együttes s¶r¶ségfüggvénye f (x1 , x2 ) = c(F1 (x1 ), F2 (x2 ))f1 (x1 )f2 (x2 ),
ahol c-vel a kopulához tartozó s¶r¶ségfüggvényt jelöljük. Tekintsük a θ = (θ1 , θ2 , α) paramétervektort, melyben θ1 az X1 , θ2 az X2 eloszlásának paramétereit tartalmazó vektorok, α pedig a kopula paramétere. 22
Ekkor a loglikelihood-függvény: ℓ(θ) =
n ∑
log[c(F1 (Xi1 ; θ1 ), F2 (Xi2 ; θ2 ); α)] +
i=1
n ∑ 2 ∑
log fj (Xij ; θj ),
i=1 j=1
ahol (Xi1 , Xi2 ) : i = 1, .., n független mintarealizációkat jelönlnek. Ebb®l θ becslése: θb =argmaxℓ(θ) Biztosítók kárkizetéseinek vizsgálatakor gyakran feltételezhetjük, hogy azok lognormális, Pareto-, Weibull- vagy valamely extrém-érték eloszlást követnek. 2.2.
Kopula illesztése rangszámok segítségével
Bemutatunk egy olyan módszert is [3] alapján, melyben a kopula becslése nem függ a peremeloszlásoktól, így nem kell attól tartanunk, hogy a marginálisok esetleges félreazonosítása módosítana az eredményen. Az egyes adatsorokhoz tartozó rangszámok segítségével írjuk fel az empirikus kopulát, majd kiválasztjuk az ismert Arkhimédeszi kopulák közül a legjobban illeszked®t. 2.2.1.
Empirikus kopulák
Tekintsük az X (i) = (Xi1 , Xi2 ) koordinátapárokat, majd rendezzük nagyság szerinti sorba X1 és X2 elemeit. Az így kapott rendezett mintában Xij rangját Rij -vel fogjuk jelölni, és az általuk meghatározott R(i) = (Ri1 , Ri2 ) vektorok segítségével írjuk fel az empirikus kopulát. Mivel a vizsgált kétdimenziós kopulák a [0, 1]2 egységnégyzeten vannak értelmezve, a rangokhoz hozzárendelünk egy-egy U˜i ∈ [0, 1]2 ún. pszeudo-meggyelést az alábbi módon: R(i) (i) ˜ U = , n+1
mellyel ekvivalens deníció az U˜ij =
n · F˜j (Xij ), n+1
ahol F˜j az Xj tapasztalati eloszlásfüggvényét jelöli.
23
Ezek alapján már fel tudjuk írni az empirikus kopulát, ami nem más, mint a pszeudo-meggyelések tapasztalati eloszlásfüggvénye, azaz n 1 ∑ ˜ Cn (u) = · χ(Ui < u). n i=1
Mivel Cn konzisztens becslése a keresend® C -nek, így a minta elemszámának növelésével egyre jobb becslését kapjuk a kopulának. A módszer további el®nye, hogy C becslése a rangszámokból álló R(i) vektorokon alapul. Ezáltal pedig a kiugró értékekre sem lesz érzékeny, mert nem a konkrét adatokkal számolunk. Érdemes megjegyezni, hogy bár közelíteni tudtuk a kopulát az eredeti marginálisok ismerete nélkül, a gyakorlatban nem kerülhetjük el ezek becslését sem. Ha az eredeti adatokra illesztett eloszlásra vagyunk kíváncsiak, szükség van a peremeloszlásokra is. 2.3.
A megfelel® kopula kiválasztása és az illeszkedés pontossága
Tekintsük a már korábban deniált Cn empirikus kopulát, valamint a keresett C t becsl® Cθn -t a H0 : C ∈ Cθ nullhipotézis mellett. Az empirikust legjobban közelít® kopula kiválasztásához az Sn =
n ∑
2 (Cn (U˜i ) − Cθn (U˜i ))
i=1
statisztika lesz segítségünkre. Ahogy azt már az el®z® szakaszban láttuk, minél nagyobb a minta elemszáma, Cn annál jobb becslése C -nek. Ezt kihasználva a dolgozatban egy bootstrap-alapú illeszkedésvizsgálati módszert alkalmazunk. A bootstrap eljárás a meglév® mintából generál véletlenszer¶en új mintákat, új információt adva a mintáról a pontosabb becslés érdekében. A vizsgálat a következ®képp zajlik: 1. Az U˜1 , ..., U˜n pszeudo-meggyelések alapján felírjuk az empirikus kopulát, majd C θ paraméterét becsüljük θn segítségével. 2. Kiszámoljuk az Sn statisztika értékét. 24
3. Veszünk egy nagy n egészt és minden k ∈ {1, ..., N }-re megismételjük az alábbi lépéseket: • A Cθn kopulából generálunk egy X1 , ..., Xn véletlen mintát és kiszámoljuk az ezekhez tartozó U˜1(k) , ..., U˜n(k) pszeudo-meggyeléseket. (k)
• Felírjuk a
(k)
1 ∑ ˜ (k) = χ(Ui ≤ u), u ∈ [0, 1]2 n i=1 n
Cn(k) (u)
empirikus kopulát és U˜1(k) , ..., U˜n(k) -ból kiszámoljuk θn(k) -t. • H0 fennállása mellett megadjuk Sn egy közelít® realizációját: Sn(k)
=
n ∑
(k) (k) 2 (Cn(k) (U˜i ) − Cθn(k) (U˜i ))
i=1
• A próba p-értékének közelítése: 1∑ χ(Sn(k) ≥ Sn ) n i=1 n
A próbát végrehajtjuk minden szóbajöv® kopulára, és végül a p-értékek, az egyes kopulafajták ismert tulajdonságai, valamint az elkészített ábrák segítségével választjuk ki azt a kopulát, amely a legjobban leírja a változók közti összefüggést. A módszer segítségével bár megbízható eredményt kapunk a legjobban illeszked® paraméteres kopula kiválasztásához, hátránya, hogy rendkívül lassú, ugyanis minden lépésben véletlen számokat generálunk, emellett pedig szükség van a kopula paramétereinek becsléseire is. Amennyiben nagy elemszámú minta áll rendelkezésünkre, érdemes más illeszkedésvizsgálati módszert alkalmazni, ami nem a bootstrap eljárást veszi alapul. 2.4.
Szimuláció Arkhimédeszi kopulákból
A kopulák lehet®vé teszik számunkra, hogy egyszer¶en szimuláljunk többdimenziós eloszlásokból. Szükségünk van egy algoritmusra, aminek segítségével el®állíthatunk egy olyan X1 és X2 változót, melyek együttes eloszlásfüggvénye F (x1 , x2 ) = C(F1 (X2 ), F2 (X2 )). Az Arkhimédeszi kopulák esetében láttuk, hogy C(u1 , u2 ) = ψ −1 (ψ(u1 ) + ψ(u2 )). 25
Ismerve X1 és X2 együttes eloszlását, X2 rekurzívan el®állítható ennek X1 -re vonatkozó feltételes eloszlásának segítségével, ahogy ez [2]-ben is olvasható. Az algoritmus a következ®: 1. Els®ként generálunk egy U1 és U2 [0, 1] intervallumon egyenletes eloszlású változót. 2. El®állítjuk X1 -et: X1 = F1−1 (U1 ), és c0 -t 0-nak tekintjük. 3. Rekurzívan X2 -t U2 = F2 (X2 |x1 ) =
ψ −1 (ψ(F1 (x1 )) + ψ (F2 (x2 ))) ψ −1 (ψ(F1 (x1 ))
megoldásaként számítjuk ki.
26
3. fejezet Kopula illesztése a vizsgált adatokra Utalunk már rá korábban, hogy a kopulák jelent®s szerepet játszanak a biztosítások területén. A dolgozatban egy nem-élet biztosítási alkalmazást mutatunk be Edward W. Frees és Emiliano A. Valdez Understanding relationships using copulas [2] cím¶ cikke alapján, melyhez rendelkezésünkre áll egy biztosítótársaság 1500 felel®sségbiztosításának kárkizetéséb®l álló adatsor, valamint az egyes károkhoz tartozó kárrendezési költségek. Ebben a fejezetben ezek együttes eloszlásának meghatározása a célunk, melyhez az el®z® fejezetben deniált Arkhimédeszi kopulák lesznek segítségünkre. 3.1.
Az adatok bemutatása
Jelölje ezentúl X1 a kárkizetésekb®l, X2 a költségekb®l álló 1500 elem¶ mintát. Ahogy a 3.1. táblázatból is látszik, ugyanakkora kárkizetési összegekhez tartozhatnak lényegesen eltér® költségek, viszont el®forfulhat, hogy egyes károknál a kárrendezési költségek sokkal magasabbak, mint maga a kártérítés. Feltételezhet® azonban, hogy magas költségek f®ként nagy károkhoz tartoznak. A 3.2. táblázat a két minta alapstatisztikáit foglalja össze. Láthatjuk, hogy mind a kártérítések, mind a költségek közt csak pozitív értékek szerepelnek, viszont el®fordulhatna akár olyan helyzet is, hogy tartalmaz az adatsor költség nélküli kártérítést vagy éppen költségeket, melyek olyan károk bekövezésekor keletkeztek, amiket végül a biztosító nem zetett ki. Az ilyen esetek vizsgálatát külön kellene elvégeznünk egy speciálisabb modell segítségével. 27
X1 X2 24 5658 1974 775 2250 2182 2250 8204 14500 625 3.1. táblázat. Részlet az adatokból X1 X2 Minimum 10 15 Maximum 2173595 501863 Átlag 41208 12588 Medián 12000 5471 Szórás 102747,7 28145,64 3.2. táblázat. Alapstatisztikák Az már el®zetes vizsgálatok nélkül is sejthet®, és a 3.1 ábra is jól mutatja, hogy X1 és X2 nem független egymástól. Példaként gondoljunk csak arra, hogy egy nagyobb irodaházban bekövetkezett t¶zesetkor amellett, hogy a biztosítónak feltehet®en igen magas kártérítést kell kizetni, a kárfelmérés is jelent®s költségekkel jár. Ahogy már az 1.3. szakaszban is láttuk, a Pearson-féle korrelációs együttható helyett érdemesebb a rangkorrelációs együtthatók segítségével vizsgálni a kárkizetések és költségek közti kapcsolatot. A Kendall-féle τ -t és a Spearman-féle ρ-t meghatározva így azt kapjuk, hogy ρτ = 0, 315, ρS = 0, 452,
ami egyrészt er®s összefügg®séget mutat, másrészt arra enged következtetni, hogy f®ként a nagyobb károkhoz tartoznak magas költségek.
28
3.1. ábra. A kárkizetések és költségek logaritmikus skálán 3.2.
Kopula illesztése
Miután megállapítottuk, hogy milyen kapcsolat áll fenn a változók közt, nekiláthatunk a kopulák illesztésének. Erre a 2.2. szakaszban bemutatott rangszámokon alapuló módszert fogjuk alkalmazni, így tehát az X1 - és X2 -höz tartozó peremeloszlások ismerete nélkül is becsülhetjük a változók együttes eloszlását. Érdemes megjegyezni, hogy a legtöbbször - mint ahogy jelen dolgozatban sem - nem tudjuk teljesen elkerülni a peremeloszlások vizsgálatát, azt azonban igen, hogy egy kevésbé jó becslés a kopula becslésén is rontson. A marginálisokkal b®vebben a következ® fejezetben foglalkozunk majd. El®ször a rangszámok és pszeudo-meggyelések segítségével elkészítjük az empirikus kopulát, melyhez a [0, 1] intervallumba transzformált adatokat a 3.2. ábra szemlélteti. Jól látszik a nagy értékek közti er®s farok-összefüggés, és meggyelhet® néhány függ®leges sáv is, melyeknek nem érdemes nagy jelent®séget tulajdonítanunk, ugyanis jogosan feltételezhetjük, hogy mindez annak következménye, hogy a biztosító törekedett kerek kártérítési összegek meghatározására.
29
3.2. ábra. A [0,1] intervallumba transzformált adatok Ahogy már korábban is láttuk, hogy az Arkhimédeszi kopulák paraméterei kifejezhet®k a Kendall-τ -ból, így ρτ = 0, 315 mellett a Gumbel-, Frank- és Claytonkopulához tartozó α értékek: α
Gumbel 1,461 Frank 3,094 Clayton 0,921 3.3. táblázat. ρτ = 0, 315-höz tartozó α értékek Ezek alapján ki kell választanunk, melyik kopulafajtára a legkisebb az eltérés az empirikus kopulához képest, és ellen®riznünk, hogy a legkisebb eltérés elfogadhatóe. Ehhez a korábban bemutatott illeszkedésvizsgálati próbát végezzük el, melynek eredményeit a 3.4. táblázat foglalja össze. Emlékeztet®ül, a paraméteres és empirikus kopula közti négyzetes eltérést az Sn próbastatisztika értéke mutatja. Sn
α
Gumbel 0,1073 1,442 Frank 0,1906 3,075 Clayton 1,0286 0,506 3.4. táblázat. Illeszkedésvizsgálat eredeményei 30
Láthatjuk, hogy a különbség a Gumbel-kopula esetén a legkisebb, viszont a próba a Frank-kopulára sem mutat rossz illeszkedést. Érdemes mindenesetre megnézni grakusan is, hogyan viszonyulnak egymáshoz a Gumbel-, Frank-, illetve Clayton-kopulából vett minták az egységnégyzeten. Ezt egyszer¶en megtehetjük, ugyanis a paraméterek ismeretében felírhatjuk a vizsgált kopulákat, és mintavételezhetünk is bel®lük. Az ábrán is meggyelhet®, hogy míg a Clayton-kopulát teljesen elvethetjük, a Gumbel-kopula illeszkedése valóban jónak bizonyul, tehát elfogadhatjuk a kárkizetések és költségek együttes eloszlásaként.
31
4. fejezet Alkalmazás viszontbiztosítások díjkalkulációjára A fejezet célja egy viszontbiztosítási díjkalkuláció a kapott eredmények segítségével, melyek alapján a biztosító kárkizetéseit és az egyes károkhoz tartozó költségeket összefügg®nek tekintjük. Megmutatjuk továbbá Frees és Valdez [2] és Marco Micocci, Giovanni Masala [6] cikkei alapján, hogy mennyivel módosulna a helyzet, ha függetlenséget feltételeznénk. Ejtsünk el®ször néhány szót a viszontbiztosításokról [5] segítségével! 4.1.
A viszontbiztosítások
A biztosítók pénzügyi stabilitását és zet®képességét különösen a kis valószín¶ség¶ nagy károk, valamint a kumulálódó károk sodorhatják veszélybe. Érdemes tehát megfontolni, hogy mekkora kárt tud a biztosító kizetni anélkül, hogy felborulna a pénzügyi egyensúlya, valamint mit lehet tenni a kizetend® kárösszeg nem várt növekedése ellen. Mit tesz a felel®sségteljes lakástulajdonos, akinek egy esetleges t¶zeset vagy betörés után keletkezett költségek komoly anyagi problémát jelentenének, de jövedelméb®l szívesen áldoz a biztonságérzetre? Biztosítást köt. Ugyanezt teszi egy biztosítótársaság is. A beérkezett biztosítási díj egy részét átengedve egy másik biztosítónak (viszontbiztosító ), az kötelezettséget vállal, hogy az el®bbinek (direkt biztosító ) az általa kizetett szolgáltatások egy részét megtéríti. Ezt nevezik viszontbiztosításnak, melyet gyakran emlegetnek a "biztosítók biztosítása "-ként is. 32
Az árazás és kockázatmegosztás szempontjából megkülönböztethetünk arányos és nem arányos viszontbiztosítási formákat. El®bbi lényege, hogy amilyen arányban vállal kockázatot a viszontbiztosító, olyan arányban részesedeik a direkt biztosítóhoz beérkez® díjból is. Bár az arányos viszontbiztosítások jelentik a legkisebb kockázatot a direkt és viszontbiztosító számára is, nem mindig el®nyös az arányos viszontbiztosítás egyik fél számára sem. A nem arányos viszontbiztosítási formáknál a direkt biztosító megtarthatja magának azokat a kockázatokat, amiket az alacsony maximális kárnagyság miatt pénzügyi kapacitása elbírna, viszontbiztosítást pedig csak egy bizonyos kárösszeg túllépése esetére köt. Ez az ún. kockázati alapú kártöbblet-viszontbiztosítás (Excess of Loss, XL). Mindez persze a viszontbiztosító számára is kedvez® abból a szempontból, hogy mivel csak a ritka károkból vállal egy meghatározott részt, lényegesen alacsonyabbak az adminisztrációs költségei. Hátránya azonban, hogy a direkt biztosító bátrabban vállal nagyobb kockázatokat, mint arányos viszontbiztosítási szerz®dés esetén. Erre megoldást jelenthet a kvóta és az XL-viszontbiztosítás kombinálása, melynél a viszontbiztosító azon kárkizetésekb®l vállal részt, melyek a direkt biztosító saját megtartásánál magasabbak, viszont megszab egy határt arra, hogy legfeljebb mekkora összegig térít a direkt biztosítónak saját pénzügyi egyensúlya fenntartása érdekében. Ennek matematikai modelljét fogjuk a következ®kben ismertetni. 4.1.1.
A matematikai modell
A korábbi jelölésekkel legyen a kizetend® kárösszeg X1 , melynek eloszlását F1 jelöli. Egy viszontbiztosítónak járó P1 díj, és egy x kizetend® kárigény esetén a direkt biztosító T x összeget zet ki, ez az ún. saját megtartása, a maradék x−T x pedig a viszontbiztosító részesedése, ahol T egy mérhet® függvényt jelöl. Ha a díjszámításhoz a várható érték elvet használjuk és Fv jelöli a viszontbiztosító részesedésének eloszlását, akkor a viszontbiztosítónak járó díj ∫
P1 =
∫
xdFv (x) =
(x − T x)dF1 (x).
Érdemes megjegyezni, hogy T mérhet®sége miatt az integrál létezik és feltehetjük, hogy véges. Nézzük most azt az esetet, amikor az XL-viszontbiztosítást kombináljuk a kvó33
tával. A direkt biztosító saját megtartását jelöljük R-rel. Ekkor a direkt biztosító azokra a kockázatokra köt viszontbitosítást, melyeknél a kárösszeg R-nél magasabb, viszont ezek R feletti részét is -jelen esetben a kárrrendezési költségek arányábanbizonyos mértékben maga téríti, míg a viszontbiztosító is szab egy L összeghatárt (kapacitás ), ameddig a kockázatot vállalni tudja, így kárkizetés ezen felüli része is a direkt biztosítót terheli. Tekintsük a korábban bevezetett károkhoz tartozó X1 és költségekhez tartozó X2 változót. Könny¶ meggondolni, hogy ez alapján a viszontbiztosítót terhel® összeg
g(X1 , X2 ) = X1 − T X1 =
0, ha X1 < R 1 −R X1 − R + XX X2 , 1 L − R + L−R X2 , L
ha R ≤ X1 < L ha X1 ≥ L,
aminek várható értéke adja meg a viszontbiztosítási díj becslését. Ez kiszámolható numerikus integrálással, valamint X1 és X2 együttes eloszlásából való szimulációval is. Ezek segítségével a viszontbiztosítási díj becslése: gb(X1 , X2 ) =
az
√ se(b g (L, R)) =
1 nsim
nsim 1 ∑ g(X1i , X2i ) nsim i=1
∑nsim i=1
g(X1i , X2i )2 − gb(L, R)2 nsim
standard hibával, ahol nsim a szimulációk számát jelöli. 4.2.
Peremeloszlások
Mivel a viszontbiztosítás szempontjából egy bizonyos küszöb feletti károk az igazán érdekesek, kézenfekv® megoldás ezekre az adatokra valamely extrém-érték eloszlást illeszteni. Els®ként a vizsgált adatsorokra egymástól függetlenül illesztjük a nagy károk modellezésekor gyakran használatos általánosított Pareto eloszlást, melyre egy u küszöb esetén P (X − u < y|X > u) ≈ 1 − (1 +
ξy − 1ξ ) , σ e
ha y > 0 és 1 + ξyσe > 0, ahol σe = σ + ξ(µ − u) és µ, σ, ξ az eloszlás paraméterei. 34
Az eloszlás megfelel® illeszkedése esetén tetsz®leges u függvényében ábrázolva X − u átlaga lineáris függvényhez közelít. A küszöböt mind a kártérítések, mind a költségek esetén a hozzájuk tartozó kvantilisfüggvények segítségével határoztuk meg. Azokat az értékeket tekintjük extrémnek, melyek az adatok 95 százalékánál nagyobbak, így X1 -nél 170000, X2 -nél 45945 lett a választott küszöbérték. Az eloszlás paramétereit maximum likelihood módszerrel becsüljük. Ez alapján X1 eloszlását a ξ1 =0,18 alak és σ1 =165324,98 skála paraméter jellemzi, míg X2 esetén ezek az értékek ξ2 =0,6 és σ2 =24777,47. Azt, hogy a feltételezett eloszlás milyen pontosan illeszkedik az adatokra, többféleképpen is ellen®rizhetjük. A folytonos eloszlások illeszkedésvizsgálatára gyakran használt Kolmogorov-Smirnov próba helyett egy er®sebb, bootstrap-alapú próbát végzünk, ami tesztel nemnegatív, illetve negatív alak paraméterrel egyaránt, és akkor utasít el, ha mind a pozitív, mind a negatív paraméterrel vett próba elutasításra kerül. A próbát az X1 -re, valamint az illesztett eloszlására alkalmazva a p-érték 0,3253, tehát a ξ1 =0,18, σ1 =165324,98 paraméter¶ GPD-t elfogadjuk. Ugyanezt X2 -re is elvégezve a p-érték 0,8318, így a ráillesztett ξ2 =0,6, σ2 =24777,47 paraméter¶ GPD is elfogadásra kerül. Mindezt alátámasztják az alábbi ábrák is, melyeken a tapasztalati, illetve az illesztett eloszlásfüggvények kvantiliseit ábrázoljuk egymással szemben. A kártérítésekhez és költségekhez tartozó QQ-ploton is találunk 1-2 kilógó értéket, ezt viszont elkerülni nem tudjuk, legfeljebb a megfelel® eloszlás illesztésével csökkenthetjük a számukat. 4.3.
Viszontbiztosítások árazása
Miután ismerjük a kárkizetések és költségek egydimenziós, valamint együttes eloszlását is, elvégezhetjük a szimulációt a Gumbel-kopulából. Az erre bemutatott algoritmussal 50000 szimulációt végezve generálunk egy új mintát, majd ennnek segítségével becsülhetjük a viszontbiztosítót várhatóan terhel® összegeket annak kapacitása és a direkt biztosító saját megtartása függvényében. Különböz® kapacitásokra megvizsgáltuk, várhatóan mekkora díjat kellene legalább el®írnia a viszontbiztosítónak, hogy fedezni tudja a kártérítésekb®l fakadó kiadásait R és L egymáshoz való arányától függ®en. A szimulációkat a 2.4. szakaszban 35
4.1. ábra. Kártérítésekhez tartozó QQ-plot
4.2. ábra. Költségekhez tartozó QQ-plot bemutatott módszer alapján végeztük el, majd számoltuk ki ezek alapján g értékét. El®zetesen is sejthet®, hogy magasabb kapacitásokhoz magasabb értékek is tartoznak, amik viszont csökkennek, ahogy R és L aránya 1-hez közelít. Ebben az esetben nyilván kisebb tartományban van a viszontbiztosítónak zetési kötelezett36
sége, valamint a képletb®l is látható, hogy ekkor a kárrendezési költségek is csak csekély mértékben befolyásolják a direkt biztosító számára zetend® összeget. Az eredményeket a 4.1. táblázat mutatja.
L 10000 50000 100000 500000 1000000
R/L 0 0,25 0,5 75270 56020 37192 108780 78625 51056 141723 98751 62445 239973 119033 58442 261459 86005 33640
0,75 18532 25000 29657 23037 11228
0,95 3699 4931 5677 3966 1752
4.1. táblázat. Viszontbiztosítási díjak becslése a Gumbel-kopulából szimulált adatok alapján Ahogy sejtettük is, RL növekedésével egyre nagyobb mértékben csökkennek az értékek, míg L emelkedédésével n®nek. Meggyelhet® azonban, hogy a 100000 és 500000 kapacitások közt RL = 0, 5, míg 500000 és 1000000 között már RL = 0, 25t®l ugyanazon arányokhoz alacsonyabb értékek tartoznak. Ennek oka az lehet, hogy míg a szimulált adatok 56,11 százaléka nagyobb 100000-nél, 500000-nél már csak 8,67, 1000000-nál pedig 1,5 százaléka nagyobb, tehát a nagy károk bekövetkezésének valószín¶sége jelent®sen kisebb, és mivel kevesebb a kár, magasabb limitnél az egy kárra es® díjak is alacsonyabbak lesznek. A limitválasztásban nagy szerepet játszanak a kvantilisek, így érdemes ezekre is vetni egy pillantást.
Kvantilisek 0,25 0,5 0,75 0,95 55248,9 123888,3 247166,2 605958,6
4.2. táblázat. A kárkizetések kvantilisei a szimulált adatok alapján Nézzük most meg, miként alakulnának ezek a díjak, ha nem vennénk gyelembe a kárkizetések és költségek közti összefügg®séget, és vessük össze a kopula-modell alapján számolt eredményekkel. Ehhez fenti táblázat értékeit fogjuk összehasonlítani azon értékekkel, melyeket pusztán F1 és F2 -b®l szimulált adatokra kapunk. 37
R/L
L 10000 50000 100000 500000 1000000
0 72395 105857 138530 236357 258195
0,25 53212 72663 89025 98805 66811
0,5 35143 45847 53683 44211 23362
0,75 17467 21838 25000 15991 7632
0,95 3471 4237 4695 2542 1111
4.3. táblázat. A becsült viszontbiztosítási díjak az F1 és F2 eloszlásokból függetlenül vett szimulációk alapján Látható, hogy bár az így kapott értékek hasonlóak a 4.1. táblázatbeliekhez, mind alacsonyabbak azoknál. A kopulából szimulált adatokra kiszámított díjak a 4.3. táblázat értékeihez viszonyított arányát a 4.4. táblázat tartalmazza, az alábbi ábrán pedig az egyes kapacitásszinteken rajzoltuk ki a az RL arányokhoz tartozó viszontbiztosítási díjakat mind a Gumbel-kopulán, mind a függetlenségen alapuló díjszámítás esetén. Az, hogy az arány minden egyes értékpárnál 1-nél nagyobb, azaz a kopula alapján számolt értékekek magasabbak, arra utal, hogy a változók függetlenként kezelése esetén alulárazottak lennének a viszontbiztosítások.
L 10000 50000 100000 500000 1000000
R/L 0 1,04 1,03 1,02 1,02 1,01
0,25 1,05 1,08 1,11 1,21 1,29
0,5 1,06 1,11 1,16 1,32 1,44
0,75 0,95 1,06 1,07 1,14 1,16 1,19 1,21 1,44 1,56 1,47 1,58
4.4. táblázat. Összefügg® és független változók alapján számolt díjak aránya Jól látszik, hogy ez akkor jelentkezik a leger®sebben, ha mind a viszontbiztosító kapacitása, mind a direkt biztosító saját megtartása magas. Ennek f®ként az az oka, hogy az eloszlások szélei sokkal érzékenyebbek arra, ha rosszul azonosítjuk az eloszlást. 38
4.3. ábra. Viszontbiztosítási díjak alakulása különböz® L értékekre F®ként olyan esetekben, mikor a direkt biztosító saját megtartása alacsony, el®fordulhat, hogy az arány 1-nél kisebb. Ez túlárazásra utal, így ez f®ként a direkt biztosító szempontjából hasznos információ. Az illeszkedésvizsgálatnál láttuk, hogy a Gumbel-kopula mellett a Frank-kopula is egész jól illeszkedik, így érdemes megvizsgálnunk azt is, melyen eredményeket kapunk, ha abból szimulálunk adatokat. Ezt foglalja össze a 4.5. táblázat. Ha összevetjük a Gumbel-kopulából szimulált adatokhoz tartozó táblázattal, láthatjuk, hogy nincs jelent®s eltérés az eredmények közt. Meggyelhet® azonban, hogy a Frank-kopulából szimulálva alacsonyabbak az értékek, és ehhez az összefügg®ségi modellhez viszonyítva kevésbé alulárazottak a viszontbiztosítások, ha függetlennek tekintjük a változókat. Mindemellett L = 1000000 kapacitás esetén túlárazást is tapasztalhatunk, ami egyrészt akkor jelentkezik, amikor a direkt biztosító a teljes kockázatot átadja a viszontbiztosítónak, másrészt mikor a saját megtartása és a viszontbiztosító kapacitása egyaránt magas. 39
R/L
L 10000 50000 100000 500000 1000000
0 0,25 0,5 73183 54464 36138 106691 76795 49669 139081 95731 59736 236792 110028 49978 257252 72104 23792
0,75 18008 24177 28168 18106 7109
0,95 3592 4745 5390 2889 1016
4.5. táblázat. A Frank-kopulából szimulált adatok alapján becsült viszontbiztosítási díjak
L 10000 50000
100000 500000 1000000
R/L 0 1,01 1,01 1,001 1,001 0,99
0,25 1,02 1,06 1,08 1,11 1,08
0,5 1,03 1,08 1,11 1,13 1,02
0,75 0,95 1,03 1,03 1,12 1,12 1,13 1,15 1,13 1,14 0,93 0,91
4.6. táblázat. Frank-kopulából való szimulációval kapott eredmények aránya a függetlenségen alapuló értékekhez Vegyük észre, hogy a Gumbel-kopulánál pont az L = 1000000 és RL = 0, 95 esetben az összefügg®ségi modellb®l számolt díj 1,58-szorosa volt a függetlenségen alapulónak, míg ez az arány a Frank-kopulánál 0,91. Ennek oka az lehet, hogy a jobb oldali farok-összefüggés lényegesen er®sebben jelentkezik a Gumbel-kopulánál, mint a Frank-félénél, éppen ezért érdemesebb is az el®bbit illesztenünk a rendelkezésünkre álló adatokra.
40
5. fejezet Összefoglalás A dolgozatban bemutattam, miként tudjuk két valószín¶ségi változó közti kapcsolatot vizsgálni, és ezen összefügg®ség segítségével a változók együttes eloszlását becsülni. Eszközül erre a kopulák szolgáltak, melyek konkrét adatsorokra való illesztéséhez két módszert ismertettünk, valamint bemutattunk egy illeszkedésvizsgálati próbát is, ami alapján kiválasztható, melyik a legjobban illeszked® elméleti kopula, amib®l a marginálisok ismeretében szimulációkat is végezhetünk. Mindez alapján jellemezni tudtuk egy biztosítótársaság kárkizetései és költségei közti összefügg®séget, valamint becslést adtunk ezek együttes eloszlására, majd a peremeloszlásokra is. Ezeket felhasználva megmutattuk, miként változik a viszontbiztosítási díj különböz® direkt biztosítói saját megtartás, és viszontbiztosítói kapacitás esetén. Els®ként a díjak várható értékének kiszámítása az illeszkedésvizsgálat után választott Gumbel-kopulából szimulált adatok alapján történt, majd megmutattuk, mennyiben változnának a díjak, ha függetlenséget feltételezve szimplán a peremeloszlásokból el®állított együttes eloszlásfüggvényb®l szimulálnánk a díjszámításhoz, továbbá amennyiben egy másik, hasonlóan jó illeszkedést mutató kopulából, a Frank-kopulából szimulálnánk. Végül pedig felismertük, hogy a költségeket függetlennek tekintve alulárazottak lennének a viszontbiztosítások, továbbá a nem megfelel® összefügg®ségi modell alkalmazása is lényegesen torzíthat az eredményeken. A dolgozatban szerepl® ábrák elkészítéséhez, és a számítások elvégzéséhez az R programcsomagot használtam.
41
Irodalomjegyzék [1] Bolla Marianna, Krámli András. Statisztikai következtetések elmélete (2005) [2] Edward W. Frees, Emiliano A Valdez. Understanding relationships using copulas, North American Actuarial Journal (1998) [3] Ivan Kojadinovic, Jun Yan. Modeling Multivariate Distributions with Continuous Margins Using the copula R package, Journal of Statistical Software (2010) [4] Jun Yan. Enjoy the Joy of Copulas: With a Package copula, Journal of Statistical Software (2007) [5] Kerényi István. Viszontbiztosítás, Aktuárius jegyzetek (2011) [6] Marco Micocci, Giovanni Masala. Loss-ALAE modeling through a copula dependence structure, Investment Management and Financial Innovations (2009) [7] Pravin K. Trivedi, David M. Zimmer. Copula modeling: An Introducion for Practitioners, Foundations and Trends in Econometrics (2005) [8] Roger B. Nelsen. An Introduction to Copulas, Springer Series in Statistics (2006)
42