Faculteit Wetenschappen en Bio-ingenieurswetenschappen Vakgroep Wiskunde
Dynamisch modelleren van het afkooprisico Masterproef ingediend met het oog op het behalen van de graad van Master of Science in de Actuari¨ele Wetenschappen
Joachim Hendrickx Promotor:
Prof. Dr. Kim Everaert
In samenwerking met
MEI 2014
2 white
3
Voorwoord Na een laatste jaar van werken en studeren, is hier ook mijn tweede masterproef. Deze masterproef was totaal anders dan de vorige doordat deze van een meer praktische kant uit gaat. Ik heb me bij het maken van de masterproef verder kunnen bekwamen in de statistiek. Ook heb ik bepaalde facetten van levensverzekeringen van dichterbij bekeken. Ik heb de stage bij KBC Verzekeringen als plezierig ervaren en wil hierom ook alle collega’s bedanken die mij hebben begeleid. Zonder dat ik hopelijk iemand te kort doe, zou ik graag in het bijzonder een aantal mensen willen bedanken die mee hebben bijgedragen aan mijn thesis. Ten eerste bedank ik mijn promotor, prof. dr. Kim Everaert. Ik heb de ondersteuning die ik van u hebben gekregen als zeer hulpzaam beschouwd. Uw commentaar was steeds zeer specifiek en duidelijk. Ten tweede bedank ik mijn collega die mij heeft geholpen bij het project van KBC Verzekeringen, Diggory Kindt. Ik vond het een zeer goede samenwerking en ik wil u bedanken voor de vrijheid die ik had bij het uitwerken van de studie. Bedankt ook voor de ondersteuning wanneer ik even niet verder kon. Ten slotte wil ik Elly Van Noten en Lies Lierman bedanken voor de kans die ik heb gekregen door aan dit project te werken. Ik vond het een toegevoegde waarde voor mijn studie. Ik wens u als lezer veel plezier met het lezen van mijn masterproef.
Joachim Hendrickx 19 mei 2014
OPGELET: Dit is de publieke versie van een vertrouwelijke masterproef. De originele masterproef bevat namelijk vertrouwelijke informatie van KBC Verzekeringen. Deze informatie is op de volgende manier onleesbaar gemaakt:
4 white
Inhoudsopgave 1 Inleiding
7
2 Het afkooprisico 9 2.1 Effect van afkoop op ALM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2 Solvency II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 Generalised Linear Models 3.1 Lineaire modellen . . . . . . . . . . . . . . . . . . . . 3.2 De veronderstellingen bij Generalised Linear Models 3.2.1 De exponenti¨ele familie van verdelingen . . . 3.2.2 Link functies . . . . . . . . . . . . . . . . . . 3.3 Het GLM model . . . . . . . . . . . . . . . . . . . . 3.4 De modelparameters schatten . . . . . . . . . . . . . 3.4.1 Numerieke methode voor grote datasets . . . 3.4.2 Significantietesten . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
17 17 18 19 20 21 21 22 22
4 Mogelijke modelparameters 25 4.1 Economische parameters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.2 Polisgegevens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.3 Het afkooppercentage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 5 Afkoop modelleren met GLM 29 5.1 Het logistische model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5.2 Praktische problemen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 6 Gewogen lineaire regressie op klassen 6.1 Continue polisvariabelen opdelen in klassen 6.2 Bivariate analyse . . . . . . . . . . . . . . . 6.3 Regressie op polisgegevens . . . . . . . . . . 6.3.1 Significante polisgegevens . . . . . . 6.3.2 Het aantal klassen reduceren . . . . 6.4 Regressie met economische parameters . . . 6.4.1 Dataset met niet-fiscale polissen . . 6.4.2 Dataset met fiscale polissen . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
31 31 33 35 36 38 38 38 40
7 De dynamische formules 43 7.1 Het continu maken van de resterende duurtijd . . . . . . . . . . . . . . . . . . 43 7.2 Afkooppercentages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 5
6
INHOUDSOPGAVE
8 Besluit
49
A Figuren A.1 Bivariate Analyse . . . . . . . . . . . . . . . . . . . A.2 Significante polisgegevens . . . . . . . . . . . . . . A.3 Regressie met economische parameters: Niet-fiscaal A.4 Regressie met economische parameters: Fiscaal . . A.5 Controle modelassumpties: Niet-fiscaal . . . . . . . A.6 Controle modelassumpties: Fiscaal . . . . . . . . .
51 51 53 55 57 58 61
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
B Het aantal klassen reduceren
65
C Regressie met de volledige dataset
69
Hoofdstuk 1
Inleiding Voor mijn masterproef heb ik dit onderwerp gekozen, omdat ik zo onmiddellijk theorie in de praktijk kon omzetten door gebruik te maken van Generalised Linear Models. Het concept afkoop was iets nieuws voor mij en zo hoopte ik om er meer over te weten te komen. Het betreft een innovatief onderzoek aangezien er over het dynamisch karakter van afkoop nog niet veel literatuur is. We proberen in deze masterproef ten eerste te bepalen welke kenmerken van een polis of van de verzekeringnemer een effect hebben op het verwacht afkooppercentage. Ten tweede onderzoeken we of er een dynamisch verband is met de marktrente. Dit verband zou namelijk een extra risico inhouden, zoals uitgelegd zal worden in hoofdstuk 2. In dat hoofdstuk geven we ook de kadering binnen de nieuwe Europese wetgeving Solvency II. In hoofdstuk 3 leggen we uit wat Generalised Linear Models zijn. We beschouwen daar kort de theorie hieromtrent. Daarna bekijken we in hoofdstuk 4 welke gegevens we allemaal beschouwen, zowel polisgegevens als parameters die de economische omgeving reflecteren. Hoofdstuk 5 en 6 gaan dan effectief over de statistische studie die is gebeurd. In hoofdstuk 7 wordt tot slot de formule toegelicht die we hieruit hebben bekomen. Deze formule is geschikt om onmiddellijk ge¨ımplementeerd te worden in actuari¨ele cash flow modellen. Over dit onderwerp is er in de literatuur niet veel te vinden. Kent en Morgan [3] beschrijven in het algemeen het dynamisch gedrag van verzekeringnemers als het op het uitoefenen van opties in een levensverzekering aankomt. Hier wordt ook specifieker ingegaan op het dynamische risico dat verbonden is aan de afkoopoptie. Kim [5] deed een statistische studie aan de hand van Generalised Linear Models op Koreaanse levensverzekeringen. Hij bekwam als belangrijkste economische parameters de marktrente, het werkloosheidspercentage en de economische groei. Tot slot heeft Kiesenbauer [4] ook een statistische studie gedaan. Hij deed dit voor 130 Duitse levensverzekeraars. Een belangrijke conclusie daar is dat afkooppercentages ook voor een groot deel afhankelijk zijn van de structuur en de geschiedenis van de verzekeringsmaatschappij. Hij bekomt als economische variabelen het consumentenvertrouwen, de marktrente en de economische groei. Deze twee studies geven al een indicatie dat er sterk verschillende resultaten bekomen kunnen worden voor verschillende landen en zelfs voor verschillende bedrijven. Een mogelijk belangrijke oorzaak voor verschillen is de fiscaliteit. Deze kan sterk verschillen per land.
7
8
HOOFDSTUK 1. INLEIDING
Hoofdstuk 2
Het afkooprisico In dit hoofdstuk beschrijven we eerst wat we juist beschouwen als afkoop. Daarna bekijken we welke invloed afkoop heeft op het Asset Liability Management (ALM). Hier zal duidelijk worden wat het risico is voor verzekeringsmaatschappijen wanneer er veel mensen afkopen. In de Engelstalige literatuur wordt vaak het woord lapse gebruikt. Hiermee bedoelt men niet steeds hetzelfde. In het meest specifieke geval gaat het over het afkopen van het volledige contract. Hierbij krijgt de verzekeringnemer zijn reserve verminderd met een afkoopvergoeding uitbetaald. Soms gaat het over het gedeeltelijk afkopen van een contract en dan krijgt de verzekeringnemer een deel van de reserve uitbetaald dat overeenkomt met dat deel van het contract. In beide gevallen zal de verzekeringsmaatschappij een vergoeding aanrekenen omdat de verzekeringnemer het contract niet tot einddatum aanhoudt. Deze vergoeding moet ervoor zorgen dat de verzekeraar gedeeltelijk of volledig vergoed wordt voor de kosten om de terugbetaling te kunnen doen. Zo wordt het risico dat hiermee verbonden is, verkleind. Een laatste mogelijkheid is dat men onder lapse ook het stopzetten van de premiebetaling verstaat, als het contract een periodieke premiebetaling inhoudt. Hiervoor wordt geen boete aangerekend, maar het risico dat dit met zich meebrengt, is ook niet zo groot als bij de andere twee gevallen, omdat er geen activa moeten worden verkocht. De eerste twee gevallen kunnen ondergebracht worden onder de term surrender en het derde geval onder de term dormancy. In deze masterproef zullen we enkel surrender beschouwen en we vertalen dit als afkoop. We bekijken hierbij zowel gedeeltelijke als volledige afkoop.
Definitie 2.1. Afkoop is de gebeurtenis waarbij de verzekeringnemer de optie uitoefent om (een deel van) zijn reserve uitbetaald te krijgen. Hierbij wordt ook (een deel van) het contract stopgezet.
Het lijkt logisch dat het aantal afkopen zal vari¨eren als economische parameters veranderen. De meest voor de hand liggende is de marktrente. Als de marktrente bijvoorbeeld groter wordt dan de gegarandeerde intrest van het contract, kunnen verzekeringnemers een hoger rendement halen door hun contract af te kopen en de vrijgekomen gelden te herbeleggen aan de hogere rentevoet. Ze zullen in dit geval dus meer geneigd zijn om af te kopen. 9
10
HOOFDSTUK 2. HET AFKOOPRISICO
2.1
Effect van afkoop op ALM
Het probleem bij afkopen dat zich voor de verzekeraar stelt, is dat de gegarandeerde intrest nooit perfect hedgebaar is. Het kan dus zijn dat het onmogelijk is om zodanig te investeren dat zowel uitbetaling bij vervroegd afkopen als op einddatum van het contract volledig gedekt zijn. In essentie betekent dit dat de duration 1 van het contract niet gekend is, omdat het tijdstip en de grootte van de betaling nog onzeker zijn. Om dit duidelijk te maken, beschrijven we eerst een kort voorbeeld waarbij we veronderstellen dat het afkooppercentage statisch is. Daarna is er nog een voorbeeld waarbij we een statisch afkooppercentage hebben verondersteld, maar waarbij de verzekeringnemers zich dynamisch gedragen ten opzichte van de intrest. Daar is er een groter risico. Voorbeeld 2.2. Veronderstel dat we een polis uitschrijven die • 5 jaar duurt, • een ´e´enmalige premie heeft van 100, • een gegarandeerde intrest heeft van 4% op jaarbasis zonder winstdeelname, • en waarvoor het gemiddelde jaarlijkse afkooppercentage 3,84% is (0,04/1,04) • en waarvoor de afkoopwaarde gelijk is aan de opgebouwde reserve. Zo geldt er dat we volgende verwachte toekomstige uitgaven hebben: Jaar 1 4
Jaar 2 4
Jaar 3 4
Jaar 4 4
Jaar 5 104
Dat de afkoopwaarde elk jaar 4 is, is gemakkelijk te zien. Er geldt namelijk dat na het eerste jaar de reserve 100 × 1, 04 = 104 is. De verwachte afkoopwaarde die we moeten uitbetalen is dan 3, 84% × 104 = 4. Omdat er zo 100 in de reserve overblijft, geldt dit elk jaar. Om ervoor te zorgen dat we aan deze verplichtingen voldoen, kunnen we investeren in 5jarige obligaties met een coupon van 4%. We veronderstellen dat deze bestaat. Als nu het re¨ele afkooppercentage hoger is dan het veronderstelde, dan moeten we ergens extra geld vandaan halen. In dit simpele voorbeeld is de enige mogelijkheid het voortijdig verkopen van obligaties. Dit gebeurt aan marktwaarde en is afhankelijk van de intrest op dat moment. Op zich is dit geen probleem, want het kan ons verlies opleveren of het kan ons winst opbrengen, naargelang de intrest is gestegen of gedaald. Stel dat de intrest is gestegen en de obligaties dus minder waard zijn. We moeten dan meer obligaties verkopen dan wanneer de intrest stabiel zou zijn gebleven. Maar dan hebben we niet meer genoeg obligaties om de toekomstige verplichtingen te dekken en zo maken we verlies. Het vorige voorbeeld geeft al een idee waarom het belangrijk is om ervoor te zorgen dat de assets en de liabilities goed op elkaar worden afgestemd. Hierbij moet een zo goed mogelijke schatting gemaakt worden van de afkoop. Ook toont het aan dat er een afkooprisico is, want 1 De duration is het gewogen gemiddelde van het tijdstip van toekomstige cash-flows. De gewichten zijn de grootte van de cash flows.
2.1. EFFECT VAN AFKOOP OP ALM
11
bij meer afkopen, kan het zijn dat je verlies maakt. Ook als er minder afkopen zijn dan verwacht, is dit niet noodzakelijk goed. Want we hebben dan elk jaar een overschot dat moet worden herbelegd op kortere termijn. Maar de intrest op kortere termijn is ook lager, zodat de verplichtingen op einddatum groter zijn dan de beleggingen. In het statische geval is er dus geen groot probleem, omdat het verwachte afkoopgedrag niet afhankelijk is van de intrest. Jammer genoeg zullen verzekeringnemers zich niet noodzakelijk statisch gedragen. Voor het volgende voorbeeld baseren we ons op een voorbeeld uit [3]. Daarin zullen we zien dat het probleem groter wordt als de verzekeringnemers dynamisch afkoopgedrag vertonen. Er zullen namelijk meer afkopen zijn wanneer de intrest stijgt. Dit is juist het geval waarbij er verlies wordt gerealiseerd bij verkoop van obligaties. En er zullen minder afkopen zijn als de intrest daalt, zodat we niet aan de goede voorwaarden kunnen beleggen om de verplichtingen te dekken. Voorbeeld 2.3. Veronderstel dat we een polis uitschrijven die • 5 jaar duurt, • een ´e´enmalige premie heeft van 100, • een gegarandeerde intrest heeft van 4% op jaarbasis met 100% van de return die boven de gegarandeerde intrest ligt als winstdeelname2 , • en waarvoor het gemiddelde jaarlijkse afkooppercentage 4,76% is (0,05/1,05) • en waarvoor de afkoopwaarde gelijk is aan de opgebouwde reserve, inclusief alle winstdeelnames uit het verleden. We veronderstellen nu dat we een return van 5% halen op onze obligaties. De winstdeelname die we dan zullen uitkeren, is gelijk aan 1%, omdat de return die we halen 1% boven de gegarandeerde intrest ligt. Zo geldt er dat we volgende verwachte toekomstige uitgaven hebben: Jaar 1 5
Jaar 2 5
Jaar 3 5
Jaar 4 5
Jaar 5 105
Dat de afkoopwaarde elk jaar 5 is, volgt analoog als in het vorige voorbeeld. Deze uitgaven zijn dan volledig gedekt door de obligaties met een coupon van 5%. Als nu de intrest stijgt of daalt terwijl alle andere parameters constant blijven, dan stijgen of dalen de assets en de liabilities met dezelfde grootte. Als de intrest bijvoorbeeld stijgt met 2 procentpunt, dan zijn beide waarden 91,8 op t = 0. Omdat we de obligatie gewoon tot maturiteit kunnen behouden, moeten we geen minwaarde realiseren en is er dus geen probleem. Laten we nu veronderstellen dat we geen statisch afkooppercentage hebben, maar een dynamische afkoop die voldoet aan 4, 76% + max(0, m − p) × 10% − min (4, 76%, max(0, p − m) ∗ 5%) ,
(2.1)
2 Dit is niet realistisch omdat we dan nooit winst zouden kunnen maken als verzekeringsmaatschappij. Dit is dan ook een puur theoretisch voorbeeld.
12
HOOFDSTUK 2. HET AFKOOPRISICO
met m de marktrente en p de intrest van de polis (gegarandeerde intrest + toegekende winstdeelname). In deze formule stijgt de afkoop als het verschil tussen de marktrente en de intrest van de polis stijgt. Hierbij is de stijging groter als dit verschil positief is dan wanneer het verschil negatief is. Figuur 2.1 geeft het afkooppercentage in functie van dit verschil.
Figuur 2.1: Formule (2.1) Als in dit geval de marktrente met 2 procentpunt stijgt naar 7%, dan stijgt het afkooppercentage naar 24,76%, want de return blijft 5%. Stel dat dit gebeurt in jaar 1. Dan zal de totale afkoopwaarde die moet worden uitbetaald, 26 (= 24, 76% ∗ 105) bedragen. Maar omdat de coupon die we krijgen maar 5 is, moeten we obligaties verkopen ter waarde van 21. Dit heeft als gevolg dat we een minwaarde moeten realiseren van (100 − 91, 8) ∗
21 = 1, 88. 91, 8
Als we nu veronderstellen dat dit verlies een invloed heeft op de returns van de jaren erna, dan wordt die return 2,57%. Maar we moeten nog steeds 4% gegarandeerde intrest geven op de polissen die niet zijn afgekocht. In de veronderstelling dat na het eerste jaar het afkooppercentage terug 4,76% is, worden de verwachte uitgaven dus Jaar 1 26
Jaar 2 3,91
Jaar 3 3,91
Jaar 4 3,91
Jaar 5 82,16
Dat de betaalde afkoopwaarde elk jaar 3,91 is, komt weer doordat (105−26)×1, 04×0, 0476 = 3, 91. Dit gaat zo verder voor de komende jaren. De marktwaarde van de obligatie op t = 0 blijft 91,8 zoals in het voorbeeld met een statisch afkooppercentage, maar de marktwaarde van de verplichtingen op t = 0 wordt
2.2. SOLVENCY II
13
3, 91 3, 91 82, 16 26 3, 91 + + + + 2 3 4 1, 07 1, 07 1, 07 1, 07 1, 075 = 24, 30 + 3, 42 + 3, 19 + 2, 98 + 58, 58
marktwaarde =
= 92, 47.
Door de hoge afkoopwaarde in het eerste jaar, is nu ook de effectieve duration van de liabilities korter dan die van de assets. Deze twee vaststellingen zorgen ervoor dat de assets en de liabilities niet meer overeenkomen. Maar er stelt zich nog een groter probleem. Doordat de return lager wordt, zal het verschil tussen de intrest die de verzekeringnemers krijgen en de marktrente nog groter worden, waardoor het probleem elk jaar groter wordt. Zo komt de verzekeraar in een negatieve spiraal terecht. Dus als we in het algemeen investeren aan de verwachte duration van de verplichtingen, dan is er het risico dat intresten stijgen en een ongerealiseerd verlies cre¨eren. Doordat de intresten stijgen, zullen er meer afkopen zijn waardoor we een deel van het ongerealiseerde verlies moeten realiseren. Een logische reactie is om te investeren aan een kortere duration om dit probleem te voorkomen. Maar dan is er het risico dat de intresten dalen en dat er minder afkopen zijn. De overschot die we dan elk jaar hebben aan inkomsten, moet herbelegd worden aan een lagere intrest. Hierdoor hebben we op einddatum niet genoeg om de verzekeringnemers terug te betalen. Deze twee voorbeelden tonen aan waarom het zo belangrijk is om het afkooppercentage goed te schatten. Een goede schatting kan er voor zorgen dat inkomsten en uitgaven in de toekomst beter met elkaar overeenkomen. Het afkooprisico bestaat dus uit de mogelijke afwijking op het toekomstig afkoopgedrag. Merk wel op dat een inschatting maken van het afkoopgedrag in de praktijk niet simpel is, omdat daar in ´e´en portefeuille polissen zitten met verschillende gegarandeerde intresten en verschillende duration. Ook de afkooppercentages kunnen verschillen doordat er een verschillend doelpubliek is of doordat er andere voorwaarden gelden bij afkoop. Bij het modelleren van het afkooppercentage zal men er dus voor moeten zorgen dat er voldoende parameters in acht worden genomen die het gedrag kunnen be¨ınvloeden van de verzekeringnemers. In deze masterproef zullen we proberen een dynamische formule te bekomen via een statistische benadering. We zullen hierbij proberen gebruik te maken van Generalised Linear Models. Het volgende hoofdstuk zal hier wat achtergrond rond behandelen. Hierbij zullen een aantal praktische problemen opduiken. Daarom zullen we toch een meer klassieke aanpak gebruiken om de formule te bekomen.
2.2
Solvency II
In de nieuwe Europese wetgeving, Solvency II, die van kracht wordt vanaf 1 januari 2016, wordt ook het afkooprisico beschouwd. We geven hier een korte kadering van het afkooprisico
14
HOOFDSTUK 2. HET AFKOOPRISICO
binnen deze wetgeving. Hiervoor hebben we ons gebaseerd op een college aan de VUB [8]. De figuren die we hier gebruiken zijn ook afkomstig van dit college. Onder Solvency II moeten technische voorzieningen gewaardeerd worden op basis van een best-estimate inschatting. Dit wil zeggen dat we een zo goed mogelijke, markt-consistente waardering moeten maken van deze voorzieningen. De buffer tegen insolvabiliteit ligt dan volledig bij de Solvency Capital Requirement (SCR). Bij levensverzekeringen wordt de best estimate liabilities berekend als het kansgewogen gemiddelde van de toekomstige cashoutflows, verminderd met het kansgewogen gemiddelde van de toekomstige cashinflows. Er wordt rekening gehouden met de tijdswaarde van geld. Deze berekening moet polis per polis gebeuren. Eventueel mogen polissen wel gegroepeerd worden in homogene klassen. De cashoutflows bestaan uit: • Uitkeringen – bij overlijden (op basis van de geschatte sterftekansen) – bij eindetermijn – bij afkoop (op basis van de geschatte afkooppercentages) – bij ziekte/invaliditeit • commissies aan makelaars • kosten (administratiekosten, beleggingsvergoedingen,. . . ) • eventuele herverzekeringspremies. De cashinflows bestaan uit: • de toekomstige premies • eventuele uitkeringen en winstdeelname van de herverzekeraar. Bovenop deze best estimate zal er ook nog een risicomarge berekend moeten worden om het kapitaal te vergoeden dat aangehouden moet worden. Hierbij komt het afkooprisico enkel impliciet aan bod doordat deze risicomarge wordt berekend aan de hand van de SCR. De SCR wordt berekend door schokken toe te passen op alle risico’s afzonderlijk en dan de verschillende vereiste kapitalen te combineren met diversificatie-effecten in acht genomen. Figuur 2.2 geeft een schematisch overzicht van al deze risico’s. We zullen hier enkel het afkooprisico bespreken. white Het vereiste kapitaal voor het afkooprisico wordt bepaald als het maximum van drie scenario’s: SCRlapse = max(Lapse up, Lapse down, Lapse mass). Hierbij is
2.2. SOLVENCY II
15
Figuur 2.2: Solvency Capital Requirement • Lapse up, een permanente stijging van 50% van de afkooppercentages voor alle polissen die hierdoor negatief be¨ınvloed worden, • Lapse down, een permanente daling van 50% van de afkooppercentages voor alle polissen die hierdoor negatief be¨ınvloed worden, • Lapse mass, de afkoop van 40% van alle verzekeringspolissen waarvoor de afkoop zou leiden tot een stijging van de best estimate. Wanneer we de resultaten van QIS53 bekijken, zien we dat het afkooprisico het grootste deel van van het onderschrijvingsrisico leven vertegenwoordigd. Dit is te zien in figuur 2.3.
3 QIS staat voor Quantitative Impact Study. Deze werden uitgevoerd door verzekeraars over heel Europa om de impact van Solvency II in te schatten.
16
HOOFDSTUK 2. HET AFKOOPRISICO
Figuur 2.3: QIS5: verdeling van het onderschrijvingsrisico leven over de subrisico’s Het afkooprisico situeert zich binnen Solvency II dus zowel in de best estimate als in de SCR. In de eerste plaats situeert deze studie zich voornamelijk in het bepalen van de afkoopparameter voor de best estimate. Voor de schokken om de SCR te bepalen zou er namelijk op verschillende manieren kunnen omgegaan worden met het dynamisch karakter van de afkoop.
Hoofdstuk 3
Generalised Linear Models Verderop in deze tekst zullen we gebruik maken van Generalised Linear Models, afgekort GLM. In dit hoofdstuk behandelen we de theoretische achtergrond ervan. Ook bekijken we in welke vorm we GLM zouden kunnen gebruiken voor het afkooprisico. Dit hoofdstuk is voornamelijk gebaseerd op [1] en [2]. We beginnen met een korte samenvatting van het klassiek lineair regressiemodel. GLM is hiervan een uitbreiding, zoals de benaming zelf al zegt.
3.1
Lineaire modellen
Het doel van een lineair model is om een verband te vinden tussen de verklarende variabelen X en de te verklaren variabele Y. Realisaties van de variabelen worden Xi en Yi genoteerd. Definitie 3.1. Een lineair model voor Y bestaat uit een vector β en een variantie σ 2 zodat Y geschreven kan worden als Y = β0 + Xβ + , waarbij normaal verdeeld is met verwachtingswaarde 0 en variantie σ 2 . Voor n observaties en m verklarende variabelen X1 , . . . , Xm zoeken we dus parameters β1 , . . . , βm zodat 1 Y1 1 X1,1 · · · X1,m 2 Y2 1 X2,1 · · · X2,m β0 Y3 1 X3,1 · · · X3,m β1 3 = .. + . .. .. .. .. . . .. .. . . . . . βm n Yn 1 Xn,1 · · · Xn,m Hierbij wordt de kleinste kwadraten methode toegepast om het model te schatten. Deze methode schat β als (X 0 X)−1 X 0 Y . Als ons model goed is, hebben we dan concreet parameters gevonden zodat voor een volgende observatie Y ∗ geldt dat ∗ Y ∗ = E[Y ∗ ] + , waarbij E[Y ∗ ] = β0 + β1 X1∗ + β2 X2∗ + · · · + βm Xm .
17
18
HOOFDSTUK 3. GENERALISED LINEAR MODELS
We veronderstellen dus dat de verwachtingswaarde van Y een lineaire combinatie is van de verklarende variabelen en dat er een gemeenschappelijke variantie is. Dit kan samengevat worden in volgende veronderstellingen.
(LM1) Willekeurige component: Elke realisatie van Y is onafhankelijk en normaal verdeeld. Ze hebben een verschillende verwachtingswaarde µi , maar dezelfde variantie σ 2 . (LM2) Systematische component: De verklarende variabelen worden gecombineerd om de verwachtingswaarde van Y te bekomen: E[Y ] = Xβ. Er zijn heel wat beperkingen bij de klassieke lineaire modellen, zoals de normaliteit of zoals dat µi een lineaire combinatie is van de verklarende variabelen. Daarom worden de veronderstellingen uitgebreid om zo te komen tot GLM.
3.2
De veronderstellingen bij Generalised Linear Models
Er bestaat een heel scala aan GLMs. Lineaire modellen zijn hiervan een specifiek geval. De veronderstellingen van normaliteit, constante variantie en additiviteit van verklarende variabelen worden aangepast. De te verklaren variabele moet niet meer normaal verdeeld zijn, maar moet behoren tot de exponenti¨ele familie van verdelingen. Het wordt ook mogelijk om de variantie te laten vari¨eren met de verwachtingswaarde. De additiviteit wordt tot slot aangepast zodat die enkel nog maar moet gelden in getransformeerde vorm. De veronderstellingen voor GLM worden zo:
(GLM1) Willekeurige component: Elke realisatie van Y is de realisatie van een verdeling die tot de exponent¨ele familie behoort. (GLM2) Systematische component: De verklarende variabelen worden gecombineerd om de variabele η te bekomen. Dit gebeurt lineair, dwz η = Xβ. (GLM3) Link functie: De relatie tussen de willekeurige en de systematische component wordt gespecifieerd door een link functie g, die differentieerbaar en monotoon is zodat g(E[Y ]) = η.
3.2. DE VERONDERSTELLINGEN BIJ GENERALISED LINEAR MODELS
19
Merk op dat de laatste veronderstelling ook kan genoteerd worden als E[Y ] = µ = g −1 (η). De normale verdeling behoort ook tot de familie van exponenti¨ele verdelingen, zodat het lineaire model een specifiek geval is van een GLM. Hierbij is de verdeling de normale verdeling, de variantie constant en de link functie de identieke functie.
3.2.1
De exponenti¨ ele familie van verdelingen
Bij de veronderstellingen voor GLM werd gebruik gemaakt van de exponenti¨ele familie van verdelingen. Hieronder defini¨eren we deze familie. Daarna geven we nog enkele eigenschappen. Definitie 3.2. De exponenti¨ ele familie van verdelingen is gedefinieerd als de 2-parameter familie yi θi − b(θi ) fi (yi ; θi , φ) = exp + c(yi , φ) , ai (φ) waarbij ai (φ), bi (θi ) en c(yi , φ) functies zijn die op voorhand gedefinieerd zijn. θi is gerelateerd aan de verwachtingswaarde en φ is een schaalparameter die gerelateerd is aan de variantie. Het is handig om te weten dat voor verdelingen die tot de familie behoren volgende twee eigenschappen gelden: • De verdeling is volledig gedefinieerd aan de hand van de verwachtingswaarde en de variantie. • De variantie van Yi kan uitgedrukt worden als een functie van de verwachtingswaarde. Deze functie kunnen we in de volgende vorm schrijven: V ar(Yi ) =
φV (µi ) . ωi
Hierbij is V (·) een functie, ook wel de variantiefunctie genoemd. De parameter φ schaalt de variantie en ωi is een gewicht voor observatie i. Dit gewicht hangt af van de ’geloofwaardigheid’ van de i-de observatie. Tot de exponenti¨ele familie behoren onder andere de normale verdeling, de Poisson verdeling, de binomiale verdeling en de gamma verdeling. Voor de normale verdeling is bijvoorbeeld V (x) = 1 en voor de binomiale is dit V (x) = x(1 − x). We bestuderen hieronder nog even kort de gewichten ωi en de schaalparameter φ. De gewichten ωi De gewichten maken het mogelijk om gekende informatie over de ’geloofwaardigheid’ van een observatie mee te nemen in het model. Stel bijvoorbeeld dat niet alle observaties over dezelfde periode gaan (sommige polissen lopen langer,. . . ). We kunnen dan een groter gewicht geven aan observaties die gaan over een langere periode, omdat die meer informatie en minder variabiliteit bevatten. Zo krijgen deze observaties een kleinere variantie en zullen
20
HOOFDSTUK 3. GENERALISED LINEAR MODELS
ze dus het model sterker be¨ınvloeden dan observaties over een kortere periode. Bij de data die we verderop gebruiken, is er geen reden om te veronderstellen dat bepaalde observaties ’geloofwaardiger’1 zijn. We gaan hier dus niet verder op in, omdat we alle gewichten gelijk zullen nemen. De schaalparameter φ φ is niet gekend op voorhand. Hij moet geschat worden als we hem willen kennen. Maar dit is niet nodig om de GLM parameters β te vinden. We hoeven φ enkel te schatten als we de standaardafwijking van de fouttermen willen weten. In dat geval kan φ behandeld worden als een extra parameter en geschat worden via de maximum likelihood methode. Het nadeel hiervan is dat we geen expliciete functie bekomen en dat het lang kan duren. Alternatieven hiervoor zijn • de moment schatter (Pearson χ2 statistiek), gedefinieerd als φˆ =
1 X ωi (Yi − µi )2 , n−p V (µi ) i
• en de totale afwijking schatter, gedefinieerd door φˆ =
D . n−p
De totale afwijking D zullen we later defini¨eren.
3.2.2
Link functies
Wegens de veronderstellingen in het lineaire model moesten de effecten daar additief zijn. Bij GLM wordt deze voorwaarde versoepeld in (GLM3). Nu is het enkel nog nodig dat een bepaalde transformatie van Y, g(E(Y )), ervoor zorgt dat de effecten additief zijn. Het is handiger om µi uit te drukken als functie van de verklarende variabelen, zodat typisch de inverse van g wordt beschouwd. Zo krijgen we µi = g −1 (ηi ). Deze link functie moet differentieerbaar en monotoon zijn (ofwel strikt stijgend ofwel strikt dalend). Enkele voorbeelden van link functies vind je hieronder.
Identiteit Log Inverse Logit Complementary log-log 1
g(x) x ln(x) 1/x
ln
g −1 (x) x ex 1/x
x 1−x
ln(− ln(1 − x))
1
ex 1+ex x − e−e
We gebruiken jaarlijkse data, dus de lengte van de observatie speelt geen rol. Alle data zijn op dezelfde manier bekomen en hebben dezelfde structuur, dus is er geen reden om grotere gewichten te geven aan bepaalde observaties
3.3. HET GLM MODEL
3.3
21
Het GLM model
De structuur van het GLM model ziet er samengevat als volgt uit: X µi = E[Yi ] = g −1 Xij βj , j
V ar[Yi ] =
φV (µi ) . ωi
Hierbij is Y
de vector met uitkomsten voor de te verklaren variabele voor alle observaties,
g(x)
de link functie (een inverteerbare functie die de link is tussen de verwachtingswaarde van de te verklaren variabelen en de lineaire combinatie van verklarende variabelen),
X
de matrix die de verklarende variabelen bevat voor alle observaties,
β
een vector met modelparameters die geschat dienen te worden,
φ
een parameter om de functie V (x) te schalen,
V (x)
de variantiefunctie, en
ωi
een gewicht dat een ’geloofwaardigheid’ toewijst aan observatie i.
Bij het opstellen komen Y , X en de ωi uit de data. Hoe deze uit de data worden gehaald is al onderhevig aan het oordeel van de ontwerper. Verdere assumpties worden gemaakt bij de keuze van de link functie, de variantiefunctie en ook of de φ mee wordt geschat of op voorhand wordt vastgelegd. Typische modelvorm voor afkooppercentages Wanneer er modellen worden gemaakt om kansen te bepalen, wordt er meestal gewerkt met het logit model met binomiale fouttermen. De logit functie wordt hier gekozen omdat die het interval (0, 1) afbeeldt op (−∞, +∞). Een andere mogelijkheid is de complementary log-log functie. Omdat afkooppercentages op polisniveau overeenkomen met een kans dat er wordt afgekocht, zijn dit onmiddellijk twee mogelijke vormen waarmee we aan de slag zouden kunnen in ons geval.
3.4
De modelparameters schatten
De modelparameters βj zouden we kunnen vinden door toepassing van de maximum likelihood methode. Voor grote datasets is dit in de praktijk niet doenbaar. Daarom wordt er meestal gewerkt met een numerieke benadering. We vatten eerst de maximum likelihood methode kort samen. Daarna beschouwen we het Newton-Raphson algoritme dat ook wordt gebruikt in statistische programma’s als SAS en R. Kort samengevat zoekt de maximum likelihood methode de parameterwaarden die de grootste kans hebben om onder het beschouwde model de observaties te hebben gegenereerd. Dit wordt gedaan door de likelihood functie te maximaliseren, of voor praktische redenen de loglikelihood functie. Hierbij wordt de likelihood gedefinieerd als het product van de kansen
22
HOOFDSTUK 3. GENERALISED LINEAR MODELS
dat elke y-waarde wordt geobserveerd. Bij de log-likelihood wordt dit product een som, wat handiger is om mee te werken.
3.4.1
Numerieke methode voor grote datasets
Het algoritme van Newton-Raphson is een iteratief proces dat de formule β n+1 = β n − H1 .s gebruikt. Hierin is β n de n-de iteratieve schatting van de vector met schatters β, s de vector met eerste afgeleiden van de log-likelihood en H1 de matrix met de tweede afgeleiden van de log-likelihood. Als startwaarde kan β 0 = 0 gekozen worden, of de resultaten van een ander statistisch model. Kort uitgelegd, berekent dit algoritme een nulpunt van s. Maar dit punt is dan een maximum van de log-likelihood functie en ook van de likelihood functie.
3.4.2
Significantietesten
Significantie zullen we testen door de afwijking te meten van de geobserveerde waarden ten opzichte van de waarden die we bekomen met het model. Hiervoor defini¨eren we de afstandsfunctie d(Yi ; µi ) als Z Yi Yi − ζ d(Yi ; µi ) = 2ωi dζ. µi V (ζ) Hierbij vergelijken we observatie Yi met de voorspelde gemiddelde waarde µi onder het GLM. Wanneer V (x) strikt positief is, is d(Yi ; µi ) positief en voldoet deze functie inderdaad aan de voorwaarden van een afstandsfunctie. d(Yi ; µi ) geeft meer gewicht aan het verschil tussen Yi en µi als het gewicht ωi groter is of als de variantiefunctie V (x) kleiner is. Dit laatste betekent dat wanneer we weten dat Yi van een verdeling komt met een kleine variantie, een klein verschil toch niet onbelangrijk is. Als we dit nu sommeren over alle observaties dan bekomen we de totale afwijking D: Z Yi n X (Yi − ζ) D= 2ωi dζ. V (ζ) µi i=1
Tot slot passen we dit nog aan aan de vorm van de verdelingsfunctie. Dit doen we door te delen door de schaalparameter φ. Zo bekomen we de geschaalde totale afwijking D∗ : Z n X ωi Yi (Yi − ζ) ∗ D = 2 dζ. φ µi V (ζ) i=1
Op deze geschaalde totale afwijking kunnen we verschillende statistische testen toepassen. E´en van de meest gebruikte is het vergelijken van twee geneste modellen. Hierbij testen we het verschil tussen twee modellen, waarbij het tweede alle verklarende variabelen van het eerste bevat. Dit wordt ook wel een Type II test genoemd.
3.4. DE MODELPARAMETERS SCHATTEN
23
Merk eerst op dat D∗ ∼ χ2df , met df het aantal vrijheidsgraden, dit is het aantal observaties min het aantal geschatte parameters. Stel nu dat model 0 is opgebouwd met een deelverzameling van de parameters waarmee model 1 is opgebouwd. Dan geldt D0∗ − D1∗ ∼ χ2df0 −df1 . Een chi-kwadraat maakt het dus mogelijk om te testen of de parameters die verschillen in beide modellen, een statistisch significant verschil opleveren. Dit meet dus of het opnemen van een extra parameter het model genoeg verbetert. Er treedt hierbij wel een probleem op. D∗ is afhankelijk van φ, dus de schaalparameter kunnen we hiermee niet schatten. Zelfs als we hem niet willen schatten, maar als hij wel ongekend is, hebben we hetzelfde probleem. Dit probleem kunnen we oplossen door een F test te doen op D in de plaats van een chikwadraat test op D∗ . Deze test ziet er dan als volgt uit df1 (D0 − D1 ) ∼ χ2df0 −df1 . (df0 − df1 )D1
24
HOOFDSTUK 3. GENERALISED LINEAR MODELS
Hoofdstuk 4
Mogelijke modelparameters In dit hoofdstuk bekijken we op voorhand welke gegevens we gaan gebruiken om het model op te stellen. We maken hierbij een onderscheid tussen twee soorten parameters. Eerst behandelen we de economische parameters. Deze zijn op een bepaald ogenblik hetzelfde voor alle polissen. Daarna beschouwen we de polisgegevens. Dit zijn specifieke gegevens die enkel van toepassing zijn op de desbetreffende polis. Als laatste zullen we ook nog de afhankelijke variabele bespreken, namelijk het afkooppercentage. We zullen toelichten wat de bronnen van de gegevens zijn, onder welke vorm we de gegevens opnemen en waarom we de gegevens onder die vorm opnemen. Hierbij zullen we vermelden wat we verwachten dat het effect gaat zijn. Soms kan het zijn dat we geen invloed verwachten, maar dat we die parameter toch mee in de analyse opnemen om er zeker van te zijn dat er geen effect is. Het gaat hier bijvoorbeeld over het geslacht. In dit project beschouwen we de portefeuille Tak 21 Individueel Modern van KBC verzekeringen, met een historiek van 10 jaar1 . Bij moderne levensverzekeringen wordt de intrestgarantie voor elke premie vastgelegd op het ogenblik van betaling. Deze gegarandeerde intrest kan eventueel nog verhoogd worden met een winstdeelname. We beschouwen deze portefeuille omdat we hier het grootste dynamisch effect op de afkoop verwachten.
4.1
Economische parameters
De belangrijkste factor die we zullen beschouwen, is de marktrente. We willen weten of de marktrente een invloed heeft op het afkoopgedrag omdat dit juist het dynamische risico inhoudt, zoals in hoofdstuk 2 beschreven. We verwachten dat er meer afkopen zullen zijn als de marktrente hoger wordt, omdat verzekeringnemers dan de mogelijkheid hebben om een hogere return te bekomen. Als marktrente beschouwen we Belgische overheidsobligaties. Meer specifiek zullen we de OLO op 10 jaar gebruiken. We gebruiken Belgische obligaties omdat de meeste verzekeringnemers Belgen zijn. We gebruiken de obligatie op 10 jaar omdat dat diegene is die in de media verschijnt en dus diegene waarmee verzekeringnemers gemakkelijk kunnen vergelijken. We verwachten wel dat andere duurtijden, behalve zeer korte duurtijden, een gelijkaardig resultaat zullen geven. 1
We gebruiken dus gegevens van 2004 tot 2013.
25
26
HOOFDSTUK 4. MOGELIJKE MODELPARAMETERS
Een tweede parameter die we beschouwen, is de aandelenmarkt. Dit is een mogelijk alternatief voor verzekeringnemers om te beleggen. We verwachten een zelfde soort effect als bij de marktrente. Om dit uit te drukken, bekijken we de procentuele toename van de Bel20 en de Eurostoxx50 gedurende het voorgaande jaar. Omdat deze waarschijnlijk sterk gecorreleerd zijn, mag er wel maar ´e´en van de twee in het model voorkomen. Als ze allebei significant zijn, zullen we onderzoeken welke van de twee het meest significante effect heeft. Dit komt in feite overeen met bekijken waarmee onze verzekeringnemers het meest vergelijken, de Belgische markt of de Europese markt. Een derde factor die een effect zou kunnen hebben, is de werkloosheidsgraad. Als er meer mensen werkloos zijn, zijn er ook meer mensen die op korte termijn geld nodig zullen hebben. De kans is dan groter dat mensen moeten afkopen omdat ze het geld nodig hebben. Een vierde factor is het consumentenvertrouwen. Als dit hoog is, geven mensen meer uit. Ze investeren dan dus minder. Het is waarschijnlijk dat dit eerder het aantal nieuwe contracten en nieuwe premies zal be¨ınvloeden, maar we nemen dit toch mee omdat het een factor is die de economie goed weerspiegelt. Andere factoren die de economische omgeving bepalen en die we zullen beschouwen, zijn de economische groei, de inflatie en wisselkoersen. Economische groei drukken we uit in procentuele toename van het bruto binnenlands product gedurende het voorgaande jaar. Wisselkoersen geven een indicatie van hoe de Europese economie het doet in vergelijking met de rest van de wereld. Als wisselkoers beschouwen we enkel de euro-dollar wisselkoers. Om consistent te zijn met andere modellen van KBC gebruiken we als OLO-gegevens de historische gegevens die worden gebruikt voor de economische scenario generator van KBC. De andere parameters hebben we bekomen via de websites van de Nationale Bank van Belgi¨e [6] en van de Organisation for Economic Co-operation and Development [7]. Tussen de economische parameters zullen er verschillende sterke correlaties zijn. We moeten dus oppassen voor multicollineariteit. Deze kan vermeden worden door te onderzoeken welke parameters sterk gecorreleerd zijn en er daarvan telkens maar 1 te behouden. Bij voorkeur wordt diegene met de grootste significantie bewaard, maar bij sterk gecorreleerde variabelen zal dit geen groot verschil maken. Voor deze variabelen nemen we steeds de waarden op 31/12 van het voorgaande jaar, omdat we ook maar jaarlijkse polisgegevens beschikbaar hebben. We nemen de waarde op het einde van vorig jaar en niet die in bijvoorbeeld het midden van het jaar, omdat we ervan uit gaan dat verzekeringnemers beslissingen nemen aan de hand van de meest recente informatie. Doordat we voor elke economische variabele maar 1 waarde per jaar hebben, zullen er maar weinig verschillende observaties zijn voor de economische variabelen. In de toekomst zou deze studie wel op maandelijkse gegevens kunnen uitgevoerd worden, omdat er nu wel maandelijks gegevens worden bewaard.
4.2. POLISGEGEVENS
4.2
27
Polisgegevens
De eerste specifieke parameter is de gegarandeerde intrest van de polis. verzekeringnemers die een hogere gegarandeerde intrest krijgen, zullen minder gemakkelijk afkopen omdat het verschil met de marktrente kleiner is. Om deze parameter goed mee te nemen in de analyse, splitsen we voor deze polissen de reserve per gegarandeerde intrest. Hierbij maken we abstractie van het feit dat steeds de oudste reserve eerst moet afgekocht worden. Ook beschouwen we deze parameter samen met de marktrente. We nemen namelijk als verklarende variabele marktrente-gegarandeerde intrest. De tweede factor is het product. Verschillende producten hebben verschillende voorwaarden en dus kan het zijn dat het afkoopgedrag anders zal zijn. Ten derde beschouwen we ook het fiscaal regime van de polis. We verwachten dat dit een belangrijke parameter zal zijn, omdat er bij afkoop van een fiscaal ingebrachte polis veel belasting moet betaald worden. Het is dan minder voordelig om naar andere beleggingen over te schakelen. Hierbij is er wel een uitzondering voor mensen die op vervroegd pensioen gaan, maar dit zal dan mee uitgedrukt worden in de leeftijdsvariabele. We maken ook een onderscheid tussen polissen die een fiscaal voordeel genieten van pensioensparen of van langetermijnsparen. Omdat het fiscaal regime van de polis voor een totaal verschillend gedrag van de verzekeringnemers kan zorgen, bekijken we tijdens de studie ook of het niet beter is om voor de drie categorie¨en een verschillende analyse te doen. Een vierde parameter die we beschouwen, is de leeftijd van de verzekeringnemer. Mensen van verschillende leeftijden hebben andere motieven om af te kopen. Jonge mensen willen het geld misschien gebruiken om een huis te kopen. Terwijl personen tussen 60 en 65 jaar willen afkopen wanneer ze op vervroegd pensioen gaan. Ook zou het kunnen dat personen met een verschillende leeftijd zich meer of minder dynamisch gedragen. Een vijfde factor die we zullen onderzoeken, is de resterende duurtijd van de polis. De afkoopvergoeding hangt meestal van de resterende duurtijd af. Dus afkopen kan ’goedkoper’ worden als de resterende duurtijd korter wordt. Andere factoren die we nog zullen beschouwen, zijn de reserve, het geslacht van de verzekeringnemer, het verkoopskanaal waarbij de polis is afgesloten, de betalingswijze en de premiefrequentie. Van deze factoren verwachten we niet onmiddellijk een invloed, maar verzekeringnemers met verschillende gegevens hiervoor kunnen wel een verschillend gedrag vertonen. Al deze gegevens komen uit de datacenters van KBC Verzekeringen. We hebben ze beschikbaar op jaarbasis, telkens op 31 december.
4.3
Het afkooppercentage
We hebben per polis en per gegarandeerde intrest steeds de reserve beschikbaar op het 31 december van het voorgaande jaar. De bedragen van de afkopen hebben we beschikbaar op
28
HOOFDSTUK 4. MOGELIJKE MODELPARAMETERS
de datum van afkoop. Deze komen dus niet overeen. Maar we hebben ook wel steeds in de gegevens staan of het een volledige of gedeeltelijk afkoop was. Voor volledige afkopen stellen we het afkooppercentage gelijk aan 100%. Voor gedeeltelijke afkopen zijn er dan nog twee mogelijkheden, afkopen uit een reserve met een andere gegarandeerde intrest dan de huidige of afkopen uit de reserve met dezelfde gegarandeerde intrest als de huidige. Voor afkopen uit een reserve met een andere gegarandeerde intrest dan de huidige, kunnen we veronderstellen dat de reserve toeneemt aan de gegarandeerde intrest. Zo krijgen we afkoop% =
afkoop m , reserve × (1 + i) 12
met i de gegarandeerde intrest en m het aantal maanden dat voorbij is voordat de afkoop plaats vindt. In januari is m dus 0, in februari 1 en zo verder. Voor afkopen uit een reserve met dezelfde gegarandeerde intrest als de huidige kunnen we dit niet toepassen, omdat het kan zijn dat er gedurende het jaar nog premies zijn betaald. Hier vermenigvuldigen we de reserve met de toename van de totale reserve van alle polissen van hetzelfde product. Dit geeft afkoop% =
afkoop
reserve × 1 +
reserve1 −reserve0 reserve0
×
m 12
,
met reserve0 de totale reserve op het begin van het jaar en reserve1 de totale reserve op het einde van het jaar. Dit is een benadering, maar deze kan zowel te hoog als te laag zijn omdat sommige polissen proportioneel gezien meer premie betalen tijdens het jaar dan andere. Het kan zijn dat dit percentage voor sommige polissen groter wordt dan 100%. In dat geval stellen we het afkooppercentage gelijk aan 100%.
Hoofdstuk 5
Afkoop modelleren met GLM In [1], [2], [4] en [5] stelt men telkens voor om afkopen te modelleren aan de hand van een generalised linear model met de logit link functie en een binomiale verdeling. In [5] wordt dit ook nog eens onderzocht met de complementary log-log link functie en een binomiale verdeling. Deze resultaten wijken niet hard af van de studie met de logit link functie. We zullen hier eerst de theorie verder uitwerken voor het geval met de logit link functie. Daarna zullen we enkele praktische problemen bespreken die we tegenkomen met deze aanpak. Hierbij beschrijven we ook hoe deze problemen op te lossen zijn door toch nog steeds gebruik te maken van hetzelfde generalised linear model. Voor de studie hebben we een andere (meer klassieke) methode uitgewerkt aan de hand van een model met lineaire regressie op homogene klassen. Dit zal aan bod komen in het volgende hoofdstuk.
5.1
Het logistische model
Een generalised linear model wordt volledig gedefinieerd aan de hand van de link functie en de verdeling van de foutterm. We defini¨eren hier eerst het logistische model. Daarna zullen we de verschillende karakteristieken ervan afleiden, zoals de variantiefunctie en de schaalparameter. Definitie 5.1. Het logistische model heeft als link functie de logit link functie x g(x) = ln , 1−x en een binomiaal verdeelde foutterm . Het is duidelijk dat de link functie volgende inverse heeft: g −1 (x) =
ex . 1 + ex
Alle observaties beschrijven eenzelfde periode, namelijk 1 jaar. Er is ook geen andere reden om bepaalde observaties een groter gewicht te geven, dus we stellen wi = 1 voor alle observaties i.
29
30
HOOFDSTUK 5. AFKOOP MODELLEREN MET GLM
De binomiale verdeling heeft als verwachtingswaarde E[] = p, met p de kans op uitkomst 1, en als variantie Var[] = p(1 − p). Het is dus onmiddellijk duidelijk dat φ = 1, en V (x) = x(1 − x). Omdat de schaalparameter een constante is, hoeft deze in dit geval niet meer geschat te worden.
5.2
Praktische problemen
Een eerste praktisch probleem stelt zich bij de vorm van de data. We willen zowel gedeeltelijke als volledige afkopen modelleren. Hiervoor hebben we de afkoop uitgedrukt in een percentage. De afhankelijke variabele neemt dus waarden aan in [0, 1]. Dit is niet van de juist vorm om het logistische model te gebruiken. Dit probleem zou opgelost kunnen worden door zowel de kans op afkoop te bepalen voor gedeeltelijke als voor volledige afkoop afzonderlijk1 . Voor de gedeeltelijke afkopen kunnen we dan een verwacht afkooppercentage bepalen. Zo bekomen we volgende formule voor het afkooppercentage. a = P afkoopvolledig + P afkoopgedeeltelijk × E a|afkoopgedeeltelijk , met a het afkooppercentage. De twee kansen op afkoop kunnen bepaald worden met het logistische model, want die kansen zijn juist de overeenkomende verwachtingswaarden. De verwachte conditionele verwachting kan aan de hand van lineaire regressie bepaald worden. Dit zorgt er wel voor dat we drie aparte regressies moeten doen. Een tweede praktisch probleem stelt zich door de hoeveelheid data. Omdat we alle moderne tak 21 producten van KBC Verzekeringen samen willen beschouwen en dit over 10 jaar, beschikken we over ongeveer 8 miljoen observaties. Als we hierop SAS procedures laten werken, neemt dit telkens toch wat tijd in. Een enkele regressie neemt al ongeveer een half uur in beslag. Dit zou kunnen verholpen worden door elk product apart te beschouwen. Beide oplossingen samen zorgen ervoor dat we 30 regressies moeten doen. De aanpak aan de hand van homogene klassen en een lineaire regressie die we in het volgende hoofdstuk voorstellen, is veel simpeler en neemt ook minder tijd in beslag.
1
Dit kan gedaan worden door twee datasets te maken. Bij 1 van die datasets stellen we afkopen tussen 0 en 1 gelijk aan 0. Bij de andere stellen we afkopen die 1 zijn, gelijk aan 0. Bij de tweede dataset defini¨eren we dan nog een dummy variabele om ervoor te zorgen dat de afhankelijke variabele enkel waardes 0 en 1 aanneemt. Het effectieve afkooppercentage bewaren we zodat we dit nog kunnen gebruiken om het verwacht afkooppercentage te bepalen op voorwaarde dat er een gedeeltelijke afkoop gebeurt.
Hoofdstuk 6
Gewogen lineaire regressie op klassen Bij deze methode zoeken we eerst klassen van polissen die zich hetzelfde gedragen. Hiervoor bepalen we voor elke continue variabele klassen waarvoor het afkooppercentage verschilt. Dit doen we grafisch. Daarna verdelen we de polissen in groepen van hetzelfde jaar en met dezelfde polisgegevens. We bepalen een gemiddeld afkooppercentage per groep en dan bepalen we aan de hand van een gewogen lineaire regressie welke parameters dit percentage be¨ınvloeden. De gewichten zijn hierbij gelijk aan het aantal observaties in die klasse. Dan weten we welke polisgegevens een significant effect hebben op het afkooppercentage. We maken nieuwe klassen waarbij we ons enkel baseren op deze parameters. Als er dan genoeg observaties per klasse zijn zodat het afkooppercentage normaal verdeeld wordt als gevolg van de Centrale Limietstelling, dan kunnen we lineaire regressie toepassen. Bij lineaire regressie moeten namelijk de fouttermen normaal verdeeld zijn. Als de te verklaren variabele normaal verdeeld is, dan is dat een indicatie dat de fouttermen ook normaal verdeeld zullen zijn. Zo zou die veronderstelling voor lineaire regressie voldaan zijn. Om dan de dynamische functie te bekomen, doen we opnieuw een gewogen lineaire regressie met de overgebleven polisgegevens en de economische parameters. Voordat we aan de regressies beginnen, controleren we eerst op multicollineariteit.
6.1
Continue polisvariabelen opdelen in klassen
Om genoeg observaties te hebben per klasse, moeten we continue polisvariabelen opdelen in klassen. Als we dit niet zouden doen, zijn er niet genoeg observaties met exact dezelfde polisgegevens. We maken deze klassen op grafische basis. Later zullen we voor de variabelen die effectief worden meegenomen, testen of de gemaakte klassen effectief significant verschillende verwachtingswaardes hebben. De eerste variabele waarbij we dit zullen doen, is de resterende duurtijd. We maken een grafiek die per resterende duurtijd het afkooppercentage weergeeft. Daarop gaan we dan na wanneer het afkooppercentage anders is dan voor voorgaande resterende duurtijden. Op figuur 6.1 hebben we stippellijnen toegevoegd om duidelijk te maken welke klassen we hebben gekozen. De eerste 5 jaren hebben duidelijk een hoger afkooppercentage, wat waarschijnlijk als oorzaak heeft dat er een verminderde afkoopvergoeding is in de laatste vijf jaren van de polis. Daarna lijkt er zich een kwadratische trend voor te doen. We kiezen hier klassen van 31
32
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
Figuur 6.1: Afkooppercentage per resterende duurtijd
tien jaar, dan is er enkel tussen 25 en 35 een grote verandering. Als de resterende duurtijd groter is dan 45 jaar, is er geen duidelijke trend zichtbaar Er is dan ook meer variantie, doordat er minder observaties zijn. Hier moeten onze klassen breder zijn omdat er minder observaties zijn. We kiezen ervoor om dit deel nog in twee te splitsen bij een resterende duurtijd van 75 jaar. Zo bekomen we dus 7 klassen voor de resterende duurtijd. De grenzen van deze klassen worden gegeven door 5, 15, 25, 35, 45 en 75 jaar. Merk op dat er zeer hoge resterende duurtijden zijn. Dit komt doordat polissen zonder einddatum in het beheersysteem de 110e verjaardag van de verzekeringnemer als einddatum krijgen. Op figuur 6.2 doen we nu hetzelfde voor de leeftijd van de verzekeringnemer. Hier zijn verschillende trends zichtbaar. We proberen deze allemaal mee te nemen door als grenzen voor de klassen de leeftijden 18, 23, 30, 40, 50 en 60 te nemen. Na 60 zijn er ook weer minder observaties waardoor we deze klasse als de breedste nemen.
Het laatste continue polisgegeven dat we beschouwen, is de reserve. Hierbij geeft figuur 6.3 het afkooppercentage aan per klasse van 10 000 euro. We bekijken dit per 10 000 euro omdat bijna elke polis een verschillende reserve heeft. Hier is geen duidelijk trend zichtbaar. Enkel de variantie neemt toe naarmate de reserve groter wordt. Dit heeft waarschijnlijk als oorzaak dat er minder polissen zijn met grote reserves. We maken hier toch klassen zodat we kunnen controleren dat er geen verband is. We kiezen voor klassen van 100 000 euro tot 400 000 en daarna ´e´en klasse.
6.2. BIVARIATE ANALYSE
33
Figuur 6.2: Afkooppercentage per leeftijd van de verzekeringnemer
Figuur 6.3: Afkooppercentage per reserve in de polis
6.2
Bivariate analyse
Hier zullen we correlaties onderzoeken om zo multicollineariteit te vermijden. We laten onmiddellijk variabelen weg die een sterke correlatie vertonen. We bekijken enkel correlaties tussen polisgegevens onderling en tussen economische parameters onderling. Correlaties tussen polisgegevens en economische variabelen onderzoeken, is niet nuttig doordat polisgegevens meestal weinig vari¨eren in de tijd en economische variabelen constant veranderen. We beginnen eerst met de correlaties tussen de polisgegevens onderling. Figuur 6.4 geeft
34
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
deze correlaties weer.
Figuur 6.4: Correlaties van de polisgegevens Er zijn niet veel hoge correlaties. Enkel tussen de resterende duurtijd van de polis en de leeftijd van de verzekeringnemer is er een hoge correlatie. Dit is ook logisch omdat je leeftijd enkel zal toenemen na het afsluiten van een polis. Ook hebben alle polissen die fiscaal zijn ingebracht als pensioensparen dezelfde eindleeftijd, zodat de correlatie nog sterker wordt. Omdat de trend in de resterende duurtijd duidelijker is dan bij leeftijd, kiezen we ervoor om de leeftijd van de verzekeringnemer weg te laten. We beschouwen nu de correlaties tussen economische gegevens. Herinner dat dit de waarden zijn op 31/12 van het voorbije jaar. Deze correlaties worden weergegeven in figuur 6.5. Tussen deze variabelen is er veel correlatie. Een oorzaak van dit feit is dat we maar 10 verschillende observaties hebben. Doordat er veel correlatie is, is het aangeraden om niet te veel economische variabelen mee op te nemen in het model. Twee variabelen zal waarschijnlijk al het maximum zijn. Van deze economische variabelen zijn er al verschillende die we onmiddellijk weglaten. Deze worden hieronder opgesomd. • De groei in de Eurostoxx50, omdat deze een correlatie heeft van 93% met de groei in de Bel20. We kiezen om de Bel20 te behouden en niet de Eurostoxx50, omdat de meeste van onze klanten Belg zijn en dus de Bel20 het vaakst in de media zullen zien. • De inflatie, omdat die sterk gecorreleerd is met de groei in het Bruto Binnenlands Product, de groei in de Bel20 en het werkloosheidspercentage. De inflatie vertoont daarentegen geen sterk verband met het afkooppercentage.
6.3. REGRESSIE OP POLISGEGEVENS
35
Figuur 6.5: Correlaties van de economische variabelen • Het consumentenvertrouwen, omdat die sterk gecorreleerd is met de groei in het Bruto Binnenlands Product en de groei in de Bel20. Het consumentenvertrouwen vertoont daarentegen geen sterk verband met het afkooppercentage. • De euro-dollar wisselkoers, omdat die sterk gecorreleerd is met de groei in de Bel20 en het werkloosheidspercentage. De euro-dollar wisselkoers vertoont daarentegen geen sterk verband met het afkooppercentage. Hierbij noemen we twee variabelen sterk gecorreleerd als er een correlatie is van ongeveer 50% of groter. Dat de laatste 3 variabelen geen sterk verband hebben met het afkooppercentage is te zien in de figuren in appendix A.1. We merken hier ook op dat er geen zichtbaar verband is tussen het afkooppercentage en de variabele OLO10-intrestgarantie. Als we die plot dan nog eens opnieuw maken voor enkel de niet-fiscale polissen, dan lijkt het dat er wel een verband is. De interactieterm tussen OLO10-intrestgarantie en het fiscaal regime zal dus belangrijk zijn. Concreet wil dit zeggen dat verzekeringnemers met een polis die niet fiscaal is ingebracht anders zullen reageren op een verandering van de marktrente dan verzekeringnemers die hun polis wel fiscaal hebben ingebracht. Deze plots zijn te zien in figuur 6.6, links de algemene scatterplot en rechts de scatterplot voor enkel de niet-fiscale polissen.
6.3
Regressie op polisgegevens
We maken groepen van polissen die voor alle polisgegevens dezelfde waarde hebben of in dezelfde klasse zitten en die geobserveerd zijn in hetzelfde jaar. We bepalen voor deze groepen een afkooppercentage. Dit is het gemiddelde van de afkooppercentages van de polissen. Daarop doen we dan een regressie om te bepalen welke polisgegevens het meest
36
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
(a)
(b)
Figuur 6.6: Afkooppercentage ten opzichte van OLO10-intrestgarantie significante effect op het afkooppercentage hebben. Daarna kunnen we dan nieuwe, grotere groepen maken aan de hand van de meest significante polisgegevens. Aan de hand van deze nieuwe klassen kunnen we dan een nieuwe regressie doen met de economische variabelen inbegrepen. Al deze regressies zijn gewogen lineaire regressies met als gewicht het aantal observaties in de groep.
6.3.1
Significante polisgegevens
Hiervoor gebruiken we de stapsgewijze automatische procedure in SAS met als selectiecriterium het corrected Akaike Information Criterion (AICc). De SAS-resultaten zijn te vinden in appendix A.2. We zullen er steeds naar verwijzen. In het eerste resultaat (in tabel A.4) is te zien dat de reserve niet mee in het model wordt opgenomen bij de automatische modelselectie. Dit wil zeggen dat het toevoegen van de reserve het model maar zeer weinig verbetert. Deze variabele kunnen we dus al weglaten. Omdat de reserve geen effect heeft op het afkooppercentage, is het niet nodig om binnen de klassen het afkooppercentage te bepalen aan de hand van een gewogen gemiddelde van de polissen met als gewicht de reserve. We zien ook dat de AICc niet meer sterk daalt bij toevoeging van het verkoopskanaal, het feit of er een aanvullende ongevalsdekking is en het feit of er een overlijdensdekking is. We laten deze 4 variabelen weg bij het bepalen van de groepen van polissen en komen zo al grotere klassen uit. Hierop doen we opnieuw een regressie om te controleren of ze nog allemaal bijdragen aan het model, of dat het hiervoor toevallig was dat ze mee waren opgenomen. Alle effecten worden mee opgenomen in het model, zoals te zien is in tabel A.5. Als we dan controleren of de residuen normaal verdeeld zijn, blijkt toch dat dit niet het geval is (zie hiervoor het histogram in figuur A.7). We moeten daarom nog variabelen weglaten. We zien dat de AICc nog 1700 daalt bij toevoeging van de productklassen, maar
6.3. REGRESSIE OP POLISGEGEVENS
37
bij toevoeging van het geslacht van de verzekeringnemer daalt die nog maar 300. Daarom kiezen we ervoor om ook het geslacht van de verzekeringnemer, de methode van premiebetaling en het soort overlijdensdekking weg te laten.
Figuur 6.7: Histogrammen van het afkooppercentage en zijn logit getransformeerde Als we dan de regressie nog eens opnieuw doen met grotere klassen, lijkt er geen variabele meer te zijn die we kunnen weglaten. Op het histogram in figuur A.8 is wel te zien dat de residuen nog steeds niet normaal verdeeld zijn. Daarom onderzoeken we de verdeling van het afkooppercentage en de transformaties ervan. Na enkele pogingen, blijkt dat de logit1 1
Ter herinnering: logit(x) = ln
x 1−x
en zijn inverse is logit−1 (x) =
ex 1+ex
38
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
transformatie van het afkooppercentage wel bijna normaal verdeeld is. Dit is te zien op figuur 6.7. Er is nog een grote piek voor de groepen met een afkoop gelijk aan 0%2 , maar omdat de foutterm normaal verdeeld moet zijn en niet de te verklaren variabele, is dit nu nog geen probleem. Ook hebben groepen die een afkooppercentage van 0% hebben meestal minder observaties, zodat het gewicht ervoor zorgt dat ze niet zo hard zullen doorwegen.
6.3.2
Het aantal klassen reduceren
We gaan per overgebleven parameter na of de verwachtingswaarde wel significant verschilt voor alle klassen. Klassen die niet significant verschillen, kunnen we dan samenvoegen. Dit staat in detail beschreven in appendix B. Voor de resterende duurtijd voegen we de twee hoogste klassen samen en voor de premiefrequentie de haljaarlijkse en de kwartaalpremies. Bij de producten zijn er verschillende die we samenvoegen. Het Life Plan wordt samengevoegd met zijn voorganger de New Life. De twee groeiplannen (97 en 99) worden samengevoegd en ook de twee spaarplannen (Life Home Plan en Life Health Plan) worden samengevoegd. Dit zijn intu¨ıtief ook logische samenvoegingen omdat ze ongeveer dezelfde polisvoorwaarden hebben. Nu hebben we nog minder klassen waardoor er minder klassen zullen zijn met een afkooppercentage van 0%. In de volgende stap zullen we de economische variabelen toevoegen.
6.4
Regressie met economische parameters
We zoeken nu een formule die het verwacht afkooppercentage bepaalt aan de hand van de 4 polisgegevens die we hiervoor hebben geselecteerd en de economische variabelen. Als we dit voor alle data samen doen, bekomen we geen goede formule. Er is te veel multicollineariteit aanwezig in de geselecteerde parameters. De methode om tot deze formule te komen, staat beschreven in appendix C. Omdat we op figuur 6.6 hebben gezien dat fiscaal ingebrachte polissen een ander effect van de marktrente op het afkooppercentage vertonen, splitsen we de data op in twee datasets, ´e´en met de niet fiscaal ingebrachte polissen en ´e´en met de polissen die wel fiscaal zijn ingebracht. Hopelijk bekomen we door deze twee datasets apart statistisch te behandelen betere resultaten. Zo bekomen we wel twee verschillende formules.
6.4.1
Dataset met niet-fiscale polissen
Voor het bepalen van een functie voor de niet-fiscale polissen, vertrekken we van dezelfde indeling in klassen als hiervoor. Het geselecteerde model van een eerste automatische selectie heeft als economische variabelen enkel de groei in de Bel20 en het verschil tussen de OLO op 10 jaar en de intrestgarantie. Dit is te zien in tabel A.9. Maar de groei in Bel20 heeft een negatieve parameterschatting. Dit is tegen onze intu¨ıtie in. Daarom zoeken we de oorzaak van dit verband. We maken een plot van het gemiddeld afkooppercentage per groei in Bel20. Hierop is te zien dat er eigenlijk geen effect is. Het effect wordt voornamelijk veroorzaakt door de observaties in 2009 en 2012. Dit zijn de jaren 2 Omdat de logit functie niet gedefinieerd is in 0 en 1 vervangen we afkoooppercentage van 0% door 0, 01% en afkooppercentage van 100% door 99, 99%.
6.4. REGRESSIE MET ECONOMISCHE PARAMETERS
39
die volgen op de financi¨ele crisis en de crisis in Griekenland. Het zou daarom niet correct zijn om deze variabele mee te nemen. We laten deze dan ook weg.
We voegen nu de interactietermen met de resterende economische variabele toe. Dit gebeurt weer via een automatische selectieprocedure, waarvan de output te vinden is in tabel A.10. Alle interacties worden mee in het model opgenomen, maar bij de opname van de laatste twee daalt AICc niet meer sterk. We nemen dus enkel de interactieterm OLO10-igar*produkt mee in het model. Wanneer dit model geschat wordt (in tabel A.11), heeft geen enkele parameter van deze interactie een schatting die significant verschillend is van 0. Ook heeft dit als gevolg dat OLO10-igar niet meer significant is. Daarom kiezen we ervoor om ook deze interactie niet mee in het model op te nemen. Tot hiertoe hebben we geen rekening gehouden met de winstdeelname die werd gegeven. We zullen dit hier nog nagaan. Merk wel op dat de winstdeelname een sterke correlatie (0,45) vertoont met OLO10-igar. Deze sterke correlatie is logisch doordat de beslissing om winstdeelname te geven, wordt be¨ınvloed door de marktrente. Reserves met een lage intrestgarantie krijgen ook steeds een hogere winstdeelname. We testen of winstdeelname mee moet opgenomen worden in het model. In figuur A.12 is te zien dat dit maar voor een kleine reductie in AICc zorgt. Ook is de parameter die bij de winstdeelname hoort niet significant verschillend van 0 op een significantieniveau van 95%. Daarom nemen we de winstdeelname niet mee op als nieuwe variabele. Omdat winstdeelname een soort van (niet gegarandeerde) intrest is, kunnen we OLO10(igar+wd) opnemen in het model in plaats van OLO10-igar. Als we de adjusted R-square van deze twee modellen vergelijken, dan zien we dat het model met OLO10-(igar+wd) beter is dan het andere.
40
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
Zo bekomen we een finaal model. De parameterschattingen voor de logit getransformeerde van het afkooppercentage worden gegeven in de volgende tabel. Merk op dat geen enkele parameter van de productklassen nog significant is, maar we zullen deze toch in het model houden omdat we dan dezelfde parameters zullen hebben voor fiscale en niet-fiscale polissen.
Voor de niet-fiscale polissen rest ons nu nog om na te gaan of de modelassumpties voor lineaire regressie voldaan zijn. Dit doen we aan de hand van de figuren in appendix A.5. Op de eerste figuur is te zien dat de residuen redelijk goed een normale verdeling benaderen. De drie figuren daarna tonen de gemiddelde residuen per klasse van een bepaald polisgegeven. Deze residuen zijn zeer klein. Daaruit kunnen we concluderen dat hun effect correct in het model is opgenomen. De laatste figuur toont het gemiddelde residu ten opzichte van OLO10-(igar+wd). Om duidelijk te maken dat daar geen trend meer in zit, hebben we de kleinste kwadraten rechte erdoor getrokken. Het voorgaande model voldoet dus aan de veronderstellingen voor lineaire regressie. Volgens de adjusted R-square verklaart ongeveer 43% van de variatie in het afkooppercentage. Verderop zal dit model nog in meer detail beschreven worden.
6.4.2
Dataset met fiscale polissen
Voor de polissen die fiscaal zijn ingebracht, gaan we analoog als hiervoor te werk. We beschouwen hierbij onmiddellijk OLO10-(igar+wd) in plaats van OLO10-igar, zodat we voor beide soorten polissen dezelfde parameters gebruiken. Ook controleren we of er een verschil is tussen polissen die zijn ingebracht als pensioensparen of als langetermijnsparen.
6.4. REGRESSIE MET ECONOMISCHE PARAMETERS
41
Daarom nemen we de dummy variabele van het fiscaal regime nog wel mee.
Een eerste analyse toont ons in figuur A.13 dat de groei in BBP de enige economische variabele is die wordt opgenomen in het model en dat er nauwelijks een verbetering is in AICc als we het fiscaal regime mee opnemen. We laten het fiscaal regime dus uit het model. Als we dit model schatten in tabel A.14, dan zien we dat er meer afkopen zullen zijn als het BBP sterker groeit. Maar we verwachten juist dat er meer afkopen zullen zijn als de economische toestand slechter is, omdat mensen hun geld dan harder nodig hebben. We gaan na wat hiervan de oorzaak is. In de volgende figuur zien we dat er ook hier twee outliers zijn. Als we deze weglaten, is er geen verband meer te zien.
We controleren nog of er een andere economische variabele moet opgenomen worden in het model. In figuur A.15 zien we dat de automatische procedure alle andere economische variabelen mee opneemt in het model, maar dat dat niet zorgt voor een grote daling in AICc. In het uiteindelijke model beschouwen we dus enkel polisgegevens. De parameterschattingen voor de logit getransformeerde van het afkooppercentage worden gegeven in de volgende tabel.
42
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
Merk ook nog op dat dit model zeker voldoet omdat het een adjusted R-square heeft van 0,7288. Dit wil zeggen dat het model 72,88% van de variatie in het afkooppercentage verklaart.
We controleren nu nog de modelassumpties voor de niet-fiscale polissen. Dit doen we aan de hand van de figuren in appendix A.6. Op de eerste figuur is te zien dat de residuen redelijk goed een normale verdeling benaderen. De drie figuren daarna tonen de gemiddelde residuen per klasse van een bepaald polisgegeven. Deze residuen zijn zeer klein. Daaruit kunnen we concluderen dat hun effect correct in het model is opgenomen. In de laatste figuur gaan we na of er echt geen effect is van OLO10-(igar+wd). Dit doen we door het gemiddelde residu te plotten ten opzichte van OLO10-(igar+wd). Daarin zien we inderdaad geen effect. Het voorgaande model voldoet dus. Verderop zal dit model nog in meer detail beschreven worden.
Hoofdstuk 7
De dynamische formules Nu gieten we de twee modellen die we hebben geschat in twee formules, ´e´en voor de fiscale polissen en ´e´en voor de niet-fiscale polissen. In deze formules zullen we indicatorfuncties gebruiken. Deze noteren we met P voor de productklassen, R voor de klassen van resterende duurtijd en F voor de klassen van premiefrequentie. Merk wel op dat we hiervoor ook klassen hebben samengevoegd1 . Voor de polissen die niet fiscaal zijn ingebracht, geeft het model als formule logit(afkoop%) =
+
Rx≤5 +
R5<x≤15
+
R15<x≤25 +
R25<x≤35 +
−
PLifePlan −
PJuniorPlan −
−
F1 −
R35<x≤45 PGroeiplan −
PSelectPlan
× (OLO10 − (igar + wd)).
F2 +
De formule voor polissen die wel fiscaal zijn ingebracht is van dezelfde vorm. Er is hier geen dynamische term. Merk ook op dat er andere producttypes zijn. Dit komt doordat sommige producten enkel fiscaal of niet-fiscaal verkocht worden. De formule wordt zo logit(afkoop%) =
7.1
+
Rx≤5 +
+
R15<x≤25 +
+
PLifePlan +
−
F1 −
R5<x≤15 R25<x≤35 + PSelectPlan −
R35<x≤45 PVAPZ −
PMVAP
F2 .
Het continu maken van de resterende duurtijd
Voor de resterende duurtijd hebben we in het model 5 parameters, ´e´en voor elke klasse behalve de hoogste. Maar dan is er een groot verschil in verwacht afkooppercentage tussen polissen met bijvoorbeeld een resterende duurtijd van 35 jaar en 36 jaar, waarvoor alle andere gegevens hetzelfde zijn. Om dit te verhelpen, willen we een functie maken die gebaseerd is op deze 5 parameterschattingen. Voor polissen met een resterende duurtijd groter dan 45 jaar, behouden we 0 als parameter, omdat we eerder al hebben gezien dat het afkooppercentage 1
Ter herinnering: We hebben voor de premiefrequentie de haljaarlijkse en de kwartaalpremies samengevoegd. Bij de producten hebben we het Life Plan samengevoegd met New Life. Ook de twee groeiplannen en de twee spaarplannen zijn samengevoegd.
43
44
HOOFDSTUK 7. DE DYNAMISCHE FORMULES
daar totaal anders is. We zoeken eerst de gemiddelde resterende duurtijd per klasse. Daarna zoeken we dan een functie die de parameterschattingen benadert in die gemiddeldes. Voor de niet-fiscale polissen bekomen we volgende klassegemiddeldes. Klasse 0-5 5-15 15-25 25-35 35-45
Gemiddelde 1,8539 8,6203 17,9667 28,4050 38,0673
Parameter 1,0504 1,1910 1,2827 1,5269 1,6682
We plotten deze punten met de kleinste kwadraten rechte. We duiden hierop ook aan wat de parameter zou zijn indien we toch klassen behouden.
Omdat dit geen grote verschillen oplevert met de constante waarden per klasse, lijkt dit een goede manier om de parameters te benaderen. Deze functie komt overeen met p = .2 De formule voor de afkoop wordt zo logit(afkoop%) =
+( −
PLifePlan −
−
F1 − 1.8433F2 +
)Rx≤45 PJuniorPlan −
PGroeiplan −
PSelectPlan
× (OLO10 − (igar + wd)).
We doen hetzelfde voor de polissen die wel fiscaal zijn ingebracht. Dit geeft volgende klassegemiddeldes. 2
Hierin is p de parameter die bij de resterende duurtijd hoort en r de resterende duurtijd.
7.1. HET CONTINU MAKEN VAN DE RESTERENDE DUURTIJD Class 0-5 5-15 15-25 25-35 35-45
Gemiddelde 2,1718 9,4380 19,2995 28,8973 37,8273
45
Parameter 1,1121 0,5494 0,6758 1,1574 1,6594
Uit deze gegevens is het onmiddellijk duidelijk dat een lineaire functie geen goede benadering is. We proberen eerst een kwadratische functie.
Deze functie wordt veel te groot wanneer de resterende duurtijd groter wordt dan 40 jaar. Ook is de afstand tussen de punten en de rechte relatief groot. Daarom proberen we een kubische functie. Dit geeft een betere benadering. De volgende figuur geeft deze functie weer. Hierop hebben we ook aangeduid wat de parameter zou zijn indien we toch klassen behouden.
46
HOOFDSTUK 7. DE DYNAMISCHE FORMULES
Deze functie wordt gegeven door p = Als we dit dan vertalen in de algemene formule voor het afkooppercentage, geeft dit logit(afkoop%) =
7.2
+( +
PLifePlan +
−
F1 −
.
)Rx≤45 PSelectPlan −
PVAPZ −
PMVAP
F2 .
Afkooppercentages
De voorgaande formules kunnen rechtstreeks ge¨ımplementeerd worden. Maar hoe groot zijn die afkooppercentages dan in de praktijk? En hoe groot is het dynamische effect? Deze twee vragen zullen we hier proberen te beantwoorden aan de hand van een paar voorbeelden. We doen dit eerst voor de fiscale polissen, omdat we daar geen dynamische term hebben. We kunnen hier dus een vast afkooppercentage bepalen als we de poliskenmerken gegeven hebben. Volgende tabel geeft de afkooppercentages weer van alle productklassen en voor bepaalde resterende duurtijden. Het gaat hierbij over polissen met maandelijkse premiebetalingen. Voor polissen met jaarlijkse premiebetaling liggen deze percentages lager.
Deze percentages liggen in lijn met de grootte van de resultaten van voorgaande studies. De grootte-orde is het enige wat we kunnen vergelijken omdat er vroeger andere klassen waren gedefinieerd. Merk op dat polissen met een duurtijd van langer dan 45 jaar een zeer laag
7.2. AFKOOPPERCENTAGES
47
afkooppercentage hebben. Bij de niet-fiscale polissen zagen we dat er wel een dynamisch effect is. Volgende grafieken laten zien hoe groot dit effect juist is. Op de grafiek geeft de horizontale as steeds weer hoeveel procentpunt de OLO op tien jaar en de intrestgarantie plus de winstdeelname van elkaar verschillen. De eerste grafiek geeft het afkooppercentage van een polis in het Life Plan met maandelijkse premiebetalingen en een resterende duurtijd van 1 jaar.
De volgende grafiek geeft het afkooppercentage van een polis in het Life Plan met jaarlijkse premiebetalingen en een resterende duurtijd van 20 jaar.
We maken ook nog dezelfde grafieken voor de Groeiplannen. De blauwe is die met maandelijkse premiebetalingen en een resterende duurtijd van 1 jaar, de groene die met jaarlijkse premiebetalingen en een resterende duurtijd van 20 jaar.
48
HOOFDSTUK 7. DE DYNAMISCHE FORMULES
Het belangrijkste dat we op deze figuren zien, is dat het dynamische effect groter is naarmate het basisafkooppercentage groter is. Dus als er in het basisgeval meer afkopen zijn, dan zal ook het dynamisch effect groter zijn. Hierbij bedoelen we met het basisgeval het geval waarbij OLO10 − (igar + wd) = 0. Als we de toename in het afkooppercentage beschouwen, bekomen we procentueel ongeveer een constante toename. Voor een toename in het verschil tussen de OLO op tien jaar en de som van de gegarandeerde intrest en de winstdeelname van 1 procentpunt, bedraagt de toename in het afkooppercentage tussen
Hoofdstuk 8
Besluit Deze masterproef had als doel om statistisch te onderzoeken welke gegevens een effect hebben op het verwacht afkooppercentage. Ook hebben we daarbij onderzocht of er een dynamisch verband is. Dit is een verband met de economische omgeving, meer specifiek met de marktrente. Een eerste onderzoek heeft ons geleerd dat het afkooppercentage het meest afhankelijk is van het fiscaal regime van de polis, de resterende duurtijd van de polis, het type product en de premiefrequentie. Daarna hebben we ondervonden dat fiscaal ingebrachte polissen zich anders gedragen dan polissen die geen fiscaal voordeel genieten. Tot slot hebben we statistisch aangetoond dat polissen die een fiscaal voordeel genieten, een afkoopgedrag vertonen dat niet afhankelijk is van de economische omgeving. Dit is te verklaren doordat de kost bij afkoop, groter is dan de opportuniteit die de hogere marktrente biedt. Polissen die een fiscaal voordeel genieten, worden namelijk extra belast als ze vervroegd worden afgekocht. Voor niet-fiscale polissen hebben we daarentegen wel een dynamisch verband gevonden. Voor een toename van OLO10 − (igar + wd) met 1 procentpunt neemt het verwacht afkooppercentage toe met ongeveer . Merk op dat deze resultaten sterk verschillen van [3] en [4]. We bekomen namelijk andere significante parameters. Maar zoals in de inleiding al werd opgemerkt, zullen de verbanden sterk verschillen per land en zelfs per verzekeringsmaatschappij. We vonden ook wel meer economische verbanden, maar deze konden we niet correct mee beschouwen in het model, omdat we te weinig data hebben. Die data zijn dan ook nog eens ’vervuild’ door de financi¨ele crisis. Deze verbanden konden we niet correct beschouwen omdat we de economische variabelen maar meenemen op 10 verschillende tijdstippen. Dit kan in de toekomst verholpen worden als er gegevens beschikbaar zouden zijn op maandbasis. De studie is enkel gebeurd op de portefeuille Tak 21 Individueel Modern. In de toekomst zullen ook de andere portefeuilles aan bod komen. Hierbij kan ongeveer dezelfde methode gebruikt worden. Er zullen wel kleine wijzigingen nodig zijn. Zo zal er bij Tak 23 best gewerkt worden met een risicoscore voor elk fonds, omdat er geen intrestgarantie is. Dit weerspiegelt dan het rendement en het risico van dat fonds. Men kan hierbij ook kijken wat de opbrengst was in het voorgaande jaar om de gegarandeerde intrest te vervangen.
49
50
HOOFDSTUK 8. BESLUIT
In deze studie hebben we enkel afkoop beschouwt, en geen premieverval (dormancy). Het lijkt niet onlogisch dat er hierbij andere variabelen een effect zullen hebben. Ten slotte kan er nog onderzocht worden wat er met het dynamisch effect moet gebeuren wanneer de Solvency II-schokken worden toegepast. Er zijn bijvoorbeeld argumenten dat het dynamisch effect niet mee geschokt moet worden. Voor het Mass Lapse scenario zouden we kunnen zeggen dat vanaf het tweede jaar de verzekeringnemers nog enkel statisch afkopen, omdat alle verzekeringnemers die dynamisch afkopen al mee hebben afgekocht met de massa. De formule die we hier hebben afgeleid zou in dat geval nog kunnen gebruikt worden, omdat ze bestaat uit een statisch deel en een dynamische term.
Bijlage A
Figuren A.1
Bivariate Analyse
Figuur A.1: Afkooppercentage ten opzichte van de inflatie
51
52
BIJLAGE A. FIGUREN
Figuur A.2: Afkooppercentage ten opzichte van het consumentenvertrouwen
Figuur A.3: Afkooppercentage ten opzichte van de euro-dollar wisselkoers white
A.2. SIGNIFICANTE POLISGEGEVENS
A.2
Significante polisgegevens
Figuur A.4: Eerste automatische lineaire regressie op polisgegevens
Figuur A.5: Tweede automatische lineaire regressie op polisgegevens
Figuur A.6: Derde automatische lineaire regressie op polisgegevens
53
54
BIJLAGE A. FIGUREN
Figuur A.7: Histogram van de residuen na de tweede regressie
Figuur A.8: Histogram van de residuen na de derde regressie white
A.3. REGRESSIE MET ECONOMISCHE PARAMETERS: NIET-FISCAAL
A.3
Regressie met economische parameters: Niet-fiscaal
Figuur A.9: Eerste automatische selectieprocedure
Figuur A.10: Automatische selectieprocedure met interactietermen
55
56
BIJLAGE A. FIGUREN
Figuur A.11: Het model met interactieterm
Figuur A.12: Het model met winstdeelname als aparte variabele
A.4. REGRESSIE MET ECONOMISCHE PARAMETERS: FISCAAL
A.4
Regressie met economische parameters: Fiscaal
Figuur A.13: Eerste automatische selectieprocedure
Figuur A.14: Modelschatting met BBPperc in het model
57
58
BIJLAGE A. FIGUREN
Figuur A.15: Automatische selectieprocedure zonder FISC en BBPperc
A.5
Controle modelassumpties: Niet-fiscaal
Figuur A.16: Histogram residuen
A.5. CONTROLE MODELASSUMPTIES: NIET-FISCAAL
Figuur A.17: Plot residuen ten opzichte van productklasse
Figuur A.18: Plot residuen ten opzichte van premiefrequentie white
59
60
BIJLAGE A. FIGUREN
Figuur A.19: Plot residuen ten opzichte van klassen resterende duurtijd
Figuur A.20: Plot residuen ten opzichte van OLO10-(igar+wd) white
A.6. CONTROLE MODELASSUMPTIES: FISCAAL
A.6
Controle modelassumpties: Fiscaal
Figuur A.21: Histogram residuen
Figuur A.22: Plot residuen ten opzichte van productklasse
61
62
BIJLAGE A. FIGUREN
Figuur A.23: Plot residuen ten opzichte van premiefrequentie
Figuur A.24: Plot residuen ten opzichte van klassen resterende duurtijd
A.6. CONTROLE MODELASSUMPTIES: FISCAAL
Figuur A.25: Plot residuen ten opzichte van OLO10-(igar+wd)
63
64
BIJLAGE A. FIGUREN
Bijlage B
Het aantal klassen reduceren Om het aantal klassen te reduceren, doen we een ANOVA. De Bonferroni t-test duidt dan klassen aan die op een niveau van 95% een significant verschillend verwacht afkooppercentage hebben. Deze worden aangeduid met drie sterren.Voor het fiscaal regime zien we dat alledrie de klassen significant verschillende verwachtingswaarden hebben.
Voor de premiefrequentie zien we dat verzekeringnemers die 2 of 4 keer per jaar een premie betalen geen significant verschillend verwacht afkooppercentage hebben. We voegen de haljaarlijkse en de kwartaalpremies dus samen.
65
66
BIJLAGE B. HET AANTAL KLASSEN REDUCEREN
Bij de resterende duurtijd bekijken we enkel opeenvolgende klassen, omdat het niet veel zin heeft om klassen samen te voegen die niet opeenvolgend zijn. Daarbij zien we dat er maar 2 opeenvolgende klassen zijn die geen significant verschillend verwacht afkooppercentage hebben. We voegen dus de klasse met resterende duurtijd van 45 jaar tot 75 jaar samen met de klasse van resterende duurtijd die groter is dan 75 jaar.
67 Om het overzichtelijk te houden, maken we bij de producten een tabel. In deze tabel staan de kruisjes voor klassen die geen significant verschillend verwacht afkooppercentage hebben. Als we meer dan twee klassen willen samenvoegen, moeten ze twee aan twee een niet-significant verschillend verwacht afkooppercentage hebben.
We kunnen dus de producten 11125 en 11128 samenvoegen. Dit zijn het Life Plan en New Life. Ook de twee groeiplannen, 111291 en 111292, kunnen we samenvoegen. Tot slot hebben ook het Life Home Plan en het Life Health Plan een verwacht afkooppercentage dat niet significant verschilt. Dit zijn respectievelijk de producten 1112E en 1112H. Nadien is er ook getest dat de klassen die we overhouden allemaal een significant verschillend verwacht afkooppercentage hebben.
68
BIJLAGE B. HET AANTAL KLASSEN REDUCEREN
Bijlage C
Regressie met de volledige dataset Een automatische stapsgewijze regressie in SAS voegt de variabelen in volgende volgorde toe:
We willen het probleem van multicollineariteit vermijden. Daarom nemen we enkel de twee economische variabelen, die het eerst worden toegevoegd, mee op in het model. Dit zijn het werkloosheidspercentage en het verschil tussen de OLO op tien jaar en de intrestgarantie. Als we dan kijken of er interactietermen tussen polisgegevens en economische variabelen1 moeten toegevoegd worden, zien we dat een selectie op basis van AICc alle interacties toevoegt. Zels bij toevoeging van de voorlaatste interactie daalt de AICc nog sterk.
1 We bekijken enkel deze interactie, omdat we willen weten of polissen met bepaalde karakteristieken een ander effect vertonen van de economische variabelen op het afkooppercentage.
69
70
BIJLAGE C. REGRESSIE MET DE VOLLEDIGE DATASET
Maar dan bekomen we grote schattingen van de parameters in absolute waarde. Deze schattingen zijn dan nog tegengesteld zodat ze mekaar vaak opheffen. Dit is een gevolg van de multicollineariteit die in het model zit. We splitsen daarom de dataset op in twee datasets, ´e´en met de niet fiscaal ingebrachte polissen en ´e´en met de polissen die wel fiscaal zijn ingebracht. Zo hopen we het probleem van multicollineariteit op te lossen.
Bibliografie [1] Anderson, D., Feldblum, S., Modlin, C., Schirmacher, D., Schirmacher, E. en Thandi, N. (2007), A Practioners Guide to Generalised Linear Models: A foundation for theory, interpretation and application, Towers Watson. [2] Cerchiara, R. R., Edwards, M. en Gambini, A. (2009), Generalized Linear Models in Life Insurance: Decrements and Risk factor analysis under Solvency II Working Paper. AFIR Colloquium Rome [3] Kent, J. en Morgan, E.(2008), Dynamic Policyholder Behaviour, Staple Inn Actuarial Society. [4] Kiesenbauer, D. (2012), Main determinants of lapse in the German life insurance industry, North American Actuarial Journal, 16(1):52-73. [5] Kim, C. (2005), Modeling Surrender and Lapse Rates with Economic Variables, North American Actuarial Journal, 9(4):5670. [6] Nationale Bank van belgi¨e, Macro-economische statistieken, geraadpleegd op 27 november 2013 van http://www.nbb.be/pub/stats/stats.htm?l=nl&tab=Figures. [7] Organisation for Economic Co-operation and Development, Stat Extracts, geraadpleegd op 27 november 2013 van http://stats.oecd.org/index.aspx. [8] Vanheule, P., Solvency II, college aan de VUB op 08/05/2014.
71