Faculteit Wetenschappen en Bio-ingenieurswetenschappen Departement van de Wiskunde
Value at Risk en modelrisico: het ERA Masterproef ingediend met het oog op het behalen van de graad van Master of Science in de Actuari¨ele Wetenschappen
Stijn Doeraene Promotor:
2013-2014
Prof. Dr. Steven Vanduffel
Abstract Bij risicoportefeuilles waar onzekerheid bestaat over de afhankelijkheden is de Value at Risk (VaR) niet eenduidig te bepalen. Het bepalen van onder- en bovengrenzen van deze VaR is de laatste jaren veelvuldig onderzocht en algoritmen werden ontwikkeld om deze te benaderen. Omdat het verschil tussen onder- en bovengrens in dergelijke situaties echter vaak aanzienlijk is, werd recent een nieuw algoritme, het Extended Rearrangement Algoritme (ERA), voorgesteld om dit interval te verkleinen, dit door een beperking op de variantie van de portefeuillesom. In deze thesis wordt deze methode besproken en geanalyseerd in functie van een selectie van risicoverdelingen. Er is aandacht voor zowel de kwalitatieve resultaten als de performantie-aspecten. Daarnaast wordt ook de mogelijkheid onderzocht voor een uitbreiding op basis van scheefheidsbeperkingen. We observeren dat het algoritme er, mits een voldoende grote dataset, in slaagt om de theoretische grenzen dicht te benaderen. Bovendien zijn de variantie-beperkte VaR-intervallen vaak opmerkelijk kleiner dan die zonder variantie-restrictie. Wel blijven aanzienlijke verschillen tussen de VaR-grenzen aanwezig, ondanks de variantiebeperkingen blijft modelrisico dus sterk aanwezig. Het ERA toont zich echter wel in staat dit risico goed te kwantificeren.
Voorwoord Na een jaar bezig te zijn met de Value at Risk en het Extended Rearrangement Algoritme bedank ik graag mijn promotor Prof. Dr. Steven Vanduffel. Ten eerste voor het voorstellen van het onderwerp van deze thesis, een onderwerp dat niet alleen mijn interesse draagt, maar ook ideaal aansluit bij mijn vooropleiding als ingenieur in de computerwetenschappen en bij mijn functie als stagiair actuaris in het Risk departement van Belfius Insurance. Ten tweede ook voor het delen van zijn expertise omtrent deze algoritmen en bijhorende literatuurstukken. Tenslotte bedank ik ook vrienden en familie voor hun steun en begrip.
Inhoudsopgave 1
Inleiding 1.1 Aanleiding en probleemstelling . . . . . . . . . . . . . . . . . . . 1.2 Thesis structuur . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Theoretisch kader 2.1 Risico’s en portefeuilles van risico’s . . . . . . . . . . . . . . . 2.2 Risicomaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Algemeen . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Value at Risk (VaR) . . . . . . . . . . . . . . . . . . . . 2.2.3 Tail Value at Risk (TVaR) . . . . . . . . . . . . . . . . 2.2.4 Overige risicomaten: CTE en ES . . . . . . . . . . . . . 2.3 Risico-aggregatie met onzekere afhankelijkheid, begrenzing van de Value at Risk . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Portefeuilles zonder variantie-beperking . . . . . . . . . 2.3.2 Portefeuilles met beperking op de variantie . . . . . . .
6 . 6 . 8 . 8 . 9 . 13 . 14
3
Het algoritme 3.1 Rearrangement Algoritme (RA) . . . . . . . . . . . . . . . . . 3.2 ERA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Begrenzing van de variantie . . . . . . . . . . . . . . . 3.2.2 Uitbreiding van het ERA: begrenzing van de scheefheid
25 . 25 . 29 . 29 . 33
4
Resultaten en performantie 4.1 Resultaten . . . . . . . . . . . . . . . . . . . . . 4.1.1 Algemeen . . . . . . . . . . . . . . . . . 4.1.2 Normaal verdeelde risico’s . . . . . . . . 4.1.3 Pareto II en lognormaal verdeelde risico’s 4.1.4 Begrenzing van de scheefheid . . . . . . 4.1.5 Optimalisatiestap 1b van het ERA . . . . 4.2 Performantie en schaalbaarheid . . . . . . . . . . 4.2.1 Algemeen . . . . . . . . . . . . . . . . .
. . . . . . . .
1
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
3 3 5
. 14 . 14 . 20
35 35 35 35 38 42 43 46 46
4.2.2 4.2.3 4.2.4
Optimalisatiestap 1b van het ERA . . . . . . . . . . . . . 46 Schaalbaarheid . . . . . . . . . . . . . . . . . . . . . . . 48 Implementatie & performantie . . . . . . . . . . . . . . . 51
Conclusie
54
Woordenlijst
56
Bibliografie
57
5
2
Hoofdstuk 1 Inleiding “Danger can never be overcome without taking risks.” — Latijnse spreuk
1.1
Aanleiding en probleemstelling
E´en van de eenvoudigste manieren om het risico van een portefeuille te verminderen is te diversifi¨eren. Door risico’s met verschillende karakteristieken samen te voegen ontstaat immers een veiligere situatie. Dit mechanisme vormt de basis in theorie¨en rond portefeuillebeheer. Om vervolgens het risico in te schatten van dergelijke portefeuilles worden risicomaten gebruikt. De Value at Risk (VaR) is hiervan e´ e´ n van de meest populaire, en de standaard in verschillende regelgevende kaders als Solvency II (European Commission, 2014) en Basel II (BCBS, 2004). Wanneer toegepast op aggregaties van risico’s ontstaat bij de VaR echter een complexere situatie. Bij portefeuilles van risico’s volstaat het namelijk niet alleen de marginale verdelingsfuncties van de afzonderlijke risico’s te kennen, ook de afhankelijkheden tussen de risico’s zijn van groot belang. Het zijn immers deze afhankelijkheden die de oorzaak zijn van het diversificatie-effect. Zo is in het roulettespel een gok op de rode kleur vrij risicovol met verlies in meer dan de helft van de gevallen. Wanneer er tegelijk ook een even grote gok op zwart wordt gemaakt, ontstaat een situatie met veel minder risico. Dit door de sterk negatieve correlatie tussen de 2 afzonderlijke risico’s. In realiteit is het exact berekenen van het risico van portefeuilles daardoor vaak problematisch. Al in 2002 kwamen Berkowitz en O’Brien (2002) bij 1 van de 3
eerste gedetailleerde analyses van VaR-modellen bij banken tot de constatatie dat deze in vele gevallen inaccuraat zijn. Terwijl de distributies van afzonderlijke risico’s in praktijk vaak nog te bepalen zijn is het registreren van de onderlinge afhankelijkheden veel delicater. Niet alleen kunnen afhankelijkheden tussen risico’s veranderen over de tijd, in het verleden is ook gebleken dat ze in extreme situaties plots kunnen veranderen (Chiang et al., 2007). Bovendien is niet alleen het bepalen van de staart van risicodistributies vaak lastig, het registreren van de exacte afhankelijkheid tussen deze extreme gebeurtenissen is door de infrequente aard nog complexer. De moeilijkheden rond het modelleren van afhankelijkheden werden o.a. tijdens de financi¨ele crisis van 2007 duidelijk toen bleek dat risico’s in de hypotheekmarkt veel sterker gecorreleerd waren dan eerst werd aangenomen (Crouhy, 2010). De onderschatte samenhang zorgde uiteindelijk voor gigantische verliezen. In dergelijke situaties met onzekere of onbekende afhankelijkheidsinformatie kan het bijgevolg interessant zijn om de absolute onder- en bovengrens van de mogelijke VaR-waarden te kunnen bepalen, zonder rekening te houden met de onderlinge correlaties. Een toepassing van het Rearrangement Algoritme (RA) (Puccetti en R¨uschendorf, 2012) door Embrechts et al. (2013a) kon deze als eerste eenvoudig bepalen. De enige vereisten zijn de verdelingsfuncties van de afzonderlijke risico’s. Als uitbreiding hierop, en omdat bleek dat in vele gevallen het mogelijk VaR-interval heel aanzienlijk was, introduceerden Bernard et al. (2013) het Extended Rearrangement Algoritme (ERA). Door het opnemen van extra gegevens, een gekende maximale variantie van de portefeuillesom, konden zo de grenzen nog verscherpt worden. De resulterende grenzen kunnen dan gebruikt worden als kwantificatie van het te lopen modelrisico. Grote VaR-intervallen duiden erop dat modellen met verschillende specificaties mogelijk heel uiteenlopende VaR’s berekenen. In deze thesis worden deze methoden in detail besproken. Analoog aan de manier waarop een maximale variantie van de portefeuillesom de VaR-grenzen kan verscherpen wordt ook een empirische uitbreiding van het ERA voorgesteld waarbij kennis van een maximale scheefheid van de portefeuillesom gebruikt kan worden om de het VaR-interval te verkleinen.
4
1.2
Thesis structuur
In hoofdstuk 2 worden de theoretische aspecten omtrent de probleemstelling geschetst. De theorie wordt ook geplaatst in een breder kader aan de hand van de uitgevoerde literatuurstudie. In hoofdstuk 3 wordt uitgeweid over de gebruikte algoritmen. Zowel het RA als het ERA komen hier aan bod. In hoofdstuk 4 worden vervolgens de resultaten van de testen ge¨ıntroduceerd en geanalyseerd. Er wordt zowel gefocust op de kwalitatieve aspecten als op de performantie. Hoofdstuk 5 vervolledigt dit document met conclusies over de eerdere resultaten.
5
Hoofdstuk 2 Theoretisch kader “Every year, if not every day, we have to wager our salvation upon some prophecy based upon imperfect knowledge” — United States Supreme Court (1919, p630)
In dit hoofdstuk wordt het theoretisch kader geschetst als voorbereiding op de introductie van de algoritmen in hoofdstuk 3.
2.1
Risico’s en portefeuilles van risico’s
Zoals in de inleiding aangehaald zullen de algoritmes uit hoofdstuk 3 toegepast worden op portefeuilles van risico. Een portefeuille kan gedefinieerd worden als een collectie van n individuele risico’s Xi waarvoor kan aangenomen worden dat een eindig gemiddelde E[Xi ] en variantie V ar[Xi ] geldt. Verder kan ook verondersteld worden dat de marginale verdelingsfuncties gekend zijn als Fj voor elke Xj , met j = 0..n of dat Xj ∼ Fj . Deze veronderstelling van gekende marginale verdelingsfuncties is in praktijk nog vrij realiseerbaar, vaak kan deze met behulp van historische data of op basis van gelijkaardige risico’s benaderd worden. In het kader van kredietrisico kan voor deze benadering van de verdelingsfuncties bijvoorbeeld gebruik gemaakt worden van modellen rond Probability of Default (PD), Loss Given Default (LGD) en Exposure at Default (EAD), componenten die o.a. ook voorkomen in de berekening van de kapitaalvereisten in de Solvency II 1 en Basel II (BCBS, 2004) akkoorden. Samengevat kan de margi1
Richtlijn 2009/138/EC van het Europees Parlement en de Europese Raad van 25 November 2009,“On the taking-up and pursuit of the business of Insurance and Reinsurance (Solvency II)”.
6
nale verdelingsfunctie dan bepaald worden door met de PD, de kans op default, de LGD, het procentueel verlies indien de default zich voltrekt en de EAD, het bedrag dat blootgesteld is indien default, het verwachte verlies (EL) te berekenen: EL = P D × LGD × EAD Voor meer informatie over de PD, LGD en EAD modellen kan verwezen worden naar o.a. Schuermann et al. (2004); Peter (2011) en Flores et al. (2010). Op basis van de marginale verdelingsfuncties van de verschillende risico’s kan vervolgens het gemiddelde µ van het gecumuleerd portefeuilleverlies S bepaald worden als: S = X1 + X2 + ..Xn =
n X
Xi
i=1
µ = E[S] = E[X1 + X2 + ..Xn ] =
n X
E[Xi ]
i=1
Het bepalen van de variantie van het gecumuleerde portefeuilleverlies S is daarentegen een omslachtiger proces. In de praktijk, ook in Solvency II (Figuur 2.1), worden hiervoor vaak correlatiematrices gebruikt. Uit onderzoek blijkt echter dat de juiste invulling van deze matrices niet zo triviaal is. Zo kwamen Chiang et al. (2007) in hun analyse van de Aziatische aandelenmarkt ten tijde van de ’97-’98 financi¨ele crisis tot de conclusie dat correlatiewaarden in crisistijden enerzijds heel dynamisch en volatiel kunnen zijn en anderzijds dat deze ook sterk be¨ınvloed kunnen worden door nieuws van o.a. veranderende kredietratings. CEIOPS (2010) vervolgens, in hun adviestekst omtrent de te gebruiken correlatieparameters in Solvency II, vermeldde nog enkele bijkomende moeilijkheden i.v.m. het bepalen van de parameters. Zo speelt het o.a. een rol over welke jaren gekalibreerd wordt en zal de beperking tot lineaire correlaties in verschillende gevallen leiden tot een onder- of overschatting van de risico’s.
7
Figuur 2.1: Gebruik van correlatiematrices bij de berekening van de SCR kapitaalsvereisten in Solvency II (Deloitte, 2010)
Deze moeilijkheden met het bepalen van de juiste correlaties maken dan ook dat de exacte variantie niet zo eenduidig is vast te stellen. Daarom wordt in het vervolg van dit document enkel gewerkt met een uiterste variantiegrens. In het algemeen kan immers wel een bovengrens s2 gesteld worden zodat V ar[S] ≤ s2 , met in het uiterste geval s2 = ∞. In de volgende delen wordt verder uitgewerkt hoe deze beperking kan helpen tot het bepalen van de Value at Risk (2.2.2). Als algemene conventie wordt, zonder aan algemeenheid in te boeten, verder aangenomen dat een risico Xi een verlies vertegenwoordigd. Het volgt hier dan ook uit dat vooral op de extreem grote waarden van S, i.e. de extreme verliezen, gefocust zal worden. Het omgekeerde geval is uiteraard analoog.
2.2 2.2.1
Risicomaten Algemeen
Een risicomaat ρ van een stochastische risicovariabele S, gedefinieerd als een functie van S naar een re¨eel getal, kan gezien worden als een manier om het risico van S samen te vatten. Indien de risicomaat vervolgens ook voldoet aan 4 andere voorwaarden kan men spreken over een coherente risicomaat (Artzner et al., 1999). Deze voorwaarden zijn: • Subadditiviteit: Voor alle X1 en X2 geldt dat: ρ(X1 +X2 ) ≤ ρ(X1 )+ρ(X2 ) 8
• Positieve homogeniteit: Voor alle λ ≥ 0 en alle Xi geldt dat: ρ(λ · Xi ) = λ · ρ(Xi ) • Monotonie: Voor alle X1 en X2 met X1 ≤ X2 geldt dat: ρ(X1 ) ≤ ρ(X2 ) • Translatie invariant: Voor alle α ∈ R en alle Xi geldt dat: ρ(Xi + α) = ρ(Xi ) − α De eerste eigenschap vertegenwoordigd in deze het voordeel van risicodiversificatie. Wanneer risico’s samengevoegd worden, treden diversificatie-effecten op waardoor de nieuwe combinatie nooit risicovoller kan zijn dat de oorspronkelijke risico’s apart. Uitzonderlijke situaties, zoals wanneer de ontstane risicoportefeuille zodanig omvangrijk is dat het sluiten ervan effect heeft op de marktprijzen onder invloed van endogeen liquiditeitsrisico 2 (Bervas, 2006; Chen, 2014) buiten beschouwing gelaten. Voor verschillende risicomaten is aan deze diversificatieeigenschap echter niet voldaan.
2.2.2
Value at Risk (VaR)
Algemeen Veruit de meest in praktijk gebruikte risicomaat is de Value at Risk (VaR). De VaR, op een bepaald betrouwbaarheidsinterval, beschrijft wat het grootst mogelijke verlies is op een bepaald risico of portefeuille van risico’s. Hoewel het VaR concept al dateert uit de jaren ’20 (Holton, 2002), heeft de VaR vooral sinds de laatste 15 jaar veel aan belang gewonnen sinds het prominent deel uitmaakt van regelgevende en industriestandaarden en het systeem van krediet ratings. Zo wordt in het kader van Solvency II de kapitaalvereiste gedefinieerd als de VaR met een betrouwbaarheidsinterval van 99.5 % (European Commission, 2014), of dus de kans om eens per 200 jaar een zwaarder verlies te lijden. Ook in Basel II krijgt de VaR een prominente rol als instrument voor bepalen van de blootstelling aan markrisico (BCBS, 2004). Een van de grote voordelen van de VaR is het feit dat deze verliezen uitdrukt in dezelfde nominale termen als het oorspronkelijk risico, dit in tegenstelling tot andere risicomaten zoals bijvoorbeeld de variantie. Ook het intuitief concept en de brede inzetbaarheid worden gezien als grote pluspunten. De VaR (Figuur 2.2), ook wel de kwantiel risicomaat genaamd, is gedefinieerd als def
VaRq (X) = FS−1 (p) = inf (x ∈ R|FX (x) ≥ q), 2
q ∈ (0, 1)
endogenous liquidity risk: dat liquiditeitsrisico onder de invloed van de trader
9
Figuur 2.2: Illustratie van de VaR van een risico X op een kans q
De VaR heeft ondanks zijn breed gebruik in de financi¨ele sector ook verschillende beperkingen. Het, per definitie, niet meenemen van de extreme waarden voorbij het q-percentiel, het feit dat de VaR niet subadditief is (Kaas et al., 2009a) en daardoor diversificatie ontmoedigd, de vaak onnauwkeurige schattingen, de observatie dat verschillende modellen resulteren in andere waarden zoals o.a. gezien in Beder (1995) en zelfs dat de VaR ook onderhevig is aan implementatierisico waardoor theoretisch identieke modellen toch verschillende schattingen kunnen genereren (Marshall en Siegel, 1997). Tenslotte wordt ook het vaak blinde vertrouwen in de VaR-waarde bekritiseert. Zo vergeleek Taleb (1997) het gebruik van de VaR met een piloot die neerstort door het blinde vertrouwen in een soms falende hoogtemeter, dit terwijl een piloot zonder hoogtemeter uit het raam zou gaan kijken. Ook Hoppe (1998) haalde hetzelfde punt aan. Ondanks deze kritieken blijft de VaR in praktijk echter de te gebruiken risicomaat en wordt de VaR over het algemeen gezien als een waardevol instrument bij het beheren van risico’s (Dowd, 2002). Het uitgebreide gebruik ervan in regelgevende kaders als Solvency II bevestigt dit ook.
10
De VaR en risicoportefeuilles Terwijl in de vorige definitie de toepassing gebeurde op alleenstaande risico’s, is het vaak interessanter om risicomaten toe te passen op risicoportefeuilles Sn van risico’s, oftewel posities bestaande uit n verschillende risico’s Xi . Hiervoor is wel kennis vereist over de cumulatieve verdelingsfunctie van Sn , dewelke vaak wordt afgeleid uit de marginale verdelingsfuncties van de afzonderlijke risico’s samen met de correlatieparameters. Zonder informatie over de correlatie is deze Sn immers niet volledig samen te stellen. Als voorbeeld kan gekeken worden naar Figuur 2.3 waarin risico’s X1 en X2 zowel met perfect positieve (scenario A) als met perfect negatieve (scenario B) correlatie samengevoegd worden, met als resultaat een totaal verschillende Sn -verdeling en VaR-waarde.
Figuur 2.3: Risico’s X1 en X2 met 2 mogelijke correlatiescenario’s en het effect op de cumulatieve distributiefunctie en de VaR
Op basis van de eerdere definitie van de VaR, is de VaR van Sn dan analoog bepaald als: VaRq (Sn ) = inf (x ∈ R|FSn (x) ≥ q),
q ∈ (0, 1)
Het ontbreken van de subadditiviteitseigenschap maakt echter dat deze VaR van het portefeuilleverlies groter kan zijn dan de som van de VaR’s van de oorspronkelijke verliezen. Dit kan eenvoudig ge¨ıllustreerd worden aan de hand van volgend voorbeeld (Hull, 2012, p189). Stel een bank met 2 gelijkaardige maar onafhankelijke verlieslatende projecten. Voor het komende jaar wordt met een kans van 0.02 een verlies van e10 miljoen verwacht en een verlies van e1 miljoen met een 11
overige kans van 0.98. De 1-jarige 97.5% VaR van deze beide projecten komt dan uit op e1 miljoen, het zwaardere verlies van e10 miljoen bevindt zich immers verder in de 2%-staart. Wanneer beide projecten echter worden samengevoegd ontstaat de volgende kansverdeling: • 0.0004 kans op e20 miljoen verlies (0.02 · 0.02) • 0.0392 kans op e11 miljoen verlies (0.02 · 0.98 + 0.98 · 0.02) • 0.9604 kans op e2 miljoen verlies (0.98 · 0.98) Wanneer van deze combinatie de 1-jarige 97.5% VaR wordt berekend bekomt men e11 miljoen, of meer dan 5 maal zoveel als de gecombineerde VaR van beide projecten afzonderlijk: e11 miljoen >e2 miljoen, wat het niet voldoen aan de subadditiviteitsvoorwaarde aantoont. Het ontbreken van deze eigenschap heeft daarnaast ook gevolgen voor de effectiviteit van de VaR-gerelateerde regelgeving. Zo merkte McNeil et al. (2005, p240) op dat als gevolg hiervan banken mogelijk geneigd zouden zijn om geconcentreerde portefeuilles aan te leggen met het oog op VaR-minimalisatie, ondanks dat dergelijke portefeuilles in normale economische omstandigheden juist risicovoller zijn. Ook zou het opleggen van een niet-subadditieve risicomaat een drijfveer kunnen zijn voor het opsplitsen van maatschappijen met als doel opnieuw een lagere VaR te bekomen. Het ontbreken van deze eigenschap kan dus gezien worden als een ernstig gemis voor de VaR. Berekening van de VaR bij ontbreken van afhankelijkheden In het geval dat de afhankelijkheden tussen de risico’s Xi echter onbekend of onzeker zijn is de in de vorige vergelijking gebruikte gezamenlijke distributiefunctie FSn moeilijk of onmogelijk te bepalen. Hoewel de marginale distributiefuncties van de risico’s X1 , . . . , Xn in praktijk nog vaak effici¨ent en accuraat te bepalen zijn ligt dit voor de gezamenlijke moeilijker, zo zijn de statistische technieken toegepast op multidimensionale data vaak computationeel zwaar of kunnen er convergentieproblemen opduiken (Bernard et al., 2014). Daarnaast kan een verkeerde afhankelijkheidsassumptie ook zware gevolgen hebben (Bernard et al., 2014; McNeil et al., 2010). In dit werk wordt verder dan ook gefocust op het geval waar enkel de marginale distributiefuncties gekend zijn. Een scenario ook gekend als risico-aggregatie met onzekere afhankelijkheid 3 . De VaR is in deze situatie niet meer exact te bepalen, wel kunnen onder- en bovengrenzen berekend worden. 3
Risk aggregation with dependence uncertainty (Bernard et al., 2014)
12
2.2.3
Tail Value at Risk (TVaR)
Een gerelateerde risicomaat is de Tail Value at Risk (TVaR), het rekenkundig gemiddelde van de VaR’s van kans q tot 1. De Tail Value at Risk (TVaR) kan gedefinieerd worden als: R1 1 VaRu (X)du TVaRq (X) = 1−q q De TVaR heeft verschillende voordelen gemeenschappelijk met de VaR. Redelijk intuitief en breed toepasbaar op verschillende soorten risico’s en portefeuilles. Bovendien wordt er in tegenstelling tot de VaR ook rekening gehouden met de extreme waarden voorbij het q-percentiel en voldoet het aan de voorwaarde voor subadditiviteit (Kaas et al., 2009a, p131) waardoor het effect van risicodiversificatie beter in kaart kan gebracht worden. Om deze redenen wordt soms, wanneer gegevens over de staart bekend zijn, aangeraden om de TVaR te gebruiken in plaats van de VaR (Dowd, 2002). Ook het Basel Committee onderzoekt sinds 2012 de mogelijkheid om in Basel III de VaR te vervangen door deze risicomaat. In hun Consultative document (BCBS, 2012, p3) wordt o.a. het niet meenemen van het staartrisico door de VaR aangehaald als belangrijk argument voor een mogelijke vervanging. In hun analyse van dit document onderstrepen Embrechts et al. (2013b) bovendien ook het mogelijk nut van het gebruik van de TVaR in risicobeheer doordat deze focust op de “wat als” vraag. “Indien toch een uitzonderlijk groot risico zich voordoet, wat is dan het verwachte verlies?” De VaR laat deze vraag immers onbeantwoord. Tegelijk zijn er echter ook verscheidene aspecten waar de TVaR het moet afleggen tegen de VaR. Embrechts et al. (2013b) halen de onzekerheid over de robuustheid van de TVaR aan. Kou en Peng (2012) bekritiseren dan weer een mogelijke verschuiving naar de TVaR met als een van de argumenten dat het betrouwbaar modelleren van de uiterste staart heel moeilijk tot bijna onmogelijk is wanneer niet voldoende datapunten aanwezig zijn. Een element dat ook in praktijk kan spelen aangezien gebeurtenissen in de uiterste staart per definitie heel erg weinig voorkomen. Of de TVaR op termijn de VaR zal kunnen vervangen is dus nog hoogst onzeker en verder onderzoek dringt zich op. Intussen blijft de Value at Risk in praktijk de te gebruiken risicomaat.
13
2.2.4
Overige risicomaten: CTE en ES
Ter volledigheid worden nog enkele andere nauw aan de VaR gerelateerde risicomaten vermeld. Dit zijn de Conditional Tail Expectation (CTE) en Expected Shortfall (ES). CTEq (X) = E[X|X > VaRq (X)] ESq (X) = E[(X − VaRq (X))+ ] Hier moet worden opgemerkt dat afhankelijk van de bron verschillende definities aan bepaalde risicomaten worden gegeven. De hiervoor gebruikte definities zijn afkomstig van Kaas et al. (2009a) en zijn gekozen omwille van hun onderscheidende kracht. Vooral de TVaR, CTE en ES worden in de literatuur vaak met elkaar gewisseld of gelijkgesteld. In deze definities zijn de CTE en TVaR echter enkel gelijk in het geval van continue distributies. Expected Shortfall wordt dan weer door het Basel Committee (BCBS, 2012) gedefinieerd als de hier gebruikte TVaR. Tenslotte zijn ook andere uitdrukkingen als Conditional Value at Risk (CVaR), Tail Conditional Expectation (TCE), Expected Tail Loss (ETL) en Average Value at Risk (AVaR) in gebruik, meestal als alternatieve benaming van de CTE of de TVaR.
2.3 2.3.1
Risico-aggregatie met onzekere afhankelijkheid, begrenzing van de Value at Risk Portefeuilles zonder variantie-beperking
Algemeen Wanneer voor een portefeuille enkel de marginale verdelingsfuncties gegeven zijn, of indien de foutmarge op de correlatiegegevens vrij groot is, is het in het kader van een effectief risicobeheer belangrijk te weten wat de uiterste onder- en bovengrenzen van de globale VaR kunnen zijn. Het bestaan en kunnen bepalen van strikte grenzen van risicomaten in het geval van aggregaties van risico’s is in het verleden al veelvuldig onderzocht, o.a. door R¨uschendorf (1982); Kaas et al. (2000); Embrechts et al. (2003); Embrechts en Puccetti (2006); Puccetti en R¨uschendorf (2012); Embrechts et al. (2013a), al dan niet toegepast op de VaR. Recentelijk toonde Bernard et al. (2013) een nieuwe strikte begrenzing aan van de VaR op basis van de TVaR van de marginale verdelingsfuncties.
14
Hoe deze uiterste grenzen bekomen kunnen worden is relatief eenvoudig aan te tonen, de bovengrens kan hier als voorbeeld genomen worden. Tegengesteld aan wat intu¨ıtief zou verwacht kan worden wordt deze bovengrens niet noodzakelijk gehaald door alle risico’s perfect te laten correleren. In Figuur 2.4 wordt dit ge¨ıllustreerd. Hoewel scenario A (blauwe grafiek) met een perfect positieve correlatie tussen risico’s X1 en X2 een hoger maximum (10 > 9) bereikt dan in scenario B (rode grafiek) met een alternatieve correlatie, is toch de VaR van scenario B hoger (8 < 9).
Figuur 2.4: De VaR van de aggregatie S2 met (uniforme) risico’s X1 en X2 in functie van de (gecumuleerde) kans met 2 mogelijke correlatiescenario’s. De hoogste VaR80% -waarde wordt bekomen met een niet perfect positieve correlatie.
De reden hierachter is dat de VaR zoals al vermeld geen rekening houdt met de staart van de verdeling voorbij het q-percentiel. Een correlatie van 1 maximaliseert dan wel het 100%-percentiel, maar niet (noodzakelijk) het q-percentiel en 15
dus ook de VaR niet. Om deze wel te maximaliseren zou FS−1 (q) de hoogst mogelijke waarde van S moeten bereiken en, aangezien cumulatieve verdelingsfuncties stijgend zijn, dus gelijk zijn aan FS−1 (1). In Figuur 2.4 is dit zichtbaar in de rode grafiek waar een maximale VaR80% behaald wordt en waar vanaf 80% de grafiek vlak is. Dit vlakke deel kan bekomen worden door in dit voorbeeld de 2 laatste datapunten van elk risico met elkaar omgekeerd gecorreleerd te maken. In plaats van zoals bij scenario A een staart te krijgen bestaande uit 8 en 10 ontstaat zo een afgevlakte staart bestaande uit 9 en 9. Het is ook dit mechanisme van afvlakking van de staart dat de basis vormt van de algoritmes die besproken worden in hoofdstuk 3. Voor de ondergrens kan een compleet analoge redenering gevolgd worden. Formeel aangetoond Om analytisch de VaR-grenzen van een portefeuille met risico’s Xi ∼ Fi te bekomen, beschouw een uniforme toevalsvariabele U ∼ U (0, 1) en definieer Xic = Fi−1 (U ) met 1 ≤ i ≤ n. Op die manier geldt Xic ∼ Fi en aangezien alle Xic ’s gedefinieerd zijn met behulp van dezelfde U geldt dat de vector X c = (X1c , . . . , Xnc ) een comonotone vector is, elk risico Xic is perfect positief met de andere. De comonotone som Snc is tenslotte bepaald als Pn gecorreleerd c i=1 Xi , de som van deze comonotone risico’s. Om tot de uiteindelijke grenzen te komen, moet daarnaast nog, in navolging van de TVaR de Left Tail Value at Risk (LTVaR) gedefinieerd worden als: R1 1 VaRu (X)du TVaRq (X) = 1−q q LTVaRq (X) =
1 q
Rq 0
VaRu (X)du
Door gebruik te maken van de subadditiveitseigenschap die voor deze beide risicomaten geldt, defini¨eren Bernard et al. (2013) dan de ondergrens A en de bovengrens B van de VaR van de portefeuillesom Sn = X1 + · · · + Xn als:
A :=
n X
LTVaRq (Xi ) = LTVaRq (Snc )
(2.1)
i=1
B :=
n X
TVaRq (Xi ) = TVaRq (Snc )
i=1
16
(2.2)
Door deze constructie zijn zowel de onder- en bovengrens (Figuur 2.5) enkel afhankelijk van respectievelijk de LTVaR en TVaR van de afzonderlijke risico’s, die op hun beurt eenvoudig kunnen afgeleid worden uit de marginale verdelingsfuncties. Bovendien staat er geen beperking op deze marginale verdelingsfuncties, waardoor de grenzen ook toepasbaar zijn op heterogene portefeuilles en spelen ook correlaties en variantie-beperkingen geen rol. De A en B grenzen kunnen dus beschouwd worden als breed inzetbare uiterste VaR-grenzen. Het is belangrijk hier op te merken dat zoals al vermeld de maximale VaR in het algemeen niet bereikt wordt door de comonotone som te nemen, i.e. wanneer alle risico’s perfect afhankelijk zijn. Dit werd ook al opgemerkt in Puccetti en R¨uschendorf (2012, p2) en Embrechts et al. (2013a, p2752). Dat de uiterste VaR-grenzen A en B dan wel gedefinieerd zijn als de LTVaR en TVaR van de comonotone som moet hier los van gezien worden. Aangezien zowel LTVaR en TVaR wel subadditief zijn, komt hierdoor, in tegenstelling tot de VaR, het uiterste geval wel voor in de toestand van comonotonie.
Figuur 2.5: Visualisatie van de grenzen A en B
De bereikbaarheid van de grenzen Bovendien kan men voor de grenzen A en B vastleggen onder welke voorwaarden deze grenzen sharp (of bereikbaar) zijn. In hun bewijs defini¨eren Ber17
nard et al. (2013, Theorem 2.2) hiervoor het concept rearrangement, letterlijk herschikking. Stel de risico’s Xi gelijk aan fi (U ) met U een uniforme U (0, 1) distributie op die manier dat {S, ≤ VaRq [Sn ]} = {U ∈ [q, 1]}, oftewel het hoogste q-percentiel van Sn komt overeen met het hoogste q-percentiel van U . Als dan zowel fi (U ) als Fi−1 (U ) een identieke distributie hebben, kan gesproken worden van een rearrangement fi van Fi−1 . Een discreet voorbeeld hiervan is te vinden in Figuur 2.6 waar wordt uitgegaan van uniform verdeelde risico’s. In die figuur is een rearrangement van het risico X2 te zien, waarbij duidelijk de discrete uniforme verdeling behouden blijft. Wel zorgt de rearrangement f2 ervoor dat het risico X2 herschikt wordt tegenover de overige risico’s, hier enkel X1 . Omdat een rearrangement kan gezien worden als een verschuiving in de correlatiestructuur wijzigt bovendien ook de verdeling van S.
Figuur 2.6: Illustratie van een rearrangement van het uniforme risico X2 en het effect op de som S
Naast een volledig rearrangement over het hele kansbereik [0, 1], kan ook een rearrangement doorgevoerd worden op een subset ervan. Zo is in Figuur 2.7 een rearrangement uitgevoerd op [0.8, 1], oftewel enkel de laatste 20% van de verdeling van S is aangetast. Een dergelijke rearrangement kan genoteerd worden als f2 |[0.8,1]
18
Figuur 2.7: Illustratie van een rearrangement van het uniforme risico X2 op [0.8, 1] en het effect op de som S
Theorema (Bereikbaarheid van de uiterste VaR-grenzen). De ondergrens A uit 2.1 is bereikt als en slechts als aan de 2 volgende voorwaarden voldaan is: 1. fi en Fi−1 zijn rearrangements op [0, q] Pn 2. i=1 fi (u) = c, ∀u ∈ [0, q] voor een bepaalde c ∈ R. De bovengrens B uit 2.2 is bereikt als en slechts als aan de 2 volgende voorwaarden voldaan is: 1. fi en Fi−1 zijn rearrangements op [q, 1] Pn 2. i=1 fi (u) = c, ∀u ∈ [q, 1] voor een bepaalde c ∈ R. Aan de hand van dit theorema kan bepaald worden wanneer de grenzen A en B uit de vergelijkingen 2.1 en 2.2 effectief bereikt worden. Het bewijs ervan kan gevonden worden in Bernard et al. (2013, p6). Voorwaarde 1 duidt hier op het toepassen van rearrangements op de risico’s. Om de bovengrens respectievelijk de ondergrens te bereiken worden rearrangement toegepast op het [q, 1] en [0, q] segment van de verdeling van S, en dit zonder de marginale verdelingsfuncties van de afzonderlijke risico’s aan te passen. In voorwaarde 2 staat de constante c dan weer voor ofwel A of B afhankelijk van de grens, de portefeuillesom moet op die intervallen dus constant gehouden worden om die grenzen te bereiken. Een discreet voorbeeld van deze situatie was al gegeven in Figuur 2.7 waar de bovengrens van de VaR80% gevonden was. Door daar een rearrangement toe te passen op het [80%, 1] deel van risico X2 ontstond daar een constante staart. Deze bovengrens van 9 voldoet dus aan beide voorwaarden in dit theorema. Een grafische voorstelling van een bekomen portefeuillesom 19
die voldoet aan de bovenstaande voorwaarden is te zien in Figuur 2.8. Door rearrangements toe te passen kan de verdeling van S aangepast worden van de zwarte grafiek naar de rode grafiek.
Figuur 2.8: Voorstelling van de portefeuillesom S in functie van kans q. Het bereiken van de grenzen A en B kan bekomen worden door rearrangements toe te passen op de [0, q] respectievelijk [q, 1] delen. Op die manier ontstaat een vlakke verdeling van S.
2.3.2
Portefeuilles met beperking op de variantie
Algemeen Wanneer naast de marginale verdelingsfuncties van de afzonderlijke risico’s meer informatie beschikbaar is over de portefeuille is het mogelijk om deze informatie te gebruiken om de grenzen uit 2.3.1 te verbeteren. Recent onderzochten zo Kaas et al. (2009b) de mogelijkheid om de grenzen te verfijnen gegeven bepaalde correlatieco¨effici¨enten waaronder Kendalls tau of Spearmans rho. Ook Embrechts en Puccetti (2010) gebruikten gegevens over afhankelijkheden om nauwere VaRgrenzen te bepalen. De benodigde informatie over de afhankelijkheden die in deze papers gebruikt wordt is in praktijk echter vaak onbekend. Bovendien zijn de verbeterde grenzen 20
vaak moeilijk te berekenen, vooral bij heterogene risicoportefeuilles, of kunnen de berekende grenzen nog verbeterd worden. Een andere aanpak is onderzocht in Bernard et al. (2013). In plaats van informatie over afhankelijkheden wordt hierin verondersteld dat de maximale variantie van de portefeuille gekend is. Door op die variantie een begrenzing te plaatsen ontstaat de mogelijkheid om, vergeleken met de onbegrensde situatie, de VaR-grenzen te verbeteren. Op basis van de praktische toepassingen, de theoretische eigenschappen van deze grenzen en de mogelijkheid om een algoritme te construeren (zie hoofdstuk 3) wordt op deze mogelijkheid verder gegaan. Voorbeeld Als voorbeeld (Bernard et al., 2013) kunnen 2 risico’s Y 1 en Y 2 beschouwd worden, beiden uniform verdeeld over het eenheidsinterval. Volgens vergelijkingen 2.1 en 2.2 zijn de uiterste grenzen van de VaR75% A en B respectievelijk 0.75 en 1.75. Deze grenzen kunnen eenvoudig behaald worden door deze risico’s te defini¨eren als Y 2 = 0.75 − Y 1 als Y 1 < 0.75 en Y 2 = 1.75 − Y 1 als Y 1 ≥ 0.75. In dat geval is de risicosom gelijk aan A in het eerste 75%-kwantiel en gelijk aan B in het laatste 25%-kwantiel zoals te zien in Figuur 2.9. Nemen we de variantiegrens s2 gelijk aan 2, dan kan gezien worden dat aan deze grens voldaan wordt 3 . Het opleggen van een aangezien var(Y 1+Y 2) = q(A−1)2 +(1−q)(B−1)2 = 16 variantiebeperking heeft in dit geval dus geen vernauwing van de VaR-grenzen tot gevolg. Indien in het extreme geval echter de variantiegrens gekozen wordt als s2 = 0 ontstaat een andere situatie zoals te zien in Figuur 2.10 en is de eerdere afhankelijkheid tussen de risico’s niet langer mogelijk. Hierdoor zijn de eerdere grenzen A en B niet meer bereikbaar en kunnen ze verscherpt worden door nieuwe grenzen a en b (Figuur 2.10). In het algemeen ontstaat een dergelijke situatie indien de variantiebegrenzing gekozen wordt kleiner dan var(Y 1 + Y 2) = q(A − 1)2 + (1 − q)(B − 1)2 , de variantie in de eerste ’optimale’ situatie.
21
Figuur 2.9: Voorstelling van 2 uniform verdeelde risico’s Y1 en Y2 met een zodanige afhankelijkheid dat hun portefeuillesom het eerste 75%-kwantiel gelijjk is aan 0.75 (=A) en het laatste 25%-kwantiel aan 1.75 (=B). De variantiegrens is hier gelijk aan +∞.
Figuur 2.10: Voorstelling van 2 uniform verdeelde risico’s Y1 en Y2 met een zodanige afhankelijkheid dat hun portefeuillesom constant is over het hele eenheidsinterval. De variantiegrens is hier gelijk aan 0.
.
22
Formele grenzen Bernard et al. (2013, Theorem 3.3) tonen vervolgens aan dat, deze gedachte volgend, de grenzen a en b kunnen bepaald worden als ( A, als s2 ≥ q(A − µ)2 + (1 − q)(B − µ)2 p a := µ − s · (1 − q)/q, anders
(2.3)
( B, als s2 ≥ q(A − µ)2 + (1 − q)(B − µ)2 p b := µ − s · q/(1 − q), anders
(2.4)
De variantiegrens q(A − µ)2 + (1 − q)(B − µ)2 is in deze het kantelpunt voor de mogelijke verbetering van de VaR-grenzen en kan ook herkend worden in voorgaand voorbeeld. Concreet houdt dit in dat indien de variantiebegrenzing voldoende groot gekozen wordt de nieuwe grenzen a en b gedefinieerd worden als de al bekende A en B grenzen, de nieuwe informatie betreffende de maximale variantie heeft dan geen verder effect. In het andere geval echter, bij een voldoende lage grens s2 kunnen nieuwe grenzen gevonden worden zodanig dat A ≤ a en b ≤ B. De vorige algemene grenzen kunnen immers nooit behaald worden zonder de variantievoorwaarde te schenden. De bereikbaarheid van de grenzen Identiek aan de eerdere VaR-grenzen in het ongelimiteerde geval (2.1 en 2.2) zijn de nieuw gevonden grenzen (2.3 en 2.4) niet altijd bereikbaar. Ook voor deze laatste zijn echter de voorwaarden te defini¨eren waaronder dit wel zo is. Het bewijs hiervan is te vinden in Bernard et al. (2013, Theorem 3.5). Theorema (Bereikbaarheid uiterste VaRq -grenzen met variantie-beperking). De ondergrens a uit 2.3 is bereikt als en slechts als de bovengrens b uit 2.4 bereikt wordt en dit gebeurt wanneer aan volgende voorwaarden voldaan is: P 1. Sn = ni=1 Xi voldoet aan de variantievoorwaarde, dus Var[Sn ] < s2 2. Sn = a voor het onderste q-gedeelte van de verdeling. 3. Sn = b voor het bovenste (1 − q)-gedeelte van de verdeling S
23
De eerste van deze voorwaarden verwijst naar het aanbrengen van de variantiebegrenzing, waaraan de verdeling van de portefeuillesom S logischerwijs moet aan voldoen. De twee overige voorwaarden zijn analoog aan de voorwaarden in het onbegrensde geval en duiden op het constant maken van van de verdeling van S op het [0, q] en het [q, 1] interval, op respectievelijk a en b. Om deze grenzen dus te bekomen, kan analoog aan het geval zonder variantiebeperking, opnieuw het systeem van rearrangements toegepast worden door de afhankelijkheden zodanig aan te passen dat de distributie van Sn zowel v´oo´ r q als erna zo vlak mogelijk wordt (Bernard et al., 2013, Theorem 3.6). Het in sectie 2.3.1 al kort vernoemde Rearrangement Algoritme (RA) kan hiervoor uitgebreid worden. Men krijgt dan het Extended Rearrangement Algoritme (ERA).
24
Hoofdstuk 3 Het algoritme “An algorithm must be seen to be believed.” — Donald Knuth
In dit hoofdstuk worden 2 algoritmen besproken die voortbouwen op de theorie aangehaald in hoofdstuk 2. Als eerste het Rearrangement Algoritme (RA) van Puccetti en R¨uschendorf (2012) (zie ook Embrechts et al. (2013a) voor de VaR-toepassing), of kortweg RA. Vervolgens het Extended Rearrangement Algoritme (ERA), een uitbreiding op het RA met als doel om te gaan met variantiebeperkingen op portefeuillesommen zoals in subsectie 2.3.2. Het ERA werd ge¨ıntroduceerd door Bernard et al. (2013).
3.1
RA
Het Rearrangement Algoritme (RA) is een algoritme dat wordt gekenmerkt door een iteratief gebruik van rearrangements, met als doel het behalen van een zo vlak mogelijke verdelingsfunctie van Sn . Zoals als aangehaald in hoofdstuk 2 (Figuur 2.6) kan een rearrangement gezien worden als een manier om de afhankelijkheid tussen 1 risico en de overige aan te passen, zonder de verdeling van dat ene risico echter te veranderen. Figuur 3.1 illustreert dit met een voorbeeld.
25
Figuur 3.1: Voorbeeld van een rearrangement op risico X1 en het effect op de verdeling van S
De werking Stel een aantal risico variabelen Xj (i = 1, . . . , n) met elk een verdelingsi functie Fj en voor elk risico Xj d datapunten zodat xij = Fj−1 ( d+1 ). Op deze manier kan een matrix Xd,n = (xij ) (3.1) bekomen worden waarbij elke kolom overeenkomt met een (gediscretiseerd) risico. Elk element xij wordt aangenomen mogelijk te zijn met een gelijke kans d1 . Door constructie is deze vector van risico’s (X1 , . . . , Xn ) dus comonotoon. Om de verdeling van het portefeuillerisico S vervolgens te bepalen kan per rij van Xd,n de som genomen worden, dit vormt de kolomvector Sd .
Xd,n
x1,1 x1,2 · · · x2,1 x2,2 · · · = .. .. ... . . xd,1 xd,2 · · ·
x1,n S1 S2 x2,n .. , Sd = .. . . xd,n Sd
(3.1)
Door vanuit deze startsituatie iteratief elk risico i te overlopen en telkens de kolomvector Xd,i te vervangen door zijn rearrangement X∗d,i zodanig dat X∗d,i anti-monotoon is met de som van de andere risico’s, en dit tot er convergentie optreedt, wordt uiteindelijk een kolomvector S∗d bekomen die zo constant mogelijk is, overeenstemmend met een distributie van Sn∗ = X1∗ + · · · + Xn∗ die niet vlakker meer kan. In die situatie geldt dan ook dat elk risico zodanig gerearranged is dat hij anti-monotoon is met de som van de andere risico’s (Puccetti en R¨uschendorf, 2012, Theorem 2.1). Er is in dat geval dan geen nieuwe, betere, rearrangement mogelijk. Als illustratie van dit mechanisme het volgende eenvoudig voorbeeld van een matrix met 4 risico’s Xi met elk 4 datapunten. Om het effect op de som Sn duidelijk te maken is deze als laatste kolom toegevoegd. In het rood aangeduid is 26
in elke iteratie het effect van een rearrangement duidelijk. Zoals kan opgemerkt worden wordt telkens een risico Xi zodanig herschikt zodat deze anti-monotoon is met de som van de anderen, zo wordt het kleinste element xij van Xd,n telkens geplaatst op de rij met de grootste som. Het resultaat van dit voorbeeld is een perfect stabiele verdeling van de som. 1 2 3 4
2 3 4 10 4 3 4 6 8 20 − > 2 6 9 12 30 8 12 16 40 1
4 3 −> 2 1
2 3 4 13 4 3 4 6 8 21 − > 2 6 9 12 29 8 12 16 37 1
8 12 4 28 4 6 9 8 26 3 −> 2 4 6 12 24 2 3 16 22 1
8 3 4 19 6 6 8 23 4 9 12 27 2 12 16 31
8 12 4 28 1 6 9 8 26 2 −> 3 4 6 12 24 2 3 16 22 4
8 12 4 25 6 9 8 25 4 6 12 25 2 3 16 25
RA en de VaR Zoals vermeld in subsectie 2.3.1 kunnen de absolute onder- en bovengrens A en B van de VaRq behaald worden door respectievelijk op het onderste q-percentiel en op het bovenste (1 − q)-percentiel rearrangements toe te passen zodanig dat beide stukken constant zijn. Om dit te bekomen passen Embrechts et al. (2013a) het RA-algoritme afzonderlijk toe op de eerste q · d rijen en de laatste (1 − q) · d rijen van X en S. Op deze manier kunnen A en B bepaald worden zoals in Figuur 3.2 ge¨ıllustreerd is. Het algoritme: schematisch Ter volledigheid wordt de schematische opbouw van het algoritme vermeld. Het proces wordt gedreven door een iteratielus totdat er geen enkel risico meer kan aangepast worden.
27
Figuur 3.2: Voorbeeld verdelingsfunctie met in het rood de door de RA aangepaste versie. RA zowel toegepast op de hele dataset (l.) en afzonderlijk toegepast op het [0, 0.95] en het [0.95, 1] percentiel (r.) Algoritme 1 Rearrangement Algoritme (RA) X ← Data matrix met dimensie (d, n) S ← Vector met elk element als som van een rij van X risico ← Risicoteller laatste ← Laatst veranderd risico Som(X) ← Bereken de som voor matrix X Som(X−k ) ← Bereken de som voor matrix X zonder (risico-)kolom k Herorden(X, k) ← Herorden kolom k van X omgekeerd t.o.v. Som(X−k ) Sorteer(X) ← Sorteer X op basis van de som van de rijen ———————————– risico ← 1 laatste ← n while (risico 6= laatste) do S ← Som(X−risico ) X ∗ ← Herorden(X, risico) if (X ∗ 6= X) then X ← X∗ laatste ← risico end if risico ← mod(risico + 1; n) + 1 end while Sorteer(X)
28
3.2 3.2.1
ERA Begrenzing van de variantie
Als uitbreiding op het Rearrangement Algoritme ontwikkelden Bernard et al. (2013) het Extended Rearrangement Algoritme (ERA). Gebaseerd op het voorgaand is dit algoritme in staat VaR grenzen te berekenen voor portefeuilles van risico’s waarvan de marginale verdelingsfuncties gegeven zijn en waar er bovendien een limiet gekend is (of kan geschat worden) van de variantie van de portefeuillesom. Het ERA steunt op de theoretische fundamenten ge¨ıntroduceerd in sectie 2.3.2. De werking Analoog aan het RA volgt het ERA dezelfde basisstructuur en wordt het toegepast op dezelfde risicomatrix X (3.2). Elke kolom stemt overeen met een risico i met verdelingsfunctie Fj en d datapunten zodat elk element van X bepaald kan i ). De vector van risico’s (X1 , . . . , Xn ) is dus initieel worden als xij = Fj−1 ( d+1 comonotoon.
Xd,n
x1,1 x1,2 · · · x2,1 x2,2 · · · = .. .. ... . . xd,1 xd,2 · · ·
x1,n S1 x2,n S2 , S = .. . d .. . xd,n Sd
(3.2)
Het algoritme kan opgesplitst worden in 2 grote fasen, een eerste initialisatiefase gevolgd door de eigenlijke werkfase met de rearrangements. Alvorens het gebruik van rearrangements toe te passen wordt een eerste maal een test op de variantie uitgevoerd. Door de variantie te toetsen aan de voorwaarde 3.3 kan meteen bekomen worden of de grenzen a en b al dan niet gelijk zijn aan B en A, een rechtstreeks gevolg van de bepalingen uit 2.3 en 2.4. q(Ad − µd )2 + (1 − q)(Bd − µd )2 ≤ s2
(3.3)
In die gevallen dat de variantie inderdaad voldoende groot om geen belemmering te vormen om de uiterste buitengrenzen te bereiken kan rechtstreeks overgegaan worden naar het (eenmalig) toepassen van het RA op de manier die Embrechts et al. (2013a) al hadden beschreven.
29
In het andere geval wordt in het ERA geopteerd om een aantal van de rijen van de matrix X op te schuiven. Met hoeveel rijen wordt geschoven wordt bepaald door het vergelijken van de gemiddelde som van deelmatrices van X met de variantiegelimiteerde bovengrens. Alhoewel deze stap strikt gezien niet nodig is, zorgt hij voor een veel effici¨entere toepassing. Door meteen met een aantal rijen te schuiven wordt vermeden dat in de RA-fase nutteloze iteraties plaats vinden. De grootheden die voor deze fase nodig zijn zijn gedefinieerd in 3.4. Het betreft de absolute boven- en ondergrens Bd en Ad , de bovengrens met variantiebeperking bd en de gemiddelde µd en variantie σd van de som, allen toegepast op de gediscretiseerde risico’s in X en gebruikmakend van het gegeven dat elk element 1 in deze matrix een gelijke kans heeft. d
Bd =
n X j=1
Ad =
d 1 X xij d − k i=k+1 n P d P
! −
xij
j=1 i=1
bd = µd + σd · n P d 1P xij , σd = µd = d j=1 i=1
r
s
! , k=
q d
(3.4)
d−k · Bd k q 1−q
d P n 1P ( xij )2 − µ2d d i=1 j=1
Wanneer de initialisatiefase be¨eindigd wordt, wordt gestart met de RA-fase. Het Rearrangement Algoritme wordt toegepast op zowel de eerste k rijen als de laatste (d−k) rijen om zo nieuwe kandidaten voor a en b te construeren. Door vervolgens de verdeling van de portefeuillesom terug te construeren en de variantie ervan te testen wordt bepaald of de laatste resultaten geldige oplossingen zijn en voldoen aan de variantievoorwaarde. Wanneer de nieuwe variantie lager is dan de grenswaarde s2 is een geldige oplossing gevonden. De onder- en bovengrens worden dan bepaald als respectievelijk het k’de en het (k + 1)’de element van de kolom S. Hier moet rekening gehouden worden met het feit dat volgens Algoritme 1 het resultaat op het einde gesorteerd wordt. Wanneer dit niet gebeurd kunnen de grenzen a en b bepaald
30
worden als de grootste som in de eerste k rijen, respectievelijk de kleinste som in de laatste (d − k) rijen (3.5). a = maxi≤k (xi1 + · · · + xin )
(3.5)
b = mini>k (xi1 + · · · + xin ) Wanneer de variantie echter niet voldoet en daarentegen nog gestegen is vergeleken met de vorige iteratie kan besloten worden dat geen oplossing te vinden is, het algoritme gaat dan niet kunnen convergeren naar a en b. Bernard et al. (2013) merken wel op dat deze situatie niet noodzakelijk met de werkelijkheid overeen stemt. Door o.a. de discretisatie kan het zijn dat mogelijke grenzen a en b nooit bereikt worden. Andersom geldt dit echter ook, zelfs indien het algoritme zich in de eerste situatie bevind is het niet volledig zeker dat het weergegeven antwoord de enige echte grens is. Om de kwaliteit van de bereikte grens te beoordelen kan gekeken worden naar de theoretische grenzen a en b (vergelijkingen 2.3 en 2.4). Aangezien ook hier voldaan moet worden aan de variantiegrens liggen eventuele resultaten noodzakelijkerwijs binnen dit domein. Hoe dichter de gevonden grenzen de theoretische benaderen, hoe beter dat deze eersten zijn. Bij een goede keuze van s2 kan verwacht worden dat het antwoord dicht de echte grens benadert. Indien aan de voorwaarden om het algoritme te stoppen tenslotte niet voldaan is, wordt een nieuwe iteratie voorbereid. De laatste rij van de datamatrix X wordt opgeschoven naar de eerste rij en het RA-algoritme wordt nogmaals gestart. Dit proces van iteraties wordt volgehouden tot 1 van de 2 eindsituaties wordt bereikt. Omdat het ERA over het algemeen beter werkt bij het benaderen van bovengrenzen dan bij ondergrenzen, vooral bij heavy tailed distributies, opperen Bernard et al. (2013) dat het in sommige gevallen interessant kan zijn om het ERA tweemaal op te roepen, eenmaal toegepast op X met een betrouwbaarheid van q en een tweede maal op −X met een betrouwbaarheid van (1 − q). Uit beide toepassingen kan dan de beste oplossing gekozen worden.Voor deze toepassing wordt gebruik gemaakt van een eigenschap van de VaR die voor elke toevalsvariabele X geldt: − VaR+ 1−q (−X) = VaRq (X)
31
(3.6)
Het algoritme: schematisch Algoritme 2 Extended Rearrangement Algoritme (ERA) i X ← Data matrix met dimensie (d, n) en elke xij = Fj−1 ( d+1 ) S ← Vector met elk element Si als som van een rij i van X s2 ← De maximaal gedefinieerde variantie van S Som(X) ← Bereken de som van de rijen voor matrix X ———————————– Stap 1: Initialisatiefase Bereken Ad , Bd , bd en µd zoals bepaald in 3.4 Als q(Ad − µd )2 + (1 − q)(Bd − µd )2 ≤ s2 , ga naar stap 2 Anders (1b): d−m P
n P
xij
i=k+1−m j=1
- Bereken voor alle m = 1 . . . k: bd (m) = - Zoek m∗ = min(m|bd (m) ≤ bd ) - En verschuif (m ∗ −1) rijen in de matrix: x(d−m∗+2)1 x(d−m∗+2)2 · · · x(d−m∗+3)1 x(d−m∗+3)2 · · · X← .. .. .. . . . x(d−m∗+1))1 x(d−m∗+1)2 · · ·
d−k
x(d−m∗+2)n x(d−m∗+3)n .. . x(d−m∗+1)n
Stap 2: Begin van de RA-fase r ← 0 en v−1 ← ∞ Stap 3: Pas RA toe op zowel de onderste k rijen als de bovenste d − k rijen: (X)1:k ← RA(X)1:k (X)k+1:d ← RA(X)k+1:d S ← Som(X) Stap 4: Bereken de variantie vr = σd2 zoals bepaald in 3.4. Twee eindsituaties waarna het algoritme stopt: • Als vr < s2 : Oplossing gevonden. De ondergrens is gegeven door Sk en de bovengrens door Sk+1 • Als vr > vr−1 : Geen oplossing mogelijk, het algoritme stopt Anders: verhoog r, verschuif 1 rij in X en ga terug naar stap 3 r ←r+1 xd1 xd2 ··· xdn x11 x12 ··· x1n X ← .. .. ... 32... . . x(d−1)1 x(d−1)2 · · · x(d−1)n
3.2.2
Uitbreiding van het ERA: begrenzing van de scheefheid
De open structuur van het ERA opent ook mogelijkheden voor verdere verfijningen van de VaR-grenzen. Wanneer naast gegevens over de variantie ook andere informatie beschikbaar is die invloed kan hebben op de grenzen kunnen deze extra voorwaarden mogelijk opgenomen worden in het ERA. E´en van de kandidaten met een mogelijke impact op de VaR-grenzen is de scheefheid, of skewness, die een maat voor de asymmetrie van een verdeling is. Het fenomeen van scheefheid komt vaak voor in financi¨ele en verzekeringstechnische gegevens (zie bvb Lane (2000)), de verdeling van vele verzekerde risico’s wordt immers typisch gekenmerkt door een overgroot deel relatief kleine schades in combinatie met een lange staart van extreme schades. De meest natuurlijke wijze om informatie over de scheefheid te gebruiken om het VaR-interval te verfijnen is door een voorbeeld te nemen aan de manier waarop een variantiebeperking gebruikt wordt in het ERA. Namelijk door een maximale scheefheid γ op de verdeling van de portefeuillesom in te stellen als extra voorwaarde, naast het gebruik van de maximale variantie s2 . De scheefheid, vaak voorgesteld als γ1 , kan gedefinieerd worden als de breuk van het 3de centrale moment µ3 met de derde macht van de standaardafwijking σ en wanneer toegepast op de portefeuillesom kan hij berekend worden zoals in 3.7. γ1 =
E(X − µ)3 µ3 = 3 σ3 (E(X − µ)2 ) 2
Pd 1 d
i=1
γ1 = 1
d
Pd
i=1
n P
!3 xij − µd
j=1 n P
!2 23 xij − µd
(3.7)
j=1
Gebaseerd op deze redenering kan een aanpassing van Stap 4 (Algoritme 3) van het ERA-algoritme (Algoritme 2) voorgesteld worden die deze extra voorwaarde toevoegt. Een geldige oplossing wordt dan gevonden indien zowel aan de variantie- als aan de scheefheidsvoorwaarde is voldaan. Indien echter blijkt dat of de variantie of de scheefheid terug aan het stijgen zijn, is geen geldige oplossing te vinden. De veranderingen beperkingen zich dus tot het aanpassen van de eindcondities. 33
De aanleiding van deze voorgestelde uitbreiding, en de eenvoudige integratie van de scheefheidsbeperking in het ERA, is de empirische observatie dat het mechanisme dat werkt om de variantie te verlagen een gelijkaardig effect heeft op de scheefheid. Na de eerste toepassing van het algoritme zijn de behaalde grenzen a1 en b1 (Figuur 3.3) immers de uiterst haalbare grenzen. Alle latere iteraties gaan zowel a1 verhogen als b1 verlagen wat naast een verlaging van de variantie ook een verlaging van de scheefheid betekent. Wanneer bij een toepassing dus zowel een variantie- als een scheefheidsbeperking gebruikt worden zal het de zwaarste beperking zijn die bepalend zal zijn voor het aantal benodigde iteraties en de uiteindelijk behaalde grenzen.
Figuur 3.3: Voorstelling van de portefeuillesom S in functie van de kans q
Algoritme 3 ERA uitbreiding: Begrenzing van de scheefheid Stap 4: Bereken de variantie vr = σd2 en gr = γ1 zoals bepaald in 3.4 and 3.7 . Twee eindsituaties waarna het algoritme stopt: • Als vr < s2 en gr < γ: Oplossing gevonden. De ondergrens is gegeven door Sk en de bovengrens door Sk+1 • Als vr > vr−1 of gr > gr−1 : Geen oplossing mogelijk, het algoritme stopt Anders: verhoog r, verschuif 1 rij in X en ga naar stap 3 (zie Algoritme 2)
34
Hoofdstuk 4 Resultaten en performantie “However beautiful the strategy, you should occasionally look at the results.” — Winston Churchill
4.1 4.1.1
Resultaten Algemeen
Met het oog op het testen van het ERA is een testsysteem ontworpen en geprogrammeerd volgens de in hoofdstuk 3 beschreven specificaties. Voor de discretisatie van de marginale verdelingsfuncties is gebruik gemaakt van de statistische software R, de algoritmen zijn omwille van de performantie geschreven in Java. De reproduceerbaarheid van de vermelde resultaten wordt gegarandeerd door de deterministische aard van het ERA. Mits gebruik van een stabiel sorteeralgoritme (zie ook 4.2.4) is geen enkel kanselement aanwezig.
4.1.2
Normaal verdeelde risico’s
Als eerste voorbeeld kunnen standaard normaal verdeelde risico’s Xi beschouwd worden, met een onzekere afhankelijkheid ten opzichte van elkaar. De absolute grenzen van de VaR Ad en Bd en de variantie-beperkte grenzen ad en bd kunnen dan bepaald worden zoals in Vergelijking 3.4 en zijn te vinden in Tabel 4.1 respectievelijk Deel B en A. Deel A bevat ook de door het ERA gevonden grenzen md en Md . De resultaten zijn onderverdeeld op basis van q-niveau, aantal datapunten per risico d, aantal risico’s n en de variantiebeperking. 35
Deel A: Variantie-begrensde grenzen md , Md , ad en bd (md ; Md ) (ad ; bd ) VaR95.0% d = 100 VaR95.0% d = 1000 VaR95.0% d = 10000 VaR95.0% d = 100000 VaR99.0% d = 100 VaR99.0% d = 1000 VaR99.0% d = 10000 VaR99.0% d = 100000 VaR99.5% d = 1000 VaR99.5% d = 10000 VaR99.5% d = 100000
ρ=0 (-0.51; 10.66) (-0.7; 13.24) (-0.64; 13.41) (-0.72; 13.7) (-0.72; 9.84) (-0.72; 13.77) (-0.72; 9.89) (-0.73; 13.78) (-0.2; 23.3) (-0.24; 23.3) (-0.26; 25.98) (-0.26; 26.02) (-0.27; 26.56) (-0.27; 26.56) (-0.27; 26.64) (-0.27; 26.64) (-0.13; 27.86) (-0.14; 27.89) (-0.14; 28.75) (-0.14; 28.76) (-0.14; 28.9) (-0.15; 28.9)
n = 10 ρ = 0.2 (-0.98; 19.32) (-1.02; 19.36) (-1.07; 20.42) (-1.08; 20.44) (-1.08; 20.6) (-1.08; 20.6) (-1.09; 20.62) (-1.09; 20.62) (-0.2; 23.3) (-0.24; 23.3) (-0.26; 25.98) (-0.26; 26.02) (-0.27; 26.56) (-0.27; 26.56) (-0.27; 26.64) (-0.27; 26.64) (-0.13; 27.86) (-0.14; 27.89) (-0.14; 28.75) (-0.14; 28.76) (-0.14; 28.9) (-0.15; 28.9)
ρ = 0.4 (-0.98; 19.32) (-1.02; 19.36) (-1.07; 20.42) (-1.08; 20.44) (-1.08; 20.6) (-1.08; 20.6) (-1.09; 20.62) (-1.09; 20.62) (-0.2; 23.3) (-0.24; 23.3) (-0.26; 25.98) (-0.26; 26.02) (-0.27; 26.56) (-0.27; 26.56) (-0.27; 26.64) (-0.27; 26.64) (-0.13; 27.86) (-0.14; 27.89) (-0.14; 28.75) (-0.14; 28.76) (-0.14; 28.9) (-0.15; 28.9)
n = 100 ρ=0 ρ = 0.4 (-1.7; 33.31) (-10.16; 193.54) (-2.2; 41.87) (-10.19; 193.56) (-2.23; 42.38) (-10.75; 204.35) (-2.28; 43.33) (-10.76; 204.36) (-2.28; 43.48) (-10.84; 206.02) (-2.29; 43.55) (-10.84; 206.02) (-2.29; 41.2) (-10.85; 206.24) (-2.29; 43.58) (-10.85; 206.24) (0.04; 0.07) (-2.33; 233.01) (-0.97; 95.58) (-2.35; 233.01) (-0.88; 88.19) (-2.62; 260.12) (-1.0; 98.9) (-2.63; 260.18) (-0.99; 96.52) (-2.68; 265.61) (-1.0; 99.42) (-2.68; 265.61) (-1.0; 96.25) (-2.69; 266.4) (-1.0; 99.49) (-2.69; 266.41) (-0.55; 112.26) (-1.4; 278.85) (-0.7; 140.22) (-1.4; 278.91) (-0.67; 136.24) (-1.44; 287.61) (-0.71; 140.95) (-1.45; 287.62) (-0.71; 135.92) (-1.45; 288.99) (-0.71; 141.05) (-1.45; 288.99)
Deel B: Onbegrensde grenzen Ad en Bd (Ad ; Bd ) d = 100 d = 1000 d = 10000 VaR95% d = 100000 d=∞ d = 100 d = 1000 d = 10000 VaR99% d = 100000 d=∞ d = 1000 d = 10000 VaR99.5% d = 100000 d=∞
n = 10 (-1.01; 19.36) (-1.08; 20.44) (-1.08; 20.60) (-1.09; 20.62) (-1.09; 20.63) (0.23; 23.30) (-0.26; 26.02) (-0.27; 26.56) (-0.27; 26.64) (-0.27; 26.65) (-0.14; 27.89) (-0.14; 28.76) (-0.15; 28.90) (-0.15; 28.92)
n = 100 (-10.19; 193.56) (-10.76; 204.36) (-10.84; 206.02) (-10.85; 206.24) (-10.86; 206.3) (-2.35; 233.01) (-2.63; 260.18) (-2.68; 265.61) (-2.69; 266.41) (-2.69; 266.5) (-1.40; 278.91) (-1.45; 287.62) (-1.45; 288.99) (-1.45; 289.2)
Tabel 4.1: Grenzen van de VaR van de som van Standaard Normaal verdeelde risico’s
36
Om het vergelijken mogelijk te maken, enerzijds tussen toepassingen met verschillende aantallen risico’s en anderzijds met de al bestaande resultaten uit Bernard et al. (2013) zijn de variantiegrenzen uitgedrukt op basis van de onderlinge correlaties ρ tussen de risico’s. Voor alle hier gebruikte verdelingen kan de bijhorende variantiegrens s2 dan eenvoudig afgeleid worden met behulp van vergelijking 4.1. Specifiek voor deze toepassing op standaard normale risico’s kan ook de vereenvoudigde vergelijking 4.2 gebruikt worden.
2
s =
n X i=1
Var(Xi ) + 2 ·
n X n X
ρ · Var(Xi ) · Var(Xj )
(4.1)
i=1 j=i+1
s2 = n + n · (n − 1) · ρ
(4.2)
Een aantal observaties zijn het vermelden waard. Ten eerste blijkt dat het ERA er goed in slaagt de theoretische variantie-begrensde VaR-grenzen ad en bd te benaderen. De grootste verschillen zijn te vinden bij de scenario’s met de strengste variantiegrenzen, en dan in het bijzonder bij de bovengrenzen. Dit is niet onverwacht, niet alleen zal bij sterkere restricties het ERA meer werk hebben om een geschikte afhankelijkheidsstructuur te vinden, ook is het benaderen van de bovengrens een lastigere operatie dan het benaderen van de ondergrens. Met betrouwbaarheidsintervallen van de VaR van typisch 95% tot 99.5% is het aantal datapunten dat bij de benadering van de bovengrens gebruikt wordt hooguit 5% van het totaal, uiterst klein vergeleken met het gedeelte dat voor de ondergrens gebruikt wordt. Naast de goede benadering door het ERA valt echter ook op dat in de meeste gevallen het verschil tussen onder- en bovengrens vrij aanzienlijk is en dit zowel bij de grenzen Ad en Bd als bij de grenzen met variantiebeperking ad en bd . Het stellen van een limiet op de variantie kan dan wel een groot effect hebben, bij de scenario’s met n = 100 valt de bovengrens van de Var95% bijvoorbeeld terug van 206 tot 43, toch blijven de verschillen nog altijd significant. Bovendien tonen de resultaten dat ook het gebruikte VaR-niveau een invloed heeft. Bij de hogere niveaus, zoals het 99.5%-niveau dat o.a. binnen Solvency II gebruikt wordt, blijkt dat de bovengrens ’slechts’ daalt van 289 tot 141, vergeleken met het effect bij het 95%-niveau een vrij beperkte daling. De bovenstaande observaties en de gevonden grenzen liggen tenslotte in dezelfde lijn als de gerapporteerde resultaten in Bernard et al. (2013). Wel zijn 37
kleine verschillen tussen de ERA-resultaten op te merken, voornamelijk bij de toepassingen met lage d-waarden. Mogelijk liggen afwijkingen tussen de gebruikte discretisaties van distributies of lichte implementatieverschillen hier aan de oorsprong.
4.1.3
Pareto II en lognormaal verdeelde risico’s
Terwijl de normale verdeling symmetrisch is zonder al te extreme waarden, zijn in praktijk risico’s vaak assymetrisch en onderhevig aan zware staarten. Om die reden is het interessant om het ERA ook toe te passen op enkele heavy tailed distributies om het effect van die extreme staarten op de werking van het algoritme te observeren. Met die bedoeling kunnen opnieuw risico’s Xi ’s beschouwd worden, nu respectievelijk met een Pareto type II en een lognormale verdeling. Tabel 4.2 bevat de resultaten van de ERA toepassingen op n Pareto verdeelde risico’s, hier toegepast met een schaalparameter σ = 1 en een vormparameter θ = 3 (om het bestaan van de eerste 2 momenten te garanderen). Tabel 4.3 bevat dan de resultaten voor de lognormaal verdeelde risico’s waar voor de parameters, zoals bij de standaard normale verdeling, een gemiddelde µ = 0 en een standaardafwijking σ = 1 gekozen is. Om het vergelijken tussen verschillende aantallen risico’s mogelijk te maken is opnieuw in plaats van een vaste variantiegrens een bepaalde correlatiewaarde ρ aangeduid. De bijhorende variantie kan dan analoog als ervoor bepaald worden als:
s2 =
n X i=1
Var(Xi ) + 2 ·
n X n X i=1 j=i+1
38
ρ · Var(Xi ) · Var(Xj )
(4.3)
Deel A: Variantie-begrensde grenzen md , Md , ad en bd (md ; Md ) (ad ; bd ) VaR95.0% d = 100 VaR95.0% d = 1000 VaR95.0% d = 10000 VaR95.0% d = 100000 VaR99.0% d = 100 VaR99.0% d = 1000 VaR99.0% d = 10000 VaR99.0% d = 100000 VaR99.5% d = 1000 VaR99.5% d = 10000 VaR99.5% d = 100000
ρ=0 (4.46; 11.62) (4.22; 12.79) (9.02; 14.61) (4.38; 14.98) / (4.4; 16.03) / (4.39; 16.52) (4.68; 4.69) (4.46; 23.23) (9.02; 24.76) (4.68; 27.9) (16.1; 27.49) (4.73; 30.2) / (4.73; 31.29) (9.02; 32.35) (4.75; 37.5) (20.55; 37.5) (4.8; 40.74) / (4.81; 42.28)
n = 10 ρ = 0.2 (4.51; 13.65) (4.1; 15.04) (9.02; 18.63) (4.17; 19.01) (16.1; 19.45) (4.13; 21.21) / (4.08; 22.31) (4.69; 4.69) (4.41; 28.36) (9.02; 33.26) (4.59; 37.1) (20.55; 38.13) (4.61; 42.02) / (4.6; 44.51) (9.02; 45.54) (4.68; 50.55) (20.55; 53.0) (4.72; 57.5) (35.84; 55.17) (4.71; 61.02)
ρ = 0.4 (4.13; 14.33) (4.0; 16.88) (9.02; 21.66) (4.01; 22.12) (16.1; 24.55) (3.92; 25.09) / (3.86; 26.6) (4.69; 4.69) (4.36; 32.56) (9.02; 42.7) (4.52; 44.2) (20.55; 49.84) (4.52; 50.89) (31.18; 53.49) (4.5; 54.3) (9.01; 51.62) (4.63; 60.61) (20.55; 68.85) (4.65; 70.07) (45.42; 71.56) (4.64; 74.9)
n = 100 ρ=0 ρ = 0.4 (45.29; 68.78) (42.34; 124.58) (45.11; 72.21) (41.25; 145.58) (47.52; 80.2) (41.35; 197.86) (47.45; 80.97) (41.24; 198.95) (48.09; 84.47) (40.9; 229.1) (47.96; 84.74) (40.34; 229.5) (48.6; 86.36) (45.43; 245.0) (48.04; 86.39) (39.69; 245.02) (46.47; 46.48) (46.5; 46.68) (45.87; 105.24) (44.18; 272.7) (48.47; 114.67) (47.75; 368.61) (48.39; 121.82) (45.67; 391.11) (49.26; 128.58) (48.11; 457.28) (48.99; 129.56) (45.66; 460.0) (49.62; 132.64) (46.8; 495.11) (49.12; 133.12) (45.46; 495.22) (48.72; 131.95) (47.11; 449.6) (48.61; 152.18) (46.69; 533.99) (49.51; 160.68) (49.22; 627.01) (49.23; 162.89) (46.88; 631.37) (49.92; 167.04) (53.31; 680.96) (49.36; 167.86) (46.78; 681.24)
Deel B: Onbegrensde grenzen Ad en Bd (Ad ; Bd ) d = 100 d = 1000 VaR95% d = 10000 d = 100000 d=∞ d = 100 d = 1000 VaR99% d = 10000 d = 100000 d=∞ d = 1000 d = 10000 VaR99.5% d = 100000 d=∞
n = 10 (3.61; 24.48) (3.64; 29.05) (3.65; 30.33) (3.65; 30.63) (3.65; 30.72) (4.32; 36.57) (4.43; 52.22) (4.45; 57.76) (4.45; 59.20) (4.45; 59.62) (4.61; 64.06) (4.63; 74.11) (4.63; 76.88) ( 4.64; 77.72)
n = 100 (36.03; 244.79) (36.42; 290.54) (36.46; 303.25) (36.46; 306.28) (36.47; 307.2) (43.24; 365.70) (44.35; 522.19) (44.46; 577.61) (44.48; 591.95) (44.48; 596.2) (46.15; 640.61) (46.33; 741.13) (46.34; 768.76) ( 46.35; 777.2)
Tabel 4.2: Grenzen van de VaR van de som van Pareto II verdeelde risico’s
39
Panel A: Variantie-begrensde grenzen md , Md , ad en bd (md ; Md ) (ad ; bd ) VaR95.0% d = 100 VaR95.0% d = 1000 VaR95.0% d = 10000 VaR95.0% d = 100000 VaR99.0% d = 100 VaR99.0% d = 1000 VaR99.0% d = 10000 VaR99.0% d = 100000 VaR99.5% d = 1000 VaR99.5% d = 10000 VaR99.5% d = 100000
ρ=0 (14.62; 35.62) (14.45; 38.87) (22.65; 43.46) (14.87; 43.82) (31.46; 41.73) (14.92; 45.56) / (14.92; 46.09) (15.68; 16.44) (15.13; 68.63) (22.65; 73.35) (15.68; 79.09) (41.55; 75.34) (15.79; 82.88) (47.15; 75.72) (15.8; 84.06) (22.65; 89.48) (15.87; 105.31) (41.55; 103.62) (15.98; 110.64) (55.57; 102.03) (16.0; 112.29)
n = 10 ρ = 0.2 (12.79; 70.88) (12.73; 71.37) (12.85; 82.25) (12.84; 82.39) (12.85; 84.9) (12.85; 84.98) (12.85; 85.22) (12.85; 85.47) (15.32; 102.79) (14.79; 102.79) (15.17; 138.55) (15.08; 138.76) (15.12; 149.45) (15.11; 149.54) (15.12; 151.65) (15.12; 151.8) (15.68; 164.0) (15.57; 165.45) (15.61; 184.3) (15.61; 184.52) (15.62; 188.73) (15.62; 188.77)
ρ = 0.4 (12.79; 70.88) (12.73; 71.37) (12.85; 82.25) (12.84; 82.39) (12.85; 84.9) (12.85; 84.98) (12.85; 85.22) (12.85; 85.47) (15.32; 102.79) (14.79; 102.79) (15.17; 138.55) (15.08; 138.76) (15.12; 149.45) (15.11; 149.54) (15.12; 151.65) (15.12; 151.8) (15.68; 164.0) (15.57; 165.45) (15.61; 184.3) (15.61; 184.52) (15.62; 188.73) (15.62; 188.77)
n = 100 ρ=0 ρ = 0.4 (153.46; 217.46) (127.37; 713.58) (152.8; 230.03) (127.35; 713.72) (159.13; 246.43) (128.4; 823.87) (158.59; 250.13) (128.39; 823.92) (159.95; 256.0) (128.5; 849.76) (159.72; 256.59) (128.5; 849.77) (160.85; 257.54) (128.51; 854.71) (159.89; 258.44) (128.51; 854.71) (156.69; 156.72) (148.9; 1027.88) (154.97; 324.13) (147.86; 1027.88) (161.35; 342.57) (150.81; 1387.22) (161.16; 361.66) (150.8; 1387.61) (162.69; 369.68) (151.12; 1495.4) (162.44; 374.63) (151.12; 1495.44) (163.07; 377.51) (151.15; 1517.97) (162.66; 378.52) (151.15; 1517.97) (162.03; 390.58) (155.69; 1653.25) (161.76; 444.59) (155.68; 1654.48) (163.1; 456.61) (156.12; 1845.09) (163.07; 462.39) (156.12; 1845.23) (163.55; 463.63) (156.16; 1887.72) (163.3; 467.8) (156.16; 1887.74)
Panel B: Onbegrensde grenzen Ad en Bd (Ad ; Bd ) d = 100 d = 1000 VaR95% d = 10000 d = 100000 d = 100 d = 1000 VaR99% d = 10000 d = 100000 d = 1000 d = 10000 VaR99.5% d = 100000
n = 10 (12.73; 71.37) (12.84; 82.39) (12.85; 84.98) (12.85; 85.47) (14.78; 102.79) (15.08; 138.76) (15.11; 149.54) (15.12; 151.80) (15.56; 165.45) (15.61; 184.52) (15.62; 188.77)
n = 100 (127.35; 713.72) (128.39; 823.92) (128.50; 849.77) (128.51; 854.71) (147.86; 1027.88) (150.80; 1387.61) (151.12; 1495.44) (151.15; 1517.97) (155.67; 1654.48) (156.12; 1845.23) (156.16; 1887.74)
Tabel 4.3: Grenzen van de VaR van de som van Lognormaal verdeelde risico’s
De resultaten van zowel de Pareto type II verdeling als de Lognormale verdeling vertonen sterke gelijkenissen. De voornaamste observatie, en het grootste verschil met de voorgaande standaard normale verdeling, is de zwakke werking van het 40
ERA bij kleine aantallen risico’s. Vooral bij de Pareto II verdeling manifesteert dit zich, met in verschillende gevallen, bij de grote d-waarden, zelfs het niet vinden van grenzen door het ERA. Een mogelijke verklaring hiervoor ligt bij de typische zware staart van deze verdelingen en het gevolg hiervan op de discretisatie. Doordat een discretisatie i xij = Fj−1 ( d+1 ) gecombineerd wordt met een extreme staart ontstaat immers een verschil in de maximale waarden die bereikt worden. Zoals in Figuur 4.1 te zien is de maximale discrete waarde bij Pareto II (θ = 3) d = 100 slechts 3.66 (= 10000 100 )) terwijl die bij d = 10000 al 20.55 is (= Fj−1 ( 10000+1 )). Deze extreme Fj−1 ( 100+1 waarden bij hoge d-waarden, in combinatie met een beperkt aantal risico’s en een lage variantiegrens (waardoor de optimalisatiestap geactiveerd wordt, zie ook 4.1.5) bemoeilijken het vinden van de geschikte correlatiecombinatie. Ook bij de lognormale verdeling is dit effect te vinden, maar in beperktere mate.
Figuur 4.1: Verschil in xij waarden bij de discretisatie van de Pareto II verdeling (θ = 3) volgens de procedure in Algoritme 2
Wanneer echter het aantal risico’s voldoende hoog is, is ook bij deze verdelingen te zien dat het ERA er in slaagt de theoretische grenzen uitermate dicht te benaderen. Door de extreme waarden in de staart is bovendien het effect van het invoeren van een variantiebeperking op de portefeuillesom groter dan bij de nor41
male verdeling. Toch blijft ook bij deze verdelingen het VaR-interval nog altijd aanzienlijk, zelfs met variantiebeperking.
4.1.4
Begrenzing van de scheefheid
In de voorgaande resultaten werd duidelijk dat het invoeren van een variantiegrens op de risicosom in vele gevallen kan leiden tot een kleiner verschil tussen onder- en bovengrens van de VaR en dat het ERA bovendien in staat is om deze verbeterde grenzen goed te benaderen. De extra informatie over de portefeuillesom kan dus zorgen voor een betere inschatting van de VaR. Om die reden werd in Sectie 3.2.2 een uitbreiding van het ERA ge¨ıntroduceerd waarbij, naast een variantiegrens, ook een scheefheidsgrens kan gebruikt worden om de grenzen van de VaR te verbeteren. Aangezien met de verschillende ERA-iteraties zowel de variantie als de scheefheid van het resultaat daalt, zal het de grootste van beide beperkingen zijn die zal bepalen hoe lang het algoritme actief blijft. Panel A: Standaard Normaal verdeelde data (m∗ ; M∗ ) VaR95% VaR99% VaR99.5%
ρ=0 ρ = 0.4 ρ=0 ρ = 0.4 ρ=0 ρ = 0.4
γ=5 (-0.27; 5.17) (-0.27; 5.26) (-0.03; 3.36) (-0.04; 4.42) (-0.01; 4.63) (-0.01; 4.86)
n = 100, d = 1000 γ = 30 γ = 150 (-2.23; 42.38) (-2.23; 42.38) (-2.32; 44.15) (-6.59; 125.27) (-0.4; 42.06) (-0.88; 88.19) (-0.38; 38.22) (-1.12; 110.97) (-0.17; 36.28) (-0.55; 112.26) (-0.18; 36.97) (-0.56; 113.61)
γ = 400 (-2.23; 42.38) (-10.75; 204.35) (-0.88; 88.19) (-2.62; 260.12) (-0.55; 112.26) (-1.4; 278.85)
Panel B: Pareto II (θ = 3) data (m∗ ; M∗ ) VaR95% VaR99% VaR99.5%
ρ=0 ρ = 0.4 ρ=0 ρ = 0.4 ρ=0 ρ = 0.4
γ=5 (48.85; 54.36) (48.85; 54.39) (49.08; 53.7) (49.08; 54.17) (49.1; 53.59) (49.1; 53.63)
n = 100, d = 1000 γ = 30 γ = 150 (47.52; 80.2) (47.52; 80.2) (47.47; 80.59) (41.35; 197.86) (48.84; 77.09) (48.47; 114.67) (48.85; 76.74) (47.93; 185.53) (48.99; 76.07) (48.72; 131.95) (48.99; 76.24) (48.47; 179.56)
γ = 400 (47.52; 80.2) (41.35; 197.86) (48.47; 114.67) (47.75; 368.61) (48.72; 131.95) (47.11; 449.6)
Tabel 4.4: Door het ERA gevonden grenzen van de VaR van sommen van respectievelijk Standaard Normaal als Pareto II verdeelde data, met limieten op zowel de variantie als de scheefheid
Wanneer toegepast op 100 standaard normaal of Pareto II verdeelde risico’s met elk 1000 datapunten, een dimensie die in de voorgaande resultaten voldoende 42
bleek voor goede resultaten, valt zoals verwacht te observeren dat een lagere scheefheidsgrens een verscherping van de grenzen tot gevolg heeft. Tabel 4.4 bevat de resultaten van deze toepassingen. In het grijs aangeduid zijn die resultaten waar de scheefheidsgrens geen invloed heeft op het eindresultaat, de variantiebeperking is in die gevallen de strengste grens. In de andere gevallen valt op te merken dat bij een lage scheefheidsgrens de variantiegrens niet veel impact heeft op de uiteindelijk gevonden grenzen. Bij zowel een ρ van 0 als van 0.4 worden dan gelijkaardige grenzen gevonden. Het enige verschil ontstaat doordat een lage variantiegrens ook de optimalisatiestap activeert (4.1.5), het effect hiervan is echter heel beperkt. Door het gebrek aan theoretisch berekenbare tegenhangers is echter niet formeel te bepalen hoe dicht de gevonden grenzen de eigenlijke scheefheidsbegrensde VaR-grenzen juist benaderen.
4.1.5
Optimalisatiestap 1b van het ERA
In hoofdstuk 3 werd al aangehaald dat het ERA een extra stap bevat (stap 1b in Algoritme 2) die als doel heeft de performantie te verbeteren. Door de werking van deze optimalisatiestap, waarbij rijen in de datamatrix worden doorgeschoven en dit totdat de gemiddelde som van de rijen k tot d − 1 kleiner is dan de bovengrens bd , is er echter ook een gevolg voor het eindresultaat. Ter illustratie kan de situatie genomen worden waarbij de rijen met 1 positie worden doorgeschoven zoals in Figuur 4.2 weergegeven. Het effect hiervan is dat de initieel laatste rij, met als eerste element x1d de nieuwe eerste rij wordt terwijl de k’de rij de (k + 1)’ste wordt. Een gelijkaardige situatie ontstaat echter ook in het geval zonder optimalisatiestap. Na toepassing van de RA-functies zou in stap 4 van het algoritme de datamatrix ook met 1 positie doorgeschoven worden. Het verschil is dat de rijen die dan worden doorgeschoven niet de oorspronkelijke zijn, maar de gerearrangede rijen, na toepassing van het RA. Doordat o.a. de gerearrangede d’de rij over het algemeen, uitzonderingen met vlakke distributies buiten beschouwing gelaten, lager is dan de oorspronkelijke d’de rij kan zo een andere eindoplossing gevonden worden.
43
Figuur 4.2: Visualisatie van de optimalisatiestap 1b. In dit voorbeeld worden de rijen in de matrix 1 positie opgeschoven (m=2)
Dit effect op het eindresultaat kan geobserveerd worden in Tabel 4.5 waar toepassingen van het ERA op verschillende scenario’s met standaard normaal verdeelde risico’s zowel gebeuren met als zonder de optimalisatiestap. Met enkele voorbeelden aangeduid in de tabel valt op te merken dat dit verschil het grootst is bij de kleinere datasets, hier zorgt de optimalisatiestap vaak voor een slechter eindresultaat. Bij de grotere datasets verkleint het verschil echter en zijn de verschillen vrij beperkt, beide versies benaderen in dat geval vrij dicht de grenzen a en b met nog slechts een heel klein verschil. De goede resultaten uit de voorgaande tabellen waar enkel toepassingen met optimalisatiestap vermeld werden ondersteunen dit ook. In uitzonderlijke gevallen kunnen ook situaties ontstaan waar de optimalisatiestap zorgt voor een beter eindresultaat (Tabel 4.5, blauwe cijfers), dit zijn echter alleenstaande gevallen. De grijze cijfers in de tabel komen overeen met situaties waar geen rijen moeten doorgeschoven worden, beide toepassingen zijn in die gevallen dus identiek.
44
n=100, d=100 m bound M bound a grens b grens A grens B grens n=100, d=1000 m bound M bound a grens b grens A grens B grens n=100, d=10000 m bound M bound a bound b bound A grens B grens
Met optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 -1.7 -8.01 0.04 -2.33 33.31 152.77 0.07 233.01 -2.2 -9.67 -0.97 -2.35 41.87 183.81 95.58 233.01 -10.19 -10.19 -2.35 -2.35 193.56 193.56 233.01 233.01 Met optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 -2.23 -10.13 -0.88 -2.62 42.38 192.54 88.19 260.12 -2.28 -10.34 -1.0 -2.63 43.33 196.47 98.9 260.18 -10.76 -10.76 -2.63 -2.63 204.36 204.36 260.18 260.18 Met optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 -2.28 -10.43 -0.99 -2.68 43.48 196.05 96.52 265.61 -2.29 -10.45 -1.0 -2.68 43.55 198.48 99.42 265.61 -10.84 -10.84 -2.68 -2.68 206.02 206.02 265.61 265.61
Zonder optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 -1.93 -8.01 0.05 -2.33 36.94 152.77 0.05 233.01 -2.2 -9.67 -0.97 -2.35 41.87 183.81 95.58 233.01 -10.19 -10.19 -2.35 -2.35 193.56 193.56 233.01 233.01 Zonder optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 -2.27 -10.3 -0.9 -2.62 43.23 195.84 88.06 260.12 -2.28 -10.34 -1.0 -2.63 43.33 196.47 98.9 260.18 -10.76 -10.76 -2.63 -2.63 204.36 204.36 260.18 260.18 Zonder optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 -2.29 -10.44 -1.0 -2.68 43.5 198.14 98.74 265.61 -2.29 -10.45 -1.0 -2.68 43.55 198.48 99.42 265.61 -10.84 -10.84 -2.68 -2.68 206.02 206.02 265.61 265.61
Tabel 4.5: Gegevens over de toepassing van het ERA op standaard normale risico’s met n = 100 en respectievelijk d = 100, d = 1000 en d = 10000, data afgerond op 2 decimalen
45
4.2 4.2.1
Performantie en schaalbaarheid Algemeen
De performantie van het RA, en bij uitbreiding het ERA, is door de iteratieve constructie (Figuur 4.3) heel erg afhankelijk van het aantal risico’s in de dataset en het aantal datapunten per risico. Bij het overlopen van alle risico’s wordt immers elk risico ook volledig gesorteerd, een intensieve operatie waarvan het effect groter wordt naarmate de dataset groter wordt.
Figuur 4.3: De iteratieve structuur van het RA
Door deze iteratieve constructie moet dus ook aandacht besteed worden aan de performantie van het algoritme en de eventuele schaalbaarheid ervan. Daarom worden in de volgende secties de verschillende aspecten hiervan aangehaald. Eerst wordt het effect van de optimalisatiestap 1b in het ERA (Algoritme 2) besproken, vervolgens de mogelijke schaalbaarheid en tenslotte worden kort de verschillende gebruikte technieken overlopen die bijdragen aan een effici¨ente implementatie.
4.2.2
Optimalisatiestap 1b van het ERA
De optimalisatiefase, stap 1b in Algoritme 2, heeft als doel de toepassing van het ERA op grotere datasets mogelijk te maken. In 4.1.5 werd hiervan het kwalitatieve effect onderzocht, hier wordt gefocust op de performantie. Tabel 4.6 toont het effect van deze optimalisatiestap op een aantal scenario’s met vermelding van het aantal iteraties in het ERA en de RA-subroutines. Uit deze resultaten kan gezien worden dat deze extra stap voornamelijk een effect blijkt te hebben op de grotere datasets, en in het bijzonder bij deze datasets 46
waar ook een strikte variantielimiet van toepassing is. Indien in deze gevallen niet initieel vele rijen verschoven worden zal het ERA immers genoodzaakt zijn veel meer iteraties te ondernemen tot een geldig resultaat kan bekomen worden. Op de grootst geteste dataset kan een reductie op het aantal RA-iteraties van meer dan 99% gemeld worden terwijl het aantal ERA-iteraties met meer dan een factor 300 vermindert. In Tabel 4.6 zijn tevens de opgemeten tijdsduren opgenomen. Het is duidelijk dat deze tijden afhankelijk zijn van gebruikte testhardware en het testsysteem, ze dienen bijgevolg zuiver ter indicatie. Ook de initialisatie van het testprogramma, met o.a. het inlezen van de externe databestanden, wordt hier niet meegenomen. Door het grote effect van de optimalisatiestap, en de noodzaak ervan bij toepassingen op grote datasets, worden verderop in dit document enkel resultaten met deze optimalisatiestap besproken. n=100, d=100 ERA iteraties RA iteraties Verschoven rijen (1b) Totale runtime (ms) n=100, d=1000 ERA iteraties RA iteraties Verschoven rijen (1b) Totale runtime (ms) n=100, d=10000 ERA iteraties RA iteraties Verschoven rijen (1b) Totale runtime (ms)
Met optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 2 2 2 1 1458 1272 1369 553 31 0 16 0 289 144 46 15
Zonder optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 8 2 2 1 3795 1272 1184 553 0 0 0 0 585 62 45 9
Met optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 2 2 2 1 2418 1339 5107 853 307 3 156 0 782 263 1443 109
Zonder optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 74 3 11 1 48220 2289 10441 853 0 0 0 0 16687 513 1847 99
Met optimalisatie q = 95% q = 99% ρ = 0 ρ = 0.2 ρ = 0 ρ = 0.2 2 2 2 1 7101 2027 7054 1158 3066 26 1550 0 23877 10595 23777 3626
Zonder optimalisatie q = 95% q = 99% ρ=0 ρ = 0.2 ρ=0 ρ = 0.2 738 19 98 1 1674216 28351 119991 1158 0 0 0 0 15749052 204821 648057 5352
Tabel 4.6: Gegevens over de toepassing van het ERA met datasets van 100 standaard normaal verdeelde risico’s en respectievelijk d=100, d=1000 en d=10000
47
4.2.3
Schaalbaarheid
Algemeen Met de opkomst van big data ontstaat ook de nood aan algoritmen die overweg kunnen met significant grote datasets. Zoals in het vorige onderdeel al kort aangeraakt is bij het ontwerp van het ERA door de toevoeging van de optimalisatiestap hier al aandacht aan besteed. Echter blijft door de iteratieve basis van het algoritme en de vele sorteeracties de performantie van het algoritme sterk afhankelijk van de grootte van de gebruikte dataset. Om praktisch toepasbaar te zijn moet ook bij grote datasets het ERA uitvoerbaar zijn. Dit wordt in dit onderdeel bekeken. Om de complexiteitsgraad en dus schaalbaarheid van een algoritme te onderzoeken wordt in de literatuur vaak gegrepen naar de zogenaamde Grote-O-notatie (big oh notation). Op basis van deze notatie kunnen algoritmen geclassificeerd worden op basis van hun gedrag bij stijgende probleemgrootten. Zo betekent O(n) dat de complexiteit lineair stijgt met n, en O(n2 ) dat de complexiteit kwadratisch stijgt, waarbij bij beiden een eventueel constante factor c buiten beschouwing gelaten wordt.
Figuur 4.4: De iteratieve structuur van het ERA
Uit analyse van het algoritme blijkt (zie ook Figuur 4.4) dat het ERA tot de O(n · d log(d)) klasse behoort. Een verhoging van het aantal risico’s zorgt voor een lineair verlengde iteratie, terwijl een toename van het aantal datapunten een zwaardere sorteeroperatie ten gevolge heeft. Met een theoretische ondergrens
48
voor comparatieve sorteeralgoritmen van O(d log(d)) 1 (zie o.a. Papadimitriou (2003)), en zo ook ge¨ımplementeerd in de testversie van het ERA door het gebruik van de Java 7 TimSort sorteermethode (Peters en Bloch, 2009a), wordt een totale tijdscomplexiteit van O(n · d log(d)) bekomen. Omdat in deze classificatie constante factors buiten beschouwing gelaten worden (de al dan niet toepassing van de optimalisatiestap 1b heeft o.a. geen effect op de tijdscomplexiteit classificatie) en er uit gegaan wordt van een worst-case scenario worden in de volgende 2 onderdelen de re¨eele effecten van vergroting van de dataset beschouwd, uitgaande van de testimplementatie. Verhoging risico’s Toegepast op verscheidene scenario’s met stijgende aantallen risico’s, gedraagt het ERA zich volgens de eerdere lineaire classificatie t.o.v. het aantal risico’s n. Focussend op het aantal RA-iteraties kan in Tabel 4.7 geobserveerd worden dat het aantal iteraties bij elke risicoverhoging van factor 10 stijgt met een factor tussen 10 en 12. De theoretische classificatie van lineariteit blijkt dus goed overeen te komen met de geteste scenario’s. De enige uitzondering hierop zijn die situaties waar ook het aantal ERA-iteraties verhoogt, zoals in het tweede scenario (d = 1000, ρ = 0, q = 95%) waar het aantal ERA-lussen van 3 naar 6 gaat. In deze situaties kan gezien worden dat het aantal RA-iteraties een extra gelijke stijging ondergaat om in dit geval uit te komen op een maximale verhoging van factor 21. De stijging in ERA-iteraties kan verklaard worden als zijnde het gevolg van een veranderde probleemsituatie. Door het aantal risico’s te verhogen is ook de variantiegrens verhoogd waardoor de verschillende ERA-toepassingen niet exact gelijklopend zijn. Dit meegenomen geldt echter voor alle geteste scenario’s dat een verhoging van het aantal risico’s met factor 10, leidt tot een, zoals verwacht lineaire, verzwaring van het aantal RA-iteraties met een factor 10 tot 21. 1
Deze ondergrens kan eventueel nog verlaagd worden door met niet-comparatieve of met parallelle sorteeralgoritmen te werken, beiden zijn in praktijk voorlopig echter moeilijk toepasbaar. Parallelle sorteermethoden bieden interessante perspectieven maar zijn nog in volle ontwikkeling. Voor een huidige status zie bijvoorbeeld Goldshteyn (2013).
49
d = 100, ρ = 0 ERA iteraties RA iteraties Verschoven rijen (1b) Sorteertijd (%) Totale runtime (ms) d = 100, ρ = 0.2 ERA iteraties RA iteraties Verschoven rijen (1b) Sorteertijd (%) Totale runtime (ms) d = 1000, ρ = 0 ERA iteraties RA iteraties Verschoven rijen (1b) Sorteertijd (%) Totale runtime (ms) d = 1000, ρ = 0.2 ERA iteraties RA iteraties Verschoven rijen (1b) Sorteertijd (%) Totale runtime (ms)
n=1000 2 10937 42 84 485
q = 95% n=10000 3 184263 45 46 1534
n=100000 6 3895028 46 47 37386
n=1000 2 13994 37 35 124
q = 99% n=10000 2 109888 45 47 2439
n=100000 2 1299744 48 43 20190
n=1000 2 10001 0 56 126
q = 95% n=10000 2 100494 0 67 2751
n=100000 2 1201844 0 60 12772
n=1000 1 5490 0 49 39
q = 99% n=10000 1 75133 0 48 1332
n=100000 1 850453 0 42 6755
n=1000 2 17986 420 47 5262
q = 95% n=10000 3 259216 457 35 35976
n=100000 6 5499894 469 30 1161929
n=1000 2 25003 372 42 6046
q = 99% n=10000 2 149937 455 33 29024
n=100000 2 1699987 482 25 268143
n=1000 2 16075 4 69 3458
q = 95% n=10000 2 180117 4 63 47078
n=100000 2 1959560 5 54 772306
n=1000 1 10514 0 67 1761
q = 99% n=10000 1 95140 0 54 36381
n=100000 1 951401 0 43 253428
Tabel 4.7: Gegevens over de toepassing van het ERA op standaard normaal verdeelde data en het effect bij een stijgend aantal risico’s. Toepassingen met verschillende d, ρ en q parameters. Verhoging datapunten Analoog aan de vorige tabel bevat Tabel 4.8 de resultaten van verschillende scenario’s waarbij telkens het aantal datapunten verhoogd is. In dit geval is de analyse eenvoudiger, het aantal datapunten verhogen verandert immers niet het probleem zoals bij een risicostijging, het maakt het enkel nauwkeuriger. Dit vertegenwoordigt zich o.a. in het aantal ERA-iteraties dat constant blijft bij verschillende d-niveaus. Bovendien blijft ook het aantal RA op een stabiel niveau met relatief kleine schommelingen en is het aandeel rijen dat in de optimalisatiestap verschoven wordt nagenoeg constant met kleine schommelingen ten gevolge van de nauwkeurigere data.
50
Ook al blijft het aantal RA-iteraties echter constant, de gemeten tijdsduren duiden wel op het feit dat elke iteratie intensiever wordt. Het sorteren, en andere operaties zoals het bijhouden van de som, gebeurt immers op een dataset die 10 tot 100 maal groter is. Het zijn die complexere sorteeracties die mede verantwoordelijk zijn voor de stijgende tijdscomplexiteit en dit vertegenwoordigd zich ook in de gemeten tijdsduren. Dit effect is bij alle geteste scenario’s merkbaar. n = 100, ρ = 0 ERA iteraties RA iteraties Verschoven rijen (1b) Sorteertijd (%) Totale runtime (ms) n = 100, ρ = 0.2 ERA iteraties RA iteraties Verschoven rijen (1b) Sorteertijd (%) Totale runtime (ms) n = 1000, ρ = 0 ERA iteraties RA iteraties Verschoven rijen (1b) Sorteertijd (%) Totale runtime (ms) n = 1000, ρ = 0.2 ERA iteraties RA iteraties Verschoven rijen (1b) Sorteertijd (%) Totale runtime (ms)
d=1000 2 2418 307 75 777
q = 95% d=10000 2 7101 3066 59 21386
d=100000 2 5004 30659 62 194830
d=1000 2 5107 156 74 650
q = 99% d=10000 2 7054 1550 62 21908
d=100000 2 9922 15490 68 492506
d=1000 2 1339 3 71 224
q = 95% d=10000 2 2027 26 72 11580
d=100000 2 3713 256 72 228754
d=1000 1 853 0 66 157
q = 99% d=10000 1 1158 0 60 5069
d=100000 1 1873 0 64 83685
d=100 2 10937 42 48 89
q = 95% d=1000 2 17986 420 48 3683
d=10000 2 25554 4202 47 56063
d=100 2 13994 37 40 89
q = 99% d=1000 2 25003 372 44 6103
d=10000 2 25009 3716 39 38584
d=100 2 10001 0 62 111
q = 95% d=1000 2 16075 4 70 5110
d=10000 2 22591 42 63 70267
d=100 1 5490 0 42 45
q = 99% d=1000 1 10514 0 69 3918
d=10000 1 11001 0 70 40086
Tabel 4.8: Gegevens over de toepassing van het ERA op standaard normaal verdeelde data en het effect bij een stijgend aantal datapunten. Toepassingen met verschillende n, ρ en q parameters.
4.2.4
Implementatie & performantie
Ter be¨eindiging van het performantieluik worden hier de voornaamste aandachtspunten en maatregelen overlopen die in de testimplementatie bijdragen tot een verbetering van de effici¨entie. 51
Het sorteeralgoritme De totale tijdsduur van een toepassing van het ERA is hoofdzakelijk afhankelijk van enerzijds een aantal matrixoperaties en anderzijds het sorteren van de risico’s. In de geteste scenario’s bedraagt het aandeel van deze laatste operatie, afhankelijk van de situatie, 25% tot 70%. Om dit aandeel zo laag mogelijk te houden is de keuze van het sorteeralgoritme belangrijk. In de testimplementatie is daarom gekozen voor de Java 7 Timsort. Dit algoritme werkt worst-case in een effici¨ente O(d log(d)) tijd, maar kan bovendien ook voordeel slaan uit data die al grotendeels gesorteerd is (Peters en Bloch, 2009b), een situatie die bij RA-toepassingen veelvuldig voorkomt. Tenslotte is Timsort, als lid van de mergesort familie, ook een stabiele sorteermethode, waardoor rijen met gelijke sommen hun onderlinge positie behouden en niet ineffici¨ent verwisseld worden. Dit behoud van positie draagt bovendien ook bij aan de deterministische aard van het algoritme. Simultane RA-uitvoering Stap 3 van het ERA omvat het oproepen van RA-subroutines op enerzijds de eerste q% rijen en anderzijds de laatste (1−q)% rijen. Aangezien echter bij toepassingen van het ERA om de VaR te berekenen de kans q bijna uitsluitend minstens 95% bedraagt omvat is deze laatste groep rijen relatief klein. Een interessante aanpassing is daarom om heel de operatie in 1 keer uit te voeren. Met als enige vereiste aanpassing dat het sorteren gescheiden moet blijven, een techniek die de gebruikte Java 7 API ondersteunt, kan het standaard RA vervolgens op heel de dataset toegepast worden in plaats van de origineel 2 afzonderlijke toepassingen. Als alternatief kan ook gedacht worden aan technieken als parallelle programmatie. Echter doordat bij de meeste toepassingen q heel groot gekozen wordt kan verwacht worden dat dit slechts voordeel oplevert bij gebruik van heel grote datasets. Verder onderzoek hiernaar valt buiten de scope van deze thesis. Registratie van de som Doorheen de uitvoering van het ERA is de correcte bepaling van de portefeuillesomvector cruciaal. Deze som wordt immers gebruikt als basis van het sorteren van de kolommen van de datamatrix. Door de continue verwisselingen binnen kolommen moet deze som echter ook continue aangepast worden. Uit performantieoogpunt is het daarom belangrijk om deze som slechts eenmaal te berekenen
52
en deze vervolgens bij elke sorteeractie telkens aan te passen. Het continue opnieuw berekenen van de som zou anders bij omvangrijke datasets het algoritme aanzienlijk vertragen.
53
Hoofdstuk 5 Conclusie “Security is mostly a superstition. Life is either a daring adventure or nothing.” — Helen Keller
De Value at Risk (VaR) en het modelrisico bij VaR-modellen stonden in deze thesis centraal. In het bijzonder werd gefocust op de aanwezigheid van modelrisico bij zogeheten risico-aggregaties met onzekere afhankelijkheid en het effect van het toevoegen van variantierestricties. Om dit modelrisico te kwantificeren werd gebruik gemaakt van het Extended Rearrangement Algoritme (ERA), ge¨ıntroduceerd door Bernard et al. (2013). In dit ERA wordt als variantierestrictie de maximale variantie van de portefeuillesom gehanteerd. Door het gebruik van deze maatstaf, die in praktijk vaak met voldoende zekerheid te benaderen valt, ontstaat immers een mogelijkheid om de absolute VaR-grenzen te verbeteren. Om de impact van deze extra restrictie te analyseren werd het ERA toegepast op verschillende distributies. De resultaten op al deze distributies waren gelijklopend. Ten eerste kon geobserveerd worden dat de benaderde grenzen van het ERA de theoretische tegenhangers dicht konden benaderen, en dit op de verschillende VaR-niveaus. Wel was op te merken dat bij de strengere variantiegrenzen en bij de heavy tailed-distributies grotere datasets vereist waren voor een goed resultaat. Ten tweede, gekeken naar de VaR-grenzen, was te bemerken dat de invoering van variantierestricties inderdaad zorgde voor significante verbeteringen van de grenzen. Echter, zelfs met deze extra restricties bleven in vele gevallen de VaR-intervallen aanzienlijk. Bovendien was dit effect nog sterker zichtbaar bij grotere VaR-betrouwbaarheidsintervallen. Tussen de VaR-intervallen bij 99.5%, de standaard configuratie bij regelgevende kaders 54
als o.a. Solvency II, en de VaR-intervallen bij 95% kon zo een verschil in grootte van factor 2 waargenomen worden. Gekeken naar de performantie werd het effect van de ge¨ıntegreerde optimalisatiestap en de schaalbaarheid onder de loep genomen. Het belang van deze extra stap is voornamelijk zichtbaar bij de grotere datasets en in combinatie met strikte variantiegrenzen. In de uiterste geteste gevallen waren zo verbeteringen met meer dan een factor 200 zichtbaar. Door de inherent iteratieve structuur van het algoritme en zijn vele intensieve operaties blijft de schaalbaarheid echter een belangrijk aandachtspunt, o.a. met het oog op eventuele praktische toepassingen. De structuur van het ERA opent tenslotte ook mogelijkheden om naast variantiebeperkingen ook andere restricties toe te voegen. In deze thesis werd zo de mogelijkheid bekeken voor het gebruik van beperkingen op de scheefheid van de portefeuillesom. Uit empirische observaties bleek dat ook deze beperkingen het VaR-interval mogelijk aanzienlijk konden verkleinen. Om te eindigen kan besloten worden dat het ERA goede resultaten neerzet, de gevonden grenzen benaderen bij voldoende grote datasets heel dicht de theoretische grenzen en de invoering van restricties op de variantie kan inderdaad leiden tot betere VaR-grenzen. Ondanks deze goede resultaten blijft modelrisico meestal echter sterk aanwezig. Modellen met verschillende specificaties kunnen, wanneer toegepast op dezelfde risicoportefeuilles, dus vaak heel uiteenlopende resultaten weergeven, zelfs met variantierestricties.
55
Woordenlijst AVaR Average Value at Risk. 13 CTE Conditional Tail Expectation. 13 CVaR Conditional Value at Risk. 13 EAD Exposure at Default. 5, 6 EL Expected Loss. 6 ERA Extended Rearrangement Algoritme. 1, 3, 4, 23, 24, 28–34, 36, 37, 40–51, 53, 54 ES Expected Shortfall. 13 ETL Expected Tail Loss. 13 LGD Loss Given Default. 5, 6 LTVaR Left Tail Value at Risk. 15, 16 PD Probability of Default. 5, 6 RA Rearrangement Algoritme. 3, 4, 23, 24, 26–31, 42, 45, 46, 48–51 TCE Tail Conditional Expectation. 13 TVaR Tail Value at Risk. 1, 12, 13, 15, 16 VaR Value at Risk. 1–3, 7–16, 18–20, 22, 24, 26, 28, 30, 32, 34–36, 38, 39, 41, 42, 51, 53, 54
56
Bibliografie Artzner, P., Delbaen, F., Eber, J.-M., en Heath, D. (1999). Coherent measures of risk. Mathematical Finance, 9(3):203–228. Basel Committee on Banking Supervision (2004). International convergence of capital measurement and capital standards: a revised framework. Technical report, Bank for international settlements. Basel Committee on Banking Supervision (2012). Consultative document: Fundamental review of the trading book. Available at: http://www.bis.org/ publ/bcbs219.pdf. Beder, T. S. (1995). Var: Seductive but dangerous. Financial Analysts Journal, pages 12–24. Berkowitz, J. en O’Brien, J. (2002). How accurate are value-at-risk models at commercial banks? The Journal of Finance, 57(3):1093–1111. Bernard, C., Jiang, X., en Wang, R. (2014). Risk aggregation with dependence uncertainty. Insurance: Mathematics and Economics, 54:93–108. Bernard, C., R¨uschendorf, L., en Vanduffel, S. (2013). Value-at-risk bounds with variance constraints. Available at SSRN 2342068. Bervas, A. (2006). Market liquidity and its incorporation into risk management. Financial Stability Review, 8:63–79. Chen, J. M. (2014). Measuring market risk under the basel accords: Var, stressed var, and expected shortfall. Aestimatio, The IEB International Journal of Finance, 8:184–201. Chiang, T. C., Jeon, B. N., en Li, H. (2007). Dynamic correlation analysis of financial contagion: Evidence from asian markets. Journal of International Money and Finance, 26(7):1206–1228.
57
Committee of European Insurance and Occupational Pensions Supervisors (2010). Ceiops’s advice for level 2 implementing measures on solvency II: Scr standard formula article 111(d) correlations. Technical report, (Committee of European Insurance and Occupational Pensions Supervisors). Crouhy, M. (2010). Risk management failures during the financial crisis. Lessons from the financial crisis: Causes, consequences, and our economic future, pages 283–291. Deloitte (2010). Presentation on solvency II: Quantitative impact study 5 (draft technical specification). Located at: http://www.deloitte.com/. Dowd, K. (2002). Measuring Market Risk. The Wiley Finance Series. Wiley. Embrechts, P., H¨oing, A., en Juri, A. (2003). Using copulae to bound the value-atrisk for functions of dependent risks. Finance and Stochastics, 7(2):145–167. Embrechts, P. en Puccetti, G. (2006). Bounds for functions of dependent risks. Finance and Stochastics, 10(3):341–352. Embrechts, P. en Puccetti, G. (2010). Bounds for the sum of dependent risks having overlapping marginals. Journal of Multivariate Analysis, 101(1):177 – 190. Embrechts, P., Puccetti, G., en R¨uschendorf, L. (2013a). Model uncertainty and var aggregation. Journal of Banking & Finance. Embrechts, P., Puccetti, G., R¨uschendorf, L., Wang, R., en Beleraj, A. (2013b). An academic response to basel 3.5. Preprint, ETH Zurich. European Commission (2014). Solvency II: Frequently asked questions. Technical report, Internal Markets & Services DG. Flores, J. A. E., Basualdo, T. L., Sordo, A. R. Q., en Comisin Nacional Bancaria y de Valores (2010). Regulatory use of system-wide estimations of pd, lgd and ead. Technical report, Financial Stability Institute. FSI Award 2010 Winning Paper. Goldshteyn, M. (2013). Bleeding edge parallel sorting algorithms. http://stackoverflow.com/questions/3969813/ which-parallel-sorting-algorithm-has-the-best -average-case-performance. Accessed: 2014-07-19. Holton, G. A. (2002). History of value-at-risk: 1922-1998. Technical report, Working paper. Contingency Analysis, Boston. 58
Hoppe, R. (1998). Var and the unreal world. Risk, 11:45–50. Hull, J. (2012). Risk Management and Financial Institutions, volume 733 of Wiley Finance. John Wiley & Sons. Kaas, R., Dhaene, J., en Goovaerts, M. J. (2000). Upper and lower bounds for sums of random variables. Insurance: Mathematics and Economics, 27(2):151– 168. Kaas, R., Goovaerts, M., en Dhaene, J. (2009a). Modern Actuarial Risk Theory. Springer. Kaas, R., Laeven, R. J., en Nelsen, R. B. (2009b). Worst var scenarios with given marginals and measures of association. Insurance: Mathematics and Economics, 44(2):146 – 158. Kou, S. en Peng, X. (2012). Comments on the consultative document “fundamental review of the trading book” released by bank for international settlement on may 3rd, 2012. Lane, M. N. (2000). Pricing risk transfer transactions. Astin Bulletin, 30(2):259– 293. Marshall, C. en Siegel, M. (1997). Value-at-risk: Implementing a risk measurement standard. Journal of Derivatives, 4:91–110. McNeil, A., Frey, R., en Embrechts, P. (2005). Quantitative Risk Management: Concepts, Techniques, and Tools. Princeton Series in Finance. Princeton University Press. McNeil, A. J., Frey, R., en Embrechts, P. (2010). Quantitative risk management: concepts, techniques, and tools. Princeton university press. Papadimitriou, C. H. (2003). Computational complexity. John Wiley and Sons Ltd. Peter, C. (2011). Estimating loss given default: Experience from banking practice. In Engelmann, B. en Rauhmeier, R., editors, The Basel II Risk Parameters, pages 151–183. Springer Berlin Heidelberg. Peters, T. en Bloch, J. (2009a). Java 7 api sort doc. http://docs.oracle. com/javase/7/docs/api/java/util/Arrays.html#sort% 28byte[]%29. Accessed: 2014-07-19.
59
Peters, T. en Bloch, J. (2009b). Java7: Timsort code commit. http://hg. openjdk.java.net/jdk7/jdk7/jdk/rev/bfd7abda8f79. Accessed: 2014-07-19. Puccetti, G. en R¨uschendorf, L. (2012). Computation of sharp bounds on the distribution of a function of dependent risks. Journal of Computational and Applied Mathematics, 236(7):1833–1840. R¨uschendorf, L. (1982). Random variables with maximum sums. Advances in Applied Probability, pages 623–632. Schuermann, T. et al. (2004). What do we know about loss given default. Credit risk models and management, 2:1–29. Taleb, N. (1997). The world according to nassim taleb. Derivatives Strategy, 2(1):37–40. United States Supreme Court (1919). Abrams v. United States, volume 250, pages 616–630. United States Reports.
60