Over de performance van beleggingsfondsen Marno Verbeek
De populariteit van beleggingsfondsen is ongekend. Maar, in hoeverre zijn dergelijke fondsen in staat een hoger rendement te behalen dan een “doe-het-zelf” belegger met een eenvoudige strategie? En, is het zo dat relatief goede fondsen het in de toekomst ook relatief goed zullen blijven doen? Dit artikel gaat kort in op deze twee vragen en presenteert empirische resultaten die suggereren dat we beide meestal met nee moeten beantwoorden.
Inleiding Vrijwel zonder uitzondering, en gelukkig in een steeds groter lettertype, voegen beleggingsfondsen de mededeling “In het verleden behaalde resultaten bieden geen garantie voor de toekomst” toe aan hun advertenties en andere publicaties. Hoewel iedereen er inmiddels wel van is doordrongen dat de waarde van een beleggingsportefeuille kan fluctueren, bestaat er op zijn minst de suggestie dat historische resultaten wel een indicatie zijn voor de toekomst. In de wetenschappelijke literatuur wordt de vraag of er persistentie bestaat in de performance van beleggingsfondsen niet eenduidig doch meestal niet positief beantwoord. Een van de econometrische problemen die hierbij een rol spelen is het feit dat persistentie alleen ex post kan worden bepaald, terwijl achteraf een deel van de beleggingsfondsen niet meer operationeel is. Relatief slechte fondsen worden vaak al in een vroeg stadium opgeheven of samengevoegd met andere fondsen. Deze selectieve uitval kan tot vertekeningen leiden die worden aangeduid met survivorship bias of look-ahead bias. In dit artikel ga ik dieper in op deze vertekeningen en op de mogelijkheid om met eenvoudige econometrische technieken hiervoor te corrigeren. Eerst zal ik echter kort aandacht besteden aan de vraag hoe we de performance van een beleggingsfonds nu eigenlijk moeten meten. Naast een theoretische uiteenzetting wordt ook ingegaan op empirische resultaten voor de Amerikaanse markt.
Het meten van performance Een van de basisprincipes in de beleggingstheorie is dat een hoger gemiddeld rendement alleen behaald kan worden door een hoger risico te nemen. Omdat niet elke vorm van risico automatisch tot een hoger verwacht rendement leidt, proberen asset pricing modellen, zoals het CAPM, te
6 medium econometrische toepassingen
bepalen welke bronnen van risico “geprijsd” zijn, dat wil zeggen zich vertalen in een hoger verwacht rendement (zie bijv. Cochrane, 2001, voor een uitgebreide bespreking). Bij het beoordelen of vergelijken van beleggingsfondsen moeten we in elk geval rekening houden met het bijbehorende risico. Hoe dit precies gedaan moet worden hangt onder andere af van de vraag die we willen beantwoorden. De vragen “Is het verstandig mijn totale beleggingsportefeuille onder te brengen bij fonds A?” en “Is beleggingsfonds A een interessante uitbreiding op mijn huidige portefeuille?” hebben immers niet noodzakelijk hetzelfde antwoord. We beperken ons hier tot de tweede vraag. Laten we het rendement van een beleggingsfonds p in periode t weergeven met Rpt. Het risicovrij te behalen rendement wordt weergegeven met Rft. Het exces rendement is dan gedefinieerd als rpt = Rpt - Rft. Verder definiëren we het exces rendement op een goed gediversificeerde beleggingsportefeuille (bijv. de marktportefeuille) als rmt. Het is het gemakkelijkst te denken over deze portefeuille als het resultaat van een eenvoudige beleggingsstrategie die we zelf zouden kunnen volgen (bijv. een passieve1 belegging in de AEX of S&P 500 index). Beschouw nu de volgende regressievergelijking: (1)
rpt = αp + βprmt + εpt
waarin αp en βp onbekende coëfficiënten zijn. De veronderstellingen dat E{εpt} = 0 en E{εptrmt} = 0 identificeren deze coëfficiënten. In dat geval is βprmt het exces rendement op een passieve portefeuille die zoveel mogelijk gecorreleerd is met beleggingsfonds p. Het verwachte extra rendement dat beleggingsfonds p behaalt ten opzichte van deze passieve portefeuille, dus ten opzichte van een strategie die we zelf eenvoudig kunnen toepassen, wordt dan gegeven door αp.2 Indien αp = 0 voegt beleggingsfonds p niets toe aan een beleggingsportefeuille die bestaat uit een (passieve) combi-
jaargang 9 editie 3 (lustrumeditie)
natie van een risicovrije belegging en de marktportefeuille. De vraag of een fondsmanager via een actieve aandelenselectie of timingstrategie een beter gemiddeld resultaat weet te halen dan een passieve strategie (gebaseerd op een risicovrije belegging en de marktportefeuille) is dus de vraag of αp groter is dan nul. Er is trouwens geen enkele reden waarom αp niet negatief zou kunnen zijn, in welk geval het betreffende beleggingsfonds een onverstandige uitbreiding is op je passieve portefeuille.3 Een gebruikelijke manier om ex post de performance van een beleggingsfonds te bepalen is het schatten van αp met behulp van OLS op basis van een historische tijdreeks van rendementsgegevens. Wanneer je als individuele belegger al een portefeuille bezit die zoveel mogelijk correspondeert met bijv. de S&P 500 index, maar waarbij je ook een relatieve overweging toepast voor kleine ondernemingen of ondernemingen met een hoge boekwaarde/marktwaarde verhouding (B/M), kun je veelal een iets hoger gemiddeld rendement verwachten dan wanneer je “passief ” de S&P 500 zou volgen. Dat wil zeggen: een dergelijke portefeuille zal in bovenstaande regressie vaak een (licht) positieve αp opleveren. Empirisch onderzoek toont immers veelal aan dat “small cap” aandelen (met een lage marktwaarde) en “value” aandelen (met een hoge B/M) gemiddeld genomen een hoger rendement opleveren dat kan worden verklaard op basis van hun βp coëfficiënten. Laten we, in navolging van Fama en French (1993), het exces rendement definiëren op een size portefeuille als het rendement op de 10% kleinste ondernemingen minus dat op de 10% grootste ondernemingen, en soortgelijk het exces rendement op een value portefeuille als het rendement op de 10% ondernemingen met de hoogste B/M minus dat op de 10% met de laagste B/M. We geven deze exces rendementen weer als rsmb,t (“small minus big”) en rhml,t (“high minus low”). We kunnen nu het rendement op een beleggingsfonds vergelijken met dat op een passieve portefeuille samengesteld op basis van de markt, size en value, met behulp van de volgende regressie: (2)
rpt = αp + βp1rmt + βp2rsmb,t + βp3rhtm,t + εpt
De veronderstelling dat de storingsterm in dit model ongecorreleerd is voor de regressoren zorgt er wederom voor dat βp1rmt + βp2rsmb,t + βp3rhtm,t het exces rendement is op een passieve portefeuille die zoveel mogelijk gecorreleerd is met beleggingsfonds p. De constante term αp geeft derhalve het extra verwachte rendement weer van het beleggingsfonds ten opzichte van deze benchmark.4 In principe is het mogelijk bovenstaande regressie uit te breiden met additionele factoren. Hierdoor zal het steeds moeilijker worden voor een beleggingsfonds om de passieve strategie te verslaan. Carhart (1997) voegt bijvoorbeeld een vierde factor toe, gebaseerd op een momentumstrategie.5 Het model met bovengenoemde drie factoren is tegen-
jaargang 9 editie 3 (lustrumeditie)
woordig min of meer algemeen geaccepteerd en wordt het Fama-French 3-factor model genoemd. De (theoretische) interpretatie ervan staat trouwens wel ter discussie.6 Het schatten van αp voor een individueel beleggingsfonds is weliswaar eenvoudig met behulp van OLS op basis van tijdreeksgegevens, maar de onnauwkeurigheid van de schattingen is veelal groot. Dit komt doordat the meeste beleggingsfondsen een vrij korte historie hebben, terwijl de volatiliteit van de rendementen erg groot is. In econometrische termen: de steekproefperiode is kort en de variantie van de storingsterm is groot. Beide aspecten zorgen voor een grote variantie van de OLS schatter. Empirische resultaten op individueel niveau komen in grote lijnen neer op het volgende: voor meer dan 50 % (vaak wel 70%) van de fondsen wordt een negatieve schatting voor αp gevonden en voor zeer weinig fondsen is αp significant positief. Als meer factoren aan het model worden toegevoegd zijn de resultaten nog ongunstiger.
Persistentie Naast het schatten van de performance van een beleggingsfonds is het voor een individuele belegger van belang te weten in hoeverre de historische performance iets zegt over de toekomst. Stel dat we op dit moment beschikken over geschatte alpha’s over de afgelopen drie jaar voor een bepaalde groep beleggingsfondsen. Kunnen we dan verwachten dat de fondsen met een goede performance het ook goed zullen blijven doen in de toekomst? Empirisch kunnen we deze vraag natuurlijk pas ex post beantwoorden. Er zijn diverse manieren waarop de persistentie in performance geanalyseerd kan worden. Een gebruikelijke manier is de volgende. We delen de steekproefperiode op in twee sub-perioden: een “ranking” periode en een evaluatieperiode. Voor beide perioden wordt de performance geschat van de beschikbare beleggingsfondsen. Op basis van de resultaten van de ranking periode worden een indeling gemaakt in een aantal klassen. Uitgaande van een opdeling in 10 groepen, bevat deciel 1 de 10% slechtste fondsen en deciel 10 de 10% beste fondsen. Vervolgens bepalen we de gemiddelde performance over de evaluatieperiode voor alle fondsen in een gegeven deciel. Indien er positieve persistentie bestaat, verwachten we dat de fondsen uit de betere decielen gemiddeld genomen ook een betere performance hebben in de evaluatieperiode.
Uitval en look-ahead bias Zoals in de inleiding al gesteld, een empirisch probleem bij het analyseren van performance en bij de persistentie van performance in het bijzonder is het bestaan van uitval. Voor Amerikaanse fondsen is er bijvoorbeeld tussen 1989 en 1994 sprake van een uitval tussen de 2% en 9% per jaar. Meestal zijn het de fondsen die relatief slecht gescoord
medium econometrische toepassingen 7
Figuur 1: Persistentie in performance, met en zonder correctie. (gesimuleerde gegevens)
hebben die worden opgeheven of worden opgenomen in een ander fonds van dezelfde maatschappij. Dit kan leiden tot serieuze vertekeningen. Laten we voor het gemak eens uitgaan van een situatie waarin geen enkel beleggingsfonds in staat is “abnormale” rendementen te behalen, d.w.z. een situatie waarin αp nul is voor elk fonds. De fondsen verschillen wel in de hoeveelheid systematisch risico die ze nemen (de beta-coëfficiënten) en de hoeveelheid idiosyncratisch risico (de variantie van de storingsterm). Fondsen met een hoog idiosyncratisch risico hebben een relatief grote kans om een schatting voor αp te hebben die ver van het gemiddelde ligt (dat gelijk is aan nul). Met andere woorden, fondsen met een grote variantie in de ranking periode zullen met een grotere kans (meer dan 10%) terechtkomen in een van de extreme decielen (met name 1 en 10). Fondsen met een lage variantie zullen relatief vaker in de middelste decielen te vinden zijn. Vooralsnog is dit geen probleem, zolang we maar beseffen dat de relatieve positie van een beleggingsfonds in de ranking periode iets te maken heeft met het (niet-systematische) risico dat het fonds neemt. Laten we nu de evaluatieperiode in ogenschouw nemen. Binnen elk deciel nemen we dan het gemiddelde “abnormale” rendement (het steekproefgemiddelde van de geschatte αp’s). Aangezien we verondersteld hebben dat de werkelijke alfa’s allemaal nul zijn, verwachten we geen systematisch patroon in de performance zoals gemeten over de evaluatieperiode. Zoiets dus als de voorste rij staafjes in Figuur 1.7 Echter, stel nu dat fondsen die relatief slecht scoren in de ranking periode met een grotere kans verdwijnen dan andere fondsen. Omdat deze fondsen veelal een
8 medium econometrische toepassingen
hoger risico kennen betekent dit dat fondsen die in de evaluatieperiode niet zijn verdwenen gemiddeld een hoger exces rendement behaald hebben dan het gemiddelde (van nul). Immers, hoe groter de variantie, hoe meer de staart van de verdeling wordt afgekapt door de uitval. Achteraf, als we de performance in de evaluatieperiode beschouwen - noodzakelijkerwijs alleen voor de fondsen die nog bestaan betekent dit dat fondsen in de extreme decielen gemiddeld genomen een betere performance vertonen. We vinden een schijnverband dat uitsluitend te wijten is aan de selectieve uitval en niets te maken heeft met enige persistentie in de performance van de fondsen. Immers, ons uitgangspunt was dat geen enkel fonds “abnormale” rendementen wist te behalen, noch in de ranking periode, noch in de evaluatieperiode.8 De precieze vorm van het schijnverband hangt af van het uitvalproces en hoe dit samenhangt met de fondsrendementen. Hendricks, Patel en Zeckhauser (1997) presenteren een J-vorm, terwijl ter Horst, Nijman en Verbeek (2001), op basis van een empirisch geschat uitvalproces, min of meer een U-vormig verband laten zien. Dit verband is weergegeven in de tweede rij staafjes in Figuur 1.9 We zien hierin bijvoorbeeld dat de 12,5% slechtste fondsen in de 3jarige ranking periode, gemiddeld genomen een abnormaal rendement behalen in de evaluatieperiode van bijna 0,12% per kwartaal. Dit is in werkelijkheid niet zo, omdat een deel van deze 12,5% is verdwenen en deze vinden we niet terug in het gemiddelde. Hoewel over de exacte terminologie wel wat verwarring bestaat, wordt een dergelijke vertekening veelal aangeduid met “look ahead bias”. Bij het beantwoorden van de vraag of de performance in de ranking periode iets zegt over die in de evaluatieperiode hebben we immers stiekem al vooruit gekeken door alleen die fondsen te gebruiken die later blijken overleefd te hebben. Dat is informatie die we aan het eind van de ranking periode nog niet konden bezitten. Deze interpretatie maakt het ook duidelijk dat het niet triviaal is deze bias te voorkomen doordat rendementen over fondsen die niet meer bestaan per definitie nooit beschikbaar zijn. De enige manier om rekening te houden met look-ahead bias en ervoor te corrigeren is een aanpassing van de schattingsmethode.
Het elimineren van look-ahead bias In de micro-econometrische literatuur zijn twee verschillende benaderingen te vinden voor het probleem van “selection bias”, waarvan look-ahead bias een speciaal geval is. Stel dat in abstracte termen onze interesse ligt in de verdeling van een of meer variabelen y gegeven een groep variabelen x. Bijvoorbeeld de verdeling van de rendementen van een beleggingsfonds in de evaluatieperiode gegeven de ranking uit de eerste periode en eventueel gegeven andere kenmerken van het fonds (bijv. beleggingstijl). Wij zijn met andere woorden geïnteresseerd in f(y|x). In beide benadering is het nodig het uitvalproces te modelleren en te identificeren als functie van waargenomen en niet-waargenomen
jaargang 9 editie 3 (lustrumeditie)
Figuur 2: Persistentie in performance van groeifondsen 1-factor model
Figuur 3: Persistentie in performance van groeifondsen 4-factor model
variabelen (de storingsterm). De meest populaire benadering is gebaseerd op het werk van Nobelprijs-winnaar James Heckman (o.a. Heckman, 1979). Hierin wordt verondersteld dat de waargenomen variabelen in het uitvalproces ofwel onafhankelijk zijn van y (voor gegeven x) ofwel deel uitmaken van x. In bovenstaand probleem is een dergelijke benadering niet geschikt omdat uitval voor een deel bepaald zal worden door de fondsrendementen die we niet in x willen opnemen. Een alternatief, o.a. gebruikt door Fitzgerald, Gottschalk en Moffitt (1998), veronderstelt dat de niet-waargenomen variabele in het selectieproces onafhankelijk is van y, maar laat alle mogelijke waargenomen variabelen toe. Deze benadering wordt gebruikt door ter Horst, Nijman en Verbeek (2001), waarbij uitval in een gegeven kwartaal wordt gemodelleerd als functie van zoveel mogelijk rendementen uit voorafgaande kwartalen.
menten. Figuur 2 presenteert de resultaten als we kijken naar de persistentie in performance over een periode van drie jaar uitgaande van het een-factor model in (1). We zien dat groeifondsen die in de eerste sub-periode relatief slecht presteren (octiel 1-4), gemiddeld genomen in de tweede sub-periode een positieve alfa behalen van maximaal 0,4% (per kwartaal). Deze resultaten zijn gecorrigeerd voor lookahead bias. Aan de andere kant, de beste fondsen uit de eerste drie jaar, leveren gemiddeld genomen een alfa op van –0,9% per kwartaal en laten dus een duidelijke onderperformance zien.11 Wat deze resultaten betreft, is het dus geen goede strategie beleggingsfondsen te selecteren op basis van hun performance over de voorafgaande drie jaar.
Om nu te corrigeren voor de look-ahead bias, kunnen op basis van het geschatte uitvalproces (bijv. een probitmodel10) eenvoudig gewichten bepaald worden. Vervolgens wordt in de analyse elk fonds gewogen. In tegenstelling tot de meer gebruikelijke situatie waarin gewichten exogeen bepaald worden, zijn de gewichten in dit geval endogeen en hebben ze dus wel degelijk effect op de consistentie van de gebruikte schatters. Een gewogen analyse zorgt er voor dat het schijnpatroon, zoals te zien in Figuur 1, verdwijnt.
Amerikaanse beleggingsfondsen 1989-1994 Als afsluiting beschouwen we enkele empirische resultaten voor Amerikaanse beleggingsfondsen, overgenomen uit ter Horst, Nijman en Verbeek (2001). We zullen ons hier beperken tot de resultaten voor de zgn. groeifondsen. De gehanteerde ranking periode is 1989-1991, de evaluatieperiode 1992-1994. Er is gebruik gemaakt van kwartaalrendejaargang 9 editie 3 (lustrumeditie)
Indien we het model waarmee we de performance meten uitbreiden met een size, value en momentum factor, worden de resultaten over het algemeen ongunstiger. Zie hiervoor Figuur 3. Gemiddeld genomen is geen enkel octiel beleggingsfondsen in staat een hoger rendement te behalen dan een passieve portefeuille gebaseerd op de genoemde factoren. De slechtste fondsen blijven slecht in de volgende drie jaar, maar ook de initieel goede fondsen presteren ondermaats.
Afsluiting: hot hands? Gebaseerd op basketbal, waar sommige spelers in staat zijn een groot aantal maal achtereen te scoren, wordt er bij beleggingsfondsen ook wel eens gesproken over “hot hands” (zie Hendricks, Patel en Zeckhauser, 1993). Hiermee wordt dan bedoeld dat de momenteel relatief goede beleggingsfondsen in de toekomst relatief goed blijven presteren. Zoals blijkt uit bovenstaande resultaten, is hiervoor empirisch nauwelijks bewijs. Ondanks het feit dat veel fondsmanagers ons anders willen doen geloven, zeggen in het verleden behaalde resultaten maar zeer weinig over toekomst. medium econometrische toepassingen 9
Personalia Marno Verbeek is als hoogleraar ondernemingsfinanciering verbonden aan de vakgroep Financieel Management (FBK) en het Econometrisch Instituut (FEW) van de Erasmus Universiteit Rotterdam.
Noten 1.
Voor het gemak noemen we dit een passieve portefeuille. In werkelijkheid vereist het volgen van bijv. de AEX index regelmatig (kleine) aanpassingen in de portefeuillegewichten.
2.
Het is ook mogelijk vergelijking (1) te interpreteren als een implicatie van het CAPM. De veronderstelling dat het CAPM het correcte asset pricing model is impliceert dan dat de constante term gelijk is aan nul. De in de tekst gekozen interpretatie geniet de voorkeur omdat niet vereist wordt dat we weten welk asset pricing model correct is.
3.
Tenzij het mogelijk zou zijn short te gaan in dit fonds (d.w.z. met een negatief gewicht in je portefeuille op te nemen.)
4.
Hoewel de interpretatie van de constante term in de twee modellen verschillend is, gebruiken we voor het gemak dezelfde notatie. Het is gebruikelijk naar deze termen te verwijzen als “alfa’s”. In het vervolg zullen we soms ook spreken over “abnormale” rendementen.
5.
In een momentum strategie wordt relatief meer belegd in aandelen met een hoog rendement over de afgelopen (zes) maanden dan in die met een laag rendement. Men belegt dus meer in “winner stocks” dan in “loser stocks”. Zie Jegadeesh en Titman (1993).
6.
Zie bijvoorbeeld Cochrane (1999) of Campbell (2000) betreffende de vraag in hoeverre we dit model als een prijsvormingsmodel mogen beschouwen. Voor onze analyse hier is deze vraag van minder belang.
7.
De fondsen in de ranking periode zijn hier opgedeeld in acht groepen (octielen).
8.
Natuurlijk, de meeste fondsen zullen positieve of negatieve schattingen hebben voor αp. Onder onze veronderstellingen is dit uitsluitend een kwestie van geluk (c.q. pech).
9.
De figuur is gebaseerd op gesimuleerde gegevens, waarbij de data zijn gegenereerd op een wijze die dicht ligt bij de waargenomen verdeling van kenmerken van beleggingsfondsen.
10.
Voor een uitleg over probit- en verwante modellen, zie bijv. hoofdstuk 7 in Verbeek (2000).
11.
De passieve strategie, waarmee we hier impliciet de beleggingsfondsen vergelijken, vereist wel regelmatig handelen (de term “passief ” is dus niet helemaal correct) en brengt derhalve transactiekosten met zich mee. Hiermee is in de analyse geen rekening gehouden. Aan de andere kant brengen veel beleggingsfondsen instap- of uitstapkosten in rekening.
E-mail:
[email protected].
Literatuur [1] Campbell, J.Y, 2000, Asset Pricing at the Millennium, Journal of Finance, 55, 1515-1568. [2] Carhart, M.M., 1997, On Persistence in Mutual Fund Performance, Journal of Finance, 52, 57-82. [3] Cochrane, J., 1999, New Facts in Finance, Economic Perspectives (Federal Reserve Bank of Chicago), 23, 36-58. [4] Cochrane, J., 2001, Asset Pricing, Princeton University Press. [5] Fama, E.F. & K.R. French, 1993, Common Risk Factors in the Returns on Bonds and Stocks, Journal of Financial Economics, 33, 3-53. [6] Fitzgerald, J., P.Gottschalk & R. Moffitt, 1998, An Analysis of Sample Attrition in Panel Data: The Michigan Panel Study of Income Dynamics, Journal of Human Resources, 33, 251-299. [7] Heckman, J.J., 1979, Sample Selection Bias as a Specification Error, Econometrica, 47, 153-161. [8] Hendricks, D., J. Patel & R. Zeckhauser, 1993, Hot Hands in Mutual Fund Performance: Short-Run Persistence of Relative Performance, 1974-1988, Journal of Finance, 48, 93-130. [9] Hendricks, D., J. Patel & R. Zeckhauser, 1997, The J-shape of Performance Persistence given Survivorship Bias, Review of Economics and Statistics, 79, 161-170. [10] Ter Horst, J.R., Th.E. Nijman & M. Verbeek, 2001, Eliminating Look-Ahead Bias in Evaluating Persistence in Mutual Fund Performance, Journal of Empirical Finance, 8, te verschijnen. [11] Jegadeesh, N. & S. Titman, 1993, Returns to Buying Winners and Selling Losers: Implications for Stock Market Efficiency, Journal of Finance, 48, 65-91. [12] Verbeek, M., 2000, A Guide to Modern Econometrics, John Wiley and Sons, Chichester.
10 medium econometrische toepassingen
jaargang 9 editie 3 (lustrumeditie)