Departement Handelswetenschappen en Bestuurskunde
Masterproef
“Het voorspellen van de Bel20 door gebruik te maken van een Artificial Neural Network”
Maarten Geerts
Master Handelswetenschappen Afstudeerrichting Finance & Risk Management
Promotor: Stefaan Pauwels Academiejaar 2010-2011
1
2
Woord vooraf Deze masterproef vormt het sluitstuk van mijn vierjarige studie aan de Hogeschool Gent. Vier jaren die door de oudere generatie als de gelukkigste tijd van mijn leven worden bestempeld. Deze leerrijke periode, doorweven met zowel mooie als moeilijkere momenten, heeft mij tot deze masterproef geleid. Doordat de weekdagen in de tweede semester volledig aan de stage worden gewijd, is het niet gemakkelijk zo’n eindwerk op deze relatief korte tijd tot een goed einde te brengen. Daarom ben ik mijn promotor, Stefaan Pauwels, dankbaar dat hij door deadlines op te leggen mij verplichtte de literatuurstudie reeds in december af te hebben. Dit zette me aan op tijd te beginnen en op geregelde tijdstippen de verschillende delen waar deze masterproef uit is opgebouwd af te werken. Nog wil ik mijn promotor bedanken voor de steun en het advies die het mogelijk maakten een degelijke masterproef af te leveren.
3
4
Abstract
Er is heel wat literatuur te vinden waarin wordt getracht de aandelenmarkt te voorspellen. Financieel voordeel is hiervoor de voornaamste reden, maar het succesvol voorspellen van de aandelenmarkt kan ook de Efficiënte Markt Hypothese verwerpen. Internationaal is er reeds heel wat onderzoek gedaan waarin wordt getracht het toekomstig verloop van aandelenkoersen in kaart te brengen en dit met wisselende resultaten. Het betreft hier echter veelal de S&P500 en andere wijdbekende aandelenindices, terwijl onderzoek m.b.t. de Bel20 zeer beperkt is. Uit bestaande literatuur en theorieën werden de meest relevante macroeconomische factoren met een invloed op de aandelenmarkt gedistilleerd, om vervolgens d.m.v. een Artificial Neural Network de aandelenrendementen van de Bel20 te voorspellen. Na de ANN-analyse van een uitgebreide dataset komen we tot de vaststelling dat 57,27% van de voorspellingen correct zijn, wat de stelling van de voorspelbaarheid van aandelenrendementen bevestigt. Dit heeft tevens voor gevolg dat theorieën die stellen dat de aandelenmarkt een willekeurig verloop kent en onmogelijk is te voorspellen, worden tegengesproken. Hoewel het voorspellen van de beursgang een moeilijke taak zal blijven door de vele factoren die een invloed hierop uitoefenen, concluderen we dat het aandelenrendement van de Bel20 wel degelijk kan voorspeld worden op basis van historische en vrij beschikbare data.
5
6
Inhoudstafel Woord vooraf
3
Abstract
5
Inhoudstafel
7
1. Introductie
9
2. Literatuur
11
2.1. Methode 2.2. Inputvariabelen 2.3. Outputvariabele 2.4. Conclusie 3. Data en methode
11 15 19 21 23
3.1. Outputvariabele 3.2. Inputvariabelen 3.3. Onderzoek 4. Resultaten
23 23 26 31
5. Conclusie
37
6. Referenties
39
6.1. Geraadpleegde werken 6.2. Lijst van gebruikte figuren 6.3. Lijst van gebruikte tabellen 7. Bijlagen
39 41 41 43
7.1. Bijlage 1: Gewichten van het model met data van een dag vóór de voorspelde dag 43 7.2. Bijlage 2: Gewichten van het model met data van drie dagen vóór de voorspelde dag 44
7
8
1. Introductie Het ogenschijnlijk willekeurig verloop van de beurskoersen, de onverwachte crashes die niemand zag aankomen, de grote winsten die met beleggen in aandelen kunnen behaald worden, ze dragen allemaal bij tot de drang om de aandelenmarkt te voorspellen. En alhoewel de Efficiënte Markt Hypothese volhoudt dat de beursgang niet te voorspellen is, zijn er toch ook enkele successen op dit vlak geboekt (Thawornwong & Enke, 2003). Heel wat auteurs (Lawrence, 1997; Kutsurelis, 1998; Chen, Leung & Daouk, 2003; Huang, Keung Lai, Nakamori, Wang & Yu, 2007; Leigh, Hightower & Modani, 2005) zijn overtuigd van de superioriteit van Artificial Neural Networks t.o.v. andere methoden zoals technische analyse, fundamentele analyse en regressie om aandelenrendementen te voorspellen en schuiven tal van voordelen van deze techniek naar voor. Het is dan ook deze methode die gebruikt wordt in dit onderzoek. Hoewel de meningen over welke variabelen te gebruiken om de aandelenmarkt te voorspellen verschillen tussen auteurs, zijn er toch variabelen die geregeld terugkomen in de verscheidene onderzoeken. In het onderzoek van Thawornwong en Enke (2003) bleken vooral de term structure van interestvoeten en kortetermijninterestvoeten zeer relevant, evenals de Consumer Price Index en de M1-geldhoeveelheid. Reeds veel onderzoek is gedaan naar het voorspellen van wijdbekende aandelenindices, zoals de S&P500, maar onderzoek naar de Bel20 is echter beperkt. Het is interessant de variabelen en methode die succesvol bleken in eerdere studies ook op deze markt toe te passen. De meest voor de hand liggende variabele om te voorspellen is de effectieve waarde van de Bel20, maar uit het literatuuronderzoek is gebleken dat het voorspellen van de return een betere manier van werken is (Kalyvas, 2001). Ook worden betere resultaten verwacht indien het de richting van die return zou zijn die we voorspellen i.p.v. de waarde zelf (Chen, Leung & Daouk, 2003; Tilakaratne, Morris, Mammadov & Hurst, 2007). 9
Uit de ANN-analyse van een uitgebreide dataset met dagelijkse data over de periode van 2002 t.e.m. 2010 concluderen we dat 57,27% van de voorspellingen correct zijn. Dit betekent dat dit model nuttig is en theorieën die voorspellingen over de aandelenmarkt onmogelijk achten, in twijfel worden getrokken. Het onderstaande onderzoek is georganiseerd als volgt; in het eerste deel wordt het reeds gerealiseerde onderzoek en de relevante literatuur besproken. Daarin wordt vooral aandacht besteed aan de te gebruiken methode, de inputvariabelen en de te voorspellen outputvariabele. Het tweede deel is gewijd aan de data en de methode die is aangewend, om vervolgens tot de resultaten van het onderzoek te komen die ik zal bespreken in het derde deel. Deze masterproef eindigt met een conclusie die het vierde deel uitmaakt.
10
2. Literatuur Er is heel wat literatuur te vinden waarin wordt getracht de aandelenmarkt te voorspellen. Hier zijn dan ook goede redenen voor. Lawrence (1997) en Kalyvas (2001) geven in hun studies aan dat financieel voordeel de voornaamste reden is, maar erin slagen de aandelenmarkt succesvol te voorspellen, heeft ook een meer wetenschappelijk verantwoord motief. Zo zou het debat over de validiteit van de Efficiënte Markt Hypothese (EMH) voor eens en voor altijd kunnen worden afgesloten. Fama (1970) gelooft immers dat de aandelenmarkt efficiënt is en dat telkens er nieuwe informatie beschikbaar is, de markt zich onmiddellijk hieraan aanpast en er dus geen ruimte is voor voorspellingen. De aandelenmarkt zou een volledig willekeurig en onvoorspelbaar pad, een ‘random walk’, volgen (Malkiel, 1973). Wanneer iemand er dus in slaagt succesvolle voorspellingen te doen, kan deze theorie worden verworpen. In de literatuur is er dus twijfel of de aandelenmarkt wel kan voorspeld worden (Kalyvas, 2001; Zhang, Patuwo & Hu, 1997; Adya, & Collopy, 1998). Thawornwong & Enke (2003) vinden in hun literatuuronderzoek echter genoeg onderzoeken waarin wordt aangetoond dat aandelenrendementen voorspelbaar zijn door middel van publiek beschikbare informatie zoals tijdreeksdata over financiële en economische variabelen.
2.1. Methode Op de vraag hoe dit voorspellen van de aandelenmarkt dan precies zou moeten gebeuren, is ook geen eenduidig antwoord te vinden in de literatuur. Lawrence (1997) o.a. geeft in zijn werk een opsomming van veel gebruikte technieken. 1. Technische analyse gaat ervan uit dat de geschiedenis zich herhaalt en dat er patronen en trends kunnen worden ontdekt in het gedrag van beleggers door grafieken te analyseren.
11
2. Fundamentele analyse onderzoekt de onderneming en probeert de intrinsieke waarde van de aandelen te doorgronden. Hier wordt ervan uitgegaan dat beleggers rationeel handelen en dat op lange termijn de waarde van de onderneming ook in zijn aandelenprijs zal weerspiegeld worden. 3. Een derde techniek zijn de statistische methodes en regressies die eerder gedrag van de aandelenmarkt proberen te vatten in vergelijkingen om de toekomstige waarden te voorspellen. 4. Ten slotte wordt ook nog de ‘Chaos theory’ naar voor geschoven. Hier vertrekt men van de gedachte dat de data niet-lineair zijn en op het eerste zicht volledig willekeurig lijken. ANN’s worden hier als oplossing geöpperd om chaotische systemen te modelleren. In de reeds bestaande literatuur, wordt de aandacht toch wel getrokken door de methode die gebruik maakt van Artificial Neural Networks om de aandelenmarkt te voorspellen. Wat ANN’s zo interessant maakt t.o.v. andere technieken, is dat ANN’s geen a priori assumpties behoeven in het modelleringsproces. ANN’s leren, op basis van data, de relaties die tussen de variabelen bestaan. Deze techniek is in staat niet-lineaire modellen op te stellen zonder voorafgaande kennis over de relaties tussen de inputvariabelen en de outputvariabelen. Deze eigenschap maakt ANN’s zeer interessant om toe te passen op de financiële markten, waar veel wordt verondersteld, maar weinig is geweten over het proces van het tot stand komen van aandelenprijzen (Thawornwong & Enke, 2003). Zhang, Patuwo & Hu (1997), Huang, Keung Lai, Nakamori, Wang & Yu (2007) geruggesteund door Hill, Marquez, O'Connor, & Remus (1994) brengen nog enkele voordelen van deze techniek aan. Zo stellen zij dat ANN’s kunnen generaliseren. Dit betekent dat ze uit een dataset toekomstige waarden kunnen afleiden, ook al bevat deze data veel ‘noise’. Verder kunnen ANN’s elke mogelijke functie aannemen die de data het best benadert, terwijl de klassieke statistische technieken dikwijls beperkt zijn in hun schattingen door de complexiteit van het onderzochte systeem. Ten slotte zijn ANN’s niet-lineair. Omdat klassieke statistische methoden van lineariteit uitgaan,
12
kan dit tot inferieure conclusies leiden bij niet-lineaire mechanismen. Kutsurelis (1998) voegt hier nog aan toe dat bij regressie-analyses de belegger al een diep inzicht in de statistiek moet hebben om de relevante onafhankelijke variabelen eruit te halen. Dit is bij ANN’s veel minder het geval. De hierboven opgesomde voordelen lijken allemaal zeer belovend, maar er zijn ook beperkingen aan de superieure werking van ANN’s. Zhang, Patuwo & Hu (1997) en Hill, Marquez, O’Connor & Remus (1994) argumenteren dat ANN’s nietlineaire methoden zijn. In het geval dat het onderzochte systeem lineair is met weinig verstoringen, dan zouden lineaire methoden wel eens betere resultaten kunnen opleveren. Een tweede probleem is de moeilijkheid om de resultaten te interpreteren. Dit, omdat deze methode geen expliciete vorm van de relatie tussen de input- en outputvariabelen oplevert, aan de hand waarvan deze relaties kunnen worden verklaard en geanalyseerd. Daarnaast zouden ANN’s ook gevoelig zijn aan ‘overfitting problems’. Dit probleem doet zich voor wanneer de ANN er niet in slaagt te generaliseren en eerder de ‘noise’ beschrijft in plaats van de onderliggende relatie. Dit probleem is vaak het gevolg van de aanwezigheid van vele parameters in verhouding tot het aantal data. Als dit de methode is die ik in mijn onderzoek wil gebruiken, zal ik dus moeten zorgen dat er genoeg data beschikbaar zijn. Daarmee belanden we bij een volgend probleem, nl. dat ANN’s meestal meer data vergen dan klassieke statistische methoden en dus meer computertijd. Ook wordt gewezen op het feit dat ANN-methodologie en modelleertechnieken snel veranderen en verbeteren. Daardoor heerst er veel onduidelijkheid over welke netwerkstructuur nu het best geschikt is voor een ANN om een systeem te benaderen. De meeste van deze problemen zijn echter niet onoverkomelijk. Mills (1991), Thawornwong & Enke (2003) en Pérez-Rodriguez, Torra, & Andrada-Félix (2005) stellen allereerst dat er geen bewijs is dat de relatie tussen aandelenrendementen en financiële en economische variabelen lineair is. Aangezien er aanzienlijke residuele variantie van het werkelijk aandelenrendement t.o.v. de voorspelde rendementen op de regressielijn is, is het goed mogelijk dat dit beter te verklaren is door niet-lineaire modellen. Een ANN is dus een goede methode als we deze 13
rendementen zouden willen voorspellen. Het probleem van de interpretatie van de resultaten, zal ik oplossen door enkel variabelen op te nemen waarvoor verder in deze literatuurstudie theoretische motivering wordt gegeven. Daarnaast, zoals hierboven reeds gesteld, zal ik over voldoende data moeten beschikken om het ‘overfitting’-probleem te voorkomen. De beperkingen die samenhangen met de methodologie en modelleertechnieken zouden ten slotte ook geen hindernis voor mijn onderzoek mogen vormen, aangezien in de literatuur verscheidene studies voor handen zijn die de aandelenmarkt succesvol voorspellen door gebruik te maken van een ANN (Adya & Collopy, 1998; Kutsurelis, 1998; Chen, Leung & Daouk, 2003; Thawornwong & Enke, 2003; Leigh, Hightower & Modani, 2005; Pérez-Rodriguez, Torra & Andrada-Félix, 2005). We weten nu welke voor- en nadelen ANN’s hebben ten opzichte van andere statistische methoden en dat tal van auteurs stellen dat het voorspellen van aandelenrendementen met deze methode zeer goed mogelijk is. De volgende vraag is of een ANN nu betere resultaten oplevert dan de klassieke statistische methoden. Kalyvas (2001) probeerde in zijn onderzoek de dagelijkse ‘excess returns’ van de FTSE500- en de S&P500-index te voorspellen a.d.h.v. de respectieve ‘Treasury Bill rate returns’, gebruikmakende van een ANN. Hij kwam echter tot de conclusie dat zijn model geen betere resultaten opleverde dan enkele naïve voorspellers, zoals o.a. het Random walk-model. Het feit dat hij enkel de T-bill rates gebruikte als inputvariabele om de aandelenrendementen te voorspellen, kan echter een reden zijn voor de slechte prestatie van zijn model. Ook Hill, Marquez, O'Connor & Remus (1994) kwamen tot de conclusie dat ANN’s vergelijkbaar zijn met andere statistische methoden, maar geloven wel in het potentieel van ANN’s, gegeven dat er verder en grondiger onderzoek wordt verricht. Dat er potentieel zit in het gebruik van ANN’s, wordt bewezen in de meerderheid van de studies die handelen over het voorspellen van de aandelenmarkt met behulp van deze techniek. Lawrence (1997) vergelijkt de eerder in dit literatuuronderzoek genoemde technieken, zoals technische analyse, fundamentele analyse en regressie met het ANN. Alhoewel de voorspellingen niet perfect zijn, stelt hij wel dat ANN’s betere 14
resultaten opleveren dan alle andere methoden en toekomst bieden in het voorspellen van de aandelenmarkt. Andere auteurs erkennen de superioriteit van ANN’s ten opzichte van andere methodes en treden hem hierin bij (Kutsurelis, 1998; Chen, Leung & Daouk, 2003; Huang, Keung Lai, Nakamori, Wang & Yu, 2007; Leigh, Hightower & Modani, 2005).
2.2. Inputvariabelen Over welke
inputvariabelen zouden moeten worden gebruikt
om
de
aandelenmarkt te voorspellen zijn de meningen van verschillende auteurs verdeeld. Toch zijn er enkele variabelen die geregeld terugkomen in de verscheidene onderzoeken. Hieronder geeft een tabel weer welke variabelen het meest worden aangehaald in de literatuur.
N° Inputvariabele 1
Aandelenindices
Literatuur voor Lawrence (1997), Kutsurelis (1998)
verschillende sectoren 2
Internationale/invloedrijke
Lawrence
(1997),
Huang,
Keung
Lai,
aandelenindices
Nakamori, Wang & Yu (2007), Tilakaratne, Morris, Mammadov, & Hurst (2007)
3
Goudprijs
Lawrence (1997), Kutsurelis (1998)
4
Wisselkoersen
Lawrence
(1997),
Huang,
Keung
Lai,
Keung
Lai,
Nakamori, Wang & Yu (2007) 5
Interestvoeten
Lawrence
(1997),
Huang,
Nakamori, Wang & Yu (2007), Chen, Leung & Daouk (2003), Leigh, Hightower & Modani (2005), Thawornwong & Enke (2003) 6
Historische
Lawrence
(1997),
Huang,
Keung
Lai,
aandelenprijzen/returns
Nakamori, Wang & Yu (2007), Chen, Leung & Daouk (2003), Leigh, Hightower & Modani (2005), Thawornwong & Enke (2003), Pérez-
15
Rodriguez, Torra, & Andrada-Félix (2005)
7
Olieprijs
Kutsurelis
(1998),
Huang,
Keung
Lai,
Nakamori, Wang & Yu (2007) 8
Inflatie/Consumer Price Index Huang, Keung Lai, Nakamori, Wang & Yu (2007), Chen, Leung
& Daouk
(2003),
Thawornwong & Enke (2003) 9
Veranderingen
in
aggregate productie
de Huang, Keung Lai, Nakamori, Wang & Yu (2007), Chen, Leung
& Daouk
(2003),
Thawornwong & Enke (2003) 10 Consumptieniveau
Huang, Keung Lai, Nakamori, Wang & Yu (2007), Chen, Leung & Daouk (2003)
11 BBP/BNP
Huang, Keung Lai, Nakamori, Wang & Yu (2007), Chen, Leung & Daouk (2003)
12 Monetaire groei
Thawornwong & Enke (2003)
13 Term structure
Thawornwong & Enke (2003), Huang, Keung Lai, Nakamori, Wang & Yu (2007), Chen, Leung & Daouk (2003)
14 Verhandeld volume
Huang, Keung Lai, Nakamori, Wang & Yu (2007), Leigh, Hightower & Modani (2005)
Tabel 1 : Inputvariabelen in de literatuur
De ‘Term structure’ van interestvoeten is de spread tussen langetermijnobligaties en kortetermijnobligaties. Huang, Keung Lai, Nakamori, Wang & Yu (2007) en Chen, Leung & Daouk (2003) stellen dat deze variabele kan gebruikt worden om de aandelenrendementen
te
voorspellen,
omdat
ze
samenhangt
met
de
conjunctuurcyclus. De term structure is laag in de conjunctuurpieken en hoog in de dalen van de conjunctuur. Dit feit, samen met het bewijs uit het verleden dat aandelenindices lager zijn tijdens recessies, leidt ertoe aan te nemen dat de term spreads enige voorspellende waarde kunnen hebben. Dit doordat een grote term spread een mogelijke economische groei in de toekomst kan aangeven, die hogere aandelenrendementen met zich meebrengt. 16
Huang, Keung Lai, Nakamori, Wang & Yu (2007), Leigh, Hightower & Modani (2005)
en
Chen,
Leung
&
Daouk
(2003)
argumenteren
dat
de
kortetermijninterestvoeten ook mee fluctueren met de economische conjunctuur. T-bill rates zijn lager in economische slechte periodes en vooral in de keerpunten, net voor de heropleving. Op die manier zijn de T-bill rates geschikt om toekomstige economische groei aan te kondigen. Net als de term structure, kan de kortetermijninterestvoet gezien worden als een indicator van het toekomstige niveau
van
de
economie
en
zo
indirect
ook
van
de
toekomstige
aandelenrendementen. Verder vonden Thawornwong & Enke (2003) dat ook de ‘certificates of deposit rates’ zeker niet mogen ontbreken als inputvariabele. In hun studie bleken dit namelijk zeer relevante variabelen te zijn. Hiermee worden de rentevoeten op depositocertificaten bedoeld. De
historische
aandelenrendementen
worden
dikwijls
opgenomen
als
inputvariabele in eerder uitgevoerde studies om te zien of deze enige informatie bezitten die bruikbaar is om toekomstige rendementen te voorspellen (Chen, Leung & Daouk, 2003). Huang, Keung Lai, Nakamori, Wang & Yu (2007) vonden in eerdere literatuur ook het bewijs dat het weglaten van deze historische rendementen (lagged stock returns) kan leiden tot misleidende resultaten en daarom moeten worden opgenomen. Een volgende verklarende variabele die wordt aangehaald is de monetaire groei. In een artikel zet Maskay (2007) twee theorieën die de invloed van de geldhoeveelheid op aandelenprijzen zouden kunnen verklaren tegenover elkaar. Enerzijds is er de theorie van Sellin (2001) die argumenteert dat een stijging van de geldhoeveelheid ertoe zal leiden dat mensen een strakker monetair beleid in de toekomst verwachten. De hoge vraag voor obligaties die dat met zich meebrengt, zal vervolgens de interestvoet doen stijgen. Hierdoor stijgt de discontovoet waardoor de verdisconteerde toekomstige cashflows (en dus ook de aandelenprijzen) dalen. In deze theorie wordt ook gesteld dat de economische activiteit zal dalen door de hogere interestvoeten, wat de andelenprijzen nog verder naar beneden haalt. 17
Anderzijds, is er de theorie van de ‘real activity economists’. Hier gaat men ervan uit dat een wijziging van het geldaanbod informatie bevat over de geldvraag die wordt geïnitieerd door de toekomstige outputverwachtingen. Een stijging van het geldaanbod houdt dan een stijging van de geldvraag in, wat op die manier een verwachte
hogere
economische
activiteit
signaleert
en
dus
hogere
aandelenprijzen. Deze laatste theorie haalde de bovenhand t.o.v. die van Sellin (2001) in het onderzoek van Maskay (2007). De overheidsconsumptie, de private consumptie, het BBP, het BNP, de Consumenten Prijs Index en de industriële productie worden ook naar voor geschoven
als
variabelen
die
informatie
over
de
toekomstige
aandelenrendementen zouden kunnen bevatten. Chen, Leung & Daouk (2003) zijn echter niet zeker of deze variabelen positief of negatief gecorreleerd zijn met deze toekomstige rendementen. Ze stellen dat als deze inputvariabelen de huidige economische toestand benaderen, ze negatief gecorreleerd zullen zijn. Als ze echter de toekomstige groei van de economie uitdrukken, zouden ze positief gecorreleerd zijn. Alhoewel in enkele onderzoeken (Lawrence, 1997; Kutsurelis, 1998) de goudprijs ook als variabele wordt opgenomen, blijkt uit een masterproef van vorig jaar (Peeters, 2010) dat de correlatie tussen de goudprijs en aandelenindices tegen de nul aanleunt. Vermits er geen verband met de aandelenmarkt wordt vastgesteld, wordt de goudprijs niet als variabele opgenomen. Tevens worden wisselkoersen en olieprijzen nog genoemd als variabelen die een impact hebben op aandelenprijzen (Huang, Keung Lai, Nakamori, Wang & Yu, 2007). Phylaktis en Ravazzolo (2005) stellen in hun werk dat wijzigingen van de wisselkoersen de internationale handelsposities veranderen en bijgevolg de output van de betrokken landen. Dit zal een weerslag hebben op de huidige en toekomstige inkomsten van bedrijven en hun aandelenkoersen. Nandha en Faff (2008) vinden in hun onderzoek argumenten dat de olieprijs een negatieve impact heeft op aandelenrendementen in alle sectoren, behalve in de mijn-, de olie- en de gassector. De reden waarom zoveel sectoren invloed 18
ondervinden van de olieprijzen, ligt volgens hen bij het feit dat olie veel bijproducten heeft die gebruikt worden in zelfs schoenen en shampoo. Vervolgens stellen ze dat hogere olieprijzen een effect hebben op de interestvoeten en het consumentenvertrouwen schaden, wat indirect leidt tot lagere aandelenkoersen. Rault en El Hedi Arouri (2009) leggen het effect van olieprijzen op de aandelenmarkt uit door er op te wijzen dat de waarde van aandelen gelijkstaat aan de verdisconteerde som van de toekomstige cash flows. Deze cash flows wijzigen door macro-economische factoren die door olieprijswijzigingen worden beïnvloed. Ten slotte wordt het verhandelde volume ook als een mogelijke verklarende variabele aangehaald in de ‘mixture-of-distributions’-theorie (Leigh, Hightower & Modani, 2005). Deze theorie zegt dat aandelenprijzen en het verhandelde volume worden beïnvloed door hetzelfde ‘nieuws’. ‘Goed nieuws’ zal aandelenprijzen doen stijgen, terwijl ‘slecht nieuws’ deze prijzen zal doen dalen. Beide gevallen worden vergezeld met een hoger verhandeld volume, omdat beleggers de impact van het nieuws verschillend inschatten.
2.3. Outputvariabele De meest voor de hand liggende outputvariabele die we zouden kunnen voorspellen, is natuurlijk de toekomstige aandelenprijs zelf. Maar Kalyvas (2001) stelt dat het beter is te werken met aandelenrendementen, aangezien deze een beperkter bereik hebben dan de eigenlijke prijzen. Verder redeneert Kalyvas (2001) dat het realistischer is gebruik te maken van ‘excess returns’. Hij gaat ervan uit dat als een belegger zijn kapitaal niet in de aandelenmarkt stopt, hij op zijn minst de voordelen van de obligatiemarkt geniet. De excess return wordt dan berekend als de return verminderd met de return van de T-bill. Daarnaast wijzen Chen, Leung & Daouk (2003) en Tilakaratne, Morris, Mammadov & Hurst (2007) erop dat recente studies hebben aangetoond dat het voorspellen van de richting van aandelenprijzen effectiever zou zijn. Ook thawornwong & Enke (2003) werken in hun onderzoek met het voorspellen van de richting van de prijsverandering in plaats van de eigenlijke waarde.
19
Aangezien het de Belgische aandelenmarkt is die zal onderzocht worden in deze masterproef, is het goed even te kijken naar gelijkaardig onderzoek betreffende de bel20-index. Er is aan de Hogeschool Gent reeds een masterproef geschreven over het effect van macro-economische factoren op bel20-aandelen, maar hier werd er gebruik gemaakt van een meervoudige regressie-analyse (Vanheuverzwijn, 2008). Vanheuverzwijn nam 5 macro-economische variabelen op die we ook al in eerdere studies tegenkwamen (wisselkoersen, olieprijs, inflatie, rentevoet en industriële productie) en een dummy-variabele die aangaf of het de periode voor de kredietcrisis betrof of die erna. In dit model werd er gewerkt met maandelijkse data over een periode van 10 jaar en er werd geconcludeerd dat het een verklarende kracht had van 12,4%. Dit lage percentage wordt in deze studie verklaard door de bedrijfsspecifieke factoren en de beursmalaise ten gevolge van 11 september 2001. Zoals uit de literatuur die hierboven al werd besproken bleek, zou dit lage percentage echter veeleer te wijten kunnen zijn aan het feit dat er van een lineair model gebruik werd gemaakt. De relatie tussen de aandelenmarkt en economische en financiële variabelen zou beter met niet-lineaire modellen worden benaderd (Mills, 1991, Thawornwong & Enke, 2003 en Pérez-Rodriguez, Torra, & Andrada-Félix, 2005). Lendasse, De Bodt, Wertz, & Verleysen (2000) trachtten in hun onderzoek met een Neural Network het teken van de variatie van de bel20-index te voorspellen met dagelijkse data over een periode van 10 jaar. Ook hier werden inputvariabelen gebruikt die eerder in de literatuur al werden aangetroffen (internationale aandelenindices, wisselkoersen, interestvoeten en historische aandelenprijzen). Hun onderzoek besluit succesvol met correcte voorspellingen van de richting van de aandelenmarkt van 57,2%.
20
2.4. Conclusie In het licht van de hierboven besproken literatuur kunnen we stellen dat de overgrote meerderheid van de auteurs de vraag of aandelenrendementen kunnen worden voorspeld, bevestigend beantwoordt. Ook in de methode waarmee die voorspelling dan zou moeten gebeuren, is er een algemene tendens te bespeuren. Het onderzoek van Adya & Collopy (1998) is maar één voorbeeld waarin de superioriteit van een Neural Network t.o.v. andere technieken naar boven komt. Het gebruik van een ANN in deze masterproef is dus aangewezen. Verder, vinden we in dit literatuuronderzoek ook argumenten voor de te gebruiken inputvariabelen. Naast enkele veel voorkomende variabelen die werden aangetroffen doorheen de verschillende studies, bleken in het werk van Thawornwong & Enke (2003) vooral de interestvoeten, de geldhoeveelheid en de CPI zeer relevant te zijn in het voorspellen van aandelenrendementen. Ten slotte werd ook de te voorspellen outputvariabele uit eerdere literatuur duidelijk. In plaats van de effectieve waarde van de Bel20 te voorspellen, wordt er beter met aandelenrendementen gewerkt. Ook worden er betere resultaten verwacht als we de richting van deze rendementen zouden voorspellen i.p.v. de waarde zelf.
21
22
3. Data en Methode 3.1. Outputvariabele De meest voor de hand liggende outputvariabele voor het voorspellen van de Bel20 zou de effectieve waarde van de aandelenkoers zijn. Uit het bovenstaande literatuuronderzoek is echter gebleken dat het voorspellen van de return 1 een betere manier van werken is en dat betere resultaten verwacht worden indien het de richting van die return zou zijn die we voorspellen i.p.v. de waarde zelf. In dit onderzoek krijgt de variabele de waarde ‘1’ toegekend als de return positief is, terwijl een negatieve return wordt aangeduid met ‘-1’. Via Datastream vindt men deze data door de Price Index van de Bel20 (BGBEL20) te downloaden.
3.2. Inputvariabelen De term structure van interestvoeten : Hiermee wordt de spread tussen de langetermijnobligaties en de kortetermijnobligaties bedoeld. Huang, Keung Lai, Nakamori, Wang & Yu (2007) en Chen, Leung & Daouk (2003) stellen dat deze variabele een voorspellende waarde kan hebben doordat een grote term spread een mogelijke economische groei in de toekomst kan aangeven, die hogere aandelenrendementen met zich meebrengt. De kortetermijninterestvoeten : Deze nemen meestal de vorm aan van de rentevoeten van T-bills. Net als de term structure, kan de kortetermijninterestvoet gezien worden als een indicator van het toekomstige niveau van de economie en zo
indirect
ook
van
de
toekomstige
aandelenrendementen.
Alhoewel
Thawornwong & Enke (2003) vonden dat de ‘certificates of deposit rates’ zeker niet mochten ontbreken als inputvariabele, neem ik deze niet op in mijn onderzoek. Een depositocertficaat is een variante van de kasbon. Het gaat om een 1
Return = (P1 – P0)/P0 , waarbij P0 staat voor de prijs van de Bel 20 op het huidige tijdstip en P 1 voor de prijs op de volgende dag.
23
gelijkaardige belegging, maar op een kortere looptijd, normaal minder dan een jaar2. De rentevoeten van deze effecten zullen dus nauw verwant zijn met die van de T-bills en maakt deze dus overbodig. De historische aandelenrendementen : Deze zullen in het onderzoek worden opgenomen door de lag van de outputvariabele als input te nemen. Huang, Keung Lai, Nakamori, Wang & Yu (2007) vonden in eerdere literatuur het bewijs dat het weglaten van deze historische rendementen kan leiden tot misleidende resultaten en daarom moeten worden opgenomen. Olieprijs : De prijs van olie heeft een grote invloed op de Belgische economie. Vergeleken met de andere landen van het eurogebied is België zeer gevoelig voor olieprijsschommelingen. Dit wordt vooral verklaard door de grote energiebehoefte van België en zijn afhankelijkheid van het buitenland inzake energie (NBB, 2010). Wisselkoersen : Sinds de invoering van de eenheidsmunt in de eurozone, spelen de wisselkoersen een veel minder belangrijke rol voor de Belgische economie, aangezien zijn belangrijkste handelspartners binnen de eurozone liggen. De VS blijft echter de belangrijkste ‘buitenlandse’ handelspartner van België 3 en omdat de olieprijzen in dollar worden uitgedrukt, is het interessant de wisselkoers van de dollar t.o.v. de euro in het onderzoek op te nemen. Internationale aandelenindices : De economie van België is niet geïsoleerd van de buitenwereld, integendeel, ze is er erg afhankelijk van. Zoals eerder reeds werd aangehaald, zijn de belangrijste handelspartners 4 van België de buurlanden, nl. Duitsland, Frankrijk en Nederland. Om deze reden zal de economische situatie van de buurlanden ook gevolgen hebben voor België. Het is daarom interessant de beurskoersen van Duitsland (DAX), Frankrijk (CAC 40) en Nederland (AEX) als inputvariabelen in het onderzoek op te nemen. Omdat de Verenigde Staten de belangrijkste handelspartner buiten de EU is en een economische grootmacht, 2
Test-Aankoop : http://www.test-aankoop.be/invest/depositocertificaat-s292860.htm
3
http://www.state.gov/r/pa/ei/bgn/2874.htm
4
http://www.state.gov/r/pa/ei/bgn/2874.htm
24
vormt ook de S&P500 een inputvariabele. Verder is het ook opportuun de Japanse beursindex (Nikkei 225) op te nemen. Aangezien de Japanse beurs vroeger opent dan de beurs van Brussel, zou deze mogelijks een invloed op de Bel20 kunnen hebben. Net als bij de outputvariabele zal bij deze aandelenindices de richting van de return als inputvariabele dienen. ‘1’ duidt op een positieve return en ‘-1’ op een negatieve. De opzet van dit onderzoek vereist heel wat financiële en economische data, wat het bijna noodzakelijk maakt te werken met dagelijkse data. Om die reden worden enkele inputvariabelen die in de literatuur worden aangeraden niet opgenomen in het onderzoek. Voor de variabelen overheidsconsumptie, private consumptie, BBP, CPI, industriële productie en geldhoeveelheid zijn immers geen dagelijkse data beschikbaar. De nodige data, zoals hierboven uiteengezet, heb ik via de databank van Thomson Reuters Datastream opgehaald. De periode waarop de data betrekking hebben, strekt zicht uit van 04/02/2002 t.e.m. 30/09/2010. Over deze periode werden dagelijkse data verzameld over de hoger besproken inputvariabelen. Deze tijdspanne met data van 2259 dagen is voldoende groot en biedt genoeg data voor een betrouwbare analyse. Met de inputvariabelen van tijdstip t wordt d.m.v. een Neural Network de outputvariabele op tijdstip t + 1 voorspeld. Wat verder in het onderzoek worden ook de data van de tijdstippen t – 1 en t – 2 opgenomen. Omdat de onderzochte periode de crisis omvat, die een stijlbreuk inhoudt in het verloop van de bel20, zal ik ook een dummyvariabele opnemen die aangeeft of het data van voor of na de crisis betreft. Al de data voor 23/05/2007 (hoogste punt van de Bel20) krijgen een dummyvariabele 0, de anderen krijgen een dummyvariabele 1.
25
In de onderstaande tabel vindt u de specifieke beschrijving van de data die verder in deze masterproef zijn gebruikt. Variabele
Beschrijving
Naam
DS Code
Term structure
LT-rentevoet –
Belgium Benchmark
BGBRYLD
KT-rentevoet
Bond 10Y
KT-rentevoeten
Belgium T-bill 1 Month
BGTBL1M
T-bill
Belgium Treasury Bill 3
BGTBL3M
rentevoeten
Month Belgium Treasury Bill 6
BGTBL6M
Month Historisch
Return bel20
Bel20 index (-1)
BGBEL20
Wisselkoers
US $ to euro (ECB)
USECBSP
Crude oil-Brent Dated
OILBRNP
aandelenrendement Wisselkoers
dollar-euro Olieprijs
Free on Board U$/Barrel Internationale indices
Return
France CAC 40
FCCAC40
DAX 30 Performance
DAXINDX
AEX Index (AEX)
AMSTEOE
beursindex Frankrijk Return beursindex Duitsland Return beursindex Nederland
26
Return
Nikkei 225 stock
beursindex Japan
average
Return
S&P 500 Composite
JAPDOWA
S&PCOMP
beursindex VS Tabel 2 : Gebruikte inputvariabelen
3.3. Onderzoek Uit het literatuuronderzoek is gebleken dat voor het voorspellen van aandelenrendementen het best wordt gewerkt met een Artificial Neural Network. Hieronder worden de redenen nog eens kort samengevat; 1. ANN’s behoeven geen a priori assumpties in het modelleringsproces. 2. ANN’s kunnen generaliseren. 3. ANN’s kunnen elke mogelijke functie aannemen. 4. ANN’s zijn niet-lineair. 5. ANN’s behoeven geen diep inzicht in de statistiek. Voor het bekomen van de hieronder besproken resultaten, heb ik gebruik gemaakt van een ANN met behulp van het softwareprogramma SAS Enterprise Miner. SAS Enterprise Miner maakt gebruik van een Multilayer Perceptron (MLP) - Neural Network. Het is dan ook met deze methode dat ik de aandelenrendementen van de Bel20 zal voorspellen a.d.h.v. de hierboven vermelde inputvariabelen. Matignon (2007) beschrijft in zijn boek wat een MLP precies inhoudt. Een dergelijk NN bestaat uit verschillende ‘units’ of neutronen en links tussen deze neutronen. Er zijn drie soorten units. Ten eerste zijn er de ‘input units’ die de inputvariabelen in het NN introduceren. Elke input unit heeft zijn eigen gewicht in de ‘inputlayer’ en het zijn deze neutronen die gebruikt worden om de doelvariabele te
27
voorspellen. Om het NN-modelleringsproces te vergemakkelijken, worden alle intervalvariabelen eerst gestandaardiseerd volgens een standaard normale verdeling. Dit zorgt er voor dat het bereik van de gewichten beperkt blijft en dat de gewichten van de inputvariabelen met elkaar kunnen worden vergeleken. Daarnaast zijn er ook nog de ‘hidden units’ die samen een ‘hidden layer’ vormen. Deze hidden units staan in verbinding met elke input unit en voeren een nietlineaire transformatie uit op de som van de gewogen inputvariabelen en een bias. Deze transformatie vindt plaats door een ‘activation function’. Standaard wordt door SAS de ‘Hyperbolic Tangent Sigmoid function’ gebruikt die de inputwaarden in een bereik van [-1;1] duwt. Ten slotte zijn er nog de ‘output units’ die dan, in het geval dat de output binair is, de voorwaardelijke kans berekenen dat het ‘target event’ zich zal voordoen. Elke hidden unit staat op zijn beurt in verbinding met elke output unit. De activation function die in de output layer wordt gebruikt als de output binair is, bestaat uit een ‘Softmax activation function’ die wordt toegepast op de gewone lineaire sommatie van de gewogen output van de hidden units en een bias. Als de voorwaardelijke kans die wordt berekend groter is dan 0.5, dan wordt dit geval als een ‘event’ bestempeld.
28
In de onderstaande figuur wordt het volledige verloop van een MLP uitgebeeld.
H1 Fhidden V1
W11 B1
Input 1
H2 Fhidden
V2
Foutput
Z
V3 B2
Input 2 W23
B4
H3
Fhidden
B3
Hj = f(∑ IiWij + Bj) Z = f(∑ VjHj + B4)
Fig. 1 : The Multilayer Perceptron
In bovenstaande figuur en in het model dat ik heb aangewend zijn er slechts drie layers. Het is echter wel mogelijk te werken met meer dan één hidden layer, maar aangezien een MLP-structuur met één hidden layer zo goed als elk model kan voorspellen zolang er maar genoeg hidden units en een voldoende grote dataset worden gebruikt, is het niet nodig een extra layer in te voegen. Uit het bovenstaande blijkt wel dat de vraag hoeveel hidden units in het model te gebruiken, van groot belang is. De juiste hoeveelheid hidden units is nodig opdat het NN succesvol zou kunnen generaliseren, dit wil zeggen, hoe goed het NN voorspellingen zal maken voor de gevallen die niet in de datatset voorkomen. Het gebruik van te weinig hidden units zal leiden tot ‘underfitting’ en te veel hidden units zal leiden tot ‘overfitting’. In het eerste geval is het NN niet complex genoeg om de relatie tussen de data te vatten, terwijl in het tweede geval het NN zo
29
complex is dat het eerder de ‘noise’ zou kunnen beschrijven dan de onderliggende relatie. Het NN-modelleringsproces verdeelt de input dataset in twee verschillende groepen. De eerste groep wordt de training dataset genoemd en wordt gebruikt om de NN-gewichten te berekenen. Bij de tweede dataset, de validation dataset, worden de gewichten van de training dataset toegepast om de misclassificatie te berekenen. Misclassificatie treedt op wanneer de voorspelde uitkomst verschilt van de werkelijke uitkomst. Dit proces, waarbij de gewichten bekomen van de training dataset worden gesubstitueerd naar de validation dataset en de misclassificatie wordt berekend, wordt verschillende keren herhaald tot de kleinste ‘misclassification rate’ in de validation dataset gevonden wordt. Soms wordt ook nog een derde groep van data gevormd, de test dataset. Deze test dataset wordt gebruikt op het einde van het proces om de prestatie van het model te evalueren op basis van een aparte dataset.
30
4. Resultaten Hierboven is besproken hoe de structuur van een MLP-model eruitziet, maar om de resultaten te begrijpen, is het toch nodig om enkele keuzes die zijn gemaakt nader toe te lichten. Allereerst is het belangrijk te melden dat het gebruikte model bestaat uit één hidden layer, opgebouwd uit drie hidden units. Deze configuratie leverde immers de beste resultaten op. De activation function die werd aangewend in de hidden layer is de ‘Hyperbolic Tangent Sigmoid function’, wat de standaard is in SAS Enterprise Miner. In de output layer wordt gewerkt met de ‘Softmax activation function’ die ook als standaard wordt geïmplementeerd door SAS Enterprise Miner als de output binaire waarden aanneemt. Zoals hierboven beschreven staat, houdt de ANN-analyse in dat de gebruikte dataset wordt verdeeld in een training dataset en een validation dataset. De resultaten die in dit deel worden besproken komen voort uit een 50/50-verdeling van de verzamelde data. In de onderstaande grafiek wordt afgebeeld hoe het proces van het bijstellen van de gewichten telkens wordt herhaald en uiteindelijk de gewichten toekent aan de input die de kleinste misclassificatie in de validation dataset opleveren. De gewichten die aan de inputvariabelen in dit model worden toegewezen, zijn terug te vinden in bijlage 1.
31
Fig. 2: NN-modelleringsproces
Het gebruikte model heeft een misclassificatieratio van 44%, zoals ook blijkt uit bovenstaande grafiek. Dit betekent dat 56% van de voorspellingen correct zijn. Dit zijn zeer bemoedigende resultaten. Pérez-Rodriguez, Torra & Andrada-Félix (2005) vonden in hun onderzoek dat van de drie verschillende Neural Network-modellen die ze hadden gebruikt, de MLP de beste resultaten leverde met 55% van de voorspellingen die correct waren. Ook Castiglione (2008) gebruikte in zijn onderzoek een MLP om de richting van verschillende aandelenindices te voorspellen, maar haalde slechts een succesratio van iets meer dan 50%. De onderstaande tabel geeft een iets gedetailleerder beeld
van de
voorspellingsresultaten uit mijn onderzoek. Validation Dataset Target Target Outcome -1 1 -1 1
Total Count
-1 -1 1 1
Percentage 301 248 249 333
26,6136 21,9275 22,0159 29,4430
Tabel 3 : Classificatietabel 1
Waar dus een stijging (1) van het rendement van de Bel20 wordt voorspeld, is dit in 57.22% van de gevallen ook de werkelijke uitkomst. Waar een daling (-1) van het rendement wordt voorspeld, is dit in 54.83% van de gevallen correct. Dit bevestigt meteen ook de conclusie van het hoger geschreven literatuuronderzoek, nl. dat 32
aandelenrendementen wel degelijk kunnen worden voorspeld door een Artificial Neural Network. In het bovenstaande model wordt enkel gekeken naar data van de dag vóór de dag waarop de voorspelling slaat. Dit leidt tot de veronderstelling dat wel eens betere resultaten zouden kunnen bekomen worden als er ook data van eerdere dagen worden opgenomen. Om deze stelling te testen, neem ik de data van alle inputvariabelen tot vijf dagen voor de dag van de voorspelling in het Neural Network op. Vervolgens verlaag ik dit aantal dagen tot op het moment dat het model het hoogste percentage aan juiste voorspellingen uitkomt. Het beste resultaat wordt bereikt met de data van de drie dagen voor de dag van de voorspelling, wat een misclassificatieratio van 43% oplevert. De gewichten die aan de inputvariabelen van dit model worden toegewezen, zijn terug te vinden in bijlage 2. Validation Dataset Target Target Outcome -1 1 -1 1
Total Count
-1 -1 1 1
Percentage 290 224 258 356
25.7092 19.8582 22.8732 31.5603
Tabel 4 : Classificatietabel 2
Uit de bovenstaande tabel kan worden afgeleid dat nu voor 57,27% van de uitkomsten juiste voorspellingen zijn gedaan. Dit percentage ligt zeer dicht in de buurt van de 57.2% die Lendasse, De Bodt, Wertz & Verleysen (2000) uitkwamen in hun onderzoek. Zij werkten ook met 2600 dagelijkse data om de richting van de Bel20 te voorspellen, maar gebruikten hiervoor een Radial Basis Function, omdat hiermee het modelleringsproces computationeel gemakkelijker verloopt dan met een MLP-model dat ik heb gebruikt. Door het feit dat hun onderzoek slaat op een vroegere periode dan deze waarop mijn onderzoek betrekking heeft, kan worden bevestigd dat er wel degelijk niet-lineaire relaties bestaan die het mogelijk maken de aandelenmarkt te voorspellen.
33
Ook de Efficiënte Markt Hypothese wordt met dit model tegengesproken. Dit kan worden geïllustreerd a.d.h.v. de ‘cumulative %Response’- grafiek.
Fig. 3: Cumulative %Response Chart
Deze grafiek kan als volgt geïnterpreteerd worden. De ‘response’ waar het model naar op zoek gaat is hier het geval ‘1’, nl. een positief rendement van de Bel20. Voor elke observatie voorspelt het model de mogelijkheid dat het rendement positief zal zijn. De observaties worden volgens voorspelde waarschijnlijkheid van hoog naar laag op de X-as geördend, om vervolgens in groepjes te worden verdeeld die elk 5% van de data bevatten. Op de Y-as is dan af te lezen welk percentage van de data werkelijk een positief rendement inhoudt binnen die groepjes van 5%. Het model heeft natuurlijk maar nut als de proportie van observaties die een positief rendement inhouden relatief hoog is in de groepjes van data waar de voorspelde waarschijnlijkheid van een positief rendement hoog is. Als de Efficiënte Markt Hypothese van toepassing zou zijn, dan zou deze grafiek ongeveer op de 50%-lijn liggen en een gelijke verdeling over de X-as hebben. Hier is te zien dat de grafiek van de validatiedataset een dalend verloop kent, wat het model dus waardevol maakt.
34
Als we de Cumulative %Response Charts van het model met data van één dag voor de voorspelde dag en van het model met data van drie dagen met elkaar vergelijken, is duidelijk te zien dat deze laatste een grotere voorspellende kracht bezit.
Fig. 4: Vergelijking Cumulative %Response Charts
In bovenstaande figuur ligt de grafiek van het model met data van drie dagen (Neural Network (4)) bijna altijd boven deze van het andere model (Neural Network). Vooral in de eerste 20% van de observaties met de hoogste waarschijnlijkheid op een positief rendement is er een merkbare verbetering in de voorspellingen zichtbaar als er data van meerdere dagen worden opgenomen. De grootste tekortkoming van Neural Networks die ook door Matignon (2007) wordt aangehaald in zijn boek, is dat het zeer moeilijk is de invloed van de inputvariabelen op het model te achterhalen. Waar het bij de traditionele regressie-analyses dus mogelijk is a.d.h.v. de gewichten de mate van belangrijkheid en het effect van de inputvariabelen op de doelvariabele vast te stellen, kan dit niet worden bereikt met een NN. Vermits de input zowel met de hiddenlayergewichten als met de outputlayergewichten wordt geassocieerd, is het niet
mogelijk
de
relatie
tussen
de
verschillende
factoren
en
de
aandelenrendementen in kaart te brengen. In tegenstelling tot de regressieanalyses heeft een Neural Network dus als enige doel correcte voorspellingen te doen i.p.v. de relatie tussen de variabelen te interpreteren.
35
36
5. Conclusie In de literatuur vinden we dat de overgrote meerderheid van de auteurs de vraag of aandelenrendementen kunnen worden voorspeld, bevestigend beantwoordt. Ook in de methode waarmee die voorspelling dan zou moeten gebeuren, is er een algemene tendens te bespeuren. O.a. uit het onderzoek van Adya & Collopy (1998) blijkt de superioriteit van een Neural Network t.o.v. andere technieken en het is ook deze methode die in dit onderzoek gebruikt wordt om de richting van de rendementen van de Bel20 te voorspellen. Verder, vinden we in het literatuuronderzoek ook argumenten voor de te gebruiken inputvariabelen. Elf variabelen en een dummy-variabele waarvoor 2259 dagelijkse data over een periode van bijna 9 jaar werden verzameld, vormen de input voor het Neural Network. Door gebruik te maken van een Multilayer Perceptron bekomen we een model dat 56% van de output correct voorspelt a.d.h.v. data van de dag voor de dag waarop de voorspelling slaat. Echter, kan worden vastgesteld dat dit percentage kan worden opgetrokken tot 57,27% door data van drie dagen op te nemen. Dit betekent dat dit model nuttig is en dus betere resultaten oplevert dan waar de ‘Random Walk’- theorie van uit gaat. De mogelijkheid om een dergelijk model op te stellen, maakt dat de Efficiënte Markt Hypothese die voorspellingen over de toekomstige beursevolutie onmogelijk acht, in twijfel kan worden getrokken. Deze studie bevestigt ook de algemene tendens in de literatuur dat met een Neural Network nuttige voorspellingen over de financiële markt kunnen gedaan worden. Het grote nadeel aan deze methode is echter de onmogelijkheid de relatie tussen de financiële en economische factoren en de aandelenmarkt te interpreteren. Met een NN worden juiste voorspellingen nagestreefd zonder de invloed van de inputvariabelen in kaart te brengen. Een model met 57,27% correcte voorspellingen op basis van enkele financiële en economische factoren is natuurlijk niet perfect. Zo wijzen Thawornwong & Enke
37
(2003) erop dat het voorspellen van aandelenrendementen een moeilijke taak zal blijven doordat ook andere factoren zoals politieke, internationale en natuurlijke gebeurtenissen hun invloed hebben. Desalniettemin, levert deze masterproef een argument voor de stelling dat aandelenrendementen tot op zekere hoogte te voorspellen zijn op basis van historische en vrij beschikbare data.
38
6. Referenties 6.1. Geraadpleegde werken Adya, M., & Collopy, F. (1998). How effective are neural networks at forecasting and prediction? a review and evaluation. Journal of Forecasting, 17, 481-495. Castiglione, F. (2008). Forecasting price increments using an artificial neural network. Manuscript submitted for publication, Center for Advanced Computer Science, University of Cologne, Köln, Duitsland. Chen, A.-S., Leung, M.T., & Daouk, H. (2003). Application of neural networks to an emerging $nancial market: forecasting and trading the taiwan stock index. Computers & Operations Research, 30. Retrieved from http://www.elsevier.com/locate/dsw Fama, E. (1970). Efficient capital markets: a review of theory and empirical work. The Journal of Finance, 25(2), 383-417. Hill, T., Marquez, L., O'Connor, M., & Remus, W. (1994). Artificial neural network models for forecasting and decision making. International Journal of Forecasting, 10(1), 5-15. Huang, W., Keung Lai, K., Nakamori, Y., Wang, S., & Yu, L. (2007). Neural networks in finance and economics forecasting. International Journal of Information Technology and Dicision Making, 6(7), 1-28. Kalyvas, E. (2001). Using neural networks and genetic algorithms to predict the stock market returns. Manuscript submitted for publication, Faculty of Science and Engineering, University of Manchester, Manchester, Manchester. Kutsurelis, J.E. (1998). Forecasting financial markets using neural networks: an analysis of methods and accuracy. Manuscript submitted for publication, Naval Postgraduate School, Monterey, California. Lawrence, R. (1997). Using neural networks to forecast stock market prices. Manuscript submitted for publication, Department of Computer Science, University of Manitoba, Winnipeg, Manitoba. Leigh, W., Hightower, R., & Modani, M. (2005). Forecasting the new york stock exchange composite index with past price and interest rate on condition of volume spike. Manuscript submitted for publication, Department of Management Information Systems, University of Central Florida, Orlando, Florida. Retrieved from http://www.elsevier.com/locate/eswa Lendasse, A., De Bodt, E., Wertz, V., & Verleysen, M. (2000). Non-linear financial time series forecasting-application to the bel20 stock market index. European Journal of Economic and Social Systems, 14(1), 81-91. 39
Malkiel, B.G. (1973). A random walk down wall street: the time-tested strategy for successful investing. New York: W.W. Norton. Maskay, B. (2007). Analyzing the effect of change in money supply on stock prices. The Park Place Economist, 15, Retrieved from http://www.iwu.edu/economics/PPE15/ppe2007p72-79.pdf Matignon, R. (2007). Data mining using sas enterprise miner. Hoboken, New Jersey: John Wiley & Sons, Inc. Mills, T.C. (1991). Non-linear times series models in economics. Journals of Economic Surveys, 5(3), 215-241. Nandha, M., & Faff, R. (2008, May). Does oil move equity prices? a global view. Energy Economics, 30(3), 986-997. NBB. (2010, September 16). Energiemarkten en de macro-economie. Economisch Tijdschrift, Retrieved from http://www.nbb.be/doc/ts/Enterprise/Press/2010/cp100916Nld.pdf Peeters, D. (2010). De correlatie tussen de goudprijs en de aandelenmarkt en het belang hiervan voor de diversificatie van een aandelen- en beleggingsportefeuille. Informally published manuscript, Handelswetenschappen en Bestuurskunde, Hogeschool Gent, Gent, Gent. Pérez-Rodriguez, J.V., Torra, S., & Andrada-Félix, J. (2005). Star and ann models: forecasting performance on the spanish “ibex-35” stock index. Journal of Empirical Finance, Retrieved from http://www.uib.es/depart/deaweb/seminaris/pdfs/SeminarioJorge.pdf Phylaktis, K., & Ravazzolo, F. (2005). Stock prices and exchange rate dynamics. Journal of International Money and Finance, 24. Retrieved from www.elsevier.com/locate/econbase Rault, C., & El Hedi Arouri, M. (2009). On the influence of oil prices on stock markets: evidence from panel analysis in gcc countries. Manuscript submitted for publication, The William Davidson Institute, University of Michigan, Michigan, Michigan. Sellin, P. (2001). Monetary policy and the stock market: theory and empirical evidence. Journal of Economic Surveys, 15(4), 491- 541. Thawornwong, S., & Enke, D. (2003). The adaptive selection of financial and economic variables for use with artificial neural networks. Manuscript submitted for publication, Eng Management, University of Missouri, Rolla, Missouri. Tilakaratne, C.D., Morris, S.A., Mammadov, M.A., & Hurst, C.P. (2007). Predicting stock market index trading signals using neural networks. Manuscript submitted for publication, Centre for Informatics and Applied Optimization, University of Ballarat, Ballarat, Australia. Retrieved from
40
http://newwww.ballarat.edu.au/ard/itms/publications/researchPapers/Papers_2007/0704.pdf Vanheuverzwijn, T. (2008). Effect van macro-economische factoren op bel20-aandelen. Manuscript submitted for publication, Handelswetenschappen en Bestuurskunde, Hogeschool Gent, Gent, België. Retrieved from http://scriptie.hogent.be/20072008/287_HMHAWF000101_scriptie.pdf Zhang, G., Patuwo, B.E., & Hu, M.Y. (1997). Forecasting with artificial neural networks: the state of the art. Manuscript submitted for publication, Graduate School of Management, Kent State University, Ohio, Kent.
6.2. Lijst van gebruikte figuren Fig. 1 : The Multilayer Perceptron
p. 29
Fig. 2 : NN-modelleringsproces
p. 32
Fig. 3 : Cumulative %Response Chart
p. 34
Fig. 4: Vergelijking Cumulative %Response Charts
p. 35
6.3. Lijst van gebruikte tabellen Tabel 1 : Inputvariabelen in de literatuur
p. 15
Tabel 2 : Gebruikte inputvariabelen
p. 26
Tabel 3 : Classificatietabel 1
p. 32
Tabel 4 : Classificatietabel 2
p. 33
41
42
7. Bijlagen 7.1. Bijlage 1 : Gewichten van het model met data van een dag vóór de voorspelde dag Nr
Input
Weight
1 2 3 4 5 6 7 8 9 10 11 12
lag bel20_W11 olieprijs_W11 tbill3m_W11 tbill6m_W11 term structure_W11 wisselkoers_W11 return duitsland_W11 return frankrijk_W11 return japan_W11 return nederland_W11 return VS_W11 dummy_W11
1,211405 -0,681981 -1,318053 -0,309087 -1,502052 -0,709546 -0,636695 2,318456 -0,065679 1,410857 -0,072917 -0,686154
13 14 15 16 17 18 19 20 21 22 23 24
lag bel20_W12 olieprijs_W12 tbill3m_W12 tbill6m_W12 term structure_W12 wisselkoers_W12 return frankrijk_W12 return japan_W12 return nederland_W12 return VS_W12 return duitsland_W12 dummy_W12
-0,863692 2,605593 2,431815 0,196556 1,067331 -0,964658 0,090864 0,195046 -0,120435 3,330213 2,612393 -1,510424
25 26 27 28 29 30 31 32 33 34 35
lag bel20_W13 olieprijs_W13 tbill3m_W13 tbill6m_W13 termstructure_W13 wisselkoers_W13 return duitsland_W13 return frankrijk_W13 return japan_W13 return nederland_W13 return VS_W13
0,458432 -0,408577 0,344361 -1,113466 -0,769246 -0,347214 -0,346667 0,234522 -0,171100 0,465916 0,221702
43
36
dummy_W13
-0,296406
37 38 39
BIAS_H11 BIAS_H12 BIAS_H13
2,555667 -5,849300 -0,617973
40 41 42
H1_output_V1 H2_output_V2 H3_output_V3
0,834554 -0,807201 -1,383653
43
BIAS_output
-1,555225
7.2. Bijlage 2 : Gewichten van het model met data van drie dagen vóór de voorspelde dag Nr 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
44
Input lag bel20_W11 bel2lag_W11 bel3lag_W11 termstructure_W11 termstructure2lag_W11 Termstructure3lag_W11 olieprijs_W11 olieprijs2lag_W11 olieprijs3lag_W11 tbill3m_W11 tbill3m2lag_W11 tbill3m3lag_W11 tbill6m_W11 tbill6m2lag_W11 tbill6m3lag_W11 wisselkoers_W11 wisselkoers2lag_W11 wisselkoers3lag_W11 return duitsland_W11 return duitsland2lag_W11 return duitsland3lag_W11 return frankrijk_W11 return frankrijk2lag_W11 return frankrijk3lag_W11 return japan_W11
Weight 0.067859 0.550930 -0.404127 0.240382 0.021356 0.347095 0.113827 -0.008564 0.016002 0.270942 -0.168951 -0.096959 -0.002352 0.077318 0.065758 0.271639 0.088307 0.304580 0.070030 -0.307735 -0.256126 -0.232475 -0.480887 0.018996 0.168871
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63
return japan2lag_W11 returnjap3lag_W11 return nederland_W11 return nederland2lag_W11 return nederland3lag_W11 senp_W11 senp2lag_W11 senp3lag_W11 dummy_W11
0.351586 0.269232 -0.378046 -0.758202
lag bel20_W12 bel2lag_W12 bel3lag_W12 term structure_W12 termstructure2lag_W12 term structure3lag_W12 olieprijs_W12 olieprijs2lag_W12 olieprijs3lag_W12 tbill3m_W12 tbill3m2lag_W12 tbill3m3lag_W12 tbill6m_W12 tbill6m2lag_W12 tbill6m3lag_W12 wisselkoers_W12 wisselkoers2lag_W12 wisselkoers3lag_W12 return duitsland_W12 return duitsland2lag_W12 return duitsland3lag_W12 return frankrijk_W12 return frankrijk2lag_W12 return frankrijk3lag_W12 return japan_W12 return japan2lag_W12 returnjap3lag_W12 return nederland_W12 return
0.194092 0.599403 -0.044543 -0.384778 -0.323156 -0.025443
-0.593456 0.303244 0.094987 0.370609 -0.869594
-0.180470 0.022810 -0.224064 -0.169681 -0.286001 -0.340761 -0.029775 -0.336732 -0.041979 0.308448 0.400622 0.493625 0.448569 0.341736 -0.038358 0.314427 -0.050541 -0.123335 0.579304 -0.002049 0.282292 0.359781 -0.085700
45
64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
46
nederland2lag_W12 return nederland3lag_W12 senp_W12 senp2lag_W12 senp3lag_W12 dummy_W12 lag bel20_W13 bel2lag_W13 bel3lag_W13 term structure_W13 termstructure2lag_W13 term structure3lag_W13 olieprijs_W13 olieprijs2lag_W13 olieprijs3lag_W13 tbill3m_W13 tbill3m2lag_W13 tbill3m3lag_W13 tbill6m_W13 tbill6m2lag_W13 tbill6m3lag_W13 wisselkoers_W13 wisselkoers2lag_W13 wisselkoers3lag_W13 return duitsland_W13 return duitsland2lag_W13 return duitsland3lag_W13 return frankrijk_W13 return frankrijk2lag_W13 return frankrijk3lag_W13 return japan_W13 return japan2lag_W13 returnjap3lag_W13 return nederland_W13 return nederland2lag_W13 return nederland3lag_W13 senp_W13
-0.269812 -0.591245 -0.257948 0.347042 0.244075 0.127041 -0.118365 0.449583 -0.066376 -0.213642 -0.255263 -0.369565 -0.107061 -0.261902 0.289562 -0.026620 -0.093156 -0.003694 -0.346752 -0.147233 -0.257380 0.114249 0.286670 0.369672 0.049934 -0.204877 0.410579 0.469371 -0.197518 0.182861 0.011825 -0.016934 0.121660 0.017472 -0.077511 0.613138
100 senp2lag_W13 101 senp3lag_W13 102 dummy_W13
-0.130279 0.533223 -0.227829
103 BIAS_H11 104 BIAS_H12 105 BIAS_H13
-0.590518 0.321563 -1,392231
106 H1_output_V1 107 H2_output_V2 108 H3_output_V3
-0.722550 0.861824 -0.950390
109 BIAS_output
-0.800392
47