De prijs(evolutie) van woningen op de secundaire markt Bart Cap´eau∗ Juli 2002 In aanvulling op de summiere opmerkingen in mijn nota “Microsimulaties, korte en iets langere termijn effecten van fiscale beleidsmaatregelen. Data-vereisten.” (Juni 2002) omtrent de prijsbepaling van vastgoed in het algemeen, en woningen in het bijzonder, wilde ik graag volgende bedenkingen kwijt omtrent het meten van de prijsevolutie van vastgoed en de gangbare praktijk in Belgi¨e om daarvoor gemiddelde prijzen te gebruiken. 1. Voor zover ik kon opmaken uit de mij beschikbare informatie, is de gangbare berekening van de prijsevolutie van vastgoed gebaseerd op een vergelijking van centrale tendens maatstaven (meer bepaald: gemiddelden en kwantielwaarden) van de prijsverdeling op een bepaald moment in de tijd. Dit is alleszins het geval voor de prijsberekening van het Nationaal Instituut voor de Statisitiek (nis), onder meer te vinden op het volgende url-adres: http://www.statbel.fgov.be/figures/d44_nl.asp. Deze gemiddelden worden berekend op basis van de totale verkoopswaarde van diverse types vastgoed (woonhuizen, appartementen, villa’s, herenhuizen,. . . ) die tijdens een bepaald jaar werden verkocht. De gegevens omvatten alle geregistreerde verkopen gedurende het betreffende jaar. Behoudens meetfouten, kan je derhalve stellen dat de weergegeven gemiddelden geen schatter zijn op basis van een steekproef, maar de werkelijke gemiddelde verkoopprijs van de populatie van de verkochte woningen, appartementen, enz. gedurende het observatiejaar. Het studie- en adviesbureau stadim hanteert een iets meer gedetailleerde classificatie van types vastgoed (de categorie woonhuizen is opsplitsbaar in kleine en middelgrote ∗
Instituut voor de Overheid, Steunpunt Bestuurlijke Organisatie in Vlaanderen, Van Evenstraat 2C, 3000 Leuven, en Centrum voor Economische Studi¨en, Naamsestraat, 69, 3000 Leuven. E-mail
[email protected] Tel. 016-32.68.61 Fax 016-32.67.96
1
woonhuizen, en grotere woonhuizen, hoewel deze laatste mogelijks de categorie herenhuizen en villa’s van het nis omvat) en laat bovendien een uitsplitsing naar locatie (gewest, provincie, arrondissement, gemeente) en oppervlakte van het perceel toe. Voorts zijn niet enkel gemiddelde prijzen te bekomen, maar eveneens andere centrale tendens maatstaven (mediaan, eerste en derde kwartiel bovengrens, negende deciel bovengrens en gemiddelde uitgezuiverd voor laagste en hoogste 25% waarnemingen). Voorzover we konden nagaan worden deze indicatoren berekend op basis van een (omvangrijke) steekproef van de verkopen. 2. Mijn opmerkingen bij de beschikbare statistieken zijn twee¨erlei van aard. Enerzijds meen ik dat deze statistieken een pover beeld geven van de actuele prijsverdeling van woningen in de betrokken referentie periode. Anderzijds zijn deze maatstaven ongeschikt om iets te besluiten over de prijsevolutie van vastgoed. Tenslotte doe ik een aantal suggesties voor het aanwenden van andere methodes, die gegeven de beschikbare data in Belgi¨e een mogelijks beter zicht op de prijsevolutie kunnen geven. 3. Het gemiddelde is een maatstaf die sterk onderhevig is aan de invloed van uitbijters. Dit zijn waarnemingen waarvan de waarden sterk afwijken ten opzichte van andere waarnemingen in de steekproef of populatie. Dit vormt overigens enkel een probleem indien de uitbijter een waarneming is die niet gegenereerd werd uit het statistisch model. Voorzover de dataset van het nis omtrent verkopen van vastgoed in een jaar t, de gehele populatie omvat, en het hier om discrete gebeurtenissen gaat, is het vermelde gemiddelde een kenmerk van de prijsverdeling van de woningen op moment t. Maar het is een bijtijds bijzonder weinig zeggend kenmerk. Een oneindig aantal verdelingen hebben hetzelfde gemiddelde: verdelingen die sterk geconcentreerd zijn rond dat gemiddelde en fel gespreide, links scheve, rechts scheve en symmetrische,. . . . Alleszins is het niet noodzakelijk, ja slechts in uitzonderlijke gevallen, zo dat de gemiddelde prijs iets zegt over de uitgaven van de gemiddelde koper van jaar t aan zijn of haar woning, een besluit dat nogal al eens al te makkelijk wordt getrokken. Voor zover de stadim dataset een steekproef vormt, lijkt het wegwerken van de invloed van uitbijters (door het aangeven van gemiddelden van getrunceerde verdelingen) niet steeds aanbevelenswaardig. Stel dat men de steekproefverdelingen van de prijs van woningen in jaar t wil vergelijken op basis van hun gemiddelde. Dan zal het weglaten van extreme waarden uit de steekproef vertekende schatters voor het gemiddelde opleveren, en zou men wel eens onterechte besluiten kunnen trekken. Integendeeel, door hun zeldzaamheid mist men de uitbuiters in menige steekproef, 2
zodat men ze hier, indien toch aanwezig, best niet wegsmijt. Wanneer men anderzijds bedenkt dat bepaalde extreme verkoopwaarden in de categorie woonhuizen eigenlijk verkopen betreffen van goederen die ten onrechte als ‘woonhuizen’ werden geclassificeerd, en eerder een villa of herenhuis zijn, lijkt het dan weer aangewezen om te corrigeren, gezien de schatter van het populatiegemiddelde anders al te fel zou worden aangetast door deze echt vreemde eend in de bijt. Alleszins geven de diverse centrale tendens maatstaven van stadim zeker een vollediger beeld van de prijsverdeling, dan het eenvoudige gemiddelde van het nis. Wat men echter nooit mag doen, maar waar deze gemiddelden meestal worden voor gebruikt, is om basis hiervan iets te zeggen over relatieve prijzen in diverse regio’s (zijn woningen duurder in Vlaanderen dan in Walloni¨e?) op een bepaalde moment in de tijd t, of voor de prijsevolutie van woningen over de tijd heen. Immers, het belangrijkste probleem bij dergelijke aanwending is misschien niet zozeer de gevoeligheid van de gemiddelde prijs voor uitbijters, maar de verschillende samenstelling van verkochte goederen in de respectieve populaties doorheen de tijd en/of over de regio’s. Wat er kan mislopen illustreer ik aan de hand van een aangepast voorbeeldje dat ik van de Nation Wide site1 pluk, waarop prijsindices voor woningen worden berekend. Stel dat er slechts twee types kleine en middelgrote woningen zijn: comfortabele, maar iets duurdere woningen, en de goedkopere standaardwoning. Laat nu de gemiddelde prijs van beide types woningen in een bepaalde regio 5% hoger liggen dan in een andere regio. In dit geval ligt het nogal voor de hand om te besluiten dat de woonprijs in de eerstgenoemde regio 5% hoger ligt dan in de tweede regio. Neem nu eens aan dat er in de eerste regio verhoudingsgewijs meer comfortabele, duurdere woningen zijn dan in de tweede regio. In dit geval zal de prijsverhouding tussen beide regio’s (5%) gevoelig overschat worden als we deze vergelijking maken op basis van de ratio tussen de gemiddelde prijs van alle kleine en middelgrote woningen in regio 1 versus 2. Dit probleem wordt gedeeltelijk opgevangen doordat bijvoorbeeld dikwijls de prijsstijgingen zelf in diverse regio’s met elkaar vergeleken worden, in plaats van de gemiddelde prijzen van een bepaalde woontype. Helaas duikt het in zijn volle glorie weer op bij de berekening van die procentuele stijging, die wel op basis van gemiddelde prijzen gebeurt. Immers, de set van verkochte woningen in jaar t kan nogal sterk verschillen van de verkochte woningen in jaar t − 1. De constructie van een index cijfer is er nou net op gericht om de prijsevoluties 1
Nation Wide is Englands tweede grootste bouwspaarco¨operatieve. Het url-adres van het analoge voorbeeld dat ik verder uiteenzet is http://www.nationwide.co.uk/hpi/method/method.htm.
3
van geaggregeerde en derhalve niet noodzakelijk homogeen samengestelde goederengroepen te bestuderen. Dit gebeurt aan de hand van de prijsevolutie van een aantal individuele goederen in de index-korf. Het gaat hier meer bepaald om een aantal min of meer homogene goederen die tot de vermelde groep behoren, waarvan men de prijsevolutie wil bestuderen. Best gaat het hierbij ook om goederen die een belangrijke bijdrage leveren tot de totale consumptie (of consumptieuitgaven)2 van (of aan) de gehele goederengroep. Om de prijs van fruit te berekenen, gaat het niet op om dit te doen aan de hand van een aantal exotische vruchten die hier niet of nauwelijks worden geconsumeerd. Van deze goederen uit de korf noteert men de prijs per eenheid op diverse opeenvolgende momenten in de tijd. Er zijn talloze methoden gekend om de prijsevolutie van de goederen in de korf te aggregeren tot een prijsindex voor de gehele goederengroep3 . Voor zeer heterogene goederen, zoals woningen, is bovenstaande methode niet onmiddellijk toepasbaar, daar de registratie van de verkoopswaarde van eenzelfde goed gedurende diverse opeenvolgende observatieperiodes niet mogelijk is, gezien dit goed langere tijd in handen van dezelfde eigenaar blijft. We stellen in volgende punt twee alternatieve methodes voor die courant worden gebruikt voor het berekenen van prijsindices voor woningen4 . Beide methoden hebben hun eigen statistische problemen (cf. Case en Szymanoski, 1995, en Gatzlaff en Haurin, 1997). 4. We overlopen dus de twee belangrijkste methoden uit de literatuur om prijsevoluties van woningen te berekenen. (a) Methode van herhaalde verkopen: deze methode volgt een set woningen doorheen de tijd, en registreert de verkoopprijs Pit op elk moment t dat een bepaalde woning i uit de gevolgde verzameling verkocht wordt. Weze xit de waarde van een aantal kwaliteitskenmerken (voorzieningen zoals badkamer, plaatsen met stromend water, enz.) van woning i op moment van verkoop t, en laat τ (i) het moment zijn waarop woning i in de dataset voor het eerst verkocht wordt, dan 2
Daar waar het om consumptieprijs indices gaat natuurlijk. Indien men daarentegen een idee wil krijgen van de productieprijs van deze goederengroep, dient het belang van de individuele goederen uit de korf in de totale productie van de goederengroep eerder in overweging genomen te worden. 3 Het is in dit kader dat men het heeft over Paasche, Laspeyres, Fishers ideale index en Divisia indices. 4 Onder meer de in Engeland frequent geciteerde Halifax-index gebruikt de tweede methode (zie http://www.hbosplc.com/view/housepriceindex/indexmethodology02.asp).
4
wordt volgend model opgelegd aan de data5 : ¡ ¢ ln Pit − ln Piτ (i) = β 0 ln xit − ln xiτ (i) + γt − γτ (i) + ²it .
(1)
Wie wat afgeschrikt is van deze vergelijking, kan best het geval beschouwen waarbij de kwaliteitskenmerken van de woning tussen twee verkoopmomenten t en τ , niet veranderden. In dit geval is ln Pit −ln Piτ = γt −γτ +²it −²iτ , een maat voor de prijsverandering van deze woning van jaar τ tot jaar t. Bemerk echter dat de diverse parameters van het model (β en γ = (γ1 , . . . , γT )) onafhankelijk zijn van de woning i. Het individu onafhankelijke gedeelte γt − γτ is derhalve een algemene prijsindex voor de prijsevolutie van woningen tussen periode t en τ. De benodigde parameters kunnen op basis van een eenvoudige regressie geschat worden. En men kan eventueel de simplifi¨erende assumptie maken dat de huizen niet gerenoveerd worden tijdens de waarnemingsperiode, zodat men enkel nog γ dient te schatten, op basis waarvan dus onmiddellijk een woonprijsindex kan afgeleid worden. Deze prijsindex kan evenwel serieus vertekend zijn omdat de prijsevolutie van woningen die frequenter verkocht worden, en dus voor selectie in de steekproef in aanmerking komen, nogal atypisch kan zijn, vergeleken bij de prijsevolutie van de gehele populatie van verkochte woningen (Gatzlaff en Haurin, 1997). (b) Hedonische prijs regressies: deze methode tracht, evenals de voorgaande, de prijs van een woning te verklaren aan de hand van de bijdrage van een aantal karakteristieken (Meese en Wallace, 1997, gebruiken bijvoorbeeld: aantal badkamers, ratio badkamers-totaal aantal kamers, grond oppervlakte, een index voor algemene kwaliteit van de woning en ouderdom van het huis). i. Geavanceerde versie: de geavanceerde versie sluit nauw aan bij de traditionele manier om prijsindices te construeren op basis van een goederenkorf. Alleen is de goederenkorf hier niet samengesteld uit een aantal goederen, maar eerder uit een aantal kwaliteitskenmerken (bijvoorbeeld deze net opgenoemd uit het artikel van Meese en Wallace). Voor elke jaar t afzonderlijk tracht men (met behulp van een regressie) de prijs van een woning i die op dat moment wordt verkocht, naar best vermogen te verklaren op basis van 5
De variabelen ² (en υ en u infra) zijn storingstermen van de regressievergelijkingen, die kleine individuele afwijkingen van het model weergeven.
5
de kenmerken xit . Dit gebeurt met volgend model: Pit = δ 0t xit + αt + υit .
(2)
Vervolgens wordt voor een bepaalde referentiesituatie r – bijvoorbeeld `a la Laspeyres: de gemiddelde waarde in het basisjaar – een aantal basiswaarden geconstrueerd voor de kwaliteitsvariabelen, xr . De verhouding tussen δ 0t xr + αt en δ 0τ xr + ατ is dan een maat voor de prijsstijging van woningen tussen periode t en τ .6 ii. Vereenvoudigde versie: de vereenvoudigde vorm van bovenstaand hedonisch model slaat de constructie van de prijsindex op basis van een korf over en tracht, net als de methode van herhaalde verkopen, onmiddellijk een tijdstrend in de prijzen te schatten op basis van de gegevens. Dit gebeurt met volgend model: 0
ln Pit = ζ ln xit +
T X
ct Dit + uit .
(3)
t=1
In deze vergelijking zijn de Dit ’s zogenaamde wissel variabelen, die de waarde 1 aannemen indien het goed i in periode t werd verkocht, en voor alle andere waarden s 6= t, neemt Dis de waarde nul aan. Bemerk dat de tijdstrend ct hier de evolutie van de prijs van de diverse kwaliteitscomponenten van de woning, xit , onmiddellijk samenbalt in ´e´en getal. De prijsindex voor jaar t ten opzichte van jaar τ is dan ook gelijk aan ct − cτ . De hedonische prijs regressie methode is, in tegenstelling tot de methode van herhaalde aankoop, meer onderhevig aan vertekening tengevolge van het ten onrechte weglaten van een aantal kwaliteitskenmerken die een belangrijke bijdrage leveren bij de prijsbepaling van een vastgoed. Bijvoorbeeld kan de nabijheid van industri¨ele zones of vlieghavens een negatieve impact hebben op de prijs van een woning, maar niet alle datasets bevatten dergelijke relevante informatie. 5. Belgi¨e hinkt alweer een beetje achterop ten opzichte van andere Europese landen, gezien hier niet direct de nodige data aanwezig blijken te zijn om de methode van herhaalde verkopen dan wel de hedonishe prijs regressie techniek te kunnen toepassen. 6
Er zijn tal van varianten van de hedonische benadering, zowel door variatie in de functionele vorm van vergelijking (2), als door de manier waarop de index wordt geconstrueerd, bijvoorbeeld door de logaritme van verhouding te nemen, dan wel de verhouding van de exponenten, zoals in de Halifax-benadering.
6
Het databestand dat het dichtst de vereiste informatie voor een hedonische regressie benadert, is alweer de nis budgetenquˆete. Sinds de 1997/98 versie wordt immers gevraagd aan de bezitters van eigen woning, in welk jaar ze deze verworven hebben en wat de aankoopprijs was. Daarnaast werden reeds lang allerlei kenmerken van de woning bevraagd. Deze dataset heeft twee nadelen: ze is bijzonder klein in vergelijking met de bestanden waarop normaal hedonische prijsregressies worden geschat, en ze is niet representatief voor de set van verkochte huizen in de diverse jaren van aankoop. Daarnaast is het niet rechtstreeks te achterhalen of de bezitters van eigen woningen deze verworven hebben in nieuwe staat, zelf gebouwd hebben, dan wel op de secundaire markt hebben gekocht. En tenslotte moet ook vermeld dat de geregistreerde aankoopprijs in de enquˆete een zogenaamde subjectieve variabele op basis van herinnering is, wat misschien minder betrouwbaar is dan de prijs die de administratie bij een effectieve verkoop registreert. 6. Natuurlijk kan op basis van een steekproef uit de nis-data omtrent geregistreerde verkopen een fel vereenvoudigde hedonische prijs regressie geschat worden (van het zelfde type als in vergelijking (3) met als verklarende x-variabelen: type van woning in de nis-nomenclatuur (woonhuizen, herenhuizen, villa’s, appartementen, landbouwerswoningen), grondoppervlakte, regio, en overdrachtsvorm (openbare verkoop versus verkoop uit de hand). Mijns inziens is deze benadering veel minder onderhevig aan de fel onderschatte invloed van de wijzigende samenstelling van de verzameling verkochte goederen doorheen de tijd. Natuurlijk blijft het probleem van vertekening omwille van ten onrechte weggelaten verklarende variabelen. Maar dat is eigenlijk gewoon een andere versie van hetzelfde probleem: namelijk geen of onvoldoende correctie voor variatie in de kwaliteit. Het verdient mijns inziens dan ook aanbeveling om in de toekomst de nodige data te (re)construeren of registreren die een meer wetenschappelijk verantwoorde bepaling van de prijsevolutie van vastgoed mogelijk maken, ten minste voorzover deze variabele nuttig geacht wordt bij de evaluatie van welvaarts-, verdelings- en gedragseffecten van het beleid.
Referenties Websites http://www.hbosplc.com/view/housepriceindex/indexmethodology02.asp 7
http://www.nationwide.co.uk/hpi/method/method.htm http://www.stadim.be/default2.htm http://www.statbel.fgov.be/figures/d44_nl.asp
Artikels Case, B. en Szymanoski, J., (1995), Precision in house price indices: findings of a comparative study of house price index methods, Journal of Housing Research, vol.6(3), 483-496. Gatzlaff, D.H. en Haurin, D., (1997), Sample selection bias and repeated-sales index estimates, Journal of Real Estate Finance and Economics, 14(1-2), 33-50.
Meese, R.A. en Wallace, N.E., (1997), The construction of residential housing price indices: a comparison of repeated-sales, hedonic-regression, and hybrid approaches, Journal of Real Estate Finance and Economics, 14(1-2), 51-73.
8