Statistieken over bezettingsgraden: enkele methodologische beschouwingen Inleiding Sinds een drietal jaar kunnen hotels maandelijks cijfers doorgeven aan het steunpunt over het aantal verhuurde kamers, de prijs van de kamers en de herkomst en motivatie van hun gasten. Nu het systeem stabiel is en de medewerking van een grote groep hotels gegarandeerd, is het tijd om relevante statistieken te ontwikkelen. De eerste doelstelling is om op relatief korte periode betrouwbare bezettingsgraden te kunnen communiceren naar beleidsmakers, onderzoekers, journalisten, etc. De specifieke structuur van de databank, de methode van dataverzameling en de beschikbare steekproef hebben echter een belangrijke impact op de constructie van een snel feedbacksysteem. De belangrijkste methodologische uitdaging is het feit dat het systeem gebaseerd is op vrijwillige medewerking, m.a.w. dat iedere hoteluitbater zelf kiest of en wanneer hij/zij de cijfers invult voor zijn/haar hotel. Het gevolg is dat de steekproef elke maand varieert. Daardoor kan niet zomaar het gemiddelde per maand worden weergegeven om de situatie van die desbetreffende maand of een vergelijking met bijvoorbeeld het voorgaande jaar of een andere regio in beeld te brengen. Bij de berekening van bezettingsgraden op een geaggregeerd schaalniveau, dienen verschillende keuzes gemaakt te worden. Deze keuzes kunnen niet steeds gebaseerd worden op een “one best solution”. Statistische methoden moeten afgewogen worden met strategische doelen om te komen tot een acceptabel raamwerk, toepasbaar op verschillende schaalniveaus. De belangrijkste knelpunten die hier behandeld worden, zijn: de keuze tussen verschillende indicatoren (bruto- of netto-bezettingsgraad en gemiddelde of totale bezettingsgraad), de manier waarop deze bezettingsgraad berekend wordt en de periode en het schaalniveau waarvoor informatie gegeven wordt. Voor elk van deze knelpunten zijn overwegingen gemaakt en waar mogelijk zijn de historische gegevens van de hotelbarometer (periode 2006-2007) geanalyseerd met het oog op een toekomstige ontsluiting van zo betrouwbaar mogelijke statistieken. Onderstaande analyses hebben enkel betrekking op de bezettingsgraad; voor de kamerprijs en de marktsegmentatie naar land van herkomst en motivatie hebben nog geen analyses plaatsgevonden. Keuze van de indicatoren Een eerste belangrijke vraag die behandeld dient te worden, betreft de indicatoren die in de statistieken weergegeven zullen worden. Er zijn immers verschillende indicatoren te onderscheiden. Ten eerste is er het onderscheid tussen bruto- en netto-bezettingsgraad. De bruto-bezettingsgraad wordt gebaseerd op het aantal dagen die een maand telt, terwijl de netto-bezettingsgraad rekening houdt met het aantal sluitingsdagen in die maand. Beide zijn interessant, maar in internationaal perspectief wordt vooral gebruik gemaakt van de bruto bezettingsgraad, waardoor deze indicator de voorkeur geniet omwille van internationale vergelijkbaarheid. Ten tweede kan zowel een gemiddelde als een totale bezettingsgraad worden berekend. De gemiddelde bezettingsgraad van een bestudeerde groep van hotels – bijvoorbeeld de hotels aan de Kust of de driesterren-hotels – is het gemiddelde cijfer van de bezettingsgraden per individueel hotel dat deel uitmaakt van die groep, Deze gemiddelde bezettingsgraad is een indicator voor de performantie van het gemiddelde, individuele bedrijf. De totale bezettingsgraad is gelijk aan de verhouding van het totaal aantal kamers dat is verhuurd binnen een bepaalde groep t.o.v. het totaal aantal beschikbare kamers van die groep. De totale bezettingsgraad is een indicator voor de performantie van een bepaalde groep van hotels, en kan bijvoorbeeld nuttig zijn om te kijken hoe goed een regio het gedaan heeft of hoe sterk of zwak de driesterrenhotels scoren in zijn geheel. Zowel bruto- als netto en gemiddelde als totale bezettingsgraden vormen dus een waardevolle indicator.
Jeroen Bryon & Bart Neuts
september 2008
1/5
De hotelgrootte: een “natural break” analyse Hotels worden vaak opgedeeld volgens het aantal kamers dat er in het hotel aanwezig zijn (hotelgrootte). Heel wat van die indelingen zijn intuïtief gemaakt en worden zelden tot nooit afgetoetst aan de realiteit. Daarom heeft een “natural break” analyse plaatsgevonden op de bezettingsgraden die kunnen worden afgeleid uit de hotelbarometer van het steunpunt,. Deze analyse zoekt ‘logische’ of ‘natuurlijke’ grenzen in de getallenreeksen die worden onderzocht, wat in dit geval neerkomt op het zoeken naar ‘sprongen’ in de gemiddelde bezettingsgraad wanneer het aantal kamers van het hotel in rekening wordt gebracht. Exploratie van deze methode voor Vlaanderen en haar macroproducten voor de maanden januari en juli 2006 en 2007, gaf het resultaat zoals te zien in tabel 1.
Vlaanderen
Kunststeden Kust
Vlaamse Regio’s
Januari 2006 ≤10 11-18 18-26 27-42 43-80 80+ ≤28 29-108 108+ ≤11 12-26 26+
Juli 2006 ≤12 13-24 25-34 35-94 94+
Januari 2007 ≤32 33-60 60+
Juli 2007 ≤16 17-38 38+
≤20 20+
≤60 60+
≤35 35+
≤16 16+
≤16 16+
≤10 11-14 14+
≤34 34+
≤16 17-28 29-36 36+ ≤8 9-10 11-26 26+
-
Tabel 1: “Natural breaks” in bezettingsgraad volgens kameraantallen (januari en juli 2006/2007)
Er kan worden vastgesteld dat de gevonden ‘natuurlijke’ kamercategorieën sterk verschillen naargelang de periode en het schaalniveau. Dergelijke methode kan in dit geval dus nooit perfect sluitende resultaten opleveren. Uiteindelijk werd daarom beslist om een eerder intuïtieve, maar internationaal algemeen aanvaarde afbakening van categorieën aan te nemen. Hotels worden daarbij opgesplitst in kleine hotels (≤ 15 kamers), middelgrote hotels (16 – 50 kamers) en grote hotels (> 50 kamers). Hoewel andere schaalniveaus gebaat kunnen zijn bij een aangepaste onderverdeling, moet er ook rekening gehouden worden met een indeling die geschikt is over de niveaus heen. Daarom dient een opdeling in te kleine eenheden eerder vermeden te worden, te meer daar de berekening van een stabiele gemiddelde bezettingsgraad bemoeilijkt zou worden indien de steekproef steeds verder wordt opgesplitst. De problematiek van de (niet-)representativiteit Welke bezettingsgraad er ook gekozen wordt, er dient steeds nagegaan te worden of een weging noodzakelijk is. Immers, aangezien de hotelbarometer van het steunpunt gebaseerd is op vrijwillige medewerking, is representativiteit van de steekproef nooit gegarandeerd. Inderdaad, een chi-kwadraattest toonde aan dat de steekproef op alle relevante variabelen (aantal kamers, aantal sterren, keten/niet-keten, geografische ligging) belangrijke, statistisch significante verschillen vertoonde met de populatie, en dit voor elke maand in de periode 2006-2007. M.a.w.: voor elke maand waren er bepaalde groepen hotels over- en andere groepen hotels ondervertegenwoordigd in de steekproef. Over het algemeen kan worden gesteld dat grote hotels, hotels met meer sterren, ketenhotels en hotels in de kunststeden oververtegenwoordigd zijn in de hotelbarometer. Een mogelijke oplossing voor deze niet-representativiteit is het invoeren van een wegingsfactor voor de berekening van de gemiddelde bezettingsgraad, waarbij het belang van ondervertegenwoordigde klassen wordt verhoogd en van de groepen die oververtegenwoordigd zijn
Jeroen Bryon & Bart Neuts
september 2008
2/5
wordt verlaagd in het berekenen van een gemiddelde. Echter, er moet pas worden gewogen indien a) er een duidelijk statistisch verband is tussen de bezettingsgraad en de variabelen waarop nietrepresentativiteit wordt vastgesteld – zoniet is weging overbodig omdat de afwijkingen in de steekproef er niet toe doen bij de berekening van het gemiddelde – en b) indien de resultaten van de gewogen bezettingsgraad significant beter zijn dan deze van de ongewogen methode. Door middel van een associatie-analyse is nagegaan of er een verband te vinden was tussen het niveau van de bezettingsgraad en de vier variabelen (aantal kamers, aantal sterren, keten/nietketen, geografische ligging). De associatiematen vertoonden allen een significante waarde, m.a.w. de kenmerken van de hotels hebben een invloed op de gemiddelde bezettingsgraad. Er zijn verschillende wegingsmethoden uitgeprobeerd om de gemiddelde bezettingsgraad te berekenen, met telkens een wegingsfactor die gebaseerd was op een combinatie van vier variabelen: aantal kamers, aantal sterren, keten en geografische ligging. De analyse toonde echter aan dat geen van de toegepaste bewerkingen een groot verschil in gemiddelde bezettingsgraad tot gevolg had. De kleine verschillen kunnen misschien wel belangrijk zijn bij de extrapolatie naar aantal overnachtingen, maar voor de gemiddelde bezettingsgraad lijken ze overbodig. Er kan dan ook worden besloten dat een gebruik van wegingscoëfficiënten, ook al lijkt dat op het eerste zicht het probleem van non-representativiteit op te vangen, in feite niet nodig is omdat dit geen betekenisvolle verbeteringen in de finale berekening tot gevolg heeft. Bijgevolg zal het STeR gebruik maken van ongewogen gemiddelde bezettingsgraden. Een extra argument contra weging is overigens dat er bij het gebruik van wegingsfactoren altijd moet gekozen worden tussen de variabelen waarop gewogen wordt en er dus altijd een fout gemaakt wordt, zelfs bij weging. Dit alles sluit echter niet uit dat er moet blijvend gestreefd worden om de representativiteit van de steekproef te vergroten, zodat een weging naar de toekomst toe ook statistisch geheel overbodig wordt. De problematiek van de “missings” Naast de niet-representativiteit van de steekproef, is de aanwezigheid van “missings” een probleem. Immers, sommige hotels vullen hun gegevens niet voor elke maand in, waardoor een continue reeks aan bezettingsgraden voor die specifieke hotels ontbreekt. Bovendien is het de bedoeling dat de bezettingsgraden op een welbepaald moment worden gecommuniceerd, bijvoorbeeld een maand na het verstrijken van de vorige maand (bv. op 30 september communiceren over de maand augustus). Sommige hotels vullen hun cijfers echter later in dan het moment waarop de statistieken worden opgemaakt. Er zijn een aantal geëigende methodes om het probleem van de “missings” in kaart te brengen en op te lossen. Een eerste methode bestaat er in om de “missings” te imputeren, wat neerkomt op het vervangen van de missings door een geschatte waarde. Verschillende technieken werden uitgetest: schatting op basis van de gemiddelde bezettingsgraad van de ganse steekproef, de gemiddelde bezettingsgraad van een groep binnen de steekproef (gebaseerd op de geografische indicator die de grootste associatie vertoont met bezettingsgraad), regressieimputatie en expectations maximization. Uit figuur 1 blijkt dat de verschillen tussen de methodes wat bezettingsgraden betreft minimaal zijn. Gezien het imputeren geen duidelijke meerwaarde biedt, wordt ervoor geopteerd deze techniek niet te gebruiken. Een tweede methode bestaat uit het schrappen van de observaties waarvoor er een “missing” is in een bepaalde periode en dus enkel die hotels in de steekproef op te nemen die voor alle relevante periodes cijfers hebben aangeleverd. Op dat moment spreken we over een “vaste steekproef”, omdat het een steekproef betreft waarbij alle hotels voor elke relevante periode een cijfer hebben aangeleverd. Dit komt in feite neer op een verlies van informatie aangezien de hotels die één of meerdere missings hebben, uit de analyse zijn geweerd, terwijl zij vaak voor enkele maanden wél gegevens hebben doorgegeven. Uit een analyse over 24 maanden (2006-2007) blijkt dat de gemiddelde bezettingsgraden die gebaseerd zijn op een vaste steekproef nauwelijks verschillen van deze die gebaseerd zijn op een variabele steekproef (d.i. een steekproef waarbij alle hotels voor een maand zijn opgenomen die in die maand hebben meegedaan ongeacht het feit of zij op een andere maand wel of niet aan de hotelbarometer hebben geparticipeerd).
Jeroen Bryon & Bart Neuts
september 2008
3/5
De conclusie is dat noch imputatie noch het schrappen van observaties die een missing hebben, een verbetering met zich meebrengen in de berekening van de gemiddelde bezettingsgraad. We kunnen m.a.w. besluiten dat ondanks het feit dat de steekproef per maand varieert, deze voor elke maand groot genoeg is om betrouwbare bezettingsgraden te berekenen ongeacht de eventuele “missings”. De statistieken van de hotelbarometer zullen dan ook worden gebaseerd op dergelijke variabele steekproeven.
Wanneer is de steekproef groot genoeg om betrouwbare resultaten op te leveren? De beleidsstatistieken over de bezettingsgraden zijn gericht op korte termijn. Dit impliceert dat de berekeningen moeten gebeuren op basis van een steekproef die na enkele weken wordt afgesloten. Gelet op het feit dat niet iedereen zijn cijfers meteen doorgeeft, bestaat de kans dat de periode waarop de steekproef wordt afgesloten, te kort is en de steekproef dus te klein en onbetrouwbare gegevens oplevert. Er moet dus een evenwicht worden gevonden tussen zo snel mogelijk statistieken genereren en zo lang mogelijk wachten zodat de steekproef groot genoeg is. Figuur 2 geeft weer hoeveel procent van de ‘finale steekproef’ – dit is de steekproef zoals die is samengesteld na de periode van één jaar – is bereikt per maand. Het blijkt dat na 1 maand de steekproef voor Vlaanderen reeds bijna 60% van de totale steekproef vormt (dit komt neer op een responsgraad van 21.1%), na twee maanden 70% (of een responsgraad van 26.6%) en dat na drie maanden drie kwart (75%) van de totale steekproef is gevormd (of 27.3% van de responsgraad) (figuur 2). Het optimale evenwicht lijkt te liggen rond anderhalve maand na de maand waarvoor de statistieken worden weergegeven, dus bijvoorbeeld op 15 oktober voor de bezettingsgraden van augustus. Op dat moment bedraagt de responsgraad voor Vlaanderen reeds meer dan 20% (zie figuur 3). Anderzijds kan gesteld worden dat dit alsnog een lange periode is, zeker voor sommige maanden zoals de zomermaanden, die toeristische piekmaanden vormen. Er wordt daarom, in samenwerking met de verschillende betrokken instanties (provinciale toeristische organisaties en Toerisme Vlaanderen), gewerkt aan een timing waarbij voor bepaalde maanden er wordt gestreefd naar een kortere periode (bijvoorbeeld twee weken na het einde van de zomervakantie) en voor andere, toeristisch minder belangrijke maanden naar een iets langere periode (bijvoorbeeld vijf weken).
100,00 95,00 90,00 85,00 80,00 75,00 70,00 65,00 60,00 55,00 50,00 na 1 maand
na 2 maanden
na 3 maanden
na 4 maanden 2006
na 5 maanden
na 6 na meer dan maanden 6 maanden
2007
Figuur 2: Evolutie responsgraad in 2006 en 2007
Jeroen Bryon & Bart Neuts
september 2008
4/5
40,00 35,00 30,00 Totale steekproef als percentage van populatie
25,00 20,00
Steekproef na 1,5 maand als percentage van populatie
15,00 10,00 5,00 december
november
oktober
september
augustus
juli
juni
mei
april
maart
februari
januari
0,00
Figuur 3: Totale steekproef en steekproef na 1,5 maand als percentage van de totale populatie (2007)
Het geografisch schaalniveau van de statistieken Tot slot moet nog een laatste punt worden uitgeklaard: op welk schaalniveau (Vlaanderen, macroproducten, regio’s, gemeentes) kunnen statistieken over de bezettingsgraad worden opgemaakt? Bij deze problematiek staat één overweging centraal: het hebben van een voldoende grote steekproef voor alle maanden en binnen een welbepaald tijdsbestek (drie tot zes weken, zie boven). Op gemeentelijk niveau zijn in principe geen statistieken mogelijk omdat er te weinig gegevens beschikbaar zijn, uitgezonderd (sommige) kustgemeentes. Alle bovenstaande analyses zijn uitgevoerd voor de drie macroproducten (Kust, Kunststeden, Vlaamse Regio’s) én alle Vlaamse Regio’s en Kunststeden. Het blijkt dat statistieken op macroproduct-niveau zeker mogelijk zijn; op dat schaalniveau zijn de steekproeven voldoende groot om betrouwbare uitspraken te doen. Voor de Kunststeden is dat evenzeer het geval. Daarentegen kennen slechts enkele Vlaamse Regio’s een voldoende participatiegraad om betrouwbare statistieken te genereren. Bijgevolg zullen de statistieken in een eerste fase beperkt zijn tot de schaalniveaus Vlaanderen, de macroproducten en de individuele Kunststeden. Conclusie Door de aard van de hotelbarometer, zijn heel wat analyses noodzakelijk geweest om te kunnen besluiten hoe de finale statistieken omtrent de bezettingsgraden worden berekend. Vooral moest worden getest in welke mate de omvang en representativiteit van de steekproef een impact heeft op de betrouwbaarheid van de resultaten. Het blijkt dat heel wat statistische technieken, zoals het gebruik van wegingsfactoren, imputaties of het schrappen van observaties die een “missing” hebben, weinig toegevoegde waarde opleveren. Anders gezegd, op heden is de steekproef van de hotelbarometer vanaf drie tot zes weken na het afsluiten van een maand, voldoende groot en stabiel genoeg om betrouwbare resultaten te genereren. Bijgevolg vormt het systeem een goeie basis om op korte termijn regelmatige cijfers omtrent de bezettingsgraden voor Vlaanderen, de macroproducten en de individuele Kunststeden te genereren.
Jeroen Bryon & Bart Neuts
Jeroen Bryon & Bart Neuts
september 2008
5/5