Dynamische modellen van prijsbeleid
Richtlijnen opzet panel (Onderdeel van Fase 1.E)
Datum 8 oktober 2001 Kenmerk AVV009
MuConsult B.V. Postbus 2054 3800 CB Amersfoort Tel. 033 – 465 50 54 Fax 033 – 461 40 21
[email protected] E-mail Internet www.MUCONSULT.NL
Inhoudsopgave 1. Inleiding
1
2. Paneldata
3
2.1 Dynamiek van verplaatsingsgedrag
3
2.2 Paneldata vs. cross-secties
4
3. Dynamische panels
7
3.1 Inleiding
7
3.2 Prijsmaatregelen in verkeer en vervoer
7
3.3 Opzet panel
10
3.4 Analyse (dynamische) keuzedata
15
3.5 Opzet Pseudo Panels
17
4. Samenvattend
20
1.
Inleiding
Voor het voeren van prijsbeleid op het gebied van verkeer en vervoer moet de overheid beschikken over goede informatie over het verplaatsingsgedrag van mensen. Op basis daarvan is het mogelijk inzicht te verkrijgen in de autonome ontwikkelingen van de mobiliteit en de gevolgen van uiteenlopende beleidsmaatregelen (zowel ex-ante als ex-post). Omdat ontwikkelingen vaak sterk met elkaar samenhangen, spelen modellen bij beleidsevaluaties en -prognoses een belangrijke rol. Met modellen is het immers mogelijk een goede representatie te geven van het gedrag en de determinanten daarvan. Bij toepassingen spelen actuele vraagstukken rondom prijsbeleid een belangrijke rol. Denk aan de kilometerheffing, rekeningrijden of parkeerbeleid. Economen wijzen er vaak op dat het doorgaans niet mogelijk is om op basis van crosssecties de effecten van prijsbeleid te onderzoeken. Immers, als de treinprijzen stijgen worden alle treinreizigers daarmee geconfronteerd, als de kosten van de auto stijgen alle autogebruikers. Voor zover sprake is van verschillen, hebben deze verschillen vooral te maken met kwaliteit (eerste of tweede klasse, een grotere auto e.d.). Voor onderzoekers is dan het probleem dat de effecten van prijzen niet te scheiden zijn van de effecten van kwaliteitsverschillen. Economen gebruiken dan ook vaak tijdreeks gegevens voor analyse van prijseffecten, omdat prijzen wel variëren in de tijd. Daarnaast kunnen panelgegevens behulpzaam zijn. Daarbij wordt een groep van mensen in de tijd gevolgd en meermalen ondervraagd. Het voordeel is dat op basis hiervan zowel variatie in de prijzen in de tijd kan worden onderzocht als verschillen in reacties tussen bevolkingsgroepen. Bij deze analyses is van belang rekening te houden met de mogelijkheid van dynamiek in gedrag, waarbij korte-termijn effecten van beleid anders zijn dan lange-termijn effecten Gedragsaanpassingen vergen tijd en dat geldt dus ook voor verplaatsingsgedrag. Soms zal daarbij sprake zijn van aanpassingen die langere tijd na de maatregel nog voortduren, soms zal op voorhand reeds met aanpassingen worden begonnen. Daarvoor bestaat een aantal principiële redenen: 8 In een groot aantal gevallen is sprake van aanpassingskosten. Deze kunnen zowel economisch als psychologisch zijn. Neem bijvoorbeeld een maatregel waarbij de kilometers van grotere auto’s zwaarder worden belast dan van kleinere auto’s. Men verwacht dan (enige) substitutie tussen autotypen. Voor velen zal deze substitutie pas op termijn optreden, omdat mensen niet onmiddellijk hun auto inruilen. Analoog zal een verhoging van de kilometerkosten niet onmiddellijk tot verhuizingen leiden, gezien de hoge transactiekosten (zowel in geld als ten aanzien van bijvoorbeeld sociale contacten). Verhuizen zal meestal pas op wat langere termijn plaatsvinden. Bij de aanpassingssnelheid spelen onder meer een rol de moeite om informatie over alternatieven te krijgen en de zoekkosten. Het idee is dat naarmate de aanpassingskosten hoger zijn, de verschillen tussen korte- en lange-termijn effecten groter zijn. 8 Mensen kunnen anticiperen op (verwachte) nieuwe omstandigheden. Zo zullen sommige mensen die willen verhuizen er nu reeds rekening mee houden dat een maatregel als rekeningrijden wordt ingevoerd. Ook kunnen mensen een auto inruilen omdat ze verwachten dat die in de nabije toekomst wel eens kapot zou kunnen gaan, al weten ze dat niet zeker. Een gedachte kan zijn dat als de gevolgen van mogelijke gebeurtenissen in de toekomst groter zullen zijn, er meer sprake is van anticiperend gedrag. Deze verschijnselen moeten worden beoordeeld met behulp van dynamische modellen. Tot
RICHTLIJNEN OPZET PANEL
1
op heden is daaraan in de literatuur weinig aandacht besteed. Dit is een lacune in onze kennis. Voor zowel beleidsmakers als onderzoekers bestaat een aantal redenen waarom men inzicht zou wensen in anticipatie- en aanpassingsprocessen: 8 In toenemende mate wordt vanuit het beleid verwacht dat inzicht wordt verkregen in de ontwikkelingspaden vanuit een nulsituatie naar het gewenste einddoel. Deze inzichten laten eventuele tussentijdse bijsturing toe, zowel ten aanzien van de communicatie rond beleid als ten aanzien van het beleid zelf. 8 Voor evaluatieonderzoek betekent dynamiek in gedrag dat de keuze van de onderzoeksperiode waarover uitspraken worden gedaan heel belangrijk is. Nu worden deze perioden op basis van ervaringen van experts gekozen, maar het valt aan te bevelen deze nader te onderbouwen. 8 Bij combinatie van maatregelen in de tijd zijn dynamische modellen nodig om de effecten van de afzonderlijke maatregelen te kunnen identificeren. Bij een sterke samenhang kunnen oorzaak en gevolg alleen worden onderzocht door de werking van maatregelen in de tijd te bestuderen. 8 Inzichten in dynamiek kunnen ook worden gebruikt om de volgtijdelijkheid van maatregelen te bepalen. Een voorbeeld is de bouw van nieuwe woonwijken. De vraag die vaak wordt gesteld, is wanneer OV-verbindingen moeten worden aangelegd. Doet men het vroeg, dan zijn de exploitatielasten op de korte termijn sterk negatief. Indien sprake is van aanpassingsgedrag kan het desondanks toch verantwoord zijn om deze keuze te maken, opdat mensen niet worden gedwongen om zich volledig op de auto te richten en daarna nooit meer het OV nemen. In principe zijn met iedere panel dataset analyses uit te voeren waarbij met dynamische aspecten rekening kan gehouden. Echter, een panel dataset dient zowel kwalitatief als kwantitatief aan een aantal voorwaarden te voldoen om geavanceerde dynamische analyses mogelijk te maken waarmee bovenstaande aspecten onderzocht kunnen worden. Zeker wanneer het keuzedata betreft, zoals bijvoorbeeld vervoerwijzekeuze, tijdstipkeuze of rijstrookkeuze (betaalstroken), is de opzet van een panel van groot belang.
Dit rapport In dit rapport beschrijven we aan welke eisen een panel database moet voldoen om dynamische aspecten te kunnen analyseren. In hoofdstuk 2 geven we allereerst een overzicht van de dynamiek van verplaatsingsgedrag en van de voor- en nadelen van een panelbenadering ten opzichte van andere aanpakken. In hoofdstuk 3 wordt vervolgens de opzet van een panel beschreven, geschikt voor dynamische analyses op de (keuze)data waarmee het effect van prijsmaatregelen in verkeer en vervoer vastgesteld moet worden. Tevens komt het analyseren van dit soort databestanden daarbij aan bod, en de alternatieve aanpak van het opzetten van een pseudo panel.
RICHTLIJNEN OPZET PANEL
2
2.
Paneldata
2.1
Dynamiek van verplaatsingsgedrag
In het rapport “Dynamische modellen van prijsbeleid: Verslag fase 1: stap A, B en C” is de theorie van de dynamiek van verplaatsingsgedrag reeds uitgebreid beschreven, in deze paragraaf vatten we de belangrijkste aspecten kort samen: Prijsbeleid wordt gezien als een effectief instrument om te komen tot een goede afstemming tussen de vraag naar vervoer (verbijzonderd naar tijd, plaats en modaliteit) en het aanbod. Vraag daarbij is in welke omvang mensen reageren en wanneer de veranderingen plaatsvinden (de “timing”). Mensen hebben te maken met een aantal typen beslissingen rond het verplaatsingsgedrag: 8 Lange-termijn beslissingen, bijvoorbeeld ten aanzien van de woon- en werklocatie en de beslissing om al dan niet een auto aan te schaffen. 8 Middel lange termijn beslissingen, waarbij keuzen ten aanzien van de activiteitenpatronen worden gemaakt. 8 Korte-termijn-, dagelijkse, beslissingen. Hierbij moet men denken aan routekeuzen voor specifieke verplaatsingen, maar ook aan de precieze tijdstipkeuzen. In de literatuur worden verschillende factoren beschreven en geanalyseerd die dynamiek in gedrag impliceren: 8 Aanpassingskosten. Hierbij onderscheiden we verschillende typen kosten voor het aanpassen van gedrag, zoals economische en psychologische kosten. 8 Informatie en onzekerheid. De toekomst is inherent onzeker, zodat mensen beslissingen over mobiliteit nemen zonder dat ze zeker zijn over de gevolgen. 8 Anticipatie. Individuen kunnen hun gedrag aanpassen aan verwachte veranderingen in omstandigheden die in de toekomst spelen. 8 Veranderingen keuzeproces. Door opgedane ervaringen en leren kan het keuzeproces zelf veranderen. 8 Overige factoren, zoals sociale en culturele factoren die van invloed zijn op de mobiliteit. Kortom, een aantal minder eenvoudig meetbare grootheden kunnen leiden tot vertraging in aanpassingsprocessen aan nieuwe omstandigheden. De statische economische theorie specificeert dat mensen in een bepaalde periode hun behoeften maximaliseren rekening houdend met beperkingen inzake tijd en geld. Deze statische benadering doet geen recht aan de volgende kenmerken van beslissingsprocessen van mensen: 8 Behoeften liggen in de tijd niet vast. Er is sprake van samenhangen in behoeften in de tijd. Zo leidt gewoontevorming ertoe dat behoeften in een bepaalde periode mede veroorzaakt worden door behoeften en gedrag in voorgaande perioden. 8 De budgetbeperkingen liggen niet vast. Mensen kunnen lenen en sparen. Daarnaast zullen mensen verwachtingen hebben ten aanzien van toekomstige ontwikkelingen in inkomen en beschikbare tijd en daarop anticiperen. 8 Mensen kunnen het bevrediging van hun behoeften uitstellen tot het gunstigste tijdstip. 8 Sommige keuzen leiden tot aanzienlijke aanpassingskosten zodat onmiddellijke realisatie van het “optimale” gedrag niet aantrekkelijk behoeft te zijn.
RICHTLIJNEN OPZET PANEL
3
De toekomst is inherent onzeker.
8
Op basis van het voorgaande kan men stellen dat dynamiek in gedrag kan leiden tot: 8 Een grote stabiliteit in gedrag, omdat tal van factoren relatief stabiel zijn in de tijd. Ook een gebrek aan informatie en onzekerheid over alternatieven kunnen leiden tot stabiliteit in gedrag. 8 Langdurige aanpassingsprocessen, afhankelijk van de omvang van de maatregel en de omvang van de psychologische en economische aanpassingskosten. 8 Anticipatie op nieuwe omstandigheden, waarbij mensen vooruitlopen op te verwachten nieuwe omstandigheden.
2.2
Paneldata vs. cross-secties
Het in de vorige paragraaf gegeven overzicht van de dynamiek die bestaat in het verplaatsingsgedrag leidt tot de conclusie dat om gedragsveranderingen als gevolg van het instellen van bepaalde maatregelen goed te kunnen meten, een dynamische analyse van data noodzakelijk is. Door in een panelcontext respondenten te volgen in de tijd kan expliciet rekening gehouden worden met bijvoorbeeld leereffecten en effecten van gewoontegedrag, die er voor kunnen zorgen dat gedragsreacties pas na geruime tijd optreden. Daardoor kunnen gevolgen van maatregelen beter vastgesteld worden dan wanneer er met opeenvolgende cross-secties wordt gewerkt, waar eventuele dynamiek slechts tot uitdrukking komt door het vergelijken van opeenvolgende verdelingen van (keuze)gedrag in de tijd en/of het retrospectief meten van gedrag in eerdere perioden. Indien dit soort gewoontegedrag optreedt, mag verwacht worden dat met een (dynamisch) panelmodel ook beter de gedragreacties voorspeld kunnen worden.
Voordelen panel In het algemeen kunnen er een aantal voordelen van een panelaanpak ten opzichte van een (herhaalde) cross-sectie worden genoemd. - Een panelopzet maakt het mogelijk op een aantal (minstens twee) momenten in de tijd de mobiliteit van individuen te meten en daarmee de eventuele veranderingen in die mobiliteit te relateren aan gewijzigde omstandigheden, zoals bijvoorbeeld het invoeren van een bepaalde maatregel. De eerste meting wordt uitgevoerd voordat een maatregel is ingevoerd en dient als "nulmeting", na invoering van een maatregel worden één of meerdere nametingen gehouden om het effect van die maatregel, op individueel niveau, in kaart te brengen. - Effecten van maatregelen kunnen gescheiden worden van autonome ontwikkelingen die niet het gevolg zijn van beleid. Zo zal economische groei leiden tot een toename van inkomens en tot een toename van autobezit. Door te kiezen voor een panelopzet kan voor deze veranderingen gecorrigeerd worden. - Schattingen van effecten van maatregelen hebben (c.p.) in een panelopzet kleinere marges dan schattingen op basis van herhaald cross-sectie onderzoek. Er worden dus nauwkeuriger resultaten verkregen. - Er kunnen allerlei typen van relaties tussen opeenvolgende metingen worden gelegd. Met andere woorden het “soort” dynamiek kan onderzocht en getest worden. -
De kosten van een panelonderzoek zijn in het algemeen lager dan herhaalde crosssecties. Immers, NAW (Naam, Adres, Woonplaats) gegevens van respondenten zijn
RICHTLIJNEN OPZET PANEL
4
reeds bekend, evenals allerlei andere kenmerken van de respondent. Bij een nieuw cross-sectie onderzoek moet een volledig nieuwe steekproef getrokken worden, wat hogere kosten met zich mee kan brengen.
Nadelen panel Vanzelfsprekend zijn er ook nadelen te noemen van een panelaanpak ten opzichte van een (herhaalde) cross-sectie. - Een deel van de respondenten zal uitvallen en niet meer mee doen aan vervolgmetingen. Van belang is dat de uitvallers niet afwijken van de blijvers. Er moet dus worden nagegaan of de groep uitvallers selectief is. Overigens kan met geëigende statistische methoden voor deze selectieve uitval gecorrigeerd worden. Tevens kunnen panels in principe ververst of aangevuld worden. Voor een panel met als doel dynamische analyses uit te voeren is dit echter geen optie, omdat daar juist zo veel mogelijk opeenvolgende waarnemingen op individueel niveau nodig zijn. Wanneer de uitval groot is zullen de kosten ook groter zijn en boven die van (herhaald) cross-sectie onderzoek uit kunnen komen. - Naast uitval bestaat in een panel de mogelijkheid dat voor een respondent de gegevens voor één of meerdere (tussenliggende) metingen ontbreken, bijvoorbeeld vanwege persoonlijke omstandigheden (vakantie, ziekte). Met deze non-response zal rekening gehouden moeten worden, of dit leidt tot informatieverlies. - Doordat mensen tussen metingen kunnen zijn verhuisd, van baan veranderd, of hun opleiding afgerond kunnen hebben en dergelijke, wordt hun verplaatsingsgedrag beïnvloed. Deze ontwikkelingen zijn geen gevolg van ingevoerde maatregelen. In vervolgmetingen moet dus nagegaan worden of respondenten dit soort veranderingen hebben doorgemaakt. De effecten van maatregelen en demografische ontwikkelingen moeten dus van elkaar gescheiden worden. - Hoe langer een panel is (dat wil zeggen de tijd tussen de eerste en laatste meting), des te meer demografische veranderingen er zullen zijn en hoe hoger ook de uitval zal zijn. Aan de ene kant zou dit pleiten voor korte panels, zodat er zo weinig mogelijk verstorende demografische veranderingen zijn, maar aan de andere kant zagen we in de vorige paragraaf reeds dat het geruime tijd kan duren voordat het effect van maatregelen volledig is uitgekristalliseerd. Kortom, de keuze van de lengte van een panel, en daarmee samenhangend van het aantal metingen, is geen eenvoudige. Deze keuze zal deels op praktische overwegingen (waaronder kosten van dataverzameling) gebaseerd zijn en deels op theoretische.
Panel of cross-sectie? Wanneer is nu een panel de meest geëigende methode om data te verzamelingen en wanneer een (herhaalde) cross-sectie? Dit hangt, vanzelfsprekend, af van wat er onderzocht moet worden. Indien er een algemeen beeld van een bepaalde situatie vastgesteld moet worden, en de ontwikkeling daarin, dan is het houden van een herhaald cross-sectie onderzoek een geschikte methode. Op deze wijze werkt bijvoorbeeld het OVG. Hierin gaat het voornamelijk om het meten van de ontwikkelingen in het verplaatsinggedrag op een geaggregeerd niveau. Het vaststellen van trends kan hierbij plaatsvinden door het vergelijken van groepen met bepaalde kenmerken op verschillende momenten. Indien het echter gaat om de vraag in welke omstandigheden personen hun gedrag veranderen, is een panelaanpak de meest geschikte methode. Door individuen te volgen in
RICHTLIJNEN OPZET PANEL
5
de tijd en daarbij hun verplaatsinggedrag, persoonlijke omstandigheden en omgevingskenmerken vast te leggen, en de veranderingen daarin, kan expliciet het verband gelegd worden tussen veranderingen in omstandigheden en veranderingen in gedrag. Bij een panel aanpak is het tevens mogelijk om dynamiek in het gedrag te onderzoeken, door het vastgelegde gedrag van opeenvolgende metingen aan elkaar te “koppelen”. Op deze wijze kunnen bijvoorbeeld gewoontegedrag of vertraagde effecten onderzocht worden. Samenvattend, een herhaald cross-sectie onderzoek is het meest informatief en efficiënt wanneer men geïnteresseerd is in de ontwikkeling van een gemiddelde (of som) over een aantal perioden, een panel is te gebruiken wanneer veranderingen vastgesteld moeten worden op individueel niveau.
RICHTLIJNEN OPZET PANEL
6
3.
Dynamische panels
3.1
Inleiding
In dit hoofdstuk zullen we een aantal aspecten beschrijven die van belang zijn waneer er, middels paneldata, dynamische analyses uitgevoerd dienen te worden. Een dusdanig panel dient aan een aantal eisen te voldoen, die zowel kwalitatief als kwantitatief van aard zijn. In de wereld van verkeer en vervoer gaat het veelal om verplaatsingsgedrag, veel van de maatregelen van de overheid zijn gericht op het beïnvloeden van dit gedrag middels prijsbeleid. Individuen moeten keuzes maken ten aanzien van bijvoorbeeld vervoerwijze, tijdstip, route, of een combinatie van deze aspecten, en het effect van een (prijs)maatregel op deze keuze moet vastgesteld worden. Omdat dit dus veranderingen in keuzegedrag betreft gaan we bij de opzet uit van een panel voor discrete keuzedata. Continue data, zoals aantallen verplaatsingen, afgelegde afstanden e.d., kunnen gebruikt worden om algemene trends in kaart te brengen. Hierbij kan bijvoorbeeld gedacht worden aan de ontwikkeling van het (gemiddelde) aantal verplaatsingen en kilometers per motief en eventueel per groep van respondenten. Dit kan overigens ook weer zowel middels panel- als (herhaald) cross-sectie onderzoek, afhankelijk van de doelstelling van het onderzoek. In de volgende paragraaf gaan we wat dieper in op (mogelijke) prijsmaatregelen in het verkeer en vervoer. Paragraaf 3.3 geeft vervolgens een overzicht van de aspecten die een rol spelen bij de opzet van een panel waarmee dynamische analyses mogelijk zijn. Bij dit overzicht geven we steeds een illustratie toegespitst op de verkeer en vervoer vraagstukken uit paragraaf 3.2. Paragraaf 3.4 gaat tenslotte in op het analyseren van keuzedata in (dynamische) panelmodellen.
3.2
Prijsmaatregelen in verkeer en vervoer
In het verkeer en vervoer worden allerlei maatregelen overwogen om de mobiliteit van mensen te beïnvloeden. Dit kunnen maatregelen zijn die mensen er toe moeten brengen hun vervoerwijze te veranderen, het tijdstip waarop men zich verplaatst of de route waarlangs deze verplaatsing wordt gemaakt. De maatregelen die overwogen worden zijn veelal prijsmaatregelen. Het idee is door mensen bewust te maken van de kosten die een bepaald gedrag met zich meebrengen, en deze kosten te variabiliseren naar bijvoorbeeld plaats en/of tijd, de mobiliteitskeuze te beïnvloeden. Zoals in het vorige hoofdstuk beargumenteerd leent een panelopzet zich het best om het effect van dit soort maatregelen te meten. Indien bekent is in hoeverre dynamiek een rol speelt in de beslissingen van mensen, kan deze informatie gebruikt worden om beter gefundeerde voorspellingen te maken van het effect van (nieuwe) maatregelen. Alvorens op deze opzet in te gaan, geven we eerst een kort overzicht van prijsmaatregelen die overwogen zijn of worden en waarvan het effect middels panels geanalyseerd zou kunnen worden.
Betaalstroken Eén van de mogelijke maatregelen die overwogen wordt is het introduceren van betaalstroken. Dit zijn stroken, parallel aan de regulier rijstroken, waarvan gebruik gemaakt mag worden indien men daarvoor betaalt. Door gebruik te maken van deze stroken in geval
RICHTLIJNEN OPZET PANEL
7
van congestie op de reguliere rijbanen is het tijdverlies dat men heeft minder. Wanneer een deel van de autobestuurders besluit van de betaalstrook gebruik te maken, zal dit eveneens positieve gevolgen hebben voor de doorstroming op de reguliere rijbanen, door het lagere aanbod. Dit is dan ook het doel van een dusdanige maatregel, namelijk het verhogen van de totale doorstroming op een bepaald weggedeelte voor een bepaalde doelgroep. Er zijn meerdere varianten van betaalstroken denkbaar. De te betalen prijs zou bijvoorbeeld een vast bedrag per keer kunnen zijn, of eventueel per kilometer. Daarnaast is een systeem denkbaar zoals het “FasTrak” systeem op de I-15 bij San Diego. Hier kunnen solorijders gebruik maken van de parallelle carpoolstroken, waarbij het bedrag dat men per keer moet betalen afhangt van de drukte op de carpoolstroken. Des te drukker de carpoolstroken, des te hoger het te betalen bedrag voor solorijders. Voor carpoolers is het gebruik van de carpoolstrook altijd gratis. Het te betalen bedrag voor gebruik van de carpoolstrook wordt getoond voordat de keuze gemaakt wordt van welke rijbaan men gebruik gaat maken. Dit systeem moet er voor zorgen dat de doorstroming op carpoolstroken gehandhaafd blijft. Een systeem van het betalen voor het gebruik van bepaalde stroken zou bijvoorbeeld ook ingevoerd kunnen worden om vanpoolers toe te laten op busbanen (langs snelwegen), waarbij beide eerder genoemde betaalsystemen in principe mogelijk zijn. Een systeem van betaalstroken zou wel zo geavanceerd moeten zijn dat het betalen geen of nauwelijks tijdverlies oplevert. Bij het FasTrak project beschikken deelnemers over een transponder in de auto die registreert of men gebruik maakt van de carpoolstrook, waarna het op dat moment geldende bedrag automatisch van de bankrekening wordt afgeschreven. Daarnaast zijn ook (contactloze) chipkaart varianten denkbaar om de betaling te doen plaatsvinden.
Rekeningrijden Het principe van rekeningrijden is ontwikkeld om de drukte in de Randstad in de (ochtend)spits beter te kunnen beheersen. Elke weggebruiker die in de ochtendspits in de richting van de grote steden in de Randstad rijdt betaalt een vast bedrag per keer. Evenals bij FasTrak zou registratie en afrekening automatisch plaats moeten vinden. Doel van rekeningrijden was te zorgen voor een betere spreiding van de drukte in de Randstad in de ochtendspits, bijvoorbeeld doordat mensen als gevolg van de maatregel besluiten eerder of later op pad te gaan, waardoor er niet betaald hoeft te worden. Tevens zou een gevolg kunnen zijn dat mensen besluiten van een andere vervoermiddel gebruik te maken. Door het introduceren van kilometerheffing (zie hieronder) zal rekeningrijden in de praktijk waarschijnlijk niet ingevoerd worden.
Kilometerheffing Op dit moment bestaat het autobelastingsysteem uit drie componenten: een eenmalige vaste heffing op de aanschafprijs van nieuwe auto’s (de BPM), een jaarlijkse vaste heffing voor elke autobezitter (MRB) en accijns op de brandstof. De BPM wordt berekend op basis van de nettoprijs van de auto: ca. 45% hiervan verminderd met een vrijstelling welke afhankelijk is van de brandstofsoort. De MRB hangt af van het gewicht van de auto en de brandstofsoort. De accijns is een vast bedrag per liter en hangt eveneens af van de brandstofsoort.
RICHTLIJNEN OPZET PANEL
8
Door de overheid wordt variabilisatie (van vaste lasten) gezien als een belangrijk instrument om het gebruik van de auto te beteugelen en de bereikbaarheid te verbeteren: er wordt daarbij meer betaald voor het autogebruik en minder voor het autobezit. Men denkt er aan om op termijn de variabilisatie in de vorm van kilometerheffing in te voeren. Hierbij wordt gedacht aan variabilisatie van de MRB en (een deel) van de BPM. Er zijn meerdere mogelijkheden om deze kilometerheffing vorm te geven. In de meest simpele vorm (de zogenaamde “platte” kilometerheffing) is het tarief dat per kilometer betaald moet worden alleen afhankelijk van het gewicht en de milieukenmerken (brandstofsoort) van de auto. Bij een meer geavanceerde variant wordt tevens rekening gehouden met de tijd waarop en/of de plaats waar gereden wordt. Bij variabilisatie naar tijd is bijvoorbeeld het tarief in de spits hoger dan in het dal, en bij variabilisatie naar plaats gelden voor bepaalde regio’s (bijvoorbeeld de Randstad) of wegtypen (snelwegen) andere tarieven. In principe is het zelfs mogelijk om het tarief nog flexibelere en zelfs dynamisch te maken, bijvoorbeeld door het te betalen bedrag mede afhankelijk te maken van de drukte op weg en/of de snelheid waarmee men rijdt. Vanzelfsprekend geldt dat hoe geavanceerder het systeem is, des te meer eisen er aan apparatuur in de auto en op de weg gesteld moeten worden. Het is de bedoeling om bij de kilometerheffing gebruik te maken van apparatuur in het voertuig (On Board Unit of OBU) en apparatuur langs de weg (DSRC-portalen) met behulp waarvan informatie wordt uitgewisseld. Mede afhankelijk van de vorm van variabilisatie kan kilometerheffing onder meer gevolgen hebben voor: Omvang van het wagenpark. De samenstelling van het wagenpark. De autokilometers (het gebruik van de auto). Emissies. De brandstofmix (via veranderingen in het omslagpunt). Het tijdstip waarop en de plaats waar gereden wordt. Het rijgedrag en de veiligheid. Door de verschuiving van vaste naar variabele lasten kunnen er echter ook ongewenste (milieu-)effecten optreden. Immers, dure (en vaak zware) auto’s worden relatief meer in prijs verlaagd bij een verlaging van de BPM dan goedkope (en vaak kleine, lichtere) auto’s. Bovendien wordt in principe de drempel verlaagd om een auto aan te schaffen, waardoor potentieel een stijging van het autobezit kan optreden, en daarmee tevens effecten op het totaal aantal kilometers dat gereden wordt en de uitstoot aan schadelijke stoffen dat daarmee gepaard gaat.
RICHTLIJNEN OPZET PANEL
9
Recentelijk is door Prof. Ir. R. Pieper onderzoek verricht naar kilometerheffing. Zijn conclusie is dat het systeem op korte termijn in te voeren is, waarbij tevens rekening gehouden kan worden met de privacyaspecten die hierbij een rol kunnen spelen. Dit laatste is mogelijk door alleen het soort weg waarover men rijdt te registreren en niet de exacte locatie waar men heeft gereden. Met een systeem van kilometerheffing kunnen beide eerder genoemde prijsmaatregelen eveneens vormgegeven worden. Immers, in een geavanceerd systeem van kilometerheffing is differentiatie naar plaats (bepaalde stroken, type weg, of locatie) en tijd (ochtendspits) mogelijk. In de volgende paragraaf zullen we dan ook voornamelijk op de concrete invulling voor die toepassing ingaan.
3.3
Opzet panel
Type data Algemeen Allereerst is het van belang om vast te stellen welke maatregel onderzocht moet worden en welke keuze respondenten hebben waarbij die maatregel een rol speelt. Waneer het bijvoorbeeld gaat om het effect van een betaalstrook te meten, bestaat de keuze in principe slechts uit het rijden op een gewone (gratis) rijstrook, en het rijden op de betaalstrook. Echter, er zouden ook allerlei andere effecten een rol kunnen spelen. Als gevolg van een dusdanige maatregel zouden mensen bijvoorbeeld kunnen besluiten hun route aan te passen of nu wel met de auto te gaan in plaats van met de trein. In dat geval bestaat de keuzeset dus niet meer uit twee alternatieven maar kan deze uit aanzienlijk meer alternatieven bestaan. Dit heeft vervolgens ook consequenties voor de te verzamelen data die de keuze verklaren. Naast persoonsgebonden variabelen gaat het nu niet meer om de kosten en de rijtijd bij het gebruik van een betaalstrook versus de reguliere rijbaan, maar ook om dit soort kenmerken van alternatieve routes en vervoerwijzen. Bij een maatregel als kilometerheffing kan het effect van deze maatregel zich afspelen op zowel het niveau van autobezit, het type auto, en het gebruik ervan. Het is dus van belang om bij de opzet van een panelonderzoek te bedenken welke effecten wel en niet onderzocht moeten worden. We moeten hier natuurlijk wel direct bij opmerken dat een goede afbakening van een onderzoek niet uniek is voor panels en/of keuzedata. Voor wat betreft de verklarende variabelen kan er een onderscheid gemaakt worden in twee typen variabelen: - Variabelen die variëren over keuzealternatieven (generieke effecten). - Variabelen die niet variëren over keuzealternatieven (alternatief specifieke effecten). In het eerste geval betreft het vaak variabelen die direct met een maatregel samenhangen. Hierbij kan bijvoorbeeld gedacht worden aan kosten, tijd(winst) en dergelijke. Elk keuzealternatief gaat gepaard met een eigen waarde voor deze variabele. In het voorbeeld van betaalstroken zijn de kosten en de tijdwinst van het gebruik van deze strook groter dan nul, terwijl die voor het alternatief (de gewone rijbaan) nul zijn. Er zijn natuurlijk situaties denkbaar dat dit soort variabelen voor meerdere (of alle) alternatieven een waarde ongelijk aan nul hebben (bijvoorbeeld door “tijd” in plaats van “tijdwinst” als variabele op te nemen). Voor dit type variabelen wordt er meestal één overall effect vastgesteld. Het uiteindelijke
RICHTLIJNEN OPZET PANEL
10
effect op de keuze komt dus tot uitdrukking in de waarde op die variabelen voor elk van de keuzealternatieven. Het tweede type variabele varieert niet over alternatieven. Dit geldt vrijwel altijd voor demografische variabelen. Om het effect van dit soort kenmerken in de keuze vast te stellen moet voor elk alternatief het effect apart vastgesteld worden (een coëfficiënt geschat worden). Het effect van inkomen kan dus bijvoorbeeld verschillen (per gulden of klasse) tussen keuzealternatieven. Een potentieel probleem van demografische variabelen is dat deze, zeker in korte panels, relatief stabiel zijn in de tijd. Het opnemen van veel van dit soort variabelen kan daardoor tot afhankelijkheden leiden tussen (sets van) demografische variabelen, waardoor het effect van elk mogelijk niet goed vastgesteld kan worden. Dit kan deels voorkomen worden door zo weinig mogelijk met klassen te werken. Immers, bij het in een jaarlijks panel werken met leeftijdklassen is de kans groot (90% bij klassen van 10 jaar breed) dat een respondent in opeenvolgende metingen in dezelfde klasse valt. Indien de leeftijd in jaren als afhankelijke wordt opgenomen is er zowel meer variatie en tevens is het aantal te schatten parameters minder in dit geval. Er zijn echter ook demografische variabelen denkbaar waarvoor dit niet mogelijk is.
Concrete invulling Wanneer we uitgaan van een systeem van kilometerheffing dan zijn er, zoals in de vorige paragraaf aangegeven, een aantal terreinen waarop deze maatregel effect kan hebben. Belangrijkste zijn daarbij het autobezit, de samenstelling van het autopark en het gebruik. Daarnaast kan sprake zijn van substitutie naar andere vervoerwijzen. Tenslotte kan, afhankelijk van de wijze waarop de maatregel wordt ingevoerd, ook sprake zijn van veranderingen in tijdstippen en routes. Afhankelijk van welk onderdeel onderzocht moet worden is een panelaanpak te gebruiken. Om de effecten van kilometerheffing op het autogebruik te kunnen onderzoeken, is een vervoerwijzekeuze model met een panel aanpak het meest geschikt. Hiermee kan per individu vastgesteld worden of en wanneer de keuze voor een bepaalde vervoermiddel verandert als gevolg van de invoering van een maatregel als de kilometerheffing. Door na het schatten van een dusdanig keuzemodel een aantal simulatiestudies uit te voeren kan bijvoorbeeld vastgesteld worden, bij verschillende varianten van kilometerheffing, wat de gevolgen voor het autogebruik zijn. Het onderzoeken van het effect op autobezit en samenstelling zou met behulp van (herhaalde) cross-secties kunnen plaatsvinden, omdat het daarbij voornamelijk om resultaten op geaggregeerd niveau gaat, en de ontwikkeling daarvan in de tijd. Wanneer een panelmodel voor de vervoerwijzekeuze opgezet moet worden dan bestaat de afhankelijke variabele uit een set van mogelijke vervoerwijzen. Voor en na de introductie van een maatregel moet dus vastgelegd worden van welk vervoermiddel men gebruik maakt voor een bepaalde verplaatsing. De verklarende variabelen zijn in dit geval naast de demografische gegevens onder andere de kosten (in tijd en geld) van het gebruik van de verschillende vervoermiddelen. Dus ook van de niet gekozen vervoermiddelen moeten deze gegevens bekend zijn. Complicatie hierbij is dat het maar de vraag is of respondenten zich bewust zijn van deze kosten, of zelfs van de kosten van het gekozen alternatief. Indien men zich niet bewust is van deze kosten zou dit een modeluitkomst kunnen zijn, waarbij de keuze dus gemaakt wordt op basis van gewoontegedrag en niet op basis van tijd en geld.
RICHTLIJNEN OPZET PANEL
11
Een panelopzet voor het meten van het effect van betaalstroken is wat eenvoudiger. De keuze bestaat hier uit het wel of niet gebruik maken daarvan, waarbij de afweging één is tussen tijd(winst) en geld. Dit zijn dan ook de belangrijkste gegevens die vastgelegd moeten worden. Met andere woorden, van elke respondent moet in voor- en nameting(en) bekend zijn wanneer hij gebruik maakt van een traject en (voor wat betreft de nametingen) wat de kosten en tijdwinst zijn bij het gebruik van de betaalstrook, ook als hiervan geen gebruik gemaakt maakt. Bij het FasTrak panel werd gedurende de maanden dat de dataverzameling plaatsvond continu gemeten wat de te behalen tijdwinst was op de carpoolstroken in de ochtendspits. Tevens werd het te betalen (variabele) tolbedrag voor solorijders op de carpoolstrook gedurende de hele ochtendspits vastgelegd. Deze gegevens werden vervolgens gekoppeld aan de verzamelde gegevens van de individuele respondenten, waarvan o.a. dag en tijdstip van gebruik van de I-15 waren geregistreerd. Op deze wijze was, naast de gemaakte keuze, voor alle respondenten bekend wat de kosten (tijd en geld) bedroegen voor elk van de verschillende keuzeopties die men had.
Aantallen metingen Algemeen Bij een panelopzet moet er in elk geval een voormeting en een nameting gehouden worden. Hoewel hiermee in principe al een panel dataset verkregen wordt is dynamiek in (keuze)gedrag niet of nauwelijks vast te stellen. Om dit wel te kunnen vaststellen zouden er minstens een tweetal nametingen moeten plaatsvinden. Hoeveel metingen en met welke tussenpozen deze plaats zouden moeten vinden is in het algemeen niet te zeggen, maar voor een goede vergelijkbaarheid van de metingen dienen deze in elk geval wel op vergelijkbare momenten plaats te vinden om externe effecten (zoals bijvoorbeeld vakanties, weekenden, feestdagen) zo veel mogelijk uit te sluiten. Dit zouden afhankelijk van de toepassing dagelijkse, wekelijkse, maandelijkse, halfjaarlijkse of jaarlijkse metingen kunnen zijn, waarbij zoveel mogelijk een vaste meetperiode (uur, dag, week, maand) gekozen dient te worden. Een aspect dat in de literatuur nog weinig aandacht heeft gekregen is de relatie tussen de looptijd van een panel en de termijn waarover voorspellingen gedaan kunnen worden. In het algemeen kan wel gezegd worden dat hoe langer de voorspeltermijn is, des te groter de kans dat niet meer voldaan wordt aan bepaalde aannames over variabelen. Een langere voorspeltermijn vereist dus meer inzicht in de ontwikkeling van variabelen in het model. Wanneer de voorspeltermijn niet langer is dan de looptijd van het panel, kan deze verwachte ontwikkeling naast de in werkelijkheid opgetreden ontwikkeling in een zelfde periode gelegd worden. Overigens is het optreden van trendbreuken ook in dit geval nog steeds mogelijk. Bij dynamische panels bestaat de mogelijkheid dat een model naar een evenwichtsoplossing convergeert, het vergroten van de tijdshorizon voorbij het evenwichtpunt leidt in dat geval dus niet meer tot andere uitkomsten in het model. Aan de ander kant kunnen (dynamische) modellen ook “exploderen” en bij een (te) lange voorspelperiode tot onrealistische resultaten leiden. Bij het bepalen van de lengte van een panel en van de voorspelperiode moet dus goed gekeken worden naar de mate van onzekerheid in de ontwikkeling van variabelen in het model. Hoe langer de looptijd van een panel, des te meer inzicht er verkregen wordt in deze ontwikkeling, overigens zonder dat hiermee deze onzekerheid verdwijnt.
RICHTLIJNEN OPZET PANEL
12
Concrete invulling Bij een panel waarbij de effecten van een prijsmaatregel in het verkeer en vervoer vastgesteld moet worden ligt een halfjaarlijkse of jaarlijkse meting het meest voor de hand. De meest geschikte maanden om een dusdanige meting te houden zijn in maart en september. Dit zijn beide maanden waarin in het algemeen weinig bijzondere omstandigheden van toepassing zijn (vakanties, feestdagen, extreme weersituaties). Om dynamische analyses mogelijk te maken zijn minstens twee nametingen nodig. De voormeting wordt gebruikt als initiële waarneming (uitgangssituatie) in deze analyses. Wanneer het gaat om een vervoerwijzekeuze model kan de voormeting ook nog als “echte” keuzewaarneming gebruikt worden. De voormeting moet wel zo representatief mogelijk zijn voor het onderzoek. Wanneer bij een betaalstrook panel onderzoek de voormeting gehouden wordt terwijl men bezig is met de aanleg van betaalstroken kan dit een verstorend effect hebben op het gebruik van en oordeel over het desbetreffende traject.
Welke respondenten Algemeen Wanneer het effect van een bepaalde maatregel onderzocht moet worden moeten vanzelfsprekend respondenten in het onderzoek betrokken worden waarop deze maatregel effect heeft. Zoals eerder gememoreerd moet hierbij wel bedacht worden dat deze groep groter kan zijn dan in eerste instantie lijkt.
Concrete invulling Bij een onderzoek naar het effect van een betaalstrook zouden in eerste instantie alleen personen in aanmerking komen die in de voormeting gebruik maken van het traject. Maar ook respondenten die voor opening van de betaalstrook van een alternatieve route gebruik maakten komen in aanmerking omdat deze personen zouden kunnen besluiten nu wel gebruik van dat traject te maken, al dan niet over de betaalstrook, door de verbeterde doorstroming. Merk op dat dit de keuzeset feitelijk met (minstens) één alternatief vergroot, men heeft de keuze uit het rijden over de betaalstrook, de parallelle gratis baan of één of meerdere alternatieve routes. Wanneer het onderzoek nog breder getrokken wordt zouden als extra keuzeopties ook nog alternatieve vervoermiddelen toegevoegd kunnen worden en de gebruikers daarvan ten tijde van de voor en nameting(en) in de steekproef opgenomen kunnen worden. Bij panel voor een kilometerheffing geldt iets soortgelijks, hierin zouden alleen autobezitters opgenomen kunnen worden, maar ook een steekproef van alle Nederlanders, omdat deze maatregel ook effect kan hebben op het autobezit.
Aantal respondenten Algemeen Voor wat betreft het aantal benodigde respondenten zijn geen algemene richtlijnen te geven. Feit is wel dat des te meer van de data vereist wordt, des te hoger de kwaliteit en kwantiteit van de data dient te zijn. Dat wil zeggen, een geavanceerd model als een dynamisch panel keuzemodel stelt hoge eisen aan de data. Wanneer dit dan ook nog een model is met relatief veel keuzealternatieven (zeg 5 of meer) dan dienen er relatief veel waarnemingen beschikbaar te zijn om het effect van elke variabele betrouwbaar te kunnen schatten. Vooral het opnemen van alternatief specifieke variabelen leidt tot relatief veel te schatten parameters. Immers, het toevoegen van een enkele extra demografische variabele leidt tot
RICHTLIJNEN OPZET PANEL
13
een aantal extra te schatten parameters gelijk aan het aantal keuzealternatieven. Naast het schatten van de structurele parameters (de verklarende) moeten er in een dynamische specificatie parameters geschat worden die deze dynamiek oppikken. Ook hiervoor geldt dat het aantal van dit type parameters afhangt van het aantal keuzealternatieven. In principe geldt dat voor elk keuzealternatief minstens één dynamische parameter in het model opgenomen kan worden. Dit zijn dus parameters die afhankelijkheden in de tijd meten. Tenslotte kunnen er nog parameters geschat worden die afhankelijkheden tussen keuzealternatieven meten. Het kan zo zijn dat de voorkeur tussen twee alternatieven sterk met elkaar samenhangt. Wanneer men in een model voor de vervoerwijzekeuze de keuze heeft tussen auto, fiets, lopen, trein en bus, dan zouden er bijvoorbeeld sterke afhankelijkheden kunnen bestaan tussen de OV alternatieven (trein en bus) of tussen de langzaam vervoer alternatieven (lopen en fietsen). Ook dit aantal parameters is weer een functie van het aantal keuzealternatieven. Er moeten echter ook restricties op dit soort verbanden worden gelegd om het model te kunnen analyseren. In de volgende paragraaf gaan we hier iets verder op in. De boodschap die uit bovenstaande uiteenzetting afgeleid kan worden is dat het totaal aantal te schatten parameters in een dynamisch panel (keuze)model snel aanzienlijk kan zijn. Dit aantal is echter slechts afhankelijk van het aantal keuzealternatieven en demografische variabelen en niet van het aantal metingen (hoewel er ook specificaties te bedenken zijn waar dit wel het geval is). Een zeer algemene vuistregel zegt weliswaar dat er minstens vijfmaal zoveel waarnemingen als te schatten parameters moeten zijn, maar deze regel is gebaseerd op meer standaard (regressie-) modellen. Voor een dynamisch panel model zouden we van minstens een verhouding van 20-25 maal zoveel waarnemingen als parameters uit willen gaan. Hierbij gelden dan tevens nog een tweetal randvoorwaarden: - Er moet “voldoende” variatie in de data zitten op individueel niveau. Dit betreft zowel de afhankelijke variabele (de keuzes) als de onafhankelijke variabelen (de verklarende). Immers, iemand die steeds dezelfde keuze maakt levert geen bruikbare informatie over wat de keuze bepaalt, alleen gewoontegedrag is dan feitelijk een verklaring. Dit gedrag kan overigens wel opgepikt worden door de parameters die de dynamiek specificeren en kan dus wel een belangrijke modeluitkomst zijn. Tevens geldt dat iemand wiens verklarende variabelen constant zijn in de tijd, maar die wel steeds andere keuzes maakt, deze keuzes dus niet op de verklarende variabelen baseert, maar op meer toevallige omstandigheden. Ook dit levert minder bruikbare informatie op. - Er moeten voor alle demografische variabelen voor elk keuzealternatief voldoende waarnemingen zijn, om elk alternatief specifiek effect te kunnen schatten. Wanneer er bijvoorbeeld meerdere inkomensklassen zijn dan dienen overall (d.w.z. per meting over alle respondenten heen) de respondenten in elke klasse elk keuzealternatief in voldoende mate (minimaal 20-25 waarnemingen) te kiezen. Deze laatste voorwaarde is tevens van belang waneer per meting een model geschat moet worden (dit zal dan vanzelfsprekend geen dynamisch model kunnen zijn). Merk op dat we onder een waarneming hier één keuzeobservatie verstaan. Een respondent die aan vier metingen meedoet levert dus vier waarnemingen op. Dit zou aanleiding kunnen zijn om van lange panels met relatief weinig respondenten uit te gaan. Echter, op basis van het laatste argument geldt een ondergrens aan het aantal respondenten van minimaal 20-25 maal het aantal keuzealternatieven.
RICHTLIJNEN OPZET PANEL
14
Concrete invulling In praktische situaties zal een panel veelal zo’n 500-1000 respondenten moeten bevatten aan het eind van de laatste meting. Rekening houdend met uitval tussen metingen betekent dit dat het aantal respondenten in de voormeting een veelvoud van dit aantal moet zijn. Stel dat we uitgaan van vier metingen (een voormeting en drie nametingen) en er sprake is van steeds 20% uitval tussen metingen, dan zou het aantal respondenten in de voormeting ongeveer twee maal zou groot moeten zijn (bij de laatste meting zijn dan nog 0,83 ≈ 0,5 keer het oorspronkelijke aantal over). Informatie van respondenten die uitvallen gedurende de totale panelperiode kan nog wel gebruikt worden om per meting analyses uit te voeren. Tevens is deze groep van belang om te onderzoeken of de uitval selectief is of niet. Voor de dynamische analyses zijn ze minder goed te gebruiken. Immers, één of meerdere nametingen ontbreken.
Verdere praktische aspecten Een efficiënte manier om gegevens te verzamelen is om bij de dataverzameling aan te sluiten bij bestaande bronnen. Eén van de bronnen die hiervoor gebruikt zou kunnen worden is het OVG. Momenteel is dit een opzet van herhaalde cross-secties. Jaarlijks wordt een landelijk steekproef getrokken waarbij er vervolgens elke maand een deel van de steekproef wordt benaderd (in 2000 n ≈ 150.000 op jaarbasis). Er zou voor gekozen kunnen worden om naast het cross-sectie deel een paneldeel te laten meelopen. Hiermee bestaat dus de mogelijkheid analyses op zowel herhaalde cross-secties uit te voeren als op paneldata. Wanneer een effect van een maatregel in een bepaald gebied onderzocht moet worden (bijvoorbeeld een regio waarin zich een weg met een betaalstrook bevindt), dan zal ervoor gezorgd moeten worden dat het paneldeel van voldoende omvang is in die regio.
3.4
Analyse (dynamische) keuzedata
Het analyseren van een keuzedata, met als doel het belang vast te stellen van elke verklarende variabele bij het maken van de keuze, vindt plaats door het maximaliseren van de likelihood. Deze likelihood is een maat voor hoe goed de gemaakte keuzes verklaard kunnen worden door de onafhankelijke variabelen in het model. De belangrijkste elementen zijn hierbij de gemaakte keuzes en de kans dat elk van de keuzealternatieven gekozen wordt. Vanzelfsprekend is het de bedoeling dat de kansen zo groot mogelijk zijn (ideaal: gelijk aan één) voor de gekozen alternatieven en zo klein mogelijk (ideaal: gelijk aan nul) voor de niet gekozen alternatieven. Keuze-experimenten werden tot voor een aantal jaren geleden vrijwel uitsluitend geanalyseerd door gebruik te maken van het Multinomiale Logit model. Reden voor de populariteit van dit model is met name gelegen in de eenvoud ervan. De keuzekansen die nodig zijn om het model te schatten kunnen worden uitgedrukt als een eenvoudige functie van de verklarende variabelen. Echter, in het Logit model moeten een aantal zeer restrictieve aannames gemaakt worden. Zo dienen keuzealternatieven onderling onafhankelijk te zijn en kunnen ook geen afhankelijkheden tussen opeenvolgende keuzes gemodelleerd worden, anders dan in het structurele deel van de vergelijking. In een panelcontext zijn het echter vaak juist de afhankelijkheden die via het residu gemodelleerd kunnen worden die van groot belang zijn.
RICHTLIJNEN OPZET PANEL
15
Het Multinomiale Probit model is een flexibel model waarbij de mogelijk bestaat allerlei afhankelijkheden te modelleren binnen en tussen keuzesets, maar het schatten van dit type model stuit op een aantal praktische bezwaren. Voor de keuzekansen bestaan namelijk geen eenvoudige uitdrukkingen. Dit betekent onder andere dat het model feitelijk niet meer geschat kan worden wanneer het aantal keuzealternatieven groter is dan drie. In een panelcontext met meerdere metingen is het zelfs met weinig alternatieven in het algemeen niet mogelijk een dynamisch model te schatten met afhankelijkheden tussen metingen. Sinds een aantal jaren is dit probleem van Probit modellen echter niet meer van toepassing. Door het ontwikkelen van simulatie methoden, die de niet te berekenen keuzekansen vervangen door benaderingen daarvan, zijn Probit modellen nu wel te gebruiken bij het analyseren van keuzemodellen, wel ten koste overigens van lange rekentijden om het model te schatten. Een ander probleem met het Multinomiale Probit model is gelegen in de identificatie van de (covariantie-) parameters in het model. Wanneer er veel keuzealternatieven zijn en/of wanneer er veel metingen zijn in een panelcontext bestaat de totale variantiecovariantiematrix al snel uit een aanzienlijke hoeveelheid parameters. Ter illustratie, een keuzeset met vijf alternatieven leidt tot vijftien covariantieparameters en in een panelmodel met drie metingen, elk met vier keuzealternatieven, zijn er al 78 verschillende parameters in de covariantiematrix. Modeltechnisch is het echter zo dat al deze parameters niet geschat (geïdentificeerd) kunnen worden. Zo moeten er wanneer een keuzeset uit M alternatieven bestaat, in elk geval M (niet willekeurige) restricties opgelegd worden aan de covariantiematrix. Zelfs met deze modeltechnische restricties zal het totaal aantal resterende covariantieparameters nog vaak te groot zijn om het model te kunnen hanteren en inzichtelijk te maken. Tevens kunnen er naast de modeltechnische identificatie nog problemen met betrekking tot de identificatie van (covariantie-) parameters bestaan die gelegen zijn in de kwaliteit van de data. Wanneer er niet voldoende variatie is in de data, of niet voldoende waarnemingen voor een bepaald deel van het model, bestaat de mogelijkheid dat voor parameters die formeel wel geïdentificeerd kunnen worden, toch geen goede schatting gevonden kan worden. Dit laatste geldt overigens niet alleen voor covariantieparameters en niet alleen voor Probit modellen.
RICHTLIJNEN OPZET PANEL
16
Conclusie uit het bovenstaande is dat in een Panel Probit model afhankelijkheden binnen en tussen keuzesets niet volledig vrij gelaten kunnen worden, maar hiervoor dienen modelspecificaties gebruikt te worden waarbij het aantal te schatten parameters binnen de perken blijft. In de Econometrische, Transportation en Marketing literatuur bestaat overigens een scala aan modelspecificaties die gebruikt kunnen worden om aan bovenstaande eisen te voldoen. Bijkomend voordeel van het gebruik maken van een specificatie met relatief weinig parameters is dat het aantal benodigde waarnemingen dat noodzakelijk is om de parameters te kunnen schatten lager is dan in een meer complexe specificatie met meer parameters. Een belangrijke eigenschap van een dynamisch model ten opzichte van een statisch model is het expliciet modeleren van afhankelijkheden tussen verschillende metingen. Dit kan enerzijds door als verklarende variabele eerdere gemaakte keuzes op te nemen, waarmee een zogenaamd “State Dependence” model verkregen wordt, en anderzijds door het opnemen van correlaties tussen metingen in de variantie-covariantiematrix van het totale panel model, zoals het geval bij onder andere “Habit Persistence” modellen. In deze laatste situatie is de keuze op een bepaald tijdstip feitelijk een functie van alle onafhankelijke variabelen op alle momenten. Dit betekent vervolgens ook dat nu niet meer de kansen van belang zijn dat een individu een bepaalde keuze maakt op een bepaald moment, maar dat de gezamenlijke kans bepaald moet worden van alle keuzes van een individu op alle momenten. Met keuzedata verzameld op individueel niveau kunnen, middels een panelaanpak, allerlei dynamische analyses uitgevoerd worden. Hoewel de data zelf op individueel niveau verzameld wordt is het met keuzedata niet mogelijk op individueel niveau analyses uit te voeren, dit in tegenstelling tot modellen die middels regressieanalyse geanalyseerd kunnen worden. Reden hiervoor is dat er veel waarnemingen nodig zijn om de (covariantie-) parameters in keuzemodellen te kunnen schatten. Met analyses op basis van keuzedata kunnen dus alleen uitspraken op geaggregeerd niveau gedaan worden. Wanneer de steekproefomvang en het aantal waarnemingen van voldoende grootte is kunnen wel analyses op subgroepen uitgevoerd worden, of groepsspecifieke parameters worden toegevoegd aan het model.
3.5
Opzet Pseudo Panels
Inleiding In het voorgaande is uitgebreid ingegaan op het gebruik van panel data bij de analyse van verplaatsingsonderzoek. Het gebruik van panel data heeft een groot aantal voordelen. Er zijn ook een aantal nadelen van een panelonderzoek genoemd: - Een deel van de respondenten zal in de loop van het onderzoek uitvallen. - Het aantal beschikbare panels is zeer gering. - Indien wel panel data beschikbaar is, is meestal het aantal jaren, waarin het panel gevolgd is, klein. Een alternatief voor panel data is de constructie van een pseudo-panel op basis van herhaalde cross-secties. Centraal in een pseudo-panel staat niet het volgen van individuen in de loop van de tijd, maar het volgen van representatieve individuen. Na het vormen van
RICHTLIJNEN OPZET PANEL
17
cohorten worden de benodigde variabelen van deze representatieve individuen berekend als cohort gemiddelden. Dit alternatief hoeft niet tot inferieure resultaten te leiden: - Een voordeel is dat het probleem van uitval niet aanwezig is bij het gebruik van een pseudo-panel. - Representativiteit is gewaarborgd omdat elke periode een nieuwe steekproef wordt getrokken. - Onder bepaalde voorwaarden kunnen dezelfde schattingstechnieken worden gehanteerd als ware het een echt panel.
Criteria voor cohorten Herhaalde cross-secties bevatten informatie van onafhankelijk getrokken steekproeven uit een populatie op meerdere tijdstippen. Ieder keer opnieuw wordt een nieuwe steekproef van huishoudens getrokken en leden van het huishouden wordt een vragenlijst voorgelegd. Leden van een huishouden kunnen bij deze opzet niet gevolgd worden in de tijd. Cohorten van individuen kunnen wel gevolgd worden in de tijd. Een cohort is hierbij gedefinieerd als een groep individuen met een vast lidmaatschap, waarbij de individuen kunnen worden geïdentificeerd als ze aanwezig zijn in een cross-sectie. Het meest voor de hand liggende voorbeeld is een leeftijdscohort, bijvoorbeeld mannen geboren tussen 1955 en 1960. Door het definiëren van cohorten bij reeksen van herhaalde cross-secties wordt een pseudo-panel geconstrueerd. Centraal in de geschatte modellen met pseudo-panels staat het gebruik van de ‘fixed effects schatter’ op basis van cohort gemiddelden. Een probleem bij het gebruik van een pseudopanel is het optreden van meetfouten, omdat de in de steekproef gemeten cohort gemiddelden af kunnen wijken van de populatiegemiddelden. Om deze meetfouten zo klein mogelijk te houden is het van groot belang om de cohorten zodanig samen te stellen dat: - De intra-individuele verschillen (binnen een cohort) zo klein mogelijk zijn en de interindividuele verschillen (tussen de cohorten) zo groot mogelijk zijn, om de onzuiverheid van de pseudo-panel data schatter te verkleinen. - De omvang van de cohorten voldoende groot is, zodat het steekproefcohort gemiddelde een goede schatting is van het populatiecohort gemiddelde. - De selectievariabele tijdsonafhankelijk is, omdat een individu in hetzelfde cohort dient te blijven in de loop van de tijd. Hoe groter het aantal cohorten (C), hoe kleiner het aantal individuen per cohort (nC), want C * nC = N (N is het aantal individuen in een cross-sectie). Als C groot is, wordt het model geschat op basis van een groot aantal observaties (C*T, T is het aantal jaren). Vergelijk hiermee een panel met veel individuen. Echter als C groot is dan is nc klein, waardoor het steekproef cohortgemiddelde geen nauwkeurige schatting is van het populatie cohortgemiddelde. Bij een nC kleiner dan 100 is de onzuiverheid van de ‘fixed effects’ schatter omvangrijk.
Aantal metingen Voor de constructie van een pseudo-panel zijn gegevens nodig van herhaalde cross-secties. De steekproefomvang van deze cross-secties dient zeer groot te zijn, want de omvang van het cohort dient groter te zijn dan 100 personen en het aantal cohorten dient voldoende groot te zijn om tot betrouwbare modelresultaten te komen. Zelfs bij een minimale omvang van 100 is de standaardafwijking van de steekproefgemiddelden vrij groot, zie de notitie ‘OVG als pseudo-panel: een dynamisch model van autogebruik’. Dus de omvang van een
RICHTLIJNEN OPZET PANEL
18
cohort dient dus eigenlijk groter te zijn dan 100. Voor 14 cohorten per jaar is dus een steekproefomvang nodig van duizenden respondenten per cross-sectie. Het is niet doenlijk om apart voor een pseudo-panel gegevens te verzamelen. Er zal moeten worden aangesloten bij bestaande databestanden. Het ligt voor de hand om de analyse van het verplaatsingsgedrag aan te sluiten bij het OVG.
RICHTLIJNEN OPZET PANEL
19
4.
Samenvattend
Deze notitie geeft een korte beschrijving van een aantal keuzen die moeten worden gemaakt om te komen tot een panelonderzoek voor de evaluatie van specifieke prijsmaatregelen. Zoals gesteld is het belangrijkste voordeel van een panel dat de maatregeleffecten gescheiden kunnen worden van andere relevante grootheden. Daarnaast kunnen met een dynamische analyse van de gegevens uitspraken worden gedaan over de effecten op korteen lange termijn. Uit de literatuur blijkt dat deze effecten substantieel kunnen zijn. In de notitie is een aantal algemene vraagstukken aan de orde gesteld. Voor een preciezere invulling is nadere specificatie van de maatregel nodig. Vast staat in elk geval dat om effecten van een prijsmaatregel in het verkeer en vervoer goed vast te kunnen stellen dit hoge eisen stelt aan zowel de kwaliteit als de kwantiteit van een panel dataset. Wanneer we de (platte) kilometerheffing wederom als voorbeeld nemen dan moeten in elk geval de volgende gegevens verzameld worden bij elke meting van het panel: -
Het autobezit (aantal, type, gewicht, brandstofsoort, enz.). Het autogebruik (kms totaal en per motief, tijdstip, herkomst en bestemmingen). Bezit en/of gebruik andere vervoermiddelen. Demografische kenmerken van de panelleden. Kosten van mobiliteit (zowel van de auto als andere vervoermiddelen).
Wanneer het effect van geavanceerdere varianten vastgesteld moet worden dan moet tevens bekend zijn wat de hoogte van de tarieven waren op verschillende momenten en plaatsen en moet eveneens de route van een autoverplaatsing worden vastgelegd. Een dynamische variant van kilometerheffing stelt zeer hoge eisen aan de dataverzameling, omdat dan van elke weg (of wegdeel) op elk moment het tarief bekend moet zijn en deze gegevens aan de respondenten gekoppeld moeten kunnen worden. De dataverzameling aan de kant van de respondenten kan (voor de platte variant) op een aantal manieren plaatsvinden. Mogelijk kan (deels) bij bestaande bronnen worden aangesloten (zoals het OVG): - Het houden van een enquête (telefonisch, schriftelijk, CAPI, internet), waarin respondenten hun verplaatsingsgedrag gedurende een bepaalde periode (vorige dag, afgelopen week) moeten vermelden. - Het bijhouden van een dagboekje gedurende één of meerdere dagen waarin respondenten hun verplaatsingsgedrag moeten vermelden. - (Indien technisch mogelijk) Middels GPS-achtige technieken registreren wanneer van een auto gebruik wordt gemaakt en waar gereden wordt. Daarnaast is hier ook nog een meer standaard enquête nodig om respondent- en overige gegevens te verzamelen. Effecten van een prijsmaatregel kunnen enerzijds op geaggregeerd niveau worden vastgesteld, en anderzijds door het analyseren van (gecompliceerde) dynamische panel keuzemodellen. Verschil tussen beide is feitelijk dat analyses op geaggregeerde gegevens inzicht geeft in de gevolgen van een maatregel, terwijl met dynamische specificaties inzicht verkregen kan worden in de oorzaken die geleid hebben tot (eventuele) gedragsveranderingen. In dit laatste geval is het daarom ook mogelijk om simulatiestudies uit te voeren. Immers, als bekend is wat (keuze)gedrag kan verklaren, kunnen effecten van allerlei varianten worden doorgerekend. Tevens kunnen met een dynamische specificatie
RICHTLIJNEN OPZET PANEL
20
effecten op zowel de lange als de korte termijn worden vastgesteld. De omvang van een panel zal in de praktijk al snel uit enkele honderden personen bestaan. De exacte benodigde omvang van een panel hangt echter sterk af van de concrete opzet van een panel. Een indicatie geeft de vuistregel dat per te schatten parameter in het dynamische keuzemodel er minimaal 25 waarnemingen moeten zijn. Probleem bij deze vuistregel is echter dat het aantal parameters ook pas is vast te stellen wanneer de aspecten van de panelopzet concreet zijn ingevuld. Wanneer voor een aanpak van pseudo-panels wordt gekozen dan dient dit een aanzienlijke steekproefomvang te hebben, die in de orde van grootte van enkele duizenden respondenten per cross-sectie zal kunnen komen te liggen. Uit praktische overwegingen zal in dat geval moeten worden aangesloten bij bestaande databestanden.
RICHTLIJNEN OPZET PANEL
21