MOGELIJKHEDEN EN BEPERKINGEN VAN STATED PREFERENCE TECHNIEKEN OM BESTAANDE MODELLEN TE ACTUALISEREN
In opdracht van Rijkswaterstaat, Dienst Verkeerskunde
Hague Consulting Group Eric Kroes 31 januari 1990 C 4/837/220/EPK
INHOUD
Pagina
SAMENVATTING 1.
2.
3.
4.
5
6.
INLEIDING EN DOEL
1
1.1 Algemeen 1 .2 Doel 1.3 Opzet van het rapport
1 1 2
THEORETISCHE ASPECTEN
3
2.1 2.2 2.3 2.4
3 4 7 8
Algemeen Theoretisch kader Stated Preference tegenover Revealed Preference Stated Preference en bias
VORMEN VAN STATED PREFERENCE ONDERZOEK
10
3.1 3.2 3.3 3.4
1O 10 11 12
Algemeen Verschillende namen voor één groep methoden Voorkeuren tegenover keuzen Verschillen in opzet, bias en toepassing
DE ANALYSE VAN STATED PREFERENCE GEGEVENS
16
4.1 Algemeen 4.2 Beschikbare analysetechnieken 4.3 Voorspellingen
16 16 18
PRAKTISCHE MOGELIJKHEDEN OM RP MODELLEN TE ACTUALISEREN MET BEHULP VAN SP
22
5.1 Algemeen 5.2 Randvoorwaarden 5.3 Relevante RP deelmodellen
22 22 24
5.4 Afweging en aanbeveling
28
LITERATUUR
32
_.
... -i-tt.--,|_^r^_,^,.i^..i..^i_-.,,,.^,. '/>'_-.••. |V-/J"- -•'..-'S>""';r i:'"-n>' 'i1-1' .
""•- ' ï-T^A-f'/-.-'• .;. • ' . . ' . '
y
'
"
'•
- '
!^:?^-.^^^'ï^.^'W'^':^:.^ ""•
' -
.•-
.
.
.
'.
: ,,, , . ' ^ -
SAMENVATTING
In dit rapport wordt verslag gedaan van een vooronderzoek met als doel het in kaart brengen van de mogelijkheden om met behulp van Stated Preference (SP) technieken bestaande modellen, gebaseerd op waargenomen gedrag, te actualiseren. Onder actualiseren worden twee verschillende dingen verstaan: het aanpassen van de nutsfunctie van het model aan gewijzigde voorkeurspatronen bij de reizigers het uitbreiden van de nutsfunctie, opdat de effecten van meer beleidsmaatregelen kunnen worden voorspeld. In het rapport wordt eerst een theoretisch kader geschetst, van waaruit SP onderzoek en RP onderzoek worden vergeleken. Vervolgens wordt een beschrijving gegegeven van de verschillende hoofdvormen van SP onderzoek die kunnen worden toegepast. Aansluitend worden de beschikbare statistische analysetechnieken beschreven, en wordt ingegaan op de specifieke aspecten die een rol spelen bij het ontwikkelen van voorspellingsmodellen op basis van SP gegevens. Voorts is nagegaan welke onderdelen van het door DVK gehanteerde modelsysteem in principe in aanmerking komen voor actualisering door middel van SP onderzoek. Op basis van verschillende overwegingen is geconcludeerd dat dit met name de volgende drie onderdelen zijn:
het vervoerwijzekeuzemodel het vertrektijdkeuzemodel het routekeuzemodel. Daarna is een afweging gemaakt van de praktische mogelijkheden en beperkingen van een concreet onderzoek met als doel het actualiseren van het modelonderdeel met behulp van SP. Daarbij is geconcludeerd dat een onderzoek gericht op het vervoerwijzekeuzemodel de beste mogelijkheden biedt. Een aantrekkelijke mogelijkheid daartoe is het actualiseren van het vervoerwijzekeuzemodel uit de OVD studie (Overdraagbaarheidsstudie; de resultaten hiervan worden eveneens in het Landelijk Model gebruikt). Daarbij kan tevens de SP methodiek als zodanig worden gevalideerd, en kan nuttige aanvullende informatie worden verkregen ten behoeve van het Onderzoek Waardering Reistijd.
- . • - ' • .
1.
INLEIDING EN DOEL
1.1 Algemeen Bij de Dienst Verkeerskunde van Rijkswaterstaat bestaat behoefte om meer inzicht te krijgen in de mogelijkheden en beperkingen van Stated Preference (SP) onderzoek. Het gebruik van SP technieken is gedurende de afgelopen 10 jaar sterk in zwang geraakt, onder andere vanwege de relatief lage kosten ervan. Bovendien sluit het gebruik en de analyse van SP gegevens goed aan op de ontwikkeling van geaggregeerde analyses en modellen naar gedesaggregeerde modellen, die zich in het voorgaande decennium voltrok. Met behulp van SP methoden kunnen afwegingsprocessen van vervoersconsumenten worden onderzocht en gekwantificeerd, bijvoorbeeld zogenaamde "Value-of-Time" schattingen. Bovendien kunnen SP methoden worden gebruikt voor het construeren van vervoersmodellen of onderdelen daarvan. Een interessante toepassing daarbij is het gebruik van SP onderzoektechnieken om bestaande modellen gebaseerd op waargenomen gedrag (Revealed Preferences of RP) te actualiseren.
Rijkswaterstaat beschikt over een uitgebreid modelsysteem voor de voorspelling van vervoersgedrag (Landelijk Model), vrijwel volledig gebaseerd op RP gegevens. Het is daarom uiterst interessant om meer concreet na te gaan wat de mogelijkheden zijn om door middel van SP gegevens onderdelen van dit bestaande RP model te actualiseren. Daarom heeft Rijkswaterstaat opdracht gegeven aan Hague Consulting Group om een vooronderzoek uit te voeren naar de mogelijkheden hiertoe, en om een voorstel te ontwikkelen voor een praktische studie. In dit rapport wordt het eerste onderdeel, het vooronderzoek, gerapporteerd. Het voorstel voor het SP validatieonderzoek wordt in een afzonderlijke notitie gegeven.
1.2 Doel Het hoofddoel van dit vooronderzoek is het in kaart brengen van de mogelijkheden om met behulp van Stated Preference technieken bestaande RP modellen te actualiseren. Het actualiseren wordt in dit rapport gehanteerd als verzamelnaam, waarbij het zowel kan gaan om het veranderen van de coëfficiënten in bestaande maar verouderde modelspecificaties als om het uitbreiden van het aantal coëfficiënten in de modellen. Het actualiseren heeft dus bet-
rekking op zowel het aanpassen van het model aan veranderingen in het voorkeurspatroon van de reizigers als op het inbrengen van nieuwe variabelen in de modellen, bijvoorbeeld vanwege de gewijzigde politieke context waarin de modellen worden gebruikt. De RP modellen weerspiegelen de voorkeurspatronen van de reizigers ten aanzien van de vervoersalternatieven. Deze patronen hebben een zekere stabiliteit, zowel in ruimte als in tijd, hetgeen overdraagbaarheidsstudies hebben uitgewezen. Op wat langere termijn echter is het niet onwaarschijnlijk dat er toch zekere verschuivingen in deze patronen gaan optreden. Daarom is het
wenselijk om van tijd tot tijd na te gaan of de voorkeurspatronen inmiddels gewijzigd zijn, en of de RP modellen aanpassing behoeven. SP onderzoek is bij uitstek geschikt om dergelijke voorkeurspatronen te kwantificeren, en technieken zijn inmiddels beschikbaar waarbij RP modellen kunnen worden aangepast met behulp van de resultaten van SP onderzoek. De RP modellen zijn gemaakt om beleidsvragen te beantwoorden op het gebied van het verkeer en vervoer. Omdat de politieke context waarbinnen dit gebeurt eveneens aan veranderingen onderhevig is dienen soms nieuwe vragen te worden beantwoord, waarvoor het model niet altijd zonder meer geschikt is. Met behulp van SP technieken kunnen de RP modelspecificaties achteraf desgewenst worden uitgebreid en verfijnd, waardoor alsnog de mogelijkheid ontstaat om de beleidsvragen te beantwoorden.
De actualisatie heeft dus in termen van de gedragsparameters in de modellen betrekking op de volgende twee verschillende elementen: het toetsen en desgewenst veranderen van de modelcoëfficiënten voor de variabelen die reeds in de bestaande modellen zijn opgenomen
het inbrengen van nieuwe variabelen en de bijbehorende coëfficiënten in de modellen. Door de aard van Stated Preference onderzoek, dat volledig gebaseerd is op uitspraken van respondenten in plaats van op waarnemingen van feitelijk gedrag, bestaat er wel twijfel omtrent de validiteit van de resultaten van dergelijk onderzoek. Daarom wordt in het vooronderzoek tevens nagegaan in hoeverre het mogelijk is om tevens een validatie van de SP onderzoekmethode aan RP gegevens uit te voeren. 1.3 Opzet van het rapport In dit rapport wordt eerst een theoretisch kader geschetst, van waaruit Stated Preference onderzoek en Revealed Preference onderzoek worden vergeleken. Vervolgens wordt een beschrijving gegegeven van de verschillende hoofdvormen van SP onderzoek die kunnen worden toegepast. Aansluitend worden de beschikbare statistische analysetechnieken kort beschreven, en wordt ingegaan op de specifieke problemen die zich kunnen voordoen bij de analyse van SP gegevens ).
Vervolgens worden de praktische mogelijkheden besproken om op basis van SP onderzoek concrete onderdelen van het Landelijk Modelsysteem te actualiseren. Daarbij wordt tevens een aanbeveling gedaan voor de uitwerking van een concreet onderzoekvoorstel, dat afzonderlijk wordt gepresenteerd.
)
De beschrijving van de theoretische aspecten is grotendeels gebaseerd op een literatuurstudie die wij eerder hebben verricht voor het Projectbureau Integrale Verkeers- en Vervoerstudies
2.
THEORETISCHE ASPECTEN
2.1 Algemeen Met "Stated Preference Onderzoek" duiden wij een familie van onderzoekmethoden aan die uitgaan van door de respondenten opgegeven voorkeuren voor vervoersalternatieven. Aan de respondenten wordt een aantal vervoersalternatieven ter beoordeling voorgelegd, en aan de respondenten wordt gevraagd om aan te geven aan welk alternatief zij de voorkeur geven. Uit deze opgegeven voorkeuren kan de onderzoeker vervolgens afleiden welke eigenschappen van de vervoeralternatieven voor de respondenten belangrijk zijn, en welke minder belangrijk. Ook kan worden bepaald hoe vervoersconsumenten de kwaliteiten van bepaalde vervoersalternatieven tegen elkaar afwegen. Daarom is één van de gangbare namen van dit soort onderzoek "Trade-off onderzoek. De ter beoordeling aangeboden alternatieven zijn tot op zekere hoogte hypothetisch, en zijn door de onderzoeker gespecificeerd. Bij de specificatie van de alternatieven wordt in de praktijk veelal gebruik gemaakt van technieken uit het experimenteel onderzoek, met als doel om een optimaal efficiënte bepaling van de te schatten coëfficiënten mogelijk te maken. Men noemt Stated Preference daarom wel een quasi-experimentele of zelfs experimentele onderzoeksmethode. Dit in tegenstelling tot de traditionele "Revealed Preference Onderzoeken", die gebruik maken van waargenomen gedrag in "echte" keuzesituaties. Daarbij wordt eveneens afgeleid hoe de vervoersalternatieven tegen elkaar worden afgewogen, maar dan op basis van feitelijk gedrag van de consument. De hierbij impliciet vergeleken vervoersalternatieven zijn reëel, en kunnen niet door de onderzoeker worden gemanipuleerd.
Het gebruik van SP technieken in het verkeer en vervoer is vooral gestimuleerd door de ontwikkelingen in het marktonderzoek. Sinds het begin van de jaren '70 heeft het gebruik van Conjoint Analysis (een verzamelnaam waarmee in het marktonderzoek alle SP technieken worden aangeduid) een grote vlucht genomen. Wij geven hier enkele van de belangrijkste referenties.
Green en Srinivasan publiceerden in 1978 hun paper "Conjoint
Analysis in Consumer Research: Issues and Outlook", dat ook nu nog als een standaardwerk op dit gebied kan worden beschouwd. In dit artikel worden de belangrijkste stappen van een Stated Preference onderzoek behandeld, en wordt een overzicht gegeven van de ervaringen met de methode in het marktonderzoek tot 1978. Het
artikel bevat veel nuttige informatie voor het opzetten van SP experimen ten.
Een uitgebreid overzicht van de soorten toepassingen van analysis in de commerciële sector in de Verenigde Staten ven door Cattin en Wittink (1982). Zij schatten dat er 1000 commerciële toepassingen van conjoint analysis zijn in de periode 1972-1982 in de Verenigde Staten, waarvan
conjoint is gegemeer dan verricht ongeveer
4% in de sector verkeer en vervoer (de meeste toepassingen, ruim 60%, zijn op het gebied van consumptiegoederen). De meest voorkomende toepassingen van conjoint analysis zijn de identificatie en specificatie van nieuwe produkten/concepten, prijsonderzoek, marktsegmentatie en reclame. Door Steer en Willumsen (1981) en door Sheldon en Steer (1982) is voor het eerst beschreven hoe conjoint analysis in het verkeer en vervoer kan worden gebruikt. Daarbij worden alle belanrijke stappen bij de opzet van een onderzoek doorgenomen, en zijn enkele voorbeelden van toepassingen voor de Engelse Spoorwegen gegeven (het afleiden van frekwentie-elasticiteiten, en het onderzoeken van voorkeuren bij zitplaatsreservering). Voorts is door Kocur et al. (1982) een uitvoerige handleiding
geschreven waarin zij de belangrijkste elementen bij de opzet en analyse van wat zij noemen Direct Utility Assessment (SP onderzoek) uiteenzetten. In dit rapport wordt een groot aantal praktische tips gegeven, en is tevens een catalogus van proefopzetten gegeven die bij de opzet van SP experimenten kunnen worden gebruikt .
2.2 Theoretisch kader In Figuur 1 (Kroes en Sheldon 1985) is een schema gegeven waarin de relaties zijn aangegeven tussen de verschillende soorten variabelen waarin de onderzoeker is geïnteresseerd bij de analyse en voorspelling van het verkeers- en vervoersgedrag.
Bij de analyse van verkeers- en vervoersgedrag gaat het veelal om de volgende hoofddimensies: generatie, de keuze om wel of niet een verplaatsing met een bepaald motief te maken
vertrektijdkeuze, de bepaling van het tijdstip waarop wordt gereisd distributie, de keuze van de reisbestemming en het woonadres
modalsplit, de keuze van het vervoermiddel waarmee wordt gereisd routekeuze.
Al deze dimensies bevatten keuze-elementen, die in beginsel kunnen worden onderzocht uitgaande van het in Figuur 1 gegeven theoretische model. In de traditionele RP vindt dit onderzoek plaats door uitsluitend gebruik te maken van de objectief meetbare gegevens (zie Figuur 2 ) . De Stated Preference benadering gebruikt echter zowel objectieve als subjectieve gegevens om het gedrag te analyseren en voorspellen (zie Figuur 3). Uitgangspunt is niet het objectief waarneembare gedrag, maar uitspraken van respondenten omtrent hun voorkeuren of gedragsintenties.
CXTUATXC»uU. C-X-mUlHTÏ
sccio-ect>o
TTWJrt^owT
rvAJLLWTTVC
__WVIK»*<EXT
J
ATTITUDCS TOtARDS TKAxnCL U-TdDMTTVEX
• DtAVtOU*
tKTDO^Ortf
ab**i-»*bl* r tfl r cna l°llc*l ••rl.tolr»
•••«)• Al*«
Figuur 1
Algemeen theoretisch kader bij verkeers- en vervoers-
onderzoek (volgens Kroes en Sheldon 1985)
SITU&T1CM41. TRAINT.:
Ft»CClVT.S
irru*Tjo*JM.
ÏOCIO-I OUUUk£TC • IST1 CS
or jJorviouAi.
T»A«ïW3rr
Figuur
2
CVftUUTIVC
ƒ
StXAVtOUB
Onderzoekrelaties Revealed Preference onderzoek
C3CTTU1MT3
COC 1 0- tC-X7M C
«WCCTVO SITUATICMA1.
«———————————
1
1 ^^•H •**»".•«* Tm*vr--
IKTWTIOIX
• __
• EX*V IOU1
^^W U.TUOUTIVU
OT ItOWXtUAL
1 TPWÏTOWT
l OU V I OU UJ.
rVUJLULTTVC
1
l'———— «rv-.bl* r»7Ctal»7lc*l »*rl**l»«
Figuur
3 Onderzoekrelaties Stated Preference onderzoek
Ben-Akiva en Boccara (1987) schetsen het theoretisch kader als volgt (zie Figuur 4). De vervoersconsumenten maken hun keuzen op basis van voorkeuren voor de vervoersalternatieven. Deze zijn niet direct meetbaar, en worden door de auteurs latente preferenties genoemd. De voorkeuren hangen samen met de eigenschappen van de vervoersalternatieven en variëren met de socio-economische kenmerken van de consumenten. De relatie tussen de eigenschappen van de vervoersalternatieven (via de latente voorkeuren) en het resulterende keuzegedrag (RP) noemen Ben-Akiva en Boccara een structurele relatie, die zich zowel leent voor analyse als voorspelling. Met behulp van de ontwikkelde modellen kan worden bepaald wat de determinanten van het keuzegedrag zijn én kan worden voorspeld hoe het keuzegedrag zal veranderen indien er wijzi-
Scxdoc;=acizic . . Chaizctrdsdc; zsd
Ar=£bct=ï
Figuur 4
-
Latent variable
-
Observable variable
-
Structural relationsh.ip
-
Measurement relationship
Theoretisch kader (volgens Ben-Akiva en Boccara 1987)
gingen in het vervoersysteem optreden. Dit gebeurt in het gangbare RP vervoersonderzoek. Het SP onderzoek daarentegen richt zich niet op het onderzoeken van het f e i t e l i j k e gedrag, maar op de voorkeuren zelf, en hoe deze variëren met (hypothetische) veranderingen in het vervoersysteem. Hoewel de feitelijke voorkeuren die het gedrag bepalen latent zijn wordt door middel van vraagstelling getracht deze zoveel mogelijk expliciet ("Stated") te
maken. Ben-Akiva en Boccara noemen dit
een meetrelatie, die
weliswaar bruikbaar is bij het identificeren en schatten van de latente voorkeuren die het feitelijke gedrag bepalen, maar die niet zondermeer valide is voor de voorspelling van gedrag.
2.3 Stated Preference tegenover Revealed Preference De traditionele verkeers- en vervoersmodellen zijn gebaseerd op gegevens die zijn verkregen door directe observatie van reisgedrag (bijvoorbeeld verkeerstellingen) of door in enquêtes te vragen naar het f e i t e l i j k e gedrag van verkeersdeelnemers. Door het gekozen vervoersalternatief te vergelijken met de niet-gekozen alternatieven kan worden afgeleid naar welk a l t e r n a t i e f de voorkeur van de respondent uitgaat (althans indien er sprake is
van een k e u z e s i t u a t i e ) . Door gebruik te maken van d a a r t o e geschikte statistische technieken kan de impliciete nutsfunctie worden bepaald, waaruit kan worden afgeleid hoe de respondent de verschillende karakteristieken van de alternatieven waardeert en tegen elkaar afweegt. Bovendien kan onder bepaalde voorwaarden hiermee worden voorspeld hoe de vervoersconsumenten zullen reageren als er bepaalde veranderingen in het vervoersysteem worden aangebracht.
Het is duidelijk dat dergelijke Revealed Preference modellen in principe de meest geëigende methode zijn om een zuivere, niet door bias vertekende indruk te k r i j g e n van de afwegingen die de vervoersconsumenten maken, en om het gedrag onder gewijzigde omstandigheden te voorspellen. Er z i j n echter in de p r a k t i j k enkele problemen verbonden aan deze methode, waardoor het niet altijd mogelijk is hiermee de gewenste resultaten te bereiken. De belangrijkste problemen zijn (Kroes en Sheldon 1988): het is niet altijd mogelijk om in de RP gegevens voor alle relevante variabelen voldoende variatie te verkrijgen om een model te kunnen schatten
er is in de praktijk bij RP gegevens vaak sprake van sterke correlaties tussen de relevante verklarende variabelen
(bijv. reiskosten en reistijd), waardoor het moeilijk of zelfs onmogelijk is om goede modellen te kunnen schatten RP modellen kunnen niet worden gebruikt om het gebruik van geheel nieuwe vervoersalternatieven te voorspellen het is voor RP modellen een vereiste dat de verklarende variabelen uitgedrukt kunnen worden in objectieve eenheden; daardoor kunnen hierin normaal gesproken slechts "kwantita-
tieve" variabelen zoals reistijd en reiskosten worden opge nomen; de invloed van verbeteringen in de meer kwalitatieve variabelen, zoals gemak en comfort, op het reisgedrag kan
daardoor niet worden geëvalueerd.
Het zijn juist deze problemen die ertoe hebben geleid dat de SP methoden in het verkeers- en vervoersonderzoek een veelgebruikte onderzoektechniek werden. Deze SP methoden bieden de onderzoeker
immers een aantal aantrekkelijke voordelen ten opzichte van RP modellen: SP methoden leveren precies de voor de modelschatting gewenste variatie in de gegevens op, doordat de onderzoeker zelf kan bepalen welke alternatieven hij/zij de respondent laat beoordelen; hierdoor kan met kleinere steekproeven worden volstaan correlaties tussen de verklarende variabelen kunnen volledig worden vermeden, door de juiste proefopzet te kiezen; dit maakt het mogelijk om de modellen vanuit statistisch oogpunt optimaal efficiënt te schatten SP methoden maken het mogelijk om voorkeuren te meten voor vervoersalternatieven die op dit moment nog niet in werkelijkheid bestaan
deze methoden maken het mogelijk om ook de invloed van meer kwalitatieve variabelen op het vervoergedrag te bepalen
Tegenover deze voordelen staat echter een belangrijk nadeel: mensen doen niet altijd wat zij zeggen, en modellen gebaseerd op antwoorden van respondenten op SP vragen zouden tot vertekende resultaten kunnen leiden. Dit is het klassieke bezwaar dat wordt aangevoerd tegen het gebruik van SP methoden, en dit is de reden waarom er, meer nog dan bij RP modellen, behoefte is aan SP validatie-onderzoek. In de volgende paragraaf wordt nader op dergelijke vertekeningen (ook wel bias genoemd) ingegaan. 2.4 Stated Preference onderzoek en bias
De soorten bias die bij onderzoek gebaseerd op Stated Preferences
kunnen optreden, en de omstandigheden waaronder het aannemelijk is dat deze vertekeningen ook daadwerkelijk zullen optreden, zijn beschreven door Bonsall (1985). Hij onderscheidt daarbij de volgende soorten bias: affirmation bias: soms hebben respondenten de neiging om antwoorden te geven conform de verwachting van de onderzoe ker;
dit is voor hen het "gemakkelijkste" antwoord; deze
vorm van bias kan optreden als uit de vraagstelling kan
worden afgeleid in welke richting de onderzoeker zijn ant woorden zoekt; in een goed en neutraal geformuleerd SP onderzoek hoeft deze vorm van bias echter niet voor te komen unconstrained response bias: deze vertekening ontstaat wanneer de respondenten zich niet goed realiseren wat de negatieve gevolgen zijn van een voorkeur voor een bepaald alter natief; deze vorm wordt ook wel non-commitment bias ge noemd; de kans hierop is het grootst als wordt gevraagd naar
gedragsintenties in een situatie die voor voor de respondent niet volledig relevant of duidelijk is
rationalisation bias: deze vorm van bias onstaat door de neiging van respondenten om hun voorkeuren zoveel mogelijk
in overeenstemming te brengen met de door hen gewoonlijk gekozen alternatieven; ook hierbij geldt dat de kans op deze
vorm van bias vooral optreedt bij SP vragen naar gedragsin tenties, wanneer de respondent onvoldoende oog heeft voor de nadelen van zijn gekozen alternatief ten opzichte van de andere alternatieven policy response bias: deze vertekening ontstaat wanneer de respondenten trachten een bepaalde beleidsbeslissing te beïnvloeden met hun antwoorden; een dergelijke vorm van bias ontstaat wanneer het doel van de studie al te duidelijk in de vraagstelling tot uitdrukking komt. Naast deze specifieke vormen van vertekening zijn er nog drie meer algemene mogelijkheden voor bias van belang:
steekproef bias: deze ontstaat als de steekproef geen zuivere afspiegeling is van de populatie; dit kan bijvoorbeeld het geval zijn wanneer een onvolledig of niet up-to-date steekproefkader is gebruikt (bijv. een verouderd register) non-response bias: vertekening als gevolg van het feit dat de resultaten van de meewerkende respondenten afwijken van die van de niet-respondenten; deze wordt vooral aangetroffen bij enquêtemethoden die tot een aanzienlijke non-respons leiden, zoals bijvoorbeeld schriftelijke enquêtes en zeer gecompliceerde enquêtes (schriftelijke SP enquêtes zijn veelal vrij gecompliceerd) bias als gevolg van het feit dat de respondenten niet goed begrijpen wat er van hen verlangd wordt, of doordat tijdens de SP vragen leereffecten optreden. De mate waarin al deze vormen van bias in de praktijk zullen optreden hangen af van de wijze waarop, en de omstandigheden waaronder het onderzoek wordt uitgevoerd. Om dergelijke vertekeningen zoveel mogelijk te vermijden is door diverse auteurs betoogd dat er bij SP onderzoek zeer hoge eisen gesteld dienen te worden aan de kwaliteit van de enquête, en dienen de SP vragen te worden gesteld in een context die zoveel mogelijk is afgestemd op de kennis en ervaringen van de respondent (Benjamin en Sen 1982, Bradley 1988). Voorts is er bij sommige auteurs (bijv. Sheldon en Steer 1982) een sterke voorkeur voor face-to-face enquêtering, om de non-respons en het eventueel niet begrijpen van de bedoeling van de Stated Preference vraagstelling zoveel mogelijk te beperken. Ook kan door gebruik te maken van ervaren enquêteurs de affirmation bias en de non-commitment bias worden gereduceerd.
3.
VORMEN VAN STATED PREFERENCE ONDERZOEK
3.1 Algemeen
In dit hoofdstuk gaan wij niet in op de wijze waarop een SP onderzoek wordt opgezet; daarvoor verwijzen wij naar de artikelen genoemd in het vorige hoofdstuk. Wel gaan wij in op de diverse namen waaronder SP onderzoek in het verkeer en vervoer bekend is, en op de verschillende (hoofd)vormen waarin SP onderzoek in de praktijk wordt toegepast. Aangezien deze vormen nogal verschillen in opzet, kans op bias en toepassingsmogelijkheden wordt daarop in een aparte paragraaf ingegaan. 3.2 Verschillende namen voor één groep methoden In de SP literatuur, vooral op het gebied van verkeer en vervoer, worden veel verschillende aanduidingen gehanteerd voor SP onderzoek, waaronder de volgende het meest bekend zijn: Conjoint Analysis (bijv. Sheldon en Steer 1982) Trade-off Analysis (bijv. Benjamin en Sen 1982) Functional Measurement (bijv. Hensher en Louviere 1983) Information Integration (bijv. Levin et al. 1983) Laboratory Simulation (bijv. Louviere et al. 1981) Direct Utility Assessment (bijv. Kocur et al. 1982) De namen Information Integration en Laboratory Simulation worden gebruikt om de gehele familie van SP technieken aan te duiden, en zijn dus feitelijk synoniemen voor Stated Preference onderzoek. Met de overige namen worden veelal meer specifieke vormen van SP onderzoek aangeduid. Zo hanteren sommige auteurs de aanduidingen Conjoint Analysis en Trade-off Analysis voor SP onderzoek waarbij voorkeuren worden gemeten door de respondent de alternatieven op rangorde van afnemende preferentie te laten leggen, terwijl de aanduidingen Functional Measurement en Direct Utility Assessment worden gebruikt voor SP onderzoek waarbij de voorkeuren op psychometrische schalen worden gemeten. Andere auteurs houden zich echter niet aan deze conventie, zodat een grote verwarring is ontstaan.
Naast de hierboven besproken technieken zijn er nog andere methoden in zwang, die eveneens op "gedragsintenties" gebaseerd zijn, maar die niet uitgaan van een experimentele opzet. Een van de bekendste hiervan is de "transfer-price" methode. Daarbij wordt aan respondenten in een concrete, feitelijke keuzesituatie gevraagd in welke mate één (of meer) omstandigheden zouden moeten veranderen voordat zij van vervoerwijze zouden veranderen. Het gaat er hierbij om het indifferentiepunt van de nutsfunctie te vinden, door middel van een rechtstreekse schatting door de respondent (zie Bonsall 1985).
10
3.3 Voorkeuren tegenover keuzen In het gebruikelijke SP onderzoek kunnen twee hoofdvormen van vraagstelling worden onderscheiden (Kroes en Sheldon 1988), namelijk: vragen naar voorkeuren ("wilt u deze alternatieven vergelijken, en aangeven naar welk alternatief uw voorkeur uit gaat?"; dit is de "zuivere" Stated Preference (SP) vraag stelling, bekend als de traditionele conjoint analysis)
vragen naar keuzen ("stel u voor dat u voor uw reis zou
kunnen kiezen uit de volgende alternatieven, wat zou u dan doen?; dit is de zogenaamde Stated Intentions ( S I ) vraag stelling, welke wordt toegepast bij conjoint choice analysis) In het traditionele SP voorkeuren-onderzoek wordt aan de respondent gevraagd om een aantal hypothetische alternatieven te vergelijken, en aan te geven naar welk alternatief zijn/haar voorkeur uitgaat. De te beoordelen alternatieven betreffen varianten van één vervoeralternatief, bijvoorbeeld de (reis per) trein. Deze hoofdvorm van SP onderzoek wordt daarom wel aangeduid als onderzoek naar "within-mode preferences" (Bates 1 9 8 3 ) , en heeft uitsluitend als doel om vast te stellen hoe de voorkeur van de respondent varieert met de eigenschappen van het vervoeralternatief. Uit de antwoorden kan worden afgeleid wat het relatief belang is van de verschillende eigenschappen van het vervoeralternatief, en hoe deze tegen elkaar worden afgewogen. Met andere woorden, er wordt een nutsfunctie bepaald, waaruit bijvoorbeeld reistijdwaarderingen kunnen worden bepaald, en waarderingen voor wachttijd, overstap, comfort, enzovoort. Indirect kunnen hieruit tevens elasticiteiten worden afgeleid, door gebruik te maken van een bekende referentie-elasticiteit (zie Kroes en Sheldon 1985). Maar de nutsfunctie kan in principe niet zondermeer worden gebruikt om keuzen te voorspellen (al doen veel marktonderzoekers en sommige verkeers- en vervoersonderzoekers dit ten onrechte w e l l ) . Alleen als alle alternatieven altijd voor alle respondenten beschikbaar zijn (geen situationele beperkingen), en alle relevante eigenschappen van de hypothetische alternatieven z i j n beschreven, kunnen feitelijke keuzen worden voorspeld. In de praktijk van het marktonderzoek is dit soms het geval ( b i j v . wasmiddelen z i j n
overal verkrijgbaar, het aantal relevante eigenschappen, inclusief de m e r k n a a m ,
is
vrij
beperkt) ,
en kan dus op b a s i s van
voorkeurenonderzoek een voorspelling van het keuzegedrag worden
gemaakt. Maar bij het vervoeronderzoek z i j n er vrijwel a l t i j d situationele beperkingen en is het aantal relevante eigenschappen te groot om volledig te b e s c h r i j v e n in een SP e x p e r i m e n t . Bovendien is er veelal sprake van bepaalde (soms niet-rationele) voorkeuren voor bepaalde alternatieven, bijvoorbeeld voor de auto als vervoermiddel.
In het meer recente SP keuze-onderzoek worden eveneens hypothetische alternatieven aan de respondent ter beoordeling aangeboden, maar nu in een heel andere context. Het gaat nu om een hypothetische maar realistische keuzesituatie, waarbij de respondent gevraagd wordt zich te verplaatsen in de aangegeven situatie, en
11
om aan te geven welk alternatief hij/zij zou kiezen. Met andere woorden: hoe zou hij/zij zich in de aangegeven omstandigheden gedragen? Deze hoofdvorm van SP onderzoek wordt in Engeland aangeduid als "between-mode preferences" (Bates 1983), en heeft als doel om vast te stellen hoe het gedrag van de respondent varieert met de eigenschappen van de verschillende vervoeralternatieven. Uit de antwoorden kunnen niet alleen nutsfuncties worden bepaald, maar ook kan direct een keuzemodel worden geschat, waarmee kan worden voorspeld hoe het reisgedrag zou veranderen bij bepaalde veranderingen in de eigenschappen van de vervoeralternatieven, of bij het beschikbaar komen van nieuwe vervoeralternatieven. Hieruit kunnen rechtstreeks elasticiteiten worden afgeleid, en kunnen bijvoorbeeld modalsplit berekeningen worden uitgevoerd. 3.4 Verschillen in opzet, bias en toepassing
Het hierboven besproken verschil tussen SP voorkeuren-onderzoek en SP keuze-onderzoek heeft belangrijke consequenties voor de opzet van de enquêtes, de te verwachten vertekeningen (bias) in de antwoorden van de respondenten en voor de toepassingsmogelijkheden van de resultaten van het onderzoek. 3.4.1 Opzet
Allereerst de opzet van de enquêtes. Bij het zuivere voorkeurenonderzoek is de vraagstelling uitsluitend gericht op het vergelijken van varianten van één soort produkt (bijv. openbaar vervoer) , zonder dat er gedragsconsequenties worden verbonden aan de antwoorden. De vraagstelling is uiteraard hierop afgestemd, en de respondent behoeft er bijvoorbeeld geen rekening mee te houden dat iemand anders de auto nodig heeft, enzovoort. Alleen de verschillen in de door de onderzoeker gepresenteerde variabelen dienen te worden geëvalueerd, want in alle andere opzichten zijn de te beoordelen alternatieven identiek. Bij de opzet van een SP keuze-onderzoek is dit anders. Hierbij gaat het om een keuze tussen verschillende alternatieven, die onderling wezenlijk verschillend zijn (bijv. openbaar vervoer en auto). Daarbij worden er directe gedragsconsequenties aan het antwoord verbonden, dat wil zeggen dat de respondent geacht wordt zo goed mogelijk aan te geven wat hij/zij in de omschreven situatie zou doen. Hierbij dient de respondent dus nadrukkelijk wél rekening te houden met bijvoorbeeld andere mensen die de auto nodig hebben (waardoor hij/zij in de aangegegeven situatie niet in
staat is om per auto te reizen). Hierbij zijn dus niet alleen de door de onderzoeker aangegeven variabelen van belang, maar ook de andere eigenschappen van de te beoordelen alternatieven, en bovendien (nadrukkelijk ook) de specifieke keuzebeperkingen van de respondent (zowel objectief als subjectief). 3.4.2 Bias
Vervolgens de te verwachten vertekeningen (bias) in de antwoorden.
12
Omdat het bij voorkeur-vragen gaat om varianten van één produkt of hoofdalternatief, en er voor de respondent geen gedragsconsequenties verbonden zijn aan het gegeven antwoord, is de kans op de vier door Bonsall onderscheiden vormen van bias in de antwoorden hier gering: er bestaat immers voor de respondent vrijwel nooit aanleiding om bewust of onbewust gemanipuleerde antwoorden te geven. Het enige gevaar, naast uiteraard de kans op non-respons bias, is dat de respondent niet begrijpt wat er van hem/haar verwacht wordt , of dat de omschrijvingen van de alternatieven niet goed overkomen. Bradley (1988) meent dat door een zorgvuldige opzet van de enquête, door goede begeleiding van de respondent (face-to-face interviews) en door een zorgvuldige afstemming van de enquête op de situatie van de respondent dergelijke vertekeningen kunnen worden vermeden. Hij stelt dat het gebruik van draagbare computers bij de enquête vele voordelen biedt, met name op het gebied van de afstemming van de vraagstelling op de respondent. De ervaringen die met deze recent ontwikkelde techniek zijn opgedaan zijn uiterst positief. Bij hypothetische keuzesituaties, waarbij gevraagd wordt naar
gedragsintenties, is de kans op bias beduidend groter. Hierbij wordt de respondent gevraagd om een keuze te maken uit een aantal wezenlijk verschillende gedragsalternatieven. Deze keuze zal niet alleen afhankelijk zijn van de omschreven eigenschappen van de alternatieven, maar van veel meer factoren zoals:
de eigenschappen van de alternatieven die niet expliciet zijn beschreven (d.w.z. de verwachting die de respondent hieromtrent heeft)' de algemene latente voorkeuren in positieve of negatieve zin ten opzichte van een bepaald alternatief (bijv. een nietrationele voorkeur voor de auto, of voor een bepaalde bestemming) de feitelijke keuze die de respondent in vergelijkbare keuzesituaties gewoonlijk maakt, en de situationele randvoorwaarden die daarbij meespelen de mate waarin de respondent geneigd is om van alternatief te veranderen of om vast te houden aan eerder gemaakte keuzen.
Voorts speelt hier veel nadrukkelijker dan bij het zuivere voorkeurenonderzoek mee dat de respondent weliswaar kan zeggen dat hij een bepaald alternatief zou kiezen, maar dat hij/zij in werkelijkheid anders zou handelen (vergelijk de vier vormen van vertekening van Bonsall 1985). Zeker voor de voorspelling van gedrag levert dit problemen op (Ben-Akiva en Boccara 1987). Uit de praktijk van het marktonderzoek is bekend dat er bij
rechtstreekse vragen naar gedragsintenties vertekeningen te verwachten zijn. Lin et al. (1986) beschrijven een standaardmethode waarmee de verkopen van nieuwe produkten kunnen worden voorspeld op basis van gemeten koopintenties, waarbij expliciet wordt gecorrigeerd voor dergelijke vertekeningen. De gehanteerde correctiefactoren zijn gebaseerd op voor- en na-onderzoek, en variëren
13
met de nationaliteit van de respondenten en de aard van de produkten. De koopintentie van respondenten in het westen blijkt bijvoorbeeld over het algemeen een overschatting van de feitelijk te verwachten verkoop op te leveren, terwijl bij respondenten in oosterse landen het omgekeerde het geval is. Ook in het vervoersonderzoek dient met dergelijke vertekeningen rekening te worden gehouden (Kroes en Sheldon 1987). Vooral bij het rechtstreeks vragen naar gedragsintenties onder gewijzigde omstandigheden ("wat zou u doen als ....?") kunnen verschillende soorten bias worden verwacht. Chatterjee en Wegmann (1983) geven een voorbeeld van aanzienlijke non-commitment bias bij vragen naar het verwachte gebruik van nieuwe openbaar vervoervoorzieningen. In
deze studie bleek het feitelijke gebruik van het nieuwe systeem ongeveer de helft te zijn van het op basis van de gedragsintenties berekende gebruik. De overschatting bleek te variëren met de keuzemogelijkheden van de respondenten (autobezitters bleken om voor de hand liggende redenen onbetrouwbaarder in hun respons dan gedwongen openbaar vervoergebruikers) en met het reismotief (sterkere bias bij frekwente reizen zoals woon-werk en winkelen). Andere onderzoekers zijn bij onderzoek naar het gebruik van openbaar vervoervoorzieningen tot vergelijkbare resultaten gekomen, bijv. Couture en Dooley 1981 en Hartgen 1972. Ook Van der Hoorn et al. (1984) constateren dat de werkelijke aantallen veranderaars ongeveer de helft zijn van diegenen die zeggen te gaan veranderen, dit keer met betrekking tot het gebruik van een bepaalde (nieuwe) wegverbinding. Overigens kunnen bovengenoemde biasverschijnselen eveneens deels te wijten zijn aan policy-respons bias: wellicht menen de respondenten door een positief antwoord de beslissing om een nieuw vervoersysteem in te zetten of een nieuwe wegverbinding aan te leggen te kunnen beïnvloeden.
Ten aanzien van non-respons bias en vertekeningen als gevolg van het niet goed begrijpen wat er verlangd wordt bestaat er waarschijnlijk weinig verschil tussen SP voorkeuren-onderzoek en SP keuze-onderzoek. Voor beide geldt dat mondelinge enquêtering sterk de voorkeur verdient om de kans op beide vormen van bias zoveel mogelijk te beperken. Daarbij stelt Louviere (1988) dat het voor de respondent gemakkelijker is zijn/haar voorkeur aan te geven door middel van een keuze dan door middel van rangordening of schaling.
3.4.3 Toepassing Dan de verschillen in de toepassingsmogelijkheden van SP voorkeuren- en keuze-onderzoek. Uit het voorkeurenonderzoek kan worden afgeleid en voorspeld hoe bepaalde alternatieven door
respondenten beoordeeld zullen worden, maar kunnen in principe geen rechtstreekse prognoses van gedrag worden gemaakt. Er wordt immers wel een nutsfunctie bepaald, maar de keuzeregel ontbreekt, waardoor de voorkeuren niet naar keuzen vertaald kunnen worden (in het marktonderzoek worden wel prognoses gemaakt door middel van zogenaamde simulatoren; daarbij wordt verondersteld dat iedere
14
respondent het alternatief met het grootste nut kiest, en wordt vervolgens geteld hoe vaak ieder alternatief is gekozen; dit is echter een gebrekkige ad-hoc methode, die meestal gedoemd is tot vertekeningen te leiden, zoals bijvoorbeeld kan worden afgeleid uit de resultaten van een onderzoek van Benjamin en Sen 1982).
De traditionele vorm van SP voorkeuren-onderzoek is bij uitstek geschikt voor de volgende doeleinden: het bepalen van het relatief belang van verschillende primaire eigenschappen van een vervoeralternatief, bijvoorbeeld reistijd, reiskosten, treinfrekwentie, overstappen, enzo voort en het op indirecte wijze afleiden van elasticiteiten hieruit (zie bijv. Sheldon en Steer 1982) het bepalen van de waardering van reistijd, de zogenaamde
Value-of-Time, voor evaluatiedoeleinden (zie bijv. Bates en Roberts 1983) het bepalen van het relatief belang van kwalitatieve aspecten van een vervoersalternatief of -systeem, bijvoorbeeld het zitcomfort in de trein, de verwarming en ventilatie, de informatievoorziening op de stations, de restauratiemogelijkheden, enzovoort (zie bijv. Andersen et al. 1986) het bepalen van de vorm van de nutsfunctie, waarbij bijvoorbeeld kan worden getoetst op interacties tussen variabelen en niet-lineaire effecten (zie bijv. Lerman et al. 1978). Uit het onderzoek naar SP keuzen kunnen uiteraard eveneens voorkeuren worden afgeleid, maar tevens kunnen de voorkeuren worden vertaald naar keuzegedrag. Daardoor is het mogelijk hiermee voorspellingen van gedrag te maken, en ontstaan de volgende extra toepassingsmogelijkheden: het voorspellen van het gebruik van de bestaande vervoersalternatieven onder gewijzigde omstandigheden, bijvoorbeeld bij verbetering of verslechtering van een alternatief (in feite hetzelfde dat RP modellen ook doen; alleen zijn de SP keuzemodellen meer flexibel voor wat betreft de soorten verklarende variabelen die opgenomen kunnen worden, minder gevoelig voor correlaties tussen de variabelen en vergen zij kleinere steekproeven)(bijv. Kroes et al. 1986) het voorspellen van het gebruik van nieuwe (vervoers)alternatieven (bijv. Louviere en Hensher 1982).
Daarmee wordt het mogelijk om ook voorspellende verkeers- en vervoersmodellen te ontwikkelen gebaseerd op SP keuze-onderzoek. Gezien de kansen op vertekeningen bij deze vorm van SP onderzoek dient dat wel met de nodige voorzichtigheid te worden gedaan. Op de praktische problemen en mogelijke oplossingen daarvoor wordt in het volgende hoofdstuk nader ingegaan.
15
DE ANALYSE VAN STATED PREFERENCE GEGEVENS
4.1 Algemeen
De voorkeursgegevens (of "keuzen") die in SP onderzoek worden verzameld dienen met behulp van statistische technieken te worden
geanalyseerd om de invloed van de afzonderlijke variabelen te kunnen bepalen. Daartoe kunnen verschillende statistische methoden worden gehanteerd, afhankelijk van de gebruikte vorm van de vraagstelling (voorkeur of keuze) en van het meetniveau van de antwoorden (rangorde, schaal of keuze). In dit hoofdstuk gaan wij nader in op de beschikbare analysetechnieken, en op enkele problemen die daarbij kunnen optreden. Verder gaan wij in op de wijze waarop met de resultaten voorspellingen kunnen worden gemaakt.
4.2 Beschikbare analysetechnieken In principe zijn er drie groepen statistische technieken beschikbaar om SP gegevens te analyseren (Green en Srinivasan 1978): metrische methoden, gebaseerd op lineaire regressie (bijv. Johnston 1972) niet-metrische methoden, bijvoorbeeld monotone regressie, zoals MONANOVA (Kruskal 1965) probabilistische methoden, zoals bijvoorbeeld logit (BenAkiva en Lerman 1985) Hiervan zijn alleen bepaalde vormen van niet-metrische regressie specifiek ontwikkeld voor de analyses van SP gegevens; de overige technieken zijn bekend vanuit het algemene econometrisch onderzoek. De metrische regressie kan worden toegepast op SP gegevens die minstens op interval niveau zijn gemeten. Dit kunnen zowel opgegeven voorkeuren als keuzen zijn, gemeten op schalen variërend van 5 tot 100 punten. Ook voorkeuren gemeten door middel van rangordening kunnen onder bepaalde voorwaarden met behulp van regressie worden geanalyseerd, na transformatie van rangwaarden naar schaalwaarden (zie Hensher en Louviere 1983). De niet-metrische regressie kan worden toegepast op voorkeursgegevens die door middel van rangordening zijn gemeten. Deze
methoden, waarvan MONANOVA het meest bekende voorbeeld is, zijn gebaseerd op een iteratief optimalisatie-algorithme, waarbij de nutsfunctie zodanig wordt bepaald dat deze zo goed mogelijk in staat is de opgegeven rangordening te reproduceren. Hierbij wordt voor elke respondent een afzonderlijke nutsfunctie geschat. De probabilistische methoden kunnen worden toegepast op voorkeursen keuzegegevens die door middel van directe keuze, rangordening
of paarsgewijze vergelijking zijn gemeten. De rangordegegevens dienen daartoe eerst te worden "geëxplodeerd" (op een bepaalde wijze getransformeerd, zie Chapman en Staelin 1982).
16
Vergelijkingen tussen de resultaten verkregen met deze verschillende methoden hebben uitgewezen dat over het algemeen de verschillen in verkregen nutsfuncties klein zijn (Cattin en Wittink 1976, Carmone et al. 1978). Green en Srinivasan (1978) concluderen dat de verschillende statistische technieken onderling niet veel verschillen qua voorspellende kwaliteiten. De metrische procedures lijken iets beter te werken als de nutsfunctie ongeveer compensatorisch is, terwijl de niet-metrische methoden het iets beter doen als het voorkeurenmodel meer lexicografisch is. Green en Srinivasan bevelen aan om bij praktisch onderzoek zowel metrische als niet-metrische schattingstechnieken toe te passen,
en de resultaten te vergelijken om een indruk te krijgen van de robuustheid daarvan.
De metrische regressie en de probabilistische methoden kunnen
zowel op individueel niveau (schatting van een afzonderlijke nutsfunctie voor elke respondent) als op groepsniveau (schatting van één nutsfunctie voor een groep respondenten) worden toegepast. De meeste niet-metrische regressiemethoden kunnen uitsluitend voor
individuele respondenten worden toegepast. Voor het maken van voorspellingen op populatie-niveau is het altijd noodzakelijk om de modellen op groepsniveau toe te passen. Individueel geschatte nutsfuncties kunnen daartoe gemiddeld worden. In de praktijk kan dit leiden tot het "ratio of means problem" (het gemiddelde van de verhouding tussen de gewichten in de individuele nutsfuncties hoeft niet gelijk te zijn aan de verhouding tussen de gemiddelde gewichten, Fowkes en Wardman 1988). Groepsgewijze schatting gaat voorbij aan de variatie in de preferenties tussen de respondenten ("taste-variation"). De resultaten van simulatiestudies hebben uitgewezen dat het gebruik van groepsgewijze toepassing van logit na segmentatie in homogene deelmarkten in de praktijk goede resultaten oplevert (Fowkes en Wardman 1988).
Tot voor kort is ervan uitgegaan dat bovengenoemde analysetechnieken zonder veel problemen op SP gegevens toegepast kunnen worden, en is er weinig aandacht besteed aan specifieke problemen die bij de statistische analyse van SP gegevens kunnen optreden. Wel was al langer bekend dat bij analyse op groepsniveau ("gepoolde" schatting) bepaalde vertekeningen in de verkregen twaarden optreden, doordat per respondent meerdere waarnemingen beschikbaar zijn (bijv. Louviere en Woodworth 1983). Dit hoeft niet tot vertekeningen in de geschatte nutsfuncties te leiden, maar veroorzaakt wel een minder dan optimale efficiëntie bij de schatting (Bates 1988).
Zeer recent zijn door Ben-Akiva en Boccara (1987) en door Bates
(1988) artikelen gepubliceerd waarin nader wordt ingegaan op de statistische aspecten bij de analyse van SP gegevens. Ben-Akiva stelt dat bij de schatting van individuele nutsfuncties theoretisch vertekeningen optreden doordat niet aan de voorwaarden voor Maximum Likelihood schatting wordt voldaan (de Maximum Likelihood schatting levert asymptotisch -dat wil zeggen bij grote aantallen
waarnemingen- onvertekende schatters op, maar bij het zeer beperkte aantal waarnemingen dat per respondent beschikbaar is
dient volgens Ben-Akiva met vertekende -biased- schatters rekening te worden gehouden). Ben-Akiva heeft daarom op theoretische
17
gronden een voorkeur voor groepsgwijze schatting (waarbij wél voldoende waarnemingen beschikbaar zijn voor het verkrijgen van onvertekende schatters).
Vanuit andere overwegingen stelt Bates (1988) dat bij groepsgewijze analyse feitelijk meer geavanceerde technieken nodig zijn om rekening te kunnen houden met mogelijke afwijkingen in de verdeling van de storingstermen (groepsgewijze schatting veronderstelt dat de variantie in de storingen tussen de verschillende respondenten gelijk is aan de variantie binnen de antwoorden van één respondent; theoretisch kunnen er echter verschillen zijn, zodat niet meer aan de veronderstellingen van de schatting wordt voldaan). Hij suggereert dat nader onderzoek door middel van simulatie wenselijk is om te onderzoeken in hoeverre deze theoretische problemen ook in de praktijk voorkomen. In de praktijk echter worden zowel individuele als groepsgewijze schattingen uitgevoerd zonder dat er sprake is van enige problemen bij de interpretatie of toepassing van de resultaten. De door BenAkiva en Bates genoemde probleempunten zijn nogal academisch van aard, en lijken vooralsnog het praktisch gebruik van genoemde analysetechnieken niet in de weg te staan.
4.3 Voorspellingen Tot nu toe hebben wij in dit hoofdstuk primair de feitelijke
analyse van de SP gegevens zelf beschouwd: het bepalen van de coëfficiënten voor de ondervraagde respondenten. Voor praktische, toegepaste studies is het minstens zo belangrijk om na te gaan hoe de resultaten, de geschatte nutsfuncties, kunnen worden toegepast om voorspellingen van voorkeuren en keuzegedrag te maken. Het maken van praktische voorspellingen op basis van de resultaten
van SP onderzoek is een gecompliceerd en belangrijk onderwerp, dat pas recent een toenemende belangstelling krijgt. Daarbij gaat het niet alleen om het maken van voorspellingen voor de onderzochte steekproef zelf, maar ook voor andere, meer algemene populaties. Het is met name op dit laatste gebied dat Hague Consulting Group een uitgebreide en unieke ervaring heeft opgebouwd bij de toepassing van volledig gedesaggregeerde modellen, gebaseerd op zowel RP gegevens (bijv. Landelijk Model) als op SP gegevens (bijv. Very Fast Train Study, in Australië).
Op theoretische gronden kan worden afgeleid dat bij SP onderzoek zowel het gebruik van individueel geschatte nutsfuncties als groepsgewijs geschatte nutsfuncties (zoals in 4.2 besproken) voor voorspellingen tot vertekende resultaten kan leiden. De gangbare oplossing hiervoor is het gebruik van een combinatie van SP en RP gegevens, waarbij de RP gegevens worden gebruikt om de SP modellen
te herschalen. (Dit betekent dus dat voor voorspellingen met behulp van SP tevens RP gegevens beschikbaar moeten zijn, of aanvullende RP gegevens verzameld moeten worden.) De genoemde herschaling van de SP modellen kan op twee verschillende manieren
gebeuren.
18
De eerste manier is het gebruik van een zogenaamde referentieelasticiteit. Deze methode werkt als volgt. Allereerst worden een aantal SP coëfficiënten geschat. Vervolgens wordt voor één van die variabelen nagegaan wat de uit de (RP) praktijk bekende elasticiteitswaarde is; dit noemen wij de referentie-elasticiteit (in het openbaar vervoer wordt bijvoorbeeld vaak gewerkt met een gemiddelde tariefelasticiteit van -0.3 ontleend aan onderzoek in Engeland). De elasticiteiten voor de andere variabelen in het SP onderzoek kunnen daarna worden berekend door de SP coëfficiënten te schalen met het quotiënt van de referentie-elasticiteit en de bijbehorende SP coëfficiënt (zie Kroes en Sheldon 1985): JET"*
-* = A**' *sp7 E"
x
waarbij: E E1^ Asp ASP
Asp2
= = = =
de de de de
geschaalde elasticiteit (voor referentie-elasticiteit (voor geschatte SP coëfficiënt voor geschatte SP coëfficiënt voor
variabele variabele variabele variabele
1) 2) 1 2
Hierbij wordt gebruik gemaakt van het feit dat de verhouding tussen de elasticiteiten voor verschillende variabelen onder bepaalde voorwaarden gelijk is aan de verhouding tussen de coëfficiënten in de nutsfunctie, onafhankelijk van het feit of de nutsfunctie gebaseerd is op SP gegevens of RP gegevens. De tweede manier vereist dat er RP gegevens beschikbaar zijn omtrent keuzegedrag in relatie tot dezelfde alternatieven welke in het SP experiment zijn betrokken. Dit kan bijvoorbeeld door aan dezelfde respondenten te vragen welk alternatief zij feitelijk gebruiken, naast de vragen over de voorkeuren in hypothetische omstandigheden. De analyse verloopt dan als volgt. Allereerst worden met behulp van de gebruikelijke analysetechnieken de coëfficiënten bepaald van de in het SP experiment opgenomen variabelen. Vervolgens wordt op basis van de verkregen SP nutsfuncties berekend wat het nut (de utiliteit) is voor elk alternatief in de feitelijke keuzesituatie (dus de RP situatie). Daarna wordt een RP keuzemodel geschat op basis van de eerder berekende SP utiliteiten en de feitelijke keuzen of marktaandelen. In dit model worden de SP utiliteiten als volgt geschaald:
U* = a x USP i- b waarbij: U USP a b
= de geschaalde utiliteit, geschikt voor predictie = de ongeschaalde SP utiliteit = schaalparameter = constante
De constante b representeert hierbij de effecten van alle niet in het SP experiment opgenomen factoren, en de schaalparameter a voert een correctie uit voor het feit dat de varianties in de RP gegevens en de SP gegevens verschillend (kunnen) zijn. Bij deze
methode wordt de verhouding tussen de coëfficiënten volledig bepaald door de resultaten van het SP experiment, terwijl de schaling volledig bepaald wordt door de RP gegevens. Met andere
19
woorden: er wordt van uitgegaan dat de structuur van de nutsfunctie (de verhouding van de waarden van de coëfficiënten onderling) gelijk is, maar dat de invloed van externe factoren en de variantie in de SP en de RP data verschillend is of kan zijn. Deze methode is. nagenoeg identiek aan de methode die bij de Overdraagbaarheidsstudie is gehanteerd om de RP modellen van het ene gebied over te dragen naar het andere. Daarbij werd immers eveneens verondersteld (en via toetsing vastgesteld I) dat de verhoudingen tussen de gedragscoëfficiënten in gebied A goed overeenstemden met die in gebied B (gelijke voorkeurspatronen), maar dat de andere ruimtelijke omstandigheden een herschaling van de nutsfuncties noodzakelijk maakten. Naast de hierboven besproken schattingswij ze in twee stappen (eerst SP coëfficiënten, dan RP schaalparameters) kan sinds kort hiervoor ook een simultane schatting worden uitgevoerd. Hague Consulting Group heeft daartoe een geavanceerde schattingstechniek ontwikkeld die het mogelijk maken om gelijktijdig één reeks gemengde schatters te bepalen, die zowel op de variantie in de RP als de SP gegevens gebaseerd zijn ). Daarbij wordt expliciet rekening gehouden met de verschillen in variantie in beide datasets, en worden de coëfficiënten als het ware geschat als een gewogen gemiddelde van beide datasets, waarbij de wegingsfactor evenredig is met de precisie van de data. Daarbij zijn in de praktijk de SP data doorslaggevend voor de verhoudingen tussen de coëfficiënten onderling, terwijl de RP data de schaling bepalen.
In principe is de laatstgenoemde methode, de simultane modelschatting op basis van RP én SP gegevens, de meest geschikte om een voorspellingsmodel te ontwikkelen op basis van SP gegevens. Wij verwachten dat deze techniek spoedig zal leiden tot een doorbraak op het gebied van het gebruik van SP gegevens voor het ontwikkelen van vervoersmodellen. Op dit moment is deze techniek echter nog zeer nieuw, en er is nog nauwelijks ervaring opgedaan met de toepassing ervan voor de combinatie van SP en RP gegevens. Bovendien vereist de methode speciale, aangepaste schattingsprogrammatuur (Hague Consulting Group heeft daartoe een eigen programma ontwikkeld). De stapsgewijze modelschatting (waarbij eerst de verhouding tussen de coëfficiënten wordt bepaald op basis van de SP gegevens, en daarna het model wordt geschaald op basis van de RP data) is theoretisch iets minder fraai, maar heeft als voordeel dat hij in de praktijk geregeld met succes is toegepast. Bovendien kan daar-
bij gebruik gemaakt worden van standaard schattingsprogramma's, zoals ALOGIT en SPSS-REGRESSION. Voor een praktisch, toegepast onderzoek is dit daarom de aangewezen methode. De als eerste genoemde methode (met gebruik van de referentieelasticiteit) is theoretisch relatief het minst fraai. Deze
^ H i e r b i j worden vergelijkbare technieken gebruikt als bij het schatten van modellen op basis van meervoudige en onvolledige datasets, waarmee Hague Consulting Group eveneens de laatste jaren veel ervaring heeft opgedaan.
20
methode is vooral geschikt wanneer het doel van het onderzoek is het schatten van elasticiteiten, zonder dat een compleet voorspellingsmodel behoeft te worden bepaald. Het voordeel is dat uitsluitend de SP coëfficiënten behoeven te worden bepaald, hetgeen met behulp van standaardprogramma's kan gebeuren. Een nadeel is echter dat er een robuuste referentie-elasticiteit bekend moet zijn, die voldoende nauwkeurig is om als uitgangspunt te dienen voor de schalingsprocedure. In de praktijk is het niet a l t i j d
eenvoudig om een dergelijke elasticiteit te vindenl
21
PRAKTISCHE MOGELIJKHEDEN OM RP MODELLEN TE ACTUALISEREN MET BEHULP VAN SP
5.1 Algemeen In dit hoofdstuk wordt ingegaan op de praktische mogelijkheden om RP modellen te actualiseren met behulp van SP gegevens. Daartoe worden allereerst een aantal randvoorwaarden geformuleerd waaraan voldaan moet worden om tot een zinvolle actualisering te kunnen komen. Deze zijn deels gebaseerd op theoretische aspecten zoals die in de eerdere hoofdstukken aan de orde zijn geweest, en deels op praktische ervaringen.
Vervolgens wordt aangegeven welke deelmodellen van het momenteel gangbare RP modelinstrumentarium, en met name het Landelijk Model, in principe voor actualisering in aanmerking komen, waarna wordt ingegaan op de haalbaarheid en relevantie van die mogelijkheden. Het hoofdstuk wordt afgesloten met een aanbeveling voor een concreet uit te voeren onderzoek.
5.2 Randvoorwaarden Om tot een zinvolle actualisering van een RP model op basis van SP gegevens te komen dient aan een aantal voorwaarden te worden voldaan. Allereerst dient de het te modelleren keuzeproces zich ervoor te lenen om met SP technieken goed te worden onderzocht. Voor een goed SP onderzoek dient onder andere aan de volgende voorwaarden te worden voldaan:
de SP vraagstelling dient concreet en specifiek te zijn, en dient te worden geplaatst in een context die herkenbaar en relevant is voor de respondenten de SP vraagstelling dient eenvoudig te zijn, en alle respondenten dienen goed te begrijpen wat er van hen wordt verlangd de SP vraagstelling dient volledig aan te sluiten bij de context waarin de resultaten geplaatst worden; voor het actualiseren van RP modellen zal dit veelal een keuzecontext zijn. Bovendien dient rekening te worden gehouden met een belangrijke beperking van SP onderzoek, namelijk de relatief korte termijn waarop de resultaten betrekking hebben. Aangezien de hypothetische alternatieven in een goed SP onderzoek zijn opgebouwd rond de huidige situatie, en bovendien de respondenten antwoorden vanuit hun huidige omstandigheden, kan met SP slechts worden voorspeld
wat op een betrekkelijk korte termijn gaat gebeuren. Wij zijn ervan overtuigd dat het heel moeilijk, zo niet onmogelijk is een
SP experiment op te zetten waarmee valide uitspraken worden verkregen over een periode van meer dan enkele jaren. Dit niet vanwege beperkingen van de validiteit van de SP methode op zich, maar vanwege het feit dat het niet haalbaar is om een realistische SP vraagstelling te formuleren met betrekking tot omstandigheden die te ver afliggen van de huidige. Daardoor is het gebruik van SP
22
beperkt tot het voorspellen van veranderingen op korte termijn, vanuit de status quo. Het gebruik van SP om evenwichtssituaties op lange termijn te voorspellen behoort in principe niet tot de mogelijkheden. Overigens geldt natuurlijk ook voor RP modellen dat deze in zekere mate gebonden zijn aan de huidige situatie. Wanneer wij immers een model, geschat op een dataset uit 1989, toepassen om een
voorspelling te maken voor het jaar 2010 veronderstellen wij impliciet ook daarbij dat de onderliggende voorkeurspatronen ongewijzigd blijven. Zoals in het voorgaande hoofdstuk werd beschreven zijn voor het doen van voorspellingen op basis van SP onderzoek altijd parallelle RP gegevens of -modellen vereist, aangezien modellen gebaseerd op alleen SP keuzen tot vertekeningen (kunnen) leiden. Daardoor kan in feite iedere correcte toepassing van SP methoden om voorspellingen te maken van keuzegedrag worden gezien als een vorm van actualisering van RP modellen of -gegevens (daarbij kan
het gaan om het actualiseren van een oud
RP model, maar ook kan
er een volledig nieuw globaal RP model worden geschat, dat met behulp van SP gegevens wordt aangevuld).Laten wij eens wat nader ingaan op de wijze waarop de actualisering kan worden uitgevoerd. Voor het toetsen en desgewenst veranderen van de modelcoëfficiënten voor de variabelen die in een bestaand RP model zijn opgenomen is het vanzelfsprekend allereerst vereist dat wij over een bestaand RP model beschikken. Verder is het noodzakelijk dat een SP experiment kan worden uitgevoerd in dezelfde context als waarop het RP model betrekking heeft. Dit zal veelal een SP keuzeonderzoek zijn, of een SP voorkeursonderzoek waarbij de eigenschappen van het gekozen vervoeralternatief worden gevarieerd. Wanneer het SP experiment is uitgevoerd wordt op de daartoe geëigende wijze een SP nutsfunctie geschat. Vervolgens kan een vergelijking worden uitgevoerd tussen de verhoudingen van de coëfficiënten binnen de nutsfunctie van het RP model en die binnen de nutsfunctie van het SP model. Indien de toetsing uitwijst dat er geen significante verschillen zijn in de verhoudingen (uitgaande van de geschatte standaardfouten in beide modellen) kan worden geconcludeerd dat het "oude" RP model geen actualisering
behoeft. Worden er echter wel significante verschillen gevonden, dan dient de nutsfunctie van het RP model te worden aaangepast. Indien de stapsgewijze of de simultane procedure uit hoofdstuk 4 wordt toegepast (de methode met de referentie-elasticiteit is niet geschikt voor het updaten van RP modellen) betekent dit, dat tevens RP gegevens beschikbaar moeten zijn. Deze RP gegevens dienen dan wel betrekking te hebben op dezelfde situatie als waarop het SP experiment betrekking had. Dit betekent, dat bij de actualisatie van een "oud" model ook nieuwe RP gegevens dienen te worden verzameld. Dit kan echter gelijktijdig met de SP enquête gebeuren, met nauwelijks extra kosten.
Men kan zich afvragen wat dan wel het voordeel is van het gebruik
23
van SP, als toch RP gegevens verzameld dienen te worden. Dit voordeel blijft groot, aangezien voor de modelschatting met SP met een kleine steekproef kan worden volstaan, terwijl voor het schatten van eenzelfde model op uitsluitend RP gegevens veelal een veel grotere steekproef zou zijn vereist. Dit omdat bij RP ten eerste slechts één waarneming per respondent wordt verkregen, en ten tweede de variantie in de waarnemingen gering en nauwelijks manipuleerbaar is. Daardoor zijn vaak veel meer respondenten nodig om dezelfde variantie in de data te verkrijgen. Ter illustratie een voorbeeld. Stel dat voor de schatting van een bepaald RP model 1000 waarnemingen nodig zijn (in de praktijk sterk afhankelijk van de verdeling van de keuzesituaties en daarmee van de verkregen variantiel). Een vergelijkbaar SP model zou kunnen volstaan met 100-200 respondenten, die gezamelijk eveneens een kleine 1000 waarnemingen opleveren. Indien de kosten van het SP onderzoek per enquête in dezelfde orde van groote liggen als die van het RP onderzoek (bijv. bij schriftelijke SP)
betekent dit een enorme kostenbesparing. Maar zelfs als de kosten van de SP enquête drie of viermaal zo hoog liggen blijft het gebruik van SP nog een belangrijke besparing opleveren l
Een laatste -praktische- randvoorwaarde voor het actualisatieonderzoek is in dit geval dat er een validatie kan worden uitgevoerd, teneinde te kunnen vaststellen of deze methode van actualiseren een voldoende betrouwbaar model als resultaat heeft. In praktische zin betekent dit, dat er niet alleen coëfficiënten dienen te worden geschat met behulp van SP, maar dat het ook mogelijk moet zijn om voor dezelfde keuzesituatie volledige RP modellen te schatten. Dit om te kunnen vergelijken of de verhoudingen tussen SP coëfficiënten vergelijkbaar zijn met die tussen de RP coëfficiënten. Resumerend kan worden gesteld, dat voor het uitvoeren van een actualisatie van een bestaand RP model met SP gegevens het volgende is vereist: er moet een bestaand RP model zijn, dat aanpassing of uitbreiding van de coëfficiënten behoeft er moet een goed SP experiment uitgevoerd kunnen worden in een context die vergelijkbaar is met die waarop het RP model betrekking heeft het moet gaan om een keuzeproces op korte termijn er moeten tegelijk RP gegevens met betrekking tot hetzelfde
keuzeproces verzameld kunnen worden er moet een schattingsprocedure worden toegepast die expliciet rekening houdt met de verschillende statistische eigen schappen van de RP en de SP dataset er moet een validatie van de SP resultaten uitgevoerd kunnen worden.
5.3 Relevante RP deelmodellen In het Landelijk Model worden vele deelmodellen onderscheiden, die alle bijdragen tot de uiteindelijke Verkeersprognoses. De volgende
24
deelmodellen zijn in het systeem opgenomen: het het het het het het het
rijbewijsbezitmodel autobezitmodel ritgeneratiemodel distributiemodel modalsplitmodel vertrektijdkeuzemodel routekeuzemodel.
Hieronder bespreken wij voor elk van deze modellen in hoeverre zij voor actualisatie door middel van SP onderzoek in aanmerking komen, c.q. daarvoor geschikt zijn. Het rijbewijsbezitmodel voorspelt de kans dat een persoon die daarvoor op grond van zijn/haar leeftijd in aanmerking komt een rijbewijs bezit. In Nederland is de situatie inmiddels zodanig, dat deze kans voor iedereen, zowel man als vrouw, zeer groot is. En in de nabije toekomst wordt verwacht dat vrijwel iedereen een rijbewijs bezit. Het keuzeproces wordt hier primair bepaald door socio-economische kenmerken, en niet zozeer door ruimtelijke of situationele omstandigheden. Daardoor leent het zich niet erg goed voor een SP experiment, aangezien de hypothetische keuzealternatieven nauwelijks realistisch voor te stellen zijn. Los daarvan zijn er voor zover ons bekend vanuit de politiek geen ideeën om het rijbewijsbezit te beïnvloeden als instrument om de mobiliteit te beïnvloeden, of om bijvoorbeeld de vervoerwijzekeuze om te buigen in de richting van het openbaar vervoer. Daarom lijkt er weinig behoefte te bestaan aan een aanpassing of een uitbreiding van de huidige rijbewijsbezitmodellen.
Het autobezitmodel voorspelt de kans dat een huishouden zal beschikken over een auto, gegeven de socio-economische kenmerken van dat huishouden en de woonplaats. Tot op zekere hoogte gelden voor dit model dezelfde overwegingen als die hiervoor bij het rijbewijsbezitmodel zijn genoemd. Vanuit het beleid gezien echter is dit deelmodel veel interessanter dan het rijbewijsbezitmodel, en bestaat er wel degelijk behoefte aan inzicht in de factoren die het autobezit beïnvloeden. Eén aspect daarvan is het soort en type auto dat wordt aangeschaft. Vanuit verschillende overwegingen is het interessant om na te kunnen gaan hoe de samenstelling van het autopark kan worden beïnvloed, bijvoorbeeld door prijsmaatregelen. Daarbij valt te denken aan de verdeling naar brandstoftype (benzine, diesel, LPG) of bijvoorbeeld naar vervuilingsgraad ("schone" conventionele motor, eenvoudige katalysator, geregelde driewegkatalysator). In principe is het mogelijk om door middel van SP onderzoek de bestaande autobezitmodellen in het Landelijk model uit te breiden zodat zij verdelingen over dergelijke typen personenauto's voorspellen. Een ander aspect daarvan is het dynamische karakter van het autobezitproces. Het zou interessant zijn om de modelmatige representatie van het autobezit meer te doen aansluiten bij de in werke-
25
lijkheid optredende processen, van de aanschaf van een auto tot en met de sloop van de auto. Een personenauto heeft immers een vrij lange levensduur, en er is een tendens tot een verdere verlenging van die levensduur. Daardoor is het autobezit een slechts vrij langzaam te besturen grootheid. De huidige autobezitmodellen houden hiermee slechts indirect rekening, en een actualisering met behulp van SP technieken zou interessant kunnen zijn. Voor wat betreft de praktische uitvoering van die actualisering is er echter een probleem. Om de autobezitmodellen werkelijk te verbeteren, door één of beide hierboven genoemde aspecten toe te voegen, zou niet volstaan kunnen worden met een eenvoudige aanpassing of uitbreiding van de bestaande modellen. In plaats daarvan zou de gehele modelstructuur moeten worden herzien, hetgeen de scope van het gewenste SP actualiseringsonderzoek verre teboven gaat. Ondanks het feit dat het op zich goed mogelijk zou zijn om SP experimenten op te zetten die de gewenste inzichten zouden geven lijken de autobezitmodellen daarom niet de meest geschikte kandidaat te zijn voor de actualisering. Het deelmodel dat de ritgeneratie simuleert berekent de kans dat een bepaald persoon al of niet een bepaalde (reeks) verplaatsing(en) zal maken. Deze is in belangrijke mate afhankelijk van socioeconomische factoren, en slechts in zeer beperkte mate van bereikbaarheidsvariabelen. In feite is de ritgeneratie volledig een afgeleide van het activiteitenpatroon: voert iemand een bepaalde activiteit uit, dan moet er (vanzelfsprekend) een verplaatsing worden gemaakt. Voor veel activiteiten is het daarom niet eenvoudig, of zelfs vrijwel onmogelijk, om een zinvol SP experiment op te zetten. Alleen voor facultatieve verplaatsingen, bijvoorbeeld voor recreatie of voor bepaalde vormen van winkelen, is dit goed te doen. In de literatuur zijn er ook wel enkele voorbeelden bekend van SP onderzoek gericht op dergelijke vormen van ritgeneratie. Maar in het algemeen lijkt het actualiseren van RP ritgeneratiemodellen met behulp van SP voor de meest gemaakte soorten verplaatsingen, waaronder woon-werk en onderwijs, een zeer moeilijk uit te voeren taak.
Het distributiemodel beschrijft het proces van de keuze van de locatie voor de uit te voeren activiteiten. Bij dit proces spelen de bereikbaarheidsvariabelen een zeer grote rol. In principe is het daardoor mogelijk om hypothetische keuze-alternatieven te specificeren die een zinvolle analyse van de voorkeuren mogelijk zouden maken. In de praktijk is dit ook hier niet eenvoudig. Dit keer is het de termijn waarop de keuzen betrekking hebben die roet in het eten gooit. Beslissingen over de keuze van woon- of werkplaats zijn beslissingen die mensen slechts zelden nemen. Daardoor is het opzetten van een realistisch SP keuze-experiment
op dit gebied alweer niet eenvoudig. De meeste mensen hebben immers op korte termijn geen plannen om te veranderen, en evenmin een recente verandering achter de rug. Daardoor kan met deze mensen geen zinvol SP experiment worden uitgevoerd. Slechts mensen die wel onlangs een dergelijke verandering hebben doorgemaakt, of die zeer actieve plannen in die richting hebben zouden als
26
respondent geschikt zijn. Overigens zijn in de literatuur wel toepassingen van SP op locatiekeuze bekend, voornamelijk winkelcentrumkeuze. Het is duidelijk dat een dergelijke meer flexibele locatiebeslissing zondermeer goed met SP te onderzoeken is. In het Landelijk Model is dat soort verplaatsingen echter slechts van ondergeschikt belang, en gaat het veeleer om de modelmatige representatie van meer "vaste" soorten verplaatsingen, die minder geschikt zijn om met SP geactualiseerd te worden.
Het modalsplitmodel voorspelt de kans dat een bepaalde persoon voor een bepaalde verplaatsing de auto gebruikt, of het openbaar vervoer, of een ander vervoermiddel. In dit soort modellen spelen de bereikbaarheidsvariabelen weer een belangrijke rol. En ook hier is het in theorie mogelijk om zinvolle SP experimenten op te zetten waarin de reacties op hypothetische keuze-omstandigheden worden onderzocht. Aangezien de vervoermiddelkeuze tevens in principe een "korte-termijn" keuze is, leent dit keuzeproces zich inderdaad zeer goed voor SP onderzoek. Bij het "korte-termijn" karakter van dit keuzeproces kunnen echter enige vraagtekens gezet worden. Het is immers uit de praktijk bekend dat veel mensen zich bij hun vervoerwijzekeuze sterk door gewoonten laten leiden, en zeker niet elke dag opnieuw een keuze bepalen. Voor de onderzoekbaarheid door middel van SP is dit
echter geen beletsel. Bepalend is dat men op korte termijn kan switchen, onafhankelijk van het feit of men dit ook daadwerkelijk doet of niet. Overigens leent het SP onderzoek zich zeer goed voor het onderzoeken van juist dit "gewoonte" aspect van de vervoerwijzekeuze. Zo zijn er verschillende onderzoeken bekend die dit aspect door middel van SP hebben gekwantificeerd. Dergelijke modellen maken
het mogelijk om korte-termijn voorspellingen te maken van veranderingen in de vervoerwijzekeuze. Dit is echter niet de termijn waarop het Landelijk Model opereert. Het deelmodel dat de vertrektijdkeuze simuleert in het Landelijk Model bestaat momenteel nog uit een aantal constanten, die de waargenomen gemiddelde verdeling van de reizen over de tijdvakken van de dag (ochtendspits, avondspits, dalperioden) reproduceren.
Er wordt echter gewerkt aan een verbetering van dit modelonderdeel, waarmee veranderingen in de vertrektijdkeuze kunnen worden voorspeld onder de invloed van congestie op het netwerk. In principe kan de vertrektijdkeuze goed worden onderzocht met behulp van SP (en in feite wordt dit modelonderdeel geheel gebaseerd op SP!). Voor de praktische uitvoering van een actualisering komt dit deelmodel echter nu nog niet in aanmerking, aangezien het nog niet operationeel is.
Het routekeuzemodel simuleert en voorspelt de route die een reiziger met een vervoermiddel (veelal de auto) aflegt door het netwerk voor een bepaalde verplaatsing. Daarbij wordt in de praktijk vaak gebruik gemaakt van eenvoudige deterministische modellen
27
die al het verkeer toedelen aan de kortste route ("alles-ofniets") of die het verkeer verdelen over de beschikbare routes totdat een "gebruikersevenwicht" is bereikt. In principe leent de routekeuzesituatie zich goed voor SP onderzoek: de keuzesituatie lijkt vrij duidelijk, de berijkbaarheidsvariabelen spelen een belangrijke rol en de keuzesituatie is op korte termijn flexibel. In de praktijk blijkt het niet zo eenvoudig te zijn om een goed SP routekeuze-experiment op te zetten, vooral omdat de beschrijving van de keuze-alternatieven gecompliceerd is, en een verregaande mate van aanpassing aan de specifieke omstandigheden vereist. Toch zijn er diverse geslaagde SP onderzoeken met betrekking tot de
routekeuze uitgevoerd, en ondanks de technische complexiteit is dit goed haalbaar. De beleidsmatige relevantie van een eventueel SP routekeuze-experiment voor actualisering van een bestaand RP model is echter enigszins onduidelijk. Er zijn bestaande routekeuzemodellen die worden gebruikt om toedelingen van het autoverkeer uit te voeren, maar deze zijn gebaseerd op zeer eenvoudige gegeneraliseerde kosten concepten. Het valideren van de gehanteerde functies lijkt een nuttige zaak, zeker als binnenkort ook de gevolgen van bijvoorbeeld tolheffing op bepaalde routes doorgerekend moeten worden. Dergelijk onderzoek wordt momenteel echter deels door anderen uitgevoerd. Naast de bestaande toedeelmodellen zijn er onlangs door Hague Consulting Group nieuwe RP routekeuzemodellen ontwikkeld, om te komen tot beleidsmatig meer relevante modellen. Deze modellen zijn inmiddels op overdraagbaarheid getoetst. Daarbij is geconcludeerd dat de modellen in hun oorspronkelijke, gecompliceerde vorm, niet goed overdraagbaar zijn. Maar de aangepaste, vereenvoudigde modellen bleken redelijk goed overdraagbaar te zijn. Op basis van de beschikbare RP gegevens konden echter niet alle gewenste variabelen succesvol in de modellen worden opgenomen. Het zou wenselijk zijn om de nutsfuncties van deze modellen uit te breiden met coëfficiënten voor de belangrijkste van deze ontbrekende variabelen, waaronder kosten (relevant voor rekening rijden) en informatie (relevant voor routegeleiding).
5.4 Afweging en aanbeveling Op basis van de beschrijving van de concrete deelmodellen van het
Landelijk Model die in principe voor actualisering in aanmerking komen kan worden geconcludeerd dat er in principe drie soorten deelmodellen zijn die geschikt zijn voor een SP onderzoek: het vervoerwijzekeuzemodel
het vertrektijdkeuzemodel het routekeuzemodel. Hoewel het actualiseren met behulp van SP slechts voor een beperkt deel van de modellen goed mogelijk is blijft het zeer zinvol om de mogelijkheden van deze techniek nader te onderzoeken. De techniek is biedt immers enerzijds de mogelijkheid om in belangrijke mate kosten te besparen opzichte van het actualiseren met behulp van RP
28
gegevens. En anderzijds kunnen met behulp van SP beleidsvariabelen worden onderzocht die zich niet of nauwelijks lenen voor onderzoek door middel van uitsluitend analyse van RP gegevens. Om een aanbeveling te kunnen doen welke van deze drie mogelijkheden het meest geschikt is voor een praktisch onderzoek dient een afweging te worden gemaakt, waarbij de voor- en nadelen voor elk van de modellen op een rij worden gezet. Wij laten hieronder elk van de modellen de revue passeren. De actualisering van het vervoerwijzekeuzemodel is praktisch zeer goed uitvoerbaar. Het merendeel van de SP toepassingen heeft betrekking op de vervoerwijzekeuze, aangezien deze keuze relatief
duidelijk is en daardoor eenvoudig aan de respondenten te presenteren: de relevante alternatieven zijn beperkt en bekend, en het is mogelijk om zonder veel moeite voor vrijwel iedere reiziger een realistische reeks hypothetische keuze-alternatieven te genereren. Daardoor is hier zelfs in veel gevallen een schriftelijke SP enquête haalbaar, hetgeen uit kostenoogpunt zeer aantrekkelijk is. Aangezien er in het praktische SP actualiseringsonderzoek zowel een SP als een RP model moet kunnen worden geschat (er moet immers tevens een validatie plaatsvinden) dienen er voor beide voldoende waarnemingen beschikbaar te zijn. Om een RP model met redelijke nauwkeurigheid te kunnen schatten zijn zo'n 1000 waarnemingen nodig (afhankelijk van de verdeling over de alternatieven), voor een vergelijkbaar SP model minimaal 100 a 200. Bij schriftelijke enquêtering voor zowel RP als SP lijkt het haalbaar om deze binnen een vrij beperkt budget te verzamelen. En aangezien bij de analyses gewerkt kan worden met de door de respondenten opgegeven karakteristieken van de beschikbare vervoersalternatieven (bijv. reistijd en reiskosten) behoeven ook geen aanvullende gegevens te worden verzameld. Een zeer aantrekkelijke praktische mogelijkheid om een vervoerwi j zekeuzemodel te actualiseren doet zich voor bij het model uit
de OVD (Overdraagbaarheids-) studie. Dit model is geschat op gegevens uit 1982, en het is de moeite waard om na te gaan of de voorkeurspatronen inmiddels zijn veranderd. Voorts heeft het model betrekking op slechts twee alternatieven: auto en trein. Dat maakt het ontwerpen van een eenvoudige, schriftelijke SP enquête relatief goed haalbaar. Bij de enquêtes kan dan tevens gebruik gemaakt worden van de reeds beschikbare, oorspronkelijke
enquê tef orrnul ieren. Tevens kan een dergelijk actualiseringsonderzoek nuttige aanvullende informatie opleveren ten opzichte van de inzichten die werden verkregen in het Onderzoek Waardering Reistijd met betrekking tot de 'value-of-time' . Daar werden onder andere ook SP
experimenten gebruikt om de gewenste tijdwaarderingen af te leiden. De actualisering van het vertrektijdkeuzemodel is praktisch gezien op dit moment nog niet uitvoerbaar. De reden daarvan is eenvoudig:
dit deelmodel wordt momenteel nog ontwikkeld, en is naar verwachting pas medio 1989 operationeel. Daardoor heeft het weinig zin om nu na te gaan of de gedragsparameters inmiddels zijn
29
veranderd: zij zijn immers uiterst recent l Bovendien zullen de gedragsparameters van dit model toch al gebaseerd zijn op SP, aangezien het moeilijk is om een RP dataset te verkrijgen waarop een vertrektijdkeuzemodel kan worden geschat. Daardoor zou ook een eventuele validatie van de SP resultaten voor dit deelmodel moeilijk uitvoerbaar zijn. De actualisering van het routekeuzemodel is in de praktijk wel haalbaar. En gezien het feit dat de datasets waarop deze modellen gebaseerd zijn inmiddels ook alweer zo'n 10 jaar oud zijn zou een dergelijk actualiseringsonderzoek zeker relevant zijn. Een andere, wellicht nog interessantere optie daarbij is om tevens te trachten de nutsfuncties van deze modellen uit te breiden. Daarbij kan worden gedacht aan enkele variabelen die op basis van RP gegevens niet met succes in het model gebracht konden worden, maar die vanuit beleidsoverwegingen erg relevant zijn, zoals bijvoorbeeld kosten en informatie. Een probleem bij een SP onderzoek gericht op de routekeuze is echter het feit dat de relevante alternatieven voor de routekeuze zich niet zo eenvoudig laten beschrijven. Allereerst hebben veel automobilisten slechts een beperkt overzicht van hun alternatieven, en bovendien zijn veel van deze alternatieven deels overlappend. Het is daardoor moeilijk om een SP onderzoek op te zetten dat aansluit bij de bestaande situatie van de respondenten, en tevens duidelijke hypothetische varianten daarop ter beoordeling aanbiedt. Daartoe zal bij voorkeur een mondelinge, face-to-face enquête uitgevoerd moeten worden, waarbij visuele hulpmiddelen worden gehanteerd om de alternatieven te omschrijven. Op zich is dit geen enkel probleem. De kosten van een dergelijk onderzoek zullen echter zeer aanzienlijk zijn.
Indien zou worden vastgesteld dat het gebruik van SP om bestaande RP modellen te actualiseren een voldoende betrouwbaar resultaat oplevert zou het overweging verdienen om de bestaande routekeuzemodellen uit te breiden met behulp van deze modellen.
Wanneer de drie mogelijkheden voor een praktisch actualisatieonderzoek met SP worden vergeleken gaat de voorkeur uit naar de eerste mogelijkheid: de actualisatie van het vervoerwijzekeuzemodel. Het tweede alternatief, het vertrektijdkeuzemodel, komt momenteel nog niet in aanmerking voor actualisatie. En de derde mogelijkheid, het routekeuzemodel, is in principe haalbaar, maar vereist mondelinge enquêtering en zal naar verwachting een zeer
aanzienlijk budget vergen. Aanbevolen wordt om voor de actualisering van het vervoerwijzekeuzemodel aan te sluiten bij de Overdraagbaarheidsstudie. Het daarbij ontwikkelde model is gebruikt voor het Landelijk Model (onder andere distributie/vervoerwijzekeuzemodel), en tevens zijn in de onlangs voltooide Value-of-Time studie hernieuwde schattingen uitgevoerd op deze dataset. Juist daar lijkt het interessant om na te gaan of 7 jaar na het oorspronkelijke onderzoek de voorkeurspatronen zijn verschoven, en of de resultaten van de nieuw te schatten SP modellen overeenstemmen met die van de RP
30
modellen (zowel de oude als de nieuwe). Gezien het doel van de studie ligt het voor de hand om alle modelschattingen met behulp van logit uit te voeren: deze techniek
kan zowel op de te verzamelen RP als de SP gegevens worden toegepast, en biedt optimale mogelijkheden bij de uit te voeren schalingsprocedure zoals beschreven in 4.3. Voorts kan hierbij worden overwogen om een simultane schatting toe te passen, met behulp van het treelogit programma dat is ontwikkeld door Hague Consulting Group. Een en ander is nader uitgewerkt in een concreet onderzoekvoorstel voor een actualiseringsstudie met behulp van SP, dat afzonderlijk wordt gepresenteerd.
31
6.
LITERATUUR
Andersen, P.B., J. Möller en R.J. Sheldon (1986): Marketing DSB Rail Services Using a Stated Preference Approach, PTRC Summer Annual Meeting, Brighton. Bates, J.J. (1983): Stated Preference Techniques for the Analysis of Transport Behaviour, World Conference on Transport Research, Hamburg.
Bates, J.J. en M. Roberts (1983): Recent Experience with Models Fitted to Stated Preference Data, PTRC summer Annual Meeting, Warwick. Bates, J. (1988): Econometrie Issues in SP Analysis, Journal of Transport Economics and Policy, Vol. 22, no 1 . Ben-Akiva, M. en S.R. Lerman (1985): Discrete Choice Analysis, MIT Press.
Ben-Akiva, M. en B. Boccara (1987): Integrated Framework for Travel Behaviour Analysis, Proceedings of the Fifth International Conference on Travel Behaviour, Aix-en-Provence, France. Benjamin, J. en L. Sen (1982): A Comparison of the Predictive Ability of Four Multiattribute Approaches, Paper presented to the TRB Conference, Washington.
Bonsall, P. (1985): Transfer Price Data - lts Definition, Collection and Use, in New Survey Methods in Transport, VNU Science Press, Utrecht. Bradley, M. (1988): Realism and Adaption in Designing Hypothetical Travel Choice Concepts, Journal of Transport Economics and Policy, Volume XXII, no 1 .
Carmone, F.J., P.E. Green en A.K. Jain (1978): The Robustness of Conjoint Analysis: Some Monte Carlo Results, Journal of Marketing Research, Vol. 15, pp.300-303. Cattin, P. en D.R. Wittink (1976): A Monte Carlo Study of Metric and Nonmetric Estimation Methods for Multiattribute Models, Research Paper No. 341 , Graduate School for Business, Stanford University.
Cattin, P. en D.R. Wittink (1982): Commercial Use of Conjoint Analysis: A Survey, Journal of Marketing, Vol. 46, pp. 44-53. Chapman, R.G. en R. Staelin (1982): Exploiting Rank Ordered Choice
Set Data within the Stochastic Utility Model, Journal of Marketing Research, Vol. 19, pp.288-301. Chatterjee, A., F.J. Wegmann en M.A. McAdams (1983): NonCommitment Bias in Public Opinion on Transit Usage, Transportation, Vol. 11, pp.347-360.
32
Couture, M.R. en T. Dooley (1981): Analysing Traveller Attitudes to Resolve Intended and Actual Use of a New Transit Service, Transportation Research Record, Vol. 794, pp.27-33. Fowkes, T. en M. Wardman (1988): Design of SP Travel Choice Experiments, with Special Reference to Taste Variation, Journal of Transport Economics and Policy, Vol. 22, no 1 . Green P.E. en V. Srinivasan (1978): Conjoint Analysis in Consumer Research: Issues and Outlook, Journal of Consumer Research, Volume 5, pp. 103-121. Hartgen, D.T (1972): Forecasting Remote Park-and-Ride Transit Usage, Preliminary Research Report 39, New York State Department of Transportation.
Hensher, D.A. en J.J. Louviere (1983): Identifying Individual Preferences for International Air Fares, Journal of Transport Economics and Policy, Volume 17, pp.225-245. Hoorn, A.I.J.M. van der, E.P. Kroes en H.E.R. Meijer (1984): Mode Choice and Mode Captivity in Interlocal Commuting, Transport Policy Decision Making, Vol. 2, pp.373-388. Johnston, J. (1972): Econometrie Methods, New York: Mc Graw-Hill. Kocur, G., T. Adler, W. Hyman en B. Audet (1982): Guide to Forecasting Travel Demand with Direct Utility Asssessment, US Department of Transportation, Urban Mass Transport ADministration, Washington DC.
Kroes, E.P. en R.J. Sheldon (1985): The Use of Attitude Models and Stated Preference Models in Practical Transport Analysis, in Behavioural Research for Transport Policy, VNU Science Press, Utrecht. Kroes, E.P. en R.J. Sheldon (1986): Stated Preference Micrisimulation Models from Qualitative Inputs to Estimate Market Shares in Intercity Travel, Proceedings of the 1986 ESOMAR Congress, Monte Carlo. Kroes, E.P. en R.J. Sheldon (1985): Deriving Travel Elasticities and Other Related Measures Using Stated Preference Techniques, in Behavioural Research for Transport Policy, VNU Science Press,
Utrecht. Kroes, E.P. en R.J. Sheldon (1987): Developing Choice Models Using Stated Preference Research, PTRC Summer Annual Meeting, Brighton. Kroes, E.P. en R.J. Sheldon (1988): Stated Preference Methods, An Introduction, Journal of Transport Economics and Policy, Volume XXII, no 1.
Kruskal, J.B. (1965): Analysis of Factorial Experiments by Estimating Monotone Transformations of the Data, Journal of Royal
33
Statistic Society, Series B, Vil. 27, pp.251-263. Lerman, S.R. en J.J. Louviere (1978): On the Use of Functional Measurement to I d e n t i f y the Functional Form of the U t i l i t y Expression in Travel Demand Models, Transportation Research Record, Vol. 673, pp.78-86. Levin, I.P., J.J. Louviere, A.A. Schepanski en K.L. Norman (1983): External Validity Tests of Laboratory Studies of Information Integration, Organizational Behavior and Human Performance, Vol. 31, pp.173-193.
Lin, L . Y . S . , A. Pioche en P. Stander ( 1 9 8 6 ) : Estimating Sales Volume Potential for Innovative Products with Case Histories, Proceedings of the 1986 ESOMAR Congress, Monte Carlo. Louviere, J.J., D . H . Henley, G. Woodworth, R . J . Meijer, I.P. Levin, J.W. Stoner, D. Curry en D.A. Anderson ( 1 9 8 1 ) : Laboratory Simulation versus Revealed Preference Methods for Estimating Travel Demand Models: An Empirical Comparison, Transportation Research Record, Vol. 794, pp. 42-51. Louviere, J.J en D.A. Hensher ( 1 9 8 2 ) : On the Design and Analysis of Simulated Choice or Allocation Experiments in Travel Choice Modelling, Transportation Research Record, Vol. 890, pp. 11-17. Louviere, J.J. en G.G. Woodworth (1983): Design and Analysis of Simulated Consumer Choice or Allocation Experiments: An Approach Based on Aggregate Data, Journal of Marketing Research, Vol. 20, pp. 350-367.
Louviere, J.J. ( 1 9 8 8 ) : Conjoint Analysis Modelling of Stated Preferences, Journal of Transport Economics and Policy, Volume XXII, no 1. Sheldon, R . J . en J.K. Steer ( 1 9 8 2 ) : The Use of Conjoint Analysis in Transport Research, PTRC Summer Annual Meeting, Warwick. Steer, J.K. en L. Willumsen (1981): An Investigation of Passenger Preference Structures, Paper presented at Conference at Oxford.
34