CIB - Centrum voor Industrieel Beleid / Verkeer en Infrastructuur
KATHOLIEKE UNIVERSITEIT LEUVEN
Cursus H01I6A
Verkeersmodellen
Prof ir L.H. Immers ir. J.E. Stada
Uitgave: januari 2010
i
Voorwoord Deze tekst biedt een inleidend overzicht van de verkeersmodelkunde. Dit vak maakt deel uit van de cursus H01I6A die gegeven wordt aan studenten van het Departement Burgerlijke Bouwkunde van de Katholieke Universiteit Leuven. Bij het schrijven van deze tekst hebben wij ons vooral laten inspireren door het werk van Manheim, Sheffi en d'Ortúzar en Willumsen. Om de lezer een ingang te bieden tot het werk van bovengenoemde en andere, voornamelijk Engelstalige auteurs, hebben wij de gebruikte terminologie en wiskundige notatie ook enigszins aangepast in Angelsaksische richting. Een woord van dank is verschuldigd aan de studenten die ons hebben gewezen op onjuistheden of onduidelijkheden in de oorspronkelijke tekst. De auteurs houden zich aanbevolen voor op- of aanmerkingen. Heverlee, mei 1998 L.H. Immers , J.E. Stada
Naast wat kleinere correcties en aanvullingen werd in deze editie vooral hoofdstuk 3 grondig herzien. Heverlee, januari 2010 L.H. Immers, J.E. Stada
email:
[email protected] [email protected]
tel: +32 16 321669 (L.H. Immers) +32 16 329614 (J.E. Stada) adres: Centrum voor Industrieel Beleid / Verkeer en Infrastructuur Celestijnenaan 300A B-3001 Heverlee
ii
Inhoud
1.
ANALYSE VAN HET TRANSPORTSYSTEEM ...................................................................... 1 1.1 1.2 1.2.1 1.2.2 1.2.3 1.3 1.4 1.5 1.6 1.7 1.8
2.
STRUCTUUR VAN HET TRADITIONELE VERKEERSMODEL ..................................... 13 2.1 2.2 2.2.1 2.2.2 2.3 2.4
3.
UTILITEITEN ALS KANSVARIABELEN ..................................................................................... 22 LOGITMODEL ........................................................................................................................ 24 SPECIFICATIE VAN EEN LOGITMODEL .................................................................................... 28 Functionele vorm............................................................................................................ 28 Variabelen ...................................................................................................................... 28 Schatting coëfficiënten logitmodel.................................................................................. 29 GRAFISCHE ILLUSTRATIE VAN HET BINAIRE LOGITMODEL ..................................................... 31 GEAGGREGEERDE EN GEDISAGGREGEERDE MODELLEN ........................................................ 32 BEPERKINGEN VAN HET LOGITMODEL .................................................................................. 33 Voorbeelden.................................................................................................................... 34 Independence of irrelevant alternatives ......................................................................... 36 NESTED LOGIT ...................................................................................................................... 39 Formulering van het nested logit model ......................................................................... 39 Schatting van de coefficienten van een nested logitmodel.............................................. 44 SAMENVATTING ................................................................................................................... 44
ZONES EN NETWERKEN ....................................................................................................... 46 4.1 4.2
5.
FUNCTIE VAN HET VERKEERSMODEL .................................................................................... 13 MODELBEGRIP...................................................................................................................... 14 Mathematische modellen ................................................................................................ 15 Calibratie en validatie .................................................................................................... 16 STRUCTUUR VERKEERSMODEL ............................................................................................. 17 OVERZICHT .......................................................................................................................... 19
DISCRETE KEUZE THEORIE ................................................................................................ 21 3.1 3.2 3.3 3.3.1 3.3.2 3.3.3 3.4 3.5 3.6 3.6.1 3.6.2 3.7 3.7.1 3.7.2 3.8
4.
MAATSCHAPPELIJKE VERANDERING ....................................................................................... 1 INTERACTIE TUSSEN HET TRANSPORTSYSTEEM EN HET ACTIVITEITENSYSTEEM ...................... 2 Opties................................................................................................................................ 3 Consequenties................................................................................................................... 4 Voorspellingsprobleem ..................................................................................................... 4 VRAAG EN AANBOD OP DE TRANSPORTMARKT ....................................................................... 5 GEVOLGEN VAN DE INTRODUCTIE VAN NIEUWE TRANSPORTVOORZIENINGEN......................... 7 MODELTYPEN ......................................................................................................................... 9 PRAKTISCHE IMPLEMENTATIES VAN HET CONCEPTUELE MODEL ........................................... 10 MODELLEN IN HET PLANNINGSPROCES ................................................................................. 11 SAMENVATTING ................................................................................................................... 12
GEBIEDSINDELING ................................................................................................................ 46 NETWERKEN......................................................................................................................... 48
PRODUCTIE EN ATTRACTIE................................................................................................ 52 5.1 BEGRIPPEN ........................................................................................................................... 52 5.2 CLASSIFICATIE VAN VERPLAATSINGEN ................................................................................. 53 5.2.1 Indeling naar motief van de verplaatsing ....................................................................... 53 5.2.2 Indeling naar tijdstip van de verplaatsing...................................................................... 54 5.2.3 Indeling naar persoonskenmerken.................................................................................. 54 5.2.4 Indeling naar gebruikte vervoerwijze ............................................................................. 54 5.3 INVLOEDSFACTOREN PRODUCTIE EN ATTRACTIE .................................................................. 54 5.3.1 Invloedsfactoren productie ............................................................................................. 54 5.3.2 Invloedsfactoren attractie............................................................................................... 56 5.3.3 Invloedsfactoren productie/attractie in het goederenvervoer......................................... 56
iii 5.4 REGRESSIEANALYSE ............................................................................................................. 57 5.4.1 Productie ........................................................................................................................ 57 5.4.1.1 5.4.1.2
5.4.2 5.4.3
Productie op basis van zonale gegevens ............................................................................. 57 Productie op basis van huishouding gegevens .................................................................... 58
Attractie .......................................................................................................................... 58 Problemen bij de toepassing van regressieanalyse ........................................................ 59
5.4.3.1 5.4.3.2 5.4.3.3 5.4.3.4 5.4.3.5 5.4.3.6
Multicollineariteit ............................................................................................................... 59 Hoeveel en welke onafhankelijke variabelen? .................................................................... 59 Non-lineariteiten ................................................................................................................. 59 Constante factor in de regressievergelijking ....................................................................... 59 Extrapolatie......................................................................................................................... 60 Ecologische correlatie ......................................................................................................... 60
5.5 CATEGORIEANALYSE ............................................................................................................ 61 5.5.1 Productie ........................................................................................................................ 61 5.5.2 Attractie .......................................................................................................................... 61 5.5.3 Problemen bij de toepassing van categorieanalyse........................................................ 61 5.5.3.1 5.5.3.2
5.6 5.7 5.8 6.
Veel calibratiegegevens nodig ............................................................................................ 62 Welke categorieën nu en in de toekomst? ........................................................................... 62
GEBRUIK VAN LOGITMODEL VOOR BEREKENING PRODUCTIE. ............................................... 62 STABILITEIT VAN PRODUCTIE EN ATTRACTIEPARAMETERS. .................................................. 63 BALANCEREN VAN PRODUCTIE EN ATTRACTIE ...................................................................... 64
DISTRIBUTIE ............................................................................................................................ 65 6.1 6.2 6.3 6.3.1 6.3.2 6.3.3 6.3.4 6.4 6.4.1 6.4.2 6.5 6.5.1 6.5.2
NOTATIES ............................................................................................................................. 66 GRONDPROBLEEM VAN DE DISTRIBUTIEBEREKENING ........................................................... 67 GROEIFACTORMODELLEN ..................................................................................................... 68 Uniforme groeifactor ...................................................................................................... 68 Groeifactormodel met één randvoorwaarde................................................................... 68 Groeifactormodel met dubbele randvoorwaarden.......................................................... 69 Nadelen groeifactormodellen ......................................................................................... 71 WEERSTAND EN DISTRIBUTIEFUNCTIE .................................................................................. 72 Verplaatsingsweerstanden .............................................................................................. 72 Distributiefunctie ............................................................................................................ 74 ZWAARTEKRACHTMODEL ..................................................................................................... 76 Principe van het zwaartekrachtmodel ............................................................................ 76 Opmerkingen over het zwaartekrachtmodel ................................................................... 78
6.5.2.1 6.5.2.2
6.5.3
De waarden van de distributiefunctie en de evenwichtsfactoren......................................... 78 Alternatieve formuleringen voor het zwaartekrachtmodel .................................................. 78
Theoretische afleidingen van het zwaartekrachtmodel................................................... 78
6.5.3.1 6.5.3.2 6.5.3.3
Afleiding zwaartekrachtmodel uit principe van maximale entropie .................................... 79 Afleiding zwaartekrachtmodel uit discrete keuze theorie.................................................... 81 Conclusie theoretische afleidingen...................................................................................... 83
6.5.4 Calibratie van de distributiefunctie ................................................................................ 83 6.6 TOEPASSINGSASPECTEN VAN DISTRIBUTIEMODELLEN .......................................................... 84 6.6.1 Intrazonaal verkeer......................................................................................................... 84 6.6.2 Externe zones.................................................................................................................. 84 6.6.3 Transformatie HB-tabel naar geschikte eenheden ......................................................... 85 7.
VERVOERWIJZEKEUZE ........................................................................................................ 86 7.1 INVLOEDSFACTOREN VERVOERWIJZEKEUZE ......................................................................... 86 7.2 VERVOERWIJZEKEUZE ALS ONDERDEEL VAN PRODUCTIE/ATTRACTIEBEREKENING............... 87 7.3 VERVOERWIJZEKEUZE ALS ONDERDEEL VAN DE DISTRIBUTIEBEREKENING .......................... 88 7.3.1 Simultaan berekening distributie/vervoerwijze met multimodaal zwaartekrachtmodel . 88 7.3.2 Sequentieel keuzemodel distributie/vervoerwijze via de logsom .................................... 92
8.
TOEDELING .............................................................................................................................. 93 8.1 TOEDELINGSMODELLEN VOOR WEGENNETWERKEN .............................................................. 93 8.1.1 Kortste route in een wegennetwerk................................................................................. 93 8.1.2 Classificatie van toedelingsmodellen.............................................................................. 95 8.1.3 Notaties........................................................................................................................... 97
iv 8.1.4 8.1.5
Alles of niets toedeling.................................................................................................... 98 Stochastische toedeling................................................................................................... 99
8.1.5.1 8.1.5.2 8.1.5.3
8.1.6
Stochastische toedelingsmodellen met theoretische verdelingsfuncties. ............................. 99 Stochastische toedelingsmodellen gebaseerd op simulatie................................................ 100 Algoritme voor de stochastische toedeling........................................................................ 100
Evenwichtstoedeling ..................................................................................................... 101
8.1.6.1 8.1.6.2 8.1.6.3 8.1.6.4 8.1.6.5
Gebruikersoptimale en systeemoptimale evenwichtstoedeling ......................................... 102 Reistijdfuncties ................................................................................................................. 103 Algoritme voor de gebruikersoptimale evenwichtstoedeling ............................................ 104 Algoritme voor de systeemoptimale evenwichtstoedeling ................................................ 107 Uitgewerkt numeriek voorbeeld evenwichtstoedeling ...................................................... 108
8.1.7 Stochastische evenwichtstoedeling ............................................................................... 112 8.2 TOEDELINGSMODELLEN VOOR OPENBAAR VERVOER NETWERKEN ..................................... 112 8.2.1 Weerstanden in het openbaar vervoer .......................................................................... 112 8.2.2 Wachttijden................................................................................................................... 113 8.2.3 Kortste route in een openbaar vervoer netwerk ........................................................... 115 8.2.4 Toedelingsmodellen voor openbaar vervoer ................................................................ 118 8.2.5 Slotopmerkingen ........................................................................................................... 120 9.
EXAMENVRAGEN.................................................................................................................. 121
LIJST VAN FIGUREN EN TABELLEN MET BRONVERMELDING ....................................... 122 REFERENTIES .................................................................................................................................. 123
1
1. Analyse van het transportsysteem De belangrijkste reden voor het ontstaan van transport is de ruimtelijke scheiding van economische en sociale activiteiten. In dit hoofdstuk wordt een modelmatige beschrijving gegeven van de wisselwerking tussen het geheel van sociale en economische activiteiten in een bepaald gebied en het transportsysteem. Het resulterende conceptuele model dient als een kader waarin de overige in deze cursus te behandelen onderwerpen in hun juiste context geplaatst kunnen worden. De beschrijving is gebaseerd op Manheim [1979]1§. Het hoofdstuk wordt besloten met enige opmerkingen over de rol van modellen in de verkeersplanning.
1.1 Maatschappelijke verandering De samenleving is aan voortdurende veranderingen onderhevig. Vanwege de sterke interacties tussen de transportsector en de maatschappij (voor een groot deel is verkeer een afgeleide van het maatschappelijk leven en het daarmee samenhangende activiteitenpatroon) kunnen maatschappelijke veranderingen belangrijke consequenties inhouden voor het functioneren van het transportsysteem. In principe kunnen drie verschillende typen veranderingen worden aangegeven die van invloed zijn op het functioneren van het transportsysteem: •
•
•
Veranderingen in de vraag naar transport. De toename van de bevolking, vergroting van het inkomen en veranderingen in het grondgebruik hebben hun weerslag op de vraag naar transport. Veranderingen in de transporttechnologie. Niet alleen op het gebied van de transportmiddelen vindt een voortdurende technische vooruitgang plaats, ook nieuwe transportconcepten dienen zich aan zoals rijstroken voor doelgroepen, informatiesystemen voor reizigers, rekeningrijden enz. Veranderingen in waardeoordelen. Beslissingen op transportgebied kunnen veelomvattende gevolgen hebben. Men bekommert zich nu meer dan vroeger om de sociale effecten van bepaalde maatregelen en om de gevolgen van het transport voor het milieu.
Wij zullen onze analyse beginnen met een systematische beschrijving van het transportsysteem en de interactie van dit transportsysteem met zijn sociaaleconomische omgeving. De volgende stap in de analyse is het identificeren van de opties die ons ter beschikking staan om sturend op te treden en het vaststellen van de consequenties van de sturingsmaatregelen. Basisveronderstellingen in de analyse zijn: •
§
het transportsysteem in een gebied wordt beschouwd als een samenhangend multimodaal systeem. De term multimodaal houdt in dat meerdere vervoerwijzen of “modaliteiten” in de beschouwingen worden meegenomen. Onder het transportsysteem verstaan we het geheel van vervoermiddelen, netwerken, terminals, transportdiensten enz. De noten verwijzen naar de lijst van referenties aan het eind van de tekst.
2 •
Vanwege de vele interacties kan het transportsysteem alleen beschouwd worden in samenhang met het sociale, economische en politieke patroon in een bepaald gebied. Dit geheel van sociale, economische en politieke activiteiten zullen wij in het vervolg het activiteitensysteem noemen.
1.2 Interactie tussen het transportsysteem en het activiteitensysteem In Figuur 1-1 is de interactie tussen het transportsysteem T en het activiteitensysteem A aangegeven. De interactie tussen beide systemen resulteert in een belastingpatroon F van het multimodale netwerk. Onder het belastingpatroon F verstaan wij het geheel van vervoersstromen in termen van oorsprong, bestemming, vervoerwijzen, routes, tijdstippen, hoeveelheden enz. en de daaraan gelieerde kwaliteit van de verkeersafwikkeling, bijv. in termen van reistijden. De variabele F beschrijft in zekere zin de toestand waarin het transportsysteem zich op zeker tijdstip bevindt.
Figuur 1-1 Interactie transportsysteem en activiteitensysteem.1 De volgende relaties zijn in Figuur 1-1 aangegeven: Relatie 1: Een gegeven transportsysteem en een gegeven activiteitensysteem zullen resulteren in een zeker belastingpatroon van het multimodale transportnetwerk. Relatie 2: Het gebruik van het multimodale netwerk, de daarmee samenhangende kwaliteit van de verkeersafwikkeling en het daaruit voortvloeiende gebruik van schaarse hulpbronnen zullen aanleiding geven tot veranderingen in het activiteitensysteem.
3 Relatie 3: Het gebruik van het multimodale netwerk en de daarmee samenhangende kwaliteit van de verkeersafwikkeling zullen aanleiding vormen voor overheden en ondernemingen om de kwaliteit van de dienstverlening en de infrastructuur te veranderen. 1.2.1 Opties Er kan op vele manieren sturend worden opgetreden ten aanzien van het transportsysteem en het activiteitensysteem. Van belang is te onderkennen dat beslissingen door verschillende groeperingen kunnen worden genomen, zoals individuele gebruikers van transportvoorzieningen, vervoersorganisaties die vervoersdiensten aanbieden en overheden die een transportbeleid formuleren en ten uitvoer brengen. De mogelijkheden tot sturing, de opties, kunnen worden geformuleerd voor het transportsysteem en het activiteitensysteem. Voor het transportsysteem staan ons opties ten aanzien van de volgende aspecten ter beschikking: •
•
•
•
•
Technologie. Als voorbeelden zijn te noemen de introductie van nieuwe vervoerconcepten als bijv. containers, de ontwikkeling van nieuwe aandrijftechnieken en innovaties op het gebied van de wegenbouw. Netwerken. Netwerken worden gedefinieerd door knooppunten en schakels die de knooppunten verbinden. Men heeft de keuze tussen allerlei netwerkconfiguraties zoals radiale, concentrische of gridpatronen. Voorts kunnen de eigenschappen van het netwerk worden veranderd. Die eigenschappen, zoals bijv. capaciteit en toelaatbare snelheid, worden vaak toegekend aan de schakels van het netwerk. Vervoermiddelen. Het aantal te gebruiken vervoermiddelen en hun eigenschappen kunnen worden beïnvloed. Exploitanten van vervoersondernemingen kunnen hieromtrent beslissingen nemen, maar ook de overheid kan invloed uitoefenen door middel van regelgeving. Exploitatie. Men kan sturend optreden door middel van het beïnvloeden van de prijzen, het verstrekken van subsidies of het nemen van andere financiële maatregelen. Ook op wetgevend gebied kan men regulerend optreden. Ook operationele beslissingen ten aanzien van lijnvoering, dienstregeling en routebepaling vallen hieronder. Organisatie. De organisatiestructuur van het transportsysteem heeft zijn weerslag op het transportsysteem. Men kan denken aan de verdeling van verantwoordelijkheden tussen de verschillende overheden of de interne organisatie binnen transportondernemingen.
Ten aanzien van het activiteitensysteem kunnen de opties ook in een aantal categorieën worden verdeeld: •
•
Verplaatsingskeuze. Het betreft hier de opties die openstaan voor elke potentiële gebruiker van het transportsysteem, namelijk de beslissing om al of niet een verplaatsing te maken, de keuze van het vervoermiddel en het tijdstip van de verplaatsing en de route. Het gezamenlijke resultaat van al deze beslissingen is de gerealiseerde vraag naar vervoer. Ruimtelijke spreiding van bevolking en economische activiteiten. Economische en sociale factoren bepalen de locaties van wonen en werken en de schaal van economische activiteiten en hebben invloed op de vraag naar vervoer. Het betreft
4 hier enerzijds factoren die bewust gestuurd kunnen worden door de uitvoering van overheidsbeleid, anderzijds processen die zich aan directe beïnvloeding van buitenaf onttrekken. Toch spreekt men in beide gevallen van opties in het activiteitensysteem. 1.2.2 Consequenties De consequenties of effecten van te treffen maatregelen zijn velerlei. Bovendien kunnen de effecten voor een groep positief uitvallen en voor een andere groep negatief. Het is belangrijk dit aspect in de evaluatie mee te nemen. Een mogelijke onderverdeling van de effecten is de volgende: •
•
•
•
•
Consequenties voor de gebruiker. Dit zijn de gevolgen voor de reiziger en verlader van goederen. De belastingen van het transportsysteem komen voor de gebruiker tot uiting in reistijden, kosten, comfort enz. Consequenties voor de exploitanten. Dit zijn de gevolgen voor wegbeheerders, openbaar vervoersondernemingen enz. Kosten en opbrengsten zijn hier belangrijke factoren. Consequenties voor het milieu. Meer en meer hebben de consequenties voor het milieu, zoals luchtverontreiniging, lawaaihinder en versnippering van het landschap invloed op de inrichting van het transportsysteem. Functionele consequenties. Dit zijn de gevolgen voor de functionele kwaliteiten van het activiteitensysteem. Te denken valt aan variaties in winkelomzetten en grondprijzen. Bestuurlijke consequenties De belastingen van het transportsysteem kunnen zodanig zijn dat dit bestuurlijke consequenties heeft voor de wetgeving, voor de verdeling van verantwoordelijkheden enz.
1.2.3 Voorspellingsprobleem Het probleem waarvoor we ons nu gesteld zien is hoe de consequenties te berekenen van de verschillende maatregelen of opties die ons ter beschikking staan. De effecten zullen zo goed mogelijk ingeschat of berekend moeten worden teneinde voldoende zekerheid te kunnen garanderen voor wat betreft de oplossing van een gesignaleerd probleem respectievelijk het realiseren van een geformuleerde doelstelling. Dit voorspellingsprobleem is schematisch aangeduid in Figuur 1-2.
5 Opties Consequenties
Technologie Netwerken
Gebruiker
Vervoermiddelen
Exploitant
Exploitatie
Voorspellingsmodel Organisatie
Fysiek Functioneel
-----------------
Bestuurlijk
Verplaatsingskeuzes Ruimtelijke spreiding
Figuur 1-2 Het voorspellingsprobleem.1 Voor het berekenen van de effecten van ingrepen op het transportsysteem moeten we voor een gegeven transportsysteem T en activiteitensysteem A het belastingpatroon F van het transportsysteem voorspellen.
1.3 Vraag en aanbod op de transportmarkt Uitgangspunt bij de voorspelling is dat er voor de transportsector een markt kan worden gedefinieerd die onafhankelijk van andere markten functioneert. Later in deze cursus (in het deel Basiskennis Vervoerseconomie) zal dieper op deze materie worden ingegaan. Vooralsnog volstaat de hierna volgende vereenvoudigde beschrijving. We onderscheiden de volgende variabelen en functies. Variabelen: T A F S V
het transportsysteem het activiteitensysteem het belastingpatroon het serviceniveau (kwaliteit van verkeersafwikkeling) de omvang van de vervoersstromen
Functies: J D
aanbodfunctie: vraagfunctie:
S = J(V,T) V = D(S,A)
Bij een gegeven transportsysteem (T is constant) geeft een aanbodfunctie (zie Figuur 1-3a) het serviceniveau (de kwaliteit van de verkeersafwikkeling) als functie van de omvang van de vervoersstromen. De aanbodfunctie beschrijft dus de service of de prestatie dat een gegeven transportsysteem kan aanbieden bij verschillende vervoersstromen. De aanbodfunctie wordt daarom ook wel servicefunctie of
6 prestatiefunctie genoemd. De kwaliteit van de verkeersafwikkeling is uit verschillende componenten opgebouwd. Belangrijke componenten zijn reistijd en reiskosten. Wijzigingen in het transportsysteem leiden wijzigingen in de aanbodfunctie Bij een gegeven activiteitensysteem (A is constant) geeft een vraagfunctie (zie Figuur 1-3b) de omvang van de vervoersstromen als functie van het serviceniveau. De functie wordt gelezen door te starten vanaf de verticale as. Naarmate het serviceniveau hoger is zal de vraag groter zijn. Men noemt dit een elastische vraag. Wijzigingen in het activiteitensysteem leiden tot wijzigingen in de vraagfunctie. Het belastingpatroon F van het multimodale netwerk is gedefinieerd als de combinatie van de vervoersstromen V met de daaraan gelieerde kwaliteit van de verkeersafwikkeling S. Voor een gegeven transportsysteem en een gegeven activiteitensysteem kan het belastingpatroon F0 = (V0,S0) worden berekend op basis van het evenwicht dat zich instelt tussen vraag en aanbod, zoals aangegeven in Figuur 1-3c.
Figuur 1-3 Evenwicht op de transportmarkt.1 In Figuur 1-4 worden naast het algemene geval zoals weergegeven in de voorgaande figuur nog twee andere functionele verbanden beschreven.
7 Let wel: op de verticale as staat nu de reistijd afgebeeld in plaats van het serviceniveau. De reistijd wordt hier beschouwd als een maat voor het serviceniveau. Dit heeft een omkering van de figuren tot gevolg. In het eerste geval, Figuur 1-4a, is er sprake van een constante aanbod-functie. Een voorbeeld is een weg met een oneindige capaciteit. De reistijd verandert niet als gevolg van een verandering in de vervoeromvang. In het tweede geval, Figuur 1-4b, is er sprake van een constante vraag-functie. De vraag is ongevoelig voor wijzigingen in het serviceniveau. Men noemt dit een (volkomen) inelastische vraag. Dit zou van toepassing kunnen zijn op passagiers, bijvoorbeeld in het openbaar vervoer, die geen alternatieve wijze van vervoer hebben, ook wel genoemd gedwongen reizigers of “captives”. t
t D J J
D
V
a
V
b
Figuur 1-4 Constante aanbod- en vraagfunctie.1 1.4 Gevolgen van de introductie van nieuwe transportvoorzieningen Als het belastingpatroon uitwijst dat er congestie is op bepaalde punten kunnen overheden bijv. besluiten tot de aanleg van nieuwe infrastructuur. Ook exploitanten van vervoersdiensten kunnen besluiten om hun diensten aan te passen. Deze terugkoppeling van het belastingpatroon naar het transportsysteem werd aangegeven door relatie 3 in Figuur 1-1. Wat gebeurt er nu als het transportsysteem wordt gewijzigd? Laten we ervan uitgaan dat het nieuwe transportsysteem een verbetering inhoudt ten opzichte van het oude transportsysteem. In Figuur 1-5 zijn zowel de aanbod-functie voor het oude systeem (J0) als het nieuwe systeem (J1) weergegeven. Evenals in Figuur 1-4 staat op de verticale as de reistijd afgebeeld! Een hogere reistijd betekent een lager serviceniveau. Zouden we een nieuw verbeterd transportsysteem onmiddellijk introduceren dan leidt dit tot een vermindering van de reistijd. Er stelt zich een nieuw evenwicht in waarbij als gevolg van de verminderde reistijd meer consumenten gebruik gaan maken van de voorziening. Het evenwicht wordt bereikt voor de waarden V1 en t1. We moeten echter bedenken dat, indien geconstateerd wordt dat de capaciteit van de verkeersinfrastructuur onvoldoende is en een uitbreiding van de capaciteit gepland wordt, het al gauw vele jaren kan duren alvorens de nieuwe voorziening in gebruik genomen kan worden. Met andere woorden, op het moment dat de nieuwe
8 voorziening in gebruik wordt genomen is als gevolg van economische en demografische ontwikkelingen, zoals bevolkingsgroei, toename van het autobezit en dergelijke, de vraag-functie gewijzigd van D0 naar D2.
Figuur 1-5 Evenwichten op korte en lange termijn.1
Enige weken of maanden na ingebruikneming van de nieuwe voorziening zal zich het evenwicht F2 hebben ingesteld. Het duurt namelijk enige tijd alvorens men zich op de nieuwe voorziening zal hebben ingesteld door wijziging van vertrektijdstippen, routes of vervoerwijzen. Dit evenwicht, aangegeven door relatie 1 in Figuur 1-1, noemen we het korte termijn evenwicht dat ontstaat als gevolg van wijzigingen in het verplaatsingsgedrag . De verbeterde kwaliteit van het transportsysteem brengt echter nog een tweede ontwikkeling op gang. Bedrijven zullen zich vestigen op plaatsen die beter bereikbaar geworden zijn, hogere inkomens trekken weg uit de stad en vestigen zich op goed bereikbare landelijke locaties enz. Kortom, reagerend en soms zelfs anticiperend op de gewijzigde kwaliteit van de infrastructuur zal men de locatie van activiteiten veranderen en mogelijk nieuwe activiteiten starten. Omdat het transportsysteem verbeterd is, zal men op grotere afstand van de werkplek gaan wonen en wellicht zullen zich nieuwe gebruikers van het transportsysteem aandienen Dit zal op zijn beurt weer een hogere ligging van de vraagfunctie veroorzaken Dit proces wordt “activity-shift” of activiteitensysteem-verschuiving genoemd en wordt aangegeven door relatie 2 in Figuur 1-1. Deze ontwikkeling voltrekt zich in een langzaam tempo en de vraag-functie D3 die behoort bij de nieuwe toestand van het activiteitensysteem zal dan ook pas op de lange termijn worden gerealiseerd. Het evenwicht F3 dat een gevolg is van de wijzigingen in het activiteitensysteem noemen we het lange termijn
9 evenwicht. Veelal zal dit evenwicht nooit bereikt worden omdat in de tussentijd nieuwe voorzieningen zijn aangebracht waardoor het systeem weer naar een nieuwe evenwichtswaarde zal streven. Het lange termijn evenwicht dient dus veeleer om ontwikkelingstendensen te kunnen aangeven. Merk op dat in Figuur 1-5 de reistijd t3 in de uiteindelijke situatie hoger is dan de aanvankelijke reistijd t0 waarmee wij onze analyse begonnen. Het serviceniveau is dus, ondanks de aanleg van nieuwe infrastructuur, verlaagd! Het kan dus voorkomen dat de introductie van een nieuwe voorziening een dermate groot effect sorteert op het vraagpatroon dat de kwaliteit van de verkeersafwikkeling in de nieuwe situatie uiteindelijk slechter wordt. Als, zoals hierboven uiteengezet, de kwaliteit van de verkeersafwikkeling slechter wordt ondanks de introductie van een nieuwe verkeersvoorziening, is het onjuist om daaruit direct te concluderen dat de aanleg van deze nieuwe voorziening dus geen zin heeft gehad. In de nieuwe situatie is immers de vervoeromvang ook veel groter. Of dat als gunstig of ongunstig beoordeeld moet worden hangt van de omstandigheden af. Bedenk dat de verhoging van de vraag veroorzaakt wordt door een verschuiving in het activiteitensysteem. Dit kan enerzijds betekenen dat eenzelfde aantal gebruikers grotere afstanden gaat afleggen, anderzijds kan het zijn dat de afgelegde afstand per gebruiker niet noemenswaardig toeneemt maar wel het aantal gebruikers. Uiteraard kan er ook een combinatie van beide effecten optreden. Als de grotere vraag voornamelijk veroorzaakt wordt door een toename in het aantal afgelegde kilometers per gebruiker dan zou men van een ongunstig effect kunnen spreken. Leidt de aanleg van de nieuwe transportvoorziening tot mobiliteit voor meer gebruikers dan zou men dit, onder enig voorbehoud, als een gunstig effect kunnen zien. Voor aanvullende opmerkingen over de effecten van wijzigingen in het transportsysteem wordt verwezen naar hoofdstuk 5.3.1. 1.5 Modeltypen Op grond van de bovenstaande analyse van evenwichtsmechanismen die van toepassing zijn op de vervoersmarkt kan een lijst worden opgesteld van typen modellen die benodigd zijn om de effecten van beleidsmaatregelen te berekenen. Het betreft de volgende modellen: • • • • •
Vraagmodellen die de omvang van de vraag bepalen als functie van het serviceniveau. Aanbodmodellen die, afhankelijk van de te nemen maatregelen, de kwaliteit van de verkeersafwikkeling bepalen als functie van de belasting van het netwerk. Korte termijn evenwichtsmodellen die op basis van het evenwicht tussen vraag en aanbod de omvang van de vervoersstromen in een netwerk bepalen. Lange termijn evenwichtsmodellen die de interacties tussen veranderingen in de infrastructuur en de ruimtelijke spreiding van activiteiten beschrijven. Effect-modellen die aangeven welke afgeleide effecten gemoeid zijn met het verschaffen van een hoger serviceniveau in termen van benodigde investeringen, milieueffecten, sociale effecten, veiligheid, enz.
Modellen behorende tot de vijf bovengenoemde typen hebben we nodig om ons voorspellingsprobleem, dat schematisch werd voorgesteld in Figuur 1-2, op te lossen.
10 In Figuur 1-6 zijn de bovengenoemde modeltypen in hun onderling verband geplaatst.
Opties Consequenties Technologie
Aanbod model
Effectmodel
Netwerken
Gebruiker
Vervoermiddelen Evenwichtmodel (korte termijn)
Exploitatie Organisatie Verplaatsingskeuzes
Exploitant Fysiek Functioneel
Vraag model
Evenwichtmodel (Lange termijn)
Bestuurlijk
Ruimtelijke spreiding
Figuur 1-6 Modeltypen benodigd voor voorspellingen.1
1.6 Praktische implementaties van het conceptuele model Het in dit hoofdstuk behandelde conceptuele model kan dienen om de veelheid van complexe transportverschijnselen die we dagelijks waarnemen in hun juiste context te plaatsen. Het model verschaft inzicht in de fundamentele interacties tussen het transportsysteem en het socio-economische systeem waarin het ingebed is. Het model is echter nog te abstract om direct als basis te kunnen dienen voor het uitvoeren van transportberekeningen. In hoofdstuk 2 zullen we het traditionele verkeersmodel behandelen, een model dat op vele plaatsen in de wereld gebruikt wordt om daadwerkelijk transportberekeningen uit te voeren. Het traditionele verkeersmodel bestaat uit een aantal submodellen die we kunnen zien als praktische implementaties van het in dit hoofdstuk behandelde conceptuele model. Hieronder volgt een overzicht van de bovengenoemde vijf modeltypen en hun parallel in het traditionele verkeersmodel. •
•
•
Vraagmodellen vinden we in het traditionele verkeersmodel terug in een aantal submodellen, namelijk het productie/attractiemodel, het distributiemodel en het vervoerwijzekeuzemodel. Aanbodmodellen vinden hun weerslag in de zogenoemde reistijdfuncties, die het verband aangeven tussen de reistijd of de weerstand op een wegvak en de wegvakbelasting. Korte termijn evenwichtsmodellen worden gebruikt in de zogenoemde toedelingsmodellen, die de routes bepalen in een netwerk rekening houdend met de invloed die de vervoersstromen uitoefenen op de weerstand van de schakels van een netwerk.
11 •
•
Lange termijn evenwichtsmodellen, die de invloed van het belastingpatroon op het activiteitensysteem weergeven, implementeert men in de praktijk vaak in de vorm van een scenario-aanpak. Hierbij postuleert men een bepaalde plausibele toekomstige sociaal-economische ontwikkeling en berekent daarvan de gevolgen voor het transportsysteem. Ook bestaan er modellen die direct de invloed van het verkeersbelastingpatroon op de ruimtelijke en sociaal-economische ontwikkeling trachten te voorspellen, maar zij worden in de praktijk nog weinig gebruikt. Wij zullen lange termijn evenwichtsmodellen niet in deze cursus behandelen. Effect-modellen zijn in grote getale ontwikkeld. Er bestaan modellen die de consequenties van de verkeersbelasting op luchtverontreiniging, lawaaihinder en veiligheid kunnen berekenen. Wegens hun specialistisch karakter komen zij in deze algemene inleidende cursus niet aan de orde.
1.7 Modellen in het planningsproces In Figuur 1-7 is aangegeven waar het voorspellingsmodel in het planningsproces kan worden toegepast. (Ook in de andere fasen van het planningsproces kunnen modellen worden gebruikt. Zij zijn evenwel niet in de figuur aangegeven, omdat zij niet in dit hoofdstuk zijn behandeld.) Probleem
Doelstellingen
Generatie van opties Criteria Voorspellingsmodel
Voorspellen
Evaluatie
Keuze
Realisatie
Figuur 1-7 Planningsproces. Er zijn enkele belangrijke redenen waarom modellen worden toegepast: •
•
Een model, zeker in de vorm van een computerprogramma, maakt het mogelijk rekening te houden met complexe interacties die zonder model waarschijnlijk over het hoofd zouden worden gezien of anders verkeerd geïnterpreteerd zouden kunnen worden. Een model behoeft niet altijd in de vorm van een computertoepassing te worden gegoten, maar leent zich er wel uitstekend voor. Modelberekeningen kunnen voor weinig geld, zeker indien vergeleken met de realisatiekosten, uitsluitsel geven over de effecten van verschillende alternatieven. Men dient zich echter bewust te zijn van de beperkingen van een model.
12 Toepassing van een model impliceert immers dat concessies worden gedaan ten aanzien van de weergave van de werkelijkheid. Modellen zijn een vereenvoudigde weergave van een deel van de werkelijkheid, anders zouden we net zo goed de werkelijkheid zelf als model kunnen nemen. Wij besluiten dit hoofdstuk met enige belangrijke criteria voor de beoordeling van prognosemodellen: • •
•
•
•
•
Relevantie. Het model moet in staat zijn de effecten te berekenen van alle sturingsmaatregelen waarin men is geïnteresseerd. Nauwkeurigheid. Er dient een redelijke overeenkomst te zijn tussen de uitkomsten van het model en de waarnemingen. Overigens dient men geen overdreven verwachtingen te koesteren omtrent de nauwkeurigheid van verkeersmodellen indien men ze vergelijkt met modellen in de exacte wetenschappen. Verkeerskunde is geen exacte wetenschap, maar een kennisveld dat zich bevindt tussen de exacte en sociale wetenschappen. Theoretische grondslag. De formulering van het model moet bij voorkeur gebaseerd zijn op een goede theoretische grondslag. Modellen die slechts leunen op een eenvoudige extrapolatie van waargenomen gedrag hebben een beperkt toepassingsveld, zowel in plaats als in tijd. Eenvoud. De eenvoud van een model moet gezien worden als een kwaliteitskenmerk. In het algemeen vertonen eenvoudige modellen ook een grotere robuustheid, dat wil zeggen een grotere weerbaarheid ten opzichte van afwijkende invoerparameters. Validatie. Het in overeenstemming brengen van de modeluitkomsten met de waarnemingen heet de “calibratie” of het empirisch fitten van een model. Het valideren van een model daarentegen houdt in dat men toetst hoe goed het model in staat is voorspellingen te doen. Daarbij dient men gegevens te gebruiken die niet bij de calibratie zijn gebruikt. De vraag naar de validatie van een voorgesteld model mag nooit achterwege blijven. Praktische toepasbaarheid. Men moet het model kunnen toepassen binnen de randvoorwaarden die opgesteld worden voor wat betreft beschikbaarheid van tijd, geld en personeel. Dit heeft vooral betrekking op de verzameling van de voor het model benodigde invoergegevens.
1.8 Samenvatting Transport ontstaat voornamelijk door de ruimtelijke scheiding van economische en sociale activiteiten. Het geheel van sociale en economische activiteiten, daarbij inbegrepen de politieke en andere overleg- en besluitstructuren, wordt het activiteitensysteem genoemd. Het activiteitensysteem vertegenwoordigt de vraagzijde bij het totstandkomen van transport. Het geheel van transportvoorzieningen heet het transportsysteem en vertegenwoordigt de aanbodzijde. Vraag en aanbod resulteren in een evenwicht, het belastingpatroon geheten, tot uiting komend in een bepaalde omvang van de transportstromen met bijbehorende attributen als reistijden, congestieniveaus enz. Het evenwicht is niet statisch maar dynamisch, in die zin dat een bepaalde omvang van de transportstromen op hun beurt weer veranderingen kunnen induceren in het activiteiten- en transportsysteem, resulterend in een nieuw evenwicht. Dit proces blijft in voortdurende beweging.
13
2. Structuur van het traditionele verkeersmodel In dit hoofdstuk geven we een inleiding tot het traditionele verkeersmodel. Dit model kan gezien worden als een uitwerking van het in hoofdstuk 1 beschreven conceptuele model. Men spreekt van het traditionele verkeersmodel omdat jaren van onderzoek en toepassing resulteerden in een algemene modelstructuur. Deze structuur die ontstond in de zestiger jaren is, ondanks grote vooruitgang in modelleringstechnieken, min of meer ongewijzigd gebleven. De ontwikkeling van verkeersmodellen is begonnen in de jaren ‘50 in de Verenigde Staten, waar omvangrijke modellen werden gebouwd onder andere voor de steden Detroit en Chicago. In de jaren ‘60 spreidde het gebruik van verkeersmodellen zich via Engeland uit over de rest van Europa. In Vlaanderen is men vrij laat (begin jaren ‘90) gestart met de grootschalige invoering van verkeersmodellen. Nu beschikt elke provincie over een eigen multimodaal verkeersmodel. De behandeling van de structuur van het traditionele verkeersmodel wordt voorafgegaan door een korte uiteenzetting van de functie van dit model en een bespreking van enige begrippen uit de algemene modeltheorie. Daarin zal gewezen worden op het onderscheid tussen statische en dynamische modellen. De eerste verkeersmodellen waren statisch van aard. De meest recente onderzoeksinspanningen zijn gericht op de ontwikkeling van dynamische modellen. In deze tekst beperken wij ons echter tot statische modellen. De beschikbare literatuur op het gebied van verkeersmodellen is zeer uitgebreid. Een standaardtekst op het gebied van statische verkeersmodellen is Ortúzar en Willumsen (1995)2 .
2.1 Functie van het verkeersmodel Het activiteiten- en transportsysteem zijn aan voortdurende veranderingen onderhevig. Deze veranderingen kunnen autonoom zijn of gepland. Met autonome ontwikkelingen worden maatschappelijke veranderingen bedoeld die zich aan onze directe beïnvloeding onttrekken zoals technische ontwikkelingen, inkomensontwikkelingen, veranderende attitudes ten opzichte van werk en vrije tijd enz. De ontwikkelingen kunnen ook het resultaat zijn van een bewust planmatige aanpak. Voorbeelden hiervan zijn de aanleg van nieuwe infrastructuur, stimulering van het gebruik van andere vervoerwijzen bijvoorbeeld door prijsmaatregelen, het nastreven van bepaalde planologische inzichten enz. De functie van het in dit hoofdstuk te behandelen verkeersmodel is nu om bij een gegeven toestand van het activiteiten- en transportsysteem het resulterende (korte termijn) evenwicht te berekenen. De transportstromen kunnen bijvoorbeeld voor ontwerp-doeleinden worden gebruikt. Maar meer nog dan de transportstromen gaat het om de bepaling van de externe effecten van die stromen. Hierbij moet gedacht worden aan veelal negatieve effecten als aantasting van het milieu en tijd- en geldverlies en ergernis veroorzaakt door congestie. Bij de systeemanalyse in hoofdstuk 1 is er ook op gewezen dat de transportstromen op hun beurt weer invloed uitoefenen op het activiteitensysteem en het transportsysteem.
14 Het gaat hier meestal om lange termijn effecten als de herplaatsing van werk en woongebieden en de aanpassing van bestaande of aanleg van nieuwe infrastructuur. Deze terugkoppelingsstappen kunnen met de huidige verkeersmodellen nog niet goed worden aangepakt. Kwantitatieve modellen die dit ingewikkelde proces adequaat beschrijven verkeren nog in de ontwikkelingsfase. Voorbeelden van vragen die een beantwoording eisen in termen van transportstromen en waarvoor een verkeersmodel kan worden gebruikt zijn: • • •
Hoe verandert het transportpatroon in een gebied na de bouw van een nieuwe autoweg? Wat is het effect van een decentralisatie van werkgelegenheid naar de rand van een stad? Wat zijn de beste plaatsen voor de ontwikkeling van werk- en woongelegenheid in een gebied?
Deze vragen geven een indruk van het schaalniveau waarop een verkeersmodel wordt toegepast. De verkeersmodellen die in deze tekst worden behandeld bewegen zich op het schaalniveau van een stedelijk gebied of een regio zoals een provincie. Zij zijn uitdrukkelijk niet bedoeld voor de beschrijving van het verkeerspatroon op een enkele weg of kruispunt.
2.2 Modelbegrip Een model is een vereenvoudigde afbeelding van een deel van de werkelijkheid. We kunnen modellen classificeren naar de wijze van afbeelding. De afbeelding kan concreet of fysiek zijn, zoals in het geval van schaalmodellen. Een heel andere klasse wordt gevormd door de abstracte modellen. Er zijn vele typen abstracte modellen. Het type waarin wij in dit hoofdstuk zijn geïnteresseerd zijn de mathematische modellen. Het verkeersmodel is een mathematisch model. Op de algemene structuur van een mathematisch model komen we later nog terug. We kunnen modellen ook classificeren naar het doel waarvoor zij gebruikt worden. Hierbij onderscheiden wij beschrijvende, voorspellende en normatieve modellen. Beschrijvende modellen beperken zich tot de schematische beschrijving van een verschijnsel en proberen dit verschijnsel niet te verklaren. Een voorspellend model, of prognosemodel, heeft meer pretenties. Hier tracht men, op basis van de huidige toestand van een verschijnsel en kennis van te verwachten toekomstige invloedsfactoren tot een voorspelling van de toekomstige toestand te komen. Men kan daarbij een naïeve techniek volgen als het extrapoleren van trends of trachten tot een dieper begrip te komen van het betreffende verschijnsel door het ontwikkelen van een theorie. In het laatste geval spreekt men van een causaal model. Het te behandelen klassieke verkeersmodel is een voorbeeld van een causaal prognosemodel. Tenslotte kent men nog de normatieve modellen. Hier legt men een bepaalde norm of doelstelling op, in de vorm van een te optimaliseren doelfunctie, en tracht men te bepalen aan welke voorwaarden moet zijn voldaan om in die optimale toestand te geraken. Normatieve modellen heten ook wel voorschrijvende of optimalisatiemodellen.
15 Er zijn nog andere classificaties mogelijk. Zo kunnen we modellen indelen naar de rol die de tijd speelt bij het beschrijven van de verschijnselen. Het aantal voertuigen dat per tijdseenheid een bepaalde doorsnede van een weg passeert (een grootheid die in de verkeerskunde wordt aangeduid met de term “ intensiteit”) zal bijvoorbeeld in het algemeen in de tijd variëren. Wordt nu in een verkeersmodel deze tijdsafhankelijkheid daadwerkelijk beschreven, dan spreken we van een dynamisch model. Veronderstellen we daarentegen dat de stromen door een bepaalde doorsnede niet veranderen (tenminste over een zekere periode, bijvoorbeeld de spitsperiode) dan hebben we een statisch model. Als laatste noemen we de indeling naar de rol die kans speelt in het model. In veel modellen worden kansvariabelen gebruikt. Is dat het geval dan is er sprake van een stochastisch model. In een deterministisch model worden geen kansvariabelen gebruikt. Samenvattend kunnen we stellen dat het in deze tekst te behandelen traditionele verkeersmodel een abstract, mathematisch model is. Het is een statisch, voornamelijk causaal voorspellend model en bevat zowel deterministische als stochastische submodellen. Zoals later zal worden aangegeven zijn een aantal situaties, bijvoorbeeld ernstige congestie in het netwerk, niet goed te beschrijven met een statisch model. Daarom is er de laatste jaren een tendens zichtbaar naar de ontwikkeling van dynamische verkeersmodellen. Ondanks hun beperkingen vinden statische modellen nog veelvuldig toepassing. Om deze reden en omdat een goed begrip van statische modellen vooraf moet gaan aan de studie van dynamische verkeersmodellen, beperken wij ons in deze inleidende cursus tot statische modellen.
2.2.1 Mathematische modellen Mathematische modellen, zoals modellen in de verkeerskunde, bestaan uit stelsels van wiskundige vergelijkingen waarin het gedrag van de variabele Y wordt afgeleid uit een aantal variabelen Xi. Y = f ( Xi , a j )
waar: Y Xi aj
Afhankelijke ( of te verklaren) variabele Onafhankelijke ( of verklarende) variabelen Parameters
16 Verschijnsel Opstellen theorie
Wiskundige specificatie
Data
Calibratie
Voorspellen nieuwe data
Nieuwe data
niet ok
Validatie ok Toepasbaar model
Figuur 2-1 Constructie van een mathematisch model. Bij de constructie van een mathematisch model wordt een bepaalde werkwijze gevolgd zoals weergegeven in Figuur 2-1. Aan de hand van waarnemingen en nadenken over een verkeerskundig verschijnsel wordt een theorie geformuleerd, die zijn weerslag vindt in een wiskundige specificatie van het model. De specificatie van het model houdt in: •
het bepalen van de functionele vorm van de vergelijkingen
•
het vaststellen van de onafhankelijke variabelen.
Een mogelijke functionele vorm voor een theoretisch model is bijvoorbeeld een lineair additieve vorm zoals: Y = a1 X 1 + a 2 X 2 + ....
of een multiplicatieve vorm zoals: Y = aX 1 X 2 ...
2.2.2 Calibratie en validatie In het gespecificeerde mathematische model komen naast de onafhankelijke variabelen Xi nog een aantal parameters aj voor. Calibratie van het model betekent het bepalen van waarden voor de parameters, zodanig dat er een maximale overeenstemming bestaat tussen de door het model berekende waarden en de
17 waarnemingen. De waarnemingen, voor een verkeersmodel afkomstig uit enquêtes en tellingen, zijn geldig voor een bepaald tijdstip dat als ijkpunt wordt genomen. Men zegt veelal dat het model gecalibreerd is voor een bepaald basisjaar. Andere termen die gebruikt worden voor calibreren zijn: het ‘schatten’ van een model en het ‘fitten’ van een model. Indien een model gecalibreerd is zegt dat nog niets over de bruikbaarheid van het model voor het doen van voorspellingen. Het is in principe mogelijk, bij een voldoend groot aantal parameters, bijna elk model goed te fitten. Validatie van een model houdt in dat de modelvoorspellingen worden vergeleken met nieuwe waarnemingen. Deze waarnemingen mogen niet reeds bij de calibratie zijn gebruikt! Men kan bijvoorbeeld een model valideren door een situatie uit het verleden met het model te ‘voorspellen’ en die met de gerealiseerde situatie te vergelijken. (“backcasting”). Een gevalideerd model, tenslotte, kan gebruikt worden voor het maken van prognoses voor een bepaald planjaar. Hier is echter enige voorzichtigheid op zijn plaats. Verkeersmodellen zijn gebaseerd op analyses van het waargenomen bestaande verplaatsingsgedrag. Zij zijn daarom alleen geldig voor omstandigheden die niet te sterk afwijken van de omstandigheden waarop de analyses zijn gebaseerd. Bovendien zal de nauwkeurigheid van de voorspellingen afnemen naarmate het planjaar verder in de toekomst ligt, omdat de modellen geen rekening houden met eventuele geleidelijke veranderingen in attitudes ten aanzien van het maken van verplaatsingen. 2.3 Structuur verkeersmodel De omvang van het gebruik van verkeersvoorzieningen, zoals de verkeersbelasting van wegen en het aantal treinreizigers op een traject, komt tot stand als gevolg van een reeks keuzen die gedaan worden door individuele vervoerconsumenten. De keuzen waarvoor het individu zich gesteld ziet betreffen: • • • • •
de keuze voor het al dan niet maken van een verplaatsing de keuze van het vertrektijdstip de keuze van de herkomst en bestemming de keuze van de vervoerwijze de keuze van de route
De opname van de keuze van herkomst en betsemming in bovenstaande lijst vereist nog enige toelichting. Het overheersende reismotief is de dagelijkse verplaatsing tussen woning en werk. Bij de keuze van herkomst (woonplaats) zal men zich vaak laten leiden door de bereikbaarheid van mogelijke bestemmingen (werkplaatsen). De lijst suggereert dat het keuzeproces in een aantal afzonderlijke keuzen uiteenvalt. In het algemeen zal dit niet zo zijn. Sommige beslissingen zullen simultaan, dat wil zeggen gelijktijdig en in directe afhankelijkheid van elkaar, genomen worden en niet in de een of andere gedefinieerde volgorde. Om het probleem mathematisch handelbaar te maken wordt verondersteld dat de keuzen wel apart gemodelleerd kunnen worden. Wat de volgorde van de modellen betreft is in het bijzonder de onderlinge relatie tussen bestemmingskeuze en vervoerwijzekeuze problematisch. Vanwege de onderlinge verwevenheid kan men het best deze keuzen in één modelstap tezamen nemen.
18 De modellering van het vertrektijdstip is impliciet in het eerste submodel (het productie- en attractiemodel) opgenomen. Dat submodel berekent voor een specifieke periode, bijvoorbeeld de spits, de hoeveelheid ondernomen verplaatsingen. De submodellen hebben invoergegevens nodig. Het verkeerspatroon is het resultaat van een groot aantal individuele keuzen. We kunnen niet elke individuele keuze modelleren. Om het model handelbaar te maken moet samenvoeging of aggregatie worden toegepast. Het studiegebied wordt daartoe onderverdeeld in een aantal zones. Men tracht daarbij zones te onderscheiden die in sociaal-economisch opzicht zo homogeen mogelijk zijn. Binnen een zone groepeert men verplaatsingen naar verplaatsingsmotieven en persoonsgroepen. Voorts voorziet men het gebied van geschematiseerde netwerken voor de verschillende vervoerwijzen.
De volgende submodellen worden onderscheiden (zie Figuur 2-2) •
Productie/attractiemodel. Een productiemodel beschrijft het aantal verplaatsingen dat gegenereerd wordt in een zone als functie van een aantal persoonlijke kenmerken en kenmerken van de omgeving. Men berekent het totaal aantal geproduceerde verplaatsingen per zone en bekommert zich nog niet om de bestemming van die verplaatsingen. De verplaatsingen zijn gespecificeerd naar tijdstip (binnen of buiten de spitsperiode enz.) Een zone heeft niet enkel het vermogen om verplaatsingen te genereren maar ook het vermogen om verplaatsingen aan te trekken. Het totaal aantal verplaatsingen dat aangetrokken wordt door een zone onafhankelijk van de herkomst, als functie van kenmerken als werkgelegenheid of winkeloppervlak, wordt beschreven door een attractiemodel. De berekende producties en attracties worden ook wel trip-ends genoemd Over een voldoend lange periode bezien dient het totaal aantal vertrekken gerekend over alle zones overeen te komen met het totaal aantal aankomsten. De uitkomsten van de productie- en attractiemodellen worden, indien nodig, aangepast om hierin te voorzien. Dit heet het balanceren van producties en attracties.
•
Distributie/Vervoerwijzekeuzemodel Distributiemodel. In het distributiemodel worden de verplaatsingen met een herkomst in een bepaalde zone i, berekend in het productiemodel, verdeeld over de mogelijke bestemmingen j. De verplaatsingen die zone j als bestemming hebben, berekend in het attractiemodel, worden verdeeld over de mogelijke herkomsten i. De koppeling van herkomsten en bestemmingen wordt berekend als functie van het gemak of de weerstand waarmee de afstand tussen i en j kan worden overbrugd. De berekeningen in dit submodel monden uit in één of meer herkomst-bestemmingstabellen, al naar gelang men meerdere verplaatsingsmotieven of persoonsgroepen onderscheidt. In een herkomstbestemmingstabel (of HB-tabel) staan de herkomsten in de rijen van de tabel. De kolommen stellen de bestemmingen voor. De elementen van de tabel stellen de verplaatsingen voor tussen een bepaalde herkomst en een bestemming.
19 Vervoerwijzekeuzemodel. Met een vervoerwijzekeuzemodel wordt berekend welke vervoerwijze de reizigers gebruiken als functie van persoonskenmerken en van de in aanmerking komende vervoerwijzen. De berekende verdeling over de verschillende vervoerwijzen wordt “modal split” genoemd. De berekening resulteert in een verdere verdeling van de HB-tabellen naar vervoerwijze.
Gebiedsgegevens
Productie/attractie
Trip-ends
Verplaatsings weerstanden uit netwerkgegevens
Distributie/Vervoerwijze
HB-tabellen
Toedeling
Vervoersstromen
Figuur 2-2 Structuur van het traditionele verkeersmodel.
•
Toedelingsmodel. Er zijn, ook indien men slechts één vervoerwijze in aanmerking neemt, vaak verschillende routes mogelijk tussen een herkomst en een bestemming. Met een toedelingsmodel (ook wel routekeuzemodel genoemd) worden de verplaatsingen tussen de herkomsten en bestemmingen afkomstig uit de HB-tabellen , aan de mogelijke routes op het netwerk toegedeeld op basis van de eigenschappen van die routes (bijvoorbeeld de weerstand). De toedeling geschiedt per vervoerwijze afzonderlijk, en resulteert in vervoersstromen op de schakels van de verschillende netwerken. De berekende vervoersstromen impliceren bepaalde reistijden. Om de consistentie van de gebruikte variabelen in het totale model te waarborgen, vergelijkt men deze reistijden met de in het distributie/ vervoerwijzekeuzemodel gebruikte reistijden en voegt eventueel een iteratiestap toe.
2.4 Overzicht Uit de bespreking van de structuur van het verkeersmodel blijkt de centrale plaats van het begrip “keuze”. Het verkeerspatroon zoals we dat waarnemen is het gevolg van het
20 keuzegedrag van een groot aantal individuen. Er is behoefte aan een algemene theorie van het individuele keuzegedrag. Een theorie die een groot aantal vervoerverschijnselen bevredigend kan verklaren is de zogenaamde discrete keuze theorie. We laten daarom onze behandeling van het verkeersmodel voorafgaan door een bespreking van deze theorie. Alvorens een verkeersmodel te kunnen toepassen heeft men gegevens nodig over het gebied dat men wenst te bestuderen en over de netwerken die voor de verplaatsingen zullen worden gebruikt. Ook aan dit onderwerp wordt een hoofdstuk gewijd. Tenslotte komen in een viertal hoofdstukken achtereenvolgens het productie/attractiemodel, het distributiemodel, het vervoerwijzekeuzemodel en het toedelingsmodel aan de orde.
21
3. Discrete keuze theorie De in dit hoofdstuk te behandelen discrete keuze theorie is een algemene theorie toepasbaar in situaties waarin personen geacht worden een keuze te maken uit een aantal elkaar uitsluitende alternatieven. De discrete keuze theorie, oorspronkelijk afkomstig uit de psychologie en de economie, is zeer geschikt gebleken voor het modelleren van keuzesituaties in de verkeerskunde. Standaard referenties op dit gebied zijn de boeken van Ben Akiva en Lerman (1985) 3 en Train (19864, 20035). Het verkeersbeeld dat we dagelijks waarnemen is het directe gevolg van een aantal keuzes die mensen maken. Belangrijke keuzes in dit opzicht zijn bijvoorbeeld de keuze van woon- en werkplaats, de keuze van de vervoerwijze (auto, openbaar vervoer of anders) en de keuze van een route tussen een herkomst en een bestemming. Bij het maken van verkeersvoorspellingen is het van belang om inzicht te hebben in dit keuzeproces. Een typische gang van zaken bij het onderzoek naar dit keuzeproces is de volgende: aan de hand van een dataset met gegevens over de keuzes die mensen gemaakt hebben in bepaalde situaties proberen we regelmatigheden op te sporen en die in mathematische vorm te gieten. De op die manier afgeleide formules gebruiken we om de keuzes in nieuwe situaties te voorspellen. Het uitgangspunt van de theorie is dat een individu, geconfronteerd met een situatie waarin hij de keuze heeft tussen een aantal elkaar uitsluitende alternatieven, aan elk alternatief een zekere waardering of utiliteit zal toekennen. Deze utiliteit is een functie van de eigenschappen van de alternatieven en de kenmerken van de persoon die de keuze maakt. De keuze zal vallen op het alternatief met de hoogste utiliteit. Het probleem is dat utiliteiten niet direct waarneembaar en meetbaar zijn. Wel waarneembaar zijn de kenmerken van de alternatieven (bijvoorbeeld reistijd en kosten bij vervoerwijzekeuze) en de kenmerken van de personen die de keuze maken (bijvoorbeeld inkomen en leeftijd). We zullen daarom aannemen dat de utiliteit van een bepaald alternatief geschreven kan worden als een functie van die kenmerken. We kunnen er echter nooit zeker van zijn dat we alle kenmerken die van invloed zijn op de utiliteit in rekening hebben gebracht. En zelfs als we alle kenmerken in rekening zouden hebben gebracht dan zal een individu de alternatieven niet altijd op dezelfde wijze beoordelen, om redenen die zich aan onze waarneming onttrekken. Daarom worden de utiliteiten gemodelleerd als kansvariabelen. De keuzemodellen geformuleerd met behulp van de discrete keuze theorie geven dan ook de kansen aan waarmee de verschillende alternatieven zullen worden gekozen. De verzameling alternatieven waaruit gekozen kan worden heet de keuzeverzameling. Sommige keuzeverzamelingen zijn van nature continu, dat wil zeggen zij bevatten een oneindig aantal elementen. Stel bijvoorbeeld dat men voor de vervaardiging van een product een keuze moet maken voor de toe te passen hoeveelheden grondstoffen waaruit het product is samengesteld. Omdat een hoeveelheid wordt voorgesteld door een continue variabele is hier sprake van een continue keuzeverzameling. Wij zijn in dit hoofdstuk echter geïnteresseerd in discontinue keuzeverzamelingen, waar de keuzeruimte slechts bestaat uit een eindig aantal discrete, elkaar uitsluitende alternatieven. Dit verklaart de naam discrete keuze theorie.
22
3.1 Utiliteiten als kansvariabelen Stel een individu verkeert in een keuzesituatie. Hij heeft de keuze uit K alternatieven. De vraag is voor welk alternatief hij zal kiezen. De discrete keuze theorie postuleert nu dat hij aan elk alternatief een zekere gekwantificeerde waardering zal toekennen en dat hij na toekenning van een utiliteit aan elk der alternatieven het alternatief met de hoogste utiliteit zal kiezen. De waardering (een getalswaarde, een scalaire grootheid) wordt ook wel nut of utiliteit genoemd. Wij zullen in het vervolg de term utiliteit hanteren. De utiliteit van een alternatief voor een individu is een functie van de kenmerken van het alternatief en de persoonskenmerken van het individu. Nu kan het voorkomen dat personen die voor het oog van de waarnemer (de onderzoeker) in precies dezelfde keuzesituatie verkeren toch tot verschillende keuzen komen. Dit kan verschillende oorzaken hebben. Het kan zijn dat de onderzoeker bepaalde kenmerken, die voor het individu wel degelijk belangrijk zijn voor zijn keuze, niet heeft verdisconteerd, hetzij door onwetendheid, hetzij door gebrek aan data. Het kan ook zijn dat de onderzoeker op de hoogte is van bepaalde overwegingen maar die niet heeft verdisconteerd omdat het moeilijk is om die factoren te kwantificeren. Voorbeelden van lastig kwantitatief te omschrijven kenmerken zijn de factoren comfort en privacy bij de keuze tussen auto en openbaar vervoer. Ook andere omstandigheden kunnen een rol spelen. Bepaalde kenmerken zijn misschien onderhevig aan meetfouten. Zo kunnen bijvoorbeeld de door de onderzoeker geschatte reistijden afwijken van de werkelijk ondervonden reistijden. Het resultaat van bovengenoemde effecten, zoals het achterwege laten van sommige kenmerken of het onjuist in rekening brengen van andere kenmerken, is dat de door de onderzoeker berekende utiliteit voor een bepaalde persoon afwijkt van de door die persoon in werkelijkheid ondervonden utiliteit. Daarom wordt de utiliteit van het alternatief a geschreven als een stochastische of kansvariabele Ua bestaande uit een systematische (niet-stochastische) component Va, en een stochastische component εa (een zogenaamde stoorterm). De stoorterm vertegenwoordigt de onzekerheid veroorzaakt door de niet of onjuist in rekening gebrachte kenmerken en is gedefinieerd als het verschil tussen de door de keuzemaker werkelijk ervaren utiliteit en de door de onderzoeker waargenomen utiliteit.
U a = Va + εa We noemen Ua de (werkelijke) utiliteit en Va de waarneembare utiliteit van het alternatief a. Voor een willekeurig gekozen persoon zal gelden dat de kans (probability) Pr(a) dat hij het alternatief a zal kiezen gelijk is aan de kans dat de utiliteit van alternatief a groter is dan de utiliteiten van alle andere alternatieven:
Pr( a ) = Pr(U a > U k )
voor alle k ≠ a
De utiliteit U heeft de volgende twee belangrijke eigenschappen:
23 •
Het optellen van een constante bij de utiliteiten van alle alternatieven (of het aftrekken van een constante) heeft geen invloed op de kansen waarmee de alternatieven worden gekozen. Immers: Pr( a ) = Pr(U a > U k ) = Pr(U a − U k > 0)
voor alle k ≠ a
Bovenstaande uitdrukking laat zien dat slechts het verschil van utiliteiten bepalend is voor de kans dat een bepaald alternatief wordt gekozen en niet het absolute niveau van de utiliteiten. Constanten opgeteld bij alle utiliteiten vallen tegen elkaar weg. •
Het vermenigvuldigen van de utiliteiten van alle alternatieven met eenzelfde positieve constante µ heeft geen invloed op de kansen waarmee de alternatieven worden gekozen. Immers: Pr( a ) = Pr(U a > U k ) = Pr( µU a > µU k )
voor µ > 0 en voor alle k ≠ a
We mogen utiliteiten dus met een willekeurige constante positieve factor schalen. Voorbeeld Stel dat een stad door twee alternatieve vervoerwijzen 1 en 2 bediend wordt. Een homogene groep personen, d.w.z. een groep waarvan elk lid dezelfde persoonskenmerken heeft, kiest uit deze twee vervoerwijzen. De alternatieven hebben de volgende utiliteiten: U1 = 5 + ε1 U2 = 7 + ε2 Veronderstel dat het volgende geldt voor de kansverdelingen van de stoortermen:
ε1 ε2
Uniform verdeeld tussen –2 en +2 Uniform verdeeld tussen –1 en +1
Neem verder aan dat de kansverdelingen voor de stoortermen onafhankelijk zijn van elkaar. Wat is de kans dat een reiziger kiest voor de eerste vervoerwijze? Oplossing: Puur op basis van de waarneembare utiliteiten V1 = 5 en V2 = 7 (laten we zeggen bepaald op basis van de reistijden en reiskosten alleen) zouden we concluderen dat een reiziger gaat kiezen voor alternatief 2. Maar er zijn meer factoren die de keuze beïnvloeden, gerepresenteerd door de kansvariabelen (stoortermen) ε1 en ε2. Het kan nu zijn dat voor sommige reizigers de utiliteit U1 toch hoger uitvalt dan de utiliteit U2. We willen weten met welke kans dit het geval zal zijn. We zoeken:
Pr(1) = Pr(U1 > U2) = Pr(5 + ε1 > 7 + ε2)
24
9 U2 8
D
C
A
B
ε2 7
ε2 6 5 4 3 2
ε1
1
ε1
0 0
1
2
3
4
5
6
7
8
9 U1
Figuur 3-1 Voorbeeld keuzebepaling bij uniforme verdeling stoortermen In Figuur 3-1 zijn U1 en U2 grafisch tegen elkaar uitgezet. De waarde van U1 ligt tussen 3 en 5, waarbij elke waarde in dit interval een gelijke kans van optreden heeft (vanwege de Uniforme verdeling). Voor U2 ligt het interval tussen 6 en 8. Een combinatie van U1 en U2 wordt weergegeven door een punt in de rechthoek ABCD. Elk punt in deze rechthoek heeft een gelijke kans van optreden (dit keer vanwege de Uniforme verdelingen en het feit dat de kansverdelingen voor de stoortermen onafhankelijk zijn van elkaar). De lijn vanuit de oorsprong geeft aan waar U1 = U2. Voor de gearceerde driehoek geldt dat U1 > U2. De kans dat een reiziger kiest voor de eerste vervoerwijze is bijgevolg gelijk aan de verhouding tussen de oppervlakte van de gearceerde driehoek en de rechthoek ABCD. Dus Pr(1) = 1/16 = 6,25% In het voorbeeld is ervan uitgegaan dat de kansverdelingen voor ε1 en ε2 onafhankelijk zijn van elkaar. Dat betekent dat de realisatie van een bepaalde waarde voor ε1 geen enkele invloed heeft op de waarde van ε2. Dat vereenvoudigt de berekeningen zeer. Stel dat er sprake zou zijn van afhankelijkheid, bijvoorbeeld dat een hoge waarde van ε1 de neiging zou hebben samen te gaan met een hoge waarde van ε2 en evenzo een lage waarde van ε1 met een lage waarde van ε2 (positieve correlatie tussen ε1 en ε2), dan zouden niet alle punten in de rechthoek ABCD een gelijke kans van optreden hebben. Er zou een tendens zijn dat meer punten zich zouden situeren rond de diagonaal van A naar C dan in de rest van de rechthoek ABCD. Dit zou zijn weerslag hebben op de kansen waarmee beide alternatieven zouden worden gekozen.
3.2 Logitmodel Het is uit het voorgaande voorbeeld duidelijk geworden dat de kansen op het kiezen van de verschillende alternatieven zullen afhangen van de kansverdelingen die we aannemen voor de stoortermen ε. Welke kansverdelingen voor de stoortermen kunnen nu het beste worden gekozen? De meest voor de hand liggende statistische verdeling voor de stoortermen is een Normale verdeling. Dat komt omdat een stoorterm gezien kan worden als de som van een groot aantal willekeurige effecten en de kansverdeling van een dergelijke som zal volgens een generalisatie van de Centrale Limietstelling tenderen naar een Normale verdeling.
25 Niet alleen de vormen van de kansverdelingen zijn van belang, maar ook de varianties. We hebben te maken met een groot aantal stoortermen, namelijk zoveel als er alternatieven in de keuzeverzameling zijn. Om berekeningen uit te kunnen voeren moeten we weten of de varianties (de grootte van de spreiding) van de verschillende stoortermen onderling verschillend zijn of dat alle varianties gelijk aan elkaar zijn. Tenslotte moeten we weten of er onderlinge afhankelijkheid (correlatie) tussen de kansverdelingen van de stoortermen voor de verschillende alternatieven bestaat. Een gezamenlijke kansverdeling (voor een aantal variabelen tegelijk) die gebruik maakt van Normale verdelingen voor alle variabelen, waarbij de varianties van de variabelen verschillend mogen zijn en waarbij er onderlinge afhankelijkheid tussen de variabelen mag bestaan heet een Multivariate Normale verdeling. Een discreet keuzemodel dat gebruik maakt van een Multivariate Normale kansverdeling voor de stoortermen heet een probit model. Het liefst zouden we een probit model toepassen omdat dat het meest algemene model is. Het nadeel van een probit model is echter dat het resultaat zich niet in een gesloten analytische vorm laat schrijven en dat men bij de toepassing ervan zijn toevlucht moet nemen tot simulatie-berekeningen (Monte Carlo technieken). Bovendien worden de berekeningen zeer bewerkelijk indien het aantal keuzealternatieven toeneemt. Daarom heeft men gezocht naar vereenvoudigingen. Het meest bekende discrete keuze model, het logitmodel, ontstaat als men de volgende drie vereenvoudigende veronderstellingen doet: •
Aanname 1: Veronderstel dat alle stoortermen ε een Gumbelverdeling hebben. Deze kansverdeling wordt ook wel een extreme-value (EV) verdeling genoemd omdat hij wordt toegepast bij de statistische analyse van extreme waarden (bijvoorbeeld de verdeling van extreme hoogwaterstanden in rivieren of langs de kust). In ons geval gaat het echter niet om de analyse van extreme waarden. Wij gebruiken de Gumbelverdeling enkel omdat hij sterk lijkt op een Normale verdeling, maar zich analytisch gemakkelijker laat manipuleren dan de Normale verdeling. Daardoor zijn we later in staat om de kansen dat bepaalde alternatieven worden gekozen in een gesloten analytische vorm te schrijven. Dat lukt niet met de Normale verdeling. De cumulatieve verdelingsfunctie voor de Gumbelverdeling luidt: F (ε ) = exp(− e − µ .ε ) In deze vorm geschreven heeft de verdeling de volgende eigenschappen: de modus (abscis van het hoogste punt van de verdeling) = 0, de verwachte waarde = 0,577../µ (0,577.. is de constante van Euler), de variantie = π2 / 6µ2 ; de parameter µ is een maat voor de spreiding van de verdeling waarvoor geldt hoe groter de µ hoe kleiner de spreiding. De verwachte waarde (het ‘gemiddelde’) van deze kansverdeling is dus niet gelijk aan nul, maar dat is niet belangrijk want, zoals boven aangegeven, is slechts het verschil van utiliteiten bepalend voor de kans dat een bepaald alternatief wordt gekozen en bij het bepalen van dat verschil vallen dezelfde gemiddeldes van de verdelingen tegen elkaar weg. De gemiddeldes zijn
26 hetzelfde op basis van aanname 2, die hieronder wordt genoemd. Figuur 3-2 laat zien dat de Normale en de Gumbelverdeling erg op elkaar lijken.
Figuur 3-2 Normale en Gumbelverdeling (zelfde gemiddelde en variantie) •
Aanname 2: Veronderstel dat de kansverdelingen voor alle stoortermen identiek zijn, dat wil zeggen dat zij allen dezelfde variantie (dus dezelfde µ) hebben.
•
Aanname 3: Veronderstel dat de kansverdelingen voor alle stoortermen statistisch onafhankelijk van elkaar zijn.Zoals al eerder opgemerkt vereenvoudigt dit de zaak zeer, want het berekenen van de gecombineerde kans op het optreden van een aantal onafhankelijke gebeurtenissen is veel eenvoudiger dan het berekenen van de gecombineerde kans op het optreden van een aantal afhankelijke gebeurtenissen. Bij onafhankelijke gebeurtenissen vinden we de gecombineerde kans op het optreden van een aantal gebeurtenissen namelijk eenvoudigweg door vermenigvuldiging van de kansen op het optreden van elk van die gebeurtenissen apart. (Later in dit hoofdstuk zal blijken dat het vooral deze aanname is die beperkingen oplegt aan het gebruik van het logitmodel. Er zijn omstandigheden waarin het niet gerechtvaardigd is om van onafhankelijkheid van de kansverdelingen uit te gaan, en in die omstandigheden leidt toepassing van het logitmodel tot onjuiste resultaten.)
Als men de bovengenoemde 3 aannamen doet dan kan voor de kans op de keuze van alternatief a uit een totaal van K alternatieven de volgende eenvoudige formule worden afgeleid: '
Pr(a ) =
e µV a
∑
K k =1
'
e µVk
Deze formule wordt het multinomiale logitmodel of kortweg logitmodel genoemd. De naam logit is afgeleid van de zogenaamde logistische functie, waarvan de grafiek een S-vormige curve is, die we verderop in dit hoofdstuk nog tegen zullen komen. Zoals uit de formule blijkt is de kans dat alternatief a wordt gekozen afhankelijk van de waarneembare utiliteiten V’ van de alternatieven, maar daarnaast ook nog afhankelijk
27 van de spreidingsparameter µ. Omdat alle utiliteitscomponenten V’ worden vermenigvuldigd met dezelfde positieve constante factor µ kan in de praktijk de spreidingsparameter µ statistisch niet apart uit waarnemingen geschat worden. Uit de statistische schatting vinden we de waarde van µV’ en we vatten deze waarde op als de waarneembare utiliteit V van een alternatief. Dit is mogelijk omdat we, zoals eerder aangegeven, utiliteiten met eenzelfde positieve factor mogen schalen zonder dat dit invloed heeft op de berekende kansen. Dit duidt erop dat we bij de afleiding ook uit hadden mogen gaan van een genormaliseerde Gumbel verdelingsfunctie met µ = 1. Het logitmodel komt er daarmee als volgt uit te zien:
Pr( a ) =
eVa
∑
K k =1
eVk
Stel dat men het logitmodel wil toepassen bij het probleem van de vervoerwijzekeuze. In dat geval hebben de symbolen de volgende betekenis: Pr(a) = = Vk K =
de kans dat vervoerwijze a wordt gekozen de waarneembare utiliteit van vervoerwijze k het aantal alternatieve vervoerwijzen
Als K = 2 spreekt men van binaire logit en in het geval K > 2 van multinomiale logit. De waarneembare utiliteiten Vk zijn, zoals gezegd, een functie van de kenmerken van de alternatieven en van de persoonskenmerken. Meestal neemt men voor deze functie een lineaire functie zoals in het volgende voorbeeld: Voorbeeld: Stel een situatie waar een keuze gemaakt kan worden uit 3 vervoerwijzen: auto, bus en fiets voor bijvoorbeeld de woon-werk verplaatsing. Neem aan dat we over een data-set beschikken met waarnemingen van de diverse woon-werk verplaatsingen van een homogene groep personen (dat wil zeggen dat de persoonskenmerken binnen de groep dezelfde zijn, of althans min of meer overeenkomstig). De dataset bevat per persoon de geldende reistijd en kosten voor zijn woonwerkverplaatsing voor de 3 vervoerwijzen en de door hem gemaakte keuze van vervoermiddel. Met behulp van die dataset werden de volgende functies voor de waarneembare utiliteiten Vk geschat: Vauto Vbus Vfiets
= 1,0 = = -0,5
- 0,15 * Cauto - 0,15 * Cbus
- 0,10 * Tauto - 0,10 * Tbus - 0,10 * Tfiets
Hierin zijn T en C respectievelijk de reistijd en de reiskosten van de verplaatsing. Stel nu dat we voor een individu (vergelijkbaar qua persoonskenmerken met de personen uit de dataset waarop de formules zijn gebaseerd) de kansen willen bepalen op het kiezen van auto, bus of fiets voor een bepaalde woon-werk verplaatsing waarvan de reistijd en kosten zijn vermeld in onderstaande tabel:
T (min) C (euro)
Auto 5 0,20
Bus 15 0,17
Fiets 20 -
28 De kansen op het kiezen van een bepaalde vervoerwijze kunnen nu als volgt worden berekend: Vauto = 0.47
Vbus = -1.53
Pr(auto) = e0.47 / ( e0.47 + e-1.53 + e-2.50 ) Pr(bus) Pr(fiets)
Vfiets = -2.50 = 84.3 % = 11.4 % = 4.3 %
Uit dit voorbeeld blijkt dat utiliteiten negatief kunnen zijn. Een negatieve utiliteit of nut moet niet worden geïnterpreteerd als het tegenovergestelde van een positieve utiliteit of nut. Zoals reeds hiervoor betoogd is het absolute niveau van de utiliteiten niet van belang. Optelling van (eenzelfde) constante bij elk van de utiliteiten leidt tot dezelfde uitkomsten.
3.3 Specificatie van een logitmodel In het voorbeeld hierboven waren de functies voor de waarneembare utiliteiten Vk gegeven. Het bepalen van deze functies (dit heet de specificatie van het model) is echter verre van triviaal. We kunnen bij de specificatie een aantal fases onderscheiden: 3.3.1 Functionele vorm Meestal wordt een lineaire functie van de kenmerken toegepast. Lineaire functies blijken in de praktijk redelijk te voldoen. Het voordeel van een lineaire functie is dat de schatting van de parameters uit de waarnemingen gemakkelijker is. Specificatie van een lineaire functie is echter geenszins verplicht; ook niet-lineaire functies komen in aanmerking. 3.3.2 Variabelen In de functies voor de waarneembare utiliteit van een alternatief dienen die variabelen te worden opgenomen waarvan vermoed wordt dat ze invloed zullen hebben op de uiteindelijke keuze. (Zoals eerder vermeld is het opnemen van werkelijk alle invloedsvariabelen quasi onmogelijk, hetzij omdat sommige invloedsvariabelen zich aan onze waarneming onttrekken hetzij door gebrek aan gegevens betreffende die variabelen). In het algemeen zijn de invloedsvariabelen te onderscheiden in: •
variabelen die karakteristiek zijn voor een bepaald alternatief (zoals bijvoorbeeld reistijd en reiskosten) en
•
variabelen die kenmerkend zijn voor de keuzemaker (zoals bijvoorbeeld inkomen en leeftijd).
•
variabelen die een combinatie zijn van kenmerken van de alternatieven en persoonskenmerken. Stel dat de reiskosten van een alternatief worden aangegeven door C en het inkomen van een persoon door I. We zouden dan kunnen veronderstellen dat het niet zozeer de absolute kost is van een alternatief die de keuze bepaalt, maar meer de kosten van het alternatief in relatie tot het inkomen van een persoon. In dat geval zouden we I/C als variable in een functie kunnen opnemen
We kunnen de gebruikte variabelen ook nog onderscheiden op een andere manier, namelijk of zij generiek dan wel alternatief-specifiek zijn:
29 •
Generieke variabelen zijn variabelen die in alle functies voor de verschillende alternatieven voorkomen en daar dezelfde coëfficiënt hebben. In bovenstaand voorbeeld is de reistijd een generieke variabele. Hieraan ligt de veronderstelling ten grondslag dat een minuut reistijd eenzelfde invloed heeft op de utiliteit, onverschillig of het een minuut reistijd per auto, bus of fiets is.
•
Alternatief-specifieke variabelen zijn variabelen die niet in de functies voor alle alternatieven voorkomen maar alleen in de functies van één of meer alternatieven. In bovenstaand voorbeeld is reiskosten bijvoorbeeld een alternatief-specifieke variabele. Vaak wordt een alternatief-specifieke variabele in de utiliteitsfunctie van slechts één alternatief gebruikt. Als we in bovenstaand voorbeeld reden zouden hebben gehad te veronderstellen dat een minuut reistijd door een persoon verschillend zou worden gewaardeerd al naar gelang het een minuut per auto, per bus of per fiets is, dan zouden de reistijden voor auto, bus en fiets als drie verschillende alternatiefspecifieke variabelen zijn gespecificeerd, en zouden er verschillende coëfficiënten voor zijn geschat. Constanten zijn een bijzondere vorm van alternatief-specifieke variabelen (ook wel alternatief-specifieke constanten genoemd). In bovenstaand voorbeeld worden twee alternatief-specifieke constanten gebruikt. Het heeft geen zin om een alternatief-specifieke constante in de functies van alle alternatieven te specificeren. Het optellen van eenzelfde constante in de utiliteitsfuncties van alle alternatieven heeft immers, zoals eerder aangegeven, geen invloed op de uiteindelijk berekende keuzes. Dat betekent dat we de alternatieve-specifieke constante voor één functie op nul kunnen zetten en alle andere functies met die op nul gezette constante kunnen corrigeren. In het voorbeeld zijn slechts de kenmerken van de alternatieven als variabelen gebruikt. We gingen ervan uit dat de functies geschat waren voor een groep personen met dezelfde persoonskenmerken. In het algemeen kunnen echter ook de persoonskenmerken van het individu dat de keuze maakt in de utiliteitsfuncties zijn opgenomen. Het betreft dan socio-economische variabelen zoals inkomen, leeftijd enz. Het heeft geen zin een variabele als inkomen als generieke variabele in de functies van alle alternatieven te specificeren omdat die term met inkomen voor één individu als eenzelfde constante in alle functies zou voorkomen. De term met inkomen zou bijgevolg geen invloed hebben op de berekende keuze van het individu. Socio-economische variabelen dienen dus als alternatief-specifieke variabelen te worden gespecificeerd. Een gecombineerde variabele als inkomen gedeeld door reiskosten daarentegen behoeft niet alternatief-specifiek te zijn, maar mag ook generiek zijn.
3.3.3 Schatting coëfficiënten logitmodel Nadat een functionele vorm voor de utiliteitsfuncties is gespecificeerd en bovendien is vastgesteld welke variabelen in de functies zullen worden opgenomen, kunnen de coëfficiënten die in de functies voorkomen met behulp van waarnemingen worden geschat. Men heeft hiervoor een steekproef nodig met de volgende gegevens:
30 •
informatie over de kenmerken van de alternatieven waaruit een keuze wordt gemaakt (bij vervoerwijzekeuze bijvoorbeeld reistijd, reiskosten etc.).
•
informatie over de persoonskenmerken van de keuzemaker (bijvoorbeeld inkomen, leeftijd, gezinsomstandigheden etc).
•
waarnemingen van de keuze die daadwerkelijk gemaakt is in een bepaalde situatie.
Voor de schatting van de coefficienten maakt men gewoonlijk gebruik van een statistische schattingsmethode die bekend staat als de method of maximum likelihood (methode van de maximale aannemelijkheid). We illustreren de methode aan de hand van een klein voorbeeld. Stel dat we een logitmodel willen opstellen voor de keuze tussen auto en bus. Om het voorbeeld eenvoudig te houden gaan we ervan uit dat de keuze tussen auto en bus voornamelijk door de reistijd wordt bepaald. (In werkelijkheid zullen een groot aantal andere factoren ook een rol spelen.) We nemen aan: Vauto = a.Tauto + b Vbus = a.Tbus De reistijd T wordt dus als een generieke variabele gespecificeerd, want in beide formules heeft T dezelfde coëfficiënt a. Bovendien hebben we een alternatiefspecifieke constante b toegevoegd. Ons doel is nu om, aan de hand van waarnemingen van de keuzes die mensen in verschillende omstandigheden hebben gemaakt, de beste waarden te schatten voor de coëfficiënten a en b. (We verwachten op voorhand een negatieve waarde te vinden voor a, want hoe hoger de reistijd, hoe lager de utiliteit zal zijn. Wat de waarde van b betreft, als uit de waarnemingen zou blijken dat bij gelijke reistijd voor beide alternatieven meestal de auto de voorkeur krijgt, dan verwachten we een positieve waarde van b. ) Stel dat we beschikken over de volgende waarnemingen van de woon-werk verplaatsingen van 3 personen: persoon
Tauto (minuten)
Tbus (minuten)
keuze
1
12
23
auto
2
31
27
auto
3
19
9
bus
(In een werkelijke situatie zullen veel meer dan 3 waarnemingen nodig zijn om tot een betrouwbare schatting te komen!) Merk op dat persoon 2 kiest voor auto, hoewel bus een kleinere reistijd heeft. Er zijn dus kennelijk nog andere factoren dan de reistijd die een rol spelen bij de keuze. Zoals eerder uiteengezet is dat juist de reden waarom we de utiliteit opvatten als een stochastische grootheid. De kans dat persoon 1 voor de auto kiest kan geschreven worden als:
31
eVauto e12 a + b = eVauto + eVbus e12a + b + e 23a
Pr(1, auto) =
Evenzo kunnen we voor personen 2 en 3 schrijven:
Pr( 2, auto) =
eVauto e31a + b = eVauto + eVbus e31a + b + e 27 a
eVbus e9 a Pr(3, bus) = Vauto = 19 a + b Vbus e +e e + e9 a Beschouw nu alle waarnemingen tezamen. Omdat de keuze van elke persoon onafhankelijk is van de keuze van de andere personen is de totale waarschijnlijkheid van het optreden van juist deze 3 waarnemingen tezamen gelijk aan het product van de 3 berekende individuele kansen. Deze totale waarschijnlijkheid wordt aangeduid met de term likelihood L (aannemelijkheid) van het optreden van de steekproef.
L = Pr(1, auto) ∗ Pr(2, auto) ∗ Pr(3, bus) Als we de kansen invullen in de formule voor de likelihood zien we dat de likelihood L een functie is van de factoren a en b. De maximum likelihood methode houdt nu in dat we a en b zodanig kiezen dat de likelihood functie L wordt gemaximaliseerd. Vaak is het gemakkelijker om de logaritme van de likelihood (de log-likelihood LL) te maximaliseren, omdat het product van kansen dan overgaat in een som van kansen:
LL = ln( L) = Pr(1, auto) + Pr(2, auto) + Pr(3, bus) Omdat de logaritme-functie een monotone functie is treden het maximum van L en het maximum van LL op voor dezelfde waarden van de veranderlijken. De waarden van a en b die de (log)-likelihood maximaliseren kunnen nu bijvoorbeeld worden bepaald door de afgeleiden naar a en b gelijk aan nul te stellen. Wij zullen dat hier niet doen. Bij een groot aantal variabelen en waarnemingen gebruikt men beter standaard beschikbare statistische software om de schatting uit te voeren. Die software levert ook statistische kentallen waarmee de kwaliteit van de schatting kan worden beoordeeld. 3.4 Grafische illustratie van het binaire logitmodel Stel er is een keuze tussen twee alternatieven: alternatief 1 en alternatief 2. Voor een binair logitmodel geldt dan:
eV1 Pr(1) = V1 e + eV2 Na deling van teller en noemer door exp(V1) ontstaat: Pr(1) =
1 1+ e
−( V1 −V2 )
We plotten nu Pr(1) als een functie van (V1-V2). Zie Figuur 3-3.
32 De curve die ontstaat heet een logistische curve. Zoals verwacht zijn de kansen op beide alternatieven gelijk aan 0.5 als de waarneembare utiliteiten gelijk zijn (dat wil zeggen als V1-V2 = 0). Als V1 groot is vergeleken met V2 (dus als V1-V2 >> 0) dan gaat Pr(1) asymptotisch naar 1. Omgekeerd als V1 veel kleiner is dan V2 dan nadert Pr(1) tot 0.
Figuur 3-3 De logistische curve.
3.5 Geaggregeerde en gedisaggregeerde modellen Het behandelde logitmodel is een voorbeeld van een gedisaggregeerd model. Hiermee wordt bedoeld dat uitgegaan wordt van het gedrag van individuen, of van groepen individuen met dezelfde persoonskenmerken. In contrast hiermee zijn de meeste modellen die we in de andere hoofdstukken van deze cursustekst behandelen geaggregeerde modellen. Daarbij wordt gebruik gemaakt van gemiddelden bijvoorbeeld over een zone. Hoewel een gedisaggregeerd logitmodel het ons mogelijk maakt keuzewaarschijnlijkheden op individuele grondslag te berekenen zijn we toch uiteindelijk geïnteresseerd in de voorspelling van het reisgedrag over een heel gebied. Omdat het logitmodel een niet-lineair model is, is het aggregeren van individuele kansen naar kansen die gelden voor een geheel gebied niet triviaal. We kunnen niet zonder meer uitgaan van de gemiddelde waarden van de verklarende variabelen over het gehele gebied. Een voorbeeld kan dit verduidelijken. Zie Figuur 3-4 Persoon A ondervindt een waarneembare utiliteit VA, voor persoon B bedraagt die VB. De correcte gemiddelde waarde van de kansgrootheid voor de groep van 2 personen A en B is gelijk aan (Pr(A) + Pr(B))/2 , dus correct is het om eerst de individuele kansen te bepalen en dan pas te middelen. Zouden we uitgaan van de gemiddelde waarden van de verklarende variabelen (de waarneembare utiliteiten) en op basis daarvan de kansgrootheid voor de groep bepalen dan verkrijgen we de incorrecte waarde van Pr((VA + VB)/2), behorende bij punt C in de figuur. Het probleem is echter dat het in de praktijk ondoenlijk is eerst alle individuele kansen te bepalen. Er zijn verschillende procedures bedacht om aan deze moeilijkheid tegemoet te komen. Een van de mogelijkheden is het beperken van de aggregatiefout door het aanbrengen van een classificatie in persoonstypen.
33 Een voorbeeld kan dit verduidelijken. Stel dat de keuze voor een bepaald alternatief (mede) afhangt van het inkomen van de keuzemaker. We moeten dan, als we het keuzegedrag in een bepaald gebied willen bepalen, niet uitgaan van een gemiddelde keuzemaker (in dit geval het gemiddelde inkomen in het gebied). We doen er beter aan de bevolking in het gebied in te delen in min of meer homogene groepen (wat inkomen betreft), vervolgens voor elk van die groepen het keuzegedrag te bepalen om tenslotte uit die gegevens het gemiddelde keuzegedrag voor het gehele gebied vast te stellen.
Figuur 3-4 Fout bij aggregatie via gemiddelden.2 Het verdient altijd aanbeveling om bij de toepassing van het logitmodel uit te gaan van gedisaggregeerde gegevens. Indien we daarover niet beschikken rest ons geen andere mogelijkheid dan met gemiddelde waarden voor de waarneembare utiliteiten over een geheel gebied te werken. De bezwaren die daaraan kleven zijn in het voorgaande uiteengezet.
3.6 Beperkingen van het logitmodel De aannamen die we hebben gedaan bij de afleiding van het logitmodel, namelijk identieke stoortermen met dezelfde variantie en onafhankelijkheid van de stoortermen onderling, hebben geleid tot een eenvoudig hanteerbaar model. Maar wanneer niet aan deze aannamen is voldaan leidt toepassing van het logitmodel tot onjuiste resultaten. We zullen het bovenstaande toelichten aan de hand van een aantal voorbeelden. Het gaat in deze voorbeelden om routekeuzeproblemen en vervoerwijzekeuze. Daar het logitmodel in beginsel toegepast kan worden voor allerhande keuzesituaties kunnen de gesignaleerde problemen ook in andere contexten voorkomen.
34
3.6.1 Voorbeelden Voorbeeld 1 (variantie stoortermen ε niet identiek) Bij de behandeling van het binaire logitmodel bleek dat de kansen op beide alternatieven een functie zijn van het verschil van de waarneembare utiliteiten van de alternatieven. Stel nu dat bij een routekeuze model alleen de reistijd als bepalende variabele wordt gezien en dat men de waarneembare utiliteit schrijft als een lineaire functie van de reistijden van de alternatieve routes. Dan zou uit het logitmodel volgen dat de kansen op het kiezen van de verschillende routes een functie zouden zijn van het reistijdverschil tussen de alternatieven. Beschouw nu het routekeuzeprobleem geïllustreerd in Figuur 3-5. In het eerste geval (Figuur 3-5a) zijn de reistijden langs beide routes respectievelijk 5 en 10 minuten, terwijl in het tweede geval de reistijden 125 en 120 minuten bedragen. Het reistijdverschil langs de alternatieve routes bedraagt in beide gevallen 5 minuten. Het logitmodel zou nu voorspellen dat het verkeer zich in beide gevallen in dezelfde proporties over de alternatieve routes zou verdelen. Dit leidt tot een onlogisch resultaat, want het mag verwacht worden dat een reistijdverschil van 5 minuten op een totale reistijd van 5 à 10 minuten niet hetzelfde resultaat geeft als eenzelfde verschil van 5 minuten, maar nu op een reis van 2 uur.
Figuur 3-5 Logit routekeuze (1).10 Het onjuiste resultaat wordt veroorzaakt door het feit dat bij de afleiding van het logitmodel aangenomen wordt dat de varianties van alle stoortermen aan elkaar gelijk
35 zijn. In dit voorbeeld is dit zeker niet het geval. Bij lange routes zal de variatie in de perceptie van de reistijden groter zijn dan bij korte routes. Voorbeeld 2 (kansverdelingen stoortermen ε niet onafhankelijk) In het netwerk in Figuur 3-6 zijn er tussen O en D drie routes. Langs elke route bedraagt de reistijd 1 uur. Ook hier veronderstellen we dat bij het kiezen tussen de routes alleen de reistijd als bepalende variabele wordt gezien De onderste twee routes overlappen elkaar. De mate van overlapping wordt aangegeven door ρ. Omdat de reistijden langs de drie routes gelijk zijn voorspelt het logitmodel dat het verkeer zich in gelijke proporties over het netwerk zal verdelen. Elke route krijgt 1/3 van het verkeer. Als ρ klein is, dus als de routes elkaar weinig overlappen zoals weergegeven in Figuur 3-6b, lijkt dit een redelijk resultaat, omdat de reizigers de drie routes als drie min of meer gelijkwaardige alternatieven zullen waarderen. Maar als de overlap erg groot is, zoals in Figuur 3-6c, is dit niet meer het geval. Naarmate ρ groter wordt zullen de twee onderste routes steeds meer als één enkele route worden gezien. Bij zeer grote overlap zal circa de helft van het verkeer de bovenste route kiezen, en de rest zal zich in twee delen van elk een kwart over beide onderste routes verdelen.
Figuur 3-6 Logit routekeuze (2).10 Hier wordt het onjuiste resultaat veroorzaakt door het feit dat de stoortermen voor de alternatieven niet statistisch onafhankelijk van elkaar zijn, terwijl dit wel bij de afleiding van het logitmodel wel wordt aangenomen. Wanner beide onderste routes elkaar sterk overlappen zijn hun stoortermen in feite sterk gecorreleerd.
36 Voorbeeld 3 (kansverdelingen stoortermen ε niet onafhankelijk) Een ander voorbeeld waarin het logitmodel niet het juiste resultaat geeft is het zogenaamde blauwe bussen- rode bussen probleem, dat veelvuldig opduikt in de literatuur over discrete keuze Veronderstel dat in een bepaalde stad 50% van de reizigers de auto kiezen en 50% de bus. Alle bussen zijn blauw geschilderd. Als evenveel reizigers de auto en de blauwe bus nemen betekent dit klaarblijkelijk dat de (waarneembare) utiliteiten van beide vervoers-mogelijkheden aan elkaar gelijk zijn: Vauto = Vblauwe bus . Neem aan dat er nieuwe bussen worden geïntroduceerd die rood geschilderd zijn. De kleur van de bussen zal, naar men mag aannemen, geen invloed hebben op de aantrekkelijkheid of de utiliteit van de bus als vorm van vervoer. Dus we kunnen waarschijnlijk gevoeglijk aannemen dat Vblauwe bus = Vrode bus. De reiziger heeft na de introductie van de rood geschilderde bussen de keuze uit drie alternatieven, namelijk auto, blauwe bus en rode bus. De waarneembare utiliteiten van de drie alternatieven zijn gelijk aan elkaar: Vauto = Vblauwe bus = Vrode bus. Het logitmodel zou nu voorspellen dat elk der drie alternatieven een kans van 1/3 heeft om gekozen te worden. Dit betekent dat het aandeel auto, na introductie van de rode bussen, van 50% naar 33,3% zou dalen. In werkelijkheid verwacht men natuurlijk dat het aandeel auto 50% zal blijven en dat de overige reizigers zich gelijkelijk over de blauwe en rode bussen zullen verdelen. Evenals bij het routekeuzeprobleem in voorbeeld 2 wordt het foutieve resultaat veroorzaakt door het feit dat de stoortermen niet statistisch onafhankelijk van elkaar zijn. De twee busalternatieven zijn in feite identiek, en hun stoortermen zijn dus volledig gecorreleerd. (Iemand die een hoge dunk heeft over de blauwe bussen zal een even hoge dunk hebben over de rode bussen.) Het probleem met de blauwe en rode bussen is een gevolg van het feit dat bij de afleiding van het logitmodel uitgegaan wordt van onafhankelijkheid van de kansverdelingen van de stoortermen. De aanname van onafhankelijke kansverdelingen voor de stoortermen leidt tot een karakteristieke eigenschap van het logitmodel, namelijk de zogenaamde independance of irrelevant alternatives (i.a.a) eigenschap.
3.6.2 Independence of irrelevant alternatives Beschouw een keuzesituatie met een groot aantal alternatieven in de keuzeverzameling. Voor twee willekeurige alternatieven i en j uit die keuzeverzameling geldt nu: Pr(i ) =
Vj
eVi
∑
K k =1
eVk
en
Pr( j ) =
e
∑
K k =1
eVk
waaruit volgt: Pr(i) / Pr(j) = eVi / eVj Hier staat dat Pr(i) / Pr(j) , dat wil zeggen de verhouding van de kansen op het kiezen van twee willekeurige alternatieven i en j , onafhankelijk is van de waarneembare utiliteiten van alle andere alternatieven in de keuzeverzameling. Men noemt deze
37 eigenschap van het logitmodel de i.i.a. (independance of irrelevant alternatives) eigenschap. Soms leidt de i.i.a. eigenschap tot niet-intuïtieve resultaten, zoals in de volgende situatie: In een stad opereren twee openbaar vervoerbedrijven A en B die een vergelijkbare service verlenen. Zij trekken dan ook elk evenveel passagiers. De verdeling over de vervoerwijzen voor een homogene bevolkingsgroep is als volgt: 60% van de reizigers kiest voor de auto, 20% voor openbaar vervoerbedrijf A en 20% voor openbaar vervoerbedrijf B. Stel nu dat bedrijf B zo onaantrekkelijk wordt dat het alternatief (nagenoeg) van de markt verdwijnt. Wat wordt nu de nieuwe verdeling van de reizigers over de overgebleven alternatieven? Als we veronderstellen dat het logitmodel van toepassing is op deze situatie, met andere woorden als we het logitmodel hebben toegepast om de oude verdeling van de reizigers te bepalen en het nu opnieuw toepassen om de nieuwe verdeling te berekenen geldt de i.i.a. eigenschap. Volgens deze eigenschap blijft de verhouding tussen auto en vervoerbedrijf A constant omdat die verhouding immers onafhankelijk is van de waarneembare utiliteit van vervoerbedrijf B. De verhouding tussen auto en bedrijf A was 3 : 1 en blijft 3 : 1. Volgens de i.i.a. eigenschap (en dus volgens het logitmodel) zal, na het verdwijnen van bedrijf B, 75% met de auto gaan en 25% met bedrijf A. Ofwel, de voormalige reizigers van bedrijf B verdelen zich proportioneel (in de verhouding 3 : 1) over de resterende vervoersalternatieven. Dat wil zeggen 15% van de voormalige reizigers van bedrijf B gaat naar de auto en 5% naar bedrijf A. Deze proportionele subsitutie (een gevolg van de i.i.a. eigenschap) is niet wat men intuïtief verwacht. Het is niet waarschijnlijk dat een (groot) deel van de mensen die oorspronkelijk kozen voor het openbaar vervoer (van bedrijf B) nu plotseling voor de auto gaat kiezen. Meer voor de hand ligt het om te verwachten dat veel, zo niet alle voormalige reizigers van bedrijf B zullen overstappen naar bedrijf A. (Bovenstaand voorbeeld komt in feite op hetzelfde neer als het blauwe/rode bussen probleem. Ook bij het blauwe/rode bussen probleem treedt bij toepassing van het logitmodel proportionele substitutie op maar dan in de andere richting. De nieuwe rode bussen trekken proportioneel evenveel reizigers aan vanuit de blauwe bussen en de auto; de verhouding tussen auto en blauwe bussen was 1:1 en blijft 1:1 volgens de i.i.a. eigenschap). In het voorbeeld hierboven spraken we over een homogene bevolkingsgroep. Daarmee bedoelen we dat de persoonseigenschappen hetzelfde worden verondersteld voor de gehele groep. We kunnen het probleem van proportionele substitutie enigszins omzeilen door uit te gaan van een heterogene groep personen. Naast de eigenschappen van de vervoerwijze zelf (zoals reistijd, kosten etc) spelen bij de keuze van de vervoerwijze ook persoonseigenschappen of persoonlijke omstandigheden een rol. Bij de keuze van het openbaar vervoer is bijvoorbeeld de beschikbaarheid van een auto van groot belang. Daarnaast kunnen er andere redenen zijn waarom mensen de voorkeur geven aan reizen met het openbaar vervoer. Stel dat we in bovenstaand voorbeeld de bevolking segmenteren in twee groepen van dezelfde omvang. Groep 1 bestaat uit personen wiens persoonlijke omstandigheden zodanig zijn dat zij bij voorkeur met de auto reizen. Van deze groep koos oorspronkelijk (voordat bedrijf B van het toneel verdween) 95% voor de auto en 5% voor het openbaar vervoer,
38 gelijkmatig verdeeld over bedrijf A en bedrijf B. (Beter is het om te zeggen dat de kans dat een persoon uit deze groep voor de auto koos 95% bedroeg en dat de kans op keuze van het openbaar vervoer door een willekeurige persoon 5% was.) Groep 2 bestaat uit personen die vaak aangewezen zijn op het openbaar vervoer of om andere redenen daar de voorkeur aan geven. Dat sluit niet uit dat zij soms voor de auto kunnen kiezen. Voor personen in deze groep was de oorspronkelijke kans op het kiezen voor de auto 25% en voor het openbaar vervoer 75% gelijkelijk verdeeld over de beide bedrijven A en B. Voor Groep 1 en Groep 2 gezamenlijk kiest dus 60% van de reizigers voor de auto, 20% voor openbaar vervoerbedrijf A en 20% voor openbaar vervoerbedrijf B, juist zoals in bovenstaand voorbeeld. In Tabel 3-1 is te zien wat het logitmodel voorspelt als openbaar vervoerbedrijf B de markt verlaat. In de beide bevolkingsgroepen apart vindt proportionele substitutie plaats (de verhouding tussen de aandelen auto en ov-bedrijf A blijft hetzelfde), maar als we de resultaten aggregeren over de gehele bevolking is dat niet meer het geval. Het autovervoer stijgt nu nog maar naar 68.72% in plaats van de 75% die we vonden bij het rekenen met een homogene bevolkingsgroep.
Tabel 3-1 Toepassing van het logitmodel bij een heterogene bevolkingsgroep Oorspronkelijke verdeling over vervoerwijzen (%) auto
ov-bedrijf A
ov-bedrijf B
Totaal
Groep 1
95
2,5
2,5
100 %
Groep 2
25
37,5
37,5
100 %
Groep 1 + 2
60
20
20
100 %
Met logitmodel berekende verdeling na verdwijning van bedrijf B (%) auto
ov-bedrijf A
ov-bedrijf B
Totaal
Groep 1
97,44
2,56
0
100 %
Groep 2
40,00
60,00
0
100 %
Groep 1 + 2
68,72
31,28
0
100 %
De i.i.a. eigenschap van het logitmodel wordt, zoals gezegd, in essentie veroorzaakt door het niet in rekening brengen van een mogelijke correlatie tussen de stoortermen ε van een deel van de alternatieven in de keuzeverzameling. Het is een in veel gevallen niet-gewenste eigenschap van een keuzemodel. Als we vermoeden, of als uit gegevens blijkt, dat de i.i.a. eigenschap (en de daaruit volgende proportionele substitutie) niet geldt voor het te onderzoeken keuzeproces, dan moeten we voorzichtig zijn met de toepassing van het logitmodel. Zoals bovenstaand voorbeeld heeft laten zien kan het probleem misschien worden omzeild (en kan men het logitmodel blijven gebruiken) indien men de keuzemakers segmenteert in een aantal groepen met verschillende persoonskenmerken.
39 Meer gebruikelijk is het echter een aangepast logitmodel te gebruiken dat wel overweg kan met gecorreleerde stoortermen ε. Een voorbeeld daarvan is het nested logitmodel, dat besproken wordt in de volgende sectie.
3.7 Nested logit In de voorgaande paragrafen hebben we gezien dat het logitmodel een goed en eenvoudig instrument is om keuzesituaties te analyseren, maar dat we ons rekenschap moeten geven van de beperkingen ervan. Het logitmodel geeft onjuiste resultaten in de volgende gevallen: • •
wanneer de alternatieven niet onafhankelijk van elkaar zijn (de stoortermen van de alternatieven zijn dan gecorreleerd) ; wanneer de varianties in de perceptie van de alternatieven sterk van elkaar verschillen (de stoortermen van de alternatieven zijn dan niet identiek).
Om het logitmodel in zijn eenvoudigste vorm te kunnen gebruiken moeten we er dus voor zorgen dat de alternatieven als duidelijk verschillende en onafhankelijke mogelijkheden worden waargenomen. Voorts moeten we reden hebben te veronderstellen dat de variaties in de perceptie van een alternatief niet te sterk zullen afwijken van de variaties in de perceptie van de andere alternatieven. Als aan bovenstaande voorwaarden niet is voldaan kunnen we in plaats van een logitmodel een probitmodel toepassen. Bij het probitmodel wordt een Multivariate Normale verdeling gebruikt en gelden de beperkingen van het logitmodel niet. Zoals eerder vermeld heeft het probitmodel echter als nadeel dat het niet in een mathematisch gesloten vorm is te schrijven en dat de berekeningen bij een groot aantal alternatieven zeer bewerkelijk zijn. Bovendien zijn voor de toepassing ervan gegevens nodig over de covariantie tussen de stoortermen van de alternatieven, en die gegevens zijn vaak niet voorhanden. Zoals in de voorgaande sectie is aangegeven is het soms mogelijk het logitmodel te blijven gebruiken door de keuzemakers in te delen in een aantal groepen met verschillende persoonskenmerken en een logitmodel toe te passen voor elke groep afzonderlijk.
3.7.1 Formulering van het nested logit model Een andere benadering, waarbij we ook gebruik kunnen blijven maken van de voordelen van het logitmodel, is de toepassing van een zogenaamd genest of nested logitmodel. We beperken ons in het navolgende tot een inleidende behandeling van de theorie van het nested logitmodel. Voor een gedegen analytische afleiding verwijzen we naar de gespecialiseerde literatuur; zie bijv Train (2003)5. We delen de verzameling van alternatieven op in een aantal deelverzamelingen die "nesten" genoemd worden. In een nest bevinden zich de alternatieven waarvan we vermoeden dat de stoortermen ε met elkaar gecorreleerd zijn. Neem het hierboven gegeven voorbeeld van de twee openbaar vervoerbedrijven A en B. Er kan worden gekozen tussen de 3 alternatieven auto, openbaar vervoerbedrijf A en openbaar
40 vervoerbedrijf B. We vermoeden dat de stoortermen ε van de twee openbaar vervoer alternatieven met elkaar gecorreleerd zullen zijn. Dan delen we de alternatieven op in de twee deelverzamelingen 'openbaar-vervoer' = {ov-bedrijf A, ov-bedrijf B} en 'privé-vervoer' = {auto}. Een nest of deelverzameling kan dus in sommige gevallen, zoals hier bij 'privé-vervoer', slechts één element bevatten. We kunnen een dergelijke opdeling schematisch weergeven in een boomdiagram zoals in Figuur 3-7.
alle verplaatsingen
prive vervoer
openbaar vervoer
auto
ov-bedrijf A
ov-bedrijf B
Figuur 3-7 Boomdiagram nested logit De intuïtie van deze werkwijze is dat alle alternatieven die zich in één nest bevinden een gedeelte van de niet waargenomen effecten, die in de stoorterm verdisconteerd zijn, gemeen zullen hebben. Het is juist dit gemeenschappelijke gedeelte dat zorgt voor correlatie tussen de stoortermen. Het gemeenschappelijke gedeelte zou voor de alternatieven binnen één nest als een constante kunnen worden beschouwd. Zoals eerder is aangegeven heeft het optellen van een constante waarde bij de utiliteiten geen invloed op de berekende kansen dat een alternatief wordt gekozen. De gedeelten van de stoortermen die resteren na aftrekking van de constante waarde zouden dan statistisch onafhankelijk van elkaar zijn, zodat voor de keuze binnen een nest een normaal logitmodel kan worden toegepast. Binnen een nest zou dan ook proportionele substitutie van toepassing zijn. Formeel verkrijgen we het nested logit model door te veronderstellen dat de stoortermen ε1, ε2, .... εn van alle n alternatieven waaruit gekozen kan worden (dus in het voorbeeld: auto, ov-bedrijf A en ov-bedrijf B) gezamenlijk verdeeld zijn volgens een zogenaamde Generalised Extreme Value (GEV) verdeling waarvan de cumulatieve verdelingsfunctie er als volgt uitziet : F (ε1 , ε 2 ,....ε n ) = exp(−
∑ alle nesten i
(
∑e
−ε j / λi λi
) )
j∈nest i
Dit is een multivariate versie van de gewone Gumbel of EV-verdeling die we gebruikten om het normale logitmodel af te leiden. Bij de afleiding van het normale logitmodel veronderstellen we dat elke stoorterm apart verdeeld is volgens een univariate EV-verdeling en veronderstellen we bovendien dat die verdelingen
41 statistisch onafhankelijk zijn. Bij de GEV-verdeling die gebruikt wordt om het nested logitmodel af te leiden zijn de stoortermen gezamenlijk of simultaan verdeeld. De marginale verdelingen voor alle stoortermen zijn nog steeds univariaat EV verdeeld, maar de stoortermen binnen een nest kunnen gecorreleerd zijn. De mate van correlatie binnen een nest i wordt aangeduid met de parameter λi . Voor verschillende nesten kan die mate van correlatie verschillend zijn. De parameter λi kan een waarde aannemen tussen 0 en 1, waarbij de waarde 0 (eigenlijk een waarde die in de limiet nadert tot 0) overeenkomt met perfecte correlatie en de waarde 1 duidt op de afwezigheid van correlatie, ofwel statistische onafhankelijkheid van de stoortermen binnen een nest. Vinden we bij een schatting uit waarnemingen dat voor een nest geldt λi < 0 of λi > 1 dan is dat een aanwijzing dat het gepostuleerde model met zijn onderverdeling in nesten onjuist is. We moeten dan een andere keuzestructuur proberen. Toepassing van een GEV-verdeling voor de stoortermen stelt ons in staat de kans op het kiezen van een bepaald alternatief in een gesloten analytische vorm te schrijven. Men kan afleiden dat voor de kans op het kiezen van alternatief a, dat zich bevindt in nest k, geldt:
∑
eVa / λk ( Pr(a, nestk ) =
∑
V j / λk λk −1
)
e
j∈nestk
(
alle nesten i
∑
V j / λi λi
e
)
(1)
j∈nesti
Bovenstaande formule voor het berekenen van de kans op een bepaald alternatief is complex en weinig inzichtelijk. Het blijkt echter dat de formule algebraisch equivalent is aan een vorm die intuitief veel beter te begrijpen is. Er kan namelijk worden aangetoond dat de boven gegeven ingewikkelde formule (1) voor de berekening van de kans op het kiezen van alternatief a uit nest k equivalent is aan de volgende reeks formules (2) t/m (5): Pr(a, nestk) = Pr(nestk) . Pr(a/nestk)
(2)
Hier staat dat de kans op het kiezen van een alternatief a (dat zich binnen nest k bevindt) gelijk is aan het produkt van twee kansen, namelijk de marginale kans op het kiezen van nest k vermenigvuldigd met de conditionele kans op het kiezen van alternatief a als we al weten dat het zich in nest k bevindt. De genoemde marginale en conditionele kansen kunnen nu beiden in de vorm van een standaard logitmodel worden geschreven. De kans op het kiezen van nest k is: eλk .LSk ∑ eλi .LSi
Pr(nestk ) =
(3)
alle nesten i
waar LS i = ln
∑e
V j / λi
(4)
j∈nest i
En de kans op het kiezen van alternatief a in nest k is:
42
Pr( a / nestk ) =
eVa / λk V /λ ∑e j k
(5)
j∈nest k
De keuze van een alternatief kan dus worden opgevat als een hiërarchie van keuzes. Om op het bovenste niveau in de hiërarchie een logitmodel voor de keuze van een nest toe te kunnen passen, moeten we een waarneembare utiliteit toekennen aan elk van de nesten. Voor een nest i wordt deze waarneembare utiliteit een samengestelde utiliteit (in het engels: inclusive value of inclusive utility), een soort vervangende waarde die karakteristiek is voor de verzameling van alle alternatieven die zich in nest i bevinden. Wat is de waarneembare utiliteit van een geheel nest van alternatieven? De keuzemaker zal het beste alternatief uit een nest kiezen. Het ligt daarom misschien voor de hand om voor de samengestelde utiliteit het maximum van de waarneembare utiliteiten in het betreffende nest te nemen. We dienen echter te bedenken dat utiliteiten stochastische variabelen zijn. In plaats van het maximum van de waarneembare utiliteiten in een nest moeten we daarom de verwachte waarde van het maximum van de waarneembare utiliteiten van de alternatieven in nest i nemen. Die verwachte waarde wordt gegeven door de uitdrukking λi . LSi . De term LSi wordt de "logsom" van nest i genoemd omdat het de logaritme is van de som van e-machten van de waargenomen utililiteiten van de alternatieven in nest i, of ook wel de logaritme van de noemer in formule (5). De logsom van nest i wordt vermenigvuldigd met λi . Daarom wordt λi vaak de logsom-coëfficiënt (in dit geval van nest i) genoemd. Zoals eerder aangegeven is λi een maat voor de correlatie van de stoortermen binnen een nest i. Een waarde λi = 1 voor alle nesten betekent dat er geen correlatie aanwezig is tussen de stoortermen van alle alternatieven, dus dat de alle stoortermen statistisch onafhankelijk zijn. Maar in dat geval hadden we kunnen volstaan met een gewoon logitmodel. Als we λi = 1 voor alle nesten substitueren in bovenstaande formules (2) t/m (5) voor het nested logitmodel dan blijken inderdaad de formules identiek te zijn aan de formule voor het normale (niet geneste) logitmodel. Ga dit voor uzelf na! Het normale logitmodel is dus een bijzonder geval van het nested logitmodel. Het normale logitmodel is een nested logitmodel waar de waarden van alle logsom-coëfficiënten gelijk zijn aan 1. Tot slot een opmerking over de gedragsmatige interpretatie van de formules voor het nested logitmodel. We hebben de complexe analytische expressie voor de kans op het kiezen van een alternatief ontleed in twee na elkaar toegepaste normale logitmodellen. Maar dit impliceert niet dat in werkelijkheid de keuze ook noodzakelijkerwijs in twee fasen (sequentieel) plaatsvindt. Het kan wel, maar het hoeft niet. We hebben in het bovenstaande namelijk slechts de definitie van conditionele kansen uit de waarschijnlijkheidsrekening gebruikt: als E en F gebeurtenissen zijn dan worden conditionele kansen als volgt gedefinieerd: Pr(E en F) = Pr(E) . Pr(F/E). In deze definitie is geen sprake van een noodzakelijk oorzakelijk of volgtijdelijk verband tussen de gebeurtenissen E en F. Met andere woorden: of een keuze nu wel of niet sequentieel plaatsvindt, in beide gevallen mogen we een nested logitmodel toepassen. Voorbeeld: We zullen nu de formules voor het nested logitmodel toepassen op het eerder beschreven probleem van de vervoerwijzekeuze tussen auto, ov-bedrijf A en ov-bedrijf B (Figuur 3-7).
43 De conditionele kansen voor de alternatieven binnen het OV-nest (een logit-model voor de keuze tussen ov-bedrijf A en ov-bedrijf B) worden:
Pr( A / OV ) =
eVA / λOV + eVB / λOV
Pr( B / OV ) =
VA / λOV
e
eVB / λOV + eVB / λOV
V A / λOV
e
De kansen voor de alternatieven op het bovenste niveau (een logit-model voor keuze tussen auto en OV) worden:
Pr(auto) =
Vauto
e
eVauto + eλOV . LSOV
Pr(OV ) =
eλOV . LSOV e + eλOV . LSOV Vauto
waarin:
LSOV = ln(eVA / λOV + eVB / λOV ) We vinden de kansen op het kiezen van ov-bedrijf A en ov-bedrijf B als volgt:
Pr( A) = Pr(OV ) . Pr( A / OV )
Pr( B ) = Pr(OV ) . Pr( B / OV )
Opmerking: Als het aantal alternatieven in een nest gereduceerd is tot slechts één alternatief, dan wordt de waarneembare utiliteit op het bovenste niveau gelijk aan de waarneembare utiliteit van het overblijvende alternatief. Zo bevat in bovenstaand voorbeeld het nest 'privé vervoer' slechts één alternatief, namelijk 'auto'. We kunnen dan het nest 'privé vervoer' weglaten en de waarneembare utiliteit op het bovenste niveau wordt: λ privevervoer .ln(eVauto / λ prive vervoer ) = Vauto
Tabel 3-2 Voorbeeld berekening nested logit model λOV = 1 geen correlatie A en B normale logit
VA VB Vauto
ov-A en ov-B 3,00 3,00 4,10
enkel ov-A 3,00
Pr(A/ov) Pr(B/ov)
λOV = 0,5 enige correlatie A en B
λOV → 0 perfecte correlatie A en B
enkel ov-A 3,00
4,10
ov-A en ov-B 3,00 3,00 3,75
0,50 0,50
1,00 0,00
0,50 0,50
1,00 0,00
0,50 0,50
1,00 0,00
Pr(auto)
0,60
0,75
0,60
0,68
0,60
0,60
Pr(OV)
0,40
0,25
0,40
0,32
0,40
0,40
Pr(A) Pr(B)
0,20 0,20
0,25 0,00
0,20 0,20
0,32 0,00
0,20 0,20
0,40 0,00
→ −∞
→ −∞ 3,75
ov-A en ov-B enkel ov-A 3,00 3,00 → −∞ 3,00 3,40 3,40
Tabel 3-2 bevat de uitkomsten van enige berekeningen met bovenstaande formules. De berekeningen zijn gedaan voor drie waarden van de logsom-coefficient λOV, varierend van een waarde van 1 (geen correlatie tussen de stoortermen), via 0,5 (enige correlatie) tot een waarde nabij 0 (perfecte correlatie tussen de stoortermen). Voor elk van de drie gevallen zijn twee kolommen gegeven: één kolom waarbij ov-bedrijf A en ov-bedrijf B beide tot de keuze-alternatieven behoren en één kolom voor de situatie waarbij ov-bedrijf van de markt is verdwenen (d.w.z. VB daalt naar een zeer lage waarde). De waarden van VA, VB en Vauto zijn voor de initiële situatie zodanig genomen dat 60% van de populatie kiest voor
44 auto en 40% voor openbaar vervoer, gelijkelijk verdeeld over de ov-bedrijven A en B. Te zien is dat voor λOV = 1 proportionele substitutie optreedt, bij λOV = 0,5 kiezen sommige voormalige gebruikers van ov-bedrijf B voor de auto, terwijl bij λOV → 0 alle voormalige gebruikers van ov-bedrijf B naar het andere ov-bedrijf A overstappen.
3.7.2 Schatting van de coefficienten van een nested logitmodel Naast het bepalen van de functionele vorm en het vaststellen van de variabelen die voorkomen in de functies voor de waarneembare utiliteiten dienen we bij een nested logitmodel een specificatie van de nesten te geven. Als dat gedaan is kunnen we aan de hand van een steekproef, met werkelijk gemaakte keuzes in specifieke situaties, een schatting maken van de coefficienten die in de functies voorkomen. De schatting levert ons bovendien een waarde voor de logsomcoefficienten λi . De logsom-coefficienten moeten liggen tussen 0 en 1. Zoniet, dan kunnen we een andere indeling in nesten proberen. Hebben de logsom-coefficienten een waarde nabij 1, dan hadden we waarschijnlijk kunnen volstaan met een normaal (niet genest) logitmodel. De schatting kan eventueel plaatsvinden met de standaard beschikbare software voor de schatting van een normaal, niet genest, logitmodel. We maken dan gebruik van het feit dat een nested logitmodel geschreven kan worden als een sequentie van twee na elkaar toegepaste normale logitmodellen. We beginnen met de schatting van de coefficienten binnen een nest. Gebruikmakend van die geschatte coefficienten berekenen we de logsom(men) op het bovenste niveau. Daarna schatten we een normaal logitmodel op het bovenste niveau, waar de logsom-coefficienten als verklarende variabelen optreden. Er is ook commerciele software beschikbaar waarmee nested logitmodellen direct geschat kunnen worden. Dergelijke software substitueert de keuzewaarschijnlijkheden gegeven door formule (1) direct in een loglikelihood functie en maximaliseert vervolgens deze functie. De directe methode van schatting verdient de voorkeur boven de sequentiele methode van schatting, om redenen van efficiency en omdat de berekende statistische indicatoren een beter beeld geven van de kwaliteit van de schatting (Train, 2003)5.
3.8 Samenvatting Het logitmodel, één van de modellen binnen de discrete keuze theorie, is gebleken een zeer geschikt instrument te zijn voor het analyseren van keuzen in de verkeerskunde. De modellen zijn gebaseerd op de toekenning van waarderingen die de aantrekkelijkheid van elk der alternatieven karakteriseren. De waarderingen worden utiliteiten genoemd. Omdat we alle kenmerken die de utiliteit van een alternatief bepalen niet kennen, maakt een stochastische component deel uit van de utiliteit. De keuzeverdeling over de alternatieven worden gegeven in termen van kansen, die later over een gebied of bevolkingsgroep kunnen worden geaggregeerd. Het logitmodel in zijn eenvoudigste vorm kent enkele beperkingen, die ten dele met behulp van een aanpassing van het logitmodel, nested logit genoemd, kunnen worden ondervangen.
45 We hebben het logitmodel in dit vroege hoofdstuk behandeld, omdat het keuze-aspect in de verkeerskunde een zeer belangrijke rol speelt zoals in de latere hoofdstukken over het traditionele verkeersmodel nog veelvuldig zal blijken.
46
4. Zones en netwerken Een verkeersmodel heeft betrekking op een bepaald studiegebied. Verplaatsingen in dit studiegebied kunnen in principe op elk adres beginnen en eindigen, en de reizigers kunnen daarbij gebruik maken van alle wegen, straten en andere transportmogelijkheden. Het is echter onmogelijk gegevens op basis van individuele gegevens te verzamelen en te analyseren. Een schematisering van de werkelijkheid is noodzakelijk. Deze schematisering omvat de volgende onderdelen: •
•
Gebiedsindeling; het studiegebied wordt ingedeeld in een aantal zones. We bestuderen de verplaatsingen van en naar deze zones. Alle verplaatsingen worden geacht te beginnen en eindigen in een denkbeeldig punt binnen deze zone, centroïde geheten. Netwerken; het transportsysteem bestaat uit een aantal netwerken, die de beschikbare vervoersmodaliteiten representeren. Het netwerk is een abstractie van de werkelijkheid, het detailniveau van de representatie is afhankelijk van het op te lossen probleem.
Omdat de schematisering van het studiegebied in zones en netwerken sterk afhankelijk is van het op te lossen probleem is het niet mogelijk daarvoor stringente regels aan te geven. De bedoeling van dit hoofdstuk is enige algemene richtlijnen te geven die bij het ontwerp van deze schematisering behulpzaam kunnen zijn.
4.1 Gebiedsindeling We onderscheiden het studiegebied en het invloedsgebied. Zowel het studiegebied als het invloedsgebied worden verdeeld in zones, respectievelijk interne en externe zones geheten. Voor het studiegebied onderzoeken we de verkeersstromen van en naar elke zone. Voor het invloedsgebied zijn alleen de stromen van belang die hun herkomst of bestemming binnen het studiegebied hebben. Van de stromen tussen twee externe zones bekijken we slechts die stromen die het studiegebied doorkruisen. Belangrijke parameters zijn het aantal toe te passen zones en de omvang ervan. Elke zone heeft een fictief punt, meestal in het zwaartepunt van de zone gelegen, waar alle verplaatsingen van en naar de zone geacht worden te vertrekken en aan te komen. Dit punt, centroïde geheten, is via connectors met het netwerk verbonden. De verplaatsingen tussen twee zones, het interzonale verkeer, wikkelen zich af op het netwerk. Het verkeer dat binnen de zone blijft, het intrazonale verkeer, heeft zijn vertrek- en aankomstpunt in dezelfde centroïde en wordt niet geanalyseerd. Deze representatie houdt in dat de zones niet te groot mogen worden, omdat dan een aanzienlijk deel van het verkeer niet op het netwerk komt, en dus niet in de analyse wordt betrokken. Anderzijds kunnen de zones ook niet te klein worden gekozen. Kleine zones vereisen veel invoergegevens. Dit verhoogt niet alleen de kosten van de studie, maar bemoeilijkt de interpretatie van de resultaten en verhoogt de kans op het maken van fouten. In de praktijk is gebleken dat, voor stedelijke en provinciale studies, zones met een bevolking van 1000 à 3000 personen redelijk voldoen. Uiteraard kan, afhankelijk van de beschikbare fondsen, de schaal of het doel van de studie, van deze waarde worden afgeweken.
47
Mechelen
Leuven Brussel
Figuur 4-1 Zone-indeling deel van model Vlaams Brabant. Wat het aantal zones betreft kunnen de volgende waarden als richtlijnen gelden. Een typische waarde voor een grootstedelijke of regionale studie is 300 tot 500 zones. Het provinciale verkeersmodel voor Vlaams Brabant (zie Figuur 4-1) omvat circa 1000 zones, wat als een groot aantal kan worden beschouwd. Voor kleinschalige studies kan men volstaan met 50 tot 100 zones. De zones dienen ongeveer gelijkwaardig in omvang te zijn voor wat betreft de verkeersproductie. Bovendien dient er gestreefd te worden naar homogeniteit ten aanzien van de determinanten van de verkeersproductie en attractie. Omdat het grondgebruik in grote mate de verkeersproductie en attractie bepalen, betekent dit dat men moet trachten de zones zodanig in te delen dat er zoveel mogelijk sprake is van een homogeen grondgebruik binnen de zone. De zonegrenzen dienen zoveel mogelijk samen te vallen met de grenzen van administratieve eenheden, waarbij gedacht kan worden aan districten zoals gebruikt door het Nationaal Instituut voor de Statistiek, kiesdistricten, gemeenten, arrondissementen of provincies. Een dergelijke gebiedsindeling vergemakkelijkt het verkrijgen van sociaal-economische gegevens. Men zal zonegrenzen ook proberen te laten samenvallen met natuurlijke barrières in het gebied zoals rivieren, kanalen, spoorwegen enz. Omdat deze natuurlijke barrières slechts op een beperkt aantal punten kunnen worden gepasseerd, vergemakkelijkt dit het vergelijken van de modelresultaten met tellingen in het veld. De vorm van de zones zal bij voorkeur zo compact mogelijk zijn om de fouten bij het berekenen van afstanden zoveel mogelijk te beperken. Voor de zone-indeling van het invloedsgebied geldt dat de omvang van de zones toeneemt als functie van de afstand tot het studiegebied. Omdat de meeste verplaatsingen zich over een relatief kleine afstand afspelen, zullen de relevante
48 verplaatsingen tussen het invloedsgebied en het studiegebied snel in omvang afnemen naarmate de afstand groter wordt. Meestal volstaat men met één zone-indeling voor alle stappen in het traditionele verkeersmodel. In sommige gevallen wijkt men hiervan af indien beschikbare tijd en fondsen dit mogelijk maken. Het blijkt bijvoorbeeld dat een adequate modellering van het openbaar vervoer baat kan hebben bij een grotere detaillering van het studiegebied. In het provinciaal model van Antwerpen bijvoorbeeld is vooral in de stad nagenoeg elke halte van het openbaar vervoer gerepresenteerd. In dergelijke gevallen kan men een hiërarchische indeling in zones en subzones toepassen.
4.2 Netwerken Het transportsysteem wordt gerepresenteerd door een netwerk, bestaande uit knooppunten en schakels die de knooppunten met elkaar verbinden.(zie Figuur 4-2) Het netwerkmodel is een vereenvoudigde weergave van het werkelijke netwerk. Men gebruikt het netwerkmodel voor het berekenen van de reistijden tussen herkomsten en bestemmingen. Daarnaast kunnen de berekende resultaten van het verkeersmodel op het netwerk grafisch worden weergegeven. Bij modaliteiten als auto, fietsen en lopen zijn de modelnetwerken directe afgeleiden van het fysieke netwerk, de schakels van het netwerk stellen de verbindingswegen voor, de knooppunten van het netwerk zijn de kruispunten. Ook worden knooppunten in het modelnetwerk gebruikt om wijzigingen in wegtype en de plaats van bijv. bruggen en andere specifieke infrastructurele voorzieningen te markeren. Eigenschappen (of attributen) die het netwerk karakteriseren worden toegekend aan de schakels. Voorbeelden van schakeleigenschappen zijn lengte, snelheid, reistijd, capaciteit enz. Aan de knooppunten van het modelnetwerk worden geen eigenschappen toegekend. Speciale eigenschappen van kruispunten, zoals lange wachttijden voor sommige afslagen of het verboden zijn van bepaalde afslagen, kunnen door toevoeging van extra (dummy)schakels worden gemodelleerd. Bij een openbaar vervoer netwerk heeft men, naast het netwerk dat de fysieke infrastructuur weergeeft, ook te maken met lijnen die de diensten representeren die op dat netwerk worden uitgevoerd. In het modelnetwerk worden de lijnen gedefinieerd als een reeks aaneengesloten schakels waaraan grootheden als frequentie, capaciteit en reistijden worden toegekend. Ook dienen haltes, voor- en natransport en overstapplaatsen te worden vastgelegd. (zie Figuur 4-3)
49
Centroide Knooppunt Schakel (weg) Zonegrens Connector
Figuur 4-2 Schema van een zone-indeling en wegennetwerk.2
50 Haltes
Lijnschakels
Voortransport
Natransp
Overstapschakel
Figuur 4-3 Openbaar vervoer netwerk.10 Het is momenteel gebruikelijk om separate netwerken op te stellen voor de verschillende vervoermodaliteiten. Dit betekent dat men impliciet veronderstelt dat een verplaatsing zich slechts via één vervoerwijze afwikkelt. Er bestaat echter een tendens om over te gaan op de toepassing van zogenaamde multimodale netwerkmodellen. Hierbij zijn de netwerken voor de verschillende vervoerwijzen onderling met elkaar verbonden via overstapschakels. Dit betekent bijvoorbeeld dat een verplaatsing die bestaat uit een autorit naar het station gevolgd door een reis per trein, goed kan worden gemodelleerd. Zoals bij de bespreking van de gebiedsindeling opgemerkt heeft elke zone een centroïde. De centroïdes zijn knooppunten waar het verkeer van de betreffende zone het netwerk opkomt of verlaat. Elke centroïde is met de rest van het netwerk verbonden door één of meer connectors. De connectors zijn een schematisering van het lokale stratenpatroon binnen een zone. Slechts het verkeer afkomstig uit de betreffende zone kan er gebruik van maken. Doorgaand verkeer tussen twee andere zones wordt niet geacht gebruik te maken van de connectors van een tussengelegen zone. Er moet voor gezorgd worden dat de connectors zodanig op het netwerk worden aangesloten dat de werkelijke situatie zo goed mogelijk wordt nagebootst. Een modelnetwerk is een gericht netwerk, dat wil zeggen aan elke schakel is een richting toegekend. Een weg waarop in beide richtingen verkeer mogelijk is wordt dus weergegeven door twee schakels. Ook als men in sommige computermodellen in
51 dergelijke gevallen slechts één schakel op het beeldscherm ziet, is de weg intern door twee netwerkschakels gerepresenteerd. Het is in het algemeen niet noodzakelijk in het model het fysieke netwerk tot in het fijnste detail weer te geven. Grote netwerken vragen veel invoergegevens en zijn daarom duur. Bovendien neemt de kans op het maken van fouten toe. Het berekenen van optimale routes vergt bij grote netwerken veel rekentijd. De rekentijd neemt toe met een macht tussen twee en drie van het aantal knooppunten.
Mechelen
Leuven Brussel
Figuur 4-4 Wegennetwerk deel van model Vlaams Brabant.
Het wegennetwerk kent een functionele classificatie. Men onderscheidt bijv. autosnelwegen, hoofdwegen, secundaire of verbindingswegen, lokale wegen en woonstraten. Het wordt aangeraden in het model die schakels weer te geven die één niveau lager liggen dan het niveau waarin men is geïnteresseerd. Wenst men bijvoorbeeld een studie te maken van het autosnelwegennet, dan neemt men de hoofdwegen ook in het netwerkmodel op. Wat de grootte van het netwerk betreft kunnen de volgende waarden als richtsnoer gelden. Een typisch netwerk voor een stedelijk of regionaal gebied telt in de orde van 1000 tot 5000 knooppunten. Het autonetwerk voor de provincie Vlaams Brabant (Figuur 4-4) heeft ongeveer 10000 knooppunten, en kan als een groot netwerk worden aangemerkt. Voor globale studies kunnen netwerken met enige honderden knooppunten reeds voldoende zijn.
52
5. Productie en attractie Het doel van de productie/attractie fase in het klassieke transportmodel is het voorspellen van het totaal aantal geproduceerde respectievelijk aangetrokken verplaatsingen per tijdseenheid voor elke zone in het studiegebied. De voorspelling gebeurt op basis van sociaal-economische gegevens van een zone. In deze fase worden twee verwante modellen gebruikt: • •
Productiemodel Dit model berekent per zone het totaal aantal geproduceerde verplaatsingen per tijdseenheid, ongeacht de zone van bestemming. Attractiemodel Dit model berekent per zone het totaal aantal aangetrokken verplaatsingen per tijdseenheid, ongeacht de zone van herkomst.
Let erop dat het gaat om het aantal verplaatsingen per tijdseenheid. Producties en attracties zijn stroomgrootheden. Omdat de verkeersstromen tijdens de spitsperiode vaak maatgevend zullen zijn voor de te gebruiken verkeersvoorzieningen is een veel gebruikte tijdseenheid vaak het drukste uur van de ochtend of avondspits. Voor het ontwikkelen van goede productie en attractiemodellen blijkt het nuttig te zijn een indeling naar verplaatsingen te maken. Na een korte begripsomschrijving beginnen we dit hoofdstuk met een behandeling van deze classificatie van verplaatsingen. Vervolgens worden de factoren besproken die van invloed zijn op de productie en attractie. De meest gebruikte methoden om de productie en attractie te berekenen, te weten regressie-analyse en categorieanalyse, worden daarna behandeld. Ook het logitmodel leent zich uitstekend voor het bepalen van productie en attractie, maar wordt daarvoor in de praktijk nog niet veel toegepast. Wij zullen de toepassing van het logitmodel voor de berekening van de productie toelichten aan de hand van een voorbeeld. Enige algemene opmerkingen over de stabiliteit van de berekende productie- en attractieparameters en het balanceren van producties en attracties ronden het hoofdstuk af.
5.1 Begrippen Een verplaatsing ontstaat als een persoon van een plaats waar hij een bepaalde activiteit verricht, gaat naar een andere plaats waar hij een nieuwe activiteit gaat verrichten. Het beginpunt van de verplaatsing heet herkomst en het eindpunt is de bestemming. Een verplaatsing kan worden gemaakt met één vervoerwijze of meer na elkaar gebruikte vervoerwijzen. Ook lopen wordt in dit verband als een vervoerwijze opgevat. De beweging van een persoon tussen twee opeenvolgende punten met gebruikmaking van één vervoerwijze noemen we een rit. Een verplaatsing kan dus uit meerdere ritten bestaan. Bijvoorbeeld een verplaatsing van herkomst H naar bestemming B bestaat uit de fietsrit van H naar punt 1, de treinrit van punt 1 naar punt 2 en de looprit van punt 2 naar B. De verplaatsingen van en naar de eigen woning worden woning-gerelateerde verplaatsingen genoemd. De overige verplaatsingen zijn niet-woning-gerelateerde verplaatsingen.
53 Een verplaatsingsketen bestaat uit een aantal verplaatsingen waarvan de eerste in de eigen woning begint en de laatste daar weer eindigt. Dus men maakt bijvoorbeeld een verplaatsing van huis naar werk en later een verplaatsing van werk naar huis. Tezamen heeft men een verplaatsingsketen voltooid. Bij de eerste verplaatsing was het huis de herkomst en het werk de bestemming, bij de tweede verplaatsing juist omgekeerd. Men maakt een verplaatsing met een bepaalde bedoeling, bijvoorbeeld om te gaan werken of te gaan winkelen. Dit noemt men het motief van de verplaatsing. De termen herkomsten en bestemmingen (of vertrekken en aankomsten) hebben niet altijd dezelfde betekenis als de begrippen productie en attractie. Bij woninggerelateerde verplaatsingen wordt de zone waar de woning zich bevindt verondersteld de verplaatsing te produceren; bij niet-woning-gerelateerde verplaatsingen is dat de zone van herkomst. Omgekeerd oefent de zone waar een buitenshuis activiteit wordt uitgeoefend bij woning-gerelateerde verplaatsingen of de zone van aankomst bij nietwoning-gerelateerde verplaatsingen een attractie of aantrekking van verplaatsingen uit. Hoewel in de avondspits de verplaatsingen juist in de richting van de woning zullen zijn, handhaaft men de bovengenoemde definities voor productie en attractie
5.2 Classificatie van verplaatsingen 5.2.1 Indeling naar motief van de verplaatsing Men heeft vastgesteld dat betere productie en attractiemodellen worden verkregen indien de verplaatsingen naar motief worden onderscheiden en vervolgens apart voor de verschillende motieven worden gemodelleerd. Bij de meeste motieven is de woning herkomst of bestemming van de verplaatsing. Bij deze woning-gerelateerde verplaatsingen is het woon-werk verkeer het belangrijkste, maar in sommige gevallen spelen ook andere motieven als onderwijs volgen, winkelen en het uitvoeren van sociaal/recreatieve activiteiten een belangrijke rol. Verplaatsingen die niet beginnen in de woning en daar ook niet eindigen (nietwoning-gerelateerde verplaatsingen) maken over het algemeen een klein deel uit van de totale hoeveelheid verplaatsingen en worden over het algemeen niet verder naar motief onderverdeeld. We krijgen aldus de volgende onderverdeling
Woning-gerelateerd
Niet woning-gerelateerd
Motief werken onderwijs winkelen sociaal/recreatief overig
Engelse benaming HBW (home-based work) HBO (home-based other)
NHB (non home-based)
54
5.2.2 Indeling naar tijdstip van de verplaatsing Verplaatsingen worden onderscheiden naarmate ze in de spitsperiode (ochtend of avond) of buiten de spitsperiode worden ondernomen. De aandelen voor de verschillende verplaatsingsmotieven zijn sterk afhankelijk van het tijdstip van de verplaatsing. Verplaatsingen met het motief werken en onderwijs volgen, die veelal in de spitsperiode plaatsvinden, worden verplichte verplaatsingen genoemd; de verplaatsingen voor winkelen, voor sociaal/recreatieve doeleinden en de overige verplaatsingen zijn minder verplichtend en worden optionele verplaatsingen genoemd. Dit betekent dat men kan beslissen deze verplaatsingen in het geheel niet te maken. Indien men wel besluit op reis te gaan is men vrijer in de keuze van het vertrektijdstip.
5.2.3 Indeling naar persoonskenmerken Omdat het verplaatsingsgedrag sterk beïnvloed wordt door sociaal-economische factoren kan een indeling naar deze factoren vaak nuttig zijn. De volgende kenmerken worden wel voor een classificatie gehanteerd: • • •
inkomensniveau autobezit omvang en structuur van de huishouding
Het vaakst treft men een classificatie naar autobezit aan (bijvoorbeeld een indeling naar 0, 1 of meer auto’s per huishouding).
5.2.4 Indeling naar gebruikte vervoerwijze Bij een indeling naar de voor de verplaatsing gebruikte vervoerwijze kan men bijvoorbeeld de volgende categorieën onderscheiden: • • • •
lopen fiets auto (eventueel gesplitst naar: chauffeur en meerijder) openbaar vervoer
Het was vroeger gebruikelijk aparte productie- en attractiemodellen te ontwikkelen voor de verschillende middelen van vervoer. Tegenwoordig wordt dit praktisch niet meer gedaan en vindt de verdeling over de vervoerwijzen pas plaats in een later stadium van de berekening. Wij komen hierop terug in het hoofdstuk over vervoerwijzekeuze.
5.3 Invloedsfactoren productie en attractie 5.3.1 Invloedsfactoren productie De volgende factoren zijn van invloed op de productie van een zone: •
Kenmerken van de huishouding - Inkomen
55
•
•
- Samenstelling (aantal werkenden, schoolgaanden, leeftijd …) - Autobezit Kenmerken van de zone - Grondgebruik - Grondprijs - Woningdichtheid, mate van verstedelijking Bereikbaarheid - Omvang transportmogelijkheden vanuit de zone - Kwaliteit transportmogelijkheden vanuit de zone
De kenmerken van de zone en de kenmerken van de huishouding zijn veelvuldig in studies toegepast. Het kenmerk bereikbaarheid daarentegen wordt nauwelijks gebruikt Dit geldt zowel voor de productiemodellen als de attractiemodellen. Het negeren van de invloedsvariabele bereikbaarheid in de modellen betekent dat de productie en attractie van een zone ongevoelig zijn voor wijzigingen in het transportsysteem. Dit is een belangrijke tekortkoming van de huidige modellen. In aanvulling van wat reeds in hoofdstuk 1.4 over dit onderwerp is gezegd, stellen wij vast dat een wijziging in het transportsysteem en het activiteitensysteemin het algemeen vijf effecten kan hebben op het patroon van de verplaatsingen: • • • • •
generatief effect: distributief effect: temporeel effect: substitutie effect: route effect:
een toe- of afname van het totaal aantal verplaatsingen; een andere verdeling van herkomsten over de bestemmingen; een verschuiving van het tijdstip van de verplaatsingen; een verschuiving naar een andere vervoerwijze; een verandering in de gekozen routes.
Deze effecten kunnen in combinatie optreden, wat een analyse van het verschijnsel zeer gecompliceerd maakt. Het niet meenemen van de factor bereikbaarheid in de productie- en attractiemodellen betekent dat het generatieve effect van een verandering in infrastructuur niet wordt verdisconteerd. Het distributieve, het substitutie effect en het route effect kan wél worden bepaald met de in hoofdstuk 6 , 7 en 0 te behandelen distributiemodellen en toedelingsmodellen. Het temporeel effect zou in rekening gebracht kunnen worden met een zogenaamd vertrektijdenmodel. Hoewel dergelijke modellen wel ontwikkeld zijn, worden zij in de praktijk weinig toegepast. Het is aannemelijk dat een verandering in infrastructuur geen groot generatief effect zal hebben op de verplichte verplaatsingen naar het werk en de school, althans op de korte termijn. Voor de minder verplichtende verplaatsingen lijkt het waarschijnlijk dat er wel een generatief effect zal optreden. Het temporeel effect van een verandering in het transportsysteem is vermoedelijk belangrijker dan men lange tijd heeft aangenomen. Vanwege congestieproblemen zullen veel reizigers de beslissing nemen vroeger of later te vertrekken. Dit fenomeen noemt men het “verbreden” van de spits. Reduceert men nu de congestieproblemen door een verbetering van de infrastructuur, dan zullen velen op korte termijn besluiten terug te keren naar de oorspronkelijke spitsperiode, waardoor de nieuwe voorziening snel weer volloopt.
56 Omdat bereikbaarheid wel degelijk een belangrijke factor is voor het bepalen van de productie en attractie van zones heeft men getracht modellen te ontwikkelen waarin de generatieve en temporele effecten van een wijziging in de bereikbaarheid worden meegenomen. Er zijn enige modellen voorgesteld, maar er bestaat vooralsnog weinig eensgezindheid over de juistheid van deze modellen. De reden daarvoor ligt in de moeilijkheid van het kwantificeren (het meetbaar maken) van het begrip bereikbaarheid Dit type modellen wordt daarom in de praktijk bijna niet toegepast, en wij zullen in deze cursus ook afzien van een behandeling ervan.
5.3.2 Invloedsfactoren attractie De volgende factoren zijn van invloed op de attractie van een zone: • •
•
Werkgelegenheid Grondgebruik - Industrieel - Onderwijs - Winkels - Dienstverlening (ziekenhuizen, banken, overheidsinstellingen, congrescentra …) - Recreatief (sportaccommodaties, bezienswaardigheden, theaters …) - Opslag en overslag ( havens, luchthavens …) Bereikbaarheid - Omvang transportmogelijkheden naar de zone toe - Kwaliteit transportmogelijkheden naar de zone toe
De zones die verplaatsingen aantrekken zijn in het algemeen de werkgebieden. In de eerste plaats komt dit door de werkgelegenheid aldaar. Daarnaast zullen die gebieden verplaatsingen aantrekken die te maken hebben met bevoorrading en dienstverlening. Evenals bij de productie van verplaatsingen speelt hier de bereikbaarheid voor wat betreft het generatieve en temporele aspect vermoedelijk een belangrijke rol.
5.3.3 Invloedsfactoren productie/attractie in het goederenvervoer Wij hebben in het voorgaande de factoren genoemd die van invloed zijn op de productie en attractie in het personenvervoer. Het vrachtvervoer speelt echter ook een belangrijke rol in het verkeer- en vervoersbeleid. Het vrachtverkeer vormt een belangrijk deel van het totale wegverkeer. Ongeveer 15% van de voertuigen op het hoofdwegennet zijn vrachtvoertuigen. Op stedelijke wegennetten varieert dit percentage van 2% tot 20%. De volgende factoren zijn van invloed op de productie en attractie in het goederenvervoer: • • • • • •
Aantal werknemers van een bedrijf Omzet van een bedrijf Bebouwd oppervlak Omvang van een industriecomplex Type bedrijf Bereikbaarheid van een bedrijf
57
5.4 Regressieanalyse Regressieanalyse is de meest gebruikte methode voor het berekenen van producties en attracties. In een lineair regressiemodel proberen we een variabele Y te voorspellen als een lineaire functie van een of meer invloedsvariabelen Xi Y = a + b1 X 1 + b2 X 2 + b3 X 3 +
De te voorspellen variabele Y heet de afhankelijke variabele. De invloedsvariabelen Xi worden de onafhankelijke variabelen genoemd. De coëfficiënt a heet de constante factor van de regressievergelijking, de coëfficiënten bi zijn de regressiecoëfficiënten. Als er slechts één variabele X aanwezig is spreekt men van enkelvoudige regressie. Als er meerdere variabelen X1, X2 … worden gebruikt is er sprake van multiple regressie. Bij toepassing van regressieanalyse voor de ontwikkeling van productie en attractiemodellen zijn de Xi de bovengenoemde sociaal-economische invloedsfactoren als inkomen, autobezit enz. De afhankelijke variabele Y stelt het aantal geproduceerde of aangetrokken verplaatsingen voor, meestal onderverdeeld naar motief. De meeste productie en attractiemodellen voorspellen het aantal verplaatsingen voor een spitsperiode. De constante factor en de regressiecoëfficiënten worden geschat (gecalibreerd) met behulp van sociaal-economische gegevens, verzameld voor een basisjaar. De schatting gebeurt met de methode der kleinste kwadraten, waarvoor talloze computerprogramma’s beschikbaar zijn. Men veronderstelt dat deze coëfficiënten tijdinvariant zijn, zodat aan de hand van verwachte sociaal-economische ontwikkelingen met behulp van de regressievergelijkingen de verplaatsingen voor een toekomstig planjaar kunnen worden bepaald.
5.4.1 Productie Men kan zich bij het ontwikkelen van regressiemodellen voor productie baseren op (geaggregeerde) gegevens per zone of op (gedisaggregeerde) gegevens per huishouden. 5.4.1.1 Productie op basis van zonale gegevens Bij deze modellen probeert men het totaal aantal verplaatsingen geproduceerd door een zone te voorspellen met sociaal-economische gegevens die karakteristiek zijn voor de gehele zone. Deze methode is alleen aan te bevelen indien men slechts over geaggregeerde zonale gegevens beschikt. Beschikt men over meer gedetailleerde gegevens op huishouding- of persoonsniveau dan is het duidelijk dat door aggregatie naar zonale gemiddelden of totalen veel informatie verloren gaat. Indien de zones wat socio-economische structuur betreft vrij homogeen van samenstelling zijn, kan de methode wel bruikbare resultaten opleveren. Om dit te bereiken zullen de zones over het algemeen klein van omvang moeten zijn, hetgeen de modellen duurder en complexer zal maken ten aanzien van de verzameling van gegevens, calibratie en toepassing.
58 Opgemerkt kan nog worden dat men bij de regressiemodellen op zonaal niveau gebruik kan maken van zonale totalen, zoals totaal aantal verplaatsingen per zone en totaal aantal auto’s per zone, of van zonale gemiddelden, zoals aantal verplaatsingen per huishouding per zone en aantal auto’s per huishouding per zone. Er is geen groot verschil tussen beide methodes, hoewel het werken met zonale gemiddelden de voorkeur geniet, omdat op die manier de invloed van de grootte van de zone (voor zover niet verdisconteerd in de andere invloedsvariabelen) teniet wordt gedaan.
5.4.1.2 Productie op basis van huishouding gegevens Zoals in de voorgaande paragraaf opgemerkt verdient een model op basis van gegevens per huishouding de voorkeur boven een model gebaseerd op zonale gegevens. Men maakt op die wijze het model onafhankelijk van de gekozen zoneindeling (zowel ten aanzien van de grootte van de zones als hun sociaal-economische samenstelling) en verder vermijdt men het verlies aan informatie dat gepaard gaat met de aggregatie van gegevens naar zonaal niveau. Men neemt over het algemeen de huishouding als eenheid en niet het individu. De reden daarvoor is dat men meent dat het de karakteristieken van een huishouding (bijvoorbeeld autobezit, inkomen en samenstelling) zijn die de productie bepalen, veeleer dan de persoonskenmerken van een individu.
5.4.2 Attractie Zoals uit het voorgaande is gebleken zijn het vooral de demografische factoren die een rol spelen bij de bepaling van de productie. Bij attractie daarentegen zijn het de werkgelegenheid in de zone en het grondgebruik die van doorslaggevend belang zijn. Voor het woon-werk verkeer is uiteraard de werkgelegenheid in de attractiezone de belangrijkste variabele. In eerste benadering zorgt elke werkgelegenheidsplaats voor één woon-werk verplaatsing. Heel vaak zal men over informatie beschikken ten aanzien van de werkgelegenheid. Mocht dat niet het geval zijn dan kan men daar een schatting naar doen op basis van het grondgebruik. Voor het motief onderwijs, een belangrijke veroorzaker van verplaatsingen, geldt ongeveer hetzelfde als voor de woon-werk verplaatsingen. Bij de schatting van de attracties voor de overige motieven zal men zich vaak baseren op het grondgebruik in de attractiezone. Dit grondgebruik kan bijvoorbeeld uitgedrukt worden in oppervlakte ingenomen door winkels, bedrijven en instellingen of een andere relevante maat die het belang van de attractor aangeeft. Bij de behandeling van regressiemethoden voor de productieschatting hebben we gezien dat men de schatting op zonaal niveau kan doen of op basis van huishoudingen. Bij de toepassing van regressieanalyse voor de berekening van attracties daarentegen gaat men vrijwel altijd uit van geaggregeerde gegevens op zonaal niveau. Tenslotte merken we op dat men voor de berekening van de attractie van zeer bijzondere zones (bijvoorbeeld luchthavens) aparte modellen opstelt, onderzoekingen doet of tellingen verricht, in plaats van gebruik te maken van de regressievergelijkingen die voor de andere zones gelden.
59
5.4.3 Problemen bij de toepassing van regressieanalyse Wij vermelden in deze paragraaf enige problemen waarop men kan stuiten bij de toepassing van regressieanalyse voor de ontwikkeling van productie en attractiemodellen. Het is zeker niet onze bedoeling om hier volledig in te zijn; regressieanalyse is een zeer verbreide statistische techniek met een uitgebreide literatuur, waarnaar wij verwijzen voor meer specialistische informatie. 5.4.3.1 Multicollineariteit Dit verschijnsel treedt op wanneer één of meer van de onafhankelijke variabelen ook onderling correlatie vertonen. Het spreekt vanzelf dat men moet trachten de onafhankelijke variabelen zodanig te kiezen dat zij zoveel mogelijk onafhankelijk van elkaar zijn, al blijkt dit in de praktijk vrij moeilijk te zijn. 5.4.3.2 Hoeveel en welke onafhankelijke variabelen? In het algemeen zal men trachten de modellen zo eenvoudig mogelijk te houden, dat wil zeggen niet meer onafhankelijke variabelen dan strikt noodzakelijk. Vragen die spelen bij de beslissing om al of niet een onafhankelijke variabele mee te nemen in een multiple regressie zijn: • • •
•
Zijn er sterke theoretische redenen om een bepaalde variabele te introduceren? Is het meenemen van bepaalde variabelen nuttig om het effect van bepaalde beleidsbeslissingen door te rekenen? Draagt de te introduceren variabele in voldoende mate bij aan de verklaring van de te voorspellen productie of attractie? Een techniek om dit te testen is de zogenaamde stapsgewijze regressie waarbij variabelen in stappen geïntroduceerd worden in de volgorde van hun bijdrage in de verklaring van de onafhankelijke variabele. Is de toekomstige ontwikkeling van de te introduceren socio-economische variabele zelf wel gemakkelijk te voorspellen? Zo niet, dan hebben we er weinig aan bij het voorspellen van de toekomstige producties en attracties.
5.4.3.3 Non-lineariteiten Het regressiemodel gaat uit van een lineaire relatie tussen verplaatsingen en socioeconomische variabelen. In werkelijkheid kan het zijn dat deze relatie niet lineair is. Soms, maar niet altijd, kan men met verschillende technieken deze moeilijkheid omzeilen. Die technieken omvatten een transformatie van variabelen (bijv. het nemen van de logaritme van de variabele) of het gebruiken van zogenaamde dummy variabelen. Wij gaan hier niet verder op in. 5.4.3.4 Constante factor in de regressievergelijking Om de optelbaarheid van resultaten te verzekeren, dient bij regressie op basis van zonale data de regressielijn door de oorsprong te gaan, ofwel de constante factor in de regressievergelijking behoort nul te zijn. Is dit niet het geval, dan is er wellicht iets mis met de specificatie van het regressiemodel.
60 Voorbeeld: Stel men vindt de volgende regressievergelijking voor het aantal vertrekken in een zone: Vertrekken = 1080 + Bevolking Voor een zone met 2000 inwoners bedraagt het aantal vertrekken dus 3080. Splitst men de zone in twee kleinere zones van elk 1000 inwoners, dan vindt men per kleinere zone 2080 vertrekken, dus voor de gehele zone 4160 vertrekken. Dit is in tegenspraak met het resultaat van 3080 vertrekken, dat we in eerste instantie vonden.
5.4.3.5 Extrapolatie Strikt genomen zijn regressievergelijkingen slechts geldig over het bereik van de gegevens die zijn gebruikt voor de calibratie. Bij toepassing van de regressievergelijkingen voor het maken van voorspellingen kan het voorkomen dat men buiten dit bereik komt. De nodige voorzichtigheid bij het gebruik van de aldus berekende resultaten is geboden 5.4.3.6 Ecologische correlatie Er kan een probleem optreden bij het gebruik van geaggregeerde gegevens dat bekend staat onder de naam ecologische correlatie. Indien de gegevens afkomstig zijn uit meerdere deelpopulaties kan het voorkomen dat binnen de deelpopulaties sprake is van een zekere (bijvoorbeeld positieve) correlatie, terwijl als we uit zouden gaan van de gemiddelden van de deelpopulaties er sprake is van een geheel andere (bijvoorbeeld negatieve) correlatie. Verplaatsingen
Personen in zone A
gemiddelde zone A
gemiddelde zone B
Personen in zone B
Inkomen
Figuur 5-1 Ecologische correlatie.2
Een voorbeeld wordt getoond in Figuur 5-1. De gedisaggregeerde gegevens binnen de zone laten een positieve invloed van het inkomen op de productie zien. Bij gebruik van gemiddelden per zone zouden we echter tot een heel andere conclusie komen.
61
5.5 Categorieanalyse Bij categorieanalyse verdeelt men de bevolking in het studiegebied in een aantal homogene groepen of categorieën gebaseerd op bepaalde sociaal-economische karakteristieken. Men bepaalt voor elk der categorieën het verplaatsingsgedrag en veronderstelt dat dit in de tijd stabiel zal blijven. Kent men de toekomstige samenstelling van een zone in termen van categorieën bewoners, dan kan daarmee het toekomstig verplaatsingsgedrag worden berekend. De methode heeft in vergelijking met regressieanalyse enige voordelen maar ook nadelen. 5.5.1 Productie Het principe van categorieanalyse voor de berekening van productie kan het best aan de hand van een voorbeeld worden geïllustreerd. Voorbeeld: Uit veel onderzoekingen is gebleken dat de productie van een huishouding vooral afhangt van het autobezit, de omvang en de samenstelling en het inkomen van de huishouding. Voor het voorbeeld nemen we aan dat men 3 klassen onderscheidt in het autobezit en 4 klassen in de omvang van het huishouden. Na inventarisatie van de gegevens zou categorieanalyse het resultaat kunnen opleveren weergegeven in de tabel waarin het aantal verplaatsingen per huishouding staat aangegeven per categorie van huishouding.
Omvang huishouden 1 2 of 3 4 5
0
Autobezit huishouding 1
2+
0.12 0.60 1.14 1.02
0.94 1.38 1.74 1.69
2.16 2.60 2.60
Tabel 5-1 Resultaat van een categorieanalyse.2
Indien men met gegevens uit het basisjaar een categorieanalyse-tabel heeft samengesteld, dan is de volgende stap het voorspellen van de aantallen huishoudens in elke categorie in een toekomstjaar. De totale toekomstige productie vinden we vervolgens door vermenigvuldiging van die aantallen met de produktiegegevens uit de tabel verkregen uit de categorieanalyse.
5.5.2 Attractie Voor de berekening van attractie wordt categorieanalyse vrijwel niet gebruikt. Het zou in principe wel kunnen met behulp van bijvoorbeeld een classificatie naar sector van werkgelegenheid en dichtheid van werkgelegenheid. De problemen bij het verzamelen van voldoende gedisaggregeerde gegevens zijn echter bijna onoverkomelijk.
5.5.3 Problemen bij de toepassing van categorieanalyse Hoewel categorieanalyse ten opzichte van regressieanalyse enige voordelen heeft zoals de conceptuele eenvoud van de methode en het feit dat non-lineariteiten gemakkelijk worden geaccommodeerd zijn er ook nadelen.
62
5.5.3.1 Veel calibratiegegevens nodig Het belangrijkste nadeel is de behoefte aan grote aantallen gegevens. Het bovenstaande voorbeeld is misleidend ten aanzien van het aantal te onderscheiden categorieën. In een praktische toepassing zal men al snel drie klassen in het autobezit onderscheiden, zes klassen voor het inkomen en zes klassen voor de omvang en samenstelling van het huishouden. Dit levert in totaal 3x6x6 = 108 categorieën. Als men ervan uitgaat dat minimaal 50 waarnemingen nodig zijn per categorie om een statistisch enigszins betrouwbaar gemiddelde te verkrijgen, dan blijken minimaal al circa 5000 waarnemingen benodigd te zijn. In werkelijkheid zal dit getal veel hoger liggen omdat de waarnemingen niet gelijkmatig over de categorieën verdeeld zullen zijn. Kortom de benodigde hoeveelheid gegevens neemt bij een geringe uitbreiding van het aantal categorieën zeer sterk toe.
5.5.3.2 Welke categorieën nu en in de toekomst? Het bepalen van geschikte homogene categorieën is een moeilijke taak, hoewel hiervoor wel zogenaamde clustering-methodes beschikbaar zijn. Ook de bepaling van de toekomstige verdeling van de huishoudens in een zone over de verschillende categorieën is een belangrijk probleem waarvoor geen geheel bevredigende oplossingen bestaan. 5.6 Gebruik van logitmodel voor berekening productie. Het totaal aantal gemaakte verplaatsingen in een gebied is het gevolg van een groot aantal individuele keuzen. Als we de keuzeverzameling voor een individu beperken tot de twee keuzen wel of niet maken van een verplaatsing kunnen we een binair logitmodel toepassen. We zullen dit toelichten aan de hand van het volgende voorbeeld dat ontleend is aan de TransCad handleiding6. Voorbeeld De productie van een zone wordt bepaald door kenmerken van de huishoudingen, kenmerken van de zone en de bereikbaarheid van de zone. Voor één bepaalde zone zijn de twee laatstgenoemde factoren constant, zodat de productie nog slechts een functie is van de kenmerken van de huishouding. Zoals elders reeds opgemerkt wordt in het algemeen de huishouding als eenheid genomen maar wij zullen in dit voorbeeld het individu als eenheid nemen. Wij willen nu de kans berekenen dat een persoon kiest voor het maken van een woon-werk verplaatsing als functie van zijn of haar persoonskenmerken. De volgende persoonskenmerken worden gebruikt: L = Leeftijd (in jaren 16-90) OPL = Opleiding (schaal van 1-17) G = Geslacht (0 = vrouw; 1 = man) GM = Gehuwde man (0 = nee; 1 = ja) GV = Gehuwde vrouw (0 = nee; 1 = ja) VK = Vrouw met kind jonger dan 6 jaar (0 = nee; 1 = ja) De laatste vier variabelen zijn zogenaamde dummy-variabelen. Dat zijn variabelen die slechts de waarden 0 of 1 kunnen aannemen. Elke dummy-variabele verdeelt de populatie in twee subgroepen. Door gebruik van meerdere dummy-variabelen kunnen we een aantal subgroepen van elkaar onderscheiden.
63 Er zijn per individu twee alternatieven, zodat we gebruik kunnen maken van een binair logitmodel. De keuze voor alternatief 1 betekent dat er wel een verplaatsing gemaakt wordt, terwijl alternatief 2 staat voor het niet maken van een verplaatsing. De kans op het maken van een woon-werk verplaatsing wordt nu als volgt met een binair logitmodel geschreven (zie hoofdstuk 3.4):
Pr(1) =
1 1+ e
−( V1 −V2 )
Aan de hand van een gegevensbestand, waarin per regel voor een persoon de waarden van de persoonskenmerken vermeld staan en of de betreffende persoon al of niet een woon-werk verplaatsing maakte, kunnen we functies schatten voor de waarneembare utiliteiten V1 en V2 . Stel we vinden het volgende resultaat:
V1 = −0.47 − 0.05∗ L + 0.21∗ OPL + 0.27∗ G + 159 . ∗ GM + 0.31∗ GV − 174 . ∗ VK V2 = 0 Omdat voor één individu de socio-economische variabelen niet zullen variëren over de twee alternatieven dienen zij als alternatief-specifieke variabelen te worden gespecificeerd (zie hoofdstuk 3.3.2). Het maakt niet uit in welke utiliteitsfunctie we de alternatief-specifieke variabele opnemen. Zouden we bijvoorbeeld de variabele G in de functie V2 hebben opgenomen in plaats van in V1, dan zou dezelfde coëfficiënt 0.27 zijn gevonden, maar met een minteken ervoor. Het uiteindelijke resultaat van de berekening blijft hetzelfde omdat we immers in het binaire logitmodel een verschil van utiliteiten gebruiken. We moeten erop letten dat alle coëfficiënten een teken hebben dat met de intuïtieve verwachtingen strookt. Het minteken bijvoorbeeld voor de variabele VK duidt erop dat een vrouw een kleinere kans heeft een woon-werk verplaatsing te maken als zij een jong kind heeft. De waarneembare utiliteit voor het maken van een verplaatsing wordt namelijk kleiner als VK de waarde 1 heeft. De waarden voor de coëfficiënten stellen ons ook in staat om te berekenen wat het effect is van een verandering in één van de variabelen. Stel bijvoorbeeld dat de kans op een woon-werk verplaatsing voor iemand met een opleiding OP = 10 gelijk is aan 50%. Ga dan na dat die kans circa 70% wordt als de opleidingsgraad naar OP = 14 stijgt terwijl de andere variabelen niet veranderen.
Het hierboven besproken logitmodel geeft de kans dat een bepaald individu een verplaatsing zal maken. Wat we willen weten is echter het totaal aantal verplaatsingen dat gemaakt wordt in een gebied. We moeten de individuele kansen dus nog aggregeren tot een voorspelling voor een geheel gebied. Zie daartoe de opmerkingen gemaakt in hoofdstuk 0.
5.7 Stabiliteit van productie en attractieparameters. Productie- en attractiemodellen worden ontwikkeld om de generatie van verplaatsingen in een toekomstig planjaar te bepalen. De gecalibreerde parameters zijn echter vaak gebaseerd op gegevens over de situatie in een basisjaar. Hoe kunnen we er zeker van zijn dat deze parameters invariant zijn in de tijd, dus dat ze ook in een toekomstige situatie zullen gelden? Het blijkt uit onderzoekingen dat, mits men zijn tijdshorizon niet te ver in de toekomst stelt, het verplaatsingsgedrag redelijk stabiel blijft. Hiervoor is het echter nodig dat de externe maatschappelijke invloeden niet al te drastisch veranderen. Een voorbeeld van een dergelijke externe invloed zou een aanzienlijke verandering in de brandstofprijzen kunnen zijn.
64 Ook maatschappelijke tendensen, zoals een langzame verandering in leefstijl in de maatschappij of een algehele gemiddelde veroudering van de bevolking zullen een invloed op het verplaatsingsgedrag hebben die niet door de klassieke productie en attractiemodellen kunnen worden weergegeven. Zogenaamde longitudinale effecten op lange termijn, die beleidsmatig zeer belangrijk zijn, vereisen een ander type modellen die momenteel volop in ontwikkeling zijn. Dit type modellen komt in een ander college aan de orde.
5.8 Balanceren van productie en attractie Als we een voldoend lange periode nemen zal het totaal aantal vertrekken gerekend over alle zones gelijk moeten zijn aan het totaal aankomsten in alle zones. Voor het berekenen van producties en attracties worden echter separate modellen gebruikt. Over het algemeen zullen de totale producties en attracties berekend met die modellen niet precies aan elkaar gelijk zijn. Het aanpassen van de modeluitkomsten, zodanig dat de totalen aan elkaar gelijk zijn, noemt men het balanceren van producties en attracties. Normaal neemt men aan dat de berekende producties betrouwbaarder zijn dan de berekende attracties, want woongelegenheid is beter te voorspellen dan werkgelegenheid. Het totaal van de berekende producties wordt daarom als de juiste waarde voor het totaal aantal verplaatsingen T beschouwd. Als Dj de attractie voor zone j is en J het totaal aantal attractiezones, wordt een evenredigheidsfactor f bepaald: J
f = T / ∑ Dj j =1
Alle berekende attracties worden nu met de factor f vermenigvuldigd. In plaats van de producties en attracties van de gehele HB-tabel in één keer te balanceren, kan men het ook in stappen doen. Men verdeelt daartoe het gebied in regio’s en brengt per regio de producties en attracties met elkaar in evenwicht.
65
6. Distributie Met behulp van de in hoofdstuk 5 besproken productie- en attractiemodellen hebben we de vertrekken en aankomsten per tijdseenheid (bijvoorbeeld het aantal verplaatsingen tijdens het drukste uur van de spitsperiode) voor de verschillende zones bepaald. We weten echter nog niet waar de verplaatsingen die vertrekken vanuit een bepaalde zone heengaan, noch kennen we de herkomst van de verplaatsingen die door een bepaalde zone worden aangetrokken. Het doel van een distributiemodel kan nu als volgt worden omschreven: Verdeel (distribueer): • •
de verplaatsingen met herkomst uit een bepaalde zone over alle bestemmingen, de verplaatsingen met bestemming in een bepaalde zone over alle herkomsten.
Het volledige patroon van verplaatsingen per tijdseenheid in het te onderzoeken gebied kan worden weergegeven in een zogenaamde herkomst-bestemmingstabel of HB-tabel. Het doel van een distributiemodel is dus om de HB-tabel voor een bepaald planjaar te bepalen. Wij beginnen dit hoofdstuk met een bespreking van de HB-tabel en de notaties die daarbij worden gebruikt. Vervolgens wordt heel compact het grondprobleem van de distributieberekening omschreven en het principe van de methodes die we voor de oplossing ervan kunnen aanwenden. Daarna worden twee methodes voor de distributieberekening behandeld: •
•
Bij de eerste methode gebruiken we de verplaatsingsgegevens uit een bestaande HB-tabel voor een basisjaar als maat om de toekomstige producties en attracties (bepaald uit het productie- en attractiemodel) te verdelen over de nieuwe te bepalen HB-tabel voor het planjaar. Omdat de oude verplaatsingsgegevens in feite met een factor worden verhoogd, heet dit model het groeifactormodel. Bij de tweede methode worden niet de bestaande verplaatsingen tussen de zones, maar de reisweerstanden tussen deze zones als een maat gebruikt om de verplaatsingen per tijdseenheid over de cellen van een HB-tabel verdelen. Omdat de resulterende formules enige verwantschap lijken te tonen met de graviteitswet van Newton is de naam zwaartekrachtmodel (gravity model) in zwang gekomen. Alternatieve benamingen voor hetzelfde model zijn interactiemodel en entropiemodel. Het woord interactiemodel spreekt voor zichzelf. De term entropiemodel kwam in gebruik, nadat men de aannemelijkheid van het zwaartekrachtmodel met behulp van het uit de natuurkunde en de informatietheorie afkomstige begrip entropie kon aantonen. Wij zullen in dit hoofdstuk laten zien dat het zwaartekrachtmodel ook te beschouwen is als een variatie op het groeifactormodel.
Omdat de invloed van verplaatsingsweerstanden gebruikt wordt bij het zwaartekrachtmodel gaat een behandeling van het begrip weerstand en het daarmee verband houdende begrip distributiefunctie aan de eigenlijke bespreking van het zwaartekrachtmodel vooraf. Voor het bepalen van de invloed van verplaatsingsweerstanden gebruiken we de gegevens uit een bestaande HB-tabel, ook wel genoemd de basismatrix. We proberen
66 de vorm van de distributiefunctie voor het basisjaar vast te tellen. Men veronderstelt dat deze distributiefunctie ook geldig blijft voor een toekomstig planjaar. Het bepalen van de distributiefunctie wordt ook wel genoemd de calibratie van het zwaartekrachtmodel. In dit hoofdstuk maken we enkele opmerkingen over deze calibratie. Een uitgebreidere behandeling vindt plaats in een vervolgcursus. Het hoofdstuk eindigt met een korte bespreking van enige toepassingsaspecten van distributiemodellen. We vermelden nog dat we ons in dit hoofdstuk zullen beperken tot zogenaamde unimodale (één-vervoerwijze) distributiemodellen. Met de verdeling van de verplaatsingen over de verschillende vervoerwijzen (de modal split) houden we ons bezig in hoofdstuk 7
6.1 Notaties Het is gebruikelijk om het patroon van verplaatsingen per tijdseenheid in een gebied weer te geven in een aantal zogenaamde herkomst-bestemmingstabellen of HBtabellen. Aparte HB-tabellen worden vaak gehanteerd ingedeeld naar motief (bijv. werk, onderwijs enz.), persoonskenmerk (bijv. auto wel of niet beschikbaar) en gebruikte vervoerswijze (bijv. auto en openbaar vervoer).
Vertrekken
1
Aankomsten 2 j
n
∑T
ij
j
1 2 i m
T11 T21
T12 T22
Tm1 D1
Tm2 D2
T1n T2n
O1 O2 Oi Om
Tij
∑T
ij
Dj
Tmn Dn
∑T
ij
=T
ij
i
Tabel 6-1 Algemene vorm van een HB-tabel. Een HB-tabel is een tweedimensionale matrix bestaande uit m rijen en n kolommen waar de rijen de herkomstzones representeren en de kolommen de bestemmingszones. In de meeste gevallen is een zone zowel herkomst- als bestemmingszone en is de matrix dus vierkant, dat wil zeggen: m = n. De cellen van rij i bevatten de verplaatsingen per tijdseenheid die uit zone i vertrekken met als bestemming de zone van de corresponderende kolom j. Op de diagonaal van links boven naar rechts onder staan de intrazonale verplaatsingen, dat zijn de verplaatsingen waarvan de herkomst en de bestemming in dezelfde zone liggen. Buiten de diagonaal staan de interzonale verplaatsingen. Het aantal verplaatsingen van i naar j (per tijdseenheid) wordt aangegeven met Tij. De som van Tij over alle kolommen van rij i is het totaal aantal verplaatsingen per tijdseenheid vertrekkend uit zone i en wordt aangeduid met Oi De som van Tij over alle rijen van kolom j is het totaal aantal verplaatsingen per tijdseenheid aankomend in
67 zone j en wordt aangegeven met Dj . (We gebruiken de Angelsaksische notatie: O voor origins, D voor destinations.) Het totaal aantal verplaatsingen in de gehele tabel geven we aan met T. Sommatie over het gehele bereik van een index noteren we door de betreffende index onder het sommatieteken te plaatsen. Zo geldt bijvoorbeeld:
∑T
ij
= Oi
j
en
∑T
ij
= Dj
i
Bij het vraagstuk van de distributie zijn de Tij onbekend. Het doel van een distributiemodel is juist om deze Tij te bepalen. De vertrekken Oi en aankomsten Dj fungeren hierbij als randvoorwaarde. De vertrekken en aankomsten worden verkregen bijvoorbeeld uit een toepassing van een productie- of attractiemodel. Al naar gelang de situatie spreken we over een model met dubbele of enkele randvoorwaarden: • •
dubbele randvoorwaarden: enkele randvoorwaarde:
zowel vertrekken als aankomsten zijn bekend ofwel vertrekken, ofwel aankomsten zijn bekend
6.2 Grondprobleem van de distributieberekening Bij een distributieprobleem met dubbele randvoorwaarden, dus de bepaling van een HB-tabel waarbij de sommen van de rijen (de herkomsten) en de sommen van de kolommen (de bestemmingen) bekend zijn, geldt:
∑T
ij
= Oi
voor i = 1 … m
= Dj
voor j = 1 … n
j
∑T
ij
i
In totaal zijn dit : m + n - 1 onafhankelijke vergelijkingen. (Als we m vergelijkingen voor de rijen en n-1 vergelijkingen voor de kolommen hebben opgesteld, geeft de voorwaarde voor de laatste (niet-gebruikte) kolom geen informatie meer, daarom zijn er m + n -1 onafhankelijke vergelijkingen.) De waarden die we willen bepalen zijn de Tij voor i = 1 … m en j =1 … n. In totaal zijn dit m*n onbekenden. Bij een 10x10 tabel bijvoorbeeld beschikken we over slechts 19 onafhankelijke vergelijkingen om de 100 cellen van de matrix te bepalen. Er zijn dus veel meer onbekenden dan vergelijkingen, het stelsel is onbepaald. Er zijn oneindig veel oplossingen die voldoen aan de gegeven randvoorwaarden. Welke van de mogelijke oplossingen is nu de juiste, ofwel hoe zullen de verplaatsingen vanuit een bepaalde herkomst zich over de bestemmingen verdelen? Het ligt voor de hand te veronderstellen dat naarmate de afstand tussen een herkomst en een bestemming kleiner is de herkomst-bestemmingsrelatie meer verkeer zal aantrekken. In de verkeerskunde spreekt men liever niet over de afstand tussen een herkomst en een bestemming, maar gebruikt men bij voorkeur het meer algemene begrip weerstand.
68 We hebben hierboven gezien dat de randvoorwaarden op zich niet voldoende zijn om de HB-tabel te berekenen. We hebben additionele voorwaarden nodig. Die additionele voorwaarden bestaan uit informatie over de weerstand tussen alle herkomsten en bestemmingen. Hoe komen we aan informatie over de weerstand tussen de herkomsten en bestemmingen? Hier kunnen we in principe twee wegen bewandelen: •
•
Men baseert zich op de verdeling van de verplaatsingen in een bestaande basismatrix. Dit is een bekende HB-tabel voor een bepaald basisjaar, die dient als uitgangspunt voor de berekening van toekomstige verdelingen. De bestaande verdeling van het verkeer over de HB relaties is immers een resultante van de weerstandsverdeling tussen de HB paren. Een model gebaseerd op dit uitgangspunt heet een groeifactormodel. Men bepaalt expliciet de weerstand tussen elk HB paar uitgedrukt in een relevante maat. Vervolgens gebruikt men de gegevens uit de basismatrix om de invloed te bepalen die de weerstand heeft op de verdeling van verplaatsingen. De aldus verkregen kennis wordt nu aangewend om de toekomstige verdeling te berekenen. Een dergelijke methode heet een synthetische methode. De bekendste synthetische methode is het zwaartekrachtmodel.
6.3 Groeifactormodellen Veronderstel dat we beschikken over een basismatrix , mogelijk afkomstig uit een voorgaande studie of anders geschat op basis van recente onderzoeksgegevens. Het doel is nu een HB-tabel te bepalen voor een toekomstig planjaar, bijvoorbeeld over 10 jaar. Stel dat we ook beschikken over een groeifactor voor het te verwachten verkeer over de komende 10 jaar. Die groeifactor kan bijv. gebaseerd zijn op een verwachte economische groei. Het kan zijn dat de te verwachten groei betrekking heeft op het gehele studiegebied, het kan ook zijn dat we geïnformeerd zijn over de te verwachten groei in productie en attractie voor de verschillende zones van het studiegebied. Afhankelijk van de beschikbare informatie kunnen we een aantal groeifactormethoden onderscheiden.
6.3.1 Uniforme groeifactor Als de informatie slechts bestaat uit een groeifactor voor het gehele studiegebied vermenigvuldigen we elke cel uit de basismatrix met de groeifactor. Dit is de meest primitieve situatie, slechts geschikt voor een planningstermijn van hooguit één tot twee jaar. De methode wordt ook gebruikt als de tijd of de financiële middelen ontbreken om verder onderzoek te doen. In de meeste gevallen zullen we beschikken over groeifactoren die gedifferentieerd zijn per zone en die bijvoorbeeld afkomstig zijn uit een voorgaande productie/attractie berekening. 6.3.2 Groeifactormodel met één randvoorwaarde Veronderstel dat we informatie hebben over de verwachte toename in verplaatsingen voor elke herkomstzone. In dit geval is het mogelijk de zone-specifieke groeifactor toe te passen op elke rij van de matrix. Zie Tabel 6-2 voor een voorbeeld. Voor zone 3 wordt een toename van 255 naar 400 voorspeld. Alle verplaatsingen in rij 3 worden nu vermenigvuldigd met een groeifactor g3 = 400/255. Analoog voor de andere rijen.
69 Basismatrix 1 2 3 4
∑
1
2
3
4
∑ j
5 50 50 100 205
50 5 100 200 355
100 100 5 250 455
200 300 100 20 620
355 455 255 570 1635
1
2
3
4
∑
voorspelde Oi 400 460 400 702 1962
i
Voorspelde matrix 1 2 3 4
∑
j
5.6 50.5 78.4 123.2 257.7
56.3 5.1 156.9 246.3 464.6
112.7 101.1 7.8 307.9 529.5
225.4 303.3 156.9 24.6 701.2
400 460 400 702 1962
voorspelde Oi 400 460 400 702 1962
i
Tabel 6-2 Voorbeeld groeifactormethode met producties als randvoorwaarde.2
6.3.3 Groeifactormodel met dubbele randvoorwaarden Dit is een zeer interessante situatie. De lezer wordt aangeraden goede nota te nemen van de methode waarmee dit probleem wordt opgelost, omdat hetzelfde principe zal terugkeren bij de behandeling van het zwaartekrachtmodel. We hebben nu informatie over zowel het aantal verplaatsingen dat in de toekomst geproduceerd zal worden in de herkomstzones, als het aantal toekomstige verplaatsingen aangetrokken door de bestemmingszones. Dit levert per rij van de HBtabel een groeifactor gi en per kolom een groeifactor Gj. Welke groeifactor moeten we nemen voor cel ij ? Een gemiddelde groeifactor (gi + Gj)/2 is geen goed idee. Als we een dergelijke gemiddelde groeifactor toepassen wordt zowel aan de randvoorwaarde voor de producties (rijtotalen) als aan de randvoorwaarde voor de attracties (kolomtotalen) niet voldaan. Door Furness werd in 1965 de volgende iteratieve methode voorgesteld om een geschatte HB-tabel voor een planjaar te verkrijgen. Breng eerst de matrix in overeenstemming met de in de toekomst verwachte producties door elke rij met een (per rij specifieke) groeifactor gi te vermenigvuldigen. Nu zal blijken dat de kolomtotalen niet overeenstemmen met de verwachte attracties. Daarom vermenigvuldigen we in de nu ontstane tabel elke kolom vervolgens met een (per kolom specifieke) factor Gj zodat dit wel het geval is. Daarna zal blijken dat we nieuwe correctiefactoren voor de rijen zullen moeten toepassen, enz. We herhalen dit vereffeningsproces totdat de correctiefactoren voor rijen en kolommen niet noemenswaard meer van 1.0 verschillen. Zie Tabel 6-3 voor een voorbeeld.
70 Basismatrix 1 2 3 4
1
2
3
4
∑ j
∑
5 50 50 100 205
50 5 100 200 355
100 100 5 250 455
200 300 100 20 620
260
400
500
802
1
2
3
4
355 455 255 570 1635
voorspelde Oi 400 460 400 702
i
voorspelde Dj Voorspelde matrix 1 2 3 4
∑
1962
∑ j
5.2 44.7 76.7 133.4 260.0
43.6 3.8 128.7 223.9 400.0
97.2 83.7 7.2 311.9 500.0
254.0 327.9 187.4 32.6 801.9
260
400
500
802
400.0 460.1 400.0 701.8 1961.9
voorspelde Oi 400 460 400 702
i
voorspelde Dj
1962
Tabel 6-3 Voorbeeld groeifactormethode met dubbele randvoorwaarden.2 Het algoritme van Furness kan als volgt worden omschreven:
Herhaal: Vereffen producties; Vereffen attracties; Tot convergentie Er kan worden aangetoond dat dit “Furness-proces” in de meeste gevallen convergeert naar een stabiele oplossing. Als we alle opeenvolgende vermenigvuldigingsfactoren van het Furness-proces samenvatten in de factor ai = gi1 * gi2 * …voor de rijen en bj = Gj1 * Gj2 * … voor de kolommen kunnen we het resultaat van de iteratie noteren als: Tij = ai bj tij Hierin worden ai en bj evenwichtsfactoren (“balancing factors”) genoemd en is tij de a-priori HB-tabel of basismatrix.
71
6.3.4 Nadelen groeifactormodellen Groeifactormethoden hebben de volgende problemen: •
•
•
Nieuwe ruimtelijke invullingen van het studiegebied kunnen niet worden geaccommodeerd. Weliswaar kunnen we de verwachte productie en attractie uitrekenen, maar we beschikken niet over geschikte startwaarden in de basismatrix. De methode leunt zwaar op de betrouwbaarheid van de gegevens in de individuele cellen van de basismatrix. Foutieve of onbetrouwbare gegevens in één of meer cellen in de basismatrix kunnen door de opeenvolgende correctiefactoren worden versterkt. Bovendien, als voor bepaalde HB-cellen waarnemingen ontbreken kan hun toekomstige waarde ook niet worden vastgesteld. Soms kunnen problemen met het iteratieproces optreden. Hierboven is gesteld dat het Furness-proces in de meeste gevallen convergeert naar een stabiele oplossing. Wanneer er zogenaamde nul-cellen in de basismatrix voorkomen is convergentie echter niet altijd gegarandeerd. Zie het voorbeeld in Tabel 6-4. De onderste tabel toont de situatie na 10 iteraties. Er is geen sprake van convergentie. Het probleem treedt op in de tweede rij van de matrix. De enige niet-nul-cel in deze rij kan in verband met het gewenste kolomtotaal nooit groter worden dan 400, dus het is uitgesloten dat het rijtotaal van de tweede rij op 460 uitkomt.
Basismatrix 1 2 3 4
∑
1
2
3
∑
4
j
5 0 50 100 155
50 50 100 200 400
100 0 5 250 355
200 0 100 20 320
260
400
500
802
1
2
3
4
355 50 255 570 1230
voorspelde Oi 400 460 400 702
i
voorspelde Dj Matrix na 10 iteraties 1 2 3 4
∑
1962
∑ j
3.4 0 65.5 191.1 260.0
0.7 388.2 2.8 8.3 400.0
61.0 0 5.9 433.1 500.0
355.3 0 345.7 101.0 802.0
260
400
500
802
420.4 388.2 419.9 733.5 1962.0
voorspelde Oi 400 460 400 702
i
voorspelde Dj
Tabel 6-4 Voorbeeld van een niet convergerend Furness proces.2 •
Een belangrijk nadeel van groeifactormethoden is dat zij geen rekening kunnen houden met veranderingen in het transportsysteem, in casu het transportnetwerk. Daarom hebben zij slechts beperkte toepassingsmogelijkheden bij het onderzoek naar het effect van de bouw van nieuwe infrastructuur, de introductie van alternatieve vervoerwijzen of de instelling van prijsmaatregelen (bijvoorbeeld tolheffing).
1962
72
6.4 Weerstand en distributiefunctie We hebben in het voorgaande gezien dat groeifactormodellen slechts een beperkte toepassing hebben. Er is behoefte aan distributiemodellen die het verplaatsingsgedrag op een meer fundamentele manier beschrijven. De bekendste van deze zogenaamde synthetische modellen is het zwaartekrachtmodel. Alvorens tot de eigenlijke bespreking van het zwaartekrachtmodel over te gaan is het noodzakelijk de begrippen verplaatsingsweerstand en distributiefunctie te behandelen. 6.4.1 Verplaatsingsweerstanden Het lijkt voor de hand te liggen de weerstand tegen een verplaatsing eenvoudig uit te drukken in de ermee gemoeide reistijd of afstand. Dat de zaak aanmerkelijk gecompliceerder is lichten we toe met een voorbeeld. Beschouw de rit tussen Tilburg in Nederland en Leuven in België. Veronderstel dat iemand per auto wil reizen van Tilburg naar Leuven. Er zijn twee redelijke routes: •
•
Tilburg - Breda - Antwerpen - Brussel - Leuven Deze route maakt geheel gebruik van autosnelwegen. De lengte is circa 135 km. Als er geen ernstige congestie is bij Antwerpen of Brussel is een gemiddelde snelheid van 90 km/uur haalbaar. De rit duurt dan 1.5 uur. Tilburg - Turnhout - Geel - Aarschot - Leuven. Deze route volgt de N9. De lengte is circa 100 km. Op sommige gedeelten van het traject is de weg zeer goed en kan met een snelheid van 70 km/uur worden gereden. Op andere gedeelten daarentegen voert de route door stads- en dorpskernen en is het oponthoud groot. Gerekend over het gehele traject Tilburg - Leuven is de gemiddeld haalbare snelheid circa 50 km/uur. De reistijd bedraagt bijgevolg 2 uur. Welke van beide bovengenoemde alternatieven voor de autorit Tilburg - Leuven heeft de kleinste weerstand, ofwel aan welke route geeft een automobilist de voorkeur? Laten we eerst de geldkosten vergelijken. Eenvoudigheidshalve beschouwen we alleen de brandstofkosten. Vanuit dit standpunt verdient de reis via de N9 de voorkeur. De rit is korter, daarnaast is door de beperkte snelheid het brandstofverbruik per kilometer relatief laag. Vervolgens vergelijken we de reistijden. Nu is de rit via Antwerpen en Brussel duidelijk in het voordeel. Er wordt een winst in reistijd geboekt van een half uur. En aan deze winst in reistijd kent de reiziger ook een zekere waarde toe. Er zijn nog andere factoren die bijdragen aan het beoordelen van de weerstand van een route. Bijvoorbeeld de veiligheid ervan of de landschappelijke schoonheid. De beoordeling hiervan is erg subjectief. De reis via Antwerpen en Brussel wint het waarschijnlijk qua veiligheid, wat betreft de landschappelijke schoonheid zullen velen de voorkeur geven aan de rit door de Midden-Kempen. Uit het voorbeeld blijkt dat het bepalen van de weerstand van een verplaatsing een moeilijk probleem is.
Het is gebruikelijk bij de bepaling van de weerstand van een verplaatsing slechts kosten- en tijdelementen te gebruiken. Andere factoren worden buiten beschouwing gelaten of, indien mogelijk, herleid tot kosten- of tijdelementen. Kosten bij een autoverplaatsing zijn bijvoorbeeld parkeerkosten, benzinekosten en tol, bij een verplaatsing met het openbaar vervoer zijn het bijvoorbeeld de kosten voor een ticket
73 en de fietsenstalling. Naast deze zogenaamde variabele kosten kan men ook vaste kosten zoals de afschrijvingskosten voor een auto of de kosten van een abonnement voor het openbaar vervoer in rekening brengen. Reistijden bij een verplaatsing per auto zijn natuurlijk de rijtijd, maar ook de tijd nodig voor het zoeken van een parkeerplaats en de looptijden van en naar de parkeerplaats. In het openbaar vervoer zijn naast de rijtijden in het voertuig de voor- en natransporttijden, de wachttijden en de overstaptijden van belang. Voor een bepaalde vervoerwijze wordt de totale weerstand van een verplaatsing van i naar j via route r nu geschreven als een lineaire combinatie van de door de reiziger ervaren subjectieve tijdsduur Tijr en kosten Kijr . Het minimum van die uitdrukking gerekend over alle mogelijke routes is de weerstand cij tussen i en j. cij = min(Tijr + K ijr γ ) r
Hierin is γ de tijdwaardering (engels: cost of time) uitgedrukt in geldeenheden per tijdseenheid (dus bijvoorbeeld euro/uur). De tijdwaardering γ geeft aan dat de reiziger het geldbedrag γ over heeft voor een tijdseenheid reistijdbesparing. In de formule zijn de geldkosten Kijr via de γ omgerekend naar tijdseenheden. Men zegt daarom dat de weerstand is uitgedrukt in gegeneraliseerde tijd. De gebruikte eenheid is bijvoorbeeld minuten. Om het onderscheid tussen “gewone” tijdseenheden en gegeneraliseerde tijdseenheden goed uit te laten komen, wordt soms de aangepaste terminologie kostenminuten gebruikt. (De weerstand kan ook worden uitgedrukt in gegeneraliseerde (geld)kosten. Om redenen van interpretatie verdient echter de uitdrukking in tijdseenheden de voorkeur; men associeert een reisweerstand meestal met een tijdsduur.) De waarde van γ is persoonsafhankelijk (het inkomen van de reiziger speelt een belangrijke rol) en motiefafhankelijk (de tijdwaardering in het zakelijke verkeer is aanmerkelijk hoger dan die van het overige verkeer). Een gangbare gemiddelde waarde voor γ is 5 tot 10 euro/uur. Voor het zakelijke verkeer kan de waarde echter oplopen tot het drie- of viervoudige hiervan. In bovenstaande formule voor de weerstand zijn Tijr en Kijr subjectieve door de reiziger ervaren reistijden en kosten. Bij het openbaar vervoer bijvoorbeeld wordt een minuut wachttijd door de reiziger als een grotere weerstand gevoeld dan een minuut effectieve rijtijd in het voertuig. Bij de kosten is iets soortgelijk het geval. Out-ofpocket kosten zoals bijvoorbeeld parkeerkosten roepen bij de reiziger een grotere weerstand op dan meer verborgen kosten zoals benzinekosten. Om dit verschil in perceptie tot uitdrukking te brengen worden de tijdsduren ts en kosten ks van de verschillende componenten s waaruit de reis van i naar j via route r is opgebouwd vermenigvuldigd met de wegingsfactoren αs en βs : Tijr = ∑ α s ⋅ t s s
en
K ijr = ∑ βs ⋅ k s s
Vaak ontbreekt het aan voldoende informatie om de waarde van de wegingsfactoren vast te stellen en worden zij noodgedwongen gelijk aan 1 gesteld. Er is echter wel veel onderzoek gedaan naar de weging van reistijdcomponenten bij het openbaar vervoer, en daarom is toepassing ervan gebruikelijk. De reistijd voor een verplaatsing per openbaar vervoer is opgebouwd uit de componenten: effectieve rijtijd in het voertuig, voortransport- en natransporttijd, wachttijd en overstaptijd. In het verkeersmodel voor
74 Vlaams Brabant zijn bijvoorbeeld de factoren toegepast zoals weergegeven in de volgende tabel. reistijdcomponent s rijtijd in voertuig voor/natransport wachttijd
αs 1.00 1.65 1.50
Tabel 6-5 Weging reistijd in openbaar vervoer (model Vlaams Brabant). Bij overstappen is er, naast de daarmede vaak gepaard gaande wachttijd en looptijd, nog de ergernis over de reisonderbreking die door de reiziger wordt ervaren. Ook hiervoor kunnen extra termen in de weerstandsformule worden ingevoerd. We zullen nu in het vervolg van deze tekst de verplaatsingsweerstand tussen twee plaatsen i en j aanduiden met de gegeneraliseerde reistijd cij en aannemen dat daarin alle van toepassing zijnde componenten op de juiste wijze zijn verdisconteerd. Als we onderscheid willen maken tussen meerdere vervoerwijzen voegen we de index m (voor modaliteit) toe. We noteren dan cijm, waarmee bedoeld wordt de weerstand tussen i en j voor vervoerwijze m.
6.4.2 Distributiefunctie Stel we kennen het totaal aantal vertrekken (de verplaatsingsproductie) van een herkomstzone. We willen weten hoe deze verplaatsingen zich over de mogelijke bestemmingen zullen verdelen. Intuïtief is duidelijk (en het blijkt ook uit empirisch onderzoek) dat het aantal verplaatsingen naar een bestemming zal dalen naarmate de afstand (of beter de weerstand) naar die bestemming toeneemt. Dit weerstandseffect op de verdeling van verplaatsingen wordt uitgedrukt door de distributiefunctie F(cij). Men hanteert afzonderlijke distributiefuncties afhankelijk van het motief van de verplaatsing, van de persoonskenmerken en, zoals in hoofdstuk 7 zal blijken, van de vervoerwijze. Er zijn in de loop van de tijd vele mathematische vormen voor de distributiefunctie voorgesteld. Zo meende men aanvankelijk dat het aantal verplaatsingen zou afnemen evenredig met het kwadraat van de afstand, daarbij ongetwijfeld geïnspireerd door de graviteitswet van Newton. Dit bleek niet door de waarnemingen te worden bevestigd. Later gebruikte men de weerstand in plaats van de afstand, en werden andere exponenten in de negatieve machtsfunctie geprobeerd. Zoals later in dit hoofdstuk zal worden aangetoond, verwacht men op grond van theoretische overwegingen dat de distributiefunctie een verloop zal hebben dat ongeveer kan worden beschreven door een negatief exponentiële functie, althans over een beperkt bereik van de weerstand. Veel toegepaste functies zijn:
F ( cij ) = cij−α
F ( cij ) = e
negatieve machtsfunctie
− β cij
F ( cij ) = cij−α ⋅ e
negatief exponentiële functie − β cij
combinatie van machtsfunctie en exponentiële functie
75 De parameters α en β in bovenstaande functies worden door calibratie met waarnemingen uit het studiegebied bepaald. De algemene vorm van de functies voor enkele waarden van de parameters is weergegeven in Figuur 6-1.
F(cij) cij0.5exp(-0.12cij)
exp(-0.05cij)
cij-0.4
cij
Figuur 6-1 Enige analytische distributiefuncties. Hoewel vaak toegepast heeft de negatief exponentiële functie een nadeel. Eenzelfde absolute toename in weerstand heeft bij lage waarden van de weerstand hetzelfde relatieve effect op de verplaatsingen als bij hoge weerstand. Dit is niet in overeenstemming met de intuïtie. Men verwacht bijvoorbeeld dat een vergroting van de weerstand van 5 naar 10 minuten een groter relatief effect heeft dan een vergroting van 120 naar 125 minuten. Een negatief exponentiële functie zal daarom doorgaans slechts over een beperkt bereik van de weerstand in overeenstemming te brengen zijn met empirische gegevens. (Zie ook voorbeeld 1 in hoofdstuk 3.6) Soms vertoont een distributiefunctie niet over het volle bereik van de weerstand een monotoon dalend verloop. Voor verplaatsingen per auto bijvoorbeeld, neemt de waarde van de distributiefunctie eerst toe, bereikt een maximum, en neemt daarna pas af met toenemende weerstand. Dit komt omdat bij zeer kleine afstanden de neiging om de auto te gebruiken klein zal zijn. Lopen of fietsen komt dan eerder in aanmerking. In dergelijke gevallen kan men soms een combinatie van machtsfunctie en exponentiële functie gebruiken om de data te beschrijven. Het is natuurlijk geenszins noodzakelijk de distributiefunctie in een gesloten mathematische vorm te schrijven. Men kan een functie ook definiëren door enumeratie (of table lookup). Dat betekent dat voor elk argument van de functie de bijbehorende functiewaarde wordt gespecificeerd. Praktisch kan dit bijvoorbeeld gebeuren door voor een aantal discrete waarden van het argument de functiewaarde in
76 een tabel op te slaan en aan te nemen dat in een interval rond een discrete waarde de functiewaarde constant blijft. Ook kan men in het interval rond de discrete waarde een interpolatie-techniek toepassen.
6.5 Zwaartekrachtmodel Na de introductie van de begrippen verplaatsingsweerstand en distributiefunctie, vervolgen wij nu onze behandeling van distributiemodellen. Het in dit hoofdstuk te behandelen zwaartekrachtmodel heeft een sterke verwantschap met de reeds behandelde groeifactormodellen. Bij de groeifactormodellen werd een bestaande a-priori matrix als een maat gebruikt voor de invloed van de weerstanden op de verplaatsingen naar de verschillende bestemmingen. Bij het zwaartekrachtmodel gebruiken we de waarde van de distributiefunctie als een maat voor de invloed van de weerstanden op de verplaatsingen tussen herkomsten en bestemmingen. 6.5.1 Principe van het zwaartekrachtmodel Het proces kan het beste toegelicht worden aan de hand van een voorbeeld. Tabel 6-6 is een HB-tabel waar de randen zijn gevuld met producties en attracties die zijn voorspeld met een productie en attractiemodel. Het gaat erom de HB-tabel in te vullen met verplaatsingen, zodanig dat aan de randvoorwaarden wordt voldaan.
1 2 3 4 voorspeld e Dj
1
2
260
400
Randvoorwaarden 3
500
4
voorspelde Oi 400 460 400 702
802
1962
Tabel 6-6 Randvoorwaarden voorbeeld zwaartekrachtmodel.2 De volgende tabel geeft de weerstanden cij tussen alle plaatsen, bijvoorbeeld uitgedrukt in minuten gegeneraliseerde tijd.
1 2 3 4
1 3 12 15.5 24
Weerstanden cij (minuten) 2 3 11 18 3 13 13 5 18 8
4 22 19 7 5
Tabel 6-7 Weerstanden voorbeeld zwaartekrachtmodel.2 Stel dat we op basis van de gegevens uit een basismatrix de volgende distributiefunctie hebben gecalibreerd.
F ( cij ) = e
−0.1cij
77 We starten het proces nu met een tabel gevuld met waarden van de distributiefunctie zoals weergegeven in Tabel 6-8. Deze tabel geeft de verhoudingen tussen het aantal verplaatsingen in elke cel van de te schatten HB-tabel. 1
Startmatrix F(cij) = exp (- 0.1 cij) 2 3 4
∑ j
1 2 3 4
∑
0.74 0.30 0.21 0.09 1.34
0.33 0.74 0.27 0.17 1.51
0.17 0.27 0.61 0.45 1.53
0.11 0.15 0.50 0.61 1.37
260
400
500
802
1.35 1.49 1.59 1.32 5.75
voorspelde Oi 400 460 400 702
i
voorspeld e Dj
1962
Tabel 6-8 Waarden distributiefunctie voorbeeld zwaartekrachtmodel.2 Om nu een HB-tabel te verkrijgen die voldoet aan de randvoorwaarden passen we op de startmatrix in Tabel 6-8 het Furness iteratieproces toe, zoals beschreven bij de groeifactormethode. Het uiteindelijke resultaat is weergegeven in Tabel 6-9 Verplaatsingen Tij berekend met het zwaartekrachtmodel 1 2 3 4 ∑
ai
j
1 2 3 4
∑
157 59 25 19 260
98 204 45 53 400
69 101 138 192 500
76 96 192 438 802
0.52
0.73
0.99
1.68
400 460 400 702 1962
410.0 379.5 229.0 428.7
i
bj
Tabel 6-9 Resultaten voorbeeld zwaartekrachtmodel.2 Als we alle opeenvolgende vermenigvuldigingsfactoren van het Furness proces samenvatten in de factor ai voor de rijen en bj voor de kolommen kunnen we het resultaat van de iteraties noteren als: Tij = a i b j F ( cij )
Dit is de gebruikelijke formulering van het zwaartekrachtmodel met dubbele randvoorwaarden. Let op de overeenkomst met het groeifactormodel. De ai en bj worden weer evenwichtsfactoren (“balancing factors”) genoemd en F(cij) is de distributiefunctie, verkregen door calibratie van de gegevens uit een basismatrix. Volkomen analoog aan de situatie met het groeifactormodel met enkele randvoorwaarden, kunnen we ook een zwaartekrachtmodel met enkele randvoorwaarden afleiden. In dat geval geldt ai = 1 óf bj = 1, en een Furnessiteratieproces is niet nodig.
78
6.5.2 Opmerkingen over het zwaartekrachtmodel 6.5.2.1 De waarden van de distributiefunctie en de evenwichtsfactoren Bij de waarden van de distributiefunctie is slechts de onderlinge verhouding van belang. Hetzelfde geldt voor de evenwichtsfactoren ai en bj. Als we het Furness iteratieproces beginnen met het vereffenen van de kolommen in plaats van het vereffenen van de rijen verkrijgen we andere evenwichtsfactoren. De onderlinge verhoudingen tussen de ai zowel als de bj zijn echter in beide gevallen dezelfde. Een andere manier om dit uit drukken is: de evenwichtsfactoren en de waarde van de distributiefunctie zijn op een constante factor na bepaald; vermenigvuldiging van bijvoorbeeld de ai met een constante factor verandert niets aan het resultaat mits we de bj, de F(cij) of het product van beide door dezelfde constante factor delen.
6.5.2.2 Alternatieve formuleringen voor het zwaartekrachtmodel In de literatuur treft men ook andere mathematische uitdrukkingen voor het zwaartekrachtmodel aan. Voorbeelden hiervan zijn:
Tij = Ai Oi B j D j F ( cij )
en
Tij = l i Qi m j X j F ( c ij )
In de eerste uitdrukking zijn Oi en Dj vertrekken uit zone i, respectievelijk aankomsten in zone j. De formule ontstaat door ai te schrijven als Ai Oi en bj als Bj Dj. De oorspronkelijke evenwichtsfactoren ai en bj zijn nu vervangen door de nieuwe evenwichtsfactoren Ai en Bj. Erg zinvol is dit niet. Begrijpelijk is het wel. Men wenst het zwaartekrachtmodel op te vatten als een model dat het aantal verplaatsingen tussen een herkomst en een bestemming beschrijft als functie van de eigenschappen van die herkomst en bestemming en de weerstand ertussen. Omdat de evenwichtsfactoren ai en bj moeilijk te interpreteren zijn als eigenschappen van herkomsten en bestemmingen, neemt men zijn toevlucht tot vertrekken en aankomsten. Veel soelaas biedt dit niet, want nu zijn nieuwe evenwichtsfactoren Ai en Bj nodig, waarvan de interpretatie net zo moeilijk is als de oorspronkelijke ai en bj. In de tweede uitdrukking gebruikt men niet vertrekken of aankomsten maar andere grootheden Qi en Xj die men bestempelt als de “polariteiten” van de herkomst- en bestemmingszone. Het idee is dat de polariteit een (nader te definiëren) karakteristieke grootheid is voor een zone en het vermogen beschrijft van die zone om verplaatsingen te produceren, respectievelijk aan te trekken.
6.5.3 Theoretische afleidingen van het zwaartekrachtmodel We hebben gezien dat het zwaartekrachtmodel gezien kan worden als een extensie van het groeifactormodel met de bijbehorende Furness procedure. Hoewel er op de Furness procedure bij oppervlakkige beschouwing niets lijkt af te dingen, schuilen er toch wat adders onder het gras. Dit kan als volgt worden ingezien.
79 Het uitgangspunt bij de gehele procedure was dat het verplaatsingsgedrag kan worden beschreven met een distributiefunctie die de invloed van de weerstand geeft op het aantal verplaatsingen. We verdeelden daarna bij de eerste iteratie de totale vertrekken vanuit een zone over de aankomstzones evenredig aan de waarden van de distributiefunctie. Bij de volgende iteratie, om de kolomtotalen in overeenstemming te brengen met de berekende attracties wordt die eerste evenredigheid weer verstoord. Na convergentie van de Furness procedure is van een evenredigheid van de verplaatsingen met de waarden van de distributiefunctie over de gehele HB-tabel geen sprake meer, zoals valt te zien in het voorbeeld in Tabel 6-8 en Tabel 6-9. Dit kan ook niet. We kunnen niet de verplaatsingen in de gehele HB-tabel evenredig laten zijn met de distributiefunctiewaarde voor de cellen, en tegelijkertijd aan de randvoorwaarden voldoen. Het bovenstaande duidt erop dat de Furness procedure het beste gezien kan worden als een compromis tussen enerzijds het zoveel mogelijk voldoen aan een evenredigheid met een distributiefunctiewaarde, anderzijds het voldoen aan de randvoorwaarden gesteld door berekende producties en attracties. Vanwege de wankele theoretische basis van het zwaartekrachtmodel gestoeld op de Furness procedure heeft men gezocht naar andere argumenten om de geldigheid van het zwaartekrachtmodel aan te tonen. We behandelen nu zeer in het kort twee alternatieve argumenten voor de geldigheid van het zwaartekrachtmodel, namelijk een afleiding m.b.v. het begrip entropie, bekend uit de fysica en de informatietheorie, en een afleiding gebaseerd op de discrete keuze theorie.
6.5.3.1 Afleiding zwaartekrachtmodel uit principe van maximale entropie Stel we moeten een HB-tabel schatten op basis van gegeven randtotalen. Het probleem is dat bij gegeven randtotalen heel veel HB-tabellen passen. In Figuur 6-2 is een voorbeeld gegeven.
5 1 6
0 2 2
5 3 8
4 2 6
1 1 2
5 3 8
3 3 6
2 0 2
5 3 8
Figuur 6-2 Verschillende HB-tabellen met dezelfde randtotalen. Maar al deze mogelijke HB-tabellen hebben niet dezelfde kans van optreden. We veronderstellen nu dat die HB-tabel tot stand zal komen die de maximale kans van optreden heeft. Met een terminologie ontleend aan fysica en informatietheorie kunnen we zeggen dat we zoeken naar de HB-tabel met maximale entropie. Het aantal manieren waarop we T verplaatsingen kunnen verdelen over een HB-tabel, zodanig dat de verdeling over de cellen Tij is, bedraagt:
W (Tij ) =
T! ∏ Tij ! i, j
(Dit is de multinomiale formule bekend uit de waarschijnlijkheidsrekening)
80 Voorbeeld Op hoeveel verschillende manieren kan een groep van 8 reizigers (noem ze A ..H) zich verdelen over een HB-tabel zodanig dat de volgende configuratie van aantallen verplaatsingen per cel ontstaat ? (Dit is de middelste configuratie uit Figuur 6-2.) 4 2
1 1
B , D, G, H E, F
A C
Eén willekeurige manier is bijv:
Als we alle rijen van de matrix achter elkaar zetten kan bovenstaande configuratie schematisch worden voorgesteld als (BDGH)A(EF)C. Het aantal mogelijke volgordes (permutaties) van de 8 letters A..H is 8!. Maar per cel is de volgorde niet van belang. Om het totaal aantal manieren te vinden dienen we daarom 8! nog te delen door het aantal permutaties per cel. Het gevraagde totaal aantal verschillende manieren bedraagt dus: 8! W (1, 2; 4,1) = = 840 4!⋅1!⋅ 2!⋅1! Als we verschillende configuraties uitproberen dan blijkt dat een gelijkmatige verdeling over de cellen op veruit het grootste aantal manieren kan voorkomen. Maar een volstrekt gelijkmatige verdeling als oplossing voor de te vinden HB-matrix is niet juist. De oplossing moet namelijk aan een aantal voorwaarden voldoen. De eerste voorwaarde is dat de verdeling over de cellen zodanig is dat de randtotalen overeenkomen met de gegeven randtotalen. Verder hebben we de weerstanden tussen de diverse herkomsten en bestemmingen nog niet in beschouwing genomen. Daarom moeten we ook een voorwaarde formuleren die te maken heeft met die weerstanden.
Het probleem kan nu als volgt geformuleerd worden: Vind de HB-tabel met Tij zodanig dat:
W(Tij) is maximaal (de HB-tabel heeft maximale kans van optreden) onder de voorwaarden:
∑T
ij
= Oi
j
∑T
ij
= Dj
i
Als we dit maximalisatieprobleem oplossen maken we geen onderscheid tussen tabellen Tij met veel verplaatsingen op een relatie met grote weerstand of veel verplaatsingen op een relatie met kleine weerstand, ofwel we kijken niet naar de invloed van de weerstand tussen een herkomst en bestemming. Om alle HB-tabellen vergelijkbaar te maken stellen we een additionele voorwaarde aan de totale “verplaatsingsinspanning” over de gehele matrix:
∑T c
ij ij
=C
waarin C een constante is
ij
Deze laatste voorwaarde stelt dat het aantal verplaatsingen vermenigvuldigd met de weerstand (of "kosten" in tijd, afstand etc) per verplaatsing, gesommeerd over de
81 gehele HB-tabel, bepaald wordt door het totale (tijd en geld) budget C dat de T reizigers tot hun beschikking hebben. Oplossing van dit maximalisatieprobleem (met behulp van Lagrange multipliers) leidt tot:
Tij = Ai Oi B j D j e
− β c ij
(waarin β gerelateerd is aan C)
Dit is het zwaartekrachtmodel met een negatief-exponentiële distributiefunctie. In de voorwaarde ∑ij Tij cij = C tellen verplaatsingen over lange afstand even zwaar als over korte afstand bij het berekenen van de totale verplaatsingsinspanning; als we de voorwaarde in de meer algemene vorm ∑ij Tij g ( cij ) = C schrijven waarin g een monotoon stijgende functie van cij is verkrijgen we één van de algemene vormen van het zwaartekrachtmodel:
Tij = Ai Oi Bj Dj f(cij) Deze afleiding van het zwaartekrachtmodel met behulp van begrip entropie werd voor het eerst gepubliceerd in Wilson (1970)7. Zeer begrijpelijke uiteenzettingen vindt men in Gould (1972)8 en Wilson en Kirkby (1980)9.
6.5.3.2 Afleiding zwaartekrachtmodel uit discrete keuze theorie Omdat het distributieprobleem in essentie een probleem is van de keuze van herkomst en bestemming, kunnen we de discrete keuze theorie toepassen die in hoofdstuk 3 behandeld is. De functie voor de waarneembare utiliteit Vi,jp voor persoon p van de keuze van i als herkomst en j als bestemming kan geschreven worden als:
Vijp = α H i + β B j − γ cij
α , β ,γ > 0
Hierin zijn Hi en Bj waarderingen van de positieve effecten die voortvloeien uit de keuze van plaatsen i en j als herkomst en bestemming. Die waarderingen houden verband met de activiteiten die in i en j kunnen worden uitgevoerd. (bijv. de aantrekkelijkheid van i als woonplaats en de aantrekkelijkheid van j als werkplaats). De reis van i naar j zal als een negatief effect worden ervaren, vandaar dat in de functie een term -γcij is opgenomen waarin cij de te overwinnen weerstand is van de reis van i naar j. De additieve vorm van de functie kan worden gerechtvaardigd door αHi en βBj op te vatten als de baten van het hebben van i als herkomst en j als bestemming en γcij op te vatten als de kosten van de verplaatsing, alles uitgedrukt in een onderling vergelijkbare (kosten)eenheid. We passen nu een aggregatiestap toe, en veronderstellen dat de individuele waarneembare utiliteiten mogen worden vervangen door een gemiddelde utiliteit per persoon over een gehele zone:
Ui,j = Vij + εij
82 Als we aannemen dat de εij identiek en onafhankelijk Gumbel-verdeeld zijn geldt een logitmodel voor de waarschijnlijkheid dat er een verplaatsing van i naar j gemaakt zal worden:
∑e
V
Vi′j′
Pr(ij ) = e ij /
α H i + β B j −γ cij
=e
/
alle i ′j ′
∑e
α H i′ + β B j′ −γ ci′j′
alle i ′j ′
Stel T is het totaal aantal verplaatsingen in de gehele HB-tabel, dan is het verwachte aantal verplaatsingen van i naar j:
Tij = Pr(ij ) ⋅ T = eα Hi ⋅ e
β Bj
⋅e
− γ cij
⋅
T
∑
α H i′ + β B j′ −γ ci′j′
i ′j ′
e
Hierin is de laatste factor gelijk aan een constante, stel K. De constante factor heeft het effect van een schalingsfactor, die ervoor zorgt dat de som van de berekende verplaatsingen overeenkomt met het totaal aantal verplaatsingen in de HB-tabel. Na de substitutie van variabelen:
eα H i = ai′
e
β Bj
= b′j
volgt:
Tij = K ai′b′j e
− γ cij
Zonder verlies van algemeenheid kunnen we de schalingsfactor K opnemen in de factoren a′i en bi′ . We verkrijgen dan:
Tij = ai b j e
− γ cij
Dit is het zwaartekrachtmodel met een negatief-exponentiële distributiefunctie. Bij de afleiding veronderstelden we dat het negatieve effect op de utiliteit van de reis van i naar j evenredig was met de weerstand cij. Het is echter denkbaar dat korte en lange afstanden op een verschillende manier doorwegen. Na substitutie van exp(-γ cij) door een meer algemene functie F(cij) ontstaat de bekende vorm van het zwaartekrachtmodel: Tij = a i b j F ( cij )
Gezien de aanzienlijke hoeveelheid vereenvoudigende aannamen die we hebben gedaan (namelijk de aannamen inherent aan het logitmodel en de aggregatiestap) is het niet verwonderlijk dat het zwaartekrachtmodel slechts een benaderende beschrijving van de distributie geeft. Inderdaad kunnen, vooral als gedetailleerd op relatieniveau wordt vergeleken, soms aanzienlijke verschillen optreden tussen waarnemingen en waarden berekend met het zwaartekrachtmodel. Over het algemeen,
83 gerekend over de gehele HB-tabel, blijken echter in de praktijk de overeenkomsten tussen waarnemingen en modelwaarden zeer redelijk te zijn.
6.5.3.3 Conclusie theoretische afleidingen We hebben gezien dat het zwaartekrachtmodel in essentie berust op een Furness iteratieprocedure waarbij als startwaarden de distributiefunctiewaarden worden gebruikt. Daarnaast kan het zwaartekrachtmodel ook worden afgeleid met behulp van het principe van entropie of uit overwegingen afkomstig uit de discrete keuze theorie. Al deze afleidingen op zich bewijzen de “correctheid” van het zwaartekrachtmodel niet, maar vergroten wel het vertrouwen in de juistheid ervan. De voorspellende waarde van het zwaartekrachtmodel zou eigenlijk moeten worden aangetoond door strikt gecontroleerde experimenten, zoals in de natuurwetenschappen gebruikelijk is. Helaas is een dergelijke werkwijze in de sociaal-economische wetenschappen bijna niet mogelijk. (Verkeerskunde, traditioneel beschouwd als een ingenieurs-discipline, heeft veel raakvlakken met de sociaal-economische wetenschappen.)
6.5.4 Calibratie van de distributiefunctie Bij de behandeling van de distributiefunctie is opgemerkt dat de bepaling van de parameters in die functie moet geschieden door calibratie met beschikbare waarnemingen voor het studiegebied. Wij beperken ons in deze cursus tot enige inleidende opmerkingen over het calibratieproces. Voor een meer diepgaande behandeling verwijzen wij naar een in de toekomst te geven vervolgcursus. Stel dat een HB-tabel met waarnemingen beschikbaar is voor een basisjaar. Neem aan dat voor deze HB-tabel een distributiemodel van toepassing is, bijvoorbeeld het in dit hoofdstuk behandelde zwaartekrachtmodel: Tij = ai bj f (cij) Parameters in dit distributiemodel zijn ai, bj en de parameters in de distributiefunctie f. Calibreren betekent nu: bepaal de parameters in het distributiemodel zodanig dat een maximale overeenkomst wordt bereikt tussen de waargenomen HB-tabel en de met het distributiemodel berekende HB-tabel. Een Engelse term die in dit verband veel gebruikt wordt is “best fit” (beste aansluiting) van distributiemodel aan waarnemingen. Hoe kunnen de parameters bepaald worden opdat er een best fit wordt verkregen? Een voor de hand liggende methode is “trial and error”. We maken een eerste schatting van de parameters op basis van inzicht en ervaring. We bepalen de mate van aansluiting van model aan waarnemingen en proberen daarna door voorzichtige aanpassing van de parameters de aansluiting te verbeteren. In de praktijk blijkt dit een veel te tijdrovende methode. Er is behoefte aan een systematische manier om de calibratie uit te voeren. Er zijn in de loop van de tijd veel calibratiemethoden voorgesteld. Een van de meest efficiënte methoden is gebaseerd op het maximum likelihood principe, een bekende
84 schattingsmethode uit de statistiek. Een voorbeeld is de zogenaamde Poissonschatter, die in een toekomstige cursus behandeld zal worden. We gingen er hierboven vanuit dat we voor de calibratie over een waargenomen HBtabel beschikten. In veel gevallen echter hebben we geen waarnemingen voor de cellen in de HB-tabel, maar beschikken we wel over tellingen op de schakels van het netwerk, bijvoorbeeld tellingen van voertuigen op een aantal wegvakken. Afhankelijk van de routekeuze van de reizigers kunnen meerdere HB-relaties gebruik maken van eenzelfde schakel in het netwerk. We staan dan voor de taak om met behulp van een routekeuzemodel als het ware de HB-tabel te reconstrueren. Routekeuzemodellen worden behandeld in het hoofdstuk over toedeling. Calibratie met behulp van tellingen op netwerkschakels komt aan de orde in een vervolgcursus.
6.6 Toepassingsaspecten van distributiemodellen We besluiten het hoofdstuk over distributiemodellen met een korte bespreking van enige praktische toepassingsaspecten. 6.6.1 Intrazonaal verkeer Het intrazonaal verkeer bestaat uit de verplaatsingen die hun herkomst en bestemming binnen dezelfde zone hebben. Hiermee in contrast staat het interzonale verkeer met herkomst en bestemming in verschillende zones. Voor de interzonale verplaatsingen gebruiken we de weerstand tussen de centroïdes van de betreffende zones, waarbij het verkeer geacht wordt zich te verplaatsen via het modelnetwerk. Het verkeer bereikt en verlaat het modelnetwerk via de connectors. Bij intrazonale verplaatsingen maken de verplaatsingen geen gebruik van het netwerk en zijn de weerstanden tussen herkomst en bestemming dus niet bekend. Omdat het aantal intrazonale verplaatsingen, vanwege de geringe afstanden, over het algemeen groot zal zijn kan dit problemen opleveren. Er zijn twee benaderingen om tegemoet te komen aan deze problemen: • •
Gebruik kleine zones en neem het intrazonale verkeer eventueel niet mee in het distributiemodel. Pas een benadering toe voor de intrazonale weerstanden, bijvoorbeeld als functie van de oppervlakte of als functie van een karakteristieke diameter van de zone. Een andere mogelijkheid is een percentage (bijvoorbeeld 50%) te nemen van de weerstand naar de dichtstbijzijnde buurzone.
6.6.2 Externe zones Bij toepassing van een distributiemodel moeten de weerstanden tussen de zones bekend zijn. Dit zal over het algemeen het geval zijn voor de zones gelegen in het studiegebied, de interne verplaatsingen. Veelal zal echter een aanzienlijk deel van het verkeer zijn herkomst of bestemming buiten het studiegebied hebben. Ook is het mogelijk dat zowel herkomst als bestemming buiten het studiegebied liggen, maar dat deze verplaatsingen het studiegebied wel doorkruisen. De weerstanden van en naar deze externe zones (ook wel invloedsgebied of buitengebied geheten) zijn moeilijker te definiëren.
85 Een mogelijke aanpak van dit probleem is om slechts de interne verplaatsingen in een synthetisch distributiemodel (bijv. het zwaartekrachtmodel) te betrekken en voor de overige verplaatsingen een groeifactormodel toe te passen. De daarvoor noodzakelijke gegevens worden verkregen uit tellingen op een cordon (een gesloten ring) gelegen rondom het studiegebied.
6.6.3 Transformatie HB-tabel naar geschikte eenheden De resultaten van de distributieberekening dienen als invoer voor de volgende fase van het verkeersmodel, namelijk de toedeling. Bij de distributiemodellen zal in het algemeen sprake zijn van personenverplaatsingen. Het kunnen verplaatsingen per dag, per spitsperiode of een andere tijdseenheid zijn. Bij een toedelingsmodel voor het autoverkeer zal men bijvoorbeeld behoefte hebben aan voertuigverplaatsingen/uur gedurende de spitsperiode. Men gebruikt factoren als voertuig-bezettingsgraden en spitsuur-coëfficiënten om een eenvoudige omzetting naar de geschikte eenheden uit te voeren.
86
7. Vervoerwijzekeuze De verschillende fases in het traditionele verkeersmodel vertonen een logische opeenvolging. Eerst wordt in het productie- en attractiemodel bepaald hoeveel verplaatsingen kunnen worden verwacht. Vervolgens wordt met het distributiemodel vastgesteld waar deze verplaatsingen heengaan, dat wil zeggen herkomsten en bestemmingen worden bepaald. In de toedelingsfase, te behandelen in hoofdstuk 0, tenslotte wordt berekend hoe de verplaatsingen daadwerkelijk zullen plaatsvinden, waarbij het accent valt op het routekeuzeproces. Hoe men ergens naar toe gaat is echter niet alleen een kwestie van routekeuze maar vooral ook van een keuze van vervoerwijze. De vervoerwijze wordt ook wel de modaliteit of mode genoemd. De verdeling van de verplaatsingen over de verschillende vervoerwijzen wordt dan de modal split genoemd. Het modelleren van de vervoerwijzekeuze is een van de klassieke problemen uit de verkeerskunde. Bij de verschillende modaliteiten kan men denken aan lopen, fietsen, autorijden, transport per openbaar vervoer en misschien nog enkele mogelijkheden afhankelijk van plaatselijke gewoonten. De nadruk valt veelal op het keuzeprobleem tussen auto en openbaar vervoer vanwege de hoge maatschappelijke relevantie van dit thema. Vanwege de congestie op het wegennet en de milieuaantasting door het wegverkeer streven beleidsbepalende instanties ernaar het gebruik van het openbaar vervoer te bevorderen. Het is daarom van het grootste belang om over modellen te beschikken die gevoelig zijn voor de attributen die de keuze voor een vervoerwijze beïnvloeden. We starten dit hoofdstuk met een kort overzicht van de factoren die bepalend zijn voor de vervoerwijzekeuze. De plaats van het vervoerwijzekeuzemodel in het traditionele verkeersmodel is in de loop van de tijd aan verandering onderhevig geweest. Aanvankelijk meende men de vervoerwijzekeuze te moeten modelleren als onderdeel van de productie en attractie. Omdat echter in dat geval de netwerkeigenschappen geen invloed kunnen uitoefenen op de vervoerwijzekeuze gaf men er later de voorkeur aan de vervoerwijzekeuze deel te laten uitmaken van de distributiefase. Deze modellen, de zogenaamde simultane en sequentiële keuzemodellen voor distributie en vervoerwijzekeuze, zullen uitvoerig worden besproken.
7.1 Invloedsfactoren vervoerwijzekeuze Er zijn vele factoren die van invloed zijn op de vervoerwijzekeuze. Eerst en vooral is dat de beschikbaarheid van de verschillende vervoermiddelen. Mensen die veroordeeld zijn tot het gebruik van de een of andere vervoerwijze noemt men captives van die vervoerwijze. Deze term wordt het vaakst gebezigd in verband met het openbaar vervoer. Indien in een huishouden geen auto ter beschikking staat, en de bestemming is te ver weg om te fietsen of te lopen en als bovendien het inkomen niet toereikend is om een auto te huren of een taxi te nemen, is men een captive van het openbaar vervoer. Maar het kan ook zijn dat er geen openbaar vervoerdienst is naar de plaats waar men wenst heen te gaan of de aard van de werkzaamheden is zodanig dat het openbaar
87 vervoer niet in aanmerking komt. In dat geval is men bijvoorbeeld aangewezen op de auto, en spreekt men van auto-captives. Personen die geen gevangene zijn van de een of andere vorm van vervoer noemt men keuze-reizigers. Men neemt aan dat deze reizigers hun keuze van vervoerwijze maken op basis van rationele overwegingen. Men kan de factoren die daarbij een rol spelen indelen in een drietal groepen: •
•
•
Kenmerken van de reiziger Er blijkt een verband te zijn tussen vervoerwijzekeuze en sociaal-economische karakteristieken zoals beroep, inkomen, leeftijd enz. Het belangrijkste kenmerk is de autobeschikbaarheid, een kenmerk overigens dat ten nauwste verband houdt met de voornoemde sociaal-economische karakteristieken. Kenmerken van de vervoerwijze In deze groep van kenmerken zijn vooral de verschillen in reistijd en kosten tussen de vervoerwijzen van belang. Maar ook factoren als parkeermogelijkheden en comfort, veiligheid, en betrouwbaarheid van het vervoermiddel spelen een rol. Kenmerken van de verplaatsing Hier kan men denken aan het motief van de verplaatsing. De regelmatige reis van wonen naar werken onderneemt men bijvoorbeeld per openbaar vervoer, terwijl het winkelen per auto gedaan wordt. Ook het tijdstip van de verplaatsing is van invloed.
Een verkeersmodel dat de vervoerwijzekeuze op de juiste wijze wil representeren moet eigenlijk gevoelig zijn voor de meeste van bovenstaande factoren. Meestal volstaat men echter met het gebruik van de weerstand cijm . Voor een bespreking van het begrip weerstand wordt verwezen naar het hoofdstuk over de distributie.
7.2 Vervoerwijzekeuze als onderdeel van productie/attractieberekening In het verleden, vooral in de USA waar de eerste ontwikkelingen van het klassieke verkeersmodel plaatsvonden, werd de berekening van de vervoerwijzekeuze uitgevoerd als onderdeel van het productie- en attractiemodel. De producties en attracties staan ook wel bekend als trip-ends. Men noemt deze modal split modellen dan ook wel trip-end modal split modellen. Men dacht dat de vervoerwijzekeuze, die hoofdzakelijk werd geïnterpreteerd als een keuze tussen auto en openbaar vervoer, vooral werd bepaald door persoonlijke karakteristieken als bijvoorbeeld inkomen. In sommige gevallen werd daar, in de vorm van een soort bereikbaarheidsindex, de mate van beschikbaarheid van openbaar vervoervoorzieningen aan toegevoegd. Het nadeel van de berekening van de modal split in of direct na de productie- en attractie-fase is dat men in dat stadium nog niet weet waar de verplaatsingen naar toegaan. Dat betekent dat de karakteristieken van het netwerk niet in de modellen zijn opgenomen. Bijgevolg zijn deze modellen beleidsongevoelig, in die zin dat verbeteringen aan bijvoorbeeld het openbaar vervoer netwerk op geen enkele wijze tot uiting komen. Het is voornamelijk om deze reden dat trip-end modal split modellen geen toepassing meer vinden.
88
7.3 Vervoerwijzekeuze als onderdeel van de distributieberekening Indien de berekening van de vervoerwijzekeuze plaatsvindt als onderdeel van de distributieberekening spreekt men van trip-interchange modellen. Het uitvoeren van de modal split berekening in samenhang met de distributie is een logische keuze. Het nadeel van de trip-end modellen is hier niet aanwezig, men kan de karakteristieken van de verplaatsingen, zoals reistijd, in de berekening van de vervoerwijzekeuze meenemen. Bovendien zijn bestemmingskeuze en vervoerwijzekeuze nauw met elkaar verbonden. Dit type modellen heeft dan ook ruime toepassing gevonden en wordt nog steeds toegepast. 7.3.1 Simultaan berekening distributie/vervoerwijze met multimodaal zwaartekrachtmodel Het zwaartekrachtmodel dat we gebruikten voor de berekening van de distributie kan worden aangepast zodat tegelijkertijd de verdeling over de vervoerwijzen berekend wordt. Wij hebben in hoofdstuk 6 over de distributie gezien dat het zwaartekrachtmodel voor één vervoerwijze (een unimodaal zwaartekrachtmodel) kan worden afgeleid met behulp van het begrip entropie of door gebruik te maken van het logitmodel afkomstig uit de discrete keuzetheorie. Wanneer er een keuze van vervoerwijzen is tussen dezelfde herkomst en bestemming kan men met deze methoden ook een multimodale versie van het zwaartekrachtmodel afleiden. Wij illustreren dit met de afleiding via het logitmodel. De keuzeverzameling voor het logitmodel bij het unimodale zwaartekrachtmodel bestond uit alle herkomst-bestemmingsparen. Als er een keuze is tussen meerdere vervoerwijzen verkrijgen we een vergrote keuzeverzameling omdat nu per herkomstbestemmingspaar één of meer vervoerwijzen moeten worden meegenomen. Als we veronderstellen, evenals we dit bij de afleiding van het unimodale zwaartekrachtmodel deden, dat de individuele utiliteiten mogen worden vervangen door een gemiddelde utiliteit per persoon over een gehele zone, ontstaat de volgende uitdrukking voor de waarneembare utiliteit Vijm voor de keuze van i als herkomst, j als bestemming en het maken van een verplaatsing van i naar j met vervoerwijze m :
Vijm = α H i + β B j − γ cijm
α , β ,γ > 0
Het verschil met de afleiding voor één vervoerwijze is de toevoeging van de index m. Nu stelt cijm de weerstand voor van de verschillende vervoerwijzen m tussen i en j. Als we ook hier aannemen dat er een logitmodel mag worden toegepast voor de keuze van i en j als herkomst en bestemming en m als vervoerwijze tussen i en j, dan kunnen we op een analoge manier als bij het unimodale geval afleiden:
Tij = ai b j e
− γ cijm
89
Dit is weer het zwaartekrachtmodel met een negatief-exponentiële distributiefunctie. De invloed van de weerstand cijm op het aantal verplaatsingen tussen i en j met −γ c m
vervoerwijze m is echter door de exponentiele term e ij wat te eenvoudig voorgesteld. Ook hier zal gelden dat korte en lange afstanden op een verschillende manier zullen doorwegen, terwijl het tevens waarschijnlijk is dat de functionele vorm zal verschillen per vervoerwijze. We substitueren daarom deze exponentiele term door de meer algemene functies Fm, die dus verschillen naar vervoerwijze:
Tijm = ai b j F m ( cijm ) waaruit volgt:
Tij =
∑T
m′ ij
m′ ∈ ij
= ai b j
∑F
m′
( cijm′ )
m′ ∈ ij
In woorden: de verdeling van de transportstromen over de verschillende vervoerwijzen m tussen een herkomst i en een bestemming j is evenredig met de waarden van de distributiefunctie Fm(cijm) voor die vervoerwijzen. Een kritiek punt in bovenstaande afleiding is de aanname omtrent de toepasbaarheid van een logitmodel. Aangezien sommige alternatieven in de keuzeverzameling betrekking hebben op verplaatsingen tussen dezelfde herkomsten en bestemmingen, kan twijfel rijzen aan de onafhankelijkheid van de stoortermen in de utiliteiten van de alternatieven. Anderzijds, indien men aanneemt dat de variantie in de utiliteiten voornamelijk toe te schrijven is aan de verschillen in perceptie tussen de verplaatsingsweerstanden is de veronderstelling van onafhankelijkheid van de stoortermen wellicht toch gerechtvaardigd. Bij het multimodale zwaartekrachtmodel maakt de berekening van de vervoerwijzekeuze deel uit van de distributieberekening. Daarom wordt dit model ook wel een simultaan berekeningsmodel voor distributie en vervoerwijzekeuze genoemd. Een andere mogelijkheid is om de berekening van distributie en vervoerwijzekeuze na elkaar uit te voeren. In dat geval spreekt men van een sequentieel berekeningsmodel voor distributie en vervoerwijzekeuze. Het sequentiele berekeningsmodel wordt in deze editie van de cursustekst niet besproken. Het simultane multimodale zwaartekrachtmodel veronderstelt de beschikbaarheid van aparte distributiefuncties per vervoerwijze. Aangezien distributiefuncties verder veelal nog gedifferentieerd worden naar motieven en persoonskenmerken heeft men een verzameling van distributiefuncties nodig alvorens men een berekening met het multimodale zwaartekrachtmodel kan uitvoeren. Indien men bijvoorbeeld de persoonskenmerken autobeschikbaar en niet-autobeschikbaar, de motieven werken en overige en de vervoerwijzen auto, openbaar vervoer en fiets onderscheidt heeft men een set van 12 distributiefuncties nodig.
90
Voorbeeld van een berekening met het multimodale zwaartekrachtmodel: Stel er zijn een drietal zones A, B en C. De ter beschikking staande vervoerwijzen voor alle relaties zijn auto, fiets en openbaar vervoer. We maken geen onderscheid naar motieven of persoonskenmerken. De randvoorwaarden, berekend met een productie- en attractiemodel, zijn weergegeven in Tabel 7-1. De opgave is de tabel in te vullen met verplaatsingen per vervoerwijze. Randvoorwaarden (auto, fiets en openbaar vervoer tezamen!) A B C voorspelde Oi A 100 B 100 C 200 voorspelde 400 Dj 200 150 50
Tabel 7-1 Randvoorwaarden voorbeeld multimodale zwaartekrachtmodel. We hebben nog de distributiefuncties per vervoerwijze nodig. De waarden van de distributiefunctie per vervoerwijze staan in Tabel 7-2. Waarden van de distributiefunctie Fijm(cijm) A B auto 20 10 A fiets 10 5 o.v. 4 3 auto 10 20 B fiets 5 10 o.v. 3 4 auto 2 5 C fiets 1 2 o.v. 1 2
C 2 1 1 5 2 2 20 10 4
Tabel 7-2 Distributiefunctiewaarden per vervoerwijze. We beschikken nu over alle gegevens om de HB-tabel te berekenen per vervoerwijze. Beter is het om te zeggen dat we drie HB-tabellen gaan bepalen: één per vervoerwijze. Eerst sommeren we per relatie de waarden van de distributiefunctie. Dit levert de resultaten weergegeven in Tabel 7-3. Deze tabel wordt nu, op dezelfde wijze als in hoofdstuk 6.5.1, gebruikt als startmatrix voor het Furness-proces.
91
Gesommeerde waarden distributiefunctie A
∑
m
Fijm ( cijm )
B
C
∑ j
A B C
∑
34 18 4 56
18 34 9 61
4 9 34 47
200
150
50
56 61 47 164
voorspelde Oi 100 100 200
i
voorspelde Dj
400
Tabel 7-3 Distributiefunctie gesommeerd over vervoerwijzen. Na een aantal iteraties van het Furness-proces vinden we nu de totale verplaatsingen berekend met het zwaartekrachtmodel. De verplaatsingen in Tabel 7-4 zijn de sommen van de verplaatsingen over alle vervoerwijzen. Verplaatsingen (alle vervoerwijzen) met zwaartekrachtmodel A B C
∑
ai
j
A B C
∑
78 50 72 200
22 48 80 150
0 2 48 50
2.27
1.14
0.18
100 100 200 400
1.01 1.23 7.85
i
bj
Tabel 7-4 Totale verplaatsingen voorbeeld multimodale zwaartekrachtmodel. Tot slot verdelen we naar evenredigheid van de waarde van de distributiefunctie de totale verplaatsingen over alle vervoerwijzen. Het resultaat staat in Tabel 7-5. Verplaatsingen per vervoerwijze
A
B
C Totaal Djm Totaal Dj
auto fiets o.v. auto fiets o.v. auto fiets o.v. auto fiets o.v.
A
B
C
46 23 9 28 14 8 36 18 18 110 55 35 200
12 6 4 28 14 6 44 18 18 84 38 28 150
0 0 0 2 0 0 28 14 6 30 14 6 50
Totaal Oim 58 29 13 58 28 14 108 50 42 224 107 69
Tabel 7-5 Eindresultaat voorbeeld multimodale zwaartekrachtmodel.
Totaal Oi 100
100
200
400
92
7.3.2 Sequentieel keuzemodel distributie/vervoerwijze via de logsom Het sequentiele model voor de berekening van distributie en vervoerwijzekeuze wordt in deze editie van de cursustekst niet besproken.
93
8. Toedeling Het traditionele verkeersmodel bestaat uit de volgende submodellen: • • •
Een productiemodel en een attractiemodel waarmee respectievelijk aantallen vertrekken en aankomsten per tijdseenheid worden bepaald Een model voor distributie- en vervoerwijzekeuze ter bepaling van HB-tabellen met verplaatsingen per tijdseenheid en per vervoerwijze. Een toedelingsmodel waarmee de gegevens uit de HB-tabellen worden vertaald naar stromen (bijvoorbeeld aantal voertuigen per uur) op de schakels van de netwerken voor de verschillende vervoerwijzen.
Dit hoofdstuk gaat over toedelingsmodellen, de derde fase in het traditionele verkeersmodel. Wij behandelen slechts de beginselen van de toedelingsmodellen. Voor meer informatie wordt verwezen naar het standaardwerk van Sheffi (1985)10 . Bij toedelingsmodellen gaat het vooral om routekeuze. Het ligt voor de hand om te veronderstellen dat een reiziger in principe de kortste route naar zijn bestemming zal kiezen. Daarom spelen bij toedelingsmodellen algoritmes voor het vinden van de kortste route in een netwerk een belangrijke rol. Vanwege de grote verschillen tussen netwerken voor het privé vervoer (auto, fiets enz.) en het openbaar vervoer worden zij apart behandeld.
8.1 Toedelingsmodellen voor wegennetwerken 8.1.1 Kortste route in een wegennetwerk Bij de in dit hoofdstuk te behandelen toedelingsmodellen moet veelvuldig de kortste route (ook wel het kortste pad) in het netwerk bepaald worden tussen een herkomst en een bestemming. Er bestaan veel kortste pad algoritmen. Wij behandelen hier één van de bekendste en meest toegepaste, namelijk het algoritme van Dijkstra. Stel dat we het kortste pad zoeken van knooppunt s naar knooppunt t in een netwerk. Het algoritme van Dijkstra bouwt nu een boom op (een kortste routeboom) beginnend vanuit s. Daarom wordt dit algoritme ook wel een “tree builder” algoritme genoemd. Startend vanuit s bewegen we ons door het netwerk waarbij we elk bezocht knooppunt u voorzien van een label L(u). Het label L(u) geeft de lengte weer van het voorlopig ontdekte kortste pad van s naar u. De labels zijn aanvankelijk voorlopig en kunnen in de loop van het algoritme worden gewijzigd als we een pad vinden korter dan de huidige waarde van L(u). Als een label niet meer gewijzigd zal worden (knooppunt niet meer aanwezig in verzameling T in onderstaand algoritme) heet het een definitief label. In onderstaand algoritme is:
V T s t u, v e
de verzameling van alle knooppunten de verzameling van alle knooppunten met een voorlopig label het herkomst knooppunt het bestemmingsknooppunt algemene aanduidingen voor een knooppunt algemene aanduiding voor een schakel
94
Het algoritme luidt: L(s) : = 0 en voor alle v ∈ V, v ≠ s : L(v) = ∞ T:=V Laat u ∈ T waarvoor L(u) minimaal is: Als L(u) = ∞ dan stop; er is geen oplossing. Als u = t dan T := T - {u} en stop; (L(t) is lengte kortste pad van s naar t) Voor elke schakel e van u naar v ∈ T : Als L(v) > L(u) + lengte(e) dan L(v) := L(u) + lengte(e) T := T - {u} en ga naar stap 3.
stap 1: stap 2: stap 3:
stap 4: stap 5:
In de stappen 1 en 2 vindt de initialisatie plaats. Vervolgens doorloopt het algoritme in een aantal iteraties telkens de stappen 3-5, waarbij in elke iteratie het knooppunt met het laagste voorlopige label definitief wordt gemaakt, nadat eerst de labels van alle daaraan verbonden knooppunten met een voorlopig label zijn aangepast. B
2
E
7
15
3
7
6
F H
9
C
A
9 7
4
6 3
D
4
G
.
Figuur 8-1 Netwerk voorbeeld kortste route algoritme Dijkstra.11 Voorbeeld: Wij illustreren het algoritme aan de hand van de bepaling van het kortste pad tussen A en H in het netwerk van Figuur 8-1 Initialisatie: Knooppunt A krijgt het label 0, alle andere het label oneindig.
95 Iteratie 1: L(A) = 0 is minimaal. Aan de knooppunten B, C en D (verbonden aan A) worden de voorlopige labels 2, 6 en 7 gegeven. Knooppunt A wordt nu definitief gemaakt, dat wil zeggen verwijderd uit de verzameling T. Iteratie 2: Nu is L(B) = 2 minimaal. De knooppunten E, F en C zijn verbonden met B. We zetten nu L(E) = 9 en L(F) = 17 . Knooppunt C heeft al het voorlopige label L(C) = 6. Omdat dit voorlopige label groter is dan L(B) + 3 wordt L(C) vervangen door de nieuwe voorlopige waarde 5. Knooppunt B wordt nu definitief met L(B) = 2 en verwijderd uit de verzameling T. Iteratie 3: Nu heeft knooppunt C uit de verzameling T het laagste label. We inspecteren de schakels vanuit C, passen eventueel de labels aan van de knooppunten verbonden met C en maken het label van C definitief. We herhalen dit proces tot tenslotte L(H) een definitieve labelwaarde heeft. Deze labelwaarde (14) geeft de lengte aan van het kortste pad van A naar H. In Tabel 8-1 is het verloop van het algoritme aangegeven. Definitieve labels zijn onderstreept.
A 0 0 0 0 0 0 0 0
B ∞ 2 2 2 2 2 2 2
C ∞ 6 5 5 5 5 5 5
D ∞ 7 7 7 7 7 7 7
E ∞ ∞ 9 9 9 9 9 9
F ∞ ∞ 17 17 16 16 16 16
G ∞ ∞ ∞ 8 8 8 8 8
H ∞ ∞ ∞ ∞ ∞ 14 14 14
Iteratie initialisatie 1 2 3 4 5 6 7
Tabel 8-1 Oplossing voorbeeld kortste route bepaling. Als we bij het labelen van een knooppunt ook onthouden via welke schakel dit knooppunt het meest recent van een label is voorzien, weten we bij beëindiging van het algoritme ook uit welke schakels het kortste pad naar dit knooppunt bestaat. Bovenstaand algoritme stopt zodra we het bestemmingsknooppunt hebben bereikt. Als we het algoritme pas stoppen nadat alle knooppunten een definitief label hebben ontvangen, m.a.w. het leeg zijn van de verzameling T als stopcriterium nemen, wordt een kortste-routeboom vanuit het startpunt naar elk knooppunt van het netwerk opgebouwd.
8.1.2 Classificatie van toedelingsmodellen De vraag naar vervoer, gegeven als verplaatsingen per tijdseenheid in de HB-tabel, varieert in de tijd. Ook de netwerkeigenschappen kunnen, al dan niet als een functie van de vervoervraag, in de tijd variëren. Toedelingsmodellen kunnen allereerst worden ingedeeld worden naar de behandeling van dit tijdsaspect:
96 • Statische toedelingsmodellen nemen aan dat verkeersvraag en aanbod tijdsonafhankelijk zijn, en bovendien dat de vraag nergens in het netwerk de fysieke capaciteit van de schakels (langdurig) overschrijdt. De verkeersstromen in het netwerk die men uitrekent met deze statische modellen variëren dus niet in de tijd. Men drukt dit wel uit door te zeggen dat het verkeer aan de gehele route tussen herkomst en bestemming wordt toegedeeld. Andere namen die voor statische modellen worden gebruikt zijn steady-state of 2-dimensionale (2D) modellen. Een steady-state of eenparige stroom is een stroom die in de tijd niet verandert. De term 2D duidt erop dat een toedeling plaatsvindt in het ruimtelijke 2-dimensionale vlak van het netwerk, en dat de dimensie tijd niet in de beschouwingen wordt betrokken. • Dynamische toedelingsmodellen houden wel rekening met een variatie in de verkeersvraag, eventueel variërende eigenschappen van het netwerk en mogelijke overschrijdingen van de fysieke capaciteit van schakels. Het resultaat is dat stromen op de schakels van het netwerk worden berekend die in de tijd variëren. Dynamische modellen worden ook wel 3D of 3-dimensionale modellen genoemd. De dynamische modellen zijn nog volop in ontwikkeling en worden in de praktijk nog niet veel gebruikt. In deze cursustekst beperken wij ons tot statische toedelingsmodellen, waarmee een zeer lange ervaring is opgebouwd De eenvoudigste toedelingsmethode is het alles of niets toedelingsmodel. Bij deze methode worden alle verplaatsingen per tijdseenheid aan één route toegedeeld, namelijk de kortste route. Er wordt geen rekening gehouden met veranderingen in de weerstand onder invloed van de belasting van het netwerk. Er wordt bij dit model verondersteld dat elke verkeersdeelnemer volledige kennis heeft van de weerstanden van alle mogelijke routes en ze op dezelfde wijze beoordeelt. In werkelijkheid ziet men dat meerdere routes tussen een herkomst en bestemming worden gebruikt, ook als het netwerk niet zwaar belast is. De reden is dat niet elke verkeersdeelnemer volledig op de hoogte is van alle weerstanden in het netwerk. Bovendien worden de weerstanden van de schakels door verschillende verkeersdeelnemers verschillend beoordeeld. Men kan dit effect in rekening brengen door aan te nemen dat er sprake is van een kansverdeling in de perceptie van weerstanden in de populatie van verkeersdeelnemers. Dit leidt tot de groep van stochastische toedelingsmodellen. Er wordt rekening gehouden met onvolledige en variërende kennis van de verkeersdeelnemers van de weerstanden in het netwerk. Men kan dit op twee manieren doen. De eerste methode maakt gebruik van theoretische kanscurves om het verkeer over alternatieve routes te leiden; de tweede maakt gebruik van simulatie. Evenals bij de alles-of-niets methode wordt bij de bovengenoemde stochastische modellen geen rekening gehouden met veranderingen in de weerstanden onder invloed van overbelasting van het netwerk (congestie). Modellen die wél rekening houden met de verandering in de weerstand van een schakel als gevolg van de verkeersbelasting heten evenwichtsmodellen. Een evenwichtsmodel wordt gebruikt voor het maken van toedelingen in wegennetwerken met congestie. Het belangrijkste kenmerk is dat de weerstand (meer in het bijzonder de tijdcomponent in de weerstand) van een schakel een functie is van de verkeersbelasting. Als de belasting op de schakels die oorspronkelijk de kortste route
97 vormden toeneemt, zal het verkeer alternatieve routes zoeken. Uiteindelijk zal een evenwicht ontstaan waarbij geen enkele verkeersdeelnemer door individuele actie zijn reistijd kan verbeteren door een andere route te kiezen. Met individuele actie wordt bedoeld: zonder overleg, samenwerking of afspraken met anderen. Het is dit evenwicht, geformuleerd door Wardrop in 1952 (1e principe van Wardrop), dat evenwichtsmodellen trachten te berekenen. Wardrop heeft nog een tweede type evenwicht, het zogenaamde systeemoptimale evenwicht, geformuleerd dat later in dit hoofdstuk aan de orde zal komen. Tenslotte is er een combinatie mogelijk van het stochastische toedelingsmodel en het evenwichtsmodel. Stochastische evenwichtsmodellen verdisconteren zowel het effect van congestie als de verschillen in weerstandsperceptie van de verkeersdeelnemers. Stochastische effecten beschouwen? nee ja Capaciteitseffecten beschouwen?
nee
alles-of-niets toedeling
stochastische toedeling
ja
evenwichtstoedeling
stochastische evenwichtstoedeling
Tabel 8-2 Classificatie statische toedelingsmodellen.
8.1.3 Notaties Indexen i = j = a = r =
herkomst bestemming schakel van het netwerk route (opeenvolging van schakels)
Variabelen Tij = Tijr = cij = ca = = ca ~ = ca tij = ta = qa =
aantal verplaatsingen per tijdseenheid van i naar j aantal verplaatsingen per tijdseenheid van i naar j via route r weerstand (gegeneraliseerde reistijd) van i naar j weerstand (gegeneraliseerde reistijd) van schakel a systeemweerstand (= qa.ca) van schakel a. marginale systeemweerstand (= dca / dqa ) van schakel a reistijd van i naar j reistijd van schakel a aantal ritten per tijdseenheid op schakel a (intensiteit)
Het begrip weerstand is behandeld in het hoofdstuk over distributie. De weerstand van een verplaatsing wordt geschreven als een lineaire combinatie van de door de reiziger ervaren tijdsduur en kosten. In het geval van een netwerkschakel neemt men vaak een
98 lineaire combinatie van reistijd en lengte van de schakel. De lengte van de schakel is dan een maat voor reiskosten over die schakel.
8.1.4 Alles of niets toedeling De alles-of-niets toedeling is een zeer eenvoudige toedelingsmethode. Figuur 8-2 toont een voorbeeld.
Figuur 8-2 Voorbeeld alles-of-niets toedeling.2 Figuur 8-2a toont het netwerk met de weerstanden langs de schakels. De HB-tabel (bijvoorbeeld uitgedrukt in voertuigen per uur) die aan dit netwerk moet worden toegedeeld is de volgende:
99
A B
C 400 300
D 200 100
De verplaatsingen per tijdseenheid ('stromen') in de HB-tabel worden per relatie achtereenvolgens toegedeeld aan de kortste route voor die relatie. Ritstromen die op dezelfde schakel van het netwerk terechtkomen worden bij elkaar opgeteld. In Figuur 8-2b staan de kortste routebomen uit de knooppunten A en B aangegeven, met de toegedeelde verplaatsingen. Figuur 8-2c toont het eindresultaat van de toedeling. De alles-of-niets toedeling kan redelijke resultaten geven in een netwerk zonder congestie, met weinig alternatieve routes tussen een herkomst en een bestemming en waarbij dan deze weinige alternatieve routes bovendien onderling sterk verschillen in weerstand. De belangrijkste functie van een alles-of-niets toedeling echter is die van een bouwsteen in meer geavanceerde toedelingsmethodes, zoals uit het vervolg van dit hoofdstuk duidelijker zal worden.
8.1.5 Stochastische toedeling Beschouw een groep reizigers die zich willen verplaatsen van een gegeven herkomst naar een gegeven bestemming. Er is een groot aantal verschillende routes waaruit zij kunnen kiezen. Elke route wordt gekenmerkt door een zekere totale weerstand die objectief te meten is. Bij een alles-of-niets toedeling veronderstellen we dat iedereen de objectief kortste route zal nemen. Maar door verschillen in waarneming, kennis en andere factoren zal er binnen de groep een spreiding zijn in de beoordeling van de verschillende weerstanden. Het gevolg is dat er eveneens een spreiding zal optreden in de gevolgde routes. Het is dit effect dat een stochastische toedeling in rekening probeert te brengen. Er zijn in principe twee groepen methodes waarmee dit gedaan kan worden: 8.1.5.1 Stochastische toedelingsmodellen met theoretische verdelingsfuncties. Deze methodes gebruiken een theoretisch kansmodel, zoals bijvoorbeeld een logitmodel, om de reizigers over de alternatieve routes te verdelen. Er zijn een aantal problemen aan deze methodes verbonden. Het eerste probleem betreft de definitie van de alternatieve routes. Bij realistische netwerken is het aantal verschillende routes tussen een herkomst en een bestemming over het algemeen zeer groot. Het is praktisch niet mogelijk al deze alternatieven bij een theoretisch kansmodel in beschouwing te nemen. Bij sommige van de onderhavige methodes tracht men dan ook zogenaamde redelijke routes te bepalen. Er zijn weer een aantal methodes waarop men dit kan doen. Men kan bijvoorbeeld niet alleen de kortste route bepalen, maar ook de op één na kortste, de op twee na kortste enz. Een andere methode om een redelijke route te bepalen is de volgende: men definieert een redelijke route als een opeenvolging van knooppunten, waarbij elk volgend knooppunt verder weg ligt van de herkomst en dichterbij de bestemming. Buiten het feit dat deze methodes nogal arbitrair zijn, zijn de benodigde algoritmes ook vrij complex.
100 Het tweede probleem is dat de methodes die steunen op theoretische kansmodellen gevoelig zijn voor de wijze waarop het netwerk is gedefinieerd. De moeilijkheden waarop men kan stuiten bij de toepassing van het logitmodel voor routekeuze zijn geïllustreerd in hoofdstuk 3.6. Zij houden verband met de veronderstelling van identieke en onafhankelijke stoortermen bij de afleiding van het logitmodel. Vanwege de bovengenoemde problemen wordt de stochastische toedeling op basis van theoretische kanscurves niet veel meer toegepast, en zij blijft in deze tekst dan ook verder buiten beschouwing.
8.1.5.2 Stochastische toedelingsmodellen gebaseerd op simulatie Deze modellen hebben als belangrijkste kenmerk dat de weerstand van een schakel door loting (Monte Carlo simulatie) wordt bepaald. De beperkte kennis van de verkeersdeelnemers omtrent het verkeerssysteem kan gemodelleerd worden door de schakelweerstanden als stochastische grootheden te definiëren. Ca = c a + ε a
De subjectieve weerstand Ca van een schakel is een stochastische variabele en is gelijk aan de objectief meetbare weerstand ca vermeerderd met een stochastische stoorterm εa. Voor de gemiddelde waarde van de stoorterm geldt E(εa ) = 0, zodat ca de gemiddelde waarde is van de subjectieve weerstand Ca. De objectieve weerstand ca kan geïnterpreteerd worden als de weerstand die we gebruikten in de alles-of-niets toedelingsmethode. Voor de vorm van de kansverdelingen van de stoortermen wordt vaak een Normale verdeling genomen. Belangrijker dan de vorm van de kansverdeling is echter de specificatie van de variantie van de stoorterm. Om ervoor te zorgen dat de variantie op routeniveau onafhankelijk is van de netwerkcodering is het noodzakelijk dat de variantie evenredig is met de schakelweerstand, ofwel de spreiding evenredig met de wortel uit de schakelweerstand. Rekening houdend met bovenstaande opmerkingen over vorm en variantie van de kansverdeling van de stoorterm komt men tot de volgende veel gebruikte formule voor de schakelweerstand:
Ca = ca + z ϕ ca met: ca z
ϕ Ca
= de objectief meetbare schakelweerstand = random getal uit een (pseudo) normale N(0,1)-distributie = een factor voor de bepaling van de grootte van de variantie. = met loting bepaalde subjectieve schakelweerstand
8.1.5.3 Algoritme voor de stochastische toedeling Het algoritme voor de stochastische toedeling op basis van simulatie komt nu op het volgende neer. Aan de hand van bovenstaande formule loten we, met behulp van een toevalsgenerator, voor elke schakel van het netwerk een realisatie van de subjectieve
101 schakelweerstand. Op het ontstane netwerk met subjectieve schakelweerstanden doen we een alles-of-niets toedeling. Dit herhalen we een aantal malen. Vanwege het kanselement zullen de kortste routes door het netwerk bij elke trekking variëren, waardoor er een spreiding van de verkeersstromen over een aantal routes ontstaat. De gewenste stochastische toedeling verkrijgen we door het gemiddelde te nemen van een aantal aldus uitgevoerde alles-of-niets toedelingen. Men kan het aantal iteraties op een van te voren gekozen getal N vastleggen, door na elke trekking van de subjectieve schakelweerstanden 1/N van het totale verkeersvolume uit de HB-tabel met een alles-of-niets toedeling aan het netwerk toe te delen en de verkregen toedelingen bij elkaar op te tellen. Beter is echter het onderstaande algoritme, waarbij na elke trekking van de subjectieve schakelweerstanden het gemiddelde genomen wordt van de tot dan toe verkregen alles-of-niets toedelingen van de gehele HB-tabel. Men herhaalt dit proces totdat aan een stopcriterium is voldaan. Het stopcriterium kan bijvoorbeeld zijn dat de na een iteratie verkregen stromen niet noemenswaard meer afwijken van de in de vorige iteratie berekende stromen. Men zegt dan dat convergentie is bereikt. i=0 qa(i) = 0 herhaal i=i+1 Bepaal Ca door loting Bepaal stromen Qa met een alles-of-niets toedeling met weerstanden Ca φ=1/i qa(i) = (1 - φ) qa(i-1) + φ Qa tot stopcriterium = waar Het effect van φ= 1 / i in bovenstaand algoritme is dat elke nieuw berekende qa(i) het gemiddelde is van alle tot dan toe gelote stromen Qa .
8.1.6 Evenwichtstoedeling In het bovenstaande hebben we de verschillen tussen individuele weggebruikers in rekening gebracht door een stochastische toedeling. Hiermee kan verklaard worden waarom weggebruikers verschillende routes kiezen in overigens gelijke omstandigheden. Dat komt omdat niet iedereen dezelfde opvatting heeft over wat de kortste route is. Er is echter nog een andere reden waarom het verkeer tussen een bepaald herkomstbestemmingspaar zich over meerdere routes verdeelt. De reistijd, en dus de weerstand van een aanvankelijk kortste route wordt namelijk groter zodra er verkeer op komt. De weerstand van deze aanvankelijk kortste route kan zodanig toenemen dat ook andere routes voor de rit in aanmerking komen. Dat is het onderwerp van deze paragraaf. Let erop dat er in deze paragraaf van wordt uitgegaan dat er geen verschillen zijn tussen de weggebruikers! Er is dus geen sprake van stochastiek. Wat we hier gaan behandelen heet daarom ook wel een deterministische evenwichtstoedeling.
102
8.1.6.1 Gebruikersoptimale en systeemoptimale evenwichtstoedeling Als de belasting op een schakel van het netwerk toeneemt wordt ook de weerstand van een schakel groter. Hoe dat tot de notie van evenwicht in transportnetwerken leidt kan aan de hand van een voorbeeld verduidelijkt worden. Veronderstel dat het aantal verkeersdeelnemers dat zich van een gegeven herkomst naar een gegeven bestemming wil verplaatsen bekend is. Neem ook aan dat de herkomst en bestemming door meerdere routes met elkaar verbonden zijn. Hoe zullen de verkeersdeelnemers zich over deze routes verdelen? Als zij allemaal de kortste route zouden nemen (gerekend over het nog onbelaste netwerk) dan zou zich op deze route congestie kunnen ontwikkelen. Daardoor zou de reisweerstand langs die route toenemen tot het punt waar die route niet meer de kortste route zou zijn. Sommige verkeersdeelnemers zouden een alternatieve route kiezen. Op die alternatieve route kan zich eventueel ook weer congestie ontwikkelen enz. Uiteindelijk ontstaat een evenwicht, voor het eerst in 1952 geformuleerd door Wardrop (1e principe van Wardrop): Het verkeer verdeelt zich zodanig over de schakels van een netwerk dat een evenwicht ontstaat waarin geen individuele verkeersdeelnemer zijn reisweerstand kan verminderen door het kiezen van een andere route. Als alle verkeersdeelnemers een volledige kennis hebben van de weerstanden op alle schakels (ook die zij niet zelf gebruiken), en zij bovendien die weerstanden op dezelfde wijze beoordelen impliceert het bovengenoemde 1e principe van Wardrop: In de evenwichtssituatie hebben alle gebruikte routes tussen een gegeven herkomst en bestemming dezelfde weerstand, en hebben niet gebruikte routes een hogere weerstand.. Het eerste principe van Wardrop beschrijft de verkeersstromen die ontstaan als elke gebruiker op individuele basis streeft naar minimalisering van zijn reisweerstand. Het is een beschrijvend principe. De verdeling van verkeersstromen die ontstaat heet een deterministisch gebruikersevenwicht of deterministische gebruikersoptimale evenwichtstoedeling. De term deterministisch duidt erop dat niet van stochastische schakelweerstanden gebruik is gemaakt. Vermenigvuldigen we de weerstand op een schakel met de intensiteit op die schakel dan verkrijgen we de systeemweerstand ca op die schakel. Het is de weerstand ondervonden door alle voertuigen gezamenlijk op de schakel:
ca = qa ca Sommatie van de systeemweerstand over alle schakels van het netwerk leidt tot de totale systeemweerstand van het netwerk. Omdat de reistijd en/of reisafstand meestal de belangrijkste componenten in de weerstand zijn, is de totale systeemweerstand een goede maat bijvoorbeeld voor het totale brandstofverbruik (en de daardoor veroorzaakte milieuvervuiling) van alle voertuigen gezamenlijk op het gehele netwerk: ctotaal = ∑ qa ca a
Bij elke toedeling behoort een totale systeemweerstand. Men kan dus bijvoorbeeld de totale systeemweerstand berekenen die behoort bij een deterministische gebruikersoptimale evenwichtstoedeling. Stel nu dat men een HB-tabel zodanig aan
103 het netwerk toedeelt dat de totale systeemweerstand wordt geminimaliseerd. Een dergelijke verdeling van het verkeer over de schakels van het netwerk heet een systeemoptimale evenwichtstoedeling. Ook hier is sprake van een evenwicht, zij het dat nu niet alle gebruikte routes tussen eenzelfde herkomst en bestemming dezelfde weerstand hebben, maar dezelfde marginale systeemweerstand. Wij komen hierop terug in paragraaf 8.1.6.4. Ook deze verkeersstroomverdeling overeenkomstig de systeemoptimale evenwichtstoedeling werd reeds beschreven door Wardrop en wordt wel aangeduid als het 2e principe van Wardrop. Het 2e principe van Wardrop is geen beschrijvend maar een normatief principe. Een verdeling volgens het tweede principe voldoet aan een bepaalde opgelegde norm, namelijk minimalisering van de totale systeemweerstand.. Men spreekt van congestie-vrije netwerken als er geen invloed is van de verkeersbelasting op de reistijd en dus op de reisweerstand. Dit is over het algemeen bij benadering het geval bij lage verkeersbelastingen of bij zeer hoge capaciteiten van de netwerkschakels. In paragraaf 8.1.6.4 zal worden aangetoond dat in congestie-vrije netwerken de gebruikersoptimale toedeling en de systeemoptimale toedeling met elkaar overeenkomen. Beide zijn dan gelijk zijn aan de verdeling die men berekent met een alles-of-niets toedeling. Als er wel sprake is van congestie zijn beide verkeersstroomverdelingen verschillend. De totale systeemweerstand zal bij een gebruikersoptimale toedeling hoger zijn dan bij de systeemoptimale toedeling. In netwerken met congestie zal van nature een evenwicht volgens het eerste principe van Wardrop tot stand komen, omdat dit principe het gebruikelijke menselijke gedrag beschrijft. Een verdeling van de verkeersstromen volgens de systeemoptimale toedeling (vanuit maatschappelijk oogpunt gewenst, in verband met beperking van brandstofgebruik en milieuvervuiling) representeert geen stabiel evenwicht. Het is bijvoorbeeld mogelijk dat bij een dergelijke stroomverdeling individuele verkeersdeelnemers hun reisweerstand kunnen verkleinen door eenzijdig (onafhankelijk van anderen) een andere route te nemen. Een systeemoptimale verdeling van de verkeersstromen zal dan ook door speciale verkeersmaatregelen (bijvoorbeeld tolheffing) moeten worden afgedwongen. Om het contrast tussen beide toedelingen te benadrukken noemt men soms de gebruikersoptimale toedeling een zelfzuchtig optimum, en de systeemoptimale toedeling een sociaal optimum.
8.1.6.2 Reistijdfuncties Een toename van de verkeersbelasting op een schakel leidt tot een toename van de reistijd en dus tot een toename van de weerstand op een schakel. Bij stedelijke netwerken gaat het hierbij niet zozeer om de congestie-effecten op de schakel zelf, maar vooral om het oponthoud bij kruispunten. Het verband tussen belasting en reistijd wordt weergegeven door een reistijdfunctie. Een van de meest gebruikte functies is de BPR-functie (Bureau of Public Roads): β
ta = t
free flow a
q (1 + α a ) cap
Hierin is: ta
=
reistijd op schakel a (inclusief kruispuntvertraging)
104 tafree flow cap = α, β =
= reistijd op schakel a bij onbelast netwerk (“free flow”) “praktische” capaciteit van schakel a empirisch bepaalde coëfficiënten
Gebruikelijke waarden voor de coëfficiënten zijn α = 0.15 en β = 4. Let erop dat bij deze waarde van α de praktische capaciteit in bovenstaande formule die intensiteit is waarbij de reistijd op de schakel 15% hoger is dan de reistijd in onbelaste toestand. De praktische capaciteit is dus iets anders dan de maximale capaciteit van een schakel, die overeenkomt met de maximale verkeersstroom die een schakel kan verwerken. Een reistijdfunctie vertoont gewoonlijk bij lage belastingen een licht stijgend verloop, om daarna bij overschrijding van de praktische capaciteit zeer sterk toe te nemen. Omdat wij rekenen met de weerstand en niet met de reistijd, dient nog een omrekening plaats te vinden naar gegeneraliseerde reistijd. Het resultaat is de volgende functie die we om traditionele redenen ook reistijdfunctie zullen blijven noemen. Het betreft nu echter verlies in gegeneraliseerde reistijd. ca = ca(qa)
8.1.6.3 Algoritme voor de gebruikersoptimale evenwichtstoedeling Algoritmes om evenwichtstoedelingen te berekenen noemt men wel capacity restraint algoritmes. Er wordt een iteratieve procedure gebruikt. In feite wordt een reeks van alles-of-niets toedelingen toegepast, waarbij in een nieuwe iteratie de weerstanden worden gebruikt die bij de toedeling in de vorige iteratie zijn verkregen. Vroeger paste men de incremental assignment methode toe, waarbij steeds een fractie van de HBtabel op het netwerk werd “geladen”, totdat de complete tabel was toegedeeld. Beter is onderstaand algoritme waarbij per iteratie de complete HB-tabel aan het netwerk wordt toegedeeld. Om ervoor te zorgen dat het algoritme convergeert (d.w.z. dat de uitkomsten van een iteratie steeds minder gaan verschillen van de uitkomsten uit de vorige iteratie) is het nodig een wegingsfactor te gebruiken, waarbij de uitkomsten van de vorige iteratie(s) gewogen worden meegeteld in de volgende iteratie. i=0 qa(i) = 0 herhaal i=i+1 Bepaal ca met reistijdfunctie: ca = ca( qa(i-1)) Bepaal stromen qa+ met een alles-of-niets toedeling met weerstanden ca Bepaal wegingsfactor φ (0 < φ < 1) (zie onder) qa(i) = (1 - φ) qa(i-1) + φ qa+ tot stopcriterium = waar
Wegingsfactor De wegingsfactor φ in bovenstaand algoritme wordt gebruikt om de nieuwe schakelbelastingen te bepalen als combinatie van de stromen die berekend zijn in de vorige iteratie en de alles-of-niets belastingen van de huidige iteratie.
105 Er zijn verschillende mogelijkheden voor de wegingsfactor: • Vaste wegingsfactor Bijvoorbeeld: φ = 0.5 Dit is de eenvoudigste methode. Convergentie is echter niet gegarandeerd, en als het algoritme al convergeert dan neemt dit zeer veel iteraties in beslag. • Afnemende wegingsfactor Bijvoorbeeld: φ = 1 / (i + 0.5) of φ = 1 / i Bij gebruik van φ = 1 / i spreekt men van de Method of Successive Averages (MSA). Het effect van een dergelijke wegingsfactor is dat de nieuwe stromen het gemiddelde zijn van de alles-of-niets toedelingen van alle tot dusverre gedane iteraties. Deze methode geeft ongeveer dezelfde resultaten als de methode met de optimale wegingsfactor (zie hierna), maar vergt in het algemeen meer rekentijd dan de optimale wegingsfactor. • Optimale wegingsfactor Bovengenoemde mogelijkheden voor de wegingsfactor hebben de volgende nadelen. Bij een vaste wegingsfactor is convergentie van het algoritme niet gegarandeerd en het algoritme is niet efficiënt. Bij een afnemende wegingsfactor convergeert het algoritme wel, maar de methode is nog steeds niet efficiënt. Een optimale wegingsfactor waarbij convergentie gegarandeerd is en die bovendien zeer efficiënt is, is gebaseerd op het Frank-Wolfe algoritme. Het Frank-Wolfe algoritme heeft te maken met het oplossen van een minimaliserings-probleem. Wat het oplossen van een minimaliserings-probleem te maken heeft met bepalen van een evenwichtstoedeling zal nu eerst behandeld worden in de volgende paragraaf. Beckman transformatie; evenwichtstoedeling als minimaliserings-probleem De Wardrop condities voor gebruikersevenwicht kunnen geschreven worden als: cijr = cij cijr ≥ cij
als als
Tijr > 0 Tijr = 0
De schakelbelastingen zijn:
qa = ∑ Tijr δijra
waarin:
δijra = 1 of δijra = 0
ijr
De parameters δijra geven aan of een route r tussen i en j wel of niet gebruik maakt van schakel a. De totale weerstand tussen i en j op route r kan geschreven worden als:
cijr = ∑ ca ( qa ) δijra a
In het bovenstaande is het gebruikersevenwicht van Wardrop beschreven in de vorm van een groot aantal wiskundige vergelijkingen. Oplossing van deze vergelijkingen geeft de oplossing van het evenwichtsprobleem, en dus de waarde van de stromen op alle schakels. Hier treedt echter een moeilijkheid op: het oplossen van een stelsel bestaande uit een groot aantal (niet-lineaire) vergelijkingen is in de numerieke wiskunde een zeer moeilijk probleem. Moeilijk betekent in deze context dat bestaande
106 iteratieve oplossingstechnieken soms niet convergeren, of als ze wel convergeren, zeer lang duren. We gebruiken nu een in de numerieke wiskunde veel toegepaste “truc”. Het probleem van het oplossen van de vergelijkingen die volgen uit de condities van Wardrop wordt getransformeerd naar het oplossen van een equivalent optimalisatieprobleem. Daarmee wordt bedoeld dat het oplossen van het optimalisatieprobleem ons tegelijkertijd de oplossingen geeft van het oorspronkelijke stelsel vergelijkingen. Waarom wordt dit gedaan? Het wordt gedaan omdat het vinden van een optimum (een maximum of minimum) van een doelfunctie een numeriek veel eenvoudiger probleem is waarvoor talrijke algoritmen bestaan. Intermezzo Stel we moeten een functie w = f(x,y) optimaliseren. We kunnen dit doen door de afgeleiden naar x en y te nemen en die nul te stellen: ∂w / ∂x = 0 ∂w / ∂y = 0 Vervolgens lossen we dit stelsel van twee simultane vergelijkingen op en vinden daarmee de waarden voor x en y waarvoor de functie w een optimale waarde krijgt. Uit dit voorbeeld blijkt dat een optimalisatieprobleem kan worden getransformeerd naar het oplossen van een stelsel vergelijkingen. Omgekeerd geldt ook dat het oplossen van een stelsel vergelijkingen kan worden getransformeerd naar het optimaliseren van een doelfunctie. De doelfunctie is die functie waarvan de afgeleiden juist de op te lossen vergelijkingen zijn. Beckman transformatie Beckman heeft in 1956 aangegeven, redenerend langs de lijnen zoals geschetst in bovenstaand intermezzo, dat het oplossen van de Wardrop vergelijkingen voor gebruikersevenwicht equivalent is aan het volgende minimaliserings-probleem: qa
min qa
∑ ∫ c ( q )dq a
a
0
onder de voorwaarden:
∑T
r ij
= Tij
r
Deze uitdrukking geeft aan dat de evenwichtsstromen qa verkregen worden door ze zodanig te kiezen dat de som over alle schakels van de oppervlakten onder de reistijdfuncties van 0 tot qa minimaal is. We keren nu terug naar het bepalen van de optimale wegingsfactor. Bij de beschrijving van het algoritme voor de gebruikersoptimale evenwichtstoedeling hebben we gezien dat het resultaat van een iteratie geschreven wordt als: qa(i) = (1 - φ) qa(i-1) + φ qa+ Het Frank-Wolfe algoritme nu is een algoritme dat een optimale wegingsfactor φ bepaalt, namelijk zodanig dat in elke iteratie een zo groot mogelijke daling in de
107 waarde van bovenstaande te minimaliseren doelfunctie wordt bewerkstelligd. Voor meer details over de werking van het Frank-Wolfe algoritme wordt verwezen naar Sheffi (1985)10.
8.1.6.4 Algoritme voor de systeemoptimale evenwichtstoedeling Zoals behandeld in paragraaf 8.1.6.1 is de systeemoptimale toedeling die toedeling van stromen aan het netwerk, waarbij de totale systeemweerstand wordt geminimaliseerd. We moeten dus het volgende minimaliseringsprobleem oplossen: min qa
∑ q ∗ c (q a
a
a
)
a
Nu geldt in het algemeen voor een differentieerbare functie f(q) met f(0)=0: qa
f ( qa ) =
∫ f ′( q ) dq
waar f′(q) de afgeleide is van f(q).
0
Dit toegepast op bovenstaande doelfunctie leidt tot het volgende minimaliseringsprobleem: qa
min qa
∑ ∫ c~ ( q ) dq a
a
0
waarin:
d c~a ( q ) = ( q∗ ca ( q )) dq
De functie c~a ( q ) heet de marginale systeemweerstandsfunctie voor schakel a, en kan worden geïnterpreteerd als de toename van de systeemweerstaand op schakel a (dus de weerstand ondervonden door alle verkeersdeelnemers gezamenlijk), bij een kleine intensiteitstoename van q naar q + dq op schakel a. Als er zich één nieuwe reiziger op schakel a aandient neemt de weerstand toe op de schakel. Hiervan ondervindt niet enkel de nieuwe reiziger hinder, maar ook alle verkeersdeelnemers die zich reeds op de schakel bevonden. Bovenstaande te minimaliseren doelfunctie toont een treffende overeenkomst met de doelfunctie die we moesten minimaliseren om een gebruikersoptimale evenwichtstoedeling te vinden. Het enige verschil is dat de reistijdfunctie ca(q) is vervangen door de marginale systeemweerstandsfunctie c~a ( q ) . Dit betekent dat we voor het bepalen van een systeemoptimale toedeling het algoritme van de gebruikersoptimale evenwichtstoedeling kunnen toepassen, zoals beschreven in paragraaf 8.1.6.3, met dien verstande dat we ca(q) dienen te vervangen door c~a ( q ) . Het betekent ook dat bij een systeemoptimale evenwichtstoedeling niet de normale weerstand (zoals bij een gebruikersoptimale toedeling), maar de marginale systeemweerstand gelijk is voor alle gebruikte routes tussen eenzelfde herkomst en bestemming (en voor niet-gebruikte routes is de marginale systeemweerstand hoger). We kunnen nu ook inzien dat bij congestie-vrije netwerken (dat wil zeggen netwerken waarbij voor alle schakels geldt dat er geen invloed is van de verkeersbelasting op de weerstand) de gebruikersoptimale toedeling en systeemoptimale toedeling aan elkaar
108 gelijk zijn. In dat geval immers is ca(q) een constante functie, en is ca ( q ) = c~a ( q ) voor alle q.
8.1.6.5 Uitgewerkt numeriek voorbeeld evenwichtstoedeling De begrippen die een rol spelen bij de evenwichtstoedeling zullen in een uitgebreid voorbeeld, ontleend aan Ortúzar en Willumsen2 , worden behandeld. In Figuur 8-3 is een eenvoudig netwerk gegeven. De plaatsen a en b zijn verbonden door de schakels 1 en 2. Aangegeven zijn de reistijdfuncties voor de twee schakels, die ook in een grafiek zijn getekend. (De reistijdfuncties zijn met opzet eenvoudig gehouden om de berekeningen overzichtelijker te maken.) Het aantal verplaatsingen van a naar b bedraagt Tab. Omdat het netwerk zo eenvoudig is kunnen de berekeningen analytisch worden uitgeschreven. Bij meer gecompliceerde netwerken is dit niet meer te doen, en dient het iteratieve algoritme uit paragraaf 8.1.6.3 (geïmplementeerd in een computerprogramma) te worden toegepast. 1 Tab
a
b
Tab
2
c1 = 10 + 0.02 q1 c2 = 15 + 0.005 q2 40 35 30
1
c a (min)
25 20
2
15 10 5 0 0
200
400
600
800
1000
1200
1400
q a (vrt/uur )
Figuur 8-3 Voorbeeld evenwichtstoedeling.
Vraag 1: Bereken de intensiteiten op de twee schakels voor verschillende waarden van Tab. a.
Tab < 250
109 Het is duidelijk dat voor Tab < 250 al het verkeer gebruik maakt van schakel 1. In dat geval is namelijk de weerstand c1 < 15, en dat is kleiner dan de weerstand die ooit bereikt kan worden op schakel 2. b. Tab > 250 Zodra Tab > 250 zal het verkeer zich over beide routes verdelen, en wel zodanig dat de weerstanden over beide routes aan elkaar gelijk zijn (1e principe van Wardrop) en de som van beide stromen gelijk is aan Tab. Stel bijvoorbeeld Tab = 2000 dan geldt:
10 + 0.02q1 = 15 + 0.005q2 q1 + q2 = 2000 waaruit volgt: q1 = 600, q2 = 1400 en c1 = c2 = 22. Deze oplossing is in de grafiek in Figuur 8-3 aangegeven.
Vraag 2: Bepaal voor Tab = 2000 de gebruikersoptimale toedeling met de Beckman transformatie.
We moeten oplossen: q1
q2
min q1,q 2 { ∫ (10 + 0.02q )dq + ∫ (15 + 0.005q )dq } = 0
0 2 1
min q1 ,q2 { 10q1 + 0.01q + 15q2 + 0.0025q22 } = min q1 { 10q1 + 0.01q12 + 15 ( 2000 − q1 ) + 0.0025 ( 2000 − q1 ) 2 } Door differentiëren en nul stellen van de afgeleide vinden we dat de doelfunctie minimaal is voor q1 = 600. Dus q2 = 1400 en c1 = c2 = 22. Dit is dezelfde oplossing als we vonden in vraag 1b. Voor dit eenvoudige geval kunnen we ook grafisch laten zien dat de evenwichtsstromen verkregen worden door ze zodanig te kiezen dat de som van de oppervlakten onder de reistijdfuncties minimaal is, zoals uiteengezet bij de behandeling van de Beckman transformatie. Zie daartoe Figuur 8-4. De twee reistijdfuncties zijn weergegeven in één grafiek, waarbij de horizontale as van twee schalen in tegengestelde richtingen is voorzien, zodanig dat de som van de stromen q1 en q2 gelijk is aan 2000. Het is gemakkelijk in te zien dat de som van de oppervlakten onder de reistijdfuncties minimaal is voor c1 = c2, met bijbehorende q1 = 600 en q2 = 1400. Bij een andere combinatie van stromen, bijvoorbeeld q1 = q2 = 1000, neemt de som van de oppervlakten toe met het verticaal gearceerde deel.
110
Figuur 8-4 Oppervlakte onder reistijdfuncties.2
Vraag 3: Bereken de systeemoptimale toedeling voor Tab = 2000.
De systeemweerstanden op de schakels zijn:
c1 = q1 (10 + 0.02q1 ) c2 = q2 (15 + 0.005q2 ) De marginale systeemweerstanden zijn: dc c~1 = 1 = 10 + 0.04q1 dq1 dc c~2 = 2 = 15 + 0.01q2 dq2 Bij de systeemoptimale evenwichtstoedeling zijn de marginale systeemweerstanden langs beide routes gelijk aan elkaar (2e principe van Wardrop):
10 + 0.04q1 = 15 + 0.01q2 q1 + q2 = 2000 waaruit volgt: q1 = 500, q2 = 1500 en c~1 = c~2 = 30
111 Vraag 4: Bepaal voor Tab = 2000 de systeemoptimale toedeling met de Beckman transformatie.
We moeten oplossen: q1
q2
min q1,q 2 { ∫ (10 + 0.04q )dq + ∫ (15 + 0.01q )dq } = 0
0 2 1
min q1 ,q2 { 10q1 + 0.02q + 15q2 + 0.005q22 } = min q1 {10q1 + 0.02q12 + 15 ( 2000 − q1 ) + 0.005 ( 2000 − q1 )2 } Door differentiëren en nul stellen van de afgeleide vinden we dat de doelfunctie minimaal is voor q1 = 500. Dus q2 = 1500 en c~1 = c~2 = 30 . Dit is dezelfde oplossing als we vonden in vraag 3.
De resultaten van de berekeningen voor Tab = 2000 worden getoond in Tabel 8-3. Toegevoegd zijn de weerstanden, marginale weerstanden en systeemweerstanden voor de gebruikersoptimale en de systeemoptimale toedeling.
gebruikersoptimaal schakel 1 schakel 2 totaal Intensiteit Weerstand Marginale systeemweerstand Systeemweerstand
600 22 34
1400 22 29
2000
13200
30800
44000
systeemoptimaal schakel schakel 2 totaal 1 500 1500 2000 20 22.5 30 30 10000
33750
43750
Tabel 8-3 Resultaten voorbeeld evenwichtstoedeling Merk op dat bij de systeemoptimale toedeling de totale systeemweerstand 250 voertuig-kostenminuten per uur kleiner is dan de totale systeemweerstand bij de gebruikersoptimale toedeling. Hoewel dit vanuit maatschappelijk oogpunt gunstig is (brandstofbesparing enz.) kan de bijbehorende stroomverdeling over de schakels niet zonder extra maatregelen worden afgedwongen. Bij de systeemoptimale toedeling is immers de weerstand langs schakel 1 kleiner dan langs schakel 2, zodat sommige verkeersdeelnemers van schakel 2 hun route zullen veranderen naar schakel 1. Uiteindelijk ontstaat het evenwicht van de gebruikersoptimale toedeling, waarbij de weerstand langs beide routes gelijk is aan 22 minuten gegeneraliseerde reistijd.
112
8.1.7 Stochastische evenwichtstoedeling Bij de meest geavanceerde (en realistische) statische toedelingsmethode, namelijk de stochastische evenwichtstoedeling, is een variatie op het 1e principe van Wardrop van toepassing (geformuleerd door Daganzo in 1977): Het verkeer verdeelt zich zodanig over de schakels van een netwerk dat een evenwicht ontstaat waarin geen individuele verkeersdeelnemer meent dat hij zijn reisweerstand kan verlagen door eenzijdig (onafhankelijk van de overige verkeersdeelnemers) een andere route te kiezen. Let op het onderstreepte woord in bovenstaande formulering. Het gaat om de persoonlijke perceptie van de verkeersdeelnemer. De systeemweerstand bij een stochastische evenwichtstoedeling is hoger dan de systeemweerstand voor een deterministische evenwichtstoedeling, maar zal ertoe naderen naarmate de onzekerheid van de verkeersdeelnemers over de weerstanden in het netwerk afneemt. We geven direct het algoritme, dat bestaat uit een combinatie van de algoritmes van de evenwichtstoedeling en de stochastische toedeling. Het algoritme is identiek aan het algoritme van de evenwichtstoedeling, alleen is de stap “doe een alles-of-niets toedeling” vervangen door “doe een stochastische toedeling”. Hoe een stochastische toedeling te doen is eerder in dit hoofdstuk behandeld. i=0 qa(i) = 0 herhaal i=i+1 Bepaal ca met reistijdfunctie: ca = ca( qa(i-1)) Bepaal stromen qa+ met een stochastische toedeling met weerstanden ca Bepaal wegingsfactor φ ( 0 < φ < 1) qa(i) = (1 - φ) qa(i-1) + φ qa+ tot stopcriterium = waar Voor de bepaling van φ in bovenstaand algoritme kan de MSA methode worden gebruikt. Een snellere convergente kan worden verkregen door aanpassing van de met het Frank-Wolfe algoritme te minimaliseren doelfunctie. Zie Sheffi (1985)10.
8.2 Toedelingsmodellen voor openbaar vervoer netwerken Er is een essentieel verschil tussen een netwerk voor het openbaar vervoer en een netwerk voor privé vervoer, zoals een autonetwerk. Het openbaar vervoer netwerk is opgebouwd uit lijnen, waarop een dienst wordt onderhouden door een aantal voertuigen. De capaciteit van de lijn houdt verband met de passagierscapaciteit van de voertuigen en de frequentie waarmede de dienst wordt uitgevoerd.
8.2.1 Weerstanden in het openbaar vervoer De reistijd van een herkomst naar een bestemming per openbaar vervoer bestaat uit de volgende componenten:
113 • • • • •
voortransport van herkomst naar halte, wachttijd bij de halte, rijtijd in het voertuig, wachttijd bij het eventuele overstappen, natransport van halte naar bestemmingsadres.
Deze componenten worden in het netwerk in rekening gebracht door de introductie van netwerkschakels voor het voor- en natransport en overstapschakels. Deze schakels hebben als attributen de reistijden ( lopen, fietsen enz.) verbonden aan voor- en natransport en overstappen en bovendien de wachttijden verbonden aan deze activiteiten. In het hoofdstuk over de distributie is al aan de orde gekomen dat, hoewel alle tijdcomponenten objectief in bijvoorbeeld minuten kunnen worden gemeten, zij niet alle op dezelfde wijze door de reiziger worden ervaren. Een minuut wachttijd bijvoorbeeld wordt door hem als een grotere weerstand gevoeld dan een minuut effectieve rijtijd in het voertuig Om de weerstanden te bepalen dient men bij de bovengenoemde tijdcomponenten nog de geldkosten, omgerekend naar gegeneraliseerde reistijd, op te tellen.
8.2.2 Wachttijden We gebruiken de volgende notaties: f h t w
λ
= = = = =
frequentie (voertuigen per tijdseenheid) intervaltijd tussen twee voertuigen ( = 1/f) rijtijd tussen twee haltes wachttijd vervoersvraag in reizigers per tijdseenheid
De wachttijd bij een halte die bediend wordt door één lijn is afhankelijk van de intervaltijd h tussen twee voertuigen (dus van de frequentie waarmee de dienst wordt onderhouden) en van de variantie in de intervaltijden .
Wachtende passagiers
λh1 λ tijd h1
h2
h3
Figuur 8-5 Wachtende passagiers bij een o.v.-halte.
114
Stel het aankomstpatroon bij de halte is λ reizigers per tijdseenheid, uniform over de tijd verdeeld. Beschouw nu K intervaltijden. De gesommeerde wachttijd W voor alle reizigers komt overeen met de oppervlakte van de driehoeken in Figuur 8-5: K
W = ∑ 12 λ hk2 k =1
Voor het aantal reizigers N dat arriveert bij de halte geldt: K
N = ∑ λ hk k =1
De gemiddelde wachttijd per reiziger is dus:
w=
1 2
K
K
k =1
k =1
∑ hk2 / ∑ hk
We kunnen dit als volgt als een functie van de gemiddelden van h2 en h schrijven:
w = 12 ( h 2 / h ) Een algemene uitdrukking voor de steekproefvariantie Sh2 is:
S h2 = h 2 − h
2
Hiermee kan de gemiddelde wachttijd geschreven worden als:
w = 12 ( h + S h2 / h ) Vaak wordt voor de gemiddelde wachttijd de halve intervaltijd genomen (bij een uniform over de tijd verdeelde aankomst van reizigers). Uit bovenstaande afleiding blijkt dat dit, strikt genomen, alleen geldt als de variantie van de intervaltijden gelijk aan nul is, ofwel bij een volkomen regelmatige dienstuitvoering. Als er een spreiding is in de intervaltijden is de gemiddelde wachttijd groter dan de helft van de gemiddelde intervaltijd! Voorbeeld: Stel: gemiddelde intervaltijd h = 10 min en standaarddeviatie S h = 10 , dus Sh2 = 10 Dan is: w =
1
2
*(10 + 10 / 10) = 5.5 min
Ondanks dit interessante resultaat, zal men in de meeste gevallen toch wel kunnen uitgaan van een redelijk regelmatige dienstuitvoering en dus van een gemiddelde wachttijd gelijk aan de halve intervaltijd. Als de lijnfrequentie laag is zullen de reizigers niet uniform verdeeld over de tijd bij de halte aankomen, maar zullen ze rekening houden met het verwachte vertrektijdstip
115 van de bus of de trein. Uit waarnemingen blijkt dat er een bovengrens aan de gemiddelde wachttijd is van 5 à 10 minuten, zeg 7.5 minuut.
Wachttijd bij parallelle lijnen Het kan zijn dat een traject tussen twee knooppunten bediend wordt door twee of meer lijnen. We geven een voorbeeld van het type redenering dat men in dat geval kan opzetten ter berekening van de gemiddelde wachttijden. Geval 1 Relatief het eenvoudigst is het geval wanneer de rijtijden tussen de twee haltes voor alle lijnen aan elkaar gelijk zijn. Het is dan gebruikelijk de gemiddelde wachttijd voor alle lijnen gelijk te stellen aan de halve intervaltijd behorende bij een frequentie f gelijk aan de som van de frequenties van de individuele lijnen. De passagiers bijvoorbeeld in lijn 1 zullen gemiddeld niet langer dan die tijd gewacht hebben, want in dat geval was het voordeliger geweest één van de andere lijnen te nemen. Merk echter op dat bovenstaande benadering tot foutieve resultaten leidt indien de lijnen op vaste tijdstippen na elkaar vertrekken. Geval 2 Stel dat de rijtijden tussen de twee haltes verschillend zijn voor de verschillende lijnen. Het kan nu bijvoorbeeld zo zijn dat een lagere frequentie van een lijn gecompenseerd wordt door een kleinere rijtijd. De frequenties mogen in dit geval niet bij elkaar opgeteld worden, zoals gemakkelijk valt in te zien. De berekening van de gemiddelde wachttijd kan nu zeer ingewikkeld worden. Stel bijvoorbeeld dat er twee lijnen zijn met t1 < t2. De reizigers zullen dan een voorkeur vertonen voor lijn 1, tenzij t2 niet veel groter is dan t1. Als t2 < t1 + ½ h1 zullen enige reizigers toch lijn 2 nemen. Men zou nu de volgende benadering kunnen toepassen: Tel de frequenties op indien t1 = t2, tel de frequenties in het geheel niet op indien t2 > t1 + ½ h1 en pas daartussen een speciale berekening toe. Vaak ziet men echter af van deze verfijning en berekent in het geval van ongelijke reistijden tussen twee knooppunten wachttijden gelijk aan de halve intervaltijd van de individuele lijnen.
8.2.3 Kortste route in een openbaar vervoer netwerk De gebruikelijke algoritmen voor het vinden van een kortste route in een wegennetwerk kunnen niet zonder wijzigingen worden toegepast bij een openbaar vervoer netwerk. De mogelijkheid van overstappen en daarbij gepaard gaande wachttijden kunnen zorgen voor anomalieën, zoals geïllustreerd in Figuur 8-6.
116
B 12
B3
2
3
Overstap 5
A 10 1
Figuur 8-6 Probleem bij gebruikelijke kortste route algoritme in o.v.-net.12 De reis van knooppunt 1 naar 3 via lijn B duurt 12 + 3 = 15 minuten. Via lijn A en B met een overstap in knooppunt 2 duurt hij 10 + 5 + 3 = 18 minuten. Dus de kortste route van 1 naar 3 is via lijn B, maar de kortste route van 1 naar 2 verloopt via lijn A. Dit betekent dat afhankelijk van de bestemming knooppunt 2 bereikt wordt via verschillende routes, hetgeen moeilijkheden zou opleveren in de klassieke algoritmes, omdat er geen sprake meer is van een éénduidige kortste routeboom vanuit knooppunt 1. Een oplossing bestaat bijvoorbeeld uit het introduceren van extra schakels waarna de gebruikelijke kortste route algoritmes toegepast kunnen worden. Een andere oplossing is het ontwikkelen van speciale algoritmes voor openbaar vervoer netwerken. Om een indruk te geven van een speciaal voor het openbaar vervoer ontwikkeld algoritme behandelen we een methode bekend staat onder de naam Transitnet (beschreven in Lamb en Havers (1970) 13) Het Transitnet algoritme wordt toegelicht aan de hand van een voorbeeld. Zie Figuur 8-7. Stel dat we de kortste routeboom vanuit knooppunt 1 willen bepalen. Eenvoudigheidshalve houden we geen rekening met wachttijden. A 12
7
6
A 6 D 7
C 3 D 1
C 4
8
Lijn A Lijn B Lijn C Lijn D
1-2-5-6-7 2-3-4-5 6-8-7 5-6-8
B 1
5
4
A 10
B 3
B 3
2
3
A 4
1
Figuur 8-7 Voorbeeld o.v.-netwerk voor bepaling kortste route.13 In essentie werkt het algoritme als volgt: Eerst bepalen we vanuit het startpunt alle knooppunten die we zonder overstappen kunnen bereiken en de daartoe benodigde tijd. Vervolgens bepalen we alle
117 knooppunten die we met één keer overstappen kunnen bereiken. Als de daartoe benodigde tijd kleiner is dan een eerder gevonden route passen we de tijd en route aan. Dezelfde procedure herhalen we voor twee keer overstappen enz., tot de gevonden routes naar alle knooppunten niet meer veranderen. Meer in detail: Elk knooppunt wordt voorzien van een label van de vorm [L.K.T] met de volgende betekenis: L K T
de laatst genomen lijn om dit knooppunt te bereiken het knooppunt waar op deze lijn is overgestapt de tijd om dit knooppunt te bereiken
Bovendien heeft elk knooppunt tijdens de uitvoering van het algoritme een [+] of een [-] indicator die aangeeft of er nog lijnen vanuit dit knooppunt moeten worden onderzocht. Knooppunten Lijnen vanuit knoop
1
2
3
4
5
6
7
8
7
1
2
3
4
5
6
7
8
0.0.0 +
0.0.∞ -
0.0.∞ -
0.0.∞ A.1.32 A.1.32 +
0.0.∞ -
A.1.4 -
0.0.∞ B.2.10 B.2.10 +
0.0.∞ A.1.20 A.1.20 +
0.0.0 -
0.0.∞ B.2.7 B.2.7 +
0.0.∞ A.1.14 A.1.14 + B.2.11 B.2.11 +
0.0.∞ -
0.0.0 -
0.0.∞ A.1.4 A.1.4 +
A.1.20 +
A.1.32 +
0.0.∞ -
0.0.0 -
A.1.4 -
B.2.7 -
B.2.10 +
B.2.11 +
A.1.20 +
A.1.32 +
0.0.∞ -
0.0.0 A.5.25
A.1.4 A.5.21
B.2.7 -
B.2.10 -
B.2.11 +
A.1.32 + A.5.29
0.0.∞ -
0.0.0 -
A.1.4 -
B.2.7 -
B.2.10 -
B.2.11 -
A.1.20 + A.5.17 D.5.18 A.5.17 +
0.0.0 A.7.56 0.0.0 -
A.1.4 A.7.52 A.1.4 -
B.2.7 -
B.2.10 -
C.6.24 +
B.2.7 -
B.2.10 -
0.0.0 A.7.54 0.0.0 0.0.0
A.1.4 A.7.50 A.1.4 A.1.4
B.2.7 -
B.2.10 -
B.2.7 B.2.7
B.2.10 B.2.10
A.5.17 A.7.36 A.5.17 C.8.21 A.5.17 A.7.34 A.5.17 A.5.17
Lijn
A
B
--
--
A D
C D
A
D.6.24 B.2.11 A.7.42 B.2.11 -
C
A
Tabel 8-4 Transitnet algoritme.13 Het algoritme ziet er als volgt uit: Initialisatie:
B.2.11 A.7.40 B.2.11 B.2.11
A.5.29 + C.6.24
D.5.19 D.5.19 + C.6.20 D.6.18 D.6.18 +
C.6.24 C.8.22 C.8.22 +
D.6.18 +
C.8.22 C.8.22
D.6.18 D.6.18
D.6.18 -
118 Het startknooppunt krijgt het label [0.0.0] en de indicator [+]. Alle andere knooppunten krijgen het label [0.0.∞] en de indicator [-]. Herhaal zolang er [+] indicators zijn: Stap 1: Kies een knooppunt met een [+] indicator. Onderzoek alle lijnen die dit knooppunt aandoen, met uitzondering van de lijn waarmee men in dit knooppunt is aangekomen. Zo verkrijgt men nieuwe voorlopige labels voor alle knooppunten die bereikbaar zijn vanuit dit knooppunt zonder verder over te stappen. Zet de indicator voor dit knooppunt op [-]. Stap 2: Update de labels en indicatoren. Vergelijk de in stap 1 verkregen nieuwe labels met de bestaande labels. Alleen als de nieuwe reistijd kleiner is dan de reeds verkregen reistijd worden de labels voor de betreffende knooppunten aangepast en worden hun indicatoren op [+] gezet. De labels en indicatoren van de overige knooppunten worden ongemoeid gelaten. In Tabel 8-4 wordt dit algoritme toegepast op het voorbeeld. De laatste regel van de tabel herbergt alle informatie voor het reconstrueren van de kortste routeboom. Stel we zoeken de kortste route van knooppunt 1 naar knooppunt 8. Het label van knooppunt 8, namelijk [D.6.18], zegt dat we hier op zijn vroegst kunnen aankomen via lijn D vanuit knooppunt 6 en dat de reis dan 18 minuten geduurd heeft. In knooppunt 6 op zijn beurt kunnen we, ook volgens de laatste regel in de tabel, op zijn vroegst aankomen in 17 minuten en wel via lijn A vanuit knooppunt 5. Zo terugwerkend naar knooppunt 1 vinden we de kortste route weergegeven in Tabel 8-5. Knooppunt
Tijd
Neem lijn
1 2 5 6 8
0 4 11 17 18
A B A D -
Tabel 8-5 Kortste route tussen twee punten in o.v.-netwerk In het voorbeeld hielden we geen rekening met wachttijden. De beschrijving van het algoritme laat echter zien dat de introductie van wachttijden en de daarbij behorende weging van tijdcomponenten niet op moeilijkheden zal stuiten.
8.2.4 Toedelingsmodellen voor openbaar vervoer We hebben bij de behandeling van toedelingsalgoritmes voor het autoverkeer gezien dat de methoden in een aantal categorieën ingedeeld kunnen worden: • • • •
Alles of niets toedeling Stochastische toedeling Evenwichtstoedeling Stochastische evenwichtstoedeling
119
Dezelfde algoritmes kunnen na aanpassing ook worden gebruikt voor toedeling aan het openbaar vervoer. Voor de alles of niets toedeling geldt wat ook reeds werd opgemerkt voor toedeling van het wegverkeer: de methode kan redelijke resultaten geven in een netwerk zonder congestie, met weinig alternatieve routes tussen een herkomst en bestemming en waarbij dan deze weinige alternatieve routes bovendien onderling sterk verschillen in weerstand. Tussen twee punten in een openbaar vervoer netwerk kunnen, evenals trouwens in een autonetwerk, meer routes bestaan. Een kenmerk van het openbaar vervoersysteem is dat er alternatieve reisroutes zijn die in ligging samenvallen. Bij gebruik van de trein heeft men bijvoorbeeld de keuze tussen sneltreinen en stoptreinen. Ook in busnetten kunnen verschillende lijnen gedeeltelijk dezelfde route volgen. Ook als deze alternatieve routes niet alle dezelfde weerstand hebben zullen de reizigers zich toch over deze routes verdelen. De reden is dat, evenals bij autonetwerken, niet elke reiziger volledige kennis heeft van de weerstanden in het netwerk. Bovendien worden de weerstanden van de schakels door verschillende reizigers verschillend beoordeeld. Om nu tot een verdeling van de reizigers over alternatieve routes te komen maakt men gebruik van stochastische toedelingsmodellen. Men kan dit op twee manieren doen. De eerste methode verdeelt de reizigers in functie van de frequenties en/of rijtijden over de alternatieve routes; de tweede maakt gebruik van simulatie (Monte Carlo methode). Bij de eerste methode zijn er verschillende mogelijkheden: Men kan de stromen verdelen evenredig met de frequenties van de lijnen, of men kan de stromen verdelen evenredig met de e-machten van gewogen rij- en wachttijden (logitmodel). De tweede methode vertoont veel gelijkenis met de simulatiemethode toegepast bij de toedeling in autonetwerken. Loting wordt nu toegepast bij het bepalen van wachttijden en de keuze van lijnen met gelijke lengte langs hetzelfde traject. Na elke loting wordt een kortste routeboom berekend. Bij de bovengenoemde alles-of-niets en stochastische toedelingen wordt geen rekening gehouden met veranderingen in de weerstanden onder invloed van overbelasting van het netwerk (congestie). Modellen die wel rekening houden met de verandering in weerstand van een schakel als gevolg van de verkeersbelasting heten bij de toedeling in autonetwerken evenwichtsmodellen. In openbaar vervoer netwerken kan overbelasting van het netwerk ontstaan als de vervoersvraag de capaciteit van het systeem overschrijdt. De capaciteit hangt naast de frequentie op de lijnen vooral samen met de voertuigcapaciteit. In principe zou men de algoritmen voor de evenwichtstoedeling in autonetwerken, na enige aanpassing, kunnen gebruiken. Dit wordt echter nauwelijks gedaan. In openbaar vervoer netwerken worden evenwichtstoedelingen praktisch niet toegepast omdat pure overbelasting van het netwerk zoals boven geschetst maar weinig voorkomt.
120
8.2.5 Slotopmerkingen Een aantal aspecten zijn in bovenstaande behandeling van het routebepalingproces niet aan bod gekomen. •
•
De eerste opmerking betreft de invloed van tariefstructuren. Naast de reistijd laat de reiziger zich bij zijn routebepaling ook beïnvloeden door de kosten van het vervoer. Vervoerbedrijven hanteren soms tariefstructuren die geen direct verband hebben met de vervoerprestatie. Het kan voorbeeld voorkomen dat er geen relatie is tussen het tarief en de afgelegde afstand, denk hierbij aan abonnementen geldig voor het hele net. Dergelijke situaties compliceren de toepassing van traditionele toedelingstechnieken. Er bestaan echter toedelingsprogramma’s die rekening kunnen houden met ingewikkelde tariefstructuren. De tweede opmerking heeft betrekking op de interactie tussen sommige vormen van openbaar vervoer en het wegverkeer. Bussen bijvoorbeeld die gebruik maken van het autowegennet ondergaan de directe invloed van eventuele congestie op dat wegennet. Ook hier zijn methoden ontwikkeld die met deze interactie rekening kunnen houden.
121
9. Examenvragen De examenvragen maken een integraal onderdeel uit van de lesstof. U kunt de examenvragen met uitgebreide uitwerkingen vinden op: http://www.mech.kuleuven.be/cib/verkeer/onderwijs Verdere hulp bij het studeren van dit vak bieden de PowerPoint slides van de lessen eveneens te vinden op bovengenoemde website.
122
Lijst van figuren en tabellen met bronvermelding De noten verwijzen naar de bron van figuur of tabel Figuur 1-1 Figuur 1-2 Figuur 1-3 Figuur 1-4 Figuur 1-5 Figuur 1-6 Figuur 1-7 Figuur 2-1 Figuur 2-2 Figuur 3-1 Figuur 3-2 Figuur 3-3 Figuur 3-4 Figuur 3-5 Figuur 3-6 Figuur 3-7 Figuur 4-1 Figuur 4-2 Figuur 4-3 Figuur 4-4 Figuur 5-1 Figuur 6-1 Figuur 6-2 Figuur 8-1 Figuur 8-2 Figuur 8-3 Figuur 8-4 Figuur 8-5 Figuur 8-6 Figuur 8-7
Interactie transportsysteem en activiteitensysteem.1 ______________________________ 2 Het voorspellingsprobleem.1 ________________________________________________ 5 Evenwicht op de transportmarkt. ____________________________________________ 6 Constante aanbod- en vraagfunctie.1 _________________________________________ 7 Evenwichten op korte en lange termijn. _______________________________________ 8 Modeltypen benodigd voor voorspellingen. ___________________________________ 10 Planningsproces.________________________________________________________ 11 Constructie van een mathematisch model. ____________________________________ 16 Structuur van het traditionele verkeersmodel. _________________________________ 19 Voorbeeld keuzebepaling bij uniforme verdeling stoortermen _____________________ 24 Normale en Gumbelverdeling (zelfde gemiddelde en variantie) ____________________ 26 De logistische curve. _____________________________________________________ 32 Fout bij aggregatie via gemiddelden. ________________________________________ 33 Logit routekeuze (1). _____________________________________________________ 34 Logit routekeuze (2). _____________________________________________________ 35 Boomdiagram nested logit ________________________________________________ 40 Zone-indeling deel van model Vlaams Brabant. ________________________________ 47 Schema van een zone-indeling en wegennetwerk._______________________________ 49 Openbaar vervoer netwerk.________________________________________________ 50 Wegennetwerk deel van model Vlaams Brabant. _______________________________ 51 Ecologische correlatie. ___________________________________________________ 60 Enige analytische distributiefuncties. ________________________________________ 75 Verschillende HB-tabellen met dezelfde randtotalen. ____________________________ 79 Netwerk voorbeeld kortste route algoritme Dijkstra. ____________________________ 94 Voorbeeld alles-of-niets toedeling. __________________________________________ 98 Voorbeeld evenwichtstoedeling. ___________________________________________ 108 Oppervlakte onder reistijdfuncties.2 ________________________________________ 110 Wachtende passagiers bij een o.v.-halte. ____________________________________ 113 Probleem bij gebruikelijke kortste route algoritme in o.v.-net. ___________________ 116 Voorbeeld o.v.-netwerk voor bepaling kortste route. ___________________________ 116
Tabel 3-1 Tabel 3-2 Tabel 5-1 Tabel 6-1 Tabel 6-2 Tabel 6-3 Tabel 6-4 Tabel 6-5 Tabel 6-6 Tabel 6-7 Tabel 6-8 Tabel 6-9 Tabel 7-1 Tabel 7-2 Tabel 7-3 Tabel 7-4 Tabel 7-5 Tabel 8-1 Tabel 8-2 Tabel 8-3 Tabel 8-4 Tabel 8-5
Toepassing van het logitmodel bij een heterogene bevolkingsgroep _________________ 38 Voorbeeld berekening nested logit model ______________________________________ 43 Resultaat van een categorieanalyse. __________________________________________ 61 Algemene vorm van een HB-tabel. ___________________________________________ 66 Voorbeeld groeifactormethode met producties als randvoorwaarde._________________ 69 Voorbeeld groeifactormethode met dubbele randvoorwaarden. ____________________ 70 Voorbeeld van een niet convergerend Furness proces. ___________________________ 71 Weging reistijd in openbaar vervoer (model Vlaams Brabant). _____________________ 74 Randvoorwaarden voorbeeld zwaartekrachtmodel.2 _____________________________ 76 Weerstanden voorbeeld zwaartekrachtmodel. __________________________________ 76 Waarden distributiefunctie voorbeeld zwaartekrachtmodel.________________________ 77 Resultaten voorbeeld zwaartekrachtmodel. ____________________________________ 77 Randvoorwaarden voorbeeld multimodale zwaartekrachtmodel.____________________ 90 Distributiefunctiewaarden per vervoerwijze. ___________________________________ 90 Distributiefunctie gesommeerd over vervoerwijzen. ______________________________ 91 Totale verplaatsingen voorbeeld multimodale zwaartekrachtmodel. _________________ 91 Eindresultaat voorbeeld multimodale zwaartekrachtmodel.________________________ 91 Oplossing voorbeeld kortste route bepaling. ___________________________________ 95 Classificatie statische toedelingsmodellen. _____________________________________ 97 Resultaten voorbeeld evenwichtstoedeling ____________________________________ 111 Transitnet algoritme.13 ___________________________________________________ 117 Kortste route tussen twee punten in o.v.-netwerk _______________________________ 118
123
Referenties 1
Manheim, M.L. (1979) Fundamentals of Transportation Systems Analysis. The MIT Press, Cambridge, Mass
2
Ortúzar, J. de D. en Willumsen, L.G. (1995) Modelling Transport. Second Edition, Wiley.
3
Ben Akiva, M.E. en Lerman, S.R. (1985) Discrete Choice Analysis: Theory and Application to Travel Demand. The MIT Press, Cambridge Mass.
4
Train, K. (1986) Qualitative Choice Analysis: Theory, Econometrics, and an Application to Automobile Demand , Cambridge: The MIT Press, (3rd printing 1993)
5
Train, K. (2003) Discrete Choice Methods with Simulation, Cambridge University Press
6
Caliper Corporation (1996) Travel Demand Modeling with TransCad 3.0
7
Wilson, A. G. (1970) Entropy in urban and regional modelling, Pion, London
8
Gould, P. (1972) Pedagogic review (of Wilson (1970), Annals of the Association of American Geographers, Vol 62, No. 4, December 1972
9
Wilson, A. G. en Kirkby, M.J. (1980), Mathematics for Geographers and Planners, 2nd edition, Clarendon press, Oxford.
10
Sheffi, Y. (1985) Urban Transportation Networks. Prentice-Hall, Englewood Cliffs, N.J.
11
Garnier, R en Taylor, J. (1992) Discrete Mathematics for new Technology. Hilger Bristol
12
Clercq, F. le (1972) A public transport assignment method. Traffic Engineering & Control, June 1972.
13
Lamb, G.M. en Havers, G. (1970) Introduction to transportation planning, treatment of networks. Traffic Engineering & Control, 11 (10), February 1970.