Gehanteerde beslissingscriteria bij de heraanleg van gevaarlijke punten
Een empirische analyse aan de hand van classificatiebomen
RA-MOW-2011-003
T. De Ceunynck, N. Janssen, S. Daniels, T. Brijs Onderzoekslijn Infrastructuur en ruimte
DIEPENBEEK, 2013. STEUNPUNT MOBILITEIT & OPENBARE WERKEN SPOOR VERKEERSVEILIGHEID
Documentbeschrijving Rapportnummer:
RA-MOW-2011-003
Titel:
Gehanteerde beslissingscriteria bij de heraanleg van gevaarlijke punten
Ondertitel:
Een empirische classificatiebomen
Auteur(s):
T. De Ceunynck, N. Janssen, S. Daniels, T. Brijs
Promotor:
Prof. dr. Tom Brijs
Onderzoekslijn:
Infrastructuur en ruimte
Partner:
Universiteit Hasselt
Aantal pagina’s:
85
Projectnummer Steunpunt:
2.3
Projectinhoud:
Evaluatie van het programma “gevaarlijke punten”
analyse
aan
de
hand
van
Uitgave: Steunpunt Mobiliteit & Openbare Werken – Spoor Verkeersveiligheid, mei 2011.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
Wetenschapspark 5 B 3590 Diepenbeek T 011 26 91 12 F 011 26 91 99 E
[email protected] I www.steunpuntmowverkeersveiligheid.be
Samenvatting Op basis van ongevallengegevens werden op het Vlaamse wegennet locaties met een hoog ongevalsrisico geïdentificeerd, de zogenaamde gevaarlijke punten. De Vlaamse overheid heeft zich geëngageerd om 800 van deze gevaarlijke punten te analyseren en infrastructureel aan te passen om de verkeersveiligheid te verbeteren. Om het analyseproces van deze punten te vergemakkelijken werd het “Vademecum Veilige Wegen en Kruispunten” opgesteld door het Agentschap Wegen en Verkeer (AWV), waarin een kader van werkwijzen en principes aangereikt wordt. Dit resulteerde in een beslissingsboom. De bedoeling van dit rapport is het in kaart brengen van de werkelijke keuzes die door de beslissingnemers werden gemaakt bij de herinrichting van de gevaarlijke punten, en deze te vergelijken met de door de leidraad voorgestelde beslissingsboom. De door het vademecum voorgestelde beslissingsboom bestaat uit drie stappen. Het proces begint met een verkeersveiligheidsanalyse op basis van de Aanpak van VerkeersOngevallen Concentraties (AVOC) methode. In de tweede stap wordt de verkeersplanologische en ruimtelijke context in het proces betrokken. Het gaat dan om de wegcategorisering enerzijds, en het feit of men zich binnen de bebouwde kom of buiten de bebouwde kom bevindt. Op basis hiervan worden een aantal mogelijke typeoplossingen naar voor geschoven. De derde stap is een verkeerskundige en ruimtelijk-fysische analyse waarbij deze typeoplossingen getoetst worden aan de verkeersintensiteiten en ruimtelijke randvoorwaarden. Beslissingsboomanalyse is een dataminingtechniek die toont hoe de waarde van een afhankelijke variabele voorspeld kan worden op basis van de waarden van een set van onafhankelijke variabelen, en geeft deze relaties visueel weer in een boomvorm. Hierbij wordt de beschikbare dataset telkens gesplitst op basis van de onafhankelijke variabele die de beste (meest homogene) verdeling in twee groepen oplevert. Uit de analyses blijkt dat de intensiteit een cruciale variabele is bij de bepaling van de kruispuntoplossing. Bij een hoge intensiteit zal vaak gekozen worden voor een conflictvrije verkeersregelinstallatie (VRI) of een kruispuntoplossing waarbij kruisende stromen vermeden worden. Bij lagere intensiteitswaarden komen meestal andere kruispunttypes naar voren, zoals een klassieke VRI of een voorrangsgeregeld kruispunt. De leidraad adviseert echter dat men vertrekt vanuit de wegcategorisering. In de praktijk blijkt men dus eerder te vertrekken vanuit de bestaande situatie dan vanuit het verkeersplanologische wensbeeld. Een tweede belangrijke vaststelling is dat vaak het bestaande kruispunttype behouden blijft bij de herinrichting. De herinrichting van gevaarlijke punten komt dus vaak neer op aanpassingen binnen eenzelfde kruispunttype. Ondanks het feit dat het afwegingsproces in werkelijkheid afwijkt van de structuur die voorgesteld is in de beslissingsboom van de handleiding, blijkt het gekozen kruispunttype na de herinrichting toch zeer vaak overeen te stemmen met de voorgestelde types in de tabel met typeoplossingen.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
3
RA-MOW-2011-003
English summary Decision criteria for the reconstruction of hot spots: An empirical analysis based on decision tree analysis Based on accident registration, Flemish roads locations with a high accident risk have been identified, the so-called hot spots. The Flemish government has committed itself to investigate and adjust 800 of these locations to improve road safety. To facilitate the process of analysis for these locations, the Agentschap Wegen en Verkeer (AWV) of the Flemish Ministry of Mobility and Public Works formulated a manual to provide the government with a framework of methods and principles, which resulted in a decision tree. The intention of this report is to discover the actual choices decision makers have made for the adjustment of the hot spots, and compare these with the decision tree that is proposed by the AWV manual. The decision tree proposed by the AWV manual consists of three steps. The procedure starts with a traffic safety analysis based on the AVOC-method (Approach for dealing with Accident Concentration Locations). In the second step, the transportation planning and spatial context are involved in the process. This is about the road classification, and whether the hot spot is located within a built-up area or not. Based on this, a number of configuration types are proposed. In the third step, these configuration types are checked with the traffic flows and spatial preconditions of the location. Decision tree analysis is a data mining technique that indicates how the value of a dependent variable can be predicted based on the values of a set of independent variables. It visualizes these relations in a tree structure. The available dataset is repeatedly split based on the independent variable that provides the best (most homogeneous) split in two subgroups. The analyses show that the traffic volume is a crucial variable for determining the configuration of the location. In case of a high traffic volume, a conflict-free traffic light regulation or a configuration that avoids crossing traffic flows is often chosen. In case of a lower traffic volume, traffic signals or a priority-rule intersection are often preferred. However, the AWV manual advises to start from the road classification. So, in practice, decision-makers often start from the current situation, rather than from the transportation planning ideal. A second important finding is that the existing configuration type is often maintained during the adjustment process. So, the adjustment of these hot spots often involves modifications to the existing layout of the location. Despite the fact that the decision making process in reality does not correspond with the structure that is proposed by the manual, the chosen intersection type after the reconstruction very often corresponds with the table of prototype solutions.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
4
RA-MOW-2011-003
Inhoudsopgave
1. 2.
INLEIDING ................................................................................ 8 LITERATUURSTUDIE ..................................................................... 9
2.1
Vergelijkbaar onderzoek
9
2.2
Beslissingsboom Vademecum Veilige Wegen en Kruispunten
9
2.3
Effecten van infrastructurele maatregelen
11
2.3.1
Standaardkruispunten.................................................................. 13
2.3.2
Rotondes ................................................................................... 13
2.3.3
VRI ........................................................................................... 15
2.3.4
Ongelijkvloerse kruising ............................................................... 16
2.3.5
Bajonetkruispunt ......................................................................... 16
2.3.6
Kanalisatie ................................................................................. 17
2.3.7
Plateaus ..................................................................................... 17
2.3.8
Aanleg van nieuwe wegen ............................................................ 17
2.3.9
Ontdubbeling van wegen .............................................................. 18
2.3.10
Verbreden van rijstroken .............................................................. 18
2.3.11
Vluchtstroken ............................................................................. 18
2.3.12
Veilige inrichting van bermen........................................................ 18
2.3.13
Fysieke rijrichtingscheiding ........................................................... 19
2.3.14
Wrijvingsgraad van het wegdek .................................................... 19
2.3.15
Aanpassen van de horizontale geometrie ....................................... 19
2.3.16
Rijweg afbakening ....................................................................... 20
2.3.17
Longitudinale geprofileerde markering ........................................... 20
2.3.18
Straatverlichting ......................................................................... 20
2.3.19
Ventwegen ................................................................................. 20
2.3.20
Fiets- en voetpaden ..................................................................... 21
2.3.21
Oversteekvoorzieningen voor voetgangers ..................................... 21
2.3.22
Snelheidsremmende maatregelen ................................................. 22
2.3.23
Overzicht ................................................................................... 22
3.
METHODOLOGIE ........................................................................24
3.1
Datamining
24
3.2
De beslissingsboom
25
3.2.1 3.3
Voor- en nadelen van beslissingsbomen ......................................... 26
CART & recursive partitioning
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
27
5
RA-MOW-2011-003
3.3.1
Variabelen .................................................................................. 27
3.3.2
Doel .......................................................................................... 27
3.3.3
Algemene werking van het algoritme ............................................. 28
3.3.4
Splitsen van knopen .................................................................... 28
3.3.5
Evalueren van splitsingen ............................................................. 28
3.3.6
Gewenste grootte van de beslissingsboom...................................... 29
3.3.7
Onvolledige data ......................................................................... 31
3.3.8
Overzicht ................................................................................... 32
3.3.9
Voor- en nadelen CART ................................................................ 32
4.
DATA ....................................................................................34
4.1
Overzicht variabelen database
34
4.1.1
Prioriteitscode ante ..................................................................... 34
4.1.2
Type kruispunt voor .................................................................... 35
4.1.3
Signalisatie kruispunt voor ........................................................... 36
4.1.4
Kruispuntoplossing na .................................................................. 37
4.1.5
Totale ochtendintensiteit .............................................................. 39
4.1.6
Categorisering 1 ......................................................................... 40
4.1.7
Categorisering 2 ......................................................................... 41
4.1.8
Fietsroutenetwerk ....................................................................... 41
4.1.9
Ruimtelijke context ..................................................................... 42
4.1.10
Max. snelheid 1 ........................................................................... 43
4.1.11
Max. snelheid 2 ........................................................................... 43
4.1.12
Fietsvoorzieningen ...................................................................... 44
4.1.13
Land use .................................................................................... 45
4.1.14
Middenberm 1 ............................................................................ 45
4.1.15
Middenberm 2 ............................................................................ 46
4.1.16
Aantal rijstroken 1....................................................................... 47
4.1.17
Aantal rijstroken 2....................................................................... 47
5.
ANALYSE ................................................................................48
5.1
Maximumboom
5.2
48
5.1.1
Wortelknoop ............................................................................... 51
5.1.2
Subknopen wortelknoop ............................................................... 52
5.1.3
Misclassificatie ............................................................................ 56
5.1.4
Variable importance score ............................................................ 57
Maximumboom met toegewezen initiële splitsingsvariabele
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
6
59
RA-MOW-2011-003
5.3
5.2.1
Wortelknoop ............................................................................... 59
5.2.2
Subknopen wortelknoop ............................................................... 61
5.2.3
Misclassificatie ............................................................................ 63
5.2.4
Variable importance score ............................................................ 64
Beslissingsboom met optimale grootte
64
5.3.1
Wortelknoop ............................................................................... 68
5.3.2
Subknopen wortelknoop - linkertak ............................................... 68
5.3.3
Subknopen wortelknoop - rechtertak ............................................. 70
5.3.4
Misclassificatie categorieën ........................................................... 72
5.3.5
Variable importance score ............................................................ 74
5.3.6
Vergelijking maximumboom – optimale boom ................................. 75
6.
DISCUSSIE ..............................................................................76
6.1
Vergelijking werkelijke beslissingsboom met beslissingsboom vademecum
76
6.2
Vergelijking uitgevoerde herinrichting – tabel typeoplossingen
77
6.3
Beperkingen van het onderzoek
78
7. 8.
CONCLUSIES ............................................................................80 LITERATUURLIJST .......................................................................84
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
7
RA-MOW-2011-003
1.
INLEIDING
Om een beeld te krijgen van de verkeersveiligheidssituatie, verzamelen overheden systematisch ongevallengegevens. Het systematisch verzamelen van deze ongevallengegevens heeft geleid tot de identificatie van locaties op het Vlaamse wegennet met een hoog ongevalsrisico, de zogenaamde gevaarlijke punten. Hiervoor berekent men de zogenaamde prioriteitscode op basis van de formule: 5*D + 3*ZG + 1*LG, waarbij “D” staat voor het aantal doden, “Z” voor het aantal zwaargewonden en “L” voor het aantal lichtgewonden over een periode van 3 jaar (1997-1999). Wanneer de prioriteitscode minstens 15 bedraagt, wordt er gesproken over een gevaarlijk punt (Vaneerdewegh, 2009). Om de Vlaamse verkeersveiligheidssituatie zo snel en efficiënt mogelijk te verbeteren, heeft de Vlaamse overheid zich geëngageerd om 800 van deze gevaarlijke punten te analyseren en infrastructureel aan te passen met de bedoeling het aantal ernstige ongevallen drastisch te verminderen. Hiervoor is een budget vrijgemaakt van 500 miljoen euro over een periode van 5 jaar (Tijdelijke Vennootschap 3V, 2006). Gezien de omvang van de investeringen en de korte tijdsspanne waarin de voorbereiding van de ingrepen op de geselecteerde locaties diende te gebeuren, was er nood aan een gestandaardiseerde methodologie om de bestaande knelpunten per locatie te detecteren en oplossingen voor te stellen. Om dit analyseproces te vergemakkelijken, werd de “Leidraad Veilig Verkeer Vlaanderen” ontwikkeld door het Tijdelijke Vennootschap Veilig Verkeer Vlaanderen (TV3V), een consortium bestaande uit de studiebureaus Arcadis Belgium, Grontmij en Technum (Tijdelijke Vennootschap 3V, 2006). Dit document vormde de basis voor de opmaak van het Vademecum Veilige Wegen en Kruispunten (AWV, 2009). Dit vademecum werd specifiek opgesteld om een kader van werkwijzen en principes aan te reiken waarop men kan terugvallen bij individuele gevallen van gevaarlijke punten. In het vademecum worden alle technische vereisten waaraan moet worden voldaan bij het transformeren van gevaarlijke punten op een overzichtelijke wijze op een rij gezet. Dit resulteert in een beslissingsboom. Een beslissingsboom is een boomvormige structuur waarbij een serie van regels leidt naar een set van beslissingen (Adeyemo & Kuye, 2006). In de beslissingsboom van het vademecum wordt de gewenste type-inrichting voor kruispunten en wegvakken beschreven in functie van een aantal variabelen zoals de functionele wegcategorisering, het geldende snelheidsregime en de ruimtelijke context. Het vademecum is echter geen blinde normering. De uiteindelijke beslissing over de uit te voeren infrastructuuraanpassingen wordt genomen door twee bevoegde commissies per provincie, namelijk de Provinciale Auditcommissie en de Provinciale Commissie Verkeersveiligheid. De bedoeling van dit rapport is het in kaart brengen van de impliciete beslissingsboom die door deze commissies werd gebruikt bij het bepalen van de uiteindelijke infrastructuuraanpassingen. Met andere woorden, er wordt onderzocht welke criteria in werkelijkheid belangrijke beïnvloedende factoren waren om al dan niet voor bepaalde typeoplossingen te opteren. Op deze manier gaan we na of de in werkelijkheid gemaakte keuzes voor typeoplossingen adequaat kunnen beschreven worden aan de hand van beslissingsbomen. Vervolgens kunnen we nagaan of deze werkelijke beslissingsbomen ook overeenstemmen met de voorschriften van de leidraad voor de aanpak van de gevaarlijke punten. Dit heeft uiteindelijk als doel om bij te dragen tot een beter begrip en duidelijkere structurering van het feitelijke beslissingsproces bij het heraanleggen van gevaarlijke punten.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
8
RA-MOW-2011-003
2.
LITERATUURSTUDIE
2.1
Vergelijkbaar onderzoek
In het eerste deel van deze literatuurstudie werd gezocht naar vergelijkbare onderzoeken in binnen- en buitenland, waarbij de werkelijke beslissingsboom in kaart werd gebracht in plaats van de theoretische. Een grondige zoektocht in nationale en internationale literatuur leverde weinig resultaat op. De meeste onderzoeken handelen over de evaluatie van een “gevaarlijke punten programma” met betrekking tot de geboekte vooruitgang in verkeersveiligheid. De gebruikte beslissingsboom wordt hierbij niet onder de loep genomen. De gebruikte methode in dit onderzoek is dan ook een originele invalshoek.
2.2
Beslissingsboom Vademecum Veilige Wegen en Kruispunten
De afgelopen jaren werden 800 gevaarlijke punten op gewestwegen in Vlaanderen geanalyseerd, waarna herinrichtingsmaatregelen werden voorgesteld en geïmplementeerd. Om het analyseproces en de keuze van de oplossing voor het wegwerken van een gevaarlijk punt te vergemakkelijken, stelde het Agentschap Wegen en Verkeer (AWV) het “Vademecum Veilige Wegen en Kruispunten” op, dat ondermeer een beslissingsboom omvat. De beslissingsboom kent drie stappen vanuit drie invalshoeken (AWV, 2009): -
De ongevallen- of verkeersveiligheidsanalyse volgens de AVOC-methode (Aanpak VerkeersOngevallen Concentraties).
-
De verkeersplanologische en ruimtelijke context.
-
De verkeerskundige en fysieke randvoorwaarden.
Een verkeersveilige oplossing in het kader van het wegwerken van een gevaarlijk punt of wegvak spreekt voor zich, maar de andere invalshoeken zijn daarom niet minderwaardig. Het is immers belangrijk om naast een verkeersveilige ook een duurzame oplossing te creëren. Daarom is het noodzakelijk om ook rekening te houden met de verkeersplanologische en ruimtelijke context van het gevaarlijk punt, en met de verkeerskundige en fysische randvoorwaarden (AWV, 2009). Het proces tot het bepalen van de voorkeursoplossing begint met een verkeersveiligheidsanalyse op basis van de AVOC-methode. Resulterende maatregelen kunnen zowel aanpassingen zijn aan het bestaande kruispunttype, als het veranderen van het kruispunttype. Daarna wordt de verkeersplanologische en ruimtelijke context in het proces betrokken. Het gaat dan om enerzijds de wegcategorisering en anderzijds de ruimtelijke context, zoals bijvoorbeeld het feit of men zich al dan niet in de bebouwde kom bevindt. In functie van deze factoren worden een aantal mogelijke typeoplossingen voor het betrokken kruispunt of wegvak naar voor geschoven, die te vinden zijn in Tabel 1 (AWV, 2009).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
9
RA-MOW-2011-003
Tabel 1 - Tabel typeoplossingen (AWV, 2009)
Legende: verkeerswisselaar
hollands complex
rotonde
lichtengeregeld kruispunt
voorrangskruispunt
voorrangsregeling
rechts in, rechts uit
geen aansluiting
Tenslotte dient op basis van de beschikbare verkeersintensiteiten en ruimtelijke randvoorwaarden een verkeerskundige en ruimtelijk-fysische analyse van de resterende kruispuntconfiguraties te gebeuren (AWV, 2009). Indien toch meerdere oplossingen overblijven, dient een kwalitatieve afweging van de verschillende kruispuntconfiguraties te gebeuren (AWV, 2009). Dit proces leidt uiteindelijk tot het weerhouden van één voorkeursoplossing. Figuur 1 geeft de beslissingsboom weer.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
10
RA-MOW-2011-003
Figuur 1 – Beslissingsboom Vademecum Veilige Wegen en Kruispunten (AWV, 2009)
2.3
Effecten van infrastructurele maatregelen
In dit deel van de literatuurstudie wordt in een aantal referentiedocumenten nagegaan wanneer welk type infrastructuur een oplossing biedt en wat de effecten zijn op het gebied van onder andere verkeersveiligheid. De keuze van een bepaald kruispunttype hangt af van verschillende factoren. Volgens PIARC (2003) zijn onderstaande factoren de belangrijkste: -
verkeersveiligheid
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
11
RA-MOW-2011-003
-
wegtype en -functie
-
aantal aansluitende takken
-
verkeerstype en –volume
-
ontwerp- en reële snelheid
-
dienstverlening aan omwonenden, beschikbare ruimte, naburig landgebruik, terrein
-
netwerkoverwegingen
-
milieu
-
kostprijs
Het is wel belangrijk om consistent te zijn in de gekozen oplossing voor een bepaald gebied of op een bepaalde route (PIARC, 2003). Bijvoorbeeld, als drie opeenvolgende kruispunten op een bepaalde weg met rotondes ingericht zijn, en het vierde is een klassiek kruispunt met voorrang van rechts, dan is dit niet in overeenstemming met de verwachting van de bestuurder en komt dit de veiligheid niet ten goede. Uit de doorgenomen referentiewerken uit de literatuur blijkt een grote verscheidenheid van mogelijke infrastructuurmaatregelen voor de herinrichting van gevaarlijke punten of wegvakken: -
Standaardkruispunten
-
Rotondes
-
Verkeersregelinstallaties (VRI)
-
Ongelijkvloerse kruising
-
Bajonetkruispunt
-
Kanalisatie
-
Plateaus
-
Aanleg van nieuwe wegen
-
Ontdubbeling van wegen
-
Verbreden van rijstroken
-
Vluchtstroken
-
Veilige inrichting van bermen
-
Fysieke rijrichtingscheiding
-
Wrijvingsgraad van het wegdek
-
Aanpassen van de horizontale geometrie
-
Rijweg afbakening
-
Longitudinale geprofileerde markering
-
Straatverlichting
-
Ventwegen
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
12
RA-MOW-2011-003
-
Fiets- en voetpaden
-
Oversteekvoorzieningen voor voetgangers
-
Snelheidsremmende maatregelen
Op het einde van dit deel is een samenvattende tabel opgenomen waarin beschikbare wetenschappelijke cijfers met betrekking tot het effect op het aantal (letsel)ongevallen zijn weergegeven voor elk van de maatregelen die hieronder besproken worden.
2.3.1 Standaardkruispunten Standaard is op elk kruispunt voorrang van rechts van toepassing. Echter, als er één weg is met druk verkeer, en een andere met weinig verkeer, functioneert deze regel slecht. In dit soort situaties is het mogelijk om een bepaalde weg voorrang te geven, en dit aan te duiden d.m.v. verkeersborden. Maar dit heeft geen invloed op het aantal ongevallen. Ook het (extra) aanduiden met verkeersborden en/of wegmarkeringen van kruispunten waar voorrang van rechts geldt, heeft geen significant effect op het aantal ongevallen. Het plaatsen van “STOP”-borden zorgt voor een daling van een aantal letselongevallen met 20% (3-arms kruispunten) tot 35% (4-arms-kruispunten) (Elvik & Vaa, 2004). PIARC (2003) stelt dat de omvorming van kruispunten met voorrang van rechts naar kruispunten met een vaste voorrangsregeling, aangeduid d.m.v. verkeersborden, zorgt voor een stijging van het aantal ongevallen bij hoge verkeersvolumes, vooral bij een smalle weg of bij de doorgang van kleine dorpen.
2.3.2 Rotondes Rotondes zijn geschikt voor alle type weggebruikers en kunnen overal toegepast worden, behalve op autosnelwegen. Ze hebben als doel het verkeer vlot af te wikkelen en de veiligheid van kruispunten te bevorderen. Daarnaast kunnen ze ook bijdragen tot de ruimtelijke afbakening van gebieden, bijvoorbeeld als overgangspoort van het bovenliggend wegennet naar stads- en dorpskernen (Daniels, 2010). a. Aantal ongevallen Uit een metastudie van Elvik & Vaa (2004), blijkt dat de aanleg van een rotonde het aantal ongevallen vermindert met 10 tot 40%. Een evaluatie van het gevaarlijke punten programma in Australië stelt dat het aanleggen van een rotonde het aantal ongevallen reduceert met 73% (Newstead & Corben, 2001). Een Amerikaanse studie stelt een daling vast van 39% van het aantal ongevallen (Persaud, Retting, Garder, & Lord, 2000). b. Ernst ongevallen Persaud (2000) concludeert dat het aantal letselongevallen bij de aanleg van een rotonde gemiddeld daalt met 76%, en het aantal dodelijke en zware letselongevallen zelfs met 89%. Indien de rotonde een VRI binnen de bebouwde kom vervangt, daalt het aantal letselongevallen met 68%. Ook Elvik (2004) geeft resultaten die in dezelfde lijn liggen: een gemiddelde reductie van het aantal ongevallen met gekwetsten met 30 tot 50%, en
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
13
RA-MOW-2011-003
een reductie van het aantal ongevallen met doden met 50 tot 70%. Het omvormen van een klassiek 4-arms kruispunt heeft het grootste effect. De achterliggende redenen zijn een lagere snelheid en het niet voorkomen van een aantal potentieel ernstige ongevallen, zoals bijvoorbeeld ongevallen met linksafslaand verkeer (Reekmans, Nuyts, & Cuyvers, 2004). c. Type slachtoffer Daniels et al. (2010) onderzochten de betrokkenheid van verschillende types weggebruikers bij ongevallen op rotondes in Vlaanderen. Ze stelden vast dat zwakke weggebruikers (voetgangers, fietsers, bromfietsers en motorrijders) oververtegenwoordigd zijn bij ongevallen op rotondes in verhouding tot hun aanwezigheid in het verkeer. Fietsers zijn betrokken in bijna één op drie van alle ongevallen op rotondes in Vlaanderen.
d. Fietsers Het enige wetenschappelijk gepubliceerde onderzoek over de effecten van rotondes op de verkeersveiligheid voor fietsers kwam tot de conclusie dat de omvorming van een bestaand kruispunt tot een rotonde gemiddeld leidt tot een stijging van het aantal ongevallen met fietsers (+27%), vooral dan de ongevallen met doden en zwaargewonden(+41-46%). Dit verklaart meteen de zware oververtegenwoordiging van fietsers bij ongevallen op rotondes. Niettemin bracht het onderzoek ook een sterk onderscheid aan het licht naargelang het type van voorzieningen voor fietsers: rotondes met aanliggende fietspaden scoren beduidend zwakker dan rotondes met drie andere gangbare types fietsvoorzieningen (gemengd verkeer, vrijliggende fietspaden en volledig gescheiden fietspaden) (Daniels, Brijs, Nuyts, & Wets, 2009).
e. Oorspronkelijke situatie en ontwerp Reekmans et al. (2004) concluderen op basis van een Nederlandse studie dat de verkeersveiligheidswinst bij de aanleg van een rotonde groter is wanneer een klassiek voorrangskruispunt (-80% letselongevallen) wordt omgebouwd dan wanneer een kruispunt met verkeerslichten (-60% letselongevallen) wordt omgebouwd. Een Amerikaanse studie stelt een daling vast van 32% van het aantal ongevallen indien kruispunten uitgerust met een VRI binnen de bebouwde kom vervangen worden door een rotonde (Persaud et al., 2000). Ook volgens PIARC (2003) gebeuren er minder ongevallen op rotondes, en zijn ze bovendien minder ernstig dan op kruispunten met VRI, op voorwaarde dat de verkeersvolumes gelijk zijn. Persaud et al. (2000) stellen bovendien bij enkelstrooksrotondes een reductie van het aantal ongevallen vast met 61%, tegenover 15% voor meerstrooksrotondes. Tenslotte is het verkeersveiligheidseffect van een rotonde zowel van toepassing binnen als buiten de bebouwde kom (Reekmans et al., 2004).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
14
RA-MOW-2011-003
2.3.3 VRI Net als rotondes, zijn VRI geschikt voor alle type weggebruikers en kunnen ze overal toegepast worden, behalve op autosnelwegen. VRI hebben als doel de verkeersafwikkeling en de oversteekbaarheid te verbeteren en de algemene verkeersveiligheid op een kruispunt te verhogen (Reekmans et al., 2004). a. Plaatsen van verkeerslichten Het CROW (2002) vond een vermindering van 15% van het aantal letselongevallen voor 3-arms kruispunten en een vermindering van 30 tot 40% voor 4-arms kruispunten in vergelijking met eenzelfde type kruispunt zonder VRI. Elvik (2004) stelt in een metastudie dat het plaatsen van VRI op kruispunten zorgt voor een daling van het aantal letselongevallen met 15% (T-kruispunt) tot 30% (4-arms kruispunt). PIARC (2003) stelt dat het omvormen van een 3-arms kruispunt met een vaste voorrangsregeling, aangeduid d.m.v. verkeersborden, naar een kruispunt met VRI de verkeersveiligheid niet significant verbetert. Het omvormen van een 4-arms kruispunt met een vaste voorrangsregeling, aangeduid d.m.v. verkeersborden, naar een kruispunt met VRI verbetert wel significant het aantal ongevallen en hun ernst. Het omvormen van een 4arms kruispunt met voorrang van rechts, naar een kruispunt met VRI vermindert significant het aantal ongevallen maar niet de ernst (PIARC, 2003). Uit de evaluatie van het gevaarlijke punten programma in Australië is een daling van 32% van het aantal ongevallen gebleken (Newstead & Corben, 2001). Reekmans et al. (2004) concluderen op basis van nog een aantal andere internationale onderzoeken, onder andere in het Verenigd Koninkrijk, dat het plaatsen van een VRI op voorheen ongeregelde kruispunten het aantal letselongevallen met 15 à 67% reduceert. Ook volgens PIARC (2003) ligt het aantal ongevallen op kruispunten met een VRI gemiddeld lager dan op gelijkaardige kruispunten zonder VRI. b. Effect van portieken boven de rijbaan Indien er bij een VRI portieken boven de rijbaan geplaatst worden is er een bijkomende reductie van het totaal aantal ongevallen met 25% en van het aantal flankongevallen met 63%, zo concludeert Ogden (1996). c. Effecten van VRI op ongevalpatronen Elvik & Vaa (2004) stellen dat vooral het aantal ongevallen met kruisende voertuigen daalt. Daarentegen is er wel een stijging van het aantal kop-staart ongevallen. Reekmans (2004) concludeert op basis van twee studies in Ogden (1996) dat “bij het plaatsen van verkeerslichten ongevallen tussen voertuigen die linksaf draaien en voertuigen die vanuit de tegenoverliggende richting komen, zullen toenemen met 52-136%. Het aantal flankongevallen vermindert met 52-84%. Voor kop-staart ongevallen zijn de resultaten uiteenlopend, variërend tussen een vermindering met 31% tot een toename met 65%.” Voor alle duidelijkheid gaat het hier dan niet om een conflictvrije regeling. d. Conflictvrije regelingen Newstead en Corben (2001) onderzochten het effect van het invoeren van een volledig gecontroleerde linksaf-fase in vergelijking met niet-conflictvrije VRI. Zij stelden een reductie van het aantal ongevallen vast met 32%. Ogden (1996) bespreekt in een studie
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
15
RA-MOW-2011-003
waaruit in soortgelijke omstandigheden blijkt dat het aantal flankongevallen daalt met 48%, het aantal ongevallen tussen linksafslaande voertuigen en voertuigen uit de tegenoverliggende richting met 82%, en het aantal voetgangerongevallen met 35%. Kop-staart ongevallen komen echter 72% meer voor. Het totale aantal letselongevallen daalt met 45%. Ook volgens Elvik & Vaa (2004) doet de uitbouw van een conflictvrij systeem het aantal ongevallen verder dalen. e. Effecten op veiligheid voetgangers De effecten op ongevallen met voetgangers op oversteekplaatsen zijn minder duidelijk. Elvik & Vaa (2004) vinden dat het plaatsen van een VRI zorgt voor een reductie van het aantal voetgangerongevallen met 12%. Het aantal ongevallen met uitsluitend motorvoertuigen neemt af met 2%. Studies van Van Hout et al. (2004) en Ogden (1996) stellen echter reducties van het aantal voetgangerongevallen vast gaande van 0 tot 50%. Voor alle duidelijkheid gaat het hier om het plaatsen van een VRI op een voorheen onbeveiligde oversteekplaats voor voetgangers. Reekmans et al. (2004) concluderen op basis van enkele onderzoeken dat het installeren van een conflictvrije regeling op kruispunten het aantal ongevallen met voetgangers met 30 tot 35% kan verminderen. Newstead en Corben (2001) concluderen dat het installeren van nieuwe verkeerslichten, die door voetgangers geactiveerd moeten worden, zorgen voor een vermindering van het aantal ongevallen met 34%. Echter, resultaten van andere studies wijzen soms op grote verschillen. Reekmans (2004) stelt dat op basis van internationale literatuur een reductie gaande van 0 tot 50% verwacht mag worden.
2.3.4 Ongelijkvloerse kruising Ongelijkvloerse kruisingen kunnen in principe overal en voor elk type weggebruiker toegepast worden. De grote veiligheidswinst zit in het feit dat er geen directe conflicten meer zijn tussen kruisende verkeersstromen, zodat ongevallen tussen verkeer met grote verschillen in snelheid, massa en richting voorkomen worden (Reekmans et al., 2004). Uit een studie besproken in Schoon (2000) blijkt dat het vervangen van kruispunten met een VRI door ongelijkvloerse kruisingen het aantal letselongevallen met 70% doet dalen en het aantal verkeersdoden met 30%. Ogden (1996) bespreekt enkele studies waaruit blijkt dat het aantal ongevallen ongeveer met 50% daalt.
2.3.5 Bajonetkruispunt Net als rotondes en VRI zijn bajonetkruispunten geschikt voor alle type weggebruikers en kunnen ze overal toegepast worden, behalve op autosnelwegen. Bajonetkruispunten hebben als doel de bestaande 4-arms kruispunten veiliger te maken door ze te vervangen door twee afzonderlijke 3-arms kruispunten (Reekmans et al., 2004). Uit de evaluatie van het gevaarlijke punten programma in Australië is een daling van 86% van het aantal ongevallen gebleken (Newstead & Corben, 2001). Ogden (1996)
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
16
RA-MOW-2011-003
vermeldt twee andere studies waaruit een daling van respectievelijk 47 en 80% van het aantal ongevallen blijkt. Een andere studie stelt echter dat een bajonetkruispunt 40% onveiliger is dan een 4-armskruispunt, maar dat één 3-armskruispunt op zich 20% veiliger is dan een 4-armskruispunt (CROW, 2002). Een laatste studie vindt een daling van het aantal letselongevallen met 33%, op voorwaarde dat het aandeel nietvoorrangsverkeer groter is dan 30% (Elvik & Vaa, 2004).
2.3.6 Kanalisatie Kanalisatiemaatregelen zijn maatregelen om voertuigen langsheen een specifiek traject te leiden bij het naderen of verlaten van een kruispunt, zoals bijvoorbeeld linksafstroken, verkeersgeleiders of wegmarkeringen. Ze kunnen overal en voor elk type weggebruiker toegepast worden. Kanalisatiemaatregelen maken de verkeerssituatie overzichtelijker en eenvoudiger (Reekmans et al., 2004). Newstead en Corben (2001) vinden een reductie van het aantal ongevallen van 27% bij een verkeersgeleider, 30% bij een rijstrook voor linksafslaand verkeer en 36% bij het aanbrengen van kanalisatiewegmarkeringen. Reekmans et al. (2004) concluderen op basis van verschillende onderzoeken dat kanalisatiemaatregelen kunnen zorgen voor een ongevalreductie met 20 tot 60% op kruispunten. Elvik & Vaa (2004) stelt in een metastudie dat kanalisatiemaatregelen vooral effectief zijn op 4-arms kruispunten, maar vermeldt dat slechts weinig resultaten statistisch significant zijn.
2.3.7 Plateaus Plateaus zijn vooral geschikt op kruispunten van wegen van een lagere categorie. Door de verhoogde aanleg wordt een kruispunt beter zichtbaar en vermindert de naderingssnelheid. Hierdoor moeten ongevallen als gevolg van een te hoge snelheid van het autoverkeer voorkomen worden (Reekmans et al., 2004; Verbokkem, Dikker, Scheffers, & Lindeloof, 2002). Een rapport van SWOV (Schoon, 2000) verwacht een daling van 20% van het aantal ongevallen op kruispunten binnen de bebouwde kom, en 35% buiten de bebouwde kom. Reekmans et al. (2004) stellen verder op basis van enkele internationale studies dat onderzoek naar het veiligheidseffect van plateaus beperkt is, maar er een tendens is dat het aantal ongevallen daalt met 20 tot 60% en het aantal letselongevallen met 25 tot 80%. Een plateau kan ook met succes in combinatie met een VRI gebruikt worden.
2.3.8 Aanleg van nieuwe wegen Ringwegen die het doorgaande verkeer rondom dorpen of steden moeten leiden i.p.v. door het centrum, doen het aantal letselongevallen dalen met 25 tot 32% (Elvik, Amundsen, & Hofset, 2001; Ogden, 1996; Reekmans et al., 2004). Een nieuwe verkeersader in stedelijk gebied heeft minder effect. Elvik (2002) vond in een metastudie een reductie van 6% van het aantal ongevallen.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
17
RA-MOW-2011-003
2.3.9 Ontdubbeling van wegen De ontdubbeling van wegen is vooral geschikt voor wegen van een hogere categorie, met als doel het verhogen van de verkeersveiligheid door onder andere het aantal ongevallen met tegemoetkomend verkeer te voorkomen. Indien er een ontdubbeling is van de volledige weg leidt dit tot een reductie van het aantal ongevallen met 29 tot 52%. Het effect is het grootst in stedelijk gebied (Elvik, 2002; Ogden, 1996; Reekmans et al., 2004).
2.3.10
Verbreden van rijstroken
Het verbreden van rijstroken is vooral geschikt voor wegen van een hogere categorie, met voldoende snelheid buiten de bebouwde kom en heeft als doel het voorkomen van ongevallen die gerelateerd zijn aan te smalle rijstroken, zoals bermongevallen en ongevallen met tegemoetkomend verkeer (Reekmans et al., 2004). Reekmans et al. (2004) stellen op basis van internationaal onderzoek dat rijstrookbreedtes van 3,4 tot 3,7 meter het veiligst zijn. In een metastudie stellen Elvik & Vaa (2004) dat het verbreden van de weg een positief effect heeft op het aantal ongevallen in landelijke gebieden, maar een licht negatief effect in stedelijke gebieden. Over het verbreden van de rijvakken zelf zijn er geen consistente resultaten, al is de tendens hetzelfde als bij het verbreden van de weg in zijn geheel (Elvik & Vaa, 2004).
2.3.11
Vluchtstroken
Vluchtstroken vinden hun voornaamste toepassingsgebied op autosnelwegen, uiteraard buiten de bebouwde kom. Het voornaamste doel is om aanrijdingen met stilstaande voertuigen te voorkomen. Op autosnelwegen die op regelmatige afstand voorzien zijn van vluchtstroken, daalt het aantal ongevallen met ongeveer 5 à 10% (Elvik & Vaa, 2004). Volgens het Nederlandse AVV zorgen vluchtstroken voor een stijging van 20 tot 30% van het aantal slachtoffers indien ze worden weggelaten (Reekmans et al., 2004; Verbokkem et al., 2002).
2.3.12
Veilige inrichting van bermen
Het veilig inrichten van bermen is vooral belangrijk bij wegen van een hogere categorie buiten de bebouwde kom, met een hoge toegelaten rijsnelheid. Het doel is het voorkomen van ongevallen, en het verminderen van de ernst van ongevallen indien één of meerdere voertuigen de berm raken en/of in aanraking komen met een vast voorwerp langs de rijbaan (Reekmans et al., 2004; Verbokkem et al., 2002). Reekmans et al. (2004) concluderen op basis van verschillende studies dat het aantal slachtoffers van bermongevallen met 13 tot 32% kan verminderen bij de aanleg van een berm. Hierbij kent een verharde berm de grootste veiligheidswinst. Wordt bovenop een (semi-)verharde berm een obstakelvrij zone gecreëerd, daalt het aantal slachtoffers van bermongevallen met 51 tot 55% (Newstead & Corben, 2001; Schoon, 2000). Volgens Elvik & Vaa (2004) kan een obstakelvrije zone van ongeveer 5 meter het aantal ongevallen met 20% reduceren in vergelijking met een obstakelvrije zone van slechts 1
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
18
RA-MOW-2011-003
meter. Een bijkomende obstakelvrije zone van 4 meter zorgt verder voor een daling van 44% van het aantal ongevallen.
2.3.13
Fysieke rijrichtingscheiding
Fysieke rijrichtingscheiding is van belang bij wegen van een hogere categorie buiten de bebouwde kom met hoge toegelaten rijsnelheid,. Het doel is het voorkomen van ongevallen met tegemoetkomend verkeer en ongevallen ten gevolge van inhalend verkeer (Reekmans et al., 2004; Verbokkem et al., 2002). Het aanleggen van een middenberm heeft meestal een positief effect. Op vierbaanswegen in landelijk gebied daalt het aantal letselongevallen met 10%. Op tweeen vierbaanswegen in stedelijk gebied is er een daling van 20 tot 40%. Enkel op tweebaanswegen in landelijk gebied is er een stijging van het aantal ongevallen met gewonden (Elvik & Vaa, 2004). Reekmans et al. (2004) concluderen op basis van internationale studies dat hoe breder de middenberm is, hoe veiliger deze is voor de weggebruikers. Verder is het volgens hen aangewezen om bij smallere middenbermen een fysische barrière te voorzien, waardoor het aantal dodelijke ongevallen zal dalen met 15 tot 26%.
2.3.14
Wrijvingsgraad van het wegdek
Het verbeteren van de wrijvingsgraad van het wegdek moet het aantal ongevallen t.g.v. slippen verminderen. Maatregelen hiervoor kunnen overal toegepast worden (Reekmans et al., 2004). Internationale studies geven aan dat het aanbrengen van een wegdek met hoge wrijving het aantal ongevallen bij nat weer kan doen afnemen met 47 tot 83%, en het totaal aantal ongevallen met 25 tot 57%. Verder blijkt dat de aanleg van langsgroeven het aantal ongevallen bij nat weer vermindert met 70 tot 75% (Reekmans et al., 2004).
2.3.15
Aanpassen van de horizontale geometrie
Het aanpassen van de horizontale geometrie moet ongevallen ten gevolge van een te scherpe bocht voorkomen, en kan overal toegepast worden (Reekmans et al., 2004). In de aanpak van een gevaarlijke punten programma in Australië, zorgde het aanpassen van de horizontale geometrie van bochten voor een reductie van 46% van het aantal ongevallen (Newstead & Corben, 2001). Volgens een metastudie van Elvik (2002) is er slechts een reductie van 16% van het aantal ongevallen. Reekmans et al. (2004) stellen dat het aanpassen van de horizontale geometrie een dure maatregel is die slechts kosteneffectief is in welbepaalde locatiegebonden omstandigheden.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
19
RA-MOW-2011-003
2.3.16
Rijweg afbakening
Verschillende vormen van rijweg afbakening kunnen overal toegepast worden, en hebben als doel het voorkomen van ongevallen waarbij voertuigen uit koers raken door onvoldoende geleiding of een te krappe bochtstraal (Reekmans et al., 2004; Verbokkem et al., 2002). Op basis van internationale literatuur concluderen Reekmans et al. (2004) dat het aantal bermongevallen met 25 tot 45% zal verminderen bij het aanbrengen van een kantstreep, vooral tijdens de nacht. Reekmans et al. (2004) vermelden dat Ogden (1996) op basis van literatuurgegevens stelt dat aanvullende geleiding zoals wegdekreflectoren het aantal bermongevallen en ongevallen door controleverlies in bochten met 30 tot 40% zal verminderen.
2.3.17
Longitudinale geprofileerde markering
Longitudinale geprofileerde markering heeft als doel het aantal ongevallen als gevolg van voertuigen die van de weg geraken (bermongevallen) te verminderen door het geven van een waarschuwing. Het toepassingsgebied van deze maatregel ligt buiten de bebouwde kom op wegen van een hogere categorie en voldoende hoge rijsnelheid (Chen, Darko, & Richardson, 2003; Reekmans et al., 2004). Reekmans et al. (2004) concluderen op basis van internationale literatuurgegevens, waaronder een metastudie, een reductie van het aantal bermongevallen met 18 tot 76%.
2.3.18
Straatverlichting
Het aanbrengen van een goede verlichting heeft als doel de rijtaak te vereenvoudigen en daarmee de verkeersveiligheid en het rijcomfort te verhogen en de verkeersafwikkeling en de sociale veiligheid te verbeteren (Verbokkem et al., 2002). Duisternis is namelijk een belangrijke factor die aan de basis ligt van het onevenredig hoog aantal ongevallen ’s nachts (Commision International de l’Eclairage, 1992). Het plaatsen of verbeteren van straatverlichting op wegen (zowel binnen als buiten stedelijk gebied) zorgt voor een daling van het aantal ongevallen met 13 tot 75%. Voorwaarde is wel dat er op de locatie een probleem is met de zichtbaarheid (Commision International de l’Eclairage, 1992). Newstead en Corben (2001) stellen dat het plaatsen van straatverlichting op kruispunten zorgt voor een daling van 29% van het aantal ongevallen. Elvik et al. (2004) geven resultaten in dezelfde richting.
2.3.19
Ventwegen
Ventwegen hebben als doel het aantal toegangspunten van een hoofdweg te verminderen en parkeren langs de hoofdweg vermijden, om op deze manier het aantal toegangsgerelateerde ongevallen en ongevallen met geparkeerde voertuigen te reduceren (Reekmans et al., 2004). De afwezigheid van geparkeerde voertuigen op de hoofdbaan vermindert het aantal slachtoffers met 20% (Schoon, 2000). Het aantal toegangsgerelateerde ongevallen daalt eveneens bij de aanleg van een ventweg (Reekmans et al., 2004).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
20
RA-MOW-2011-003
2.3.20
Fiets- en voetpaden
De aanleg van fiets- en/of voetpaden heeft als doel het terugdringen van het aantal ongevallen ten gevolge van gemengd verkeer, zoals kop-staart ongevallen, eenzijdige inhaalongevallen, enzovoort… Met andere woorden, het voorkomen van ongevallen tussen verkeer met grote verschillen in snelheid, massa en richting, zoals zwakke weggebruikers en gemotoriseerd verkeer (Elvik & Vaa, 2004; Reekmans et al., 2004; Verbokkem et al., 2002). Een metastudie van Elvik (2002) stelt dat het totaal aantal ongevallen door de aanleg van fiets- en voetpaden daalt met 9%. Elvik & Vaa (2004) bevestigen dit, maar stellen wel vast dat verhoogde voet- en fietspaden het aantal ongevallen met voetgangers en fietsers met respectievelijk 5 en 30% doen dalen, terwijl het aantal ongevallen met uitsluitend gemotoriseerd verkeer stijgt met 16%. Een andere studie, aangehaald in Schoon (2000), vindt een reductie van het aantal fietsslachtoffers bij de aanleg van een fietspad van 25%. Een fietssuggestiestrook zorgt voor een daling van 10% van het aantal fietsslachtoffers (Schoon, 2000). Het verbreden van de voetpaden zorgde bij het Australische gevaarlijke punten programma voor een reductie van 31% van het aantal ongevallen (Newstead & Corben, 2001). Elvik & vaa (2004) vinden geen statistisch significant effect voor het totaal aantal ongevallen bij dubbelrichtingsfietspaden.
2.3.21
Oversteekvoorzieningen voor voetgangers
Oversteekvoorzieningen hebben als doel het vermijden van voetgangerongevallen tijdens het oversteken van de rijweg. Het spreekt voor zich dat dergelijke voorzieningen enkel geplaatst kunnen worden op locaties met voldoende voetgangers, en niet op autosnelwegen (Reekmans et al., 2004). De effecten van geregelde oversteekvoorzieningen zijn reeds eerder besproken. Op basis van internationale literatuur stellen Reekmans et al. (2004) dat het onzeker is of ongeregelde oversteekvoorzieningen ook leiden tot meer verkeersveiligheid voor voetgangers. “Verschillende studies komen tot verschillende conclusies en het effect (positief of negatief) is erg afhankelijk van de plaatselijke situatie (voertuigintensiteit, voertuigsnelheid, aantal rijstroken) en van de manier van uitvoering (zebrapad al dan niet met aangepaste signalisatie, middengeleiders of uitbouw van het voetpad).” (Reekmans et al., 2004). Van Hout et al. (2004) bespreken verschillende studies waaruit blijkt dat (ongeregelde) zebrapaden bij kruispunten een hoger risico op ongevallen lijken te hebben, vooral bij een voertuigstroom van meer dan 100 voertuigen per uur en een 85%-percentiel snelheid vanaf 56 km/h. Metastudies in Elvik (2002) en Elvik & Vaa (2004) stellen dat het aantal voetgangerongevallen met 80% en het aantal ongevallen met motorvoertuigen met 10% daalt indien er een ongelijkvloerse kruising is voor voetgangers.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
21
RA-MOW-2011-003
2.3.22
Snelheidsremmende maatregelen
Snelheidsremmende maatregelen (plateaus, middengeleiders, versmallingen, …) hebben logischerwijze als doel de snelheid te verlagen en/of de aandacht van de bestuurder te vestigen op een naderende gevaarlijke situatie. Er zijn verschillende soorten van maatregelen die zowat overal toegepast kunnen worden, zoals bijvoorbeeld bij het naderen van een rotonde of een kruispunt (Reekmans et al., 2004). Reekmans et al. (2004) concluderen op basis van enkele Nederlandse studies in 30 km/h zones dat snelheidsremmers op wegvakken in verblijfsgebieden het aantal letselongevallen met 15 tot 26% doen dalen. Dwars geprofileerde markering kan volgens een studie in Ogden (1996) zorgen voor een reductie van 51% van het totaal aantal ongevallen, al ligt volgens Elvik & Vaa (2004) de effectiviteit lager.
2.3.23
Overzicht
Onderstaande tabel geeft een overzicht van de beste schattingen met betrekking tot het aantal (letsel)ongevallen voor elk van de maatregelen die besproken werden.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
22
RA-MOW-2011-003
Tabel 2 - Effecten infrastructurele maatregelen Infrastructuurmaatregel Standaardkruispunt - “STOP”-bord Rotonde
VRI klassiek VRI conflictvrij Ongelijkvloerse kruising Bajonetkruispunt Kanalisatie Plateau Ringweg doorgaand verkeer Ontdubbeling weg Vluchtstroken Berm + obstakelvrije zone Fysieke rijrichtingscheiding Verhogen wrijvingsgraad Langsgroeven Aanpassen horizontale geometrie bochten Rijweg afbakening Longitudinale geprofileerde markering Straatverlichting Ventwegen (geen geparkeerde voertuigen op hoofdbaan) Fiets- en voetpaden Ongelijkvloerse kruising voor voetgangers Snelheidsremmende maatregelen
Beste schatting -35% letselongevallen
Bron (Elvik & Vaa, 2004)
-30 tot -50% letselongevallen -50 tot -70% dodelijke ongevallen +27% letselongevallen fietsers -67% letselongevallen
(Daniels et al., 2009)
-32% ongevallen (t.o.v. klassieke VRI) -70% letselongevallen -30% doden -86% ongevallen -33% letselongevallen -60% ongevallen -60% ongevallen -80% letselongevallen -32% letselongevallen -52% -10% -55% -44% -40% -83% -75% -46%
(Schoon, 2000) (Newstead & Corben, 2001) (Elvik & Vaa, 2004) (Reekmans et al., 2004) (Reekmans et al., 2004) (Elvik & Vaa, 2004) (Elvik & Vaa, 2004) (Elvik & Vaa, 2004) (Newstead & Corben, 2001) (Elvik & Vaa, 2004) (Elvik & Vaa, 2004) (Reekmans et al., 2004) (Newstead & Corben, 2001)
-45% bermongevallen -76% bermongevallen
(Reekmans et al., 2004) (Reekmans et al., 2004)
-75% ongevallen (indien probleem met zichtbaarheid) -29% ongevallen -20% slachtoffers
(Commision International de l’Eclairage, 1992) (Newstead & Corben, 2001) (Schoon, 2000)
-30% ongevallen fietser + voetganger -80% voetgangerongevallen -10% ongevallen (auto) -26% letselongevallen
(Elvik & Vaa, 2004)
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
ongevallen ongevallen slachtoffers ongevallen letselongevallen ongevallen (weg = nat) ongevallen ongevallen
(Reekmans et al., 2004) (Reekmans et al., 2004)(CROW, 2002)
23
(Elvik & Vaa, 2004) (Reekmans et al., 2004)
RA-MOW-2011-003
3.
METHODOLOGIE
Het opstellen van een beslissingsboom (“decision tree”) is een dataminingtechniek. In dit deel van de literatuurstudie wordt kort de achtergrond betreffende datamining geschetst en wordt zowel de statistische techniek achter beslissingsbomen die in dit onderzoek gebruikt wordt, recursive partitioning, alsook de beslissingsboom zelf beschreven. Verder wordt er ook uitleg gegeven over de gebruikte software. Er bestaan verschillende softwarepakketten waarmee beslissingsbomen geformuleerd kunnen worden. In dit onderzoek wordt gebruik gemaakt van het programma DTREG. Bij de beschrijving van beslissingsbomen en de achterliggende techniek, zal daar waar nodig vermeld worden hoe DTREG omgaat met de techniek en welke keuzes gemaakt zijn, zoals bijvoorbeeld het omgaan met ontbrekende variabelen, die leiden tot de beslissingsboom.
3.1
Datamining
“Data is wat we verzamelen en opslaan, en kennis is wat ons helpt om beslissingen te nemen. Kennis uit data halen is datamining” (Negnevitsky, 2005). Datamining wordt gebruikt om inzicht te krijgen in de data en belangrijke en bruikbare informatie uit data te halen. De definitie is als volgt: “Datamining is een proces van het ontdekken van waardevolle informatie uit grote hoeveelheden data, opgeslagen in onder andere databases.” Het verschil met traditionele statistiek, waarbij een hypothese wordt gevormd en getest, is dat bij datamining bepaalde patronen, associaties en hypotheses automatisch uit de data gehaald worden (C. Zhang & S. Zhang, 2002). In het algemeen kunnen de taken of activiteiten van datamining in 2 categorieën verdeeld worden: beschrijvende datamining en voorspellende datamining. De eerste beschrijft de dataset op een beknopte manier en geeft interessante eigenschappen weer, terwijl de tweede één of meerdere modellen vormt en voorspellingen probeert te doen voor nieuwe datasets (C. Zhang & S. Zhang, 2002). De dataminingtechniek die in dit onderzoek gebruikt zal worden is classificatie. Classificatie analyseert een dataset en ontwikkelt een model. Dit model kan bijvoorbeeld een beslissingsboom zijn. Een beslissingsboom is in feite een model met een boomvormige structuur, dat door de visuele presentatie eenvoudig te begrijpen is, en het representeert een set van classificatieregels die leiden tot een beslissing. De beslissingsboom is één van de meest gebruikte dataminingtechnieken en is zowel beschrijvend als voorspellend: de beslissingsboom geeft enerzijds weer welke variabelen bepalen aan welke categorie een object wordt toegekend, maar kan anderzijds ook gebruikt worden om objecten van een nieuwe dataset te classificeren (Adeyemo & Kuye, 2006; Breiman, Friedman, Olshen, & Stone, 1984; Negnevitsky, 2005; C. Zhang & S. Zhang, 2002). Beslissingsbomen worden meestal gebruikt voor classificatie, zoals in dit onderzoek het geval is, maar kunnen ook gebruikt worden voor regressie. Naast classificatie bestaan er ook verschillende andere datamining taken, waaronder bijvoorbeeld clustering en
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
24
RA-MOW-2011-003
tijdreeksanalyse (C. Zhang & S. Zhang, 2002). In het kader van dit onderzoek wordt hier echter niet verder op ingegaan.
3.2
De beslissingsboom
De beslissingsboom toont hoe de waarde van de afhankelijke variabele voorspeld kan worden op basis van de waarden van een set onafhankelijke of voorspellende variabelen. Een beslissingsboom bestaat uit knopen (“nodes”), takken (“branches”) en bladeren (“leaves”). Een knoop is een punt in de beslissingsboom waarbij een beslissing moet genomen worden, en een tak is de verbinding tussen twee knopen. Een blad is een knoop aan het uiteinde van een tak en wordt ook soms eindknoop (“terminal node”) genoemd. De bovenste knoop van een beslissingsboom is de wortelknoop (“root node”). Dit is altijd het startpunt van de beslissingsboom, waarna deze naar beneden groeit door de data op elk niveau verder in knopen op te splitsen. De wortelknoop bevat dan ook alle data van de gebruikte dataset. De subknopen bevatten telkens een kleiner wordend deel van de dataset (Negnevitsky, 2005). Afhankelijk van de mate waarin een knoop bij elke stap gesplitst wordt, onderscheiden we binaire beslissingsbomen en multiway trees. Bij een binaire beslissingsboom worden de records in elk van de knopen gesplitst op basis van een binaire vraag (d.i. een vraag met twee uitkomstmogelijkheden). Bij multiway trees kunnen de records in de knopen echter gesplitst worden in meer dan twee takken (Berzal, Cubero, Marín, & Sánchez, 2004). In dit rapport wordt gebruik gemaakt van binaire beslissingsbomen. Omdat de meeste variabelen die gebruikt zullen worden binair zijn, of kunnen omgezet worden in binaire variabelen, is de verwachting dat een binaire beslissingsboom de meest valide representatie van de data zal geven. Bovendien worden binaire bomen in wetenschappelijk onderzoek het vaakst gebruikt. Er zal dan ook niet verder worden ingegaan op multiway trees. Figuur 2 geeft een voorbeeld van een dergelijke binaire beslissingsboom, in de rest van het rapport kortweg “beslissingsboom” genoemd.
Figuur 2 - Voorbeeld beslissingsboom (Sherrod, 2010)
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
25
RA-MOW-2011-003
De rechthoeken in bovenstaande figuur zijn de knopen van de beslissingsboom, die telkens een deel van de dataset vertegenwoordigen. De eerste regel in elke knoop geeft het knoopnummer weer. Knopen 2, 4 en 5 zijn eindknopen. Knoop 1 is de wortelknoop, die alle data van de dataset vertegenwoordigt. Initieel worden dus alle records in de dataset toegewezen aan dezelfde categorie van de afhankelijke variabele. De gekozen categorie waaraan de records in de wortelknoop worden toegewezen is degene die het meest voorkomt (Hill & Lewicki, 2006). De tweede regel geeft de naam van de voorspellende variabele weer die gebruikt is om de knoop te splitsen. De “<=” en “>” tekens geven aan of de waarden van de variabele kleiner dan of gelijk zijn aan, respectievelijk groter zijn dan de waarde gebruikt om de knoop te splitsen. Dit is enkel zo bij continue variabelen. Indien de voorspellende variabele categorisch is, zal in elke knoop vermeld staan welke categorieën van de variabele deze bevat (Sherrod, 2010). “N = …” geeft weer hoeveel records (kruispunten) binnen deze knoop liggen (Sherrod, 2010). De voorlaatste regel geeft de naam van de afhankelijke variabele weer, en de categorie van deze variabele die toegewezen aan de knoop (Sherrod, 2010). In dit onderzoek is de afhankelijke variabele de gekozen kruispuntoplossing. De categorie kan dus bijvoorbeeld “rotonde” of “VRI” zijn. De laatste regel in elke knoop tenslotte geeft het percentage weer van de records in de knoop waarbij de werkelijke categorie van de afhankelijke variabele verschilt van de categorie die aan de knoop toegewezen is door de beslissingsboom, of eenvoudiger gezegd, het percentage van records dat foutief geclassificeerd is (Sherrod, 2010).
3.2.1 Voor- en nadelen van beslissingsbomen Één van de belangrijkste voordelen van beslissingsbomen is dat de oplossing op een eenvoudige manier visueel voorgesteld kan worden, en relatief eenvoudig te interpreteren is. Elk pad kan eenvoudig gevolgd worden doorheen de beslissingsboom. Bovendien kunnen de relaties die gevonden worden ook eenvoudig uitgedrukt worden als een set van regels (Negnevitsky, 2005). Beslissingsbomen kennen ook nadelen. Het maken van beslissingsbomen vereist categorische data, wat betekent dat continue data gegroepeerd moeten worden en zo mogelijk belangrijke verborgen verbanden verloren gaan (Negnevitsky, 2005). DTREG zal continue data automatisch omzetten in categorische data, naargelang het gewenst aantal categorieën door de gebruiker. Hoe meer toegelaten categorieën, hoe smaller en nauwkeuriger de categorieën zijn, maar hoe groter de beslissingsboom wordt (Sherrod, 2010).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
26
RA-MOW-2011-003
Een andere beperking van beslissingsbomen is het feit dat er slechts met één variabele per keer rekening wordt gehouden, wat kan leiden tot een onnodige defragmentatie van de data. Ondanks deze nadelen zijn beslissingsbomen één van de vaakst gebruikte dataminingtechnieken (Negnevitsky, 2005).
3.3
CART & recursive partitioning
Recursive partitioning is de statistische techniek die de basis vormt van Classification and Regression Trees (CART), een beslissingsboomalgoritme. CART is een verdelingsvrije regressiemethode, in Engelstalige literatuur een “nonparametric regression method” genoemd (H. Zhang & Singer, 1999). Dit betekent dat geen enkele variabele in CART verondersteld wordt een bepaalde statistische distributie te volgen (Yohannes & Webb, 1999). Naast CART bestaan er ook andere beslissingsboomalgoritmes, zoals bijvoorbeeld CHAID, ID3 en C4.5 (Berry & Linoff, 1999). Het algoritme dat in dit onderzoek gebruikt wordt is CART, de voor- en nadelen van deze methode worden later besproken.
3.3.1 Variabelen De afhankelijke (“target”, “outcome”) variabele is de variabele waarvoor de waarden gemodelleerd en voorspeld worden door andere variabelen. Er moet één en slechts één afhankelijke variabele zijn. De afhankelijke variabele in dit onderzoek is de gekozen kruispuntoplossing. De onafhankelijke of voorspellende variabelen zijn de variabelen wiens waarden gebruikt worden om de waarde van de afhankelijke variabele te voorspellen. Er moet minstens één onafhankelijke variabele zijn, maar het kunnen er ook meerdere zijn (Sherrod, 2010). Er is dus telkens een afhankelijke variabele Y, die het doel van de studie bepaalt, en een set van p voorspellers, x1, …, xp. Het aantal voorspellers kan variëren en is voor elk probleem anders. Y is een random variabele, x1, …, xp zijn vaste variabelen (Yohannes & Webb, 1999; H. Zhang & Singer, 1999). De variabelen kunnen zowel categorisch als continu zijn. Categorische variabelen kunnen door hun klein aantal discrete categorieën geclassificeerd worden, continue data zijn data die een oneindig aantal waarden kunnen aannemen binnen een bepaald interval. Als de afhankelijke variabele continu is, produceert CART regressiebomen, als deze variabele categorisch is, zijn dit beslissingsbomen (Yohannes & Webb, 1999; H. Zhang & Singer, 1999).
3.3.2 Doel Het statistisch probleem dat zich stelt is het bewijzen van een relatie tussen de random variabele en de vaste variabelen, zodat het mogelijk is om de random variabele Y te voorspellen op basis van de waarden van de vaste variabelen x 1, …, xp. CART is dus een techniek die de belangrijkste variabelen en hun interacties kan selecteren die belangrijk zijn in het bepalen van de afhankelijke variabele (Negnevitsky, 2005; Yohannes & Webb, 1999; H. Zhang & Singer, 1999). Met behulp van CART worden dus de variabelen en hun interacties begrepen die verantwoordelijk zijn voor de afhankelijke variabele (Yohannes & Webb, 1999).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
27
RA-MOW-2011-003
3.3.3 Algemene werking van het algoritme Om beslissingsbomen te bouwen, maakt CART gebruik van een training set (“learning sample”). Een training set is een reeks van bestaande (historische) data met toegewezen klassen voor alle observaties. Een beslissingsboom wordt vertegenwoordigd door een reeks van vragen die de training set splitsen in steeds kleinere delen. Zoals reeds eerder aangehaald zijn de vragen die CART stelt binaire vragen (ja/nee). Het algoritme van CART zal dan vervolgens, in een iteratief proces, zoeken naar alle mogelijke variabelen en waarden om de beste verdeling te vinden. Met de beste verdeling worden twee delen met een maximale homogeniteit bedoeld. Het algoritme zal knopen proberen te vormen waarin één bepaalde klasse domineert (Negnevitsky, 2005; Timofeev, 2004). DTREG zal dus bij elke splitsing twee keuzes maken, namelijk welke variabele gebruikt wordt om de data te splitsen en bij welke waarde of bij welke categorieën de splitsing plaatsvindt. Een splitsingsvariabele kan bij meerdere knopen in de boom gebruikt worden om de data te splitsen (Sherrod, 2010).
3.3.4 Splitsen van knopen DTREG zal elke voorspellende variabele onderzoeken om te kijken in welke mate deze geschikt is om een knoop in twee groepen te verdelen (Sherrod, 2010). Bij een continue variabele wordt een splitsing gemaakt tussen elke discrete waarde van de voorspellende variabele. Het aantal geëvalueerde splitsingen is zo gelijk aan het aantal discrete waarden van de voorspellende variabele min één. De beste splitsing voor de voorspellende variabele in een bepaalde knoop is diegene waar de grootste verbetering van het model plaatsvindt, dit wil zeggen daar waar de laagste heterogeniteit van de afhankelijke variabele in de knoop bereikt wordt. Dit proces wordt herhaald voor elke voorspellende variabele meegenomen in de analyse. Uiteindelijk wordt de beste splitsing van alle voorspellende variabelen gebruikt om de knoop ook daadwerkelijk te splitsen (Sherrod, 2010). Het splitsen van een categorische variabele is complexer. In het geval dat de afhankelijke variabele ook categorisch is, wat in dit onderzoek het geval is, moet elke potentiële splitsing voor elke mogelijke combinatie van categorieën van de voorspellende variabele geëvalueerd worden. Het aantal splitsingen is dan gelijk aan 2(k–1)–1 waarbij k het aantal categorieën van de voorspellende variabele voorstelt (Sherrod, 2010).
3.3.5 Evalueren van splitsingen Het splitsen houdt zoals eerder gezegd in dat de data verdeeld wordt in twee delen met een maximale homogeniteit (Timofeev, 2004). In de ideale situatie wordt de knoop verdeeld in twee subknopen zodat alle waarden van de afhankelijke variabele van de records in de linkerknoop identiek zijn aan elkaar, net zoals de waarden in de rechterknoop identiek zijn aan elkaar, terwijl de waarden in de linkerknoop verschillen van die in de rechterknoop. Zulke perfecte splitsing is vrij zeldzaam en uiteraard alleen mogelijk als de records die gesplitst worden slechts twee mogelijke waarden van de afhankelijke variabele hebben.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
28
RA-MOW-2011-003
De maximale homogeniteit wordt gedefinieerd door de zogenaamde “impurity function”. “Impurity” staat voor de heterogeniteit van de afhankelijke variabele in de knoop en de daling ervan wordt de verbetering van de splitsing genoemd. De twee belangrijkste “impurity functions” zijn de “Gini splitting rule” en de “Twoing splitting rule”. Het Ginialgoritme zal in de training set de grootste klasse zoeken en deze trachten te isoleren van de rest van de data. Het Twoing-algoritme daarentegen, zal de data doorzoeken naar twee klassen die samen uit meer dan 50% van de data bestaan. Naast deze twee methoden zijn er ook verschillende andere methoden beschikbaar om de data te splitsen. Echter, de gekozen methode maakt weinig of niet uit voor de uiteindelijke beslissingsboom (Breiman et al., 1984; Sherrod, 2010; Timofeev, 2004). In de praktijk wordt de Gini splitting rule meestal gebruikt omdat deze over het algemeen iets betere resultaten oplevert (Adeyemo & Kuye, 2006; Sherrod, 2010). In deze studie wordt dan ook het Gini-algoritme gebruikt. Om te bepalen welke categorie van de afhankelijke variabele aan een knoop wordt toegewezen, wordt gekeken naar de misclassificatiekost van de records in de knoop. De gebruikte formule vergelijkt hiervoor ondermeer de distributie van de categorieën van de afhankelijke variabele in de knoop met de distributie in de totale dataset (Sherrod, 2010).
3.3.6 Gewenste grootte van de beslissingsboom Een maximumboom is een boom waarbij de training set gesplitst wordt totdat de eindknopen van de beslissingsboom enkel observaties bevatten van eenzelfde klasse. De eindknopen zijn dus allen zuivere knopen. Dergelijke boom kan resulteren in honderden niveaus en daardoor erg complex worden. Bovendien geeft een kleinere boom meer accurate voorspellingen bij nieuwe data, hoewel dit paradoxaal kan klinken (Sherrod, 2010). Het is daarom nuttig om de grootte van de boom te optimaliseren. Dit houdt in dat niet-significante knopen, en mogelijk zelfs subbomen, van de beslissingsboom afgesneden worden. Dit proces wordt dan ook zeer toepasselijk “snoeien” of “pruning” genoemd. Bij DTREG is het ook mogelijk om een minimumgrootte op te geven waarbij een knoop wordt gesplitst, net zoals het maximum aantal niveaus van de boom. Bij de constructie van een maximumboom in DTREG zal het model niet getest of gesnoeid worden, en wordt daarom ook wel een verkennende boom genoemd (Sherrod, 2010). Voor dit proces, snoeien (“pruning”) genoemd, zijn verschillende algoritmen beschikbaar. Optimalisatie van het aantal records in elke knoop en V-Fold kruisvalidatie (“V-Fold cross-validation”) zijn de belangrijkste methoden (Breiman et al., 1984; Sherrod, 2010; Timofeev, 2004). Bij het eerste algoritme, optimalisatie van het aantal records in elke knoop, zal het splitsen gestopt worden wanneer het aantal observaties in een knoop kleiner is dan een vooraf gedefinieerd aantal. Deze methode is snel, consistent en eenvoudig. Het is duidelijk dat hoe groter het vooraf gedefinieerd aantal, hoe kleiner de uiteindelijke beslissingsboom zal zijn (Sherrod, 2010). Om de optimale grootte van de beslissingsboom te vinden, kan ook de V-Fold kruisvalidatie procedure gebruikt worden. Hierbij wordt een evenwicht gezocht tussen de complexiteit van de beslissingsboom en een zogenoemde misclassificatiekost. De misclassificatiekost geeft aan wat de totale kost is van de door de beslissingsboom foutief
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
29
RA-MOW-2011-003
voorspelde records. Het is mogelijk om de misclassificatiekost voor verschillende soorten foute voorspellingen te variëren (Lewis, 2000). Bijvoorbeeld, bij een beslissingsboom voor het stellen van een diagnose of een patiënt al dan niet een bepaalde ernstige ziekte heeft, zal vaak een zwaardere kost worden gehanteerd voor “false negatives” dan voor “false positives”. Met andere woorden, het wordt als ernstiger ervaren als de boom aangeeft dat een patiënt die de ziekte heeft foutief wordt aanzien als gezond, dan wanneer een gezond persoon de diagnose krijgt de ziekte te hebben. Eerstgenoemde fout kan namelijk catastrofale gevolgen hebben, terwijl de tweede fout vaak enkel ongemak veroorzaakt. De V-fold kruisvalidatie procedure gebruikt eerst de volledige dataset om een beslissingsboom te genereren die groter is dan optimaal. Dit wordt de reference tree genoemd, en is de boom die het beste de volledige dataset fit. Vervolgens wordt de volledige dataset random verdeeld in een aantal subsets van dezelfde grootte. Een vooraf gespecificeerde “V-waarde” bepaalt het aantal subsets (ook wel “folds” genoemd) van de data gevormd uit de training set (Breiman et al., 1984; Sherrod, 2010). Één van de subsets of folds wordt gereserveerd voor gebruik als onafhankelijke test dataset, terwijl de andere subsets gecombineerd worden tot training dataset voor de bouw van het model. Dit betekent dat een beslissingsboom wordt gebouwd op basis van (V-1) folds, waarna deze testboom wordt gebruikt om de data van de test fold te classificeren. De test fold van de dataset wordt dus gebruikt om te testen hoe goed de gegenereerde beslissingsboom functioneert bij een onafhankelijke dataset, die niet gebruikt werd bij het opstellen van de boom (Sherrod, 2010). De procedure voor het bouwen van het model wordt “V” maal herhaald, telkens met een andere subset die dan dienst doet als test dataset. Er worden dus “V” verschillende modellen gebouwd, die telkens getest worden tegen een onafhankelijke subset van de data (Lewis, 2000). Telkens wordt de zogenaamde “cross validation cost” berekend voor elke mogelijke grootte van de boom. De boomgrootte die over de verschillende testbomen heen gemiddeld de laagste cross validation cost heeft, Figuur 3 - Werking "V-fold cross- wordt dan beschouwd als de optimale validation" (Lewis, 2000) boomgrootte (Sherrod, 2010). V-Fold kruisvalidatie is gebaseerd op de gemiddelde prestatie van de verschillende modellen, waardoor die een zeer goede schatting is van de prestatie van het originele model waarbij de volledige dataset wordt gebruikt (Lewis, 2000; Witten & Frank, 1999). Met DTREG is het mogelijk om te kiezen hoeveel kruisvalidatiebomen gebruikt worden voor de validatie van het model. Uit onderzoek blijkt dat een waarde van 10 optimaal is.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
30
RA-MOW-2011-003
Een groter aantal doet de rekentijd sterk toenemen, maar geeft zelden een betere boom. Kruisvalidatie op basis van 10 folds is dan ook in de praktijk de gangbare methode (Witten & Frank, 1999). Kruisvalidatie wordt aangeraden boven andere methoden bij kleine tot middelgrote datasets waarbij de rekentijd minder belangrijk is, wat in dit onderzoek het geval is. Met DTREG is het mogelijk om de boom te snoeien tot het aantal knopen dat zorgt voor de kleinste fout in de kruisvalidatiebomen. Theoretisch is dit de beste grootte van de boom, maar deze kan slechts marginaal beter zijn dan een kleinere boom met een iets grotere fout (Hill & Lewicki, 2006; Sherrod, 2010). Naarmate de boom groter wordt, daalt de misclassificatiekost voor de training dataset. Bij een maximumboom is deze nul. Wanneer gebruik wordt gemaakt van een aparte test dataset ligt dit anders. Wanneer men een test dataset gebruikt, betekent dit dat een onafhankelijke dataset die niet gebruikt werd bij het opstellen van de beslissingsboom, gebruikt wordt om te testen hoe goed de beslissingsboom werkt voor nieuwe data. In de praktijk houdt dit in dat een deel van de verzamelde dataset (vaak ongeveer 1/3 van de data) apart wordt gehouden en niet wordt gebruikt voor het opstellen van de beslissingsboom. Voor een test dataset zal de misclassificatiekost, naarmate de boom groter wordt, eerst dalen tot een minimum, maar voorbij dit punt zal de misclassificatiekost terug beginnen stijgen omdat de data dan “overfitted” wordt (Chang & Wang, 2006). Overfitting betekent dat de beslissingsboom zodanig complex is dat ook de ruis van de dataset wordt gemodelleerd (Adeyemo & Kuye, 2006). Aangezien deze ruis bij een nieuwe dataset anders zal zijn, levert een maximumboom dan ook vaak een zwakke prestatie voor onafhankelijke data. Een overfitted beslissingsboom zal dus een hogere werkelijke misclassificatiekost hebben (Breiman et al., 1984; Timofeev, 2004). Het punt waar de misclassificatiekost van de testset minimaal is, geeft de optimale grootte van de beslissingsboom weer (Chang & Wang, 2006). In dit rapport wordt er voor gekozen om V-fold kruisvalidatie te gebruiken voor het bepalen van de optimale grootte van de boom, en de dataset niet op te splitsen in een training set en een aparte test set. Vanuit methodologisch oogpunt is het gebruik van een aparte test set nochtans te prefereren. Dit geeft namelijk het meeste vertrouwen dat de beslissingsboom goed is in het voorspellen van de afhankelijke variabele bij nieuwe data. Dit geeft een idee over de werkelijke misclassificatiekost. Dit is althans het geval bij voldoende grote datasets, bestaande uit duizenden records, met ten minste enkele honderden records van elke classificatie. De dataset in dit onderzoek bevat slechts 529 records en is dus relatief klein. Diverse auteurs halen aan dat het apart houden van een test set een inefficiënt gebruik is van de beschikbare data wanneer men slechts over een beperkte dataset beschikt (Breiman et al., 1984; Sherrod, 2010; Witten & Frank, 1999). Dit verarmt namelijk de (toch al relatief beperkte) training dataset, waardoor de schatting van de beslissingsboom die hieruit voortvloeit minder betrouwbaar zal zijn (Sherrod, 2010). Het gebruik van de V-fold kruisvalidatie methode geeft het voordeel dat de volledige data kan gebruikt worden bij het opstellen van de beslissingsboom.
3.3.7 Onvolledige data Databases zijn vaak onvolledig, en dat is bij dit onderzoek niet anders. Indien de waarde van de afhankelijke variabele ontbreekt, zit er niets anders op dan de hele record uit de analyse te halen. Het ontbreken van waarden van voorspellende variabelen is een andere zaak. DTREG kent verschillende manieren om hiermee om te gaan. De eenvoudigste
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
31
RA-MOW-2011-003
manier is om de records waar waarden van voorspellende variabelen ontbreken, niet te analyseren. Deze methode kan aangewezen zijn indien de dataset groot is, en het percentage van records met ontbrekende variabelen klein (Sherrod, 2010). Een andere manier is om de ontbrekende waarden van variabelen te vervangen door de mediaan, indien de voorspellende variabelen continu zijn, of door de meest voorkomende categorie bij categorische variabelen (Sherrod, 2010). De meest aangewezen, gesofisticeerde en accurate methode voor de classificatie van records met ontbrekende waarden is het gebruik van surrogaat splitsingsvariabelen (“surrogate splitter variables”). Eenvoudig gezegd zijn dit voorspellende variabelen die de geproduceerde splitsingen van de primaire splitsingsvariabele nabootsen. De resultaten zijn gelijkaardig, maar net iets minder goed dan deze van de primaire variabele. Bij het creëren van een beslissingsboom wordt elke voorspellende variabele bij elke splitsing in de boom geëvalueerd om te bepalen hoe goed het de waarden kan verdelen. Wanneer de beste voorspellende variabele gekend is, worden de andere mogelijke voorspellende variabelen onder de loep genomen en worden hun splitsingen vergeleken met die van de primaire splitsing. Op basis hiervan wordt de associatie tussen beiden berekend. Een associatie van 1 betekent dat een surrogaat splitsingsvariabele exact dezelfde records in de linker- en rechterknoop stopt als de primaire variabele. Een associatie van 0 betekent dat de surrogaat splitsingsvariabele geen beter resultaat kent als gewoon de records in de meest waarschijnlijke groep te steken. Bij het gebruik van surrogaat splitsingsvariabelen zal, wanneer de waarde van de primaire splitsingsvariabele ontbreekt, er in de surrogaatsplitsingen worden gezocht naar een niet-ontbrekende waarde van een surrogaatvariabele (Sherrod, 2010).
3.3.8 Overzicht Samenvattend telt de constructie van een beslissingsboom twee grote stappen. De eerste stap is het bouwen van de boom. Bij elke knoop wordt onderzocht welke variabele het meest geschikt is om deze te splitsen (de splitsingsvariabele), en bij welke waarde dit best gebeurt. Het splitsen van een knoop resulteert in twee subknopen, waarbij de waarde van de splitsingsvariabele bepaalt welke data in de linker- of rechterknoop gaan. Bij dit proces kan er gebruik gemaakt worden van surrogaat splitsingsvariabelen. Het splitsingsproces kan volledig gebeuren, zodat de maximumboom wordt gevormd, of tot een vooraf bepaalde maximumgrootte (Adeyemo & Kuye, 2006). De tweede grote stap omvat het snoeien van de boom. Hiervoor worden een aantal kruisvalidatiebomen gevormd waarbij voor elke mogelijke grootte van de boom de zogenaamde “misclassification cost” wordt berekend. Het algoritme zal tenslotte de oorspronkelijke boom snoeien tot de gewenste grootte (Adeyemo & Kuye, 2006).
3.3.9 Voor- en nadelen CART De CART methode heeft verschillende voordelen. Ten eerste is CART, zoals eerder gezegd, een verdelingsvrije methode. Het vooraf specificeren van een bepaalde distributie of functionele vorm is dus niet nodig. Verder zal CART zelf de significante variabelen selecteren en de niet-significante elimineren. De resultaten van CART zijn ook invariant aan monotone variaties van de onafhankelijke variabelen. Het veranderen van deze variabelen naar bijvoorbeeld hun logaritme of vierkantswortel zal de structuur van
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
32
RA-MOW-2011-003
de beslissingsboom niet veranderen. Uiteraard zullen de splitsingswaarden zelf wel veranderen. Een ander belangrijk voordeel van de CART methode is dat deze goed overweg kan met eventuele uitschieters. Het gebruikte algoritme zal deze meestal isoleren in een aparte knoop. Ook kan CART overweg met zowel numerieke als categorische variabelen (Timofeev, 2004; Yohannes & Webb, 1999). Een laatste voordeel van CART is dat de methode heel effectief is voor het verwerken van grote datasets, doordat het de belangrijkste variabelen kan selecteren (Yohannes & Webb, 1999). Een nadeel van CART is echter dat het telkens splitsen van de data in twee groepen gebaseerd is op slechts één waarde van de mogelijke verschillende verklarende variabelen. Een statistisch model dat voor het splitsen rekening houdt met verschillende variabelen tegelijk kan in sommige gevallen meer aangewezen zijn. In situaties waar de categorie van de afhankelijke variabele afhangt van een combinatie van variabelen, zal de beslissingsboom zwak zijn in het ontdekken van een dergelijke structuur (Breiman et al., 1984; Negnevitsky, 2005; Yohannes & Webb, 1999). Een ander nadeel is dat de CART methode niet gebaseerd is op een probabilistisch model en er dus geen betrouwbaarheidsintervallen zijn voor de voorspellingen van CART. Het vertrouwen in CART is dus gebaseerd op de nauwkeurigheid van de voorspellingen in het verleden onder gelijkaardige omstandigheden, of anders gezegd, de geproduceerde beslissingsbomen zijn net zo goed als de data waarmee ze tot stand gekomen zijn. Het is dus belangrijk om de data vooraf grondig te cleanen (Breiman et al., 1984; Negnevitsky, 2005; Yohannes & Webb, 1999). Een laatste nadeel is tenslotte dat de in dit onderzoek gebruikte dataset, naar de maatstaven van een CART-analyse, vrij klein is. De dataset bestaat slechts uit 529 records, terwijl bijvoorbeeld datasets van warenhuizen die CART-analyse gebruiken om koopgedrag van consumenten te onderzoeken vaak duizenden records bevatten. Dit is nadelig omdat er doorheen de constructie van de boom een constante datafragmentatie plaatsvindt. Dit betekent dat de kans reëel is dat er voor bepaalde categorieën te weinig records zullen zijn om harde conclusies te kunnen trekken. Hierbij moet echter vermeld worden dat de dataset naar de maatstaven van verkeerskundig onderzoek wel relatief groot is. Het is onrealistisch om een dataset van duizenden gevaarlijke punten te verwachten, zeker in een vrij beperkt onderzoeksgebied zoals Vlaanderen. Het feit dat in de literatuurstudie geen gelijkaardige onderzoeken werden teruggevonden bevestigt dit.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
33
RA-MOW-2011-003
4.
DATA
De data die gebruikt worden in dit rapport zijn afkomstig van een bestaande database van TV3V die werd gereorganiseerd om tot een geschikt formaat voor de analyses te komen. De dataset dateert van 2010; de laatste gegevens werden van TV3V verkregen in de loop van maart van dat jaar. De gegevens uit de voorsituatie en de verkeersintensiteiten zijn voornamelijk afkomst uit de dossiers van TV3V voor de Provinciale Auditcommissie. Deze dossiers dateren van de jaren 2003-2008. Voor een aantal gevaarlijke punten was nog onvoldoende informatie beschikbaar. Na het opkuisen van de data kon er uiteindelijk gewerkt worden met de gegevens van 529 kruispunten. Een aantal variabelen uit de database, zoals de aanwezige voetgangersvoorzieningen, openbaar vervoervoorzieningen, parkeermogelijkheden of oversteekvoorzieningen zullen niet in de analyse meegenomen worden omdat deze hoogstwaarschijnlijk geen of weinig effect zullen hebben op de uiteindelijke oplossing. Bovendien ontbraken bij deze variabelen vele waarden in de database, en ligt een goede indeling van deze variabelen niet voor de hand. Ook het aantal bestaande opstelstroken zal niet meegenomen worden. Ook hier is een functionele indeling moeilijk te maken, en bovendien zou er al snel een (te) groot aantal variabelen ontstaan. De afhankelijke variabele is “Kruispuntoplossing na”. Alle anderen zijn onafhankelijke of voorspellende variabelen. In de rest van dit hoofdstuk zullen de gebruikte variabelen geanalyseerd worden aan de hand van beschrijvende statistieken.
4.1
Overzicht variabelen database
4.1.1 Prioriteitscode ante Oorspronkelijk was het de bedoeling om te werken met het aantal ongevallen op de locaties. Bij verschillende records in de database ontbraken echter ongevalgegevens. De prioriteitscode van het zware punt voor de heraanleg was echter bijna overal beschikbaar. Deze waarde wordt berekend aan de hand van de formule “5*D+3*Z+1*L”, waarbij “D” staat voor het aantal doden, “Z” voor het aantal zwaargewonden en “L” voor het aantal lichtgewonden. Deze variabele is een continue variabele. Figuur 4 geeft een visueel overzicht van de verdeling van de waarden van de variabele, die variëren tussen 7 en 112. Dit is opmerkelijk omdat de prioriteitscode minimaal 15 moet bedragen om te kunnen spreken van een gevaarlijk punt (+ er moeten minstens 3 ongevallen op 3 jaar tijd hebben plaatsgevonden) (Vaneerdewegh, 2009). Telkens één kruispunt heeft een prioriteitscode van 7, 8 of 13. Waarschijnlijk is dit een fout in de database. Doordat het slechts om 3 punten gaat, zal dit normaal geen verdere invloed hebben op de analyse. Verder hebben 19 records in de database een waarde 0. Deze zijn niet weergeven in het onderstaande histogram. Bij de analyse van de data met DTREG is ervoor gezorgd dat de records met een waarde 0 als ontbrekende waarden werden beschouwd, en niet als records met een numerieke waarde 0. Uit het histogram is duidelijk af te leiden dat het grootste deel van de records een prioriteitscode heeft tussen 15 en 35.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
34
RA-MOW-2011-003
Prioriteitscode ante 45 40
Frequentie
35 30 25 20 15 10 5
111
103
95
87
79
71
63
55
47
39
31
23
15
0
Verzamelbereik
Figuur 4 - Prioriteitscode ante
4.1.2 Type kruispunt voor Figuur 5 beschrijft de waarden van de variabele “type kruispunt voor”. Dit is een categorische variabele die de inrichting van het gevaarlijke punt beschrijft vóór het werd heringericht. T- en Y-kruispunten worden samengevoegd tot één categorie omdat het op zich ongeveer om hetzelfde soort kruispunt gaat. In de database werd er oorspronkelijk een onderscheid gemaakt tussen kruispunten met 5 takken en 6 of meer takken. Omwille van hun beperkt aantal is ervoor gekozen om deze in één categorie te plaatsen. Het blijkt dat meer dan de helft van de gevaarlijke punten voor de herinrichting orthogonale viertakskruispunten waren. 20% van de gevaarlijke punten waren T- of Yvormige drietakskruispunten. Andere types zoals wegvakken, rotondes en kruispunten met meer dan 4 takken blijken minder frequent voor te komen.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
35
RA-MOW-2011-003
Type kruispunt voor 17; 3% 29; 5% 7; 1% 8; 2%
305; 58% Viertakskruispunt (orthogonaal)
105; 20%
Viertakskruispunt (diagonaal) T-kruispunt / Y-kruispunt Wegvak Rotonde
58; 11%
5 en meer takken Onbekend
Figuur 5 - Type kruispunt voor de herinrichting Voor de analyse met DTREG is volgende codering gebruikt: Viertakskruispunt (orthogonaal)
1
Viertakskruispunt (diagonaal)
2
T-kruispunt / Y-kruispunt
3
Wegvak
5
Rotonde
6
5 en meer takken
7
Onbekend
?
4.1.3 Signalisatie kruispunt voor De categorische variabele “signalisatie kruispunt voor” geeft de signalisatie van het kruispunt weer vóór de heraanleg. De data voor deze variabele worden weergegeven in Figuur 6. Bij één kruispunt in de database werd vermeld “VRI en voorrangsgeregeld”. Dit kruispunt werd ingedeeld bij de categorie “VRI”. Het blijkt dat VRI en voorrangsgeregeld kruispunt elk ongeveer in ongeveer de helft van de gevallen aanwezig waren voor de herinrichting van het kruispunt.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
36
RA-MOW-2011-003
Signalisatie kruispunt voor 2; 0%
253; 48% 274; 52% VRI Ander Onbekend Figuur 6 - Signalisatie kruispunt voor heraanleg
4.1.4 Kruispuntoplossing na De variabele “kruispuntoplossing na” is de afhankelijke of target variabele. Het is een categorische variabele die de gekozen kruispuntoplossing weergeeft. De oorspronkelijke database bevat te veel verschillende categorieën. Daarom is beslist om enkele categorieën samen te nemen. “Rechts in, rechts uit”, “tunnel zonder uitwisseling”, “hollands complex met brug”, “hollands complex met tunnel” en “afsluiten” worden tot één categorie samengevoegd omdat het in het algemeen over hetzelfde gaat, namelijk het voorkomen van kruisende bewegingen. Daarnaast werd een categorie gemaakt met andere oplossingen, waaronder bijvoorbeeld snelheidsbeperkingen, verkeersplateaus, plaatsing van camera’s, …, omdat de oorspronkelijke categorieën te weinig records bevatten voor een bruikbare analyse. De verdeling van de data over de verschillende categorieën is weergegeven in Figuur 7.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
37
RA-MOW-2011-003
Kruispuntoplossing na
47; 9% 43; 8%
155; 30%
VRI conflictvrij (+infra) Rotonde Voorrangsgeregeld
34; 6%
VRI klassiek (+infra)
78; 15%
80; 15% 92; 17%
Herinrichting wegvak, doortochtkruispunt Rechts in, rechts uit; tunnel zonder uitwisseling; hollands complex met brug; hollands complex met tunnel; afsluiten Snelheidsbeperking, camera's, plateau, fietsbrug, fietstunnel, fietsoversteekplaats, verbetering verlichting, andere, …
Figuur 7 - Kruispuntoplossing na herinrichting Voor de analyse met DTREG is volgende codering gebruikt: VRI conflictvrij (+infra)
1
Rotonde
2
Voorrangsgeregeld
4
VRI klassiek (+infra)
5
Herinrichting wegvak, doortochtkruispunt
6
Rechts in, rechts uit; tunnel zonder uitwisseling; hollands complex met brug; hollands complex met tunnel; afsluiten 7 Snelheidsbeperking, camera's, plateau, verbetering verlichting, andere, …
fietsbrug, 3
fietstunnel,
fietsoversteekplaats,
Op basis van de gebruikte dataset is het moeilijk om een eenvoudige tabel te maken waarin duidelijk te zien is hoe de kruispuntoplossingen in de voorsituatie en de nasituatie al dan niet met elkaar overeenkomen of hoe de nieuwe situatie verschilt ten opzichte van de vorige situatie. De reden hiervoor is een andere indeling in categorieën zoals duidelijk blijkt uit voorgaande grafieken. Met de oplossingsmatrix die opgesteld werd door TV3V (2006) (zie Tabel 3), is dit wel mogelijk. Let wel, deze matrix bevat gegevens van 659 kruispunten, wat meer is dan de gebruikte dataset, die gegevens bevat over 529 kruispunten.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
38
RA-MOW-2011-003
Tabel 3 - Oplossingsmatrix (TV3V, 2006)
Uit deze oplossingsmatrix valt reeds af te leiden dat het type kruispunt in de voorsituatie (Voorrangsgeregeld, VRI, …), een belangrijke rol zal spelen voor het bepalen van de nasituatie. Dit wordt in de latere analyse ook bevestigd. Het blijkt dat de voorgestelde oplossing vaak gelijkaardig is aan de bestaande toestand. Bijvoorbeeld, als het kruispunt in oude toestand geregeld werd met VRI, is de kans vrij groot dat dit ook na de herinrichting het geval is. Dit biedt uiteraard het voordeel dat de kostprijs van de herinrichting relatief laag blijft.
4.1.5 Totale ochtendintensiteit Als intensiteitsmaat is er gekozen voor de totale ochtendintensiteit vóór de heraanleg, omdat de ochtendspits meestal geconcentreerder verloopt dan de avondspits. De totale ochtendintensiteit wordt bepaald door de intensiteiten van elk type weggebruiker op elke tak op te tellen. Deze variabele is een continue variabele wordt uitgedrukt in personenauto-equivalent per uur (pae/uur). Dit is een getal dat rekening houdt met de samenstelling van het verkeer. Het rekent de diverse vervoerwijzen om naar de impact van een vervoermiddel op de verkeersstroom. Concreet betekent dit bijvoorbeeld dat een vrachtwagen een hogere waarde krijgt, omdat hij door zijn karakteristieken (bv. lengte en beperkt acceleratievermogen) zwaarder weegt op de doorstroming op een weg dan een personenwagen. Een vrachtwagen wordt bij een intensiteitstelling traditioneel 2 à 3 maal zo zwaar gewogen als een personenwagen. De waarde varieert in deze dataset tussen 150 en 6887 pae/uur. Voor de visualisatie van de variabele zijn de intensiteitswaarden in Figuur 8 verdeeld in categorieën. De meeste waarden bevinden zich tussen 1000 en 3000 pae/uur.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
39
RA-MOW-2011-003
Totale ochtendintensiteit
83; 16%
73; 14%
22; 4% 40; 8% [0-999] 192; 36%
[1000-1999] [2000-2999]
119; 22%
[3000-3999] [> 4000] Onbekend
Figuur 8 - Totale ochtendintensiteit (pae/uur)
4.1.6 Categorisering 1 De variabele “categorisering 1” (Figuur 9) is een categorische variabele en geeft de categorisering weer van de hoofdweg op het kruispunt. In 43% van de gevallen blijkt de hoofdweg een secundaire weg. Ook primaire wegen zijn vrij vaak (in 30% van de gevallen) de hoofdweg op een gevaarlijk punt.
Categorisering 1
45; 9% 14; 3% 80; 15%
157; 30%
Hoofdweg Primair Secundair
233; 43%
Lokaal Onbekend
Figuur 9 - Categorisering 1
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
40
RA-MOW-2011-003
4.1.7 Categorisering 2 “Categorisering 2” is een categorische variabele en geeft de “hoogste” categorisering weer van de niet-hoofdweg(en) op het kruispunt. Met de “hoogste” categorisering wordt bedoeld dat indien, één van de niet-hoofdwegen een secundaire weg is en een andere niet-hoofdweg een lokale weg is, de waarde van de variabele “secundair” wordt. De waarden van “categorisering 2” worden weergegeven in Figuur 10. In twee derde van de gevallen blijkt de niet-hoofdweg op het kruispunt een lokale weg te zijn.
Categorisering 2 1; 0% 12; 2% 94; 18%
73; 14%
Hoofdweg Primair 349; 66%
Secundair Lokaal Onbekend
Figuur 10 - Categorisering 2
4.1.8 Fietsroutenetwerk Deze categorische variabele geeft weer of er een route van het fietsroutenetwerk aanwezig is op één van de toeleidende wegen. Dit kan zowel een lokale als een bovenlokale, functionele of recreatieve fietsroute zijn. De resultaten zijn weergegeven in Figuur 11. Het valt op dat bij zeer veel gevaarlijke punten een fietsroute aanwezig is.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
41
RA-MOW-2011-003
Fietsroutenetwerk
90; 17%
5; 1%
434; 82%
Ja Nee Onbekend
Figuur 11 - Fietsroutenetwerk Voor de analyses met DTREG is de volgende codering gebruikt: Ja
1
Nee
0
Onbekend
?
4.1.9 Ruimtelijke context De categorische variabele “ruimtelijke context” heeft betrekking op de ligging van het kruispunt: binnen of buiten de bebouwde kom. Uit Figuur 12 blijkt dat het merendeel van de gevaarlijke punten buiten de bebouwde kom gelegen is.
Ruimtelijke context
43; 8% 151; 29%
335; 63%
BiBeKo BuBeKo Onbekend
Figuur 12 - Ruimtelijke context
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
42
RA-MOW-2011-003
4.1.10
Max. snelheid 1
De variabele “Max. snelheid 1” geeft de hoogste toegelaten maximumsnelheid op één van de takken weer vóór de heraanleg. De variabele is categorisch. Bij enkele records werd de maximumsnelheid vermeld als 20, 60 of 80 km/h. Om het aantal categorieën te beperken, werden deze snelheden telkens ingedeeld bij de dichtstbijzijnde hogere categorie. De resultaten worden weergegeven in Figuur 13. Een maximumsnelheid van 50 km/u blijkt het meest voor te komen op de hoofdtak van de gevaarlijke punten (37%). Het verschil is niet zo heel uitgesproken, want ook een maximumsnelheid van 70 km/u (25%) en van 90 km/u (24%) blijkt op veel gevaarlijke punten voor te komen. Gevaarlijke punten met een maximumsnelheid op de hoofdrijrichting van 30 km/u blijken zeldzaam. Ook gevaarlijke punten met een maximumsnelheid van 120 km/u op de hoofdrijrichting komen weinig voor.
Max. snelheid 1
61; 12%
7; 1%
3; 1%
129; 24%
120 km/h 199; 37%
90 km/h 70 km/h
130; 25%
50 km/h 30 km/h Onbekend
Figuur 13 - Max. snelheid 1
4.1.11
Max. snelheid 2
De categorische variabele “Max. snelheid 2” geeft de hoogste toegelaten maximale snelheid op één van de takken van de niet-hoofdweg(en) weer vóór de heraanleg. Ook hier werd het aantal categorieën beperkt door records met de waarde 20, 60 of 80 km/u in te delen bij de dichtstbijzijnde hogere categorie. De resultaten zijn weergegeven in Figuur 14. De resultaten zijn vergelijkbaar met die voor de maximale rijsnelheid op de hoofdrijweg (Figuur 13).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
43
RA-MOW-2011-003
Max. snelheid 2
94; 18%
5; 1% 104; 20%
11; 2%
120 km/h 119; 22%
90 km/h 70 km/h
196; 37%
50 km/h 30 km/h Onbekend
Figuur 14 - Max. snelheid 2
4.1.12
Fietsvoorzieningen
De categorische variabele “fietsvoorzieningen” is weergegeven in Figuur 15 en geeft de “hoogste” fietsvoorziening weer op één van de takken van het gevaarlijk punt, vóór de heraanleg. Bij iets meer dan de helft van de gevaarlijke punten blijkt de “hoogste” fietsvoorziening een aanliggend fietspad.
Fietsvoorzieningen
45; 9% 20; 4%
105; 20%
66; 12%
Vrijliggend Aanliggend 293; 55%
Fietssuggestiestrook Gemengd Onbekend
Figuur 15 - Fietsvoorzieningen
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
44
RA-MOW-2011-003
4.1.13
Land use
De categorische variabele “Land use” geeft het dominante grondgebruik weer rond het kruispunt (Figuur 16). Het groot aantal categorieën in de oorspronkelijke database was echter onbruikbaar omwille van praktische redenen. Daarom is beslist het aantal categorieën terug te brengen tot vijf, zijnde: “gemeenschapsvoorzieningen”, “wonen”, “industrie”, “groen” en “agrarisch”. Het overgrote deel (63%) van de gevaarlijke punten blijkt zich te bevinden in een omgeving waar het omliggende grondgebruik voornamelijk gekenmerkt wordt door de functie “wonen”.
Land use 14; 3% 58; 11%
336; 63%
45; 9%
76; 14% wonen industrie groen agrarisch gemeenschapsvoorzieningen
Figuur 16 - Grondgebruik rond het gevaarlijke punt
4.1.14
Middenberm 1
De categorische variabele “Middenberm 1” geeft de aanwezigheid weer van een middenberm op één van de takken van de hoofdweg vóór de heraanleg. Uit Figuur 17 blijkt dat op meer dan de helft van de gevaarlijke punten geen middenberm aanwezig is op een tak van de hoofdrijrichting.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
45
RA-MOW-2011-003
Middenberm 1
49; 9% 190; 36%
290; 55% Ja Nee Onbekend
Figuur 17 - Middenberm 1
4.1.15
Middenberm 2
De categorische variabele “Middenberm 2” geeft de aanwezigheid weer van een middenberm op één van de takken van de niet-hoofdweg(en) vóór de heraanleg. Uit Figuur 18 blijkt dat het aantal gevaarlijke punten met een middenberm op één van de takken van de niet-hoofdweg beperkt is.
Middenberm 2
58; 11%
76; 14%
395; 75%
Ja Nee Onbekend
Figuur 18 - Middenberm 2
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
46
RA-MOW-2011-003
4.1.16
Aantal rijstroken 1
De categorische variabele “Aantal rijstroken 1” geeft het maximaal aantal rijstroken per rijrichting op één van de takken van de hoofdweg weer vóór de heraanleg. 54% van de gevaarlijke punten hebben slechts 1 rijstrook per rijrichting. Bij 37% van de gevaarlijke punten heeft minstens 1 tak van de hoofdweg 2 rijstroken per rijrichting.
Aantal rijstroken 1
42; 8% 5; 1%
287; 54%
195; 37%
1 2 3 Onbekend
Figuur 19 - Aantal rijstroken 1
4.1.17
Aantal rijstroken 2
De categorische variabele “Aantal rijstroken 2” geeft het maximaal aantal rijstroken per rijrichting op één van de takken van de niet-hoofdweg(en) weer vóór de heraanleg. Het blijkt dat in 79% van de gevallen de niet-hoofdwegen slechts 1 rijstrook per rijrichting hebben.
Aantal rijstroken 2
61; 12% 2; 0% 45; 9%
421; 79%
1 2 3 Onbekend
Figuur 20 - Aantal rijstroken 2
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
47
RA-MOW-2011-003
5.
ANALYSE
5.1
Maximumboom
De analyse start met de constructie van de maximumboom. De maximumboom heeft zeker niet de optimale grootte en door de hoge complexiteit is ze moeilijk te interpreteren. Ze zal ook slecht presteren bij voorspellingen met nieuwe data. De reden om met de maximumboom te starten is dat bepaalde structuren later in gesnoeide bomen kunnen terugkomen, en dat gekeken kan worden welke variabelen weinig of geen belang hebben en dus niet verder mee in de analyse moeten worden genomen. Het opstellen van de maximumboom is dus verkennend. Bij de maximumboom is “Kruispuntoplossing na” uiteraard de afhankelijke variabele. Alle andere variabelen die beschreven werden in het vorige hoofdstuk zijn de voorspellende variabelen. Deze worden allemaal meegenomen voor de constructie van de maximumboom, zoals in Figuur 21 te zien is. Hier wordt ook aangegeven welke de categorische en de continue variabelen zijn en welke variabelen niet-numerieke waarden hebben.
Figuur 21 - Input gegevens variabelen DTREG Bij de constructie van de maximumboom zal, net als bij alle andere beslissingsbomen, het Gini-algoritme gebruikt worden. Het maximum aantal niveaus van de boom wordt logischerwijze ingesteld op onbeperkt, de minimum splitsingswaarde op 2.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
48
RA-MOW-2011-003
Figuur 22 - Instellingen maximumboom De resulterende maximumboom telt 19 niveaus en maar liefst 266 eindknopen, waardoor het onmogelijk is deze in dit rapport weer te geven. Bovendien bevat de database slechts gegevens van 529 punten, waardoor elke eindknoop slechts enkele punten zal bevatten. Het is dan ook duidelijk dat deze beslissingsboom in de praktijk weinig bruikbaar is. Op de volgende pagina is een vereenvoudigd deel van de maximum beslissingsboom weergegeven. Elke knoop bevat volgende informatie: het knoopnummer, de categorie waaraan de afhankelijke variabele toegewezen werd en het percentage foutief geclassificeerde records.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
49
RA-MOW-2011-003
Figuur 23 - Vereenvoudigde weergave deel van de maximumboom
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
50
RA-MOW-2011-003
5.1.1 Wortelknoop Indien alleen naar de wortelknoop (knoop 1) wordt gekeken, zou elk kruispunt ingedeeld worden bij “VRI conflictvrij (+ infra)”. Dit is logisch vermits de wortelknoop de volledige dataset bevat en conflictvrije VRI in ongeveer 30% van de gevallen de gekozen kruispuntoplossing is (zie Tabel 5). 70,70% van de data in de wortelknoop is dan ook foutief geclassificeerd. Tabel 4 bevat alle gegevens van de wortelknoop. In de geconstrueerde maximumboom splitst de wortelknoop zich met behulp van de variabele “Totale ochtendintensiteit”. De splitsingswaarde bedraagt 1741,1667. Zoals eerder in dit rapport werd gesteld, wordt bij een continue variabele een splitsing gemaakt tussen elke discrete waarde van de voorspellende variabele. Het aantal geëvalueerde splitsingen is zo gelijk aan het aantal discrete waarden van de variabele min één. Maar zoals te zien is op Figuur 22 is het maximaal aantal categorieën voor voorspellende variabelen beperkt tot 200. Doordat er een stuk meer discrete waarden zijn voor deze variabele dan 200, worden verschillende waarden gegroepeerd, wat een kommagetal als splitsingsvariabele verklaart (Sherrod, 2010). De output in Tabel 4 toont dat de verbetering in misclassificatie 0,058566 bedraagt. De belangrijkste concurrerende splitsingsvariabele is “Signalisatie kruispunt voor”, met een verbetering in misclassificatie van 0,034. De twee belangrijkste surrogaat splitsingsvariabelen zijn “Aantal rijstroken 1" en "Signalisatie kruispunt voor” met een associatie van respectievelijk 0,342 en 0,329. Tabel 4 - Output wortelknoop maximumboom
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
51
RA-MOW-2011-003
Tabel 5 - Verdeling categorieën
5.1.2 Subknopen wortelknoop a. Knoop 2 Indien de intensiteitswaarde kleiner is dan 1741,1667 moet de linkertak gevolgd worden (knoop 2). Kruispunten worden nu toegewezen aan categorie 4 (voorrangsgeregeld kruispunt). Het percentage foutief geclassificeerde records daalt tot 67,68%. Op basis van de maximumboom kan er dus gesteld worden dat er 32,32% kans is dat de gekozen kruispuntoplossing een voorrangsgeregeld kruispunt is indien de totale ochtendintensiteit op een kruispunt kleiner is dan 1741,1667 pae/uur. Opmerkelijk is dat 85 van de 92 kruispunten (92,4%) waarbij de oplossing een voorrangsgeregeld kruispunt is, zich in deze knoop bevinden. Ook 52 van de 80 punten (65%) waarbij de oplossing een rotonde is, bevinden zich in deze knoop. Dit valt af te leiden uit Tabel 5 en Tabel 6.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
52
RA-MOW-2011-003
Tabel 6 - Output knoop 2 maximumboom
b. Knoop 3 Indien de intensiteitswaarde groter is dan 1741,1667 moet de rechtertak gevolgd worden (knoop 3). Kruispunten worden hier nog steeds toegewezen aan categorie 1 (VRI conflictvrij). Het percentage foutief geclassificeerde records daalt tot 50,79%. Er kan dus gesteld worden dat, indien de totale ochtendintensiteit op een kruispunt groter is dan 1741,1667 pae/uur, er 49% kans is dat de gekozen kruispuntoplossing een conflictvrije VRI is. Deze knoop bevat gegevens van 254 kruispunten. 80,6% van de records met als kruispuntoplossing “VRI conflictvrij (+infra)” bevinden zich in deze knoop. Ook 31 van de 43 kruispunten (72,1%) van categorie 7 (tunnel, hollands complex,…) bevinden zich in deze knoop (deze waarden vallen af te leiden uit Tabel 5 en Tabel 7).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
53
RA-MOW-2011-003
Tabel 7 - Output knoop 3 maximumboom
Er kan dus geconcludeerd worden dat de intensiteitswaarde een belangrijke voorspellende variabele is voor een voorrangsgeregeld kruispunt of een conflictvrije VRI. 92,4% van de voorrangsgeregelde kruispunten heeft een intensiteitswaarde kleiner dan 1741,1667 pae/uur, 80,6% van de kruispunten uitgerust met een conflictvrije VRI heeft een intensiteit groter dan 1741,1667 pae/uur. Ook kruispuntoplossingen van categorie 6 (“Herinrichting wegvak, doortochtkruispunt”) blijken met behulp van deze intensiteitswaarde goed te voorspellen. 82,35% van dergelijke kruispunten hebben namelijk een intensiteitswaarde kleiner dan 1741,1667. Knoop 3 wordt op zijn beurt opnieuw gesplitst op basis van de totale ochtendintensiteit. De splitsingswaarde bedraagt nu 2858,3688. De belangrijkste concurrerende splitsingsvariabele is opnieuw “Signalisatie kruispunt voor”, met een iets kleinere verbetering.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
54
RA-MOW-2011-003
c. Knoop 286 / 287 / 468 Indien de totale ochtendintensiteit kleiner is dan 2858,3688 moet de linkertak gevolgd worden (knoop 286), en indien ze groter is, wordt de rechtertak gevolgd (knoop 287). Uit knoop 287 kan afgeleid worden dat, indien de totale ochtendintensiteit op een kruispunt groter is dan 2858,3688 pae/uur, er 62,65% kans is dat de gekozen kruispuntoplossing een conflictvrije verkeersregelinstallatie is. De knoop bevat in deze fase 83 records. 33,5% van de kruispunten waarbij de oplossing een conflictvrije VRI is, bevinden zich in deze knoop, en 47,1% van hen bevinden zich in knoop 286. Dit valt af te leiden uit Tabel 5 en de output van de genoemde knopen. Knoop 287 wordt gesplitst op basis van de variabele “Max. snelheid 2”. Indien de waarde van deze variabele 70 (of 30) bedraagt, komen de records terecht in knoop 468, waar 77,42% van de records juist geclassificeerd worden. Echter, de knoop bevat op dat moment nog slechts 31 records. d. Knoop 2 Nu wordt er teruggegaan naar knoop 2. Deze bevat de records waarvan de totale ochtendintensiteit kleiner is dan 1741,1667 pae/uur. Knoop 2 wordt gesplitst op basis van de variabele “Signalisatie kruispunt voor”. Kruispunten die vroeger geregeld werden met een VRI volgen de linkertak (knoop 4), vroegere voorrangsgeregelde kruispunten volgen de rechtertak (knoop 5). e. Knoop 4 Knoop 4 bevat 59 records. De kruispunten worden voor 44,07% juist ingedeeld, namelijk in categorie 5 “VRI klassiek (+ infra)”. Op basis van de maximumboom kan er dus gesteld worden dat, indien de totale ochtendintensiteit op een kruispunt kleiner is dan 1741,1667 pae/uur en indien het kruispunt vroeger geregeld werd met een VRI, er 44,07% kans is dat de gekozen kruispuntoplossing een klassieke verkeersregelinstallatie is. 33,3% van de kruispunten met een klassieke VRI bevindt zich in deze knoop. Dit valt af te leiden uit Tabel 5 en de output van knoop 4. f.
Knoop 5 / 66
Knoop 5 bevat 204 records. De kruispunten worden voor 41,67% juist ingedeeld, namelijk in categorie 4 (“Voorrangsgeregeld kruispunt”). Er kan dus gesteld worden dat, indien de totale ochtendintensiteit op een kruispunt kleiner is dan 1741,1667 pae/uur en indien het kruispunt vroeger een voorrangsgeregeld kruispunt was, er 41,67% kans is dat de gekozen kruispuntoplossing opnieuw voorrangsgeregeld is. Bovendien zitten nog steeds 92,4% van de records waarbij de kruispuntoplossing een voorrangsgeregeld kruispunt is in deze categorie (85 van de 92). Dit valt af te leiden uit Tabel 5 en de output van knoop 5. Knoop 5 splitst de records op basis van de ruimtelijke context. Knoop 66, waarbij de kruispunten buiten de bebouwde kom gelegen zijn, telt een misclassificatie percentage van 56,26%, maar bevat 68,5% (of 63 records van de 92) van de kruispunten die na herinrichting voorrangsgeregeld zijn. Dit valt af te leiden uit Tabel 5 en de output van knoop 66.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
55
RA-MOW-2011-003
Hieruit kunnen we concluderen dat de intensiteitswaarde (met een grenswaarde van 1741,1667 pae/uur), de vroegere signalisatie van het kruispunt en (in iets mindere mate) de ruimtelijke context belangrijke voorspellers zijn voor voorrangsgeregelde kruispuntoplossingen. Het is logisch dat deze maximumboom verder in detail besproken kan worden, in theorie zelfs elke knoop. In de praktijk zou dit echter veel te complex worden, en bovendien weinig relevant. Veel dieper in detail gaan zou resulteren in het bespreken van knopen met slechts enkele records, wat statistisch gezien weinig waarde heeft. Bovendien worden de beslissingsregels dan zo lang dat ze niets meer verklaren.
5.1.3 Misclassificatie Uit de literatuurstudie is gebleken dat bij een maximumboom de misclassificatie 0 bedraagt. De misclassificatie van de maximumboom is samengevat in Tabel 8. In de maximumboom blijkt de misclassificatie (in de eindknopen, niet de hiervoor besproken knopen!) van alle categorieën van de afhankelijke variabele te schommelen tussen 0 en 3%, wat verwaarloosbaar klein is. Er is echter één uitzondering. Categorie 3 (Snelheidsbeperking, camera's, plateau, fietsbrug, fietstunnel, fietsoversteekplaats, verbetering verlichting, andere, …) heeft een onverklaarbare misclassificatie van 17%, al moet er wel bij vermeld worden dat het aantal records in deze categorie relatief beperkt is. Tabel 8 - Misclassificatie maximumboom Actual
Misclassified
Category
Count
Weight
Count
Weight
Percent
Cost
1
155
155
3
3
1.935
0.019
2
80
80
2
2
2.500
0.025
3
47
47
8
8
17.021
0.170
4
92
92
0
0
0.000
0.000
5
78
78
1
1
1.282
0.013
6
34
34
1
1
2.941
0.029
7
43
43
0
0
0.000
0.000
Total
529
529
15
15
2.836
0.028
In Tabel 9 is de “confusion matrix” van de maximumboom weergegeven. Deze geeft gedetailleerdere informatie over hoe de records geclassificeerd zijn door de beslissingsboom. De nummers op de diagonale as geven het aantal records weer dat juist geclassificeerd werd door de beslissingsboom, en de nummers buiten de diagonale as de
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
56
RA-MOW-2011-003
records die fout geclassificeerd werden. Uit de confusion matrix blijkt duidelijk dat enkele records die toebehoren aan categorie 3, foutief gelinkt werden aan categorie 4 (voorrangsgeregeld), 5 (VRI klassiek) of 6 (herinrichting wegvak, doortochtkruispunt). Tabel 9 - Confusion matrix maximumboom Actual category
Predicted category 1
2
3
4
5
6
7
1
152
1
1
1
0
0
0
2
0
78
0
1
0
1
0
3
0
1
39
3
2
2
0
4
0
0
0
92
0
0
0
5
0
0
0
0
77
1
0
6
0
0
0
0
1
33
0
7
0
0
0
0
0
0
43
5.1.4 Variable importance score Om te kijken hoe belangrijk een variabele is, berekent CART de “variable importance scores”, die weergegeven zijn in Tabel 10. Het algoritme kijkt hiervoor naar de verbetering, of toename in homogeniteit, die toegewezen kan worden aan de splitsingsof surrogaatvariabele. De waarden van alle verbeteringen worden gesommeerd over elke knoop. De variabele met de hoogste som van verbeteringen krijgt een score van 100, alle andere variabelen krijgen lagere scores in verhouding tot hun potentiële toename in homogeniteit. Een score van 0 betekent dat de variabele nergens in de boom een rol speelt, en het niet opnemen van deze variabele in de boom zou dan ook geen verschil in resultaten mogen betekenen (Sherrod, 2010).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
57
RA-MOW-2011-003
Tabel 10 - Variable importance scores maximumboom
De berekende scores geven dus de bijdrage weer van elke variabele in het classificeren of het voorspellen van de afhankelijke variabele, waarbij de bijdrage voortvloeit uit zowel de rol van de variabele als splitsingsvariabele, als zijn rol als surrogaatvariabele. Als een variabele nooit gebruikt is om een knoop te splitsen, is het bijgevolg een foute interpretatie om te stellen dat de variabele geen invloed of belang zou hebben. Zo kan bijvoorbeeld een kleine verandering in de dataset zorgen dat de splitsing van de knoop op basis van een andere variabele gebeurt, waardoor de structuur van de rest van de beslissingsboom ook verandert (Breiman et al., 1984). Een andere mogelijkheid is dat in vele gevallen variabele X gebruikt wordt om verschillende knopen te splitsen, omdat variabele X net iets beter presteert dan variabele Y. Variabele X zou dan heel belangrijk zijn, terwijl variabele Y dat niet is. Maar indien variabele X uit de analyse wordt gelaten, zou variabele Y gebruikt worden om verschillende knopen te splitsen en daardoor plots heel belangrijk worden. Variabele X verbergt of maskeert dus eigenlijk het belang van variabele Y, een fenomeen dat “masking” wordt genoemd. Een goede manier om met dit fenomeen om te gaan is dan ook door niet alleen te kijken naar de variabelen die als splitsingsvariabelen gebruikt zijn, maar ook rekening te houden met de associatie van de surrogaatvariabelen met de splitsingsvariabele. Dit is precies wat het CART algoritme, en dus ook DTREG, doet (Sherrod, 2010). Breiman et al. (1984) stellen echter dat de beste splitsing meestal significant beter is dan de tweede beste splitsing, zeker voor knopen dicht bij de wortelknoop. Toch is er nog een andere opmerking. De variable importance score meet in feite de bruikbaarheid van de variabele om dienst te doen als splitsings- of surrogaatvariabele in een specifieke boom van een specifieke grootte. Het zegt dus eigenlijk niets over het belang van de variabele bij de constructie van een andere boom. Het is duidelijk dat het voorgaande vooral betrekking heeft op variabelen die niet gebruikt zijn om de wortelknoop, of eventueel de daarop volgende knopen, te splitsen. Wanneer een boom groter is, is het logisch dat variabelen meer kansen hebben om een rol te spelen en een score te krijgen verschillend van 0 (Steinberg, 2009).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
58
RA-MOW-2011-003
Als er wordt teruggekeken naar de tabel, is het duidelijk dat de totale ochtendintensiteit een belangrijke variabele is in de maximumboom, wat reeds uit de bespreking gebleken is. Deze variabele is namelijk als primaire splitsingsvariabele gebruikt voor het splitsen van de wortelknoop en enkele subknopen dicht bij de wortelknoop. In de output van DTREG ziet men “prioriteitscode ante” terugkomen als alternatieve splitsingsvariabele of als surrogaatvariabele in de wortelknoop en de 2 lagere niveaus van de boom. Dit verklaart onder andere waarom deze variabele in de grafiek zo belangrijk is.
5.2
Maximumboom met toegewezen initiële splitsingsvariabele
Bij de maximumboom is gebleken dat de wortelknoop gesplitst wordt op basis van de totale ochtendintensiteit. “Signalisatie kruispunt voor” bleek de voornaamste concurrerende splitsingsvariabele. Daarom zal in dit deel een maximumboom gemaakt worden waarbij de variabele “Signalisatie kruispunt voor” gebruikt wordt om de wortelknoop te splitsen. De resulterende maximumboom telt 20 niveaus en 258 eindknopen.
5.2.1 Wortelknoop De wortelknoop is logischerwijze dezelfde als bij de eerder geconstrueerde maximumboom. Het verschil is dat de wortelknoop zich nu splitst op basis van de variabele “Signalisatie kruispunt voor”, waarbij de records met als waarde “VRI” naar de linkerknoop (knoop 2) gaan, en de records met waarde “voorrangsgeregeld kruispunt” naar de rechterknoop (knoop 3) gaan. De verbetering in misclassificatie bedraagt 0,034, zoals bij de vorige maximumboom reeds berekend werd. Op de volgende pagina is een vereenvoudigd deel van de maximum beslissingsboom weergegeven. Elke knoop bevat volgende informatie: het knoopnummer, de categorie waaraan de afhankelijke variabele toegewezen werd en het percentage foutief geclassificeerde records.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
59
RA-MOW-2011-003
Figuur 24 - Vereenvoudigde weergave deel maximumboom met toegewezen initiële splitsingsvariabele
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
60
RA-MOW-2011-003
5.2.2 Subknopen wortelknoop a. Knoop 2 De 254 kruispunten in knoop 2 worden toegewezen aan de categorie “VRI conflictvrij (+infra)”. De output van knoop 2 is weergegeven in Tabel 11. Het percentage foutief geclassificeerde records daalt tot 53,54%. Op basis van deze beslissingsboom kan er dus gesteld worden dat er 46,46% kans is dat de gekozen kruispuntoplossing een conflictvrije verkeersregelinstallatie is, indien het kruispunt vroeger ook al geregeld werd met een VRI. Bovendien bevinden 118 van de 155 kruispunten met een conflictvrije VRI als oplossing (76,12%) zich in deze knoop. Ook 57 van de 78 kruispunten met een klassieke VRI als oplossing (73%) bevinden zich in deze knoop (zie Tabel 5 en Tabel 11). Dit betekent dus dat 175 van de 233 kruispunten (75,1%) waarvan de voorgestelde oplossing een VRI is ook in de oude situatie reeds geregeld werd met een VRI. We mogen dus concluderen dat, indien het kruispunt vroeger geregeld werd met een VRI, er een grote kans is dat dit in de toekomst ook zal gebeuren. Tabel 11 - Output knoop 2
Knoop 2 wordt op zijn beurt gesplitst op basis van de totale ochtendintensiteit. De splitsingswaarde bedraagt nu 2858,3688 pae/uur.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
61
RA-MOW-2011-003
b. Knoop 4 / 5 Indien de totale ochtendintensiteit kleiner dan of gelijk is aan 2858,3688, volgen de records de linkerknoop (knoop 4). Indien de ochtendintensiteit groter is dan 2858,3688 volgen de records de rechterknoop (knoop 5). In knoop 5 worden 45 van de 66 records (68,18%) aan de juiste categorie toegewezen, namelijk categorie 1 (VRI conflictvrij + infra). Op basis van deze beslissingsboom kan er dus gesteld worden dat, indien een kruispunt vroeger geregeld werd met een VRI en indien de intensiteit op een kruispunt groter is dan 2858,3688 pae/uur, er 68,18% kans is dat de gekozen kruispuntoplossing een conflictvrije VRI is. Merk op dat in de eerder berekende maximumboom reeds bleek dat, indien de intensiteit groter is dan 2858,3688 pae/uur, er 62,65% kans is dat de gekozen kruispuntoplossing een conflictvrije VRI is. c. Knoop 3 De 275 kruispunten in knoop 3 worden toegewezen aan categorie 4 (voorrangsgeregeld kruispunt). Het percentage foutief geclassificeerde records daalt tot 66,55% in vergelijking met de wortelknoop. Op basis van deze beslissingsboom kan er dus worden gesteld dat, indien het kruispunt vroeger een voorrangsgeregeld kruispunt was, er 33,45% kans is dat de gekozen kruispuntoplossing niet verandert. Zeer opvallend is ook dat deze knoop alle records bevat met een voorrangsgeregeld kruispunt als oplossing. Dit valt af te leiden uit Tabel 5 en de output van knoop 3. Het is dus duidelijk dat alle kruispunten met een klassieke voorrangsregeling vroeger ook reeds voorrangsgeregelde kruispunten waren. Knoop 3 wordt op zijn beurt eveneens gesplitst op basis van de totale ochtendintensiteit. De splitsingswaarde bedraagt hier 1707,3121. d. Knoop 228 / 229 Indien de totale ochtendintensiteit kleiner dan of gelijk is aan 1707,3121, volgen de records de linkerknoop (knoop 228), indien ze groter is dan 1707,3121 volgen ze de rechterknoop (knoop 229). In knoop 228 worden 42% van de records aan de juiste categorie toegewezen, namelijk categorie 4 (voorrangsgeregeld kruispunt). Dit komt overeen met 84 van de 200 records in de knoop. Op basis van deze maximumboom kan er dus gesteld worden dat, indien een kruispunt vroeger een voorrangsgeregeld kruispunt was en indien de intensiteit op een kruispunt kleiner is dan 1707,3121 pae/uur, er 42% kans is dat de gekozen kruispuntoplossing een voorrangsgeregeld kruispunt is. Bovendien zitten nog steeds 91,3% van de records waarbij de kruispuntoplossing een voorrangsgeregeld kruispunt is in deze categorie. Dit valt af te leiden uit Tabel 5 en de output van knoop 228. Deze vaststelling komt overeen met de eerder berekende maximumboom waarbij gesteld werd dat indien de intensiteit kleiner dan is 1741,1667 en het kruispunt vroeger een voorrangsgeregeld kruispunt was, er 41,67% kans is dat de kruispuntoplossing opnieuw een voorrangsgeregeld kruispunt is.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
62
RA-MOW-2011-003
Ook hier splitst de knoop zich op basis van de ruimtelijke context, zoals ook het geval was in de eerder geconstrueerde maximumboom.
5.2.3 Misclassificatie De misclassificatie van de maximumboom met toegewezen initiële splitsingsvariabele is weergegeven in Tabel 12. De resultaten zijn quasi identiek aan die van de maximumboom (Tabel 8), namelijk een zeer kleine misclassificatie van 3% in de eindknopen, en enkel een relatief hogere misclassificatie voor categorie 3 (Snelheidsbeperking, camera's, plateau, fietsbrug, fietstunnel, fietsoversteekplaats, verbetering verlichting, andere, …). Tabel 12 - Misclassificatie splitsingsvariabele
maximumboom
Actual
met
toegewezen
initiële
Misclassified
Category
Count
Weight
Count
Weight
Percent
Cost
1
155
155
3
3
1.935
0.019
2
80
80
3
3
3.750
0.037
3
47
47
7
7
14.894
0.149
4
92
92
1
1
1.087
0.011
5
78
78
2
2
2.564
0.026
6
34
34
1
1
2.941
0.029
7
43
43
0
0
0.000
0.000
Total
529
529
17
17
3.214
0.032
In Tabel 13 is de confusion matrix van de maximumboom met initiële splitsingsvariabele weergegeven. Ook hier zijn de resultaten quasi identiek aan die van de maximumboom (Tabel 9). Tabel 13 - Confusion splitsingsvariabele Actual category
matrix
maximumboom
met
toegewezen
initiële
Predicted category 1
2
3
4
5
6
7
1
152
2
0
1
0
0
0
2
0
77
0
1
1
1
0
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
63
RA-MOW-2011-003
3
0
1
40
5
0
1
0
4
0
0
0
91
1
0
0
5
0
0
1
0
76
1
0
6
0
0
0
1
0
33
0
7
0
0
0
0
0
0
43
5.2.4 Variable importance score De variable importance scores van de beslissingsboom met toegewezen initiële splitsingsvariabele blijven ongewijzigd ten opzichte van de maximumboom (Tabel 10).
5.3
Beslissingsboom met optimale grootte
Voor het maken van de beslissingsboom met de statistisch optimale grootte worden alle voorspellende variabelen meegenomen in de analyse. Zoals bij de vorige beslissingsbomen zal ook hier het Gini-algoritme gebruikt worden om een maximale homogeniteit te krijgen bij het splitsen van de knopen. Om te zoeken naar de optimale grootte van de boom, het “snoeiproces”, wordt V-Fold kruisvalidatie gebruikt. Het aantal kruisvalidatiebomen dat gebruikt dient te worden, wordt ingesteld op 10. De boom wordt gesnoeid tot het aantal knopen dat zorgt voor de kleinste gemiddelde fout in de kruisvalidatiebomen. Voor de classificatie van ontbrekende waarden wordt gebruik gemaakt van surrogaat splitsingsvariabelen.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
64
RA-MOW-2011-003
Figuur 25 - Instellingen boom met optimale grootte De geproduceerde beslissingsboom kent 8 eindknopen en bestaat uit 5 niveaus, te herkennen aan de rode verticale lijn op Figuur 26. De figuur geeft weer hoe het aantal foutief geclassificeerde records verandert met de grootte van het model. De blauwe en rode horizontale lijn geven de misclassificatiekost weer van de optimale beslissingsboom van respectievelijk de training data en de test data. Zoals reeds eerder vermeld is de optimale grootte gelijk aan de grootte waarbij de misclassificatiekost van de test dataset geminimaliseerd wordt. De rode verticale lijn duidt hier dus de optimale grootte van de beslissingsboom aan (Chang & Wang, 2006).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
65
RA-MOW-2011-003
Figuur 26 - Misclassificatiekost en modelgrootte De volledige beslissingsboom wordt weergegeven in Figuur 27.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
66
RA-MOW-2011-003
Figuur 27 - Beslissingsboom met optimale grootte Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
- 67 -
RA-MOW-2011-003
5.3.1 Wortelknoop In de wortelknoop (knoop 1) wordt elk kruispunt, net als bij de vorige beslissingsbomen, ingedeeld in categorie 1 (VRI conflictvrij) omdat dit de vaakst gekozen kruispuntoplossing is. De wortelknoop splitst zich met behulp van de variabele “Totale ochtendintensiteit”. De splitsingswaarde bedraagt, net als in de maximumboom in paragraaf 5.1, 1741,1667. De belangrijkste concurrerende splitsingsvariabele is “Signalisatie kruispunt voor”, die een verbetering kent van 0,034 ten opzichte van 0,058566 voor de primaire splitsingsvariabele. De twee belangrijkste surrogaat splitsingsvariabelen zijn “Aantal rijstroken 1" en "Signalisatie kruispunt voor” met een associatie van respectievelijk 0,342 en 0,329. De wortelknoop van de boom met optimale grootte splitst zich dus op identiek dezelfde manier als de maximumboom in 5.1.
5.3.2 Subknopen wortelknoop - linkertak a. Knoop 2 Indien de intensiteitswaarde kleiner is dan 1741,1667 moet de linkertak gevolgd worden (knoop 2). Kruispunten worden nu toegewezen aan categorie 4 (voorrangsgeregeld kruispunt). Het percentage foutief geclassificeerde records daalt tot 67,68%. Omdat deze knoop identiek is aan knoop 2 van de maximumboom in paragraaf 5.1, zal deze hier niet opnieuw besproken worden. Knoop 2 splitst zich in twee op basis van de variabele “Signalisatie kruispunt voor”. Indien deze de waarde “VRI” heeft, gaan de records naar knoop 4, indien de waarde “voorrangsgeregeld kruispunt” bedraagt, gaan de records naar knoop 5. b. Knoop 4 In deze knoop bevinden zich de kruispunten waarbij de totale ochtendintensiteit kleiner is dan 1741,1667 en welke vroeger geregeld werden door VRI. Deze kruispunten worden toegewezen aan categorie 5, “VRI klassiek (+ infra)”. Ook deze knoop is identiek aan knoop 5 van de maximumboom in 5.1 en zal hier niet opnieuw besproken worden. Knoop 4 wordt op zijn beurt gesplitst op basis van de al dan niet aanwezigheid van een middenberm op de hoofdweg. Indien er een middenberm aanwezig is, komt de resterende data terecht in knoop 6, zo niet komen deze terecht in knoop 7. c. Knoop 6 Knoop 6 is een eindknoop en bevat nog 19 records waarvan er 52,63% juist geclassificeerd zijn als een rotonde. Op basis van de beslissingsboom met optimale grootte kan er dus gesteld worden dat, indien de totale ochtendintensiteit op een kruispunt kleiner is dan 1741,1667 pae/uur, het kruispunt vroeger geregeld werd met een VRI en er een middenberm aanwezig was op de hoofdweg, er 52,63% kans is dat de gekozen kruispuntoplossing een rotonde is. Wel moet opgemerkt worden dat deze knoop maar 19 records bevat, waarvan 10 rotondes. Dus slechts 12,5% van het aantal records waarbij de kruispuntoplossing een rotonde is, bevindt zich in deze knoop. d. Knoop 7 Knoop 7 is een eindknoop en bevat nog 40 records waarvan er 57,50% juist geclassificeerd zijn als een klassieke VRI. Op basis van deze beslissingsboom kan er dus Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
68
RA-MOW-2011-003
gesteld worden dat, indien de totale ochtendintensiteit op een kruispunt kleiner is dan 1741,1667 pae/uur, het kruispunt vroeger geregeld werd met een VRI en er geen middenberm aanwezig was op de hoofdweg, er 57,50% kans is dat de gekozen kruispuntoplossing een klassieke VRI is. 23 van de 78 (29,5%) records waarbij de gekozen kruispuntoplossing een klassieke VRI is, bevindt zich in deze knoop. Dit valt af te leiden uit Tabel 5 en de output van knoop 7. e. Knoop 5 De kruispunten in knoop 5 zijn diegenen waarvan de totale ochtendintensiteit kleiner is dan 1741,1667 pae/uur, en die vroeger voorrangsgeregeld waren. 41,67% van de records zijn juist geclassificeerd als zijnde voorrangsgeregeld kruispunt. Op basis van de beslissingsboom met optimale grootte kan er dus gesteld worden dat, indien de totale ochtendintensiteit op een kruispunt kleiner is dan 1741,1667 pae/uur en indien het kruispunt vroeger een voorrangsgeregeld kruispunt was, er 41,67% kans is dat de gekozen kruispuntoplossing opnieuw voorrangsgeregeld is. Dit is een identieke conclusie als bij de maximumboom, wat logisch is aangezien dit ook zo was bij de andere knoop op dit niveau, namelijk knoop 4. Knoop 5 wordt gesplitst op basis van de ruimtelijke context. Kruispunten buiten de bebouwde kom gaan naar knoop 26, deze binnen de bebouwde kom naar knoop 27. f.
Knoop 26
Knoop 26 is een eindknoop met 144 records waarvan 43,75% juist geclassificeerd zijn als voorrangsgeregelde kruispunten. Op basis van de beslissingsboom met optimale grootte kan er dus gesteld worden dat, indien de totale ochtendintensiteit op een kruispunt kleiner is dan 1741,1667 pae/uur, het kruispunt vroeger een voorrangsgeregeld kruispunt was en het buiten de bebouwde kom gelegen is, er 43,75% kans is dat de gekozen kruispuntoplossing opnieuw voorrangsgeregeld is. 68,5% van de records met een voorrangsgeregeld kruispunt als kruispuntoplossing bevinden zich in deze knoop, voor de records met een rotonde als kruispuntoplossing is dit 36,25%. Dit valt af te leiden uit Tabel 5 en Tabel 14.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
69
RA-MOW-2011-003
Tabel 14 - Output knoop 26
g. Knoop 27 Knoop 27 is een eindknoop met 60 records waarvan 23,33% juist geclassificeerd zijn als doortochtkruispunten. 41,2% van de records met een doortochtkruispunt of een herinrichting van het wegvak als oplossing bevindt zich in deze knoop, evenals 24% van de voorrangsgeregelde kruispunten.
5.3.3 Subknopen wortelknoop - rechtertak a. Knoop 3 Indien de intensiteitswaarde groter is dan 1741,1667 moet de rechtertak gevolgd worden (knoop 3). Kruispunten worden nu toegewezen aan categorie 1 (VRI conflictvrij + infra). Het percentage foutief geclassificeerde records daalt tot 50,79%. Omdat deze knoop identiek is aan knoop 3 van de maximumboom, zal deze hier niet opnieuw besproken worden. Knoop 3 wordt op zijn beurt opnieuw gesplitst op basis van de totale ochtendintensiteit. De splitsingswaarde bedraagt nu 2858,3688. b. Knoop 105 Indien de totale ochtendintensiteit groter is dan 2858,3688, wordt de rechtertak gevolgd (knoop 105). Knoop 105 is identiek aan knoop 287 van de maximumboom, en zal hier dan ook niet opnieuw besproken worden.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
70
RA-MOW-2011-003
c. Knoop 104 Indien de totale ochtendintensiteit kleiner is dan 2858,3688 moet de linkertak gevolgd worden (knoop 104). Het aantal misgeclassificeerde records mag dan groot zijn (87,13%), toch bevinden zich 22 van de 43 records van categorie 7 (“Rechts in, rechts uit; tunnel zonder uitwisseling; hollands complex met brug; hollands complex met tunnel; afsluiten”) zich in deze knoop. Dit valt af te leiden uit de output van de knoop, en uit Tabel 5. 51,16% van de kruispunten waarbij voor één van bovenstaande oplossingen gekozen werd heeft dus een totale ochtendintensiteit gelegen in het interval [1741,1667; 2858,3688]. Hetzelfde geldt voor 47,1% van de kruispunten met als oplossing een conflictvrij VRI. Knoop 104 is identiek aan knoop 286 van de maximumboom. Knoop 104 wordt gesplitst op basis van de variabele “land use”. Indien de variabele de waarde “agrarisch”, “industrie” of “groen” aanneemt, wordt de linkertak (106) gevolgd. Indien de waarde “gemeenschapsvoorzieningen” of “wonen” is, verhuizen de records naar de rechtertak (knoop 107). d. Knoop 106 Knoop 106 is een eindknoop en bevat 64 records. Het aantal misgeclassificeerde records bedraagt 81,25%. Uit deze knoop zijn dan ook geen relevante conclusies te trekken. e. Knoop 107 Deze knoop telt een misclassificatie van 72,90%. Ongeveer 37% van de kruispuntoplossingen in categorie 5, “VRI klassiek (+ infra)”, bevindt zich in deze knoop. Wat verder opvalt is het vrij grote aantal records (45) met een kruispuntoplossing in categorie 1, “conflictvrije VRI (+ infra)”, wat overeenkomt met 30%. Dit valt af te leiden uit Tabel 5 en de output van knoop 107. Knoop 107 wordt gesplitst op basis van de variabele “Signalisatie kruispunt voor”. Indien het kruispunt vroeger geregeld werd met een VRI wordt de linkertak gevolgd (knoop 132). In het geval ze vroeger voorrangsgeregeld waren, wordt de rechtertak (knoop 133) gevolgd f.
Knoop 132
Knoop 132 is een eindknoop en telt 80 records. 70% van de records is foutief geclassificeerd als “VRI klassiek (+ infra)”. Wel valt op dat deze knoop, net als knoop 107, vrij veel records telt waarbij de kruispuntoplossing “VRI conflictvrij (+ infra)” is. In totaal hebben 64 records een VRI als kruispuntoplossing, wat overeenkomt met 27,5% van het totaal aantal kruispuntoplossingen met een VRI. Dit valt af te leiden uit Tabel 5 en de output van knoop 132. g. Knoop 133 Knoop 133 is eveneens een eindknoop en bevat 27 records. Hier is 77,78% van de records foutief geclassificeerd als zijnde een van de kruispuntoplossingen van categorie 7 (Rechts in, rechts uit; tunnel zonder uitwisseling; hollands complex met brug; hollands complex met tunnel; afsluiten). Er zijn geen relevante conclusies te trekken uit deze knoop.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
71
RA-MOW-2011-003
5.3.4 Misclassificatie categorieën In Tabel 15 en Tabel 16 is duidelijk te zien dat categorieën 2 (rotonde) en 3 (Snelheidsbeperking, camera's, plateau, fietsbrug, fietstunnel, fietsoversteekplaats, verbetering verlichting, andere, …) slecht geclassificeerd worden door de beslissingsboom. Categorie 3 kent zelfs helemaal geen eindknoop in de geproduceerde beslissingsboom. Waarschijnlijk is dit te verklaren door het feit dat deze categorie een combinatie is van verschillende maatregelen. Het is dan ook evident dat alle records van deze categorie verkeerd geclassificeerd worden. Categorieën 4 (Voorrangsgeregeld kruispunt) en 5 (VRI klassiek + infra) worden het beste geclassificeerd en kennen het laagste misclassificatie percentage. Tabel 15 – Misclassificatie training data beslissingsboom optimale grootte Training data Actual
Misclassified
Category
Count
Weight
Count
Weight
Percent
Cost
1
155
155
103
103
66.452
0.665
2
80
80
70
70
87.500
0.875
3
47
47
47
47
100.000
1.000
4
92
92
29
29
31.522
0.315
5
78
78
31
31
39.744
0.397
6
34
34
20
20
58.824
0.588
7
43
43
25
25
58.140
0.581
Total
529
529
325
325
61.437
0.614
Tabel 16 - Misclassificatie validatie data beslissingsboom optimale grootte Validation data Actual
Misclassified
Category
Count
Weight
Count
Weight
Percent
Cost
1
155
155
95
95
61.290
0.613
2
80
80
77
77
96.250
0.963
3
47
47
47
47
100.000
1.000
4
92
92
34
34
36.957
0.370
5
78
78
40
40
51.282
0.513
6
34
34
23
23
67.647
0.676
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
72
RA-MOW-2011-003
7
43
43
33
33
76.744
0.767
Total
529
529
349
349
65.974
0.660
De “confusion matrices” (Tabel 17 en Tabel 18) geven gedetailleerde informatie over hoe de verschillende records geclassificeerd zijn door de beslissingsboom. De aantallen op de diagonale lijn zijn juist geclassificeerd, diegenen buiten de diagonale foutief. Conflictvrije VRI (categorie 1) worden voornamelijk foutief geclassificeerd als voorrangsgeregelde kruispunten (categorie 4), klassieke VRI (categorie 5) of als categorie 7 (Rechts in, rechts uit; tunnel zonder uitwisseling; hollands complex met brug; hollands complex met tunnel; afsluiten). Hetzelfde geldt voor rotondes (categorie 2). De foutief geclassificeerde voorrangsgeregelde kruispunten (categorie 4) zijn voornamelijk als doortochtkruispunt bestempeld (categorie 6), en andersom. Categorie 7 wordt vooral foutief geclassificeerd als een conflictvrije VRI (categorie 1) of voorrangsgeregeld kruispunt (categorie 4). Tabel 17 - Confusion matrix training data beslissingsboom optimale grootte Training data Actual category
Predicted category 1
2
3
4
5
6
7
1
52
2
0
18
47
2
34
2
4
10
0
30
11
8
17
3
12
0
0
15
5
9
6
4
1
0
0
63
0
22
6
5
3
3
0
7
47
7
11
6
2
2
0
10
6
14
0
7
9
2
0
9
4
1
18
Tabel 18 - Confusion matrix validation data Validation data Actual category
Predicted category 1
2
3
4
5
6
7
1
60
3
7
17
35
3
30
2
8
3
1
29
16
10
13
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
73
RA-MOW-2011-003
3
11
1
0
17
5
8
5
4
0
1
0
58
10
21
2
5
14
0
1
9
38
9
7
6
4
0
0
12
7
11
0
7
11
2
0
8
10
2
10
5.3.5 Variable importance score Tabel 19 geeft de “variable importance scores” weer van de verschillende variabelen. Tabel 19 - Variable importance scores
De variabele “Totale ochtendintensiteit” is gebruikt om de wortelknoop te splitsen, en verschillende andere knopen op de rechtertak. “Signalisatie kruispunt voor” is gebruikt om een knoop op het tweede niveau te splitsen. Dit verklaart de hoge score. “Middenberm 1”, “Categorisering 1”, “Aantal rijstroken 1” is een volgende groep van variabelen met een vergelijkbare score. Als we de knopen in de optimale beslissingsboom meer in detail bekijken, zien we dat de drie bovenstaande variabelen de belangrijkste concurrerende splitsings- en surrogaat splitsingsvariabelen zijn voor “Totale ochtendintensiteit”. “Aantal rijstroken 1”, “Categorisering 1” en “Middenberm 1” hebben een verbetering van respectievelijk 0,022; 0,017 en nogmaals 0,017 ten opzichte van 0,058566 voor de primaire splitsingsvariabele “Totale ochtendintensiteit”. Uit de beslissingsboom blijkt dat de kruispunten met een lage intensiteit in de linkerknoop terechtkomen. Indien de wortelknoop gesplitst zou worden met één van de concurrerende splitsingsvariabelen, zouden die punten waarvan de hoofdweg 1 rijstrook telt en waarbij de hoofdweg een lokale of secundaire weg is, in de linkerknoop terechtkomen. Hetzelfde geldt voor de rechterknoop. Hierin steken de kruispunten met een hoge intensiteitswaarde, 2 of meer rijstroken of de primaire- en hoofdwegen, Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
74
RA-MOW-2011-003
afhankelijk van de gekozen splitsingsvariabele. Min of meer hetzelfde geldt voor de surrogaat splitsingsvariabelen. Het lijkt er dus sterk op dat de variabele “Totale ochtendintensiteit” het belang van de andere variabelen maskeert. Dit wordt bovendien bevestigd in knoop 3. Ook deze knoop splitst zich op basis van de variabele “Totale ochtendintensiteit”, maar het aantal rijstroken, de categorisering en de al dan niet aanwezigheid van een middenberm zijn opnieuw de belangrijkste concurrerende splitsings- en surrogaat splitsingsvariabelen. Een mogelijke verklaring waarom “Prioriteitscode ante” zo hoog scoort in de tabel is het feit dat deze variabele voor zowel knoop 2, een belangrijke knoop op niveau 2, als voor knoop 107 een belangrijke concurrerende splitsingsvariabele voor “Signalisatie kruispunt voor” is. Bij knoop 107 komen kruispunten die vroeger geregeld werden met een VRI in de linkerknoop terecht, terwijl vroeger voorrangsgeregelde kruispunten in de rechterknoop terechtkomen. Indien “Prioriteitscode ante” gebruikt zou worden om knoop 2 en 107 te splitsen, zouden de kruispunten met een prioriteitscode <= 24,5 respectievelijk <= 16,5 in de linkerknoop terechtkomen. Dit wijst erop dat de kruispunten geregeld met een VRI gemiddeld een lagere prioriteitscode hebben dan voorrangsgeregelde kruispunten. Uit de tabel met de variable importance scores leren we verder ook nog dat de kenmerken van de hoofdwegen (“Middenberm 1”, “Categorisering 1”, “Aantal rijstroken 1” ) belangrijker zijn dan de kenmerken van de niet-hoofdwegen (“Middenberm 2”, “Categorisering 2”, “Aantal rijstroken 2”) voor het bepalen van de gewenste kruispuntoplossing. Ook de reeds bestaande fietsvoorzieningen of de aanwezigheid van een fietsroutenetwerk zijn maar van weinig belang voor de uiteindelijke kruispuntoplossing.
5.3.6 Vergelijking maximumboom – optimale boom Als we de eerder geconstrueerde maximumboom (in deel 5.1) vergelijken met de beslissingsboom met optimale grootte (in deel 5.3) valt het op dat deze bomen bijna identiek zijn, zowel qua structuur als qua inhoud. Hiermee wordt bedoeld dat de optimale boom in feite identiek is aan de basis van de maximumboom. Men mag zich hier niet laten misleiden door het grote verschil in misclassificatie tussen beide bomen (3% voor de maximumboom, t.o.v. 61% voor de optimale boom). Het verschil zit hem hier namelijk in het feit dat een maximumboom blijft doorgroeien tot de misclassificatie (quasi) nul bedraagt. Zoals eerder aangehaald zal dit echter de data overfitten, wat niet wenselijk is omdat de prestaties bij een nieuwe dataset minder goed zullen zijn. De optimale boom daarentegen wordt gesnoeid om dit risico op overfitten te voorkomen. Daardoor is het logisch dat de eindknopen een hoger percentage misgeclassificeerde records bevat dan de maximumboom. Het feit dat de maximumboom en de optimale boom zo sterk gelijkend zijn is positief voor de stabiliteit van de boom (Breiman et al., 1984).
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
75
RA-MOW-2011-003
6.
6.1
DISCUSSIE
Vergelijking werkelijke beslissingsboom vademecum
beslissingsboom
met
Nu geweten is hoe de impliciete beslissingsboom van de beleidsmakers er uitziet, is het mogelijk om een vergelijking te maken met de beslissingsboom uit het vademecum. Deze werd weergegeven in Figuur 1 op pagina 7. Na een verkeersveiligheidsanalyse op basis van de AVOC methode, wordt er vertrokken vanuit de verkeersplanologische ruimtelijke context om de mogelijke typeoplossingen te bepalen. Het komt er op neer dat men voor het bepalen van het gewenste kruispunttype vertrekt vanuit de categorisering van de wegen waaruit het kruispunt bestaat, en het feit of het kruispunt binnen of buiten de bebouwde kom ligt. Op deze manier blijft nog een beperkt aantal mogelijke typeoplossingen over. De optimale oplossing wordt dan getoetst aan de verkeerskundige en fysische randvoorwaarden. Hierbij wordt de intensiteit en beschikbare ruimte in rekening gebracht. De capaciteit en de fysische inpasbaarheid van de voorgestelde oplossing dienen hierbij beoordeeld te worden, en ook landschappelijke aspecten kunnen een belangrijke rol spelen. Wanneer er dan nog meerdere mogelijke kruispunttypes overblijven, dient een kwalitatieve afweging te gebeuren om te komen tot één voorkeursoplossing. Deze wordt dan getoetst aan kritische randfactoren zoals de kostprijs of timing (AWV, 2009). Een opmerkelijk verschil betreft het opnemen van de categorisering en de intensiteit. Het vademecum adviseert om te vertrekken vanuit de categorisering van de wegen, en de intensiteit pas later in het proces te betrekken. Men raadt dus aan om te vertrekken vanuit het wensbeeld, en de bestaande verkeersstromen hier pas later aan te toetsen. De beslissingsboomanalyse in dit onderzoek toont echter dat de belangrijkste variabele van waaruit vertrokken wordt de intensiteit is. Het voordeel van het gebruiken van de intensiteit als centrale variabele is dat dit een objectief meetbare waarde is. De wegcategorie is eveneens een objectief gegeven, want dit is vastgelegd in beleidsplannen, maar is het resultaat van een subjectief beslissingsproces en het levert een niet numerieke waarde op. Bovendien stemt dit verkeersplanologisch wensbeeld niet noodzakelijk overeen met de actuele situatie. Het onderzoek wijst uit dat de variabele “intensiteit” het belang van de variabele “categorisering” enigszins maskeert, maar niettemin is het toch duidelijk dat men in de praktijk eerder vertrekt vanuit de bestaande situatie dan vanuit het wensbeeld. Een andere vaststelling is dat het oude kruispunttype vaak behouden blijft in de nieuwe situatie. De herinrichting van gevaarlijke punten heeft dus veeleer te maken met wijzigingen aan de bestaande inrichtingskenmerken van het kruispunt. Dit kan bijvoorbeeld gaan over het aanbrengen van afslagstroken, het vervangen van een gewone VRI door een conflictvrije VRI, het aanleggen van betere fietsvoorzieningen,… Op basis van de analyses kan, rekening houdende met de onderstaande beperkingen, geconcludeerd worden dat de genomen beslissingen in verband met de herinrichting van gevaarlijke punten in de praktijk niet helemaal gebeuren op basis van de criteria die in de leidraad zijn voorzien. Waar de nadruk in het vademecum gelegd wordt op de verkeersplanologisch meest wenselijke oplossing (wegcategorisering, ligging in het fietsroutenetwerk), wordt er in de praktijk eerder vertrokken vanuit de in de werkelijkheid bestaande situatie (verkeersintensiteit, bestaande kruispuntinrichting en voorrangsregeling). Deze tegenstelling moet echter gerelativeerd worden omdat Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
76
RA-MOW-2011-003
sommige variabelen (bijvoorbeeld ochtendintensiteit en categorisering van de hoofdweg) elkaar deels maskeren.
6.2
Vergelijking uitgevoerde typeoplossingen
herinrichting
–
tabel
In dit onderdeel wordt gekeken in welke mate de uitgevoerde herinrichting overeenstemt met de tabel met typeoplossingen uit het vademecum (Tabel 1). Met andere woorden, is de herinrichting in overeenstemming met wat door het vademecum wordt gezien als wenselijk? Zoals gezegd vertrekt deze tabel met typeoplossingen vanuit vier punten: de categorisering en snelheidslimiet op de hoofdrijbaan, de categorisering van de zijtak en de ruimtelijke context (binnen/buiten bebouwde kom). Hierbij komt een beperking van de beschikbare data naar voor. In de database is de categorie van de wegen (primair, secundair, lokaal) beschikbaar, maar niet het type (type I, type II, type III), waardoor niet exact kan worden bepaald op welk vak van de tabel het kruispunt slaat. Wanneer de gekozen herinrichting aangegeven staat in minstens één van de vakken waarop het kruispunt kan slaan, wordt geoordeeld dat het kruispunt in overeenstemming is met de tabel van typeoplossingen.
Gekozen herinrichting in overeenstemming met tabel typeoplossingen? 39; 7% Ja Nee
152; 29%
Mogelijkheid niet in tabel 319; 60% Ontbrekende data 19; 4%
Figuur 28 - Overeenstemming gekozen herinrichting met tabel typeoplossingen Ondanks het feit dat dit een relatief ruwe analyse is, kunnen toch een aantal opvallende conclusies getrokken worden. Allereerst blijkt het aandeel van kruispunten waarvan de herinrichting niet overeenstemt met de tabel met typeoplossingen zeer klein, slechts 4%. Dit is een opmerkelijke vaststelling, gegeven het feit dat uit de voorgaande analyses blijkt dat bij de impliciete beslissingsboom de variabelen categorisering, maximumsnelheid en ruimtelijke context van minder belang zijn. Met andere woorden, via een andere redenering komt men toch tot dezelfde beslissing voor de herinrichting. Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
77
RA-MOW-2011-003
Wat verder nog opvalt is dat in 29% van de gevallen het onmogelijk is om de gekozen herinrichting te vergelijken met de tabel met typeoplossingen omdat de mogelijkheid niet voorzien is in de tabel. Het blijkt dus dat het raadplegen van de tabel, ondanks het feit dat deze vrij gedetailleerd en uitgebreid is, niet altijd mogelijk is omdat een aanzienlijk aantal situaties nog steeds ontbreekt. Een aantal voorbeelden van kruispunten waarbij de vergelijking niet kon gemaakt worden: kruispunten waarbij de gekozen herinrichting van type 3 is (Snelheidsbeperking, camera's, plateau, fietsbrug, fietstunnel, fietsoversteekplaats, verbetering verlichting, andere, …), kruispunten waarbij de hoofdrijbaan een lokale weg is met maximumsnelheid 90 km/u, kruispunten binnen de bebouwde kom waarbij de hoofdrijbaan een secundaire weg is met maximumsnelheid 90 km/u,… Er kan geargumenteerd worden dat het hoge percentage overeenstemming (60%) tussen de gekozen herinrichting en de mogelijkheden van de tabel met typeoplossingen erop wijst dat dit een goede tabel is. Het is echter zo dat de tabel zelden echt uitsluitsel biedt. Met andere woorden, de tabel geeft niet aan wat aan te bevelen is, maar enkel wat eventueel kan, waardoor de kracht van het instrument in het beslissingsproces eerder beperkt is. Zo blijkt uit de tabel bijvoorbeeld dat het quasi altijd mogelijk is om een kruispunt her in te richten met verkeerslichten, en worden er vaak drie of meer mogelijkheden geboden. Er moet rekening mee gehouden worden dat de complexe werkelijkheid moeilijk bevat kan worden in een dergelijke vereenvoudigde tabel. Dit blijkt ook uit het grote belang van het kruispunttype voor de herinrichting. Bij een herinrichting blijkt dus uit de voorafgaande analyses vaak dat het kruispunttype best behouden blijft, maar dat de aanpassingen zich eerder op een detailniveau situeren.
6.3
Beperkingen van het onderzoek
De gebruikte database in dit onderzoek bestaat uit 529 records, verdeeld over 7 verschillende categorieën, zoals te zien in Tabel 20. Tabel 20 - Verdeling categorieën
De gebruikte dataset is dus vrij klein naar de maatstaven van een CART-analyse. De databases die bijvoorbeeld door warenhuizen worden gebruikt om koopgedrag te analyseren bestaan vaak uit tienduizenden records. Zeker voor een aantal categorieën bevat de dataset (te) weinig records om harde conclusies te kunnen trekken. Dit is bijvoorbeeld het geval voor kruispuntoplossingen behorende tot categorie 3 (Snelheidsbeperking, camera's, plateau, fietsbrug, fietstunnel, fietsoversteekplaats, verbetering verlichting, andere, …). Dit is een eerste beperking van dit onderzoek. Een Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
78
RA-MOW-2011-003
uitgebreidere dataset geeft meer mogelijkheden voor analyse. Hier moet echter wel bij vermeld worden dat de gebruikte dataset naar de maatstaven van verkeerskundig onderzoek wel relatief groot is. Het is onrealistisch om een dataset van duizenden gevaarlijke punten te verwachten, zeker in een al bij al vrij beperkt onderzoeksgebied zoals Vlaanderen. Het feit dat in de literatuurstudie geen gelijkaardige onderzoeken werden teruggevonden bevestigt dit. Een tweede beperking van het onderzoek is dat er geen aparte test dataset beschikbaar is om de opgestelde beslissingsboom te testen. Merk op dat het testen van de beslissingsboom zelf iets anders is dan het testen van de statistisch optimale grootte van de boom, zoals het “V-Fold kruisvalidatie” algoritme doet. Toch is een “beperkte” dataset nu eenmaal een gegeven en een belangrijke praktische beperking in dit soort onderzoeken. Een laatste beperking heeft te maken met de aard van de onderzochte data. Zoals reeds werd aangegeven is het beslissingsproces om te komen tot een herinrichting van kruispunten een relatief complex gebeuren waarbij een veelheid aan verkeerskundige, ruimtelijke, financiële, juridische en bouwtechnische factoren om de hoek komen kijken. Het weergeven van deze complexiteit in een boomstructuur houdt hoe dan ook een sterke vereenvoudiging van de werkelijkheid in. Dit blijkt ondermeer uit de relatief hoge misclassificatie die de optimale beslissingsboom blijft vertonen.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
79
RA-MOW-2011-003
7.
CONCLUSIES
Het gebruik van een beslissingsboom laat toe om het beslissingsproces dat wordt gehanteerd bij het heraanleggen van gevaarlijke punten in kaart te brengen. Het Vademecum Veilige Wegen en Kruispunten suggereert een beslissingsboom die door beslissingnemers gevolgd kan worden bij de herinrichting van een gevaarlijk punt. Het vademecum geeft aan om te vertrekken vanuit een verkeersveiligheidsanalyse volgens de AVOC-methode. Vervolgens wordt de verkeersplanologische ruimtelijke context in rekening gebracht met behulp van de tabel met typeoplossingen, die gebruik maakt van de wegencategorisering, de rijsnelheid, en of het kruispunt zich binnen of buiten de bebouwde kom bevindt. Tenslotte wordt dan op basis van de beschikbare intensiteiten en ruimtelijke randvoorwaarden een verkeerskundige en ruimtelijk-fysische analyse van de resterende kruispuntconfiguraties gemaakt. De bedoeling van dit rapport is om de impliciete of werkelijke beslissingsboom die gehanteerd werd door de beslissingnemers in kaart te brengen. Met andere woorden, er wordt gekeken welke kruispuntkenmerken in werkelijkheid doorslaggevend bleken bij de keuze van het kruispunttype bij de herinrichting. De impliciete beslissingsboom met optimale grootte bevat 8 eindknopen en gebruikt 5 verschillende splitsingsvariabelen (ochtendintensiteit, signalisatie in de voorsituatie, ruimtelijke context, aanwezigheid middenberm en ruimtegebruik). Hieronder wordt een overzicht gegeven van de conclusies die getrokken kunnen worden voor elke categorie (“kruispuntoplossing na”) op basis van de geconstrueerde beslissingsbomen. Categorie 1
Categorie 2
VRI conflictvrij (+infra)
Intensiteit > 1740 pae/uur
Ook mogelijk bij intensiteit > 2860pae/uur
Kruispunt vroeger ook vaak geregeld met VRI
Rotonde
Categorie 3
Snelheidsbeperking, camera's, plateau, fietsbrug, fietsoversteekplaats, verbetering verlichting, andere, …
Categorie 4
Intensiteit <= 1740 pae/uur fietstunnel,
Geen relevante conclusies mogelijk
Voorrangsgeregeld
Intensiteit <= 1740 pae/uur
Kruispunt vroeger ook reeds voorrangsgeregeld
Gelegen buiten de bebouwde kom
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
80
RA-MOW-2011-003
Categorie 5
Categorie 6
Categorie 7
VRI klassiek (+infra)
Kruispunt vroeger ook vaak geregeld met VRI
Zowel mogelijk bij intensiteit <= 1740 pae/uur als bij intensiteit > 1740 pae/uur
Onwaarschijnlijk indien intensiteit > 2860 pae/uur
Herinrichting wegvak, doortochtkruispunt
Intensiteit <= 1740 pae/uur
Kruispunt was vroeger voorrangsgeregeld
Rechts in, rechts uit; tunnel zonder uitwisseling; hollands complex met brug; hollands complex met tunnel; afsluiten
Intensiteit > 1740 pae/uur
Uit de maximumboom en de boom met de statistisch optimale grootte blijkt dat bij 92,4% van de gevaarlijke punten waarbij de oplossing een voorrangsgeregeld kruispunt is, de intensiteit lager ligt dan 1740 pae/uur (zie knoop 2 p.52). Dit percentage blijft gelijk indien het ook vroeger een voorrangsgeregeld kruispunt was en daalt tot 68,5% indien het gelegen is buiten de bebouwde kom (zie knoop 5 en 66 p.55). Eenvoudiger gezegd betekent dit het volgende: 92,4% van de na herinrichting voorrangsgeregelde kruispunten heeft intensiteit < 1740. 92,4% van de na herinrichting voorrangsgeregelde kruispunten heeft intensiteit < 1740 EN was vroeger ook reeds voorrangsgeregeld. 68,5% van de na herinrichting voorrangsgeregelde kruispunten heeft intensiteit < 1740 EN was vroeger ook reeds voorrangsgeregeld EN is gelegen buiten de bebouwde kom. Voor gevaarlijke punten waarbij de oplossing een rotonde is, heeft 65% van de kruispunten een intensiteit lager dan 1740 pae/uur. Indien de herinrichting een doortochtkruispunt of de herinrichting van een wegvak inhoudt, is dit voor 82,4% van de punten het geval. Bij deze laatste daalt het percentage tot 68,5% indien het ook vroeger een voorrangsgeregeld kruispunt was (zie output knoop 2 p.52). Verder blijkt uit de maximumboom en de boom met de statistisch optimale grootte dat bij 80,6% van de gevaarlijke punten waarbij de oplossing een conflictvrije VRI is, de intensiteit hoger ligt dan 1740 pae/uur (zie knoop 3 p.53). Voor gevaarlijke punten waarbij de oplossing tot categorie 7 behoort (Rechts in, rechts uit; tunnel zonder uitwisseling; hollands complex met brug; hollands complex met tunnel; afsluiten), heeft 72,1% van deze kruispunten een intensiteit hoger dan 1740 pae/uur (zie eveneens knoop 3 p.53). Uit de maximumboom met de toegewezen initiële splitsingsvariabele blijkt dat meer dan 75,1% van de gevaarlijke punten waarbij een klassieke of een conflictvrije VRI als kruispuntoplossing voorgesteld wordt, ook vroeger geregeld werden met een VRI (zie knoop 2 p.61). Ook blijkt dat 100% van de gevaarlijke punten die na herinrichting voorrangsgeregeld zijn, dit ook in de voorsituatie waren (zie knoop 3 p.53). Met andere woorden, geen enkel kruispunt werd “gedowngraded” van bijvoorbeeld een rotonde of kruispunt met VRI naar een kruispunt met voorrangsregeling.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
81
RA-MOW-2011-003
Hieronder worden enkele beslissingsregels weergegeven die afgeleid kunnen worden op basis van de geconstrueerde beslissingsbomen. Het percentage staat voor het aantal records dat juist geclassificeerd is in de weergegeven categorie op basis van de beslissingsregels. Indien totale ochtendintensiteit > 1740 pae/uur 49,21%
VRI conflictvrij (+infra)
Indien totale ochtendintensiteit <= 1740 pae/uur Indien kruispunt vroeger geregeld met VRI 44,07%
VRI klassiek (+infra)
Indien totale ochtendintensiteit <= 1740 pae/uur Indien kruispunt vroeger geregeld met VRI Indien middenberm aanwezig op hoofdweg 52,63%
Rotonde (Opmerking: beperkt aantal records!)
Indien totale ochtendintensiteit <= 1740 pae/uur Indien kruispunt vroeger geregeld met VRI Indien geen middenberm aanwezig op hoofdweg 57,50%
VRI klassiek (+infra)
Indien totale ochtendintensiteit <= 1740 pae/uur Indien kruispunt vroeger voorrangsgeregeld Indien kruispunt gelegen buiten de bebouwde kom 47,37%
Voorrangsgeregeld
Indien totale ochtendintensiteit > 2860 pae/uur 62,65%
VRI conflictvrij (+infra)
Het is duidelijk dat de intensiteit een cruciale variabele is bij de bepaling van de kruispuntoplossing. Bij een hoge intensiteitswaarde zal vaak gekozen worden voor een conflictvrije VRI of een kruispuntoplossing waarbij kruisende bewegingen voorkomen worden (categorie 7). Bij een lagere intensiteitswaarde komen een klassieke VRI, een voorrangsgeregeld kruispunt, een doortochtkruispunt of de herinrichting van een wegvak (categorie 6) en in iets mindere mate een rotonde als oplossing naar voren. Kruispunten die na herinrichting voorrangsgeregeld zijn of geregeld worden met een VRI, waren dit ook vaak in het verleden. Dit wijst er op dat aan deze kruispunten vooral infrastructurele aanpassingen zijn gebeurd, en dat de algemene kruispuntvorm niet veranderd is. Een gedetailleerde analyse van de knopen in de optimale beslissingsboom wijst uit dat de variabele “Totale ochtendintensiteit” een maskerend effect heeft voor de variabelen Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
82
RA-MOW-2011-003
“Middenberm 1”, “Categorisering 1” en “Aantal rijstroken 1”. Zo gaat een hogere intensiteit vaak hand in hand met een hogere categorisering en wegen met meerdere rijstroken. Zeker “Categorisering 1” en “Aantal rijstroken 1” zijn mogelijke alternatieve variabelen voor de splitsingen. Verder blijkt ook duidelijk dat de kenmerken van de hoofdwegen (“Middenberm 1”, “Categorisering 1”, “Aantal rijstroken 1” ) belangrijker zijn dan de kenmerken van de niet-hoofdwegen (“Middenberm 2”, “Categorisering 2”, “Aantal rijstroken 2”) voor het bepalen van de kruispuntoplossing. Ook blijkt dat de reeds bestaande fietsvoorzieningen of de aanwezigheid van een fietsroutenetwerk maar van weinig belang zijn bij de bepaling van de uiteindelijke kruispuntoplossing. Een vergelijking tussen deze werkelijke beslissingsboom en de beslissingsboom van het vademecum toont dus een aantal interessante verschillen. De belangrijkste conclusie is dat men in de werkelijke beslissingsboom de intensiteit als belangrijkste variabele heeft, terwijl de beslissingsboom van het vademecum aangeeft om te vertrekken vanuit de categorisering. De intensiteitswaarde biedt het voordeel dat dit een objectief meetbare waarde is, terwijl de wegencategorisering het resultaat is van een subjectief beslissingsproces. Bovendien slaat de wegcategorie op het verkeersplanologisch wensbeeld, dat niet noodzakelijk overeenstemt met de actuele situatie. Ook blijkt het bestaande kruispunttype in werkelijkheid een belangrijke invloed te hebben, hoewel dit element niet is opgenomen in de beslissingsboom van het vademecum. Het blijkt duidelijk dat men in de praktijk eerder vertrekt vanuit de bestaande situatie dan vanuit het verkeersplanologisch wensbeeld. Ondanks dit afwijkende beslissingsproces, blijkt uit een vergelijking van de uitgevoerde herinrichting en de tabel met typeoplossingen toch dat de gekozen herinrichting vaak overeenstemt met de aanbevelingen van de tabel met typeoplossingen. Dit kan gezien worden als een indicatie dat de tabel met typeoplossingen goed functioneert, maar het is echter zo dat de tabel zelden uitsluitsel biedt over de te prefereren herinrichting, waardoor de kracht als beslissingsinstrument beperkt is. De belangrijkste beperking van het onderzoek is de grootte van de dataset. De dataset bevat 529 records, wat naar de maatstaven van een CART-analyse vrij klein is. Naar de maatstaven van verkeerskundig onderzoek is dit echter wél een grote dataset; het is onrealistisch om in een geografisch beperkt gebied als Vlaanderen een dataset van duizenden gevaarlijke punten te verwachten. Ook blijkt uit het resterende hoge percentage misclassificatie dat een beslissingsboomstructuur een vrij sterke vereenvoudiging is van de werkelijkheid, waarbij de complexe overwegingen die een rol spelen bij de herinrichting niet altijd voldoende kunnen opgenomen worden.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
83
RA-MOW-2011-003
8.
LITERATUURLIJST
Adeyemo, A. B., & Kuye, G. (2006). Mining Students’ Academic Performance using Decision Tree Algorithms. Journal of Information Technology Impact, 6(3), 161-170. AWV. (2009). Vademecum veilige wegen en kruispunten. Brussel: Agentschap Wegen en Verkeer. Berry, M., & Linoff, G. (1999). Mastering Data Mining: The Art and Science of Customer Relationship Management (1st ed.). New York, USA: John Wiley & Sons, Inc. Retrieved from http://portal.acm.org/citation.cfm?id=555358 Berzal, F., Cubero, J.-C., Marín, N., & Sánchez, D. (2004). Building multi-way decision trees with numerical attributes. Information Sciences, 165(1-2), 73-90. doi:10.1016/j.ins.2003.09.018 Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and Regression Trees. California, USA: Wadsworth International Group. Chang, L.-Y., & Wang, H.-W. (2006). Analysis of traffic injury severity: An application of non-parametric classification tree techniques. Accident Analysis & Prevention, 38(5), 1019-1027. doi:10.1016/j.aap.2006.04.009 Chen, C., Darko, E. O., & Richardson, T. N. (2003). Optimal Continuous Shoulder Rumble Strips and the Effects on Highway Safety and the Economy. ITE Journal, 73(5), 3041. Commision International de l’Eclairage. (1992). Technical Report: Road Lighting as an Accident Countermeasure ( No. CIE 93). Vienna, Austria: CIE Central Bureau. CROW. (2002). Handboek wegontwerp - Gebiedsontsluitingswegen ( No. 110). Ede, The Netherlands: CROW. Daniels, S. (2010). An epidemiological approach to explain crash risk and crash severity for different types of road users at roundabouts (Doctoral dissertation). Hasselt University, Diepenbeek. Daniels, S., Brijs, T., Nuyts, E., & Wets, G. (2009). Injury crashes with bicyclists at roundabouts: influence of some location characteristics and the design of cycle facilities. Journal of Safety Research, 40(2), 141-148. doi:10.1016/j.jsr.2009.02.004 Daniels, S., Brijs, T., Nuyts, E., & Wets, G. (2010). Externality of risk and crash severity at roundabouts. Accident Analysis & Prevention, 42(6), 1966-1973. doi:10.1016/j.aap.2010.06.001 Elvik, R. (2002). The importance of confounding in observational before-and-after studies of road safety measures. Accident Analysis & Prevention, 34(5), 631-635. doi:10.1016/S0001-4575(01)00062-8 Elvik, R., Amundsen, F., & Hofset, F. (2001). Road Safety Effects of Bypasses. Transportation Research Record: Journal of the Transportation Research Board, 1758(-1), 13-20. doi:10.3141/1758-03 Elvik, R., & Vaa, T. (2004). The Handbook of Road Safety Measures (1st ed.). Bingley, UK: Emerald Group Publishing. Hill, T., & Lewicki, P. (2006). Statistics: methods and applications : a comprehensive reference for science, industry, and data mining. Tulsa, USA: StatSoft, Inc. Lewis, R. J. (2000). An Introduction to Classification and Regression Tree (CART) Analysis. Presented at the 2000 Annual Meeting of the Society for Academic Emergency Medicine, San Francisco California. Negnevitsky, M. (2005). Artificial intelligence: a guide to intelligent systems (2nd ed.). Harlow, UK: Pearson Education. Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
84
RA-MOW-2011-003
Newstead, S. V., & Corben, B. F. (2001). Evaluation of the 1992-1996 Transport Accident Commission Funded Accident Black Sport Treatment Program in Victoria ( No. 182). Monash University Accident Research Centre. Ogden, K. W. (1996). Safer Roads: Guide to Road Safety. UK: Ashgate Publishing Limited. Persaud, B. N., Retting, R. A., Garder, P. E., & Lord, D. (2000). Crash Reductions Following Installation of Roundabouts in the United States. Arlington, USA: Insurance Institue for Highway Safety. PIARC. (2003). Road Safety Manual - Recommendations from the World Road Association (PIARC). France, La Défense. Reekmans, S., Nuyts, E., & Cuyvers, R. (2004). Effectiviteit van infrastructurele verkeersveiligheidsmaatregelen ( No. RA-2004-39). Diepenbeek, Belgium: Steunpunt Verkeersveiligheid, Onderzoekslijn Infrastructuur en Ruimte. Schoon, C. C. (2000). Verkeersveiligheidsanalyse van het concept-NVVP; Deel &: Effectiviteit van maatregelen ( No. D-2000-91). Leidschendam, The Netherlands: SWOV. Sherrod, P. H. (2010). DTREG -- Predictive Modeling Software. DTREG - Software For Predictive Modeling and Forecasting. Steinberg, D. (2009). What is the Variable Importance Measure? Salford Company Blog. Retrieved September 20, 2010, from http://salford-systems.com/blog/262-what-isthe-variable-importance-measure.html Tijdelijke Vennootschap 3V. (2006). Wegwerken gevaarlijke punten en wegvakken in Vlaanderen. Leidraad Veilig Verkeer Vlaanderen, 2e editie. Antwerpen: Tijdelijke Vennootschap 3V. Timofeev, R. (2004). Classification and Regression Trees (CART) - Theory and Applications (Master thesis). Humboldt University, Berlin, Germany. Van Hout, K., Dreesen, A., & Cuyvers, R. (2004). Risico-analyse van doortochten: Verkeersveiligheid in de bebouwde omgeving - een literatuurstudie ( No. RA-200438). Diepenbeek, Belgium: Steunpunt Verkeersveiligheid, Onderzoekslijn Infrastructuur en Ruimte. Vaneerdewegh, P. (2009). Vlaanderens grootscheepse zwartepuntenaanpak met TV3V. Kortrijk, Belgium. Verbokkem, C. A., Dikker, E. J., Scheffers, P. J., & Lindeloof, M. (2002). Effecten en kosten van verkeersveiligheidsmaatregelen ( No. V&I-99325504). De Bilt, The Netherlands: Grontmij Verkeer & Infrastructuur. Witten, I. H., & Frank, E. (1999). Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations (1st ed.). San Francisco, USA: Morgan Kaufmann. Yohannes, Y., & Webb, P. (1999). Classification and regression trees, CART: A user manual for identifying indicators of vulnerability to famine and chronic food insecurity. Washington D.C., USA: International Food Policy Research Institute. Zhang, C., & Zhang, S. (2002). Association Rule Mining: Models and Algorithms (1st ed.). Berlin, Germany: Springer. Zhang, H., & Singer, B. (1999). Recursive partitioning in the health sciences. New York, USA: Springer.
Steunpunt Mobiliteit & Openbare Werken Spoor Verkeersveiligheid
85
RA-MOW-2011-003