Een uitwisselmodel voor verkeersveiligheidsindicatoren D. Tirry, T. Steenberghen [RA-2014-004] 9/09/2014
© Steunpunt Verkeersveiligheid Wetenschapspark 5 bus 6 | 3590 Diepenbeek Consortium UHasselt, KU Leuven en VITO
Niets uit deze uitgave mag worden verveelvoudigd en/of openbaar gemaakt zonder uitdrukkelijk te verwijzen naar de bron.
Dit rapport kwam tot stand met de steun van de Vlaamse Overheid, programma ‘Steunpunten voor Beleidsrelevant Onderzoek’. In deze tekst komen onderzoeksresultaten van de auteur(s) naar voor en niet die van de Vlaamse Overheid. Het Vlaams Gewest kan niet aansprakelijk gesteld worden voor het gebruik dat kan worden gemaakt van de meegedeelde gegevens. Het Steunpunt Verkeersveiligheid 2012-2015 voert in opdracht van de Vlaamse overheid beleidsondersteunend Wetenschappelijk onderzoek uit over verkeersveiligheid. Het Steunpunt Verkeersveiligheid is een samenwerkingsverband tussen de Universiteit Hasselt, de KU Leuven en VITO, de Vlaamse Instelling voor Technologisch Onderzoek.
Steunpunt Verkeersveiligheid | RA-2014-004
Inhoudstafel 1
Inleiding ......................................................................................................................................... 10 1.1
2.
1.1.1
Europa en Vlaanderen kiezen voor Open Data ............................................................................. 10
1.1.2
Van Open Data naar Linked Open Government Data ................................................................... 11
1.2
Doel en opzet ........................................................................................................................... 12
1.3
Gevalstudie: harmonisering van ongevallen- en fietscomfortgegevens ................................... 13
1.4
Gewenste resultaten ................................................................................................................. 14
Gevalstudie: harmonisering van ongevallen- en fietscomfortgegevens ............................... 15 2.1
Fietsinfrastructuur als oorzaak van ongevallen ........................................................................ 15
2.2
Ongevallengegevens ................................................................................................................ 16
2.2.1
Het ongevallenregistratieproces .................................................................................................... 16
2.2.2
Gelokaliseerde ongevallen en gevaarlijke punten .......................................................................... 17
2.2.3
Ongevallenindicatoren ................................................................................................................... 18
2.3
Fietscomfortgegevens .............................................................................................................. 18
2.3.1
Ontstaansgeschiedenis fietspadenaudit ........................................................................................ 18
2.3.2
Auditmethode................................................................................................................................. 19
2.3.3
Indicatoren fietscomfort ................................................................................................................. 20
2.4
Monitoringkader voor fietscomfort en fietsveiligheid ................................................................ 21
2.4.1
Generiek kader van de Verkeersveiligheidsmonitor ....................................................................... 21
2.4.2
Analytisch kader voor fietscomfort en fietsveiligheid ...................................................................... 22
2.5
Uitwisseling van gegevens ....................................................................................................... 23
2.5.1
Syntactische discrepantie .............................................................................................................. 24
2.5.2
Semantische heterogeniteit ........................................................................................................... 25
2.6
Semantische componenten voor geïntegreerde monitoring .................................................... 27
2.6.1
Ontologie voor een uniform metadataschema ............................................................................... 27
2.6.2
Gecontroleerde vocabulaire in plaats van doorlopende tekst ........................................................ 28
2.6.3
Een taxonomie of thesaurus voor logische samenhang ................................................................ 28
2.7 3.
Context en achtergrond ............................................................................................................ 10
Conclusie .................................................................................................................................. 30
Semantische webstandaarden .................................................................................................... 31 3.1
Dublin Core ............................................................................................................................... 31
3.1.1
Beschrijving ................................................................................................................................... 31
3.1.2
Toepassingsmogelijkheden ........................................................................................................... 31
3.2
INSPIRE ................................................................................................................................... 32
3.2.1
Beschrijving ................................................................................................................................... 32
3.2.2
Toepassingsmogelijkheden ........................................................................................................... 32
3.3
SKOS ........................................................................................................................................ 33
3.3.1
Beschrijving ................................................................................................................................... 33
3.3.2
Toepassingsmogelijkheden ........................................................................................................... 34
3.4
DCAT ........................................................................................................................................ 34
Steunpunt Verkeersveiligheid | RA-2014-004
3.4.1
Beschrijving ................................................................................................................................... 34
3.4.2
Toepassingsmogelijkheden ........................................................................................................... 36
3.5
Asset Description Metadata Schema (ADMS) ......................................................................... 36
3.5.1
Beschrijving ................................................................................................................................... 36
3.5.2
Toepassingsmogelijkheden ........................................................................................................... 37
3.6
PROV Specificatie .................................................................................................................... 37
3.6.1
Beschrijving ................................................................................................................................... 37
3.6.2
Toepassingsmogelijkheden ........................................................................................................... 39
3.7
VCard – FOAF -ORG ............................................................................................................... 39
3.7.1
Beschrijving ................................................................................................................................... 39
3.7.2
Toepassingsmogelijkheden ........................................................................................................... 39
3.8
Data Cube................................................................................................................................. 40
3.8.1
Beschrijving ................................................................................................................................... 40
3.8.2
Toepassingsmogelijkheden ........................................................................................................... 40
3.9
QUDT........................................................................................................................................ 40
3.9.1
Beschrijving ................................................................................................................................... 40
3.9.2
Toepassingsmogelijkheden ........................................................................................................... 40
3.10
GeoSPARQL ........................................................................................................................ 41
3.10.1
Beschrijving ................................................................................................................................... 41
3.10.2
Toepassingsmogelijkheden ........................................................................................................... 41
3.11 4.
Conclusie.............................................................................................................................. 41
Specificatie van het uitwisselmodel ........................................................................................... 43 4.1
Terminologie ............................................................................................................................. 43
4.2
Classes ..................................................................................................................................... 44
4.2.1
Mandatory classes ......................................................................................................................... 46
4.2.2
Recommended classes ................................................................................................................. 46
4.2.3
Optional classes ............................................................................................................................ 47
4.3
Properties per class .................................................................................................................. 47
4.3.1
Catalog .......................................................................................................................................... 47
4.3.2
Dataset .......................................................................................................................................... 48
4.3.3
Distribution ..................................................................................................................................... 49
4.3.4
Agent ............................................................................................................................................. 50
4.3.5
PolicyAssessment.......................................................................................................................... 50
4.3.6
Measure ......................................................................................................................................... 51
4.3.7
Provenance activity ........................................................................................................................ 51
4.3.8
Provenance entity .......................................................................................................................... 51
4.3.9
Provenance agent.......................................................................................................................... 52
4.3.10
Concept Scheme ........................................................................................................................... 52
4.3.11
Concept ......................................................................................................................................... 52
4.3.12
Licence Document ......................................................................................................................... 52
4.3.13
Period Of Time............................................................................................................................... 52
4.4
Gecontroleerde vocabulaires.................................................................................................... 53
Steunpunt Verkeersveiligheid | RA-2014-004
4.4.1
Aanbevelingen ............................................................................................................................... 53
4.4.2
Vocabulaires in het uitwisselmodel ................................................................................................ 53
4.4.3
ISO19115....................................................................................................................................... 54
4.4.4
Modellicenties Open Data Vlaanderen .......................................................................................... 54
4.5 5.
6.
Toegankelijkheid ....................................................................................................................... 55
Implementatie van het uitwisselmodel ....................................................................................... 56 5.1
Aanpak...................................................................................................................................... 56
5.2
Praktische voorbeelden ............................................................................................................ 56
5.2.1
Ongevallenstatistieken ................................................................................................................... 57
5.2.2
Fietscomfortindicatoren ................................................................................................................. 60
Conclusies .................................................................................................................................... 63
Bibliografie ........................................................................................................................................... 65
Steunpunt Verkeersveiligheid | RA-2014-004
Lijsten Figuur 1:Algemeen kader voor de ontwikkeling van het uitwisselmodel ............................................... 13 Figuur 2:Schematische voorstelling van informatieverlies dat leidt tot onderregistratie overgenomen uit (Nuyttens, 2013) .................................................................................................................................... 17 Figuur 3: Schematische weergave van een generiek conceptueel kader ............................................. 22 Figuur 4: het thema fietscomfort ingevuld in het generiek monitoringkader ......................................... 23 Figuur 5: lijnvisualisatie van breedtecomfort ......................................................................................... 24 Figuur 6: Voorbeeld van een gecontroleerde vocabulaire voor het beschrijven van ongevalsfactoren 28 Figuur 7: Doelhiërarchie voor Verkeersveiligheid (Koornstra et al., 2002) ........................................... 29 Figuur 8: Toepassingsgebied van een Geografische Data Infrastructuur (Tóth, Portele, Illert, Lutz, & Lima, 2012) ............................................................................................................................................ 32 Figuur 9: Afbeelding van het DCAT-AP schema ................................................................................... 35 Figuur 10: Bestaande metadata transformeren naar de DCAT-AP specificatie (Loutas, Keyzer, & Goedertier, 2013) .................................................................................................................................. 35 Figuur 11: ADMS domein model ........................................................................................................... 37 Figuur 12: PROV high-level data model ................................................................................................ 38 Figuur 13: Grafisch voorbeeld van het gebruik van PROV (W3C PROV Model Primer) ...................... 38 Figuur 14: GeoSPARQL als basis voor domein feature types en domeinontologie (Kolas, Perry, & Herring, 2013) ........................................................................................................................................ 41 Figuur 15: UML diagram van het uitwisselmodel .................................................................................. 45
Tabellen Tabel 1: comfortaspecten van een fietspadenaudit............................................................................... 20 Tabel 2: voorbeeld van scoring op comfortaspecten ............................................................................ 21 Tabel 3: Vergelijking metadataschema’s Natuurrapport en Stadsmonitor ............................................ 25 Tabel 4: Vergelijking classificatie fietspad ............................................................................................. 26 Tabel 5: Vergelijking wegfactoren ......................................................................................................... 26 Tabel 6: kleurencodes voor de specificatie ........................................................................................... 43
Steunpunt Verkeersveiligheid | RA-2014-004
Gebruikte afkortingen ADMS ADSEI BFF BIVV DCAT EEA EU GDI GI GML IMOB INSPIRE ISO LD LOD LOGD MOW MVG OD OGC OGD OWL PV RDF RWO SDI SDMX SKOS URI VC VITO VOF VV W3C WMS WFS
Asset Description Metadata Schema Algemene Directie Statistiek en Economische Informatie Bovenlokaal Functioneel Fietsroutenetwerk Belgisch Instituut voor Verkeersveiligheid Data Catalog Vocabulary European Environment Agency European Union Geografische Data-Infrastructuur Geografische Informatie Geography Markup Language Instituut voor mobiliteit Infrastructure for Spatial Information in Europe International Organization for Standardization Linked Data Linked Open Data Linked Open Government Data Departement Mobiliteit en Openbare Werken Ministerie van de Vlaamse Gemeenschap Open Data Open Geospatial Consortium Open Government Data Web Ontology Language Proces-verbaal Resource Description Framework Departement Ruimtelijke Ordening, Wonen en Onroerend Erfgoed Spatial Data Infrastructure Statistical Data and Metadata Exchange Simple Knowledge Organisation System Uniform Resource Identifier Afdeling Verkeerscentrum Vlaamse Instelling voor Technologisch Onderzoek Verkeersongevallenformulier Verkeersveiligheid World Wide Web Consortium Web Map Service Web Feature Service
7 Steunpunt Verkeersveiligheid | RA-2014-004
Samenvatting Het analyseren van de verkeersveiligheidstoestand heeft de reputatie langdurig, tijdrovend en kostbaar te zijn. Vaak worden dezelfde gegevens zoals ongevallendata meerdere keren opgeslagen door verschillende diensten, al dan niet in heterogene vormen en formaten. Digitale samenwerking en harmonisatie tussen overheidsdiensten onderling of tussen overheidsdiensten en externe actoren kan de analyse sneller, eenvoudiger en goedkoper maken voor alle betrokken partijen, meer in het bijzonder wanneer informatie tussen verschillende beleidsdomeinen of beleidsniveaus uitgewisseld moet worden. De kern van de problematiek is dat de informatisering door de jaren heen op een gefragmenteerde wijze bij de overheid is uitgebouwd waardoor vandaag een waaier aan toepassingen gebruikt worden om de dienstverlening en beleidsondersteuning te realiseren. Gegevensuitwisseling tussen de verscheidenheid aan applicaties is niet altijd evident (V-ICT-OR vzw, 2013) en, ondanks initiatieven zoals het opzetten van kruispuntdatabanken en toepassen van strategische ICTstandaarden, blijft het moeilijk om gegevens met elkaar te delen. Als gevolg hiervan hebben beleidsmedewerkers meer dan ooit behoefte aan één integraal monitoring platform om informatie en indicatoren op te zoeken die beleidsbeslissingen kunnen ondersteunen. In de afgelopen jaren hebben verschillende monitoringsystemen het licht gezien: de Verkeersveiligheidsmonitor, de Ruimtemonitor, de Stadsmonitor, de Natuurindicatoren, de Milieu- en Natuurverkenning, etc… Dit type van informatieplatformen zijn een eerste stap in het centraliseren, structureren en harmoniseren van beleidsrelevante indicatoren. Ze spelen een belangrijke rol in het distribueren van data en informatie naar zowel interne als externe stakeholders, maar blijken vooralsnog niet in staat om indicatoren tussen verschillende platformen uit te wisselen. Semantische interoperabiliteit is een bijkomende voorwaarde voor uitwisseling en hergebruik van deze gegevens. In dit rapport wordt een aanzet gegeven naar de ontwikkeling van een semantisch uitwisselmodel voor de verkeersveiligheidsmonitor. De belangrijkste doelstelling van dit onderzoek is het bevorderen van de toegankelijkheid, de kwaliteit en de uitwisselbaarheid van indicatoren. Met behulp van een semantisch uitwisselmodel kunnen verkeersveiligheidsindicatoren op een gestructureerde manier beschreven worden en in samenhang ontsloten en gepresenteerd worden. De ontwikkeling van een uitwisselmodel voor het monitoren van verkeersveiligheid berust op een combinatie van een top-down strategische analyse met een bottom-up invulling. Bij de top-down benadering wordt het reeds beschikbare semantische raamwerk geanalyseerd. Internationale standaarden die in aanmerking komen voor het uitwisselmodel worden geanalyseerd en vergeleken om te vermijden dat een nieuwe solitaire specificatie ontwikkeld wordt. In de bottom-up analyse worden vanuit een concrete gevalstudie, i.e. het integreren van ongevallengegevens met fietscomfortgegevens, de behoeften naar interoperabiliteit beschreven en in kaart gebracht. Door afstemming met het aanbod aan bestaande standaarden wordt een nieuwe specificatie opgemaakt die als referentie-standaard gebruikt kan worden om ruimtelijke verkeersveiligheidsindicatoren te beschrijven en ontsluiten. In deze studie ligt de klemtoon op de ontwikkeling van een metadataprofiel voor indicatoren, in de toekomst zal nagegaan worden in welke mate een specificatie opgesteld kan worden op data niveau. De ontworpen specificatie is gebaseerd op de bestaande DCAT vocabulaire (European Commission, 2013a) en is hierdoor compatibel met andere dataportalen die deze standaard gebruiken om ‘Open Data’ te beschrijven. Aanpassingen en uitbreidingen werden gemaakt om informatie op te nemen over het beleidskader, het ruimtelijk kader, herkomst van de gegevens, en meetwaarden en dimensies. Een voorbeeldimplementatie van de specificatie is beschikbaar op de Verkeersveiligheidsmonitor.
8 Steunpunt Verkeersveiligheid | RA-2014-004
English Summary A semantic data model for road safety indicators Road safety analysis has the reputation of being lengthy, costly and time-consuming. The same information such as accident data is often stored multiple times by different organizations using heterogeneous models and formats. Digital cooperation and harmonization between administrations or between administrations and external actors can make the analysis faster, easier and cheaper for all parties concerned, in particular when information between different policy areas and policy levels must be exchanged. However, in the course of the past years the available IT infrastructure and services became highly customized and thus fragmented, resulting in a variety of applications to realize public services and policy support. Exchanging data between such applications is not obvious and, despite initiatives such as the establishment of common databases and the application of common ICT-standards, it remains difficult and complex to share data among stakeholders belonging to different organizations. Consequently, policy makers more than ever need one integrated monitoring platform to search for information and indicators that can support in all aspects of policy. In recent years several monitoring systems have been developed : A Road Safety monitor, the Spatial Monitor Flanders, the ‘Stadsmonitor’, the ‘Natuurindicatoren’, the ‘Milieu- en Natuurverkenning’, etc… This type of information platforms were a first step in centralizing, structuring and harmonizing policy-relevant indicators. The monitoring systems play an important role in the distribution of data and information to both internal and external stakeholders, yet they have thus far not proved to be capable in exchanging indicators. Semantic interoperability is an additional condition for exchanging digital information with unambiguous and shared meaning. This report is a first step towards the development of a semantic exchange model for the Flemish Road Safety monitor. The main objective of this research is to promote the accessibility, quality and exchangeability of indicators. Using a semantic exchange model Road Safety indicators can be described and published in a structured and coherent manner. The development of an exchange model to support the monitoring of road safety traffic is based on a combination of a top-down strategic analysis with a bottom-up requirements analysis. In the topdown approach the available semantic framework is reviewed. International standards that are eligible for the exchange model are analyzed and compared in order to avoid the development of a new isolated specification. In the bottom-up approach a case study, i.e. the integration of accident data with bike comfort data, is set up to map and describe specific requirements for interoperability of road safety indicators. By comparing the outcome of the requirements analysis with the range of existing standards a new specification is designed and proposed as a reference model for describing geographic road safety indicators. In this study the focus is on the development of a metadata profile for indicators, in the future it will be examined to what extent a specification can be modelled at data level. The designed specification is based on the existing vocabulary DCAT (European Commission, 2013a) and is therefore compatible with other data portals that use the same standard to describe 'Open Data'. Modifications and extensions were made to include the policy framework, spatial properties, provenance of data, and information on used measures and dimensions. A demo implementation of the specification is available on the Road Safety Monitor.
9 Steunpunt Verkeersveiligheid | RA-2014-004
1
Inleiding
1.1
Context en achtergrond
1.1.1
Europa en Vlaanderen kiezen voor Open Data
In maart 2010 heeft de Europese Commissie het startsein gegeven voor de Europa 2020strategie1 die de EU uit de crisis moet helpen en als doelstelling heeft de Europese economie te ontwikkelen tot een zeer concurrerende, sociale en groene markteconomie. Eén van de belangrijkste initiatieven van deze strategie is de Digitale Agenda voor Europa2 die ICT en overheidsgegevens als hulpmiddel wil inzetten in het behalen van de 2020-doelstellingen. Overheidsgegevens omvatten alle informatie die overheidsinstanties in de Europese Unie produceren, verzamelen of waar ze voor betalen. Voorbeelden zijn geografische informatie, statistieken, meteorologische gegevens, gegevens van met overheidsmiddelen gefinancierde onderzoeksprojecten en gedigitaliseerde boeken van bibliotheken. Deze informatie leent zich bij uitstek voor hergebruik in nieuwe producten en diensten, en kan op die manier zorgen voor efficiëntere overheden. Vooralsnog worden tot op vandaag weinig gegevens door de overheid ter beschikking gesteld voor hergebruik. Door overheidsgegevens open te stellen (bv via portalen) zullen burgers meer betrokken worden bij het politieke en maatschappelijke leven en kan een publieke bijdrage worden geleverd aan beleidsdomeinen zoals bijvoorbeeld milieu (European Commission, 2011). De exploitatie van het web als platform voor gegevens en informatie-integratie en het gebruik van semantische technologieën om overheidsgegevens beschikbaar en toegankelijk te maken worden aanzien als belangrijke sleutelelementen om met open data aan de slag te gaan. Ook in Vlaanderen is tijdens de afgelopen jaren een beleidskader ontstaan voor het beschikbaar stellen van overheidsgegevens als ‘Open Data’. Dit beleidskader is organisch gegroeid vanuit verscheidene regelgevende initiatieven o.a. decreet openbaarheid van bestuur, decreet hergebruik van overheidsinformatie, het GDI-decreet en het decreet betreffende het elektronisch bestuurlijke gegevensverkeer. Een conceptnota aan de Vlaamse Regering 3 bundelde alle voor open data relevante regelgeving en geeft een eerste aanzet naar een visie, strategische doelstellingen en plan van aanpak om met open data aan de slag te gaan. Door resoluut voor open data te kiezen, sluit de Vlaamse overheid aan bij een steeds groter wordend aantal overheden die de verbintenis hebben aangegaan om overheidsinformatie als open data beschikbaar te stellen aan het brede publiek. Open data wordt daarbij gedefinieerd als ‘data die openbaar zijn, elektronisch beschikbaar zijn en gebruik maken van open standaarden zowel voor het aanbieden (open formats) als het ontsluiten (open API’s) van gegevens’4. De conceptnota omvat 6 strategische krachtlijnen om gerelateerde knelpunten en randvoorwaarden aan te pakken (Bourgeois, 2011): 1) Open data wordt de norm binnen de Vlaamse overheid; 2) Hergebruik van open data is toegestaan, ook voor commerciële doeleinden, gratis of tegen een billijke vergoeding. Open data maakt hierbij gebruik van eenvoudige, gestandaardiseerde licentiemodellen; 3) Open data maakt gebruik van open standaarden; 4) Open data uit authentieke gegevensbronnen waar het kan; 5) Open data volgens een integrale benadering: Ook de lokale overheden in Vlaanderen zijn belangrijke leveranciers van data. Bovendien mag de link met het federale niveau niet vergeten worden. Samenwerking over de bestuurslagen heen biedt een sterke meerwaarde; 6) VO-bedrijfsinformatie in een centraal repertorium: Datasets uit deze gegevens over de Vlaamse overheid kunnen na een concrete beslissing van de Vlaamse Regering als open data ter beschikking gesteld.
1
http://ec.europa.eu/europe2020/index_en.htm http://ec.europa.eu/digital-agenda/ 3 http://www.bestuurszaken.be/sites/bz.vlaanderen.be/files/VR_2011_2309_DOC_09591_BIS_Beleid_met_betrekking_tot_open_data.pdf 4 Eén van de meest gehanteerde definities is de ‘open definition’ van de Open Knowledge Foundation. Voor meer informatie, zie http://opendefinition.org/okd/. 2
10 Steunpunt Verkeersveiligheid | RA-2014-004
Gedreven door soortgelijke initiatieven worden vandaag in heel Europa duizenden datasets opengesteld via het opzetten van Open Data portalen (bv http://data.gov.be). Het publiceren ervan gebeurt veelal op een ad-hoc wijze zonder zich te houden aan gemeenschappelijk overeengekomen normen en standaarden. Hierdoor ontstaat opnieuw een fragmentering van data die het zoeken, hergebruiken en integreren ervan opnieuw een uitdaging maakt. Het gebruik van semantiek kan een oplossing brengen en de uitwisselbaarheid van gegevens bevorderen. Bij een uitwisselingsproces van gegevens kan semantiek de structuur van data en de betekenis van de onderdelen beschrijven. Bij eGovernment toepassingen biedt semantiek het potentieel om slimmer en efficiënter met overheidsdiensten- en toepassingen om te gaan en om creativiteit en innovatie te bevorderen in onze digitale economie.
1.1.2
Van Open Data naar Linked Open Government Data
In deze paragraaf geven we meer achtergrondinformatie waarom een uitwisselmodel nodig is in de huidige ‘Open Data’ cultuur. Dit doen we door enkele begrippen te definiëren die ontstaan zijn door enerzijds het paradigma van een open overheid en anderzijds de inbreng van ICT die de openheid en transparantie mee kunnen ondersteunen. De combinatie van ‘Open Government’ en de ICT vooruitgang maakt het mogelijk om de kwaliteit van informatie verder te verbeteren en participatie en samenwerking tussen overheid en externe actoren te stimuleren (Geiger & Lucke, 2012).
1.1.2.1
Open Data (OD)
Open Data is, zoals het wordt gedefinieerd door de `Open Definition`5, data die vrij gebruikt kan worden, hergebruikt kan worden en opnieuw verspreid kan worden door iedereen onderworpen enkel, in het uiterste geval, aan de eis tot het toeschrijven en gelijk delen. Dit omvat de volgende eigenschappen:
1.1.2.2
Beschikbaarheid en Toegankelijkheid: De data moet in zijn geheel beschikbaar zijn, en voor niet meer dan een redelijke productieprijs, bij voorkeur door middel van downloaden via het internet. De data moet ook beschikbaar zijn in een handige en modificeerbare vorm. Hergebruik en herverspreiding: de data moet aangeboden worden onder voorwaarden die hergebruik en herverspreiding toestaan, daarbij ook het samenvoegen met andere datasets inbegrepen. Universele deelname: iedereen moet kunnen gebruiken, hergebruiken en herverspreiden.
Open Government Data (OGD)
De term Open Government Data (OGD) verwijst naar gegevens en informatie die geproduceerd of gecontroleerd worden door de overheid of door de overheid gecontroleerde instellingen, én die beschikbaar kunnen worden gesteld voor hergebruik voor zowel privé- als commerciële doeleinden, met minimale of geen juridische, technische of financiële beperkingen (European Commission, 2013b). De definitie van OGD verwijst expliciet naar de publieke sector, maar sluit tegelijkertijd de publicatie van vertrouwelijke of privé informatie uit. Dit houdt in dat de opgeslagen gegevens eerst door de verantwoordelijke administraties gescreend, doorzocht, gefilterd, geformatteerd, gecontroleerd of bewerkt kunnen worden. Deze gegevens kunnen van alle aard zijn: statistieken, geografische gegevens, kaarten, plannen, milieugegevens, boekhoudkundige gegevens, wetten en richtlijnen, en andere publicaties (Geiger & Lucke, 2012).
1.1.2.3
Linked Data (LD)
‘Linked’ Data is een essentieel onderdeel van het Semantische Web. Door Tim Berners-Lee in 2006 al beschreven als een component van ‘Web 3.0’, een trend waarbij Internettoepassingen 5
http://opendefinition.org/okd/ 11
Steunpunt Verkeersveiligheid | RA-2014-004
goed op elkaar afgestemd en soms zelf geïntegreerd kunnen worden. De ontwikkeling van het Internet wordt dan als volgt beschreven: van het web van documenten (Web 1.0) via Web 2.0 waar het Internet als interactief communicatiemedium beschouwd wordt en gebruikers informatie kunnen uploaden naar Web 3.0: het web van Linked Data, waar Internettoepassingen en data bijvoorbeeld via webservices aan elkaar gelinkt kunnen worden. Deze slimme toepassingen kunnen dan de links volgen tussen datasets. Dit is de basis van het semantic web (Folmer, Reuvers, & Quak, 2013). ‘Linked Data’ wordt in deze context gebruikt als term voor een methode voor het publiceren van data in een structuur zodat het linkbaar wordt en daarmee de bruikbaarheid verhoogt. Het bouwt voort op standaard web technologie zoals HTTP en URI, maar in plaats van webpagina’s leesbaar te maken op een klassieke manier, worden ze uitgebreid op een manier die machinaal leesbaar is. Hierdoor kunnen data van verschillende oorsprong geconnecteerd en bevraagd worden (Bizer, Heath, & Berners-Lee, 2009). Tim Berners-Lee definieerde 4 ontwerpprincipes van Linked Data6:
Use Uniform Resource Identifiers (URIs) to uniquely identify things (data entities); Use HTTP URLs, corresponding to these URIs, so that information can be retrieved; Provide metadata using open standards such as RDF; Include links to related URIs, so that people can discover more things.
1.1.2.4
Linked Open Data (LOD)
De bovenvermelde ontwerpprincipes vermelden geen openheid. De ‘O’ in Linked Open Data werd geïntroduceerd door latere projecten zoals het W3C Linking Open Data Project 7 en het LOD2 project8, die de indruk wekten dat LD en LOD synoniemen van elkaar zijn. Dit is echter niet altijd het geval. Ook de privé-sector met bedrijven zoals Garlik, BBC, Fujitsu European Labs, en AstraZeneca maken gebruik van Linked Data om hun private databronnen te integreren (Archer, Dekkers, Goedertier, & Loutas, 2013). Vanuit deze overweging kunnen we de volgende definitie afleiden voor Linked Open Data (Geiger & Lucke, 2012): Linked Open Data zijn alle opgeslagen data die via het WWW met elkaar geconnecteerd zijn en die voor het algemeen belang toegankelijk gemaakt worden zonder enige beperking voor gebruik of verdere verspreiding.
1.1.2.5
Linked Open Government Data (LOGD)
‘Linked Open Government data’ zijn bijgevolg ‘Open Government data’ die volgens de ‘Linked Data’ principes gepubliceerd zijn. Akkoorden over gemeenschappelijke formaten en structuren voor de uitwisseling van LODG ondersteunen het delen, het vinden en het hergebruik van deze data. Dit onderzoek wil bijdragen aan een uitwisselmodel voor een specifiek type van gegevens, namelijke ruimtelijke en beleidsrelevante indicatoren.
1.2
Doel en opzet
De belangrijkste doelstelling van dit onderzoek is het bevorderen van de toegankelijkheid, de kwaliteit en de uitwisselbaarheid van ruimtelijke indicatoren in het verkeersveiligheidsdomein. Dit rapport ambieert een belangrijke stap in de richting van de definitie van een semantisch uitwisselmodel zodat ruimtelijke indicatoren op een gestructureerde manier beschreven worden en in samenhang ontsloten en gepresenteerd kunnen worden. Hoewel het uitwisselmodel in de eerste plaats gericht is op ruimtelijke indicatoren, kan het ook aangewend worden voor nietruimtelijke indicatoren en bijgevolg gebruikt worden om gemengde (ruimtelijke én nietruimtelijke) en beleidsrelevante indicatorenclusters te ondersteunen.
6
http://www.w3.org/DesignIssues/LinkedData.html http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData 8 http://lod2.eu/ 7
12 Steunpunt Verkeersveiligheid | RA-2014-004
De ontwikkeling van een uitwisselmodel gebeurt vanuit de combinatie van een top-down strategische analyse met een bottom-up invulling. Deze schetsen het kader en randvoorwaarden waarin het semantisch model ontwikkeld zal worden en inventariseren de concrete behoeften om gegevens uit te wisselen. Vanuit de afstemming van beide benaderingen wordt een specificatie van een uitwisselmodel voor ruimtelijke indicatoren opgesteld.
Figuur 1:Algemeen kader voor de ontwikkeling van het uitwisselmodel
Met de combinatie van een top-down analyse en een bottom-up invulling wil dit onderzoek niet enkel technisch maar ook beleidsmatig zijn i.e. nagaan hoe indicatorenbundels kunnen opgesteld worden voor het monitoren van vooropgestelde beleidsdoelstellingen of ruimtelijke beleidsprincipes door het samenbrengen van informatie afkomstig van verschillende beleidsdomeinen en beleidsniveaus. Met dit onderzoek willen we bijvoorbeeld nagaan in welke mate monitoring op schaal Vlaanderen complementair kan zijn met monitoring op lokaal niveau. In de bottom-up analyse worden vanuit een concrete case de behoeften naar interoperabiliteit beschreven en in kaart gebracht. Diverse beleids- en wetenschappelijke documenten die aan het specifieke thema van de case gerelateerd zijn, vormen hiervoor de basis. Bij de top-down benadering wordt het algemene semantisch raamwerk geanalyseerd. Internationale standaarden die in aanmerking komen voor het uitwisselmodel worden geanalyseerd en vergeleken om te vermijden dat een nieuwe solitaire standaard ontwikkeld wordt. Door afstemming met de concrete behoeften kan een nieuw metadataprofiel en datamodel opgemaakt worden die als referentie-standaarden gebruikt kunnen worden om ruimtelijke beleidsindicatoren te beschrijven en ontsluiten. In een eerste fase van de ontwikkeling ligt de klemtoon op de ontwikkeling van een metadata profiel voor ruimtelijke indicatoren. In een tweede fase zal nagegaan worden in welke mate een specificatie opgesteld kan worden op data niveau.
1.3
Gevalstudie: harmonisering van ongevallen- en fietscomfortgegevens
Het is de regel dat de ontwikkeling van een specificatie of norm vertrekt vanuit één of meerdere gevalstudies die invulling geven aan de bottom-up benadering van de behoefteanalyse. Vanuit concrete gevalstudies kan men de behoeften inventariseren, beschrijven en in kaart brengen. De gevalstudie die we in dit rapport verder zullen analyseren is het op elkaar afstemmen van ongevallengegevens en fietscomfortgegevens. Ongevallengegevens en de daaruit afgeleide 13 Steunpunt Verkeersveiligheid | RA-2014-004
ongevallenstatistieken zijn essentieel om het verkeersveiligheidsbeleid op te volgen. De kwaliteit van de ongevallendata is echter niet optimaal en het opstellen van indicatoren over ongevalsoorzaken is slechts in beperkte mogelijk. Het integreren van ongevallengegevens met andere databronnen, zoals bv fietscomfortgegevens, kunnen een nieuwe kijk bieden op een specifiek thema, in dit geval de invloed van de fietsinfrastructuur op letselongevallen met fietsers. In hoofdstuk 2 analyseren we op welke wijze fietscomfortindicatoren en ongevallenindicatoren geharmoniseerd kunnen worden. Dit doen we door de heterogeniteit van bestaande indicatoren te analyseren en vertrekkende hiervan de specifieke behoeften aan semantisch componenten te beschrijven die het uitwisselen en integreren van indicatoren uit beide databronnen kunnen bevorderen.
1.4
Gewenste resultaten
Deze studie naar een uitwisselmodel voor ruimtelijke verkeersveiligheidsindicatoren richt zich op het aantonen van een reeks potentiële voordelen naar zowel data producenten als consumenten:
Het gebruik van gemeenschappelijke ontologieën en digitale woordenlijsten maken gefragmenteerde en heterogene indicatoren interoperabel en koppelbaar; Het leveren van domeinoverschrijdende en niveauoverschrijdende overheidsdiensten kan efficiënter geleverd worden; Externe stakeholders of private partijen kunnen door de beschikbaarheid van nieuwe gegevens nieuwe data-gedreven diensten ontwikkelen en bijkomende return-on-investment realiseren; Verschillende beleidsvraagstukken kunnen beter en efficiënter geanalyseerd worden, mede door participatie van andere overheidsdiensten of externe stakeholders die vrije toegang hebben tot ruimtelijke indicatoren.
14 Steunpunt Verkeersveiligheid | RA-2014-004
2. Gevalstudie: harmonisering van ongevallen- en fietscomfortgegevens In dit hoofdstuk verkennen we de noden en behoeften om een specifiek thema te monitoren, namelijk het belang van fietscomfort voor de algemene veiligheid van de fietsers. We analyseren op welke manier fietscomfortindicatoren en ongevallenindicatoren geharmoniseerd kunnen worden. Eerst gaan we dieper in op de relatie tussen de staat van de infrastructuur en fietsongevallen, vervolgens presenteren we beide gegevensbronnen en de gemeten concepten. Daarna beschrijven we hoe het generiek monitoringkader (Tirry & Steenberghen, 2013) kan toegepast worden op de context van dit specifieke onderwerp. Op basis van de beschikbare indicatoren maken we een analyse van de belangrijkste indicatorkenmerken en suggereren we een aantal semantische componenten om ruimtelijke indicatoren uit verschillende bronnen te harmoniseren.
2.1
Fietsinfrastructuur als oorzaak van ongevallen
In 2011 deden er zich volgens het jaarrapport Verkeersveiligheid in Vlaanderen 6.324 ongevallen voor waarbij fietsers betrokken waren (Carpentier & Nuyttens, 2013). 5.740 fietsers raakten hierbij lichtgewond, 805 zwaargewond en 49 stierven. 20,6 procent van wie sterft of zwaar gewond raakt in het verkeer is een fietser. Hierbij dient opgemerkt te worden dat door het fenomeen van onderregistratie het reëel aantal slachtoffers in werkelijkheid nog veel hoger is. In de praktijk is het zeer complex om op basis van de ongevallengegevens de exacte oorzaak van een ongeval te achterhalen. De ongevallenformulieren bevatten meestal geen of weinig informatie over de oorzaken van de letselongevallen, en geven in de eerste plaats de mogelijkheid aan ordediensten om factoren die aan het ongeval hebben bijgedragen in te vullen. De factoren kunnen betrekking hebben op de weggebruiker, zijn voertuigmiddel, of op de weg. Eerder onderzoek toonde aan dat het niet verlenen van voorrang – zowel door de fietser als door de opponent – een belangrijke rol speelt bij het ontstaan van dodelijke ongevallen (Martensen & Nuyttens, 2009; Van Hout, 2007). Factoren van de weg daarentegen worden in de ongevallenformulieren zelden als oorzaak van een ongeval aangegeven. In 2011 werden slechts voor 13.5% van alle ongevallen wegfactoren geregistreerd. Nochtans vormt de staat en aard van het fietspad een belangrijk risico op ongevallen met fietsers. Heel wat ongevallen gebeuren met langsrijdende voertuigen, en het risico neemt toe indien er bijvoorbeeld geen vrijliggend fietspad is aangelegd. De slechte staat van het fietspad werd in 2011 110 keer geregistreerd als oorzaak van een letselongeval met fietsers. Dat de staat van de fietsinfrastructuur en fietscomfort niet optimaal zijn, blijkt ook uit de comfortaudits door de Fietsersbond van 1400km fietspaden verspreid over 31 gemeenten in Vlaanderen (Coessens, 2013). De globale scores voor trillingscomfort zijn net geen 5/10, 5.2/10 voor de breedte van het fietspad en 6.5/10 voor de afscheiding t.o.v. de rijweg. Om de invloed van de staat en aard van de fietsinfrastructuur op ongevallen beter in te schatten, is er nood aan kwaliteitsvolle en geïntegreerde informatie:
Indicatoren over fietsongevallen en de daaruit resulterende letsels, waarbij de ordediensten extra aandacht dienen te geven aan het registreren van de ongevallenfactoren (gedrags-, voertuig- en wegfactoren)
Indicatoren over de staat en aard van de fietsinfrastructuur om het risico op ongevallen beter in kaart te brengen.
In de volgende secties bespreken we de 2 gegevensbronnen en hun karakteristieken in detail.
15 Steunpunt Verkeersveiligheid | RA-2014-004
2.2
Ongevallengegevens
Tegenwoordig wordt de verkeersveiligheidstoestand in een land of regio vooral beschreven op basis van geregistreerde letselongevallen. Zonder goede statistieken is het onmogelijk om uitspraken te doen over de algemene evolutie van ongevallen- en slachtoffercijfers. In Vlaanderen maken het Belgisch Instituut voor de Verkeersveiligheid (BIVV) en het Steunpunt Verkeersveiligheid jaarlijks een statistische analyse van letselongevallen op basis van de data die door de Federale overheidsdienst Economie Algemene Directie Statistiek en Economische Informatie (ADSEI) verzameld worden. Verschillende verkeersveiligheidsindicatoren (aantal lichtgewonden, zwaargewonden, verkeersdoden, ongevallenernst, risico’s enz.) komen in deze analyse aan bod (Carpentier & Nuyttens, 2013). In een volgende paragraaf bespreken we het ongevallenregistratieproces, daarnaast zal ook kort ingegaan worden op de belangrijkste indicatoren.
2.2.1
Het ongevallenregistratieproces
Het ongevallenregistratieproces in België werd reeds uitvoerig door Van Raemdonck et al. beschreven (Van Raemdonck, Van Malderen, & Macharis, 2011) en trachten we hieronder kort samen te vatten. Vooraleer het eigenlijk registratieproces toe te lichten, is het belangrijk stil te staan bij de definitie die men in België hanteert voor een verkeersongeval. De verkeersongevallendata voor België bevatten enkel ongevallen die plaatsvinden op de openbare weg, waarbij minstens één voertuig betrokken is, lichamelijke letsels veroorzaakt zijn, en vastgesteld werden door de politie. Dit impliceert dat ongevallen waarin alleen voetgangers betrokken zijn of ongevallen met enkel materiële schade niet opgenomen worden in de ongevallenstatistieken. Vaak worden ook enkelvoudige ongevallen met fietsers en voetgangers niet opgenomen in de statistieken, omdat ze meestal niet geregistreerd worden door de ordediensten. Bij een letselongeval komt afhankelijk van de plaats van het ongeval de lokale of federale politie ter plaatse. In de eerste plaats dient de politie de basisinformatie over het ongeval te verzamelen: identificatie van de betrokkenen, controle documenten, tijdstip en plaatsbepaling, etc.… Daarnaast verzamelen ze ook meer gedetailleerde informatie over de omstandigheden van het ongeval: verloop van het ongeval, zichtbaarheid, weersituatie, staat van de infrastructuur etc.… Op basis van alle informatie wordt dan een proces-verbaal (PV) opgesteld, dat het administratieve eindproduct is van politionele interventie. De finaliteit van een PV is echter van burgerlijke en strafrechtelijke aard, daarom worden de gegevens uit het digitale PV automatisch overgenomen in het verkeersongevallenformulier (VOF), waarbij de politie het VOF eventueel nog verder kan aanvullen of meer accuraat maken met informatie die achteraf bekomen werd bv over de toestand van het slachtoffer. Uiteindelijk worden de gegevens van de lokale en federale politie samengebracht in een nationale gegevensbank. Daar worden de gegevens gecontroleerd op actualiteit en volledigheid, alvorens ze verzonden worden naar de dienst ADSEI die ze opnieuw controleert, kalibreert en valideert. Indien er sprake is van dodelijke slachtoffers (slachtoffers die zijn overleden op de plaats van ongeval, bij het vervoer naar het ziekenhuis of binnen 30 dagen (= "doden 30 dagen")) zullen de parketten deze informatie aan ADSEI bezorgen via afzonderlijke fiches, zodat ADSEI de statistieken over dodelijke letselongevallen kan bijwerken. Ondanks de recente verbeteringen in het ongevallenregistratieproces (i.e. digitalisering en automatisering) is er nog steeds sprake van een significante onderregistratie van ongevallengegevens. Onderstaande figuur illustreert alle stappen waarbij gegevens over een letselongeval verloren kunnen gaan.
16 Steunpunt Verkeersveiligheid | RA-2014-004
Figuur 2:Schematische voorstelling overgenomen uit (Nuyttens, 2013)
van
informatieverlies
dat
leidt
tot
onderregistratie
Ten eerste is het pas bij wet verplicht een ongeval aan de politie te melden, indien de betrokkenen gewond of overleden zijn (stap 1 in Figuur 2). De ordediensten hoeven niet opgeroepen te worden bij ongevallen met louter materiële schade. In bepaalde gevallen kan het echter voorkomen dat verkeersslachtoffers hun eigen letsels niet of pas later erkennen zoals bv. bij whiplash (stap 2). Zelfs indien er sprake is van een duidelijk letsels, wordt de politie volgens Lammar (Lammar, 2006) om heel wat redenen niet ingelicht (stap 3) en gaat hier de meeste informatie verloren:
De betrokkenen zijn niet op de hoogte van de meldplicht;
De aard van de letsels wordt niet voldoende ernstig bevonden;
Er was geen derde partij betrokken;
Slachtoffers zijn onder invloed van alcohol of drugs;
De politie wordt niet geïnformeerd uit angst voor vervolgingen.
Ten vierde moet de politie ook ter plaatse komen (stap 4) en alle informatie correct registreren (stap 5). Ook hier kan informatieverlies optreden. Uiteindelijk moeten de VOFs gecentraliseerd worden in de nationale databank (stap 6) en opgenomen worden in de statistieken van ADSEI (stap 7). Door aanpassingen in het registratieproces, is het aantal fouten in stap 6 en 7 weliswaar significant gedaald. ADSEI is zich bewust van de onderregistratie en vermenigvuldigt daarom de gemeten statistieken met een kalibratie-coëfficiënt of ophogingsfactor om cijfers te bekomen die dichter bij de werkelijke aantallen aanleunen. De coëfficiënten bedragen afhankelijk van de politiezone ongeveer 20 à 25 procent voor licht en ernstig verwonde verkeersslachtoffers. Eenmaal de ongevallengegevens door ADSEI verwerkt zijn, worden ze mits het afsluiten van een vertrouwelijkheidscontract (ter bescherming van de privacy) ter beschikking gesteld aan de gebruikers (MOW, BIVV, Steunpunt Verkeersveiligheid, etc.…).
2.2.2
Gelokaliseerde ongevallen en gevaarlijke punten
Om verder onderzoek te doen naar ongevalsfactoren met behulp van ruimtelijke indicatoren, is er nood aan gegeorefereerde ongevallendata (Van Malderen & Macharis, 2010). Het departement MOW van de Vlaamse Overheid staat zelf in voor de lokalisatie van de ongevallen. Voor het merendeel van de ongevallen kan men via adresinformatie en het Centraal Referentieadressenbestand (CRAB) de puntlocatie automatisch bepalen. Voor de verkeersongevallen waarbij geen exacte locatie gekend is, wordt er opnieuw samengewerkt met de lokale politiezones om de ongevallengegevens te corrigeren. Uiteindelijk kan men na het consulteren van de politiezones 95% van de geregistreerde verkeersongevallen lokaliseren. Nadien wordt een eindverwerking uitgevoerd en worden de verkeersongevallen geaggregeerd over een periode van 3 jaar om o.a. zwarte punten te identificeren. Zwarte punten worden 17 Steunpunt Verkeersveiligheid | RA-2014-004
berekend op basis van de 1-3-5 definitie waarbij rekening wordt gehouden met de ernst van het ongeval. Een lichtgewonde (LG) krijgt een gewicht van 1, een zwaargewonde (ZG) 3 en een dodelijk verkeersslachtoffer (D) 5. Men bekomt een zwart punt indien er op 3 jaar tijd op dezelfde plaats minimum 3 ongevallen gebeurd zijn en waarbij het totale gewicht 15 of meer bedraagt. Dit wordt samengevat in de volgende functie (Moons, 2009): 1 LG + 3 ZG + 5 D ≥ 15
2.2.3
Ongevallenindicatoren
Het jaarrapport Verkeersveiligheid opgemaakt door het BIVV en het steunpunt verkeersveiligheid (Carpentier & Nuyttens, 2013) geeft jaarlijks een overzicht van de belangrijkste ongevallenstatistieken en een nadere analyse van de verkeersslachtoffers op Vlaams niveau. Omdat enkel de registratie van het aantal verkeersdoden (bijna) volledig is, is dit de meest betrouwbare indicator voor de beschrijving van de evolutie van de verkeersveiligheid, en ligt de nadruk in het jaarrapport in de eerste plaats op de evolutie van het aantal verkeersdoden. Naast de evolutie van het absoluut aantal slachtoffers, worden ook de mortaliteit (aantal doden per miljoen inwoners), het overlijdensrisico (aantal verkeersdoden per miljard reizigerskilometer), het ongevalsrisico (aantal letselongevallen per miljard voertuigkilometers) en de ongevallenernst (aantal verkeersdoden per 1000 letselongevallen) op grafiek weergegeven. Voorts worden de verkeersslachtoffers ook verder opgesplitst naar leeftijd, geslacht en verplaatsingswijze. Daarnaast worden ook indicatoren opgesteld die verder inzoomen ongevalsomstandigheden. Ongevallen worden daarom verder ingedeeld volgens:
op
de
Tijdstip: letselongevallen zijn onderhevig aan het seizoen, de periode van de week en de uren van de dag;
Weergesteldheid: Regenweer levert een verhoogd risico op ten opzichte van normale weersomstandigheden, mede door de verminderde zichtbaarheid en langere remafstand.
Locatie: het type weg, de locatie binnen of buiten de bebouwde kom, het lokale snelheidsregime en het type kruising bepalen mee de ernst van het ongeval.
Terwijl de ongevallendata voldoende informatie leveren over de evolutie van het aantal slachtoffers en over de ongevalsomstandigheden, is het opstellen van indicatoren over ongevalsoorzaken slechts in beperkte mate mogelijk. Tijdens het ongevallenregistratieproces kan de politie ter plaatse zelden met zekerheid oordelen over bepaalde ongevalsoorzaken zoals overdreven of onaangepaste snelheid, gordeldracht, etc.… De indicatoren over ongevalsoorzaken zijn dan ook meestal gelimiteerd tot het weergeven van informatie over rijden onder invloed. Het percentage bestuurders onder invloed wordt gedefinieerd als het aantal bestuurders onder invloed in verhouding tot het aantal geteste bestuurders. De statistieken hebben enkel betrekking op de bestuurders die bij een letselongeval betrokken zijn en hebben geen verband met alcoholcontroles buiten een ongevalscontext.
2.3 2.3.1
Fietscomfortgegevens Ontstaansgeschiedenis fietspadenaudit
Vlaanderen heeft een netwerk van bovenlokale fietsverbindingen (BFF) van ca. 12.000 km. Sommige daarvan werden recent aangelegd, andere 20-30 jaar geleden op basis van de toen geldende veiligheids- en comforteisen. Bijgevolg is er nood aan een gerichte opwaardering van de bestaande fietsinfrastructuur in overeenstemming met de huidige en toekomstige veiligheidsen comforteisen (Crevits, 2010). Hiertoe werden meerdere initiatieven uitgewerkt zoals het sterrensysteem voor fietspaden, waarbij zowel de onderhoudstoestand van het fietspad (o.a. putten en verzakkingen) als het comfort (o.a. vlakheid) en de veiligheid in rekening gebracht worden (Crevits, 2009). Op termijn dienen alle fietspaden langs gewestwegen te voldoen aan 18 Steunpunt Verkeersveiligheid | RA-2014-004
de normen die opgesteld werden in het Vademecum Fietsvoorzieningen9 o.a. door het uitvoeren van een programma van structureel onderhoud. Zowel het gewest, de provincies als de gemeenten spelen hun rol in het structureel onderhoud. Maar liefst 60% van het BFF ligt op gemeentewegen, dus zijn de gemeenten zeer belangrijk als schakel in de aanleg en het beheer van veilige en comfortabele fietspaden. Toch blijkt ook dat vele gemeenten geen precies zicht hebben op de staat van hun fietsinfrastructuur. Daarom werd in 2010 een proefproject fietspadenaudits opgezet om op een objectieve wijze de kwaliteit van het fietspadennetwerk te meten. De fietspadenaudit bouwde verder op het eerste meetfietsproject (2008 -2009) dat op vrijwillige basis was opgezet door de Fietsersbond. De testen met de eerste meetfiets toonden aan dat dit type van metingen helpen om te komen tot een benchmarking en tot een breder inzicht in de effectieve kwaliteit van het fietspadennetwerk. Voor de fietspadenaudit werden 5 meetfietsen aangekocht om vlakheidsmetingen uit te voeren i.e. de effenheid van het fietspad wordt gemeten door de trillingen bij het overrijden. De Fietsersbond werd geselecteerd voor de uitvoering van het project. Het proefproject verliep in drie fases in de periode van juni 2010 tot maart 2011.
de ontwikkeling van 3 belangrijke bouwstenen voor fietspadenaudits in Vlaanderen,
het uittesten van deze bouwstenen,
de voorbereiding voor de uitbreiding van het hele project naar alle gemeenten vanaf de lente van 2011.
De 3 bouwstenen waren: 1)
Het uittesten van de nieuwe meetfietsen om te komen tot een uniforme fietseronafhankelijke meetprocedure.
2)
Het aanmaken van een online toegankelijke databank waarin meetgegevens worden opgeslagen. In deze databank kunnen dan zoekopdrachten worden ingegeven om de gegevens beleidsmatig te interpreteren.
3)
Het in detail uitschrijven van de auditprocedure voor fietspaden met het oog op de aanpassing en aanvulling van het Vademecum Fietsvoorzieningen.
Inmiddels werd het proefproject verlengd, en werden naast trillings- en comfortgegevens ook de karakteristieken van kruisingen geregistreerd in functie van potentiële veiligheidsproblemen.
2.3.2
Auditmethode
Het in detail uitschrijven van een uniforme auditmethode om de staat van het fietspad te meten is noodzakelijk voor een objectieve inschaling ongeacht het fietspad en ongeacht de meetfietser. Het resulterende document (Coessens, 2013) definieert een fietspadenaudit en beschrijft concrete richtlijnen om een audit op een correcte manier uit te voeren. Het voorwerp van de fietspadenaudit omvat alle tracés, die uitsluitend of hoofdzakelijk voor fietsers zijn aangelegd, of waar fietsers de belangrijkste weggebruiker zijn. Er bestaan 4 types fietstracés:
9
fietspaden die aanliggend en/of vrijliggend zijn;
fietswegen (fietstracés in eigen bedding langs spoorlijnen, doorheen een veld of bos);
jaagpaden die vaak worden gebruikt door fietsers;
korte fiets-/voetgangers-doorsteken die fungeren als verbinding tussen twee straten.
http://www.mobielvlaanderen.be/vademecums/vademecumfiets01.php (nieuwe versie 2013) 19
Steunpunt Verkeersveiligheid | RA-2014-004
Een audit van fietspaden is minstens een audit van alle fietspaden en van alle fietswegen. De opgestelde auditprocedure beschrijft de volgende stappen om tot een uniforme audit van fietspaden te komen: 1) het verzamelen van de administratieve, vooraf gekende informatie over deze fietspaden: aantal tracés, lengte, locatie, type parallelweg, wegbeheerder, datum van aanleg, type BFF Route, hun mogelijks deel zijn van een gemeentelijk fietsroutenetwerk of schoolroutenetwerk; 2) het invoeren van deze data in de fietsaudit applicatie (smartphone); 3) het opstellen van een routeplan voor de audit; 4) het ter plaatse afrijden van de fietspaden en registreren van alle kenmerken, de afmetingen en de comfortkwaliteit; 5) het verzamelen van visueel materiaal (foto’s) tijdens de audit in geval het fietspad recenter is dan 2008 of een fietsweg, fietsdoorsteek of jaagpad is; 6) het invoeren van deze gegevens in de databank en koppeling van het visueel materiaal; 7) het verifiëren van deze gegevens in de databank (controle op volledigheid en juistheid) en ter beschikking stellen ervan aan de wegbeheerder via de gepaste rapportering en cartografie.
2.3.3
Indicatoren fietscomfort
Onderstaande tabel beschrijft de comfortaspecten die tijdens een audit gemeten worden.
Tabel 1: comfortaspecten van een fietspadenaudit
Comfortaspect
Beschrijving
Trillingscomfort
Alle trillingsmetingen werden gedaan met een door de KU Leuven ontwikkelde meetfiets. Het 10Hz meetsysteem, een gravitatiemeter geplaatst op de vooras levert 100 meetresultaten per seconde (6000/minuut). Met het opzoekingscentrum voor de wegenbouw (OCW) werd tijdens het pilootproject in 2007 afgesproken om standaarddeviatie (STDEV) te gebruiken als statistische verwerkingsmethode voor deze meetgegevens. Na evaluatie werden de standaarddeviatieresultaten op lineaire basis herleid tot scores op 10. De breedte van het fietspad is niet enkel belangrijk voor de veiligheid, maar beïnvloedt ook het gevoel van comfort. De eisen/richtlijnen gesteld in het fietsvademecum voor breedte waren de basis voor de waardering van de breedte. Een fietspad met de minimale breedte zoals bepaald in het vademecum enerzijds voor enkelrichtingsfietspaden, anderzijds voor tweerichtingsfietspaden kreeg in dit onderzoek een 7,5/10. Een fietspad met de aanbevolen breedte zoals bepaald in het vademecum kreeg een 10/10. Een goed fietspad met een breedte daartussenin zou dus een 8,5/10 krijgen. De afscheiding t.o.v. de rijweg werd als derde parameter geëvalueerd. De afscheiding of buffer is uiteraard zowel voor veiligheid als comfort belangrijk. Om te komen tot een aanvaardbare berekening van de buffer werd zowel de boordsteen van het fietspad (of de strepen indien geschilderd) als de goot van de weg en – indien aanwezig- de verharde of groene zone daartussen opgemeten. Indien er zich een haag bevond tussen het fietspad werd de hoogte van de haag meegeteld. Bij verhoogde fietspaden werd de opkant meegeteld. Parkeerzones tussen de weg en het fietspad werden ook meegeteld tenzij er zich veel auto’s bevonden en er minder dan 60cm ruimte was tussen de geparkeerde auto’s en het fietspad. Tot slot waren de snelheid op de parallelle rijweg en het enkel- of dubbelrichtingskarakter van het fietspad, 2 laatste elementen die de score beïnvloedden.
Evaluatie breedte
van
de
Evaluatie van de afscheiding van de weg
20 Steunpunt Verkeersveiligheid | RA-2014-004
Voor elk gemeten tracé wordt voor elk van bovenstaande comfortaspecten een totaalscore berekend, alsook een globale evaluatie van alle comfortaspecten samen . Op basis van het gewogen gemiddelde (met afstand in km als gewicht) gebeurt dit ook voor alle gemeentelijke en gewestelijke fietspaden samen. Tabel 2: voorbeeld van scoring op comfortaspecten Straat
Beheerder
Classificatie
Type Trace
Trill
Br
Afsch
Globaal 5,9
Lengt e (M) 3160
Ouder dom 3
Steenwe g op Baarle Hertog Kanaal jaagpad Kanaal jaagpad
AWV
Functionele route BFF
Fietspad
9,2
5
0
Waterwegen en Zeekanaal Waterwegen en Zeekanaal
Hoofdroute BFF
Jaagpad
8,5
10
10
9,3
1565
19
Hoofdroute BFF
Jaagpad
8,4
10
10
9,2
2515
19
In de meest recente auditprocedure (generatie 3) worden naast comfortaspecten ook de kenmerken en probleempunten van kruisingen geregistreerd. Deze worden niet meegenomen in de berekening van de score, maar worden samen met acute comfort- of veiligheidsproblemen (bv put, geen markering, etc.…) op kaart gevisualiseerd.
2.4
Monitoringkader voor fietscomfort en fietsveiligheid
Een geïntegreerde monitoring van fietsongevallen, ongevalsfactoren en de staat van de fietsinfrastructuur kan bijdragen aan een objectieve opvolging van de reële kwaliteit en veiligheid van het fietspadennetwerk. In deze sectie trachten we een specifiek monitoringkader op te stellen voor fietscomfort en fietsveiligheid, weliswaar beperkt tot de fietspadinfrastructuur. We vertrekken hierbij van het generieke monitoring kader van de verkeersveiligheidsmonitor (Tirry & Steenberghen, 2013) en passen vervolgens hierop het analytisch kader van de comfortaudits en ongevallenregistratie toe.
2.4.1
Generiek kader van de Verkeersveiligheidsmonitor
In 2012 werd de aanzet gegeven voor een Verkeersveiligheidsmonitor met de ontwikkeling van een generiek conceptueel kader om de toestand en dynamiek van een beleidsthema op een coherente en consistente wijze te monitoren. Het conceptueel kader heeft als doel een structuur aan te reiken om indicatoren en de fenomenen, problematieken en uitdagingen die ze illustreren met elkaar te verbinden en logisch te ordenen binnen één geharmoniseerde set van indicatoren. Het vormt de ‘conceptuele bril’ waardoor men kijkt om indicatoren te kunnen plaatsen en interpreteren. Het conceptuele denkkader heeft als doel de individuele indicatoren volgens een bepaalde systeembenadering met elkaar te verbinden in een coherent geheel (Tirry & Steenberghen, 2013)
21 Steunpunt Verkeersveiligheid | RA-2014-004
Figuur 3: Schematische weergave van een generiek conceptueel kader
Het conceptueel kader voor de Verkeersveiligheidsmonitor is gebaseerd op 2 grote blokken die met elkaar interageren in strategische indicatorenbundels en die verweven zijn in een beleidscyclus. Het linkerblok in de figuur, dat aangedreven wordt door externe drijvende krachten (economisch, politiek, sociaal-cultureel…), ordent de omgevingsfactoren volgens meetbare maatschappelijke tendensen. Het rechterblok toont de beleidsambities van een beleidsdomein, uitgesplitst in strategische doelstellingen, operationele doelstellingen en concrete actieprogramma’s. Deze beleidsambities worden afgestemd met beleidspartners, zowel horizontaal (met andere beleidsdomeinen) als verticaal (met andere beleidsniveaus), en met andere stakeholders. Beide blokken interageren met elkaar in zogenaamde strategische indicatorenbundels die relevant zijn voor het ruimtelijk beleid. Dit zijn groepen van indicatoren die bewust samengenomen worden om een meer integrale kijk te bekomen op de nagestreefde beleidsdoelstellingen of op specifieke sleutelkwesties. Het is duidelijk dat een set van indicatoren op meerdere manieren gebundeld kan worden in functie van de thematiek die men wil monitoren. Men kan bijvoorbeeld indicatoren bundelen om een specifiek subthema (bv. fietscomfort en fietsveiligheid) toe te lichten, maar men kan ook indicatoren bundelen om een totaalbeeld te genereren of om een heel specifiek beeld te bekomen van de concrete output van het beleid. Indicatoren binnen één indicatorenbundel kunnen zowel afkomstig zijn van het linkerblok (omgevings- en effectindicatoren) als van het rechterblok (output- en procesindicatoren).
2.4.2
Analytisch kader voor fietscomfort en fietsveiligheid
Het concept van comfortaudits is in de eerste plaats bedoeld om een globaal zicht te krijgen op de comfortkwaliteit van de fietsinfrastructuur. Comfortabele fietspaden die niet verkeersveilig zijn, hebben weinig toegevoegde waarde. Een gecombineerde audit comfort/veiligheid is volgens de Fietsersbond bijgevolg opportuun, maar inschatting van veiligheid op zuivere objectieve en meetbare criteria blijkt complex en moeilijk realiseerbaar (Fietsersbond vzw, 2009). Toch is men in het algemeen erover eens dat het verhogen van het fietscomfort bijdraagt tot de vergevingsgezindheid van de infrastructuur en bijgevolg het risico op letselongevallen voor fietsers vermindert. Het opstellen van een specifieke indicatorenset in een uniform
22 Steunpunt Verkeersveiligheid | RA-2014-004
monitoringsysteem, waarbij gegevens over fietsongevallen en fietscomfort gebundeld worden, kan ondersteuning bieden om het verband tussen comfort en veiligheid beter te analyseren. Indien we dit specifiek thema toepassen op het algemene conceptueel kader van de Verkeersveiligheidsmonitor komen we tot de volgende invulling:
Figuur 4: het thema fietscomfort ingevuld in het generiek monitoringkader
De toestand van de fietsinfrastructuur en het voorkomen van fietsongevallen wordt bepaald en aangedreven door externe (politieke, economische, sociale, technologische) drijvende krachten. De staat van de fietsinfrastructuur kan gemeten worden aan de hand van scores, afzonderlijk per comfortaspect of een globale score. Deze scores alsook de kenmerken van de tracés kunnen als individuele indicatoren op kaart gevisualiseerd worden. Ook ongevallengegevens kunnen verder geanalyseerd worden en informatie geven de eigenschappen van fietsongevallen en fietsslachtoffers (geslacht en leeftijd), de evolutie van fietsongevallen, het voorkomen van ‘zwarte punten’ op het netwerk, wegfactoren, etc.… Door ongevallengegevens en comfortgegevens te combineren kan men beter zicht krijgen op de staat en impact van de fietsinfrastructuur op ongevallen en kan een gericht fietsbeleid ontwikkeld worden met aandacht voor technische aspecten, subsidiëring en sensibilisering. De beleidsambities kunnen vertaald worden naar strategische doelstellingen, operationele doelstellingen en concrete actieprogramma’s. De interactie tussen de huidige toestand en het gekozen beleid kan vertaald worden naar strategische indicatorenbundels die relevant zijn voor verder beleid. In een indicatorenbundel kijkt men bv naar de benchmarking van gemeenten of exploreert men welke tracés prioriteit krijgen voor subsidiëring. Ook het in kaart brengen van de vraag naar comfortabele fietspaden (bv op basis van aandeel van fietsers in verplaatsingen) kan de gemeenten helpen om meer gericht te investeren in de fietsinfrastructuur. De verweving met de beleidscyclus zoals vooropgesteld in het generiek kader blijft van toepassing voor onze gevalstudie.
2.5
Uitwisseling van gegevens
Basisgegevens of afgeleide indicatoren met betrekking tot fietsongevallen en fietscomfort kunnen momenteel niet uitgewisseld of geïntegreerd worden. De belangrijkste reden hiervoor is het gebrek aan toegang tot de ruwe gegevens: zowel de ongevallendata als de fietscomfortgegevens zijn niet publiek toegankelijk, o.a. omwille van de bescherming van de privacy.
23 Steunpunt Verkeersveiligheid | RA-2014-004
Daarnaast zijn de applicaties die gebruikt worden om beide gegevens te beheren fundamenteel verschillend. Gelokaliseerde ongevallengegevens kunnen geraadpleegd en bevraagd worden via een geoloket ‘Ongevallen’. Op aanvraag kunnen ze ook door het departement MOW geëxporteerd worden naar een ESRI geodatabase of shapefile die zowel de puntlocatie als een beschrijving van de ongevallenkenmerken bevat. De fietscomfortgegevens daarentegen worden niet beheerd in een GIS-omgeving, maar in een onafhankelijke databank waarin de GPScoördinaten van de meetpunten samen met de kenmerken van de meting als alfanumerieke gegevens opgeslagen worden. De databank wordt via een web applicatie ontsloten naar gemeentelijke, provinciale en gewestelijke mandatarissen en ambtenaren die verantwoordelijk zijn voor het fietsbeleid en investeringen in fietsinfrastructuur. Wel is er gebruikmakend van Google Maps een toepassing ontwikkeld die de kenmerken van de gemeten tracés en de scores voor de verschillende comfortaspecten als punten of lijnen visualiseert (Figuur 5). De fietscomfortgegevens kunnen enkel als een CSV-bestand gedownload worden.
Figuur 5: lijnvisualisatie van breedtecomfort
Het opstellen van een passend beleid inzake de fietsinfrastructuur vraagt om de ontwikkeling van grootschalige infrastructuren om primaire en afgeleide gegevens te delen, te integreren en te verwerken op een betekenisvolle manier waarbij manuele handelingen zo veel mogelijk vermeden wordt. Om de ongevallen- en fietscomfortgegevens te integreren, zijn er momenteel 2 fundamentele hindernissen: syntactische discrepantie en semantische heterogeniteit.
2.5.1
Syntactische discrepantie
Syntactische discrepantie doet zich voor wanneer de schrijfwijze (vorm of syntax) van de uit te wisselen gegevens verschilt (Brussee, Punter, & Roes, 2008). Een klassiek probleem in GIS dat we ook in onze gevalstudie aantreffen, is de syntactische heterogeniteit door het gebruik van verschillende datamodellen en bestandsformaten: shapefile, file geodatabase, ASCII, etc.…Zowel de ongevallengegevens als de fietscomfortgegevens worden opgeslagen volgens een eigen specifiek datamodel en verspreid via heterogene bestandsformaten. Tijdens het laatste decennium is de beschikbare software, inclusief de GIS software, in die mate geëvolueerd dat het transformeren tussen verschillende datamodellen, bestandsformaten of tussen verschillende geometrieën niet langer een onoverkomelijk probleem vormt. Bovendien zijn er de afgelopen jaren door het Open Geospatial Consortium (OGC) standaarden en bestandsformaten zoals de Geography Markup Language (GML) ontwikkeld die syntactische 24 Steunpunt Verkeersveiligheid | RA-2014-004
interoperabiliteit mogelijk maken. In de praktijk kan het echter vervelend en tijdrovend zijn om gegevens qua vorm en syntax op elkaar af te stemmen.
2.5.2
Semantische heterogeniteit
Semantische heterogeniteit doet zich voor wanneer meerdere betekenissen gegeven worden aan één concept uit de reële wereld om het te kunnen gebruiken in een verschillende context of in verschillende disciplines (Bishr, 1998). Wat wordt bedoeld met het begrip ‘fietspad’, ‘wegbeheerder’, etc.… Het kan tot verwarring leiden indien niet alle stakeholders dezelfde betekenis geven aan de concepten en begrippen die binnen eenzelfde monitoringsysteem gehanteerd worden. Ook context bepaalt mee de betekenis van de concepten. Worden trillingsmetingen uitgevoerd in functie van comfort of in functie van veiligheid? Om concepten en de onderliggende gegevens op eenduidige wijze uit te wisselen, is het aangewezen de context te kennen waarbinnen de gegevens verzameld werden. We identificeerden bij onze 2 databronnen de volgende semantische tekortkomingen om ze op een betekenisvolle manier te integreren:
1) Geen of onvolledige metadata Metadata zijn gegevens die de eigenschappen van informatieobjecten beschrijven. Typische metadata van een dataset zijn de titel, beschrijving, formaat, auteur, aanmaakdatum, uitgever, toegangsvoorwaarden, etc.… Het voorschrijven van een uniform schema of standaard kan de vindbaarheid en de samenhang van informatie verhogen. Noch voor de ongevallengegevens, noch voor de fietscomfortgegevens worden op dit ogenblik metadata volgens een uniform metadataschema gedocumenteerd. Wel bestaan er afzonderlijke beschrijvende documenten (Word-formaat) die een aantal metadata-elementen bevatten. Het ontbreken van een uniform schema bemoeilijkt de interpretatie en integratie van de gegevens. Onderstaande tabel toont de metadataschema’s die gedocumenteerd worden in vergelijkbare monitoringsystemen zoals het Natuurrapport en de Stadsmonitor.
Tabel 3: Vergelijking metadataschema’s Natuurrapport en Stadsmonitor Natuurrapport Indicator Analyse
Achtergrondinformatie
-Titel -Beschrijving -Beleidsdoel -Trend en doelafstand -Verklaring -Verwachting -Extra bijlage -Link naar versie natuurrapport -Indicatorverantwoordelijke -Databeheerder -Verwijzing naar Mina-plan -Referentie
Stadsmonitor -Titel -Korte definitie -Uitgebreide definitie -Toelichting Cluster -Compleetheid -Validiteit -Bekommernissen uit de visie Extra informatie -Databron (opgesplitst volgens leverancier teller en noemer van -Schaal indicator) -Betrouwbaarheid -Kostprijs -Vergelijkbaarheid tijd -Periodiciteit
en
in
Hoewel beide monitoringsystemen een verschillend metadataschema hanteren, bevatten ze een aantal gemeenschappelijke elementen die verwijzen naar gerelateerde beleidsdoelstellingen, beleidsdocumenten en bereikte resultaten. Een gemeenschappelijke metadata-structuur waarbinnen de betekenis van elk van de metadata-velden exact gekend is, zou ons in staat stellen om een duidelijker onderscheid te maken naar bv de representativiteit van een indicator om een welomlijnde beleidsdoelstelling te meten. In het Natuurrapport en de Stadsmonitor ontbreken er evenwel een aantal essentiële metadataelementen die noodzakelijk zijn om gegevens te integreren: -
toegang en gebruik van de data: is er informatie beschikbaar wie de data mag gebruiken, worden er licenties gebruikt? 25
Steunpunt Verkeersveiligheid | RA-2014-004
-
distributie van data: hoe worden de indicatoren gedistribueerd, welke formaten worden er gebruikt…. Gebruik van identifiers: zijn er unieke identifiers die gebruikt kunnen worden om te verwijzen naar een indicator? Geldigheid: hoe lang is de indicator geldig? Op welke tijdsperiode heeft de indicator betrekking?
2) Gebruik van verschillende classificaties Een tweede verschil dat we observeren wanneer we beide databronnen vergelijken is het gebruik van uiteenlopende classificaties voor dezelfde concepten. Bijvoorbeeld, in onderstaande tabel wordt weergegeven hoe het type van fietspad op verschillende wijze gecategoriseerd wordt in beide databronnen. Tabel 4: Vergelijking classificatie fietspad
Ongevallendata plaats op fietspad
Fietscomfortgegevens type fietspad
rijdt op / verlaat vrijliggend fietspad rijdt op fietspad, gescheiden door markering andere
Aanliggend Aanliggend bij obstakel Kort reglementair aanliggend bij kruising Vrijliggend Losliggend Geen fietspad
Een ander voorbeeld van een uiteenlopende classificatie is het beschrijven van comfortfactoren waarin het comfort- of veiligheidsprobleem op een ander detailniveau beschreven wordt in functie van de finaliteit van de databank.
Tabel 5: Vergelijking wegfactoren
Ongevallendata wegfactoren slechte staat van de weg of fietspad gebrekkige signalisatie defecte of onvoldoende verlichting werken verkeersopstopping, file, ongeval sterke daling (>7%) scherpe bocht slechte zichtbaarheid
Fietscomfortgegevens Acuut comfort- en veiligheidsproblemen 1a.Op-en afrijden bij kruising absoluut problematisch 1b.Oprijden problematisch 1c.Afrijden problematisch 2.Brede scheur in fietspad 3.Put of verzakking (inclusief verzakte of te hoge putdeksels) 4a.Opstuwing boomwortels 4b.Sterk uitstulpende voegvulling 4c.Gevaarlijk uitstekend materiaal/bult 5.Vuil op fietspad 6a.Bermbegroeiing woekert 6b.Overhangende takken 7a.Vernauwing : paaltjes 7b.Gevaarlijk: te nauwe doorgang 8.Te scherpe bocht/asverlegging 9.Teveel indalingen 10.Gevaarlijk niveauverschil in lengterichting 11a.Markering invoeging rijweg ontbreekt 11b.Markering invoeging rijweg ok maar geen rugdekking 11c.Markering invoeging rijweg & rugdekking ok 12.Fietspad ligt teveel in dwarshelling 13.Zeer gevaarlijke afslag auto’s 14.Markering sterk vervaagd
26 Steunpunt Verkeersveiligheid | RA-2014-004
Om aan de hand van indicatoren een analyse te maken over de invloed van de staat van de infrastructuur op ongevallen is ofwel een harmonisatie van classificaties ofwel een duidelijke keuze voor één (nieuwe) bepaald classificatiesysteem wenselijk om tot een betere interoperabiliteit te komen. Producenten van indicatoren hoeven hiervoor niet noodzakelijk hun eigen classificatie aan te passen, maar kunnen voorzien in een transformatie naar een gemeenschappelijke groepering of classificatie.
3) Gebruik van verschillende ruimtelijke aggregatieniveaus Uit een analyse van de ongevallengegevens en fietscomfortgegevens blijkt dat de afgeleide indicatoren niet volgens eenzelfde ruimtelijke aggregatie gepubliceerd worden. Het niveau van de aggregatie wordt bepaald door het bestuursniveau waarvoor de indicatoren van toepassing zijn. De fietscomfortgegevens worden bijvoorbeeld per gemeente en per wegbeheerder geaggregeerd in functie van het structureel beheer en onderhoud van de fietstracés. Het zijn immers de lokale gemeenten die instaan voor de aanleg en het onderhoud van de lokale fietspaden en de gewesten die instaan voor het beheer van fietspaden langsheen de genummerde wegen. Ongevallen daarentegen worden vaak geaggregeerd per gewest omdat mobiliteit en infrastructuur hoofdzakelijk regionale bevoegdheden zijn. In het jaarrapport Verkeersveiligheid worden de dodelijke ongevallen ook geaggregeerd per provincie om de invloed van de bevolkingsdichtheid op dodelijke letselongevallen na te gaan. Hieruit blijkt dat de provincies met de hoogste bevolkingsdichtheid de laagste mortaliteit kennen. Om de gegevens beter op elkaar af te stemmen en meer inzicht te verkrijgen in het verband tussen fietscomfort en ongevallen, is het daarom aangewezen om indicatoren op meerdere vergelijkbare aggregatieniveaus te berekenen.
2.6
Semantische componenten voor geïntegreerde monitoring
In deze paragraaf willen we het aanbod aan semantische oplossingen beschrijven voor de syntactische discrepantie en semantische heterogeniteit die geobserveerd werden bij de vergelijking tussen fietscomfortgegevens en ongevallendata.
2.6.1
Ontologie voor een uniform metadataschema
Een ontologie is een middel om een kennisdomein te beschrijven. Een ontologie is een beschrijving van een kennisdomein (bv fietscomfort) in termen van klassen en karakteristieken die in het domein gehanteerd worden, inclusief eigenschappen van relaties, instanties van klassen, de relaties die tussen instanties gelden, en de attributen die instanties hebben 10. Interpreteren we elke klasse als een concept, relaties als relaties tussen concepten en instanties als instanties van die concepten dan zien we dat een ontologie een formeel conceptueel kader is en de eigenschappen daarvan documenteert (Brussee et al., 2008). In onze gevalstudie hebben we vastgesteld dat er geen sprake was van een uniform metadataschema voor het opstellen van indicatoren omtrent fietscomfort en fietsveiligheid. Het gebruik van een ontologie kan hiervoor een oplossing bieden en gaat zelfs een stap verder dan het opstellen van een klassiek metadataschema. Een klassieke metadataschema is eigenlijk een gedegenereerde ontologie waarin maar één klasse en alleen attributen worden gedefinieerd. Een voorbeeld van een klassiek metadataschema is bv de ISO-standaard 19115 (International Organization for Standardization, 2014) voor geografische data die een set van 400 metadata-elementen beschrijft. De naam van een contactpersoon wordt in dit schema als een attribuut van het metadataschema gemodelleerd. Het datatype van dit veld is tekst. Een ontologie daarentegen gaat ruimer dan een klassiek metadataschema en ondersteunt het gebruik van meerdere klassen. De naam van een contactpersoon kan in de plaats van tekst een verwijzing zijn naar een andere klasse waarin de persoon verder beschreven wordt door een reeks attributen. In die zin kan men een ontologie als een middel beschouwen om een
10
Definitie van Ontology volgens Wikipedia (http://en.wikipedia.org/wiki/Ontology_%28information_science%29)
27 Steunpunt Verkeersveiligheid | RA-2014-004
semantisch metadataschema op te stellen. Ontologieën kunnen ook met elkaar gerelateerd worden om een bepaald kennisdomein volledig te bestrijken. Door bijvoorbeeld de DBPedia ontologie en de FOAF ontologie (zie hoofdstuk 3) te combineren, kan men op een uniforme manier personen beschrijven en de encyclopedische kennis erover bundelen.
2.6.2
Gecontroleerde vocabulaire in plaats van doorlopende tekst
Een gecontroleerde vocabulaire is een eindige opsomming van woorden, termen of codes (ANSI-NISO, 2005). Van een oneindige (of heel erg grote) ruimte van strings beperkt een gecontroleerd vocabulaire de ruimte van mogelijkheden tot een beperkt aantal termen. De betekenis van de term wordt meestal impliciet gelaten of buiten het gecontroleerd vocabulaire gedocumenteerd. Het dwingt mensen om hun woordgebruik in te perken en verhoogt de kans dat alle stakeholders binnen één monitoringsysteem het zelfde bedoelen met een woord, omdat van te voren duidelijk is wat de mogelijke keuzes zijn. Zowel de ongevallendata als de fietscomfortgegevens gebruiken reeds in hoge mate gecontroleerde vocabulaires om de kenmerken van ongevallen en comfortmetingen op een eenduidige manier in de databank te omschrijven. Figuur 6 illustreert hoe een codelijst gedefinieerd werd om ongevalsfactoren te beschrijven. ONG_CODE_FACTOREN_GEBR FACTOR NISRUBRIEK
CODE 1 2 3 4 5 6 7 8 9 Figuur 6: Voorbeeld ongevalsfactoren
rijdt door een rood licht verleent geen voorrang overschrijdt een doorlopende witte streep haalt verkeerd in voert in extremis een uitwijkingsmaneuver uit niet reglementaire plaats op de rijbaan controleverlies over stuur houdt geen afstand tussen weggebruikers val van
een
gecontroleerde
vocabulaire
18 18 18 18 18 18 18 18 18 voor
het
beschrijven
van
Het gebruik van gecontroleerde vocabulaires is ook aangewezen voor metadata. Een typisch voorbeeld hiervan is het documenteren van een meet- of publicatiefrequentie van indicatoren. Hiervoor kan een eindige lijst opgesteld worden die waarden bevat zoals: dagelijks, maandelijks, halfjaarlijks, jaarlijks, 2-jaarlijks etc.… Gecontroleerde vocabulaires vergroten de semantische interoperabiliteit omdat het actief en vrij bedenken van termen door verschillende mensen grotendeels wordt gereduceerd tot passief herkennen met de beschikbare lijst als gedeelde context.
2.6.3
Een taxonomie of thesaurus voor logische samenhang
Producenten van indicatoren gebruiken allerlei classificatiesystemen om indicatoren logisch te groeperen. Voor verkeersveiligheidsindicatoren gebeurt dit meestal volgens het Mens-VoertuigOmgeving model (Hillier, 2002) of de doelhiërarchie van verkeersveiligheid. De doelhiërarchie van verkeersveiligheid werd oorspronkelijk ontworpen in Nieuw-Zeeland en in verschillende Europese projecten (SafetyNet) aangevuld en gebruikt, en tracht een inzicht te geven in de verschillende aspecten van verkeersveiligheid in een land of regio (Koornstra et al., 2002).
28 Steunpunt Verkeersveiligheid | RA-2014-004
Figuur 7: Doelhiërarchie voor Verkeersveiligheid (Koornstra et al., 2002)
De statistieken van ongevallengegevens worden doorgaans ook volgens een vast stramien beschreven:
Algemene ongevallen- en slachtoffercijfers;
Verdeling naar weggebruikertypes;
Verdeling volgens tijdstip;
Verdeling volgens locatie;
Verdeling naar kenmerken van slachtoffers en specifieke doelgroepen (kinderen, jonge bestuurders, senioren, zwakke weggebruikers, etc.…);
Verdeling naar kenmerken van het ongeval;
Verdeling naar thema’s zoals alcohol, snelheid.
De logische ordening of gebruikte classificatie wordt in de meeste studies via de structuur van het rapport (bv. het jaarrapport Verkeersveiligheid) of de website (bv. BIVV Onderzoek en Statistieken11) aangeboden, maar zelden wordt per indicator aangegeven waar de indicator zich situeert in de logische ordening. Indien slechts één indicator uitgewisseld wordt, gaat deze informatie over de positie in het geheel verloren. Daarom is het aangewezen de logische samenhang mee op te nemen in het metadataschema of de ontologie, en de classificatie of logische ordening expliciet te documenteren. Dit kan door in de metadata gebruik te maken van een taxonomie of thesaurus:
11
Taxonomie: Een taxonomie is een hiërarchische ordening van klassen. Een taxonomie kan beschouwd worden als een specifiek type van een gecontroleerde vocabulaire waarin termen niet zomaar op eenzelfde niveau opgelijst zijn, maar hiërarchisch georganiseerd zijn. In onze case zou het documenteren van de doelstellingenhiërarchie voor verkeersveiligheid en het Mens-Voertuig-Omgeving raamwerk als een expliciete taxonomie de interoperabiliteit van de metadata van de indicatoren verhogen.
Thesaurus: Een thesaurus is een opsomming van woorden met een vooraf gedefinieerde ordening en gestandaardiseerde onderlinge relaties (ANSI-NISO, 2005). Een thesaurus is eveneens een specifiek type van een gecontroleerd vocabulaire
http://bivv.be/nl/pers/onderzoek-en-statistieken 29
Steunpunt Verkeersveiligheid | RA-2014-004
waarin we naast een opsomming van termen ook een aantal van te voren bepaalde relaties tussen die termen aangeven. Een goed voorbeeld van een thesaurus is de GEMET (GEneral Multilingual Environmental Thesaurus) thesaurus 12. Deze veel gebruikte thesaurus dekt een breed scala aan milieuonderwerpen en organiseert deze volgens een thematische en hiërarchische structuur.
In de praktijk worden de termen taxonomie en thesaurus vaak door elkaar gebruikt of zijn ze inwisselbaar. De nadruk bij een taxonomie ligt op de hiërarchische ordening (uitgedrukt in broader-narrower relaties), waarbij voor thesauri een relatie zonder verdere toelichting voldoende is.
2.7
Conclusie
In dit hoofdstuk werd een specifieke analyse gemaakt van twee verschillende onafhankelijke databronnen, namelijk ongevallengegevens en fietscomfortgegevens in functie van een potentiële harmonisatie. Uit de analyse bleken 2 soorten knelpunten naar voren te komen: syntactische discrepantie en semantische heterogeniteit. Vervolgens werden een aantal semantische componenten gesuggereerd die ingezet kunnen worden om de gegevens beter op elkaar af te stemmen. Het ontwikkelen van een domeinspecifieke ontologie, gecontroleerde vocabulaires en taxonomieën kunnen een oplossing bieden om de metadata op een uniforme manier te beschrijven en om de data op een homogene manier te structureren en harmoniseren. In hoofdstuk 3 inventariseren we een aantal internationale standaarden die deze semantische componenten kunnen aanbieden om uiteindelijk een algemeen uitwisselmodel te specifiëren dat geschikt is om ruimtelijke indicatoren op een uniforme en geharmoniseerde manier uit te wisselen.
12
http://www.eionet.europa.eu/gemet/
30 Steunpunt Verkeersveiligheid | RA-2014-004
3. Semantische webstandaarden In het vorige hoofdstuk werden vanuit een concrete gevalstudie een aantal interoperabiliteitsproblemen beschreven die een vlotte uitwisseling van indicatoren belemmeren. Ook werden er reeds een aantal semantische componenten gesuggereerd die vooral als doel hebben de semantiek van indicatoren vast te leggen. Deze componenten zijn niet bedoeld als een uitwisselingsstandaard, maar bieden instrumenten aan die in een standaard gebruikt kunnen worden. In dit hoofdstuk volgen we een top-down benadering en analyseren we een aantal bestaande internationale webstandaarden die vandaag reeds een kader bieden voor een semantische onderbouwde uitwisseling van (ruimtelijke) informatie. In de volgende secties beschrijven we een aantal standaarden die relevant zijn in een semantisch kader zoals ‘Linked Open Data’ of specifiek van toepassing zijn op ‘ruimtelijke informatie’. Voor elke standaard onderzoeken we in welke mate ze toegepast kunnen worden voor een uitwisselmodel voor ruimtelijke indicatoren.
3.1 3.1.1
Dublin Core Beschrijving
Dublin Core13 is een sectoroverstijgende standaard waarmee online bronnen van metadata kunnen worden voorzien. De 15 velden van de oorspronkelijke ‘Dublin Core Metadata Element Set’ zijn: title (titel), creator (auteur of maker), subject (onderwerp en trefwoorden), description (omschrijving), publisher (uitgever), contributor (andere medewerkers), date (datum), type (bestandstype), format (bestandsformaat), identifier (bestandsidentificatie), source (bron), language (taal), relation (relatie), coverage (dekking) en rights (rechten). Dublin Core can op 2 manieren gebruikt worden: met of zonder extensies. Als je de standaard gebruikt zonder extensies wordt deze 'Simple Dublin Core' of vereenvoudigd Dublin Core genoemd. Gebruik je de elementen met extensies dan gebruik je 'Qualified Dublin Core'. De extensies worden verfijningen of qualifiers genoemd die toelaten om sub-elementen te definiëren en specifieker te zijn. Vanaf 2000 richtte de Dublin Core Community zich meer op het idee dat metadata beschreven worden door de combinatie van Dublin Core met andere gespecialiseerde vocabulaires om aan specifieke implementatievereisten te kunnen voldoen. In dezelfde periode werkte het World Wide Web Consortium (W3C) op haar beurt aan een generiek datamodel voor metadata, het Resource Description Framework (RDF). Door de ontwikkeling van een uitgebreide set van metadata termen (DCMI Metadata Terms) werd Dublin Core één van de meest populaire woordenlijsten voor een gecombineerd gebruik met RDF in het kader van Linked Open Data.
3.1.2
Toepassingsmogelijkheden
Dublin Core is een standaard die gericht is op het verbeteren van de vindbaarheid van bronnen. De Dublin Core Metadata Element set lijkt op het eerste zicht een goede vertrekbasis om algemene metadata te creëren voor alle soorten informatie, maar wordt soms als té generiek beschouwd vanwege de vage en brede definities voor de individuele metadata-elementen. Door de simultane ontwikkeling met RDF en de frequente integratie tussen de 2 specificaties nam Dublin Core echter een belangrijke plaats in het online beschrijven, en is hierdoor uitgegroeid tot één van de belangrijkste woordenlijsten in het kader van Linked Open Data. Door de integratie en het wijdverspreide gebruik ervan is de standaard bijgevolg geschikt om algemene metadata-termen te dekken. De standaard bezit echter onvoldoende elementen om informatie die specifiek is aan ruimtelijke indicatoren (bv verwijzen naar een taxonomie, geografisch referentiesysteem,etc …) op een adequate manier te beschrijven.
13
http://dublincore.org/ 31
Steunpunt Verkeersveiligheid | RA-2014-004
3.2 3.2.1
INSPIRE Beschrijving
INSPIRE (Infrastructure for Spatial Information in Europe) is een Europese richtlijn en verplicht de Europese lidstaten om plaats-en milieugebonden gegevens (die geclassificeerd werden over 34 thema’s) digitaal vindbaar, bruikbaar en uitwisselbaar te maken binnen een Europese geografische data infrastructuur (GDI). Om de grensoverschrijdende interoperabiliteit van geografische data infrastructuren te waarborgen werd een raamwerk ontwikkeld waarin specificaties werden opgesteld voor metadata, uitwisseling van data, netwerkdiensten, toegang, monitoring en rapportering. Dergelijke specificaties bestaan uit een reeks uitvoeringsmaatregelen (in de vorm van verordeningen van de Commissie dwz juridisch bindend in de lidstaten van de EU), samen met de bijbehorende technische richtlijnen, die de lidstaten helpen bij de invoering van de uitvoeringsmaatregel. Het INSPIRE raamwerk is in hoofdzaak gebaseerd op de ISO 191xx standaarden en de standaarden ontwikkeld door het Open Geospatial Consortium (OGC).
3.2.2
Toepassingsmogelijkheden
De specificaties voor metadata, data en netwerkdiensten kunnen als basis dienen voor de ontwikkeling van een uitwisselmodel voor ruimtelijke indicatoren. De reikwijdte van de specificaties is echter beperkt tot veelgebruikte en algemeen aanvaarde ruimtelijke referentieobjecten, zoals opgelijst in de 34 thema’s van de INSPIRE richtlijn. Specifieke toepassingen die gericht zijn op het aanleveren van thematische of afgeleide data (zoals de publicatie van indicatoren via een monitoringsysteem) vallen buiten het bereik van het INSPIRE raamwerk (Figuur 8).
Figuur 8: Toepassingsgebied van een Geografische Data Infrastructuur (Tóth, Portele, Illert, Lutz, & Lima, 2012)
Het uitwisselen van ruimtelijke indicatoren heeft in vergelijking met ruimtelijke basisdata ook andere en bijkomende behoeften in een ‘Open Data’ context. We bespreken hieronder in welke mate elke component van het INSPIRE raamwerk herbruikbaar is voor een uitwisselmodel voor indicatoren.
3.2.2.1
Metadata
Zowel de metadata-elementen die in de Metadata richtlijn zijn opgenomen (i.e. metadata voor ‘discovery’) als de metadata-elementen die nodig zijn voor interoperabiliteit kunnen toegepast worden op ruimtelijke indicatoren. Een aantal metadata-elementen ontbreken echter of zijn niet 32 Steunpunt Verkeersveiligheid | RA-2014-004
geschikt om alle behoeften te dekken zoals bv voor het gestructureerd beschrijven hoe een indicator berekend wordt (beperking van het ‘lineage’ element), het identificeren en beschrijven van classificatiesystemen die gebruikt worden, het bespreken van de indicator in functie van beleidsdoelstellingen, etc… Hiervoor is het aangewezen om bestaande INSPIRE metadata elementen niet te gebruiken en te vervangen door elementen uit andere standaarden die de thematische aspecten kunnen beschrijven die in INSPIRE niet van toepassing zijn.
3.2.2.2
Data
Ook op data niveau de INSPIRE specificaties als inspiratie dienen voor de ontwikkeling van een uitwisselmodel voor ruimtelijke indicatoren. Eén van de aanbevelingen van INSPIRE is trouwens om de ontwikkelde data modellen en applicatieschema’s verder uit te breiden voor lokale en specifieke toepassingen. Dit kan tot op zekere hoogte toegepast worden voor ruimtelijke indicatoren die gebruik maken van de ruimtelijke entiteiten die reeds in INSPIRE gemodelleerd werden zoals administratieve eenheden, statistische sectoren en geografische grids. Daarentegen kan het ook voorkomen dat de ontwikkeling van een indicator gepaard gaat met het aggregeren of disaggregeren naar een nieuwe ruimtelijke entiteit die niet als een basisentiteit gemodelleerd werden in één van de 34 thema’s van INSPIRE vallen.
3.2.2.3
Netwerkdiensten
De belangrijkste netwerkdiensten binnen INSPIRE zijn de catalog, view en download services. Omdat ruimtelijke indicatoren als een specifiek type van ruimtelijke data beschouwd kunnen worden, lijken INSPIRE netwerkdiensten het ideale medium om metadata, kaarten en ruimtelijke data zelf te distribueren. In de context van Linked Open data zijn webservices echter overbodig. Om Linked Open Data te publiceren wordt een methode gevolgd die gebaseerd is op de techniek van unieke HTTP-URI’s en RDF. Resource Description Framework of RDF is een standaard van het World Wide Web Consortium (W3C), die oorspronkelijk ontworpen was als een metadata-model, maar gaandeweg gebruikt werd als een formaat om gegevens via het web voor te stellen en uit te wisselen. De transformatie van bestaande gegevens naar RDF is op dit ogenblik nog complex en tijdrovend. In afwachting dat de metadata en data van indicatoren omgezet zijn naar het open RDF formaat, kunnen netwerkdiensten en de ISO en OGC-standaarden waarop ze gebaseerd zijn, wel tijdelijk ingezet worden om data via geografische web services te visualiseren en ontsluiten.
3.3
SKOS
3.3.1
Beschrijving
SKOS14
of Simple Knowledge Organisation System is een W3C standaard voor het representeren van terminologiebronnen (‘Knowledge Organisation systems’) zoals thesauri, classificatieschema’s, woordenlijsten en taxonomieën in een semantisch kader. SKOS maakt gebruik van het Resource Description Framework (RDF) en RDF schema om gecontroleerde vocabulaires op een interoperabele wijze uit te wisselen tussen allerhande applicaties. In onderstaand voorbeeld illustreren we hoe een thesaurus in SKOS als een concept schema gedefinieerd kan worden, en hoe verschillende concepten deel uit maken van de thesaurus, al dan niet met een explicitering van onderlinge relaties.
ex:dieren rdf:type skos:ConceptScheme; dct:title "Eenvoudige dieren thesaurus"; dct:creator ex:diederikTirry. 14
http://www.w3.org/TR/skos-primer/ 33
Steunpunt Verkeersveiligheid | RA-2014-004
ex:zoogdieren rdf:type skos:Concept; skos:inScheme ex:dieren.
ex:koeien rdf:type skos:Concept; skos:broader ex:zoogdieren; skos:inScheme ex:dieren.
ex:vissen rdf:type skos:Concept; skos:inScheme ex:dieren.
3.3.2
Toepassingsmogelijkheden
In onze case study werden verschillende soorten heterogeniteit beschreven die geobserveerd werden bij de beschikbare indicatoren over groene ruimte voor recreatie. Hieruit bleek dat het implementeren van alle soorten gecontroleerde vocabulaires een must is om semantische heterogeniteit aan te pakken. De SKOS standaard werd specifiek ontwikkeld voor deze problematiek en biedt een aantal semantische oplossingen om terminologiebronnen samen te stellen en te publiceren op het web, eventueel met verwijzingen naar andere concept schemes. Andere standaarden zoals DCAT (zie 3.4) verwijzen dan ook naar SKOS voor het beschrijven van gecontroleerde vocabulaires. SKOS in zowel voor metadata als de data zelf inzetbaar.
3.4 3.4.1
DCAT Beschrijving
DCAT15 (Data Catalog Vocabulary) is een standaard die de uitwisseling van data tussen dataregisters faciliteert. DCAT is door de W3C Government Linked Data (GLD) werkgroep ontworpen als een RDF vocabulaire en is geschikt voor het beschrijven van data in alle mogelijke formaten. DCAT ondersteunt het creëren van bijkomende toepassingsprofielen. De term ‘toepassingsprofiel’ wordt gebruikt voor specificaties die gebaseerd zijn op één of meerdere standaarden, en meer specificiteit toevoegen door het identificeren van verplichte, aanbevolen en optionele elementen die gebruikt moeten worden voor een bepaalde toepassing. Daarnaast worden in een toepassingsprofiel ook aanbevelingen gemaakt ten aanzien van het gebruik van gecontroleerde woordenlijsten. De INSPIRE metadata richtlijn kan men bijvoorbeeld ook beschouwen als een toepassingsprofiel van de ISO19115 metadata standaard. Eén van de meest gekende toepassingsprofielen van DCAT is DCAT-AP, het toepassingsprofiel voor data portalen in Europa. DCAT-AP16 is een specificatie voor het beschrijven van overheidsgegevens in Europa en faciliteert de interoperabiliteit van catalogi van online gepubliceerde gegevens (European Commission, 2013a). De finaliteit van dit profiel is overheidsinformatie beter te ontsluiten over de grenzen en sectoren heen. Dit kan worden bereikt door de uitwisseling van beschrijvingen van datasets tussen data portals. Een akkoord over een gemeenschappelijk formaat zou het zoeken, delen en hergebruiken van deze gegevens kunnen ondersteunen. De specificatie is ontwikkeld in het kader van het ISA 17 programma van de EC en is gebaseerd op het gebruik van de ‘Data Catalog’ vocabulary (DCAT) en het Asset Description Metadata Schema (ADMS). 15
http://www.w3.org/TR/vocab-dcat/ https://joinup.ec.europa.eu/asset/dcat_application_profile/asset_release/dcat-application-profile-data-portals-europefinal 17 Interoperability Solutions for European Public Administrations (http://ec.europa.eu/isa/) 16
34 Steunpunt Verkeersveiligheid | RA-2014-004
Figuur 9: Afbeelding van het DCAT-AP schema
Onderstaande figuur geeft weer hoe de metadata van een ongevallendataset toegewezen kan worden aan de verschillende onderdelen van de DCAT-AP.
Figuur 10: Bestaande metadata transformeren naar de DCAT-AP specificatie (Loutas, Keyzer, & Goedertier, 2013)
35 Steunpunt Verkeersveiligheid | RA-2014-004
3.4.2
Toepassingsmogelijkheden
Zowel de DCAT vocabulaire als al haar toepassingsprofielen zijn specificaties die gericht zijn op alle soorten overheidsgegevens: primaire, afgeleide, ruimtelijke en niet-ruimtelijke data. De voornaamste doelstelling is een specificatie aan te bieden die gebruikt kan worden om metadata uit te wisselen tussen data portalen. Aangezien een monitoringsysteem ook als een specifiek portaal beschouwd kan worden, komt de DCAT vocabulary en bij uitbreiding DCAT-AP zeker in aanmerking om als basis te gebruiken voor het ontwikkelen van een uitwisselmodel voor ruimtelijke indicatoren. De DCAT specificatie bevat bovendien klassen die het beschrijven en gebruik van thesauri of taxonomieën mogelijk maken. Doordat DCAT bedoeld is voor alle soorten data, bevat het slechts één metadata-element om ruimtelijke kenmerken te beschrijven i.e. de geografische dekking van een dataset. Het is aangewezen om bijkomende elementen toe te voegen (eventueel uit de INSPIRE standaard) om de ruimtelijke kenmerken zoals locatie, referentiesysteem en de ruimtelijke representatie (vector of grid) te beschrijven.
3.5 3.5.1
Asset Description Metadata Schema (ADMS) Beschrijving
Asset Description Metadata schema (ADMS) is een metadata vocabulaire om semantische modellen met betrekking tot interoperabiliteit (specificaties, schema’s, data modellen, codelijsten, software tools, etc…) te beschrijven, waardoor het voor ICT-ontwikkelaars mogelijk is om deze ‘modellen’ te vinden en hergebruiken voor nieuwe toepassingen (European Commission, 2012). ADMS is zoals DCAT-AP een toepassingsprofiel van DCAT, maar legt in tegenstelling tot DCAT-AP de focus op ‘herbruikbare’ metadata in plaats van op unieke metagegevens. De specificatie is opgemaakt door de ADMS working group, die opgericht werd in het kader van het EC ISA programma. De ADMS namespace document is recent ook gepubliceerd door W3C. ADMS is bedoeld als een model dat gedistribueerde samenwerking faciliteert. ADMS heeft niet de bedoeling om bestaande systemen en gegevens te transformeren naar deze specificatie, maar eerder te fungeren als een gemeenschappelijke bovenliggende laag om metagegevens over semantische componenten te kunnen uitwisselen.
36 Steunpunt Verkeersveiligheid | RA-2014-004
Figuur 11: ADMS domein model
3.5.2
Toepassingsmogelijkheden
De implementatie van de ADMS specificatie in een uitwisselmodel biedt op zichzelf geen rechtstreekse meerwaarde aan de primaire gebruikers van het uitwisselmodel. ADMS is in de eerste plaats bedoeld om externen de mogelijkheid te geven om bepaalde semantische componenten zoals schema’s, codelijsten, etc.. te hergebruiken door deze nauwgezet te beschrijven en beschikbaar te stellen met behulp van de ADMS specificatie. Daarom zullen we in een eerste fase weinig rekening houden met de ADMS standaard, uitgezonderd die elementen die ook nuttig zijn om unieke metadatagegevens te beschrijven, zoals bijvoorbeeld informatie over de versie van een dataset of indicator.
3.6 3.6.1
PROV Specificatie Beschrijving
Voor het beschrijven van herkomstinformatie (‘provenance’) zijn er de afgelopen jaren verschillende standaarden ontwikkeld. In de context van een GDI wordt vooral beroep gedaan op ISO 19115 en de FGDC Content Standard for Digital Geospatial Metadata (CSDGM) 18 om herkomstinformatie te beschrijven. Daarnaast bestaan er ook meer generieke en themaonafhankelijke standaarden zoals Dublic Core 19 en het Open Provenance Model (OPM)20. De standaarden verschillen enerzijds in de invalshoek die ze hanteren. Ligt de focus op de actoren, de objecten en datasets of eerder op de processen? Anderzijds verschillen ze ook in detailniveau en wordt herkomstinformatie ofwel beknopt dan wel gedetailleerd weergegeven. Doordat de verschillen tussen de verschillende standaarden echter subtiel zijn, is het in vele gevallen mogelijk een mapping te maken tussen de standaarden onderling. Het W3C tracht met een nieuwe kandidaatspecificatie PROV de subtiele verschillen te overstijgen en één schaalbare en domeinonnafhankelijke standaard voor beschrijving van herkomstinformatie voor te stellen. PROV is een specificatie die ontwikkeld werd door een W3C werkgroep (Provenance 18
http://www.fgdc.gov/metadata/geospatial-metadata-standards#csdgm http://dublincore.org/documents/dcmi-terms/ 20 http://openprovenance.org/ 19
37 Steunpunt Verkeersveiligheid | RA-2014-004
Working Group). Het omvat een data model voor het beschrijven van herkomstinformatie op het web. Herkomstinformatie kan worden gebruikt voor vele doeleinden, zoals inzicht in hoe data verzameld is, het bepalen van eigendom van en rechten over een object, het beoordelen van betrouwbaarheid van informatie, na te gaan of het proces en de stappen die gebruikt zijn voor het verkrijgen van een resultaat voldoet aan de gestelde eisen, en het reproduceren van hoe iets is gemaakt. Het PROV model wordt gebruikt voor herkomstgegevens, zoals beschrijving van de entiteiten en de activiteiten die deel uitmaken van de productie en aflevering van een bepaald object of beschrijving van beïnvloeding op andere wijze. Onderstaand schema toont de structuur van het PROV model op hoog niveau. Omdat de PROV specificatie ontwikkeld is om te beschrijven hoe dingen gemaakt en geleverd worden, worden de relaties benoemd zodat ze gebruikt kunnen worden voor beweringen over het verleden.
Figuur 12: PROV high-level data model
De functionaliteit van PROV kunnen we best demonstreren via een eenvoudig voorbeeld. In onderstaand schema wordt grafisch aangetoond hoe een persoon (Derek) een kaart heeft gemaakt op basis van 2 handelingen. Eerst heeft Derek compositie gemaakt op basis van een dataset en een aantal inputparameters (regionList), vervolgens heeft hij het resultaat (composition) geïllustreerd om een kaart te creëren. De grafische weergave van dit eenvoudig voorbeeld toont de verschillende onderdelen van de herkomstinformatie o.a. de agenten, de associaties en de attributie die aan entiteiten wordt toegekend.
Figuur 13: Grafisch voorbeeld van het gebruik van PROV (W3C PROV Model Primer21)
21
http://www.w3.org/TR/2013/NOTE-prov-primer-20130430/
38 Steunpunt Verkeersveiligheid | RA-2014-004
3.6.2
Toepassingsmogelijkheden
In de context van een ‘Open Data’ monitoringsysteem is het essentieel om weten op welke manier indicatoren berekend werden. Het correct en uitgebreid beschrijven van de berekeningswijze draagt bij aan een juiste interpretatie en de betrouwbaarheid van de indicator, en garandeert bovenal dat een indicator in de toekomst op dezelfde manier berekend wordt. Een vaak gestelde vraag bij het beschrijven van herkomstinformatie is welke granulariteit of detailniveau gehanteerd moet worden. Enerzijds is gedetailleerde informatie nodig voor de betrouwbaarheid van gegevens na te gaan, anderzijds kan het vragen van te gedetailleerde informatie ertoe leiden dat data producenten geen of geen correcte informatie bezorgen omdat het tijdrovend en complex is om het volledige berekeningsproces in detail te beschrijven. Ook de invalshoek van de gebruiker van de metagegevens over herkomst bepaalt mee hoe gedetailleerd de herkomstinformatie dient te zijn en vanuit welk perspectief deze bekeken zal worden. In een uitwisselmodel voor ruimtelijke indicatoren ligt de focus eerder op de verschillende processen, en vooral de ruimtelijke operaties, die zijn uitgevoerd op een aantal basisgegevens, dan op de verschillende actoren die betrokken zijn in het proces. In die optiek zou het logisch zijn om de ISO19115 norm te hanteren om herkomstinformatie of ‘lineage’ te beschrijven. Het monitoringsysteem dat we voor ogen houden is echter niet exclusief voor ruimtelijke gegevens en gericht op de ‘Open Data’ context. Vandaar dat de PROV specificatie als een soort overkoepelende specificatie het meest geschikt is om herkomstinformatie te beschrijven. Bij de toepassing van de PROV specificatie in het uitwisselmodel is het dus van belang het gebruik ervan te schalen naar de context van monitoringsysteem voor ruimtelijke indicatoren. Een mapping tussen ISO19115 en PROV kan eenvoudig worden gerealiseerd, zodat herkomstinformatie die volgens ISO19115 beschreven werd op een eenvoudige manier omgezet kan worden naar de PROV standaard.
3.7 3.7.1
VCard – FOAF -ORG Beschrijving
De vCard specificatie22 heeft reeds een lange geschiedenis en werd voor het eerst voorgesteld in 1995 en vervolgens gestandaardiseerd door de IETF23 in 1998. Sindsdien werden er ook nieuwe vocabulaires ontwikkeld, zoals FOAF 24 in 2005 en de ORG ontologie in 2013. De vCard ontologie is gericht op het beschrijven van mensen en organisaties, inclusief informatie over de locatie en de groeperingen van deze entiteiten. De FOAF ontologie richt zich meer op de relaties tussen mensen, organisaties en eigenschappen die inherent zijn aan sociale media. De ORG25 ontologie richt zich hoofdzakelijk op organisatiestructuren, rollen en activiteiten.
3.7.2
Toepassingsmogelijkheden
Uit de beschrijving valt af te leiden dat er overlapping is tussen de vCard, FOAF en ORG specificatie. Toch zijn ze elk in hun specifiek doeldomein zeker zinvol en kunnen ze zelfs complementair gebruikt worden om verbeterde informatie te verstrekken. In het uitwisselmodel kunnen ze gebruikt worden om informatie over personen en organisaties te beschrijven. FOAF wordt ook doorgaans gebruikt voor het verwijzen naar brondocumenten en referenties.
22
http://www.w3.org/TR/vcard-rdf/ IETF: Internet Engineering Task Force 24 http://xmlns.com/foaf/spec/ 25 http://www.w3.org/TR/vocab-org/ 23
39 Steunpunt Verkeersveiligheid | RA-2014-004
3.8
Data Cube
3.8.1
Beschrijving
De Data Cube vocabulary26 is een specificatie aanbevolen voor het beschrijven en distribueren van statistische observaties en metingen in RDF. Deze standaard is gebaseerd op de SDMX ISO-standaard en is puur gericht op de publicatie van multi-dimensionale gegevens op het web. SDMX (Statistical Data and Metadata Exchange) werd in 2001 als norm geïnitieerd door zeven internationale organisaties (BIS, ECB, Eurostat, IMF, OECD, World Bank and the UN) om op een efficiënte wijze statistische gegevens uit te wisselen.
3.8.2
Toepassingsmogelijkheden
De Data Cube standaard is redelijk complex en in de eerste plaats ontworpen voor statistische multi-dimensionale data. De standaard is ontwikkeld in functie van het bevragen van de data volgens één of meerdere dimensies. Ruimtelijke indicatoren zijn in de meeste gevallen niet multi-dimensioneel en worden bij voorkeur ook niet ontwikkeld op basis van statistische eenheden. Het ontwikkelen en publiceren van beleidsrelevante indicatoren gebeurt ook niet in functie van statistische bevragingen. De standaard lijkt dan ook enkel toepasbaar op een beperkte set van indicatoren die gebaseerd zijn op gekende statistische eenheden.
3.9
QUDT
3.9.1
Beschrijving
QUDT27
(Quantities, Units, Dimensions and Data Types Ontologies) is een verzameling van ontologieën die een precieze semantische betekenis geven aan meetconcepten zoals hoeveelheden, eenheden, afmetingen en de benodigde data types. De doelstelling van de QUDT specificaties is het definiëren van een eenvormig model voor meetbare grootheden, de eenheden voor het meten van verschillende soorten hoeveelheden, de numerieke waarden van grootheden in verschillende meetsystemen, en de datastructuren en datatypes die nodig zijn om de objecten te bewaren en te manipuleren. QUDT is gebaseerd op de internationale ISO standaard ISO 80000-1:2009 (International Organization for Standardization, 2009) die algemene informatie en definities bevat met betrekking tot hoeveelheden (quantities), eenheden (units), symbolen en coherente meetsystemen, zoals de ‘International System of Quantities’ (ISQ) en de ‘International System of Units’ (SI). ISO 80000-1 refereert bovendien naar een andere standaard i.e. ISO/IEC Guide99:2007 (International Organization for Standardization (ISO) and the International Electrotechnical Commission (IEC), 2007) die concepten en termen i.v.m. metrologie definieert.
3.9.2
Toepassingsmogelijkheden
De verkeersveiligheidstoestand wordt geschetst aan de hand van een waaier van uiteenlopende indicatoren i.e. waarneembare fenomenen die op een numerieke wijze gemeten en gekwantificeerd worden. Om de resultaten van indicatoren te vergelijken of automatisch te transformeren, is het belangrijke om rigoureuze definities te handhaven voor de verschillende types van hoeveelheden en meeteenheden. De QUDT standaard voorziet ons van een lijst met vooraf gedefinieerde meettypes en meeteenheden die in een uitwisselmodel begrippen zoals aantallen, lengte, percentages, etc…en hun respectievelijke meeteenheden op een semantische manier betekenis geven.
26
http://www.w3.org/TR/vocab-data-cube/
27http://qudt.org/
40 Steunpunt Verkeersveiligheid | RA-2014-004
3.10 GeoSPARQL 3.10.1 Beschrijving GeoSPARQL28 is de standaard van het Open Geospatial Consortium (OGC) voor het combineren van Linked Data semantiek en geografische functionaliteit. GeoSPARQL definieert een kleine ontologie in RDFS/OWL met het oog op een gestandaardiseerde uitwisseling van ruimtelijke gegevens in RDF. De ontologie ondersteunt zowel kwantitatief als kwalitatief ruimtelijk redeneren en bevragen met behulp van de SPARQL query taal. Linked Data die beschreven worden met de GeoSPARQL ontologie, kunnen geïndexeerd worden in een ‘geografische’ triple store, dit is een formaat van databank die specifiek ontwikkeld is voor het semantische web. GeoSPARQL is een ontologie die enkel de geometrische component en de ruimtelijke relaties van een feature weergeeft, daarom is de combinatie met andere ontologiën noodzakelijk om ook niet-ruimtelijke informatie weer te geven.
Figuur 14: GeoSPARQL als basis voor domein feature types en domeinontologie (Kolas, Perry, & Herring, 2013)
3.10.2 Toepassingsmogelijkheden Veel problemen, waarvoor semantische webtechnologie een oplossing biedt, hebben inherent een ruimtelijke context. Om redeneren op ruimtelijke niveau efficiënter te maken, is er nood aan semantisch redeneren in combinatie met een speciaal indexmechanisme. De GeoSPARQL ontologie biedt een oplossing in de vorm van een RDF/OWL standaard voor het opslaan en bevragen van ruimtelijke informatie in RDF. GeoSPARQL is dus een specificatie die zeker toepasbaar is op het concept van ruimtelijke indicatoren, indien het gebruik ervan gecombineerd wordt met andere domeinontologieën om de niet-ruimtelijke component van de indicatorgegevens te modelleren. Met de implementatie van GeoSPARQL kan men indicatoren ruimtelijk bevragen op basis van filters of topologische relaties, zoals in een GIS. GeoSPARQL is wel beperkt tot de ondersteuning van features, en kan niet gebruikt worden om rastergegevens weer te geven. Dit is in de context van de Verkeersveiligheidsmonitor een belangrijke beperking aangezien we streven naar een optimale ruimtelijke verdeling om de ruimtelijke differentiatie indicator correct in beeld te brengen.
3.11 Conclusie In dit hoofdstuk presenteerden we een overzicht van een aantal internationale standaarden die semantische componenten kunnen aanbieden om uiteindelijk een algemeen uitwisselmodel te
28
http://www.opengeospatial.org/standards/geosparql
41 Steunpunt Verkeersveiligheid | RA-2014-004
specifiëren dat geschikt is om ruimtelijke indicatoren op een uniforme en geharmoniseerde manier te beschrijven en te modelleren. Uit de analyse blijkt dat het merendeel van de standaarden van toepassing zijn op het beschrijven van gegevens i.e. de metadata. DCAT en het DCAT toepassingsprofiel voor data portalen in Europa vormen een solide vertrekpunt voor een uitwisselmodel voor metadata van indicatoren. Voor de uitwisseling van data zijn enkel de INSPIRE, Data Cube en GeoSPARQL specificatie van toepassing. INSPIRE heeft data specificaties opgesteld voor 34 thema’s die uitgebreid kunnen worden voor specifieke toepassingen zoals het monitoren van beleidsgerelateerde gegevens. De standaard encodering voor INSPIRE data is GML, een op XML gebaseerde syntax. GML is weliswaar een open formaat, maar uitsluitend van toepassing op ruimtelijke data en kent bovendien een verschillend formalisme dan RDF. Bijgevolg is de GML encodering niet inzetbaar in de Linked Open Data context. Momenteel zijn er studies lopend die onderzoeken hoe INSPIRE data specificaties getransformeerd kunnen worden naar het RDF model. Tot op vandaag zijn er enkel cases waarbij de omzetting ad-hoc gebeurt, wat resulteert in niet-interoperable RDF bestanden. Het is van belang dat de transformatie van de INSPIRE UML modellen naar RDF op een uniforme manier gebeurt, zodat de data door iedereen op dezelfde wijze wordt getransformeerd. Dit kan van belang zijn voor ruimtelijke indicatoren die opgebouwd zijn op basis van ruimtelijke entiteiten (administratieve eenheden, statistische eenheden…) die tot één van de 34 INSPIRE thema’s behoren. Voor deze indicatoren is het wenselijk de INSPIRE data specificaties verder uit te breiden. De Data Cube specificatie is dan weer vooral bedoeld voor statistische en multi-dimensionale data en is slechts beperkt toepasbaar op de context van ruimtelijke indicatoren, waarvan het merendeel niet multi-dimensioneel is. GeoSPARQL daarentegen is een kleine ontologie in RDFS/OWL met het oog op een gestandaardiseerde uitwisseling van ruimtelijke gegevens in RDF. Bij de transformatie van de INSPIRE dataspecificaties naar RDF, kan men wellicht niet rond de GeoSPARQL specificatie om het geometrische luik van de INSPIRE specificaties te modelleren. GeoSPARQL is echter beperkt tot het modelleren van features, voor rasterdata zijn er op dit ogenblik geen standaarden gekend voor semantische webtoepassingen. Uit het bovenstaande concluderen we dat de INSPIRE, Data Cube and GeoSPARQL specificaties slechts gedeeltelijk geschikt of niet voldoende matuur zijn om een uitwisselmodel voor data op te stellen. Het lijkt daarom beter af te wachten naar ‘officiële’ richtlijnen omtrent de omzetting van INSPIRE data specificaties naar RDF in plaats van een ad-hoc tussentijdse oplossing te bedenken. Daarom zullen we de specificatie in hoofdstuk 4 voorlopig beperken tot een model voor metadata van ruimtelijke beleidsrelevante indicatoren. In afwachting van een model voor data raden we wel het gebruik van open formaten (GML, JSON, KML) aan om data verder te distribueren. Sommige van deze formaten kunnen via web feature services aangeleverd worden.
42 Steunpunt Verkeersveiligheid | RA-2014-004
4. Specificatie van het uitwisselmodel In de vorige hoofdstukken hebben we eerst een analyse gemaakt van een aantal interoperabiliteitsproblemen met betrekking tot de uitwisseling van gegevens en indicatoren en vervolgens vanuit een top-down benadering nagegaan welke bestaande standaarden toepasbaar zijn om tegemoet te komen aan de interoperabiliteitsproblematiek. In dit hoofdstuk stellen we een specificatie voor die gebruikt kan worden om metadata van ruimtelijke indicatoren uit te wisselen via semantische webtechnologie. De specificatie is gebaseerd op de DCAT vocabulaire en is hierdoor compatibel met andere portalen die deze standaard gebruiken om ‘Open Data’ te beschrijven. Aanpassingen werden gemaakt om informatie op te nemen over:
Het beleidskader: Het beleidskader wordt geïmplementeerd door het definiëren van een taxonomie om beleidsonderwerpen te structureren en het ontwikkelen van een aparte klasse om assessments en evaluaties te documenteren. Het ruimtelijk kader: Een aantal metadata-elementen wordt overgenomen uit de ISO19115 standaard om informatie over ruimtelijke aspecten te documenteren Herkomstinformatie: Het PROV model zal mee geïntegreerd worden in de specificatie. Waarden en dimensies: Er worden extra metadata-elementen voorzien om de meetvariabelen te omschrijven, alsook de ruimtelijke, temporele en thematische dimensies.
Om de verschillen met de originele DCAT specificatie visueel duidelijk te maken, maken we gebruik van volgende achtergrondkleuren:
Tabel 6: kleurencodes voor de specificatie
Achtergrondkleur
Omschrijving
Wit
Originele DCAT specificatie
Geel
Uitbreiding voor ruimtelijke aspecten (klassen en attributen)
Groen
Uitbreiding voor meetwaarden en dimensies (klassen en attributen)
Blauw Roze
Uitbreiding voor herkomstinformatie (klassen en attributen)
4.1
Uitbreiding voor beleidskader (klassen en attributen)
Terminologie
In de volgende paragrafen worden klassen en eigenschappen gegroepeerd in de rubrieken ‘Verplicht ', Aanbevolen en 'Optioneel' . Deze termen hebben de volgende betekenis:
Verplicht (‘Mandatory’): een leverancier van indicatoren moet informatie over instanties van de klasse of het attribuut verstrekken. Aanbevolen (‘Recommended’): een leverancier van indicatoren moet informatie over instanties van de klasse of het attribuut verstrekken, indien deze beschikbaar zijn. Optioneel (‘Optional’): een leverancier van indicatoren kan informatie verstrekken, maar is niet verplicht om dit te doen.
Klassen worden geclassificeerd als ‘Verplicht’ indien ze een basisklasse zijn in het uitwisselmodel of indien ze als data type gebruikt worden voor een verplicht attribuut. De klasse 'Distributie' is in paragraaf 4.2 geclassificeerd als 'Aanbevolen' voor het geval dat een bepaalde dataset niet over een downloadbare Distributie beschikt, en in dergelijke gevallen de leverancier van de indicator dus niet in staat zou zijn om deze informatie te verstrekken. We 43 Steunpunt Verkeersveiligheid | RA-2014-004
verwachten echter dat in de meeste gevallen datasets downloadbaar zijn, wat in dergelijk geval het verstrekken van informatie over de distributie verplicht maakt. Alle overigen klassen zijn optioneel. Een verdere beschrijving wordt enkel gegeven in sectie 4.3 indien het model verplichte of aanbevolen attributen voor de klasse specificeert. Dit gegevensmodel hergebruikt termen uit een aantal bestaande specificaties. Klassen en eigenschappen die in onderstaande paragrafen aan bod komen werden afgeleid van de volgende naamruimten:
adms: http://www.w3.org/ns/adms# dcat: http://www.w3.org/ns/dcat# dct: http://purl.org/dc/terms/ foaf: http://xmlns.com/foaf/0.1/ qudt: http://qudt.org/schema/qudt# rdfs: http://www.w3.org/2000/01/rdf-schema# schema: http://schema.org/ skos: http://www.w3.org/2004/02/skos/core# xsd: http://www.w3.org/2001/XMLSchema# v: http://www.w3.org/2006/vcard/ns# dcat-sm:http://projects.sadl.kuleuven.be/vocab/dcat-sm#
In de volgende paragrafen wordt een overzicht gegeven van de gedefinieerde klassen en attributen. Omdat het uitwisselmodel afgeleid is van de DCAT specificatie, werd gekozen om de documentatie Engelstalig te houden. Klassen en attributen die niet in het oorspronkelijk DCAT profiel aanwezig zijn, worden in kleur aangegeven.
4.2
Classes
Figuur 15 toont een UML diagram van alle klassen en eigenschappen van het uitwisselmodel. Indien de klassen en attributen afstammen van de originele DCAT vocabulaire, is de beschrijving overgenomen uit het rapport “DCAT Application profile for data portals in Europe” (European Commission, 2013a).
44 Steunpunt Verkeersveiligheid | RA-2014-004
class DCAT-Ruimtemonitor prov: wasAttributedTo «recommended»
«recommended» dcat-sm:PolicyAssessment «mandatory» prov :Entity
«mandatory» dct:description dct:title
«recommended» «recommende... prov :Activ ity
«recommended»
«mandatory» dct:description
prov: used «recommended»
«mandatory» dct:title
dct: source «mandatory»
«mandatory» foaf:name
prov: wasAssociatedWith
prov:wasGeneratedBy
«optional» dct:identifier
«optional» dct:issued dct:modified
dcat:theme «recommended»
«recommen... prov :Agent
dct:type
«mandatory» skos:Concept
dcat-sm: dcat:theme spatialRepresentationType
dct: publisher «recommended»
«recommended» «recommended» dcat:Distribution
«recommended» «recommended» dct:type (indicatorentypologie) «recommended»
«mandatory» skos:prefLabel
«recommended» qudt:QuantityKind skos: inScheme
«optional» dcat:byteSize dcat:downloadURL dct:issued dct:modified dct:title
«recommen... qudt:Unit
dcat-sm: policyAssessment «recommended»
«mandatory» skos:ConceptScheme
«mandatory» foaf:Agent
dct: «mandatory» «recommended» license dct:title
«mandatory» dcat:Dataset
dct: publisher «recommended»
«mandatory» foaf:name
«optional» adms:version adms:versionNotes dcat-sm:dataQuality dct:identifier dct:issued dct:modified
dcat-sm:observableProperty dcat-sm:unitOfMeasure «recommended» «recommended» dcat:dataset
dcat: themeTaxonomy «recommended»
dct: publisher «mandatory»
«mandatory» foaf: «recommended» isPrimaryTopicOf
«mandatory» dcat:Catalog
«optional» dcat: landingpage
«mandatory» dct:description dct:title
dct:spatial «optional» «recommended» dcat-sm:Measure
«mandatory» dct:description dct:title
«recommended» dct:description dcat: distribution «recommended»
«optional» dct:LicenseDocument
dct: format «recommended»
«optional» dct: MediaTypeOrExtent
dcat: mediaType «optional»
dcat: accessURL «mandatory»
«mandatory» rdfs:Resource
dct:rights «optional»
dcat: keyword «recommended»
dcat-sm: measure
dct: license «recommended»
«mandatory» rdfs:Literal
dcat-sm: spatialResolution «optional»
«recommended» «recommended» dcat-sm:spatialDimension dcat-sm:temporalDimension dcat-sm:thematicDimension
dcat-sm: referenceSystemInfo «recommended»
«recommended» dct:issued dct:modified
«optional» dct:RightsStatement
«optional,union» iso19115:MD_Resolution iso19115:equivalentScale
«recommended» iso19115:MD_ReferenceSystem
dct:temporal dcat: landingPage «optional» dct:spatial
«mandatory» iso19115:referenceSystemIdentifier
«optional»
foaf: isPrimaryTopicOf «recommended»
dct:spatial
dct: accrualPeriodicity «optional»
«optional»
dcat: contactPoint «recommended»
«optional»
foaf: homepage
«optional» foaf:Document
«optional» dct:Frequency
«optional» dct:Location
«recommended»
«optional» v :VCard
«optional» dct:PeriodOfTime «optional» schema:endDate schema:startDate
dct:rights «optional» dct:temporal «optional»
Figuur 15: UML diagram van het uitwisselmodel
45 Steunpunt Verkeersveiligheid | RA-2014-004
4.2.1
Mandatory classes
Class name
Usage note for the Application Profile An entity that is associated with Catalogs and/or Datasets. If the Agent is an organisation, the use of the Organization Ontology29 is recommended. A subject of a Dataset.
URI
Reference
foaf:Agent
http://xmlns.com/foaf/spec/#t erm_Agent , http://www.w3.org/TR/vocab -org/
skos:Concept
Concept scheme
A concept collection (e.g. controlled vocabulary) in which the Category is defined.
skos:ConceptScheme
Catalog
A catalog or repository that hosts the Datasets being described. A conceptual entity that represents the information published. A literal value such as a string or integer; Literals may be typed, e.g. as a date according to xsd:date. Literals that contain human-readable text have an optional language tag as defined by BCP 4730. Anything described by RDF.
dcat:Catalog
http://www.w3.org/TR/2013/ PR-vocab-dcat20131217/#class-concept http://www.w3.org/TR/2013/ PR-vocab-dcat20131217/#class-conceptscheme http://www.w3.org/TR/2013/ PR-vocab-dcat20131217/#class-catalog http://www.w3.org/TR/2013/ PR-vocab-dcat20131217/#class-dataset http://www.w3.org/TR/rdfconcepts/#section-Literals
Agent
Concept
Dataset
Literal
Resource
4.2.2
dcat:Dataset
rdfs:Literal
rdfs:Resource
http://www.w3.org/TR/rdfschema/#ch_resource
Usage note for the Application Profile A physical embodiment of the Dataset in a particular format.
URI
Reference
dcat:Distribution
An activity is something that occurs over a period of time and acts upon or with entities; it may include consuming, processing, transforming, modifying, relocating, using, or generating entities. An entity is a physical, digital, conceptual, or other kind of thing with some fixed aspects; entities may be real or imaginary. An agent is something that bears some form of responsibility for an activity taking place, for the existence of an entity, or for another agent's activity. Policy Assessment represents the state of the policy for a given time or timespan. A measure represents the measure variables, dimensions and unit of measures that are used to represent a certain phenomenon. This class contains the description of the spatial and temporal reference system(s) used in a dataset. MD_ReferenceSystem contains an element to identify the
prov:Activity
http://www.w3.org/TR/2013/ PR-vocab-dcat20131217/#class-distribution http://www.w3.org/TR/2013/ REC-prov-o20130430/#Activity
Recommended classes
Class name Distribution
Activity
Entity
Agent
PolicyAssessme nt Measure
MD_ReferenceSy stem
29
prov:Entity
http://www.w3.org/TR/2013/ REC-prov-o20130430/#Entity
prov:Agent
http://www.w3.org/TR/2013/ REC-prov-o20130430/#Agent
dcatsm:PolicyAssessment dcat-sm:Measure
iso19115:MD_Referenc eSystem
ISO19115:2003 Geographic Information --Metadata
W3C. The Organization Ontology. W3C Proposed Recommendation,17 http://www.w3.org/TR/2013/PR-vocab-org-20131217 30 IETF. BCP 47. Tags for Identifying Languages. http://www.rfc-editor.org/rfc/bcp/bcp47.txt
december
2013.
46 Steunpunt Verkeersveiligheid | RA-2014-004
reference system used.
4.2.3
Optional classes
De klassen ‘Catalog Record’, ‘Linguistic System’ en ‘Standard’ van de originele DCAT vocabulaire zijn weggevallen, omdat ze niet van toepassing zijn op het uitwisselmodel. Class name Document
Reason for exclusion A textual resource intended for human consumption that contains information, e.g. a web page about a Dataset. A rate at which something recurs, e.g. the publication of a Dataset.
URI foaf:Document
Reference http://xmlns.com/foaf/spec/#t erm_Document
dct:Frequency
Licence document
A legal document giving official permission to do something with a resource.
dct:LicenseDocument
Location
A spatial region or named place. It can be represented using a controlled vocabulary or with geographic coordinates. In the latter case, the use of the Core Location Vocabulary31 is recommended. A media type or extent, e.g. the format of a computer file
dct:Location
http://dublincore.org/docume nts/dcmi-terms/#termsFrequency http://dublincore.org/docume nts/2012/06/14/dcmiterms/?v=terms#LicenseDoc ument http://dublincore.org/docume nts/dcmi-terms/#termsLocation
Period of time
An interval of time that is named or defined by its start and end dates.
dct:PeriodOfTime
Publisher type Rights statement
A type of organisation that acts as a publisher A statement about the intellectual property rights (IPR) held in or over a resource, a legal document giving official permission to do something with a resource, or a statement about access rights. A description following the vCard specification, e.g. to provide telephone number and e-mail address for a contact point. Factor which provides a general understanding of the density of spatial data in the dataset
skos:Concept
Frequency
Media type or extent
VCard
MD_Resolutio n
4.3
dct:MediaTypeOrExtent
dct:RightsStatement
http://dublincore.org/docume nts/dcmi-terms/#termsMediaTypeOrExtent http://dublincore.org/docume nts/dcmi-terms/#termsPeriodOfTime http://www.w3.org/TR/vocab -adms/#dcterms-type http://dublincore.org/docume nts/dcmi-terms/#termsRightsStatement
v:VCard
http://www.w3.org/2006/vcar d/ns-2006.html#VCard
iso19115:MD_Resolutio n
ISO19115:2003 Geographic Information --Metadata
Properties per class
4.3.1
Catalog
4.3.1.1
Mandatory properties for Catalog
Property dataset
URI dcat:dataset
Range dcat:Dataset
description
dct:description
rdfs:Literal
publisher
dct:publisher
foaf:Agent
title
dct:title
rdfs:Literal
31
Usage note This property links the Catalog with a Dataset that is part of the Catalog. This property contains a free-text account of the Catalog. This property refers to an entity (organisation) responsible for making the Catalog available. This property contains a name given to the Catalog.
European Commission. Joinup. Core https://joinup.ec.europa.eu/asset/core_location/description
Location
Card. 1..n 1..1 1..1
1..1
Vocabulary. 47
Steunpunt Verkeersveiligheid | RA-2014-004
4.3.1.2
Recommended properties for Catalog
Property assessmen t
URI dcatsm:policyAssessment
Range dcatsm:PolicyAssessment
homepage
foaf:homepage
foaf:Document
licence
dct:license
dct:LicenseDocument
release date
dct:issued
themes
dcat:themeTaxonomy
rdfs:Literal typed as xsd:date or xsd:dateTime skos:ConceptScheme
update/ modificatio n date
dct:modified
4.3.1.3
rdfs:Literal typed as xsd:date or xsd:dateTime
Card. 0..n
Usage note This property refers to a statement that specifies rights associated with the Catalog. This property refers to a geographical area covered by the Catalog.
Card. 0..1
0..1
0..1
0..1
0..n
0..1
Optional properties for Catalog
Property rights
URI dct:rights
Range dct:RightsStatement
spatial / geographic
dct:spatial
dct:Location
4.3.2
Usage note This property links the Catalog with an policy assessment that is part of the Catalog This property refers to a web page that acts as the main page for the Catalog. This property refers to the licence under which the Catalog can be used or reused. This property contains the date of formal issuance (e.g., publication) of the Catalog. This property refers to a knowledge organization system (KOS) used to classify the Catalog's Datasets. This property contains the most recent date on which the Catalog was changed or modified.
0..n
Dataset
De Dataset klasse is een subklasse van Entity (prov:Entity) en erft hierdoor alle eigenschappen (attributen en relaties) van Entity. 4.3.2.1
Mandatory properties for Dataset
Property description
URI dct:description
Range rdfs:Literal
title
dct:title
rdfs:Literal
4.3.2.2
Usage note This property contains a free-text account of the Dataset. This property contains a name given to the Dataset.
Card 1..1
Usage note This property contains contact information that can be used for flagging errors in the Dataset or sending comments This property links the Dataset to an available Distribution. This property contains a keyword or tag describing the Dataset. This property refers to an entity (organisation) responsible for making the Dataset available. This property refers to a category of the Dataset. A Dataset may be associated with multiple themes. This property refers to a any kind of reference for the resource. This property refers to a type of the indicator. This property declares the measures of the phenomenon being observed This property contains information about the type of spatial represenation
Card 0..n
1..1
Recommended properties for Dataset
Property contact point
URI dcat:contactPoint
Range v:VCard or v:Kind
dataset distribution keyword/ tag publisher
dcat:distribution
dcat:Distribution
dcat:keyword
rdfs:Literal
dct:publisher
foaf:Agent
theme/ category
dcat:theme, subproperty of dct:subject foaf:isPrimaryTopicOf
skos:Concept
dct:type
skos:Concept
measure
dcat-sm:measure
dcat-sm:Measure
Spatial representat ion
dcatsm:spatialRepresentat ionType
skos:Concept
is Primary Topic Of type
foaf:Document
0..n 0..n 0..1
0..n
0..n 0..1 0..n
0..n
48 Steunpunt Verkeersveiligheid | RA-2014-004
reference system
4.3.2.3
dcatsm:referenceSystemIn fo
iso19115:MD_Referenc eSystem
0..n
Usage note This property refers to the frequency at which Dataset is updated. This property contains the main identifier for the Dataset, e.g. the URI or other unique identifier in the context of the Catalog. This property refers to a web page that provides access to the Dataset, its Distributions and/or additional information. This property contains the date of formal issuance (e.g., publication) of the Dataset. This property refers to a geographic region that is covered by the Dataset. This property refers to a temporal period that the Dataset covers. This property contains the most recent date on which the Dataset was changed or modified. This property contains a version number or other version designation of the Dataset. This property contains a description of the differences between this version and a previous version of the Dataset. A subjective evaluation of an element can then be expressed with a textual statement as a data quality descriptive result. This property contains information on the level of detail expressed as a scale factor or a ground distance
Card. 0..1
Usage note This property contains a URL that gives access to a Distribution of the Dataset. The resource at the access URL may contain information about how to get the Dataset.
Card 1..n
Usage note This property contains a free-text account of the Distribution. This property refers to the file format of the Distribution. This property refers to the licence under which the Distribution is made available.
Card 0..1
Optional properties for Dataset
Property frequency
URI dct:accrualPeriodicity
Range dct:Frequency
identifier
dct:identifier
rdfs:Literal
landing page
dcat:landingPage
foaf:Document
release date
dct:issued
rdfs:Literal typed as xsd:dateTime
spatial/ geographical coverage temporal coverage update/ modification date version
dct:spatial
dct:Location
dct:temporal
dct:PeriodOfTime
dct:modified
adms:version
rdfs:Literal typed as xsd:date or xsd:dateTime rdfs:Literal
version notes
adms:versionNotes
rdfs:Literal
dataQuality
dcat-sm:dataquality
rdfs:Literal
spatialResol ution
dcatsm:spatialResolution
iso19115:MD_Resoluti on
4.3.3
This property contains information about the spatial reference system used in a dataset
0..n
0..1
0..1
0..n
0..n 0..1
0..1
0..1
0..1
0..1
Distribution
4.3.3.1 Property access URL
4.3.3.2
Mandatory properties for Distribution URI dcat:accessURL
Range rdfs:Resource
Recommended properties for Distribution
Property description
URI dct:description
Range rdfs:Literal
format
dct:format
dct:MediaTypeOrExtent
licence
dct:license
dct:LicenseDocument
0..1 0..1
49 Steunpunt Verkeersveiligheid | RA-2014-004
4.3.3.3
Optional properties for Distribution
Property byte size
URI dcat:byteSize
download URL
dcat:downloadURL
media type
dcat:mediaType, subproperty dct:format dct:issued
release date
Range rdfs:Literal typed xsd:decimal rdfs:Resource
as
dct:MediaTypeOrExtent of
rights
dct:rights
rdfs:Literal typed as xsd:date or xsd:dateTime dct:RightsStatement
title
dct:title
rdfs:Literal
update/ modificatio n date
dct:modified
rdfs:Literal typed xsd:date xsd:dateTime
4.3.4
URI foaf:name
Card. 1..1
Usage note This property links the assessment with a Dataset has been used for making the assessment This property contains a free-text account of the policy assessment. This property contains a name given to the Catalog.
Card. 1..n
0..1
0..1
0..1
0..1 0..1
Range rdfs:Literal
PolicyAssessment
4.3.5.1
Mandatory properties for PolicyAssessment
Property source
URI dct:source
Range dcat:Dataset
description
dct:description
rdfs:Literal
title
dct:title
rdfs:Literal
4.3.5.2
1..1 1..1
Recommended properties for PolicyAssessment
Property publisher
URI dct:publisher
Range foaf:Agent
release date
dct:issued
theme/ category
dcat:theme, subproperty dct:subject
rdfs:Literal typed as xsd:date or xsd:dateTime skos:Concept
update/ modificatio n date
dct:modified
rdfs:Literal typed as xsd:date or xsd:dateTime
is Primary Topic Of
foaf:isPrimaryTopicOf
foaf:Document
Property temporal coverage
Usage note This property contains a name of the agent.
0..n
Mandatory property for Agent
Property name
4.3.5.3
Card. 0..1
Agent
4.3.4.1
4.3.5
as or
Usage note This property contains the size of a Distribution in bytes. This property contains a URL that is direct link to a downloadable file in a given format. This property refers to the media type of the Distribution if this is defined in IANA. This property contains the date of formal issuance (e.g., publication) of the Distribution. This property refers to a statement that specifies rights associated with the Distribution. This property contains a name given to the Distribution. This property contains the most recent date on which the Distribution was changed or modified.
of
Usage note This property refers to an entity (organisation) responsible for making the assessment available. This property contains the date of formal issuance (e.g., publication) of the assessment. This property refers to a category of the Assessment. An Assessment may be associated with multiple themes. This property contains the most recent date on which the assessment was changed or modified. This property refers to a any kind of reference for the resource.
Card. 0..1
Usage note This property refers to a temporal period that the Assessment covers.
Card. 0..n
0..1
0..n
0..1
0..n
Optional properties for PolicyAssessment URI dct:temporal
Range dct:PeriodOfTime
50 Steunpunt Verkeersveiligheid | RA-2014-004
spatial coverage
dct:spatial
dct:Location
landing page
dcat:landingPage
foaf:Document
4.3.6
This property refers to a geographic region that is covered by the Assessment. This property refers to a web page that provides access to the Assessment
0..n
0..1
Measure
4.3.6.1
Recommended properties for Measure
Property
URI
Range
Usage note
Card.
measure variable
dcatsm:observablePropert y dcatsm:unitOfMeasure dcatsm:spatialDimension dcatsm:temporalDimensio n dcatsm:thematicDimension
qudt:QuantityKind
This property refers to an identification of the variable being measured. This property describes the unit (of measure) that is being used. This property refers to the spatial dimensions of the variable This property refers to the temporal dimensions of the variable
0..1
This property refers to the thematic dimensions of the variable
0..n
unit of measure spatial dimension temporal dimension thematic dimension
4.3.7
qudt:Unit rdfs:Literal rdfs:Literal
rdfs:Literal
0..n 0..n
Provenance activity
4.3.7.1
Mandatory properties for provenance activity
Property description
4.3.7.2
URI dct:description
Range rdfs:Literal foaf:image
Usage note This property allows for representing provenance information, either as structured text or as an image.
Card. 1..1
Recommended properties for provenance activity
Property used
URI prov:used
Range prov:Entity
was Associated with
prov:wasAssociatedWi th
prov:Agent
4.3.8
0..1
Usage note This property refers to the data source where the dataset or indicator has been derived from This property refers to the person or organization that has processed the dataset
Card. 0..n
Usage note This property contains a name given to the Entity.
Card. 1..1
0..1
Provenance entity
4.3.8.1 Property title
4.3.8.2 Property was Attributed to was Generated
Mandatory properties for provenance entity URI dct:title
Range rdfs:Literal
Recommended properties for provenance entity URI prov:wasAttributedTo
Range prov:Agent
Usage note Attribution is the ascribing of an entity to an agent
Card. 0..1
prov:wasGeneratedBy
prov:Activity
Generation is the completion of production of a new entity by an
0..n
51 Steunpunt Verkeersveiligheid | RA-2014-004
By
4.3.8.3
activity. This entity did not exist before generation and becomes available for usage after this generation
Optional properties for provenance entity
Property identifier
Usage note This property contains the main identifier for the Dataset, e.g. the URI or other unique identifier in the context of the Catalog.
Card. 0..n
Usage note This property contains a name of the agent.
Card. 1..n
Usage note This property contains a name of the category scheme. May be repeated for different versions of the name
Card. 1..n
Usage note This property contains a preferred label of the category. This property can be repeated for parallel language versions of the label.
Card. 1..n
Usage note This property refers to a type of licence, e.g. indicating ‘public domain’ or ‘royalties required’.
Card. 0..1
Range Usage note rdfs:Literal typed as This property contains the start of xsd:date or the period xsd:dateTime end date/time schema:endDate rdfs:Literal typed as This property contains the end of xsd:date or the period xsd:dateTime Please note that while both properties are optional, one of the two must be present.
Card. 0..1
4.3.9 4.3.9.1
URI dct:identifier
Range rdfs:Literal
Provenance agent Mandatory property for provenance agent
Property name
URI foaf:name
Range rdfs:Literal
4.3.10 Concept Scheme 4.3.10.1
Mandatory property for Concept Scheme
Property title
URI dct:title
Range rdfs:Literal
4.3.11 Concept 4.3.11.1
Mandatory property for Concept
Property preferred label
URI skos:prefLabel
Range rdfs:Literal
4.3.12 Licence Document 4.3.12.1
Recommended property for Licence Document
Property licence type
URI dct:type
Range rdfs:Class
4.3.13 Period Of Time 4.3.13.1
Optional properties for Period Of Time
Property start date/time
URI schema:startDate
0..1
52 Steunpunt Verkeersveiligheid | RA-2014-004
4.4
Gecontroleerde vocabulaires
4.4.1
Aanbevelingen
Het uitwisselmodel voorziet het gebruik van een aantal gecontroleerde vocabulaires, taxonomieën en thesauri voor het eenduidig beschrijven van de indicator. Het gebruik van deze gestructureerde woordenlijsten is bevorderlijk voor de interoperabiliteit van de gegevens. Om indicatoren tussen verschillende beleidsdomeinen en –niveaus vlot uitwisselbaar te maken, gelden volgende aanbevelingen:
4.4.2
Publicatie van de vocabulaire volgens de Vlaamse Open data licenties (zie 4.4.4); Het operationaliseren en onderhoud wordt uitgevoerd door een Vlaamse Overheidsinstelling; De gecontroleerde vocabulaire wordt grondig gedocumenteerd; Wordt online gepubliceerd, en bij voorkeur geïdentificeerd aan de hand van een persistente URI.
Vocabulaires in het uitwisselmodel
Onderstaande tabel geeft per attribuut aan welke vocabulaire of concept schema gebruikt dient te worden om een waarde op te geven voor het attribuut.
Property URI
dcat:theme
Used for Class Distributio n Dataset
dcat:themeTaxonomy
Catalog
dct:accrualPeriodicity
Dataset
dct:format
Distributio n Catalog, Dataset
dcat:mediaType
dct:spatial
Vocabulary name IANA Verkeersveilig heidsmonitor domeinen Verkeersveilig heidsmonitor Dublin Core Collection Description Frequency Vocabulary32 IANA GeoNames
dct:type
Licence Document
Vlaamse Open Data Licenties
dct:type
Dataset
Indicatoren typologie
32
Dublin Core Metadata Initiative. Dublin http://dublincore.org/groups/collections/frequency/
Vocabulary URI
Usage note
http://www.iana.org/assignments/ media-types/media-types.xhtml TBD
Beleidsdomeine n en thema’s
TBD http://purl.org/cld/freq/ eigen NL alternatief
of
een
http://www.iana.org/assignments/ media-types/media-types.xhtml http://www.geonames.org/ontology
TBD
Core
Collection
Description
Bv http://www.geon ames.org/BE/ad ministrativedivisionbelgium.html De lijst van termen is beschikbaar op http://www.open dataforum.info/in dex.php/compon ent/k2/item/155de-open-datalicenties Lijst om type indicator te bepalen
Frequency
Vocabulary.
53 Steunpunt Verkeersveiligheid | RA-2014-004
4.4.3
ISO19115
Voor eigenschappen die de ruimtelijke context beschrijven kunnen we ook terugvallen op gestandaardiseerde woordenlijsten. Onderstaande tabel geeft weer welke gestructureerde woordenlijsten uit de ISO19115 standaard aangewend kunnen worden om de input te beperken tot een selectie van voorgedefinieerde waarden.
Property URI iso19115:spatialRepre sentationType
Used for Class Dataset
iso19115:referenceSys temIdentifier
MD_Refer enceSyste m
iso19115:equivalentSc ale
MD_Resol ution
4.4.4
Vocabulary name Spatial Representatio n Type RS_Identifier
Vocabulary URI
Usage note
TBD
Vector / Grid
TBD
Representativ e Fraction
TBD
Het gebruik van EPSG codes wordt sterk aanbevolen om het SRS te identificeren. Meest gangbare schaalniveaus
Modellicenties Open Data Vlaanderen
Op 23 september 2011 besliste de Vlaamse Regering dat Open Data de norm wordt in Vlaanderen. De regering besliste toen ook dat hergebruik van Open Data is toegestaan, zowel voor commerciële als niet-commerciële doeleinden, gratis of tegen een billijke vergoeding. Voor dat hergebruik zijn er eenvoudige, gestandaardiseerde modellicenties ontwikkeld. Het CAG keurde die goed op 12 december 2012. De Vlaamse overheid heeft de modellicenties zo opgesteld dat ze door alle instanties in Vlaanderen, ook op lokaal niveau, kunnen gebruikt worden. De instanties kunnen een keuze maken uit vijf modellicenties33 (waarbij licentie 4a en 4b altijd samen moeten worden gebruikt):
(1) Een Creative Commons Zero verklaring, waarbij de instantie afstand doet van haar intellectuele eigendomsrechten voor zover dit wettelijk mogelijk is. Hierdoor kan de gebruiker de data hergebruiken voor eender welk doeleinde, zonder een verplichting op naamsvermelding. (2) Gratis Open Data Licentie: onder deze licentie doet de instantie geen afstand van haar intellectuele rechten, maar mag de data voor eender welk doel hergebruikt worden, gratis en onder minimale restricties. (3) Open Data Licentie tegen Billijke Vergoeding: onder deze licentie stelt de instantie nog steeds haar data ter beschikking voor eender welk hergebruik, maar wil zij voor alle soorten hergebruik een billijke vergoeding ontvangen. (4a) Gratis Open Data Licentie voor Niet-Commercieel Hergebruik: deze licentie regelt het gratis niet-commercieel hergebruik van data. Licentie 4b wordt dan toepasselijk voor het commercieel hergebruik. (4b) Open Data Licentie tegen Billijke Vergoeding voor Commercieel Hergebruik: deze licentie vormt de tegenhanger van de Gratis Licentie voor Niet-Commercieel Hergebruik en wordt steeds samen met Licentie 4a gebruikt. Voor alle entiteiten van de Vlaamse overheid geldt het volg-of-verklaar-principe: de ‘Gratis Open Data Licentie’ wordt standaard gebruikt voor het ter beschikking stellen van datasets die vallen onder het toepassingsgebied van het decreet betreffende het hergebruik van overheidsinformatie. Enkel indien dit voldoende gemotiveerd wordt, kunnen de andere licenties worden toegepast.
De modellicenties worden als een gestructureerde woordenlijst ter beschikking gesteld voor het uitwisselen van indicatoren.
33
http://www.opendataforum.info/index.php/component/k2/item/155-de-open-data-licenties
54 Steunpunt Verkeersveiligheid | RA-2014-004
4.5
Toegankelijkheid
Met betrekking tot toegang tot de data is het uitwisselmodel gelimiteerd tot het geven van informatie over de technische formaten van de verschillende distributies van de indicatoren. De attributen dcat:mediaType en dct:format geven de nodige informatie over het formaat van de gegevens en welke software gebruikt kan worden om de indicatoren te verwerken. De toegankelijkheid is bijgevolg afhankelijk van de software die men dient te gebruiken en is geen onderdeel van dit uitwisselmodel. In de toekomst zal verder onderzocht worden of een gemeenschappelijk data model ontwikkeld kan worden om naast uitwisselbare metadata ook interoperabiliteit op data-niveau te faciliteren.
55 Steunpunt Verkeersveiligheid | RA-2014-004
5. Implementatie van het uitwisselmodel 5.1
Aanpak
De specificatie zoals beschreven in hoofdstuk 4 is geschikt voor gebruik in een Linked Open Data omgeving. Om dit in de praktijk te realiseren dient er echter een traject afgelegd te worden die zowel strategisch als operationeel nog veel inspanningen vragen. Op strategisch vlak is er nood aan de ontwikkeling van een ‘persistent URI’-strategie voor overheidsgegevens. Uniform Resource Identifiers (URI's) zijn de gestandaardiseerde manier om op het internet dingen (pagina's met informatie, objecten, datasets) uniek te identificeren. Dit is een taak die met andere overheidsactoren uitgevoerd moet worden om een breed gedragen consensus te bekomen over de bouwstenen van de URI-strategie. Op operationeel vlak dient men semantische webtechnologie in te zetten om Linked Open Data te produceren en consumeren. Vandaag is er een ruim aanbod aan semantische software, maar slechts een beperkt gedeelte ervan is voldoende matuur om in een productie-omgeving op een gebruiksvriendelijke manier Linked Data te ontsluiten en te gebruiken. Zeker wat geografische gegevens betreft is het aanbod van geschikte software beperkt. Een bijkomende randvoorwaarde voor de implementatie van het uitwisselmodel is de integratie met een geografisch content management systeem (zie Error! Reference source not found.). Voor de initiële ontwikkeling van de Verkeersveiligheidsmonitor werd de voorkeur gegeven aan de implementatie van een GeoCMS die het beste van twee werelden combineert nl een robuust CMS om informatie op een gebruiksvriendelijke wijze te beheren en presenteren op een website in combinatie met software componenten die toegang geven tot geografische databanken en webservices. Daarom stellen we de volgende aanpak voor om het uitwisselmodel te realiseren:
1) Ten eerste zal het uitwisselmodel als een ‘metadata-template’ geïmplementeerd worden in een geografisch content management systeem De template zal toelaten om alle informatie in te voeren en metadata aan te leveren conform de specificaties van het uitwisselmodel. Vermits er nog geen uitwisselmodel voor data is, zal de distributie van indicatoren geïmplementeerd worden via standaard WMS en WFS services om de indicatoren resp. te visualiseren en downloaden. De geografische webservices laten toe om data in een open formaat (GML, GeoJSON, KML, shapefiles) te verspreiden. 2) In een tweede fase voorzien we een tool die de metadata opgeslagen in het geoCMS kan transformeren naar RDF. 3) Vervolgens zullen we nagaan hoe een SPARQL endpoint kan opgezet worden zodat de RDF data rechtstreeks bevraagd kunnen worden. Dit vereist de opzet en integratie met een semantische databank (i.e. triplestore) die vanuit het CMS gevoed kan worden. 4) Wanneer een uitwisselmodel voor data ontwikkeld is, zullen we de metadata en data van ruimtelijke indicatoren samen ontsluiten en transformeren naar RDF.
Eénmaal het ganse traject gerealiseerd is, kunnen het geoCMS en de semantische software (triplestore en SPARQL endpoint) parallel beheerd worden. Totnutoe hebben we ons vooral geconcentreerd op de specificatie van een uitwisselmodel. In de toekomst zal er nood zijn aan een protocol die potentiële partners toelaten om indicatoren (metadata en data) op een automatische wijze uit te wisselen tussen de verschillende monitoringsystemen die dezelfde specificaties hanteren.
5.2
Praktische voorbeelden
In deze paragraaf geven we een praktisch voorbeeld hoe een metadata-template gebruikt kan worden om metadata van indicatoren te creëren volgens de specificaties van uitwisselmodel. De voorbeelden hieronder is gebaseerd op onze specifieke gevalstudie nl het in kaart brengen van fietscomfort en fietsveiligheid. Opgelet, de voorbeelden zijn fictief, en worden enkel weergegeven om het gebruik van het uitwisselmodel te illustreren.
56 Steunpunt Verkeersveiligheid | RA-2014-004
5.2.1
Ongevallenstatistieken
dct:title dct:description
Cataloog Verkeersveiligheidsmonitor
dct:issued
De Verkeersveiligheidsmonitor Vlaanderen is een centrale toegangspoort tot indicatoren ter ondersteuning van het verkeersveiligheidsbeleid in Vlaanderen. De Verkeersveiligheidsmonitor voorziet een directe en gebruiksvriendelijke toegang tot relevante indicatoren voor diverse beleidsonderwerpen en thema’s. De doelstelling van de Verkeersveiligheidsmonitor is het beschikbaar maken van wetenschappelijke en beleidsrelevante indicatoren, enerzijds ter ondersteuning van de beleidsvoorbereiding en –opvolging van het verkeersveiligheidsbeleid in Vlaanderen, anderzijds in functie van de maatschappelijke discussie en keuzes met betrekking tot maatschappelijke uitdagingen die op ons afkomen. Het portaal presenteert geografische indicatoren en beoordelingen van beleidsdoelstellingen aan de hand van resp. indicatorpagina’s en beleidsassessments. Alle componenten (metadatacataloog, view en download diensten) worden rechtstreeks en geïntegreerd aangeboden via een geografisch content management systeem. 01/07/2013
dct:modified
21/01/2014
dct:publisher
Steunpunt Verkeersveiligheid
dct:spatial
Vlaanderen
foaf:homepage
http://projects.sadl.kuleuven.be/verkeersveiligheidsmonitor http://www.verkeersveiligheidsmonitor.be skos:Indicatorentypologie skos:Beleidsonderwerpen skos:Thema’s skos:RuimtelijkeRepresentatie skos:VlaamseLicentiemodellen skos:Dimensies … Fietsveiligheid …. …
dcat:themetaxonomy
dcat-sm:assessment dcat:dataset
Policy Assessment dct:title
Fietsveiligheid
dct:description
dct:identifier
In 2011 deden er zich volgens het jaarrapport Verkeersveiligheid in Vlaanderen 6.324 ongevallen voor waarbij fietsers betrokken waren (Carpentier & Nuyttens, 2013). 5.740 fietsers raakten hierbij lichtgewond, 805 zwaargewond en 49 stierven. 20,6 procent van wie sterft of zwaar gewond raakt in het verkeer is een fietser. Hierbij dient opgemerkt te worden dat door het fenomeen van onderregistratie het reëel aantal slachtoffers in werkelijkheid nog veel hoger is. Eerder onderzoek toonde aan dat het niet verlenen van voorrang –zowel door de fietser als door de opponent - een belangrijke rol speelt bij het ontstaan van dodelijke ongevallen (Martensen & Nuyttens, 2009; Van Hout, 2007). Factoren van de weg daarentegen worden in de ongevallenformulieren zelden als oorzaak van een ongeval aangegeven. In 2011 werden slechts voor 13.5% van alle ongevallen wegfactoren geregistreerd. Nochtans vormt de staat en aard van het fietspad een belangrijk risico op ongevallen met fietsers. Heel wat ongevallen gebeuren met langsrijdende voertuigen, en het risico neemt toe indien er bijvoorbeeld geen vrijliggend fietspad is aangelegd. De slechte staat van het fietspad werd in 2011 110 keer geregistreerd als oorzaak van een letselongeval met fietsers. Dat de staat van de fietsinfrastructuur en fietscomfort niet optimaal zijn, blijkt ook uit de comfortaudits door de Fietsersbond van 1400km fietspaden verspreid over 31 gemeenten in Vlaanderen (Coessens, 2013). Om de invloed van de staat en aard van de fietsinfrastructuur op ongevallen beter in te schatten, is er nood aan kwaliteitsvolle en geïntegreerde informatie: Indicatoren over fietsongevallen en de daaruit resulterende letsels, waarbij de ordediensten extra aandacht dienen te geven aan het registreren van de ongevallenfactoren (gedrags-, voertuig- en wegfactoren) Indicatoren over de staat en aard van de fietsinfrastructuur om het risico op ongevallen beter in kaart te brengen. http://www.verkeersveiligheidsmonitor.be/policy-assessment/fietsveiligheid
dct:issued
21/01/2014
dct:modified
21/01/2014
dct:publisher
Steunpunt Verkeersveiligheid
dct:temporal dct:spatial
start: 01/01/2010 end: 31/12/2012 Vlaanderen
dcat:landingpage
http://www.verkeersveiligheidsmonitor.be/policy-assessment/fietsveiligheid
dcat:theme
Fiets
foaf:isPrimaryTopicOf
Van Hout, K. (2007), Risico’s van Fietsen. Diepenbeek, Steunpunt Verkeersveiligheid. Martensen, H., & Nuyttens, N. (2009). Themarapport fietsers - Verkeersongevallen met
57 Steunpunt Verkeersveiligheid | RA-2014-004
fietsers 2000-2007. Brussel. dct:source
dct:title dct:description
Evolutie van fietsongevallen Ongevalsfactoren Ongevalstypen Algemeen fietscomfort Trillingscomfort Breedte van het fietspad Afscheiding van de weg ….
Dataset Evolutie van fietsongevallen
dct:identifier
Het aantal dodelijke en zwaargewonde slachtoffers onder de fietsers heeft in het afgelopen decennium– zoals het totaal van alle verkeersslachtoffers – een sterke vermindering gekend. De indicator toont het aantal ongevallen met fietsers, omgekomen fietsers, zwaargewonde fietsers en lichtgewonde fietsers gepresenteerd. Omgekomen fietsers zijn gedefinieerd als diegene die in een verkeersongeval ter plaatse zijn overleden opgeteld bij diegene die binnen de 30 dagen aan de gevolgen daarvan zijn overleden. http://www.verkeersveiligheidsmonitor.be/indicator/evolutie-van-fietsongevallen
dct:issued
21/01/2014
dct:modified
21/01/2014
dct:publisher
Steunpunt Verkeersveiligheid
dct:spatial
Vlaanderen
dcat:landingpage
http://www.verkeersveiligheidsmonitor.be/indicator/evolutie-van-fietsongevallen
dcat:theme
fiets
adms:version
1.1
adms:versionNotes
op basis van nieuwe gegevens 2012
dct: accrualPeriodicity
jaarlijks
dct:temporal dcat:keyword
start:01/01/1995 end: now fiets, fietscomfort, fietsinfrastructuur
dct:type
omgevingsindicator
iso19115: spatialRepresentationType foaf:isPrimaryTopicOf
vector
iso19115: referenceSystemInfo iso19115: spatialResolution dcat-sm:measure dcat:distribution
dcat-sm:provenance dcat-sm:dataquality dcat:contactpoint
Van Hout, K. (2007), Risico’s van Fietsen. Diepenbeek, Steunpunt Verkeersveiligheid. Martensen, H., & Nuyttens, N. (2009). Themarapport fietsers - Verkeersongevallen met fietsers 2000-2007. Brussel. EPSG:31370 1:10.000 Aantal fietsongevallen per gemeente WMS WFS map RDF Berekeningswijze (gestructureerd) Berekeningswijze (grafisch) De kwaliteit van de indicator ongevallenregistratie. vCard Jan Janssen
wordt
bepaald
door
de
kwaliteit
van
de
Aantal fietsongevallen per gemeente(Measure) qdut:QuantityKind
Aantal
qdut:Unit dcat-sm:spatialDimension
gemeente
dcat-sm:temporalDimension
2012
dcat-sm:thematiclDimension WMS (Distribution) dct:title
WMS fietsongevallen
dct:description
Web Map Service van de indicator
dcat:accessURL
http://www.verkeersveiligheidsmonitor.be/indicator/wms/fietsongevallen
58 Steunpunt Verkeersveiligheid | RA-2014-004
dcat:downloadURL dct:issued
21/01/2014
dct:modified
21/01/2014
dcat:bytesize dcat:mediatype
image/png, application/kml
dct:format dct:rights
Om alle gebruikers de kans te geven de indicatoren te ontdekken, zijn de raadpleegdiensten in een eerste fase voor iedereen toegankelijk.
dct:license WFS (Distribution) dct:title
WFS Algemeen aanbod van groene ruimte
dct:description
Web Feature Service van de indicator
dcat:accessURL dcat:downloadURL
http://www.verkeersveiligheidsmonitor.be/indicator/wfs/fietsongevallen
dct:issued
21/01/2014
dct:modified
21/01/2014
dcat:bytesize
12MB
dcat:mediatype
application/json, application/kml
dct:format
GML2, GML3,shape-zip
dct:rights dct:license
Gratis Open Data Licentie
map (Distribution) dct:title
Kaart fietsongevallen
dct:description
Web Map Service van de indicator
dcat:accessURL
http://www.verkeersveiligheidsmonitor.be/indicator/map/fietsongevallen
dcat:downloadURL dct:issued
21/01/2014
dct:modified
21/01/2014
dcat:bytesize
1MB
dcat:mediatype dct:format
PDF
dct:rights dct:license Berekeningswijze gestructureerd (Provenance) dct:description prov:wasAssociatedWith
Stap 1: reclassify ongevallengegevens naar fietsongevallen Stap 2: Aggregatie naar gemeente Jan Janssens
prov:used
MOW gelokaliseerde ongevallendata
prov:wasAttributedTo
Steunpunt Verkeersveiligheid
Berekeningswijze grafisch (Provenance) dct:description
59 Steunpunt Verkeersveiligheid | RA-2014-004
vCard Jan Janssen vcard:fn
Jan Janssens
vcard:organization-name
Steunpunt Verkeersveiligheid
vcard:organization-unit
Werkgroep Fiets
vcard:hasEmail
[email protected]
vcard:hasAddress vcard:street-adress vcard:postal-code vcard:locality vcard:country-name vcard:hasTelephone
kerkstraat 1 3000 Leuven België +3216555555
indicatorentypologie
Controlled Vocabulaires Omgevingsindicator, inputindicator,procesindicator, outputindicator,effectindicator,…
beleidsthema
Fietsveiligheid,….
thema
Voertuig, fiets, voetganger, …..
licentiemodellen
Creative Commons Zero, Gratis Open Data Licentie, Open Data Licentie tegen Billijke Vergoeding, Gratis Open Data Licentie voor Niet-Commercieel Hergebruik, Open Data Licentie tegen Billijke Vergoeding voor Commercieel Hergebruik vector, grid
Spatial Representation
5.2.2
Fietscomfortindicatoren
dct:issued
Cataloog Databank & Webapplicatie Audit & Structureel Beheer van Fietstracés De Fietsersbond verspreidt comfortindicatoren via een interactieve website en databank: de fietsaudit databank. In deze databank vindt u indicatoren over comfort voor 31 Vlaamse gemeenten: trillingscomfort, breedte van het fietspad, afscheiding van de weg. 20/04/2010
dct:modified
21/01/2014
dct:publisher
Fietsersbond, Vlaamse overheid
dct:spatial
Vlaanderen
dct:title dct:description
foaf:homepage dcat:themetaxonomy
skos:onderwerpen skos:RuimtelijkeRepresentatie
dcat-sm:assessment
dct:title dct:description
Dataset Trillingsscore fietsaudit per gemeente per wegbeheerder De scores voor gemeentelijke en gewestelijke fietspaden werden per gemeente apart geregistreerd. Door deze aparte registratie werd duidelijk of er comfortverschillen bestaan tussen beide categorieën.
dct:identifier dct:issued dct:modified
09/12/2013
dct:publisher
Fietsersbond, Vlaamse overheid
dct:spatial
Vlaanderen (selectie gemeenten)
dcat:landingpage
http://www.fietscomfort.be
dcat:theme
Fietsveiligheid
adms:version adms:versionNotes dct: accrualPeriodicity
maandelijks
dct:temporal dcat:keyword
start:01/01/2007 end: 31/12/2013 fiets
dct:type
omgevingsindicator
60 Steunpunt Verkeersveiligheid | RA-2014-004
iso19115: spatialRepresentationType foaf:isPrimaryTopicOf
vector
iso19115: referenceSystemInfo iso19115: spatialResolution dcat-sm:measure
EPSG:31370
dcat:distribution
WMS XLS/CSV map Berekeningswijze (gestructureerd) Berekeningswijze (grafisch)
dcat-sm:provenance
http://www.fietscomfort.be
1:10000 Trillingsscore per wegbeheerder
dcat-sm:dataquality dcat:contactpoint
vCard Piet Peeters
Trillingsscore per wegbeheerder (Measure) qudt: Quantitykind
STDEV of score op 10
qudt: Unit dcat-sm:spatialDimension
gemeente
dcat-sm:temporalDimension
2007-2013
dcat-sm:thematiclDimension
trillingsscore
WMS (Distribution) dct:title
WMS Trillingsscore per wegbeheerder
dct:description
Web Map Service van de indicator
dcat:accessURL
http:// www.fietscomfort.be/wms/
dcat:downloadURL dct:issued
01/01/2013
dct:modified dcat:bytesize dcat:mediatype
image/png, application/kml
dct:format dct:rights
Enkel intern toegankelijk
dct:license XLS/CSV (Distribution) dct:title
CSV Trillingsscore per wegbeheerder
dct:description
tabel kan gedownload worden als excel
dcat:accessURL
http:// www.fietscomfort.be
dcat:downloadURL dct:issued
01/01/2013
dct:modified dcat:bytesize
50kB
dcat:mediatype
text/csv
dct:format
XLS
dct:rights
Publiek Toegankelijk
dct:license
Gratis Open Data Licentie
map (Distribution) dct:title
Kaart Trillingsscore per wegbeheerder
dct:description
PDF van de kaart
dcat:accessURL
http:// www.fietscomfort.be
dcat:downloadURL dct:issued
01/01/2013
dct:modified dcat:bytesize dcat:mediatype dct:format
PDF
dct:rights
Publiek Toegankelijk
dct:license Berekeningswijze gestructureerd (Provenance) dct:description
Stap 1: standaarddeviatieresultaten (STDEV) worden op lineaire basis herleid
61 Steunpunt Verkeersveiligheid | RA-2014-004
tot scores op 10 per fietstracé Stap 2: de score voor alle fietstracées worden geaggregeerd per gemeente
prov:wasAssociatedWith
Stap 3: weging van de scores op basis van de lengte van het fietstracé. Piet Peeters
prov:used prov:wasAttributedTo Berekeningswijze grafisch (Provenance) dct:description
vCard Piet Peeters vcard:fn
Piet Peeters
vcard:organization-name
Fietserbonds
vcard:organization-unit
Comfortaudits
vcard:hasEmail
[email protected]
vcard:hasAddress vcard:street-adress vcard:postal-code vcard:locality vcard:country-name vcard:hasTelephone
kerkstraat 1 2000 Antwerpen België +3235555555
indicatorentypologie
Controlled Vocabulaires Omgevingsindicator, inputindicator,procesindicator, outputindicator,effectindicator,…
onderwerpen
Voertuig, fiets, voetganger, …..
licentiemodellen
Creative Commons Zero, Gratis Open Data Licentie, Open Data Licentie tegen Billijke Vergoeding, Gratis Open Data Licentie voor Niet-Commercieel Hergebruik, Open Data Licentie tegen Billijke Vergoeding voor Commercieel Hergebruik vector, grid
Spatial Representation
62 Steunpunt Verkeersveiligheid | RA-2014-004
6. Conclusies Het analyseren en in kaart brengen van de verkeersveiligheidstoestand heeft de reputatie langdurig, tijdrovend en kostbaar te zijn, omdat de benodigde gegevens en indicatoren vaak in heterogene vormen en formaten bewaard worden. Meer dan ooit is er behoefte aan één integraal monitoring platform om informatie en indicatoren op te zoeken die beleidsbeslissingen kunnen ondersteunen. Voorbeelden hiervan zijn de monitoringsystemen zoals de Verkeersveiligheidsmonitor, de Ruimtemonitor, de Stadsmonitor, de Natuurindicatoren, de Milieu- en Natuurverkenning, etc… die de afgelopen jaren ontwikkeld werden door verschillende actoren. Dit type van informatieplatformen zijn een eerste stap in het centraliseren, structureren en harmoniseren van beleidsrelevante indicatoren. Ze spelen een belangrijke rol in het distribueren van data en informatie naar zowel interne als externe stakeholders, maar blijken vooralsnog niet in staat om indicatoren tussen verschillende platformen uit te wisselen. Semantische interoperabiliteit is een bijkomende voorwaarde voor uitwisseling en hergebruik van deze gegevens. De opzet van deze studie is het bevorderen van de toegankelijkheid, de kwaliteit en de uitwisselbaarheid van ruimtelijke indicatoren i.v.m. verkeersveiligheid. We hebben aan de hand van een concrete gevalstudie over fietscomfort en fietsveiligheid een aantal interoperabiliteitsproblemen met betrekking tot de uitwisseling van indicatoren geanalyseerd. Vervolgens hebben we vanuit een top-down benadering het reeds beschikbare semantische raamwerk geanalyseerd. Internationale standaarden die in aanmerking komen voor het uitwisselmodel werden geanalyseerd en met elkaar vergeleken om te vermijden dat een nieuwe solitaire specificatie ontwikkeld wordt. Vanuit de vergelijking tussen het aanbod en de specifieke behoeften die in de gevalstudie geïdentificeerd werden, werd een nieuwe specificatie ontwikkeld die aangewend kan worden om metadata van ruimtelijke indicatoren uit te wisselen via semantische web technologie. De resulterende specificatie is gebaseerd op de DCAT vocabulaire en is hierdoor compatibel met andere portalen die deze standaard gebruiken om ‘Open Data’ te beschrijven. Aanpassingen en uitbreidingen werden gemaakt om informatie op te nemen over:
Het beleidskader: Het beleidskader wordt geïmplementeerd door het definiëren van een taxonomie om beleidsonderwerpen te structureren en het ontwikkelen van een aparte klasse om assessments en evaluaties te documenteren. Het ruimtelijk kader: Een aantal metadata-elementen wordt overgenomen uit de ISO 19115 standaard om informatie over ruimtelijke aspecten te documenteren Herkomstinformatie: Het W3C PROV model zal mee geïntegreerd worden in de specificatie. Meetwaarden en dimensies: Er worden extra metadata-elementen voorzien om de meetvariabelen te omschrijven, alsook de ruimtelijke, temporele en thematische dimensies.
Het resultaat is een uitwisselmodel die aan de gebruikers toelaat om verkeersveiligheidsindicatoren op een gestructureerde manier te beschrijven en in samenhang te ontsluiten en presenteren. Een voorbeeldimplementatie van de specificatie is beschikbaar op de Verkeersveiligheidsmonitor. Vooralsnog beperkt de specificatie zich tot metadata van ruimtelijke indicatoren. In afwachting van een specifiek model voor de onderliggende data wordt het gebruik van open formaten (GML, JSON, KML) aanbevolen om de indicatorengegevens te distribueren. Sommige van de open formaten kunnen vandaag via web feature services aangeleverd worden. In de toekomst wensen we de specificatie uit te breiden naar de onderliggende data, zodat metadata én data tesamen op een semantische wijze gepubliceerd en uitgewisseld kunnen worden. Voor de uitwisseling van data lijken de INSPIRE, Data Cube en GeoSPARQL specificatie in aanmerking te komen:
INSPIRE heeft reeds data specificaties opgesteld voor 34 thema’s die uitgebreid kunnen worden voor specifieke toepassingen zoals het monitoren van beleidsgerelateerde gegevens. Momenteel zijn er studies lopend die onderzoeken hoe INSPIRE data specificaties getransformeerd kunnen worden naar het RDF model. Tot op vandaag zijn er enkel cases waarbij de omzetting ad-hoc gebeurt, wat resulteert in niet-interoperabele RDF bestanden. Het is van belang dat de transformatie van de INSPIRE UML modellen naar RDF op een uniforme manier gebeurt, zodat de data door 63
Steunpunt Verkeersveiligheid | RA-2014-004
iedereen op dezelfde wijze wordt getransformeerd. Dit kan van belang zijn voor ruimtelijke indicatoren die opgebouwd zijn op basis van ruimtelijke entiteiten (administratieve eenheden, statistische eenheden…) die tot één van de 34 INSPIRE thema’s behoren. Voor deze indicatoren is het bijgevolg wenselijk de INSPIRE data specificaties verder uit te breiden.
De Data Cube specificatie is in de eerste plaats bedoeld voor statistische en multidimensionale data en is slechts beperkt toepasbaar op de context van verkeersveiligheidsindicatoren, waarvan het merendeel niet multi-dimensioneel is.
GeoSPARQL is een kleine ontologie in RDFS/OWL met het oog op een gestandaardiseerde uitwisseling van ruimtelijke gegevens in RDF. GeoSPARQL is echter beperkt tot het modelleren van features, voor rasterdata zijn er op dit ogenblik geen standaarden gekend voor semantische webtoepassingen.
In verder onderzoek zullen bovenstaande specificaties een startpunt vormen om een uitwisselmodel te modelleren dat geschikt is voor het harmoniseren van beleidsrelevante verkeersveiligheidsindicatoren.
64 Steunpunt Verkeersveiligheid | RA-2014-004
Bibliografie ANSI-NISO. (2005). ANSI-NISO Z39.19-2005, Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies. Retrieved December 05, 2013, from http://www.niso.org/kst/reports/standards?step=2&gid=&project_key=7cc9b583cb5a62e8c 15d3099e0bb46bbae9cf38a Archer, P., Dekkers, M., Goedertier, S., & Loutas, N. (2013). Study on business models for Linked Open Government Data Document. Bishr, Y. (1998). Overcoming the semantic and other barriers to GIS interoperability. International Journal of Geographical Information Science, 12(4), 299–314. doi:10.1080/136588198241806 Bizer, C., Heath, T., & Berners-Lee, T. (2009). Linked Data - The Story So Far. International Journal on Semantic Web and Information Systems. Bourgeois, G. (2011). Conceptnota aan de Vlaamse Regering met betrekking tot open data. Retrieved from http://www.bestuurszaken.be/sites/bz.vlaanderen.be/files/VR_2011_2309_DOC_09591_BIS_Beleid_met_betrekking_tot_open_data.pdf Brussee, R., Punter, M., & Roes, J. (2008). Catalogus van instrumenten voor semantische interoperabiliteit. INTEGRATE-project, Enschede. Carpentier, A., & Nuyttens, N. (2013). Jaarrapport Verkeersveiligheid 2011: Analyse van verkeersveiligheidsindicatoren in Vlaanderen tot en met 2011. Steunpunt Verkeersveiligheid & Belgisch Instituut voor de Verkeersveiligheid. Coessens, B. (2013). Auditprocedure Fietspaden - Handleiding bij de databank & webapplicatie ’Audit & Structureel beheer van fietstracés. Samenwerking tussen Fietsersbond & Vlaamse Overheid. Crevits, H. (2009). Beleidsnota Mobiliteit en Openbare Werken 2009-2014. Brussel. Crevits, H. (2010). Kandidaat-gemeenten gezocht voor proefproject in 15 gemeenten. Retrieved December 15, 2013, from http://www.hildecrevits.be/fr/kandidaat-gemeenten-gezochtvoor-proefproject-15-gemeenten European Commission. (2011). COM(2011) 882 - Open data - An engine for innovation, growth and transparent governance. Brussel. European Commission. (2012). ADMS Description Metadata Schema. ISA Programme. Retrieved from https://joinup.ec.europa.eu/asset/adms/home European Commission. (2013a). DCAT Application Profile for data portals in Europe. ISA Programme. Retrieved from https://joinup.ec.europa.eu/asset/dcat_application_profile/asset_release/dcat-applicationprofile-data-portals-europe-final European Commission. (2013b). DIRECTIVE 2013/37/EU amending Directive 2003/98/EC on the reuse of public sector information, 1–8. Fietsersbond vzw. (2009). Rapport comfortaudit Fietspaden Vlaanderen. Folmer, E., Reuvers, M., & Quak, W. (Eds.). (2013). Deel 1 - Managementoverzicht. In Pilot Linked Open Data Nederland. Geiger, C. P., & Lucke, J. Von. (2012). Open Government and ( Linked ) ( Open ) ( Government ) ( Data ). Journal of E-Democracy and Open Government, 4(2), 265–278. Hillier, P. (2002). Highways liability and the investigation of road traffic accidents. In IPWEA NSW Division Annual Conference. TRL.
65 Steunpunt Verkeersveiligheid | RA-2014-004
International Organization for Standardization. (2009). ISO 80000-1:2009 Quantities and units Part 1: General. International Organization for Standardization. (2014). ISO 19115-1:2014 Geographic information - Metadata - Part1: Fundamentals. International Organization for Standardization (ISO) and the International Electrotechnical Commission (IEC). (2007). ISO/IEC Guide 99:2007 - International vocabulary of metrology - Basic and general concepts and associated terms (VIM). Kolas, D., Perry, M., & Herring, J. (2013). Getting started with GeoSPARQL. Open Geospatial Consortium. Koornstra, M., Lynam, D., Nilsson, G., Noordzij, P., Pettersson, H. E., Wegman, F., & Wouters, P. (2002). SUNflower. A Comparative Study of the Development of Road Safety in Sweden, the United Kingdom, and the Netherlands. SWOV Institute for Road Safety Research, Leidschendam, The Netherlands. Lammar, P. (2006). Haalbaarheidsstudie voor de correctie van de ongevallengegevens. Steunpunt Verkeersveiligheid, Diepenbeek. Loutas, N., Keyzer, M. De, & Goedertier, S. (2013). “Open Data Support, how can we help you?” Presentation at the meeting of the working group of the pan-European open data portal of 18 June 2013. Martensen, H., & Nuyttens, N. (2009). Themarapport fietsers - Verkeersongevallen met fietsers 2000-2007. Brussel. Moons, E. (2009). Evaluatie van het programma “gevaarlijke punten”. Audit van bestaande evaluatieprogramma’s. Rapport Steunpunt MOW – spoor Verkeersveiligheid. Diepenbeek. Nuyttens, N. (2013). Onderregistratie van verkeersslachtoffers. Vergelijking van de gegevens over zwaar gewonde verkeersslachtoffers in de ziekenhuizen met deze in de nationale ongevallenstatistieken. Tirry,
D., & Steenberghen, T. (2013). Een conceptueel verkeersveiligheidsmonitor. In Steunpuntrapport RA-2013-001 Verkeersveiligheid, Diepenbeek.
kader voor een (p. 59). Steunpunt
Tóth, K., Portele, C., Illert, A., Lutz, M., & Lima, M. N. De. (2012). A conceptual model for developing interoperability specifications in Spatial Data Infrastructures. JRC Reference reports. doi:10.2788/21003 Van Hout, K. (2007). De risico’s van fietsen. In Steunpuntrapport RA-2007-108. Steunpunt Verkeersveiligheid, Diepenbeek. Van Malderen, F., & Macharis, C. (2010). Het gebruik van Geografische Informatie Systemen in Verkeersveiligheid: De ontwikkeling van een gevisualiseerde databank: Deel I. Steunpuntrapport RA-MOW-2010-004, Diepenbeek, België. Van Raemdonck, K., Van Malderen, F., & Macharis, C. (2011). Het ongevallenregistratieproces in Vlaanderen. In Steunpuntrapport RA-MOW-2011-009. Steunpunt Verkeersveiligheid, Diepenbeek. V-ICT-OR vzw. (2013). OSLO: Open Standaard voor Lokale Overheden. Retrieved December 12, 2013, from http://www.v-ictor.be/assets/51826237ce3fb538cc000273/OSLO_betere_en_elektronische_dienstverlenin g_2_mei_2013.pdf
66 Steunpunt Verkeersveiligheid | RA-2014-004
Het Steunpunt Verkeersveiligheid 2012-2015 is een samenwerkingsverband tussen de volgende partners:
67 Steunpunt Verkeersveiligheid | RA-2014-004