Casusbeschrijving I&M
3
Casusbeschrijving I&M ONDERZOEK OPEN DATA EN HET GEBRUIK VAN STANDAARDEN
Versie: 1.0 Datum: 26 maart 2012
Concept
Casusbeschrijving I&M
Inhoud 1
Inleiding
3
2
Kenmerken organisatie
4
2.1
Inleiding
4
2.2
Commerciële openstelling BAG-gegevens biedt veel mogelijkheden
4
2.3
Standaardisatie data (en metadata) in de samenwerking van overheidsorganisaties
5
3
Herbruikbaarheid
7
3.1
Wat zijn de verschillende soorten van formaat waarin data kan worden gepubliceerd?
7
3.2
Wat is het beste format waarin data kunnen worden gepubliceerd?
7
3.3
Zouden er ten behoeve van Open data nieuwe standaarden op de ‘pas toe leg uit’- lijst moeten worden opgenomen?
7
4
Vindbaarheid
8
4.1
Wat zijn de verschillende mogelijkheden om data te vinden?
8
4.2
Op welke wijze i.c. organisatorisch, technisch en procedureel wordt gewaarborgd dat data gevonden worden?
8
5
De wijze waarop de ontsluiting / infrastructuur wordt ingericht
9
5.1
Welke systematiek wordt gehanteerd om data te publiceren?
9
5.2
Met welke systematiek wordt data op een effectief en efficiënte wijze gepubliceerd?
9
6
Relevante ontwikkelingen binnen de EU-beleidskaders
10
6.1
Wat zijn de relevante ontwikkelingen binnen de EU-beleidskaders?
10
6.2
Wat betekent dit voor de huidige praktijk?
10
7
Lessons learned webrichtlijnen
11
7.1
Wat zijn de effecten hiervan op het publiceren, vinden en te hanteren systematiek op korte en langere termijn?
11
7.2
Zijn de ontwikkeling op het gebied van webrichtlijnen vergelijkbaar met de ontwikkeling bij opendata en standaarden?
11
7.3
Welke lessen kunnen worden meegenomen vanuit webrichtlijnen?
11
Bijlage beantwoording Factfindingsvragen
Versie 1.0
12
Pagina: 2
Casusbeschrijving I&M
1
Inleiding In december 2011 is Logica Business Consulting gestart met het onderzoek ‘Open data en gebruik standaarden’ in opdracht van het Forum Standaardisatie. Het onderzoek wordt uitgevoerd in een viertal fasen. Het voorliggende document heeft betrekking op de eerste fase van het onderzoek waarin de feitelijke gegevensverzameling heeft plaatsgevonden op basis van de factfindingsvragen, een documentenanalyse en het uitvoeren van een internationale benchmark. Op basis hiervan zijn per deelnemende organisatie aan het onderzoek casusbeschrijvingen gemaakt. Doel van de casusbeschrijving is het vastleggen van de feitelijke situatie per fase. Op basis van de verschillende casusbeschrijvingen wordt gekomen tot een synthese in termen van best practices en aanbevelingen. Op basis hiervan wordt de centrale onderzoeksvraag beantwoord. In deze casusbeschrijving wordt ingegaan op I&M. De opzet van de casus beschrijving is als volgt: Hoofdstuk 2 beschrijft op hoofdlijnen de kenmerken van de betreffende organisatie/ casus Hoofdstuk 3 t/m 7 behandelen achtereenvolgens de verschillende aandachtsgebieden: herbruikbaarheid (3), vindbaarheid (4), wijze waarop de ontsluiting plaatsvindt (5), de toekomstige ontwikkelingen binnen de EUbeleidskaders (6) en tenslotte de lessons learned uit de webrichtlijnen (7). In de bijlage van deze casusbeschrijving zijn de antwoorden van de factfindingsvragen opgenomen.
Versie 1.0
Pagina: 3
Casusbeschrijving I&M
2
Kenmerken organisatie
2.1
Inleiding Gesprekspartner vanuit I&M is de heer Coomans. Het interview vindt plaats vanuit zijn rol als accountmanager en betrokkenheid bij het project Basisregistraties Adressen en Gebouwen (BAG). Het projectteam heeft als doel bronhouders te ondersteunen met de aansluiting op de BAGLV en afnemers te helpen BAG optimaal te gebruiken. De BAG bevat gegevens over adressen en gebouwen, zoals straatnaam, huisnummer, geometrie en oppervlakte van het verblijfsobject in vierkante meters. Deze zogeheten grondslagen van de BAG zijn beschreven in de Catalogus Basisregistraties Adressen en Gebouwen. Het ministerie van Infrastructuur en Milieu stelt vanaf 1 februari 2012 de gegevens uit de Basisregistraties Adressen en Gebouwen (BAG), inclusief alle postcodes, aan iedereen zonder belemmeringen ter gebruik. Zowel overheden als private partijen mogen de gegevens dan ook voor commerciële doeleinden gebruiken. De BAG wordt beheerd door gemeenten en landelijk gedistribueerd door het Kadaster. De BAG bevat gegevens over alle gebouwen en adressen in Nederland en is onderdeel van het Stelsel van Basisregistraties. De BAG is Open data, wat betekent dat iedereen de BAG gegevens mag gebruiken voor alle doeleinden. Stimuleren van de afnemers van de BAG is een van de projecten van ICTU. Een en ander is het gevolg van de uitspraak van de rechter in december 2011 in het geding dat PostNl had aangespannen tegen de Staat. De rechter verwierp de bezwaren die PostNl had tegen het volledig vrijgeven van alle (adres)gegevens, inclusief postcodes uit de BAG, aan iedereen die daarover wil beschikken. Instellingen met een publieke taak, zoals ministeries, waterschappen, politiekorpsen en veiligheidsregio's zijn vanaf 1 juli 2011 verplicht de authentieke gegevens uit de registraties te gebruiken. Als voorbeeld van hoe partijen deze gegevens kunnen gebruiken kan dienen het VPRO programma “Nederland van Boven" Het VPRO programma laat met boeiende datavisualisaties en prachtige luchtbeelden zien hoe de krioelende mierenhoop die Nederland heet, dag in dag uit functioneert. De aflevering van 17 januari 2012 draaide om het thema ‘wonen’. En daarbij worden o.a. gegevens van de BAG gebruikt, om te laten zien wanneer onze huizen en wijken gebouwd zijn en hoe groot de gemiddelde tuin is in een wijk. De VPRO heeft de gegevens van de BAG gebruikt om via een interactieve kaart zichtbaar te maken in welke periode een woongebied is gebouwd (bouwjaar van ieder gebouw staat in de BAG) en – in combinatie met de gegevens van de Kadastrale registratie – om de gemiddelde tuingrootte in een wijk te bepalen.
2.2
Commerciële openstelling BAG-gegevens biedt veel mogelijkheden Vanaf 1 februari 2012 zijn de gegevens uit de Basisregistraties Adressen en Gebouwen (BAG), inclusief alle postcodes, te gebruiken voor overheden en private partijen. Ook voor commerciële doeleinden. Een ontwikkeling die veel kansen en mogelijkheden biedt. Voor overheden, maar ook voor bedrijven en dienstverleners. Om gegevens te kunnen delen is de Nederlandse overheid bezig met het opzetten van het Stelsel van Basisregistraties. Door de registraties, die onder meer informatie bevatten over adressen, persoonsgegevens, bedrijfsnamen en coördinaten van Versie 1.0
Pagina: 4
Casusbeschrijving I&M
locaties, aan elkaar te koppelen kan de overheid snel over betrouwbare en actuele gegevens beschikken. Dat levert onder meer een administratieve lastenverlichting op. Zo hoeven burgers en bedrijven niet telkens opnieuw hun gegevens te verstrekken aan gemeenten, provincies en andere overheden. Bijvoorbeeld bij het aanvragen van een vergunning. Ook bespaart het stelsel kosten, aangezien gegevens op minder plekken beheerd hoeven te worden. Een van de dertien basisregistraties is de BAG, beheerd door het Kadaster. In de basisadministratie worden alle adressen in Nederland eenduidig, actueel en volledig vastgelegd. Daarnaast wordt van alle gebouwen in Nederland geregistreerd waar ze staan (coördinaten) en worden enkele gegevens vermeld, zoals gebruiksdoel, oppervlakte en bouwjaar. Tevens biedt de BAG unieke identificatienummers ("BSNnummers voor gebouwen"), waardoor het leggen van relaties met andere (basis)registraties eenvoudiger te realiseren is. Tot op heden mogen overheidspartijen alle gegevens uit de BAG (gratis) gebruiken voor hun eigen administratie. Private partijen mogen de BAG gebruiken, mits zij de postcodes niet voor commerciële doeleinden gebruiken of aan derden verstrekken. Met ingang van 1 februari 2012 komt daar verandering in. Dat heeft onder meer te maken met een wettelijke verplichting (artikel 3 van de wet BAG) om alle adres- en gebouwgegevens van Nederland die zijn opgeslagen in de BAG, inclusief postcodes, aan eenieder beschikbaar te stellen. In dat kader is begin februari 2011 door het ministerie van Infrastructuur en Milieu het postcodeconvenant met TNT Post (nu: PostNL) opgezegd. Dit past ook in het beleid van de Rijksoverheid en de Europese Commissie dat erop gericht is om overheidsinformatie op een makkelijke en goedkope wijze aan iedereen ter beschikking te stellen. Zo draagt de toegankelijkheid van overheidsinformatie er aan bij dat burgers beter in de gelegenheid worden gesteld tot participatie in de maatschappij en controle van de overheid. Verder komt de groeiende aandacht voor hergebruik van overheidsinformatie ook voort uit de potentiële economische waarde. In verschillende landen zijn studies gedaan om de maatschappelijke kosten en baten van Open data in beeld te brengen. In deze studies wordt de waarde van Open data hoog ingeschat. Volgens het ICTU liggen daar de kansen en de mogelijkheden zowel voor overheden, als met name voor bedrijven en dienstverleners namelijk in het het maken van toepassingen (apps) voor smartphones en tablet-pc's, waarbij wordt uitgegaan van de gegevens uit de BAG. Overheden zullen die apps niet maken omdat dit buiten hun taak opvatting valt. Sommige BAG-producten zijn gratis en voor andere producten hoeft slechts verstrekkingkosten te worden betaald."
2.3
Standaardisatie data (en metadata) in de samenwerking van overheidsorganisaties Om haar werk te doen, heeft de overheid gegevens nodig. Véél gegevens, vastgelegd in maar liefst 30.000 verschillende systemen, die worden gebruikt bij beleids-
Versie 1.0
Pagina: 5
Casusbeschrijving I&M
uitvoerings- en handhavingstaken. Dat moet anders. Minder versnipperd, eenvoudiger. Daarvoor zijn er de basisregistraties. Steeds alle informatie die bij elkaar hoort op één plek vastleggen. Dat is in essentie een basisregistratie. Waar het uiteindelijk om gaat, is dat de losse basisregistraties als één logisch, samenhangend geheel gaan werken. Zodat bij het beantwoorden van een vraag of het oplossen van een probleem direct alle relevante gegevens uit verschillende registraties bij elkaar kunnen komen. Dit betekent dat het gegevens productieproces op elkaar moet worden afgestemd. Zoals in de wijze waarop de processen rondom de gegevensverwerking en het beheer van de data (bestanden) moeten worden georganiseerd, alsmede afspraken over metadatering, zodat de verschillende basisregistratie met elkaar gegevens kunnen uitwisselen. In de samenwerking van overheidsorganen in het kader van datasets van de basisregistratie wordt al op een Open data achtige wijze samengewerkt. Belangrijkste uitdagingen in het stelsel van basisregistraties zijn: 1. De BAG combineren met andere datasets 2. Eenduidig gebruik van metadata over de datasets heen 3. Het organiseren van de processen rondom de datasets (betrouwbaarheid, eenduidigheid, kwaliteit, etc.).
Belangrijk verschil zoals we dit in het stelsel hebben georganiseerd met de discussie van Open data, is dat je de processen rondom de datasets vrij laat. Met het opstellen van de BAG is de eerste stap gezet om de basisregistraties te ontsluiten voor niet-overheidsgebruikers en een concrete implementatie van het Open data gedachtegoed zoals dit nu op de politieke agenda staat.
Versie 1.0
Pagina: 6
Casusbeschrijving I&M
3
Herbruikbaarheid
3.1
Wat zijn de verschillende soorten van formaat waarin data kan worden gepubliceerd? De formats zoals opgenomen op de ‘pas-toe-leg-uit’-lijst zijn de adequate formats waarin de overheidsdata als Open data kunnen worden gepubliceerd. Hierbij opmerkend dat per functioneel gebied c.q. toepassinggebied van Open data hierop aanvullingen noodzakelijk kunnen zijn. Dit is afhankelijk van het functioneel gebied. Hierbij wel van uitgaande dat het drie sterren volwassenheid niveau het minimale en maximale noodzakelijke is voor overheidsorganisaties die Open data aanbieden.
3.2
Wat is het beste format waarin data kunnen worden gepubliceerd? Een XML-bestand is het beste forrmat. Wat betreft hetgeen de XML Feeds dienen te bevatten is een discussie die op centraal niveau moeten worden beslecht. OWMS is een hele goed richtlijn als handreiking. Via OWMS krijgt je eenvoudige richtlijnen hoe dit moet:”Identificatie, Titel, Informatietype, Taal en Datum laatste wijziging” zijn goede verplichte eigenschappen. Uiteraard kan het zijn dat je per functioneel gebied hierop aanvullingen krijgt.
3.3
Zouden er ten behoeve van Open data nieuwe standaarden op de ‘pas toe leg uit’- lijst moeten worden opgenomen? Het moet een dynamische lijst zijn waarbij steeds wordt aangesloten bij de meest gangbare standaarden. De lijst is nu vrij algemeen. Wellicht dat per functioneel gebied c.q. toepassingsgebied een deellijst moet komen. De lijst is op dit moment adequaat genoeg voor het realiseren van drie sterren.
Versie 1.0
Pagina: 7
Casusbeschrijving I&M
4
Vindbaarheid
4.1
Wat zijn de verschillende mogelijkheden om data te vinden? De BAG wordt nu gevonden via de bronhouders of via google.nl. Een landelijke portaal waarin op een centraal punt alle Open data kunnen worden geworden gevonden is aan te bevelen. Leerervaring en kritieke succesfactor vanuit het stelsel van basisregistraties is een landelijke voorziening. Een centraal aanspreekpunt c.q. benaderingspunt voor zowel het beheer als mede de distributie van de datasets. Data.overheid.nl kan deze functie gaan vervullen. De wijze waarop de samenwerking gaat plaatsvinden met de verschillende aanbieders van Open data kan technisch gezien op verschillende wijzen worden ingevuld.
4.2
Op welke wijze i.c. organisatorisch, technisch en procedureel wordt gewaarborgd dat data gevonden worden? Overheidsorganisatie en zeker overheidsorganisaties met administratieve processen zijn op dit moment nog niet ingericht om Open data te publiceren. Dit betreft het proces waarin tot Open data wordt gekomen. Dit betekent dat in het proces van creatie van Open data de procedures hiervoor moeten worden opgenomen. Het technisch ontsluiten van Open data is niet het probleem, maar de processen op dusdanige wijze inrichten dat vanaf de bron in het proces de creatie van de Open data wordt gerealiseerd. Dit betekent dat er richtlijnen moeten komen over bijvoorbeeld te hanteren standaarden en eisen met betrekking tot de metadata. Dit kan alleen worden gerealiseerd als op een centraal punt hierover een beslissing wordt genomen. Het daadwerkelijk vinden van de Open data kan worden bevorderd door te komen tot een portaal waarin alle Open data zijn geregistreerd op een uniforme wijze.
Versie 1.0
Pagina: 8
Casusbeschrijving I&M
5
De wijze waarop de ontsluiting / infrastructuur wordt ingericht
5.1
Welke systematiek wordt gehanteerd om data te publiceren? Technisch gezien is het niet lastig om data als Open data te publiceren. Dat is binnen de BAG een relatief eenvoudige procedure. De uitdaging ligt er in om de processen die leiden tot Open data dusdanig in te richten en te standaardiseren dat vanaf ‘front-inpipe’ van het creatieproces rekening wordt gehouden met de vereisten ‘end-in-pipe’ . Dan is het een relatief eenvoudig handeling om de data te publiceren.
5.2
Met welke systematiek wordt data op een effectieve en efficiënte wijze gepubliceerd? De bronhouders zijn verantwoordelijk voor het creatieproces van Open data. Via een centrale actor in de situatie van de BAG moeten de data dan worden gepubliceerd als Open data. De centrale actor is verantwoordelijk voor de organisatie van de processen met betrekking tot de creatie van Open data en het formuleren van vereisten, standaarden en kwaliteitseisen.
Versie 1.0
Pagina: 9
Casusbeschrijving I&M
6
Relevante ontwikkelingen binnen de EU-beleidskaders
6.1
Wat zijn de relevante ontwikkelingen binnen de EU-beleidskaders? Op Europees niveau uitwisseling van de Open data. Grenzen zullen vervangen en datasets zullen over de grenzen heen worden gecombineerd. Dit betekent informatie delen en het komen tot Europese standaarden en informatiemodellen die hierop aansluiten. Als voorbeeld hiervoor kan dienen het BSN nummer en BAG Open data.
6.2
Wat betekent dit voor de huidige praktijk? Voor wat betreft basisregistraties, er komt meer druk op om de data open te maken. De kvk heeft het moeilijk, omdat die niet mag doen wat de markt mag. Dus zij mogen steeds minder data openbaar maken. Wat je ziet is de ontwikkeling dat we binnen de overheid al werken met de principes van Open data en dat we nu de datasets buiten de overheid beschikbaar gaan stellen. Met andere woorden dat we stap verder gaan. Technisch gezien allemaal niet het probleem. Maar uitdagingen liggen wel op het gebied van privacy en juridische aspecten.
Versie 1.0
Pagina: 10
Casusbeschrijving I&M
7
Lessons learned webrichtlijnen
7.1
Wat zijn de effecten hiervan op het publiceren, vinden en te hanteren systematiek op korte en langere termijn? Niet van toepassing.
7.2
Zijn de ontwikkeling op het gebied van webrichtlijnen vergelijkbaar met de ontwikkeling bij opendata en standaarden? Het is vergelijkbaar in termen van proces. Inhoudelijk echter niet. De discussie van webrichtlijnen was een doel-middelen discussie. Dit is niet het geval bij Open data. Het doel is hier nog niet duidelijk. Er is een noodzaak maar nog geen duidelijk doel. Dit doel zal er pas komen als het beleidsterrein wordt geïnstitutionaliseerd met een duidelijke politieke lobby.
7.3
Welke lessen kunnen worden meegenomen vanuit webrichtlijnen? 1. Er moeten een hoger doel komen voor Open data, dat is er nu nog niet, behalve dat het moet. 2. Zorg dat je in het proces van de creatie van de Open data al weet wat de vereisten zijn die verderop in de keten worden gesteld en baseer daarop je Open data beleid. 3. Borg de procesvereisten in het proces van creatie. In het proces van creatie moeten die eisen op een eenvoudige wijze in het proces worden geborgd. 4. Zorg dat er voor Open data een eigenaar komt en een lobby die druk kan uitoefen. Met andere woorden organiseer het beleidsterrein. 5. Heb een lange adem in het implementeren van de standaarden (een jaar of 8). 6. Sluit aan bij de best practices (niet alles van de grond af aan ontwikkelen).
Versie 1.0
Pagina: 11
Casusbeschrijving I&M
Bijlage beantwoording Factfindingsvragen Nr. A.
Factfindingsvragen Herbruikbaarheid
A01.
Op welke wijze ziet u de vraag- en aanbodketen van Open data?
Antwoord
Belangrijk uitgangspunt in het praten over Open data is de hantering van het volgende onderscheid. Je hebt Data, Informatie en Kennis. Het verschil tussen de begrippen is dat data de ruwe gegevens betreft. De ruwe data gezet in een context (door een overheidsorganisatie) is informatie en kennis is de verrijking die door een afnemer of hergebruiker wordt geleverd. Dit principe moet je toepassen op de (objectgebaseerde) waardeketen van de BAG. De waardeketen ziet er als volgt uit:
De bronhouders verzamelen data en gebruiken deze voor eigen processen. Dit gebeurd op basis van Voorgeschreven standaarden en informatiemodellen. Vanaf de bronhouders volgt export van data naar de landelijke voorziening. Dit gebeurt via standaarden/protocollen, deze zijn vrij technisch. De bronhouders krijgen via de inkijkvoorziening toegang tot de database voor hun interne processen. Gebruikers c.q. afnemers van de database zijn dataverwerkers zoals o.a. Belastingdienst, UWV, KvK, en planbureaus. De dataverwerkers bieden vervolgens weer kennis aan bij derde partijen. Je ziet in deze waardeketen de ontwikkeling van de data naar informatie en kennis. Bronhouders verzamelen de data. De landelijke voorziening plaats deze in een context en vervolgens wordt er door gebruikersinformatie van gemaakt. Gebruikers van BAG kunnen verschillende twee verschillende soorten dataset afnemen (via een abonnementstelsel gebaseerd op gebruikerskosten) namelijk een extract van de gehele database in de vorm van een XML bestand (datadump i.c. 19 ½ gigabid) of een compact deel van de database (extract van ruwe data). Zo’n datadump stelt wel eisen aan de wijze waarop een gebruiker zijn ICT heeft ingericht. BAG light is een compacte versie van BAG die gemakkelijker is in het gebruik en minder technische eisen stelt aan de ICT bij de gebruiker. Mutatiebestanden zijn XML. Je kunt een inkijk in de webvoorziening hebben, als je maar één ding nodig hebt. Webservicedienst draait bij het kadaster.
In de discussie van Open data is het van belang om je te realiseren dat hergebruikers, gebruikers en afnemers de overheidsdata in een context (definitie gegevens, populatie, duiding gegevens, etc.) moeten hebben. De ruwe data zegt hen niks. Als overheidsorganisatie moeten we die context toevoegen aan de ruwe data. Het maken van kennis kan dan gebeuren door gebruikers. Je zou het kunnen vergelijken met wetteksten. Een gebruiker zegt een documenten met willekeurige wetsartikelen niks. Wetsartikelen in de goede volgorde geeft context aan de gebruikers. Die kan er dan kennis ervan maken. Innovatie zit hem erin dat een ruwe data in een bepaalde context in een nieuwe context worden geplaatst of dat de dataset met een andere dataset wordt gecombineerd waardoor kennis ontstaat. Het is niet de verantwoordelijkheid van de overheid om dit te doen. Dit moet de markt doen. Kortom Open data is data (geplaatst in een content) waar iedereen altijd alles mee mag doen, zonder (technische) beperking. Dit is de meest pure vorm. Open data is niet meer dan de grondstof. Het cement is wat je er verder mee doet. A02.
Versie 1.0
Welke beleid hanteert u met betrekking tot tot opendata en Standaarden?
Pagina: 12
Casusbeschrijving I&M
Antwoord
A03. Antwoord
A04. Antwoord
A05. Antwoord
A06.
Versie 1.0
De BAG valt onder het regime stelsel van basisregistratie. Voor de duidelijkheid. Binnen het stelsel kennen we twee soorten van klanten. Klanten binnen het stelsel en klanten buiten het stelsel. Uitgangspunt in dit stelsel is open,……tenzij!. Zowel intern als extern. Intern zijn we al ver gevorderd. We hebben de grondstoffen winning gestandaardiseerd en hebben de verschillende datasets in termen van definities en metadata geüniformeerd. We gaan dan ook binnen het stelsel voor maximale herbruikbaarheid en willen nu de stap zetten naar gebruikers buiten het stelsel. Dit zou een kleine stap moeten zijn omdat we binnen het stelsel al veel hebben geregeld. Het enige verschil tussen binnen het buiten het stelsel zijn de organisatorische processen rondom de datasets en mogelijke juridische/privacy gevoelige onderwerpen. Technische gezien kunnen we zowel gebruikers binnen en buiten het stelsel bedienen. De BAG is de eerste stap naar klanten buiten het stelsel. Wat zijn de toekomstige uitdagingen voor de vraag- en aanbodketen van Open data? Binnen het stelsel het verbinden van de datasets en meer datasets toevoegen aan het stelsel. Buiten het stelsel is dat heel anders. 1. Er is nooit echt goed nagedacht over wat de indirecte gebruikers (gebruikers III) aan eisen stellen aan de datasets. Dit omdat we vanuit het stelsel nooit contact met hen hebben gehad (weten eigenlijk niet wie het zijn). Nu we de BAG hebben vrijgegeven kregen we bijvoorbeeld een vraag van de koepelorganisatie van Dakdekkers, zij wilde weten hoeveel daken (in aantallen en vierkante meters) er in Nederland zijn (per regio). Hierover hebben we nooit eerder nagedacht. Dat gaan nu doen. 2. Moeten wij dit ovelreg gaan organiseren en welke rol hebben wij als overheid dan in dit overleg? 3. Waar zijn de Open data wel of niet voor bedoeld en hoever gaan Open data? 4. Binnen de BAG hebben we ons met name voor wat betreft Open data gericht op de administratieve processen bij overheidsorganisaties en de wijze waarop we deze moeten ontsluiten (XML). WE hebben ook nog data vanuit GEO processen. De vraag is met welke standaarden wij deze gaan ontsluiten? Het is voor dus van belang dat we een beter zicht op de gehele keten krijgen en inzicht krijgen in de eisen en wensen van onze indirecte gebruikers met hierbij de stelregel dat we ruwe data leveren in een context we maken er geen kennis van. Dat moet de Koepel van Dakdekkers zelfs doen. Wat kan naar u mening een classificatiemodel, zoals het 5 sterrenniveau model van TBL in de praktijk voor de overheid betekenen voor formaatkeuze en groei naar verbeterde interoperabiliteit? Model is vaag bekend. Op zich wel een goed model om over de zelfde dingen te praten en hieraan betekenis te geven. Voor wat de het stelsel van basisregistraties en de gebruikers binnen het stelsel zitten we op 5 sterren. Zo ver zijn we al. We hebben daar al linked data (datasets zijn daar gecombineerd, zie bijvoorbeeld het GBA/BIG data). Maar dit is dus voor overheidsorganisaties binnen het stelsel. Voor gebruikers buiten het stelsel komen we aan drie sterren. De basisregistraties zitten dan op een niveau van drie sterren. Voor wat betreft deze gebruikers willen we geen 5 sterren (linked data) en willen we ook niet komen. Dit gaat namelijk in tegen de taken en verantwoordelijkheden van overheidsorganisaties. Overheidsorganisaties zijn niet in het leven geroepen om de organisatie van de linked data in een functioneel gebied op zich te nemen. Dat is toch echt de verantwoordelijkheid van de markt. Wat zijn de alternatieven voor het 5 sterrenniveau model en/of op welke punten is aanscherping nodig. Ken geen ander model wat vergelijkbaar is aan het sterrenmodel in termen van een gemeenschappelijk begrippenkader en volwassenheid in Open data. Wel kennen overheidsorganisaties wettelijke verplichtingen die worden meegenomen in de processen van dataverzameling. Authentieke data is wettelijk geborgde kwaliteit, dit is voor de overheid het maximaal haalbare niveau. Dit kan je vergelijken met de het vijf sterren model. Deze verplichten stellen namelijk ook eisen aan de interne procesgang en datasets van een overheidsorganisatie. Naast de basisregistraties is er data die niet onder dat wettelijke regime valt. Binnen de overheid is het stelsel van basisregistraties het hoogst haalbare op het gebied van volwassenheid in termen van het sterrenmodel. Voor gebruikers buiten de overheid is de overheid niet verplicht om de markt te organiseren voor linked data. Welke voor overheden relevante standaarden zijn te onderkennen? Is dit een subset van de wettelijke, gangbare en pas toe leg uit standaarden of zijn er nog standaarden belangrijk buiten deze set?
Pagina: 13
Casusbeschrijving I&M
Antwoord
A10.
We werken volledig met de lijst van BFS of te wel de ‘pas toe leg uit’-lijst. Gegeven het feit dat we ons richten met de BAG op administratieve processen bij de overheid sluiten we qua standaarden aan bij de gangbare en breed toepasbare standaarden voor deze processen. XML is hier de standaard. We hanteren binnen het stelsel nog geen standaard voor geo-processen. Daar moeten we wel naar toe. Als je kijkt naar de ‘pas-toe-leg-uit’ lijst zijn de Geo-standaarden onduidelijk. Dit zou men als BFS kunnen verbeteren. Gegeven het volwassenheidsniveau van het stelsel is het in het kader van deze lijst en handleidng wellicht handig als wordt gekeken naar de (technische) standaarden zoals wij die binnen het stelsel hanteren. Je zou de lijst hierop kunnen baseren. Het is van belang dat er een duidelijke lijst komt. Wellicht moet je over lijsten praten namelijk een lijst per toepassingsgebied zoals bijvoorbeeld een lijst voor administratieve processen, beleidsprocessen en geo-processen. Daarnaast moeten het dynamische lijsten zijn want je moet steeds aansluiten bij de gangbare standaarden binnen een functioneel domein. Dat kan per domein veranderen. Ik weet dat het BSF nu werkt aan een erkenningsproces voor basisvoorzieningen. Wellicht een idee om een procedure op te stellen voor standaarden per toepassingsgebied. Binnen gemeenten is er een stuff lijst. Wat is het huidig niveau (“ist”), hoe zou een volgende stap (“soll”) eruit zien, en hoe kan deze stap worden gezet? Voor wat betreft de BAG en het Stelsel van basisregistraties hebben we een aantal uitdagingen binnen het stelsel, maar dit hou je altijd. IST in het stelsel zijn de vijf sterren. IST buiten het stelsel zijn de drie sterren. Een Soll zou zijn het toepassen van de visie op basisregistraties in andere toepassinggebieden en meer zicht krijgen op de keten. Qua volwassenheidsniveau, de visie op de basisregistratie is er. Dat kan op meer niveaus toegepast worden, daarvoor is doorontwikkeling nodig. Technisch gezien staan we hier ook niet voor grote uitdagingen. De wijze waarop we technisch de datasets ontsluiten hebben goed voor elkaar op basis van jarenlange ervaring. Voor Open data (gebruikers buiten het stelsel) is het de uitdaging het drie sterrenniveau. De uitdaging zit niet in de techniek maar in het leren kennen van de keten en inzicht krijgen de wensen van de indirecte gebruikers. De soll situatie hierbij is de “pas-toe-leg-uit”- lijst en dan aangevuld met Geostandaarden. Wel moet een politiek discussie worden gevoerd over wat is de overheidstaak bij Open data. Is dat data, informatie of kennis. Daarnaast is het een overheidstaak om tot 5 sterren te komen. Als overheidsorganisaties verspreiden we data geen links. Op basis van onze ervaringen met de basisregistratie bij gebruikers bij overheidsorganisaties is het technisch niet moeilijk om te voorzien in Open data. Technisch gezien sluiten we aan bij de gangbare technische standaarden. Wanneer is welke standaard geschikt (niveaus en bepalende factoren/criteria in keuzemodel)? Bijvoorbeeld: Welke standaard van de bovengenoemde set is het meest geschikt voor een bepaald domein ook in relatie tot de hergebruikers. XML, is drie sterren, gemetadateerd en gestructureerd en machine readable. Het basisniveau is de meest haalbare toepasbaarheid. Deze toepasbaarheid mogelijk maken en ondersteunen. Wat betekenen deze niveaus (en bijbehorende standaarden) voor aanbieders en voor afnemers qua A10. voordelen/nadelen? Alls je voor de overheid drie sterren als eis neerzet en er vanuit gaat dat de je niet door wil groeien naar vijf sterren (geen overheidstaak) dan is het technisch niet zo moeilijk. Je sluit aan bij de gangbare standaarden. Wel moet je rekening houden met de hoeveelheid gigabits die je verstrekt. Dit vergt wel technische eisen aan de gebruikers kant. Als je er daarnaast van uitgaat dat het gaat om informatie (met metadatering) dan ben je vrij flexibel. De flexibiliteit heeft een voordeel en een nadeel. Voordeel is dat afnemers geen eigen systeem hoeven aan te schaffen om iets met data te kunnen doen. Nadeel is wel dat ze een eigen bewerkingsslag moeten maken. Het betekent altijd een extra stap aan de gebruikerskant. Welke praktijkvoorbeelden zijn er in Nederland van deze niveaus?
Antwoord
Stelsel van basisregistraties, GBA, BAG, straks ook BGT.
A11.
Moeten bepaalde standaarden nog worden gelokaliseerd of is de ‘pas toe leg uit’ -lijst adequaat? Welke suggesties zijn mogelijk?
Antwoord
De lijst is goed. De lijst moet aangepast worden aan nieuwe toepassingsgebieden (eventueel zouden er verschillende lijsten moeten komen per toepassingsgebied omdat per toepassingsgebied de standaarden kunnen verschillen). Daarnaast moet het een flexibele lijst zijn die aansluit bij de meest gangbare standaarden afgestemd op sterniveau 3. Wens is dat er nieuwe toepassingen op basis van
A07. Antwoord
A08.
Antwoord A09. Antwoord
Versie 1.0
Pagina: 14
Casusbeschrijving I&M
standaarden komen. Dit leidt hopelijk tot aanvulling van de lijst.
Versie 1.0
Pagina: 15
Casusbeschrijving I&M
B.
Vindbaarheid (hoe zorg ik dat mijn data gevonden wordt?)
B12.
Antwoord
B13. Antwoord
Versie 1.0
Welke toekomstvaste velden (metadata) kunnen gebruikt worden om duurzame vindbaarheid te bevorderen, zodat aanbieders van data deze metadata kunnen leveren bij de dataset en het opendata-register (http://data.overheid.nl/) deze kan gebruiken? Lastige vraag. Het is noodzakelijk om dataset te voorzien van metadata (context), anders zegt gebruikers het niks. Basisregistraties worden beheerd door uitvoeringsorganisaties. De taak van de organisatie zijn administratieve processen. Een deel van de data die nu gebruikt worden in deze processen wordt aangemerkt als Open data en dus het bepalen van metadata. De BAG levert de structuur en de status van de data. Het Kadaster moet zorgen voor de juiste richtlijnen voor de metadatering. Dan kunnen de gebruikers deze kaders toepassen. Dit is een nieuwe taak voor de overheid. Er zijn nog niet echt goede voorbeelden hoe dit moet. Het zou goed zijn om het voorbeeld van Kruispuntbank uit België te volgen als de wijze waarop je het kan organiseren. Kruispuntbank van Ondernemingen (KBO) is een gegevensbank aangemaakt en in beheer van de FOD Economie, K.M.O., Middenstand en Energie waarin de identificatiegegevens van ondernemingen zijn samengebracht. De KBO past in het streven van de Belgische overheid om de administratieve procedures voor ondernemingen te vereenvoudiging en tevens een efficiëntere organisatie te verkrijgen van de overheidsdiensten. Sommige gegevens van de KBO zijn voor iedereen toegankelijk met de onlinetoepassing Public Search .Daarnaast levert de KBO diensten die alleen bestemd zijn voor ondernemingen. Zo kunnen ondernemingen met Private Search hun eigen gegevens raadplegen. Ondernemingen kunnen ook sommige gegevens van andere ondernemingen opvragen voor commercieel gebruik. Voor ondernemingsloketten en overheidsdiensten zijn er afzonderlijke toegangen tot de gegevens van de KBO voorzien.
Leerervaring vanuit het stelsel van basisregistraties is dat er centrale, landelijke organisatie moet zijn die alles coördineert en waar alles te vinden is. Data.overheid.nl kan deze rol functie vervullen voor alle datasets die je kan afnemen bij de overheid. Helaas is Data.overheid.nl nu een soort van databak/verzamelbak of een kaartenbak met verschillende soorten van datasets en metadatering. Dit betekent wel dat er met de website nog wat moet gebeuren wil het deze functie kunnen vervullen. De wijze waarop de website een relatie legt met de organisaties die verantwoordelijk zijn voor de dataset moet organisatorisch en bestuurlijk worden ingevuld. Vanuit een technisch oogpunt maakt het niet uit voor welke model en inrichting je voor de website kiest. Technisch is alles mogelijk. Op dit moment vinden nieuwe gebruikers de BAG voornamelijk via ons netwerk en via google. Welke toekomstvaste velden (metadata) zijn in combinatie met andere registers relevant, zodat ook data behorend bij andere registers kunnen worden gevonden? Dit is een probleem dat Data.overheid.nl op zou moeten lossen, waar wij i.c. BAG en de andere basisregistraties ons aan zouden conformeren. Uiteraard wel binnen de kaders vanuit Europese Commissie. De keuze vanuit de Europese Commissie is leidend. De discussie over metadata is niet zo interessant, daarin in moeten gewoon keuzen worden gemaakt. Het zit hem niet in de metadata, maar in het proces er omheen, dat moet worden geregeld. Hoe ga je er op toezien dat iedereen zich
Pagina: 16
Casusbeschrijving I&M
B14. Antwoord
conformeert aan de metadata? Het beleidsterrein c.q. de het veld van overheidsaanbieders is nog niet goed georganiseerd c.q. geïnstitutionaliseerd. Daar ligt een uitdaging. Data.overheid.nl zou hierin een belangrijke rol kunnen spelen. De discussie over metadata gaat richting semantiek. Het is van belang dat Data.overheid.nl het proces gaat organiseren om hiertoe te komen en zich opwerpt als procesmoderator. Welke rol kunnen bestaande metadata-standaarden (zoals OWMS) hierbij spelen? Die mogen bekender worden. OWMS is een hele goed richtlijn handreiking. De overheid heeft de data niet gemaakt om als Open data te fungeren. Via OWMS krijgt je eenvoudige richtlijnen hoe dit moet. Identificatie, Titel, Informatietype, Taal en Datum laatste wijziging zijn verplichte eigenschappen. Dit is generiek goed. Maar op specifieke functionele gebieden zou je hierop een uitbreiding kunnen hebben. Wellicht dat je moet afspreken dat deze set gelijk staat aan twee of drie sterren. Uitdaging is om: deze vereisten voor Open data toe te passen binnen de wetten van de overheidsprocessen bij de verschillende overheidaanbieders een proces te organiseren dat ze OWMS gaan toepassen en het in de haarvaten gaat zitten bij de overheidsorganisaties. De OWMS is goed ontwikkeld bij ICTU. Voor hergebruik van data en het ontsluiten ervan is het zeker handig.
B15.
Via welke methodiek/proces kan een aanbieder de velden in het register up to date houden?
Antwoord
De uitvoering van de wettelijke taak is leidend. Overheidsorganisaties zijn niet in het leven geroepen om te voorzien in Open data, dat komt er nu bij. In het stelsel van basis registraties is het zo geregeld dat de bronhouders niet verantwoordelijk zijn om de gegevens in dataset up-to-date te houden. Dat doen de landelijke voorziening. De bronhouders zijn wel verantwoordelijk voor de data entry. Het Kadaster is hier dus voor verantwoordelijk. In het stelsel van basisregistraties organiseren we een overlegstructuur waarin we komen tot een Publicatieregime (voor stelsel van basisregistraties). Je krijgt dan een soort publicatiekalender zodat iedereen op de hoogte is van de wijzigingen die worden doorgevoerd op welk moment. Welke (meta)informatie heeft een potentiële afnemer nodig om te weten of zij de data kan hergebruiken. Actualiteit (Status, begin – einde, objecten). Vooral de toelichting op de meta informatie (context) is nodig. Zoals bijvoorbeeld waarop is bouwjaar gebaseerd. Deze informatie is belangrijk omdat dit iets zegt over de wijze waarop je de gegevens kan hergebruiken. Nu is er in de koppeling van BAG en WOZ discussie over metadatering en het maken van data. Je mist in de metadata de betekenis die aan de data is toegekend. Op welke wijze kunnen afnemers automatisch gesignaleerd worden over wijzigingen in de (metadata) velden en in de achterliggende Open data? Wijzigingen in de brongegevens krijgen de gebruikers gewoon. Die krijgen ze via mutaties mee; de wijzigingen in de data zelf. Het wijzigen van metadata duurt een jaar of twee, omdat er overleg nodig is met de stuurgroep, bronhouders en afnemers. Je kan de natuurlijk ook technische hulpmiddelen inzetten om dit te doen (RSS). Technisch zijn hiervoor allerlei oplossingen die gemakkelijk te implementeren zijn. Het is van belang dat je de processen rondom het wijzigingen van de metadata goed vormgeeft. Hoe zorg ik dat uit te faseren datasets worden gecommuniceerd?
B16. Antwoord
B17. Antwoord
B18. Antwoord
B19.
Zie antwoorden hierboven. Dit gebeurd niet bij de BAG is wettelijk een verplichting. Als het zou gebeuren dan is dit een traject van meerdere jaren zijn in overleg met heel veel partijen in de gehele keten. Welke ideeën heeft u nog meer ?
Antwoord
N.v.t.
Versie 1.0
Pagina: 17
Casusbeschrijving I&M
C.
De wijze waarop de ontsluiting / infrastructuur wordt ingericht (via welke Systematiek publiceer ik mijn data?
C20. Antwoord
C21. Antwoord
Welke technische randvoorwaarden/criteria zijn er voor de systematiek voor datapublicatie vanuit een overheidspartij? Het technische beleid voor het gebruik van de basisregistraties is op basis van een jarenlange ervaring ontwikkeld (GBA). Deze technische randvoorwaarden zijn opgesteld op basis van binnen het stelsel koppelen en delen van gegevens en datasets. Dicteren en opstellen gebeuren vanuit de uitvoer van wettelijke taken. We hanteren deze opgedane kennis en technische ervaringen ook voor Open data. De technische randvoorwaarden zoals gesteld binnen het stelsel hebben zich bewezen en werken. Het technisch realiseren van Open data is geen probleem. De uitdagingen zit in de metadata, de toegankelijkheid van de datasets en de organisatie van de processen rondom de Open data. Welke rol zou cloud-technologie hierbij kunnen spelen?
C22.
Wat wordt precies bedoeld met deze vraag. Gaat het om schaalbaarheid of dat gebruikers ook kunnen werken in de dataset. Als je kijkt binnen het stelsel dan werken de actoren als op basis van de cloud principes. De gehele technische infrastructuur is uitbesteed en makkelijk schaalbaar. Via het internet geven we de bronhouders toegang tot de dataset. Met betrekking tot de gebruikers van Open data van de BAG biedt Cloud geen toegevoegde waarden. Het kan misschien maar… Het Kadaster zal nooit met zijn datasets in de cloud gaan. Dit zal ook niet kunnen vanwege de wettelijke basis van de gegevens. Verwachting is dat het stelsel van basisregistraties en Cloud niet perse dicht bij elkaar komen. Ze zullen tegen elkaar aan schurken, maar het is voor deze soort data minder relevant. Onder welke voorwaarden kan cloud-technologie een rol spelen?
Antwoord
Zie c21.
Versie 1.0
Pagina: 18
Casusbeschrijving I&M
D.
EU-beleidskaders
D23.
Wat zijn de relevante ontwikkelingen binnen de EU-beleidskaders?
Antwoord
Voor wat betreft basisregistraties, er komt meer druk op om de data open te maken. De kvk heeft het moeilijk, omdat die niet mag doen wat de markt mag. Dus zij mogen steeds minder data openbaar maken. Voor geo informatie gebeurt het al op grote schaal. Wat je ziet is de ontwikkeling dat we binnen de overheid al werken met de principes van Open data en dat we nu de datasets buiten de overheid beschikbaar gaan stellen. Met andere woorden dat we stap verder gaan. Technisch gezien allemaal niet het probleem. Maar uitdagingen liggen wel op het gebied van privacy en juridische aspecten. Wat zijn de toekomstige EU-ontwikkelingen en hiermee verwachte beleidskaders?
D24. Antwoord
D25.
Antwoord
Versie 1.0
Op Europese niveau uitwisseling van de Open data. Grenzen zullen vervangen en datasets zullen over de grenzen heen worden gecombineerd. Dit betekent informatie delen en het komen tot Europese standaarden en informatiemodellen die hierop aansluiten. Als voorbeeld hiervoor kan dienen het BSN nummer en BAG Open data. Wat zijn de effecten hiervan op het publiceren, vinden en te hanteren systematiek op korte en langere termijn? Of op andere gebieden zoals bijvoorbeeld de realiseerbaarheid van de implementatie van deze richtlijnen binnen een organisatie? Het stelsel van basisregistraties kent interne processen, die zijn goed geborgd. Dit zijn overheidsprocessen. Op korte termijn maakt de discussie over Open data het erg complex, vanwege de semantische discussie en het aanleren van nieuwe processen door een organisatie, het komen tot een portaal. Maar op lange termijn gaan we er meer baat bij hebben. Investering in Open data voor het BAG is is nodig, maar dit levert op termijn de investering op.
Pagina: 19
Casusbeschrijving I&M
E.
Lessons learned webrichtlijnen
E26. Antwoord
Zijn de ontwikkeling op het gebied van webrichtlijnen vergelijkbaar met de ontwikkeling bij Open data en standaarden? Het is heel vergelijkbaar. Alleen is de discussie van webrichtlijnen een doel-middel discussie. Daar was een doel namelijk toegankelijkheid en de wil om overheidsinformatie aan te beiden. De discussie ging over hoe gaan we dat doen? Na een lang proces voldoen nu een tiental overheidsorganisatie aan die richtlijnen. Dat is een mager resultaat na die jaren.
E27.
Welke lessen kunnen worden meegenomen vanuit webrichtlijnen?
Antwoord
Les die je hieruit kan leren zijn: 1. Er moeten een hoger doel komen voor Open data, die is er nu nog niet behalve dat het moet. 2. Zorg dat je in het proces van de creatie van de Open data al weet wat de vereisten zijn die verder op in de keten worden gesteld en al voortijdig weet welke eisen de keten stelt en baseer daarop je Open data beleid 3. Borg de procesvereisten in het proces van creatie. In het proces van creatie moeten die eisen op een eenvoudige wijze in het proces worden geborgd. 4. Zorg dat er voor Open data een eigenaar komt en een lobby die druk kan uitoefen. Met andere woorden organiseer het beleidsterrein 5. Heb een lange adem in het implementeren van de standaarden (een jaar of 8). 6. Sluit aan bij de best practices (niet alles van de grond af aan ontwikkelen).
Versie 1.0
Pagina: 20