Casusbeschrijving CBS
2
Casusbeschrijving CBS ONDERZOEK OPEN DATA EN HET GEBRUIK VAN STANDAARDEN
Versie: 1.0 Datum: 26 maart 2012
Concept
Casusbeschrijving CBS
Inhoud 1
Inleiding
3
2
Kenmerken organisatie
4
2.1
Juridisch/organisatorisch
5
3
Herbruikbaarheid
7
3.1
Wat zijn de verschillende soorten van formaat waarin data kan worden gepubliceerd?
7
3.2
Wat is het beste format waarin data kunnen worden gepubliceerd?
7
3.3
Zouden er ten behoeve van Open data nieuwe standaarden op de ‘pas toe leg uit’- lijst moeten worden opgenomen?
7
4
Vindbaarheid
8
4.1
Wat zijn de verschillende mogelijkheden om data te vinden?
8
4.2
Op welke wijze i.c. organisatorisch, technisch en procedureel wordt gewaarborgd dat data gevonden worden?
8
5
De wijze waarop de ontsluiting / infrastructuur wordt ingericht
9
5.1
Welke systematiek wordt gehanteerd om data te publiceren?
9
5.2
Met welke systematiek wordt data op een effectief en efficiënte wijze gepubliceerd?
9
6
Relevante ontwikkelingen binnen de EU-beleidskaders
10
6.1
Wat zijn de relevante ontwikkelingen binnen de EU-beleidskaders?
10
6.2
Wat betekent dit voor de huidige praktijk?
10
6.3
Wat zijn de effecten hiervan op het publiceren, vinden en te hanteren systematiek op korte en langere termijn?
10
7
Lessons learned webrichtlijnen
11
7.1
Zijn de ontwikkeling op het gebied van webrichtlijnen vergelijkbaar met de ontwikkeling bij opendata en standaarden?
11
7.2
Welke lessen kunnen worden meegenomen vanuit webrichtlijnen?
11
Bijlage beantwoording Factfindingsvragen
Versie1.0
12
Pagina: 2
Casusbeschrijving CBS
1
Inleiding In december 2011 is Logica Business Consulting gestart met het onderzoek ‘Open data en gebruik standaarden’ in opdracht van het Forum Standaardisatie. Het onderzoek wordt uitgevoerd in een viertal fasen. Het voorliggende document heeft betrekking op de eerste fase van het onderzoek waarin de feitelijke gegevensverzameling heeft plaatsgevonden op basis van de factfindingsvragen, een documentenanalyse en het uitvoeren van een internationale benchmark. Op basis hiervan zijn per deelnemende organisatie aan het onderzoek casusbeschrijvingen gemaakt. Doel van de casusbeschrijving is het vastleggen van de feitelijke situatie per fase. Op basis van de verschillende casusbeschrijvingen wordt gekomen tot een synthese in termen van best practices en aanbevelingen. Op basis hiervan wordt de centrale onderzoeksvraag beantwoord. In deze casusbeschrijving wordt ingegaan op het CBS. De opzet van de casus beschrijving is als volgt: Hoofdstuk 2 beschrijft op hoofdlijnen de kenmerken van de betreffende organisatie/ casus Hoofdstuk 3 t/m 7 behandelen achtereenvolgens de verschillende aandachtsgebieden: herbruikbaarheid (3), vindbaarheid (4), wijze waarop de ontsluiting plaatsvindt (5), de toekomstige ontwikkelingen binnen de EUbeleidskaders (6) en tenslotte de lessons learned uit de webrichtlijnen (7). In de bijlage van deze casusbeschrijving zijn de antwoorden van de factfindingsvragen opgenomen.
Versie1.0
Pagina: 3
Casusbeschrijving CBS
2
Kenmerken organisatie Het CBS verzamelt gegevens bij personen, bedrijven en instellingen. Deze gegevensverzameling verwerkt het CBS tot statistieken over bedrijven, groepen mensen en hun omgeving. Dan gaat het bijvoorbeeld over criminaliteit, werkloosheid of het aantal baby’s dat geboren wordt. Voor het verzamelen van gegevens gebruikt het CBS twee methoden. In de eerste plaats gebruikt het CBS bestaande registraties, zoals het bevolkingsregister en de bestanden van de Kamers van Koophandel. In de tweede plaats haalt het CBS gegevens op bij alle Nederlanders door ze te interviewen – telefonisch of elektronisch – of door ze persoonlijk te bezoeken. Al sinds een aantal jaar ligt de nadruk op de eerste methode. Het gebruik van registers zorgt ervoor dat het CBS deze instellingen niet zo vaak meer hoeft te benaderen en dat verlaagt bijvoorbeeld de administratieve lastendruk. Het publicatiebeleid van het CBS is er op gebaseerd dat de werkzaamheden van het Bureau uit belastinggeld betaald worden en dat de geproduceerde statistische informatie daarom openbaar toegankelijk is. Ook artikelen en persberichten zijn voor iedereen beschikbaar. Daarbij hanteert het CBS het principe dat klanten de geleverde informatie ook zelf weer mogen publiceren. Artikelen – zoals die uit het Webmagazine – mogen worden bewerkt en herschreven. Of degene die de informatie – al of niet na bewerking – opnieuw publiceert daarbij winst nastreeft of niet, is niet de zorg van het CBS. De enige voorwaarde die het Bureau aan hergebruik van de informatie stelt, is dat de naam van het CBS genoemd moet worden. Alle statistische informatie van het CBS is via de website beschikbaar. Gebruikers hebben er toegang tot de databank StatLine, persberichten en het Webmagazine. De website (http://www.cbs.nl) en de statistische databank StatLine (http://statline.cbs.nl) zijn afzonderlijk en gratis te benaderen. Het CBS stelt ook microdata beschikbaar voor analyses. Deze mogelijkheid staat open voor onderzoeksinstituten die daarvoor zijn gemachtigd via de CBS-wet of die daarvoor toestemming hebben gekregen van de Centrale Commissie voor de Statistiek. Zij kunnen werken vanaf hun eigen werkplek via remote acces of remote execution, of on site op de vestigingen van het CBS in Den Haag en Heerlen. Er staat een groot aantal bestanden klaar waarop analyses kunnen worden uitgevoerd, onder strikte voorwaarden. Belangrijkste bron van de statische output van het CBS in termen van Open data is StatLine.
Versie1.0
Pagina: 4
Casusbeschrijving CBS
2.1
Juridisch/organisatorisch Hoewel er vanuit een ICT optiek uitdagingen zijn te definiëren met betrekking tot Open data in termen van bijvoorbeeld informatiemodellen, businessarchitectuur, etc., ligt de grootste uitdaging op de juridische en organisatorische aspecten van Open data. Onderwerpen die een grote relevantie hebben voor de verdere ontwikkeling van dit beleidsterrein kunnen zijn:
Controle op naleving licenties. Op welke wijze ga je als overheidsorganisatie de afgegeven licenties controleren en wat als die licenties niet worden nageleefd? Op welke wijze ga je handhaven? Antwoorden op deze vragen en een institutionalisering hiervan is een randvoorwaarde voor de verdere ontwikkeling van (het beleidsterrein van) Open data. Ideeën over de wijze waarop dit dient plaatst te vinden zijn nog niet uitgekristalliseerd. Je zou kunnen denken aan een toezichthouder of regulator zoals bijvoorbeeld de Dte/NMa/Opta. Je zou dan een instantie creëren die daadwerkelijk de controle gaat uitvoeren en kan toezien op de handhaving ervan.
Controle op juist gebruik c.q. interpretatie van (meta)data. Zeker vanuit de vijf sterrengedachte is het van belang dat er controle op het juiste gebruik van de (meta)data plaatsvindt. Er moet iets of wat zijn die vanuit een centrale rol de regie hierop houdt. De vraag is natuurlijk of de overheid c.q. de overheidsorganisaties verantwoordelijk moeten zijn voor metadata of dat de markt dit moet op pakken. Ondersteuning bij de interpretatie van de Open data. Heeft de overheidsaanbieder wel of niet een rol in het correct gebruik van de data? Neem het CBS. Het CBS wil naast alleen dataleverancier (datafabriek) ook helpen bij het correcte gebruik van data. Dit enerzijds vanuit zorgvuldigheid met betrekking tot de dataset maar ook om de dataset voor een grotere publiek toegankelijk en begrijpbaar te maken (dit kan je zien als een overheidstaak). Dat zie je bij het CBS terug in de doelgroep aanpak. Oftewel:het aanpassen aan de taal van de doelgroep. Dit betekent dat je naast de metadata ook voorziet in een andere dienst als overheidsaanbieder. Indien dit het geval is dan is er waarschijnlijk technische en organisatorische
Versie1.0
Pagina: 5
Casusbeschrijving CBS
ondersteuning nodig bij de verschillende datasets die je aanbied, zeker in het begin. Indien je deze service ook aanbied dan zullen overheidsorganisatie, in tijden van bezuiniging, personele capaciteit en middelen moeten inzetten om dit te realiseren.
Versie1.0
Pagina: 6
Casusbeschrijving CBS
3
Herbruikbaarheid
3.1
Wat zijn de verschillende soorten van formaat waarin data kan worden gepubliceerd? Dit is afhankelijk van de aard van het toepassingsgebeid. Voor wat betreft het CBS en ons productieproces hanteren wij:
3.2
Wat is het beste format waarin data kunnen worden gepubliceerd? CSV, Excel, SPSS, Html.
3.3
Zouden er ten behoeve van Open data nieuwe standaarden op de ‘pas toe leg uit’- lijst moeten worden opgenomen? Dit moet per domein c.q. toepassingsgebied worden bekeken. Voor wat betreft het CBS i.c. STAT LINE voldoet de lijst op dit moment.
Versie1.0
Pagina: 7
Casusbeschrijving CBS
4
Vindbaarheid
4.1
Wat zijn de verschillende mogelijkheden om data te vinden? Gebruikers, afnemers kunnen gewoon gebruik maken van Google. Belangrijk is wel dat de er een centraal punt komt waarin hergebruikers en afnemers zicht krijgen op de verschillende datasets die er zijn en zorg draagt voor uniformering van de metadata. Los van over welke velden het gaat, lijkt het een onbegonnen zaak alle dataleveranciers dezelfde classificatie te laten aanhouden. De portal dient dus een intelligent zoekmechanisme te hebben dat synoniemen, homoniemen en semantische verbanden herkent. Zie: semantische zoekmachine Logius/BD. Zou ook kunnen werken zoals Google, door zoektermen te definiëren en op basis daarvan wordt het aanbod dan vastgesteld. De broninformatie moet in de metadata zitten: waarover gaat het, welke periode, wat is de populatie, welke dimensies? Er moet wel realtime toegang tot de metadata zijn, anders is de data niet vindbaar. Het is het handigst om de data te dupliceren bij de portal en met de kopieën te werken. De data in de portal moet dan wel up to date gehouden worden.
4.2
Op welke wijze i.c. organisatorisch, technisch en procedureel wordt gewaarborgd dat data gevonden worden? Dit is het productieproces bij het CBS. Dat is op een dusdanige wijze ingericht dat vanaf het begin tot het einde, het opleveren van de output set wordt voorzien in de juiste organisatorische en procedure maatregelen. Wat betreft is het bij het CBS het gehele productieproces ingericht als een keten. Waarbij in het begin van het proces eisen worden gesteld die achterin het proces pas relevant worden.
Versie1.0
Pagina: 8
Casusbeschrijving CBS
5
De wijze waarop de ontsluiting / infrastructuur wordt ingericht
5.1
Welke systematiek wordt gehanteerd om data te publiceren? Technische gezien is ons interne productieproces ingericht met de juiste technische ondersteuning. Technisch gezien is ons hele proces ingericht op het publiceren in STAT LINE. Technische problemen om Open data te publiceren hebben we niet. Wel liggen er uitdagingen in ICT met betrekking tot informatiemodellen, businessarchitectuur, het aanbrengen van koppelingen tussen datasets etc. Maar dit is een fase verder dan alleen het publiceren van Open data.
5.2
Met welke systematiek wordt data op een effectief en efficiënte wijze gepubliceerd? Zie ons interne productie proces.
Versie1.0
Pagina: 9
Casusbeschrijving CBS
6
Relevante ontwikkelingen binnen de EU-beleidskaders
6.1
Wat zijn de relevante ontwikkelingen binnen de EU-beleidskaders? Vooral het creëren van bewustzijn, voorwaarden scheppen doormiddel van richtlijnen en standaarden.
6.2
Wat betekent dit voor de huidige praktijk? Is lastig om dit heel concreet te benoemen.
6.3
Wat zijn de effecten hiervan op het publiceren, vinden en te hanteren systematiek op korte en langere termijn? Technisch gezien niet veel. Zal voornamelijk gaan over de wijze waarop de metadata worden vormgegeven en de wijze waarop datasets vanuit verschillende landen met elkaar kunnen worden gecombineerd. Kortom over de processen rondom een dataset.
Versie1.0
Pagina: 10
Casusbeschrijving CBS
7
Lessons learned webrichtlijnen
7.1
Zijn de ontwikkeling op het gebied van webrichtlijnen vergelijkbaar met de ontwikkeling bij opendata en standaarden? Er is een wezenlijk verschil tussen deze twee ontwikkelingen. Open dat gaat over system to system. Webrichtlijnen gaat over de vorming van een interface tussen machine en mens. Dit neemt niet weg dat er geen lessen toepasbaar zijn.
7.2
Welke lessen kunnen worden meegenomen vanuit webrichtlijnen? W3C en de manier waarop standaarden tot stand komen gaat langzaam en is een moeizame weg. Er zijn al wel veel standaarden, dus het is raadzaam om niet allemaal nieuwe standaarden uit te vinden, maar om de juiste te selecteren. Maar wees selectief hierin. Op de pas-toe-leg-uit vragenlijst staan standaarden die te domein specifiek geformuleerd zijn, bijvoorbeeld de stuff standaard. Je hebt of een generieke lijst of een domein specifieke lijst. Maar nu is de lijst van alles wat.
Versie1.0
Pagina: 11
Casusbeschrijving CBS
Bijlage beantwoording Factfindingsvragen Nr. A.
Factfindingsvragen Herbruikbaarheid
A01. Antwoord
A02. Antwoord
A03. Antwoord
Op welke wijze ziet u de vraag- en aanbodketen van Open data? CBS ziet Open data (vooralsnog) beperkt tot haar statistische producten (content Statline). Zgn. “duidingen” (webartikelen, persberichten, etc), methodologische verhandelingen en transparantie over bedrijfsvoering ihkv WOB worden daarmee uitgesloten. Vanuit haar programma zal de productportfolio voornamelijk aanbod-gestuurd zijn, zoals dat ook voor Statline het geval is. Dit is een standaardproces binnen CBS, wat niet zal wijzigen. Wellicht alleen het technische formaat waarin data gepubliceerd wordt. Afnemers zijn brokers en softwareleveranciers. Brokers doen echt bewerkingsslagen over de data. Softwareleveranciers bouwen bijvoorbeeld een app of tool die toegang geeft tot statline. Een voorbeeld van een hergebruiker is Funda. Zij gebruiken statistische informatie ter ondersteuning. Om webartikelen en datasets in één keer binnen te kunnen halen (door afnemer) is er nog veel te doen. Op basis van de WOB zou de bedrijfsvoering van CBS ook onder Open data vallen, dit is voorlopig uitgesloten. CBS zal voornamelijk aanbod gestuurd werken in de keten. Het werkprogramma van het CBS wordt vastgesteld door de Centrale Commissie voor de Statistiek. Het CBS is verantwoordelijk voor de communautaire statistieke in Nederland Dit is het grootste deel van het werkprogramma. Het CBS probeert meer op de actualiteit in te spelen op basis van de gegevens die al binnen zijn. Dus met een andere bril naar de bestaande data kijken. Als data open wordt, dan kunnen de gebruikers dat zelf doen. Intern is hier veel effort in gestopt, maar dit is meer iets van de markt. Bij interpretatie gaat wel veel mis, als je geen inhoudelijke kennis hebt. Welke beleid hanteert u met betrekking tot tot opendata en Standaarden? Qua materiaal is de content van Statline publieke informatie. Handmatig te doorzoeken en te downloaden in excel of csv formaat, echter nog niet machinaal doorzoekbaar of opvraagbaar. Data bij CBS is open, tenzij. Dit is het uitgangspunt. Er zijn twee waarnemingen soorten te onderscheiden. De primaire waarneming, die data haal je direct op bij de bron (de respondent: een individu of bedrijf). Deze informatie is per definitie gevoelig. Secundaire waarneming gaat om het gebruiken van data die al door anderen gebruikt zijn. Bijv. in de basisregistraties. Maar ook deze data is herleidbaar naar de bron. Deze privacygevoelige informatie zou er ook uit moeten. Het beleid hiervoor wordt dit jaar geschreven. CBS is nu bezig met de eerste stappen. We zien het als een leerproces, waar we voorzichtig mee moeten zijn. Langzamerhand zal er meer ter beschikking worden gesteld. Vanuit de politiek zal er ook meer druk op komen. Wat zijn de toekomstige uitdagingen voor de vraag- en aanbodketen van Open data? Opstellen beleid en strategie voor Open Data (2012). Organisatorisch en technisch inrichten van mechanisme voor het “klaarzetten” van databestanden, inclusief correcte metadata, zonder toename van beheerslast. Kwaliteit van data en metadata moet worden verbeterd vwb de onderlinge samenhang van de verschillende tabellen (bestanden). 1. 2. 3. 4.
5.
A04.
Versie1.0
Het formuleren van beleid en strategie. Het organisatorisch vormgeven van het mechanisme. De kwaliteit van de metadata als zodanig. Technisch gezien zou het op een andere manier moeten kunnen dan statline. Dit is een korte termijn oplossing. Er moet gezocht worden naar een lange termijn oplossing. Hierbij wordt met een schuin ook gekeken naar het portaal van OCW. Een andere uitdaging: in hoeverre moet metadata toegeschreven worden aan de gebruiker? De wens is om dit doelgroepengericht aan te pakken (maar er wordt nu nog niks mee gedaan). Een voorbeeld: CBS levert data aan HBO’s (onderwijs). Maar er is waarschijnlijk een andere taal nodig als je tabellen aanlevert aan het basisonderwijs. Zelfde geldt voor Engelse data: vertaling aan de markt overlaten? Want het is veel werk. Dit zou bijvoorbeeld vergemakkelijkt kunnen worden door vocabulaire vast te leggen en in een tabel te publiceren. Dan hoef je alleen maar de definitie te linken.
Wat kan naar u mening een classificatiemodel, zoals het 5 sterrenniveau model van TBL in de praktijk voor
Pagina: 12
Casusbeschrijving CBS
de overheid betekenen voor formaatkeuze en groei naar verbeterde interoperabiliteit? Antwoord
A05. Antwoord
A06. Antwoord
A07. Antwoord
A08.
Antwoord
A09. Antwoord
A10. Antwoord
A11.
Versie1.0
Er lijkt een minimaal niveau nodig te zijn om Open data echt nieuwe toepassingen te laten krijgen. Anders blijft het op het huidige niveau van handmatig “browsen”. Men moet minimaal op 3 sterren niveau zitten. Wat betreft 5 sterren, moet je zover gaan? Het leuke is juist dat data van het CBS en data van een andere partij gelinkt kunnen worden. Dat gaat CBS niet doen, maar zou iets voor de markt kunnen zijn. Wat zijn de alternatieven voor het 5 sterrenniveau model en/of op welke punten is aanscherping nodig. Vindbaarheid, begrijpelijkheid en (geautomatiseerde) toepasbaarheid zijn sleutelwoorden. Applicatiebouwers en informatiebrokers zullen alleen willen investeren als de dataleverantie over langere tijd stabiel gegarandeerd is. Niveau 3: Metadata en een machinaal verwerkbaar dataformaat. Niveau 5 (data linking) rekenen wij als “datamining” vooral tot de taak van de afnemers. Welke voor overheden relevante standaarden zijn te onderkennen? Is dit een subset van de wettelijke, gangbare en pas toe leg uit standaarden of zijn er nog standaarden belangrijk buiten deze set? Zie voorgaande. Standaarden uit de bestaande lijst zijn onvoldoende, specifieke standaarden voor deze toepassing zijn (brood)nodig. O.a. keuze tussen terbeschikkingstelling via REST-ful dan wel webservice. Standaarden hebben niet direct met Open data te maken. Het is geen user interface, maar een machine interface. Een deel is op het niveau van semantische domeinen. De pas toe leg uit lijst is een ratjetoe. De uitdaging zit in de samenhang, een samenhang die over de domeinen heen gaat. Ik denk daarbij meer aan Dublin Core, maar dat is dan weer te globaal. Een goed voorbeeld is er in mijn ogen nog niet. Op het niveau van de data zelf zijn er wel mogelijke kandidaten. Eurostat gaat sdmx wettelijk opleggen. Maar bij sdmx wordt metadata met de data mee geleverd. Dit heeft tot gevolg dat het erg grote bestanden worden. Ik denk niet dat dit heel efficiënt is. Misschien moeten we kijken naar dspl van google, want daar gaat Open data naar toe. Metadata staat dan in xml en data is csv bestanden. Brokers nemen vaker data af. Maar als de metadata vaststaan, dan heb je die maar één keer nodig. Wat is het huidig niveau (“ist”), hoe zou een volgende stap (“soll”) eruit zien, en hoe kan deze stap worden gezet? Gezamenlijk een eerste stap mbt standaarden en richtlijnen, dan geleidelijk het volume aan beschikbare data vergroten. Nu direct de sluizen openzetten leidt onherroepelijk tot verspilling en teleurstelling. Het CBS zit op drie sterren niveau. Voor de eigen data zouden we eventueel tot 5 sterren moeten gaan. Van de ist naar soll is een geleidelijk leerproces. Maar het is vooral belangrijk dat er standaarden komen, dat maakt de boel efficiënter. Als we nu de boel open zouden gooien, dan zouden we onszelf en de afnemer teleurstellen. Verwachtingsmanagement over de kwaliteit ed. duidelijk maken is belangrijk. Wat is het en wat is het vooral niet? Wanneer is welke standaard geschikt (niveaus en bepalende factoren/criteria in keuzemodel)? Bijvoorbeeld: Welke standaard van de bovengenoemde set is het meest geschikt voor een bepaald domein ook in relatie tot de hergebruikers. Als je een standaard kiest, moet je daaraan voldoen. Als je naar een hoger niveau gaat, dan kan ik me voorstellen dat je aan meer standaarden moet voldoen. Niet dat je perse aan een heel andere standaard moet voldoen. Wat betekenen deze niveaus (en bijbehorende standaarden) voor aanbieders en voor afnemers qua A10. voordelen/nadelen? DSPL (van google) zou een handige zijn. Vooral om te visualiseren. Technische implicaties voor de afnemers. Het is onhandig als het niveau hoger wordt, dat je aan een andere standaard moet voldoen. Voor de afnemers wordt het duidelijker en makkelijker als vastgesteld is aan welke (meer) standaarden je moet voldoen. Per niveau heb je dan een betere kwaliteit (aspecten als betrouwbaarheid ed.). Voor de aanbieder wordt dat juist weer lastiger, want die moet meer doen. Welke praktijkvoorbeelden zijn er in Nederland van deze niveaus? Voorbeelden van 3 sterren niveau. 1. Data.overheid.nl. 2. Geo standaarden. Moeten bepaalde standaarden nog worden gelokaliseerd of is de ‘pas toe leg uit’ -lijst adequaat? Welke suggesties zijn mogelijk?
Pagina: 13
Casusbeschrijving CBS
Antwoord
B.
Wat wordt bedoeld met “gelokaliseerd”? Gevonden resp. aangepast aan de lokale omstandigheden? Zie verder voorgaande.
Vindbaarheid (hoe zorg ik dat mijn data gevonden wordt?)
B12.
Antwoord
B13. Antwoord
B14. Antwoord
B15. Antwoord
B16. Antwoord
Welke toekomstvaste velden (metadata) kunnen gebruikt worden om duurzame vindbaarheid te bevorderen, zodat aanbieders van data deze metadata kunnen leveren bij de dataset en het opendata-register (http://data.overheid.nl/) deze kan gebruiken? Los van over welke velden het gaat, lijkt het een onbegonnen zaak alle dataleveranciers dezelfde classificatie te laten aanhouden. De portal dient dus een intelligent zoekmechanisme te hebben dat synoniemen, homoniemen en semantische verbanden herkent. Zie: semantische zoekmachine Logius/BD. Zou ook kunnen werken zoals Google, door zoektermen te definiëren en op basis daarvan wordt het aanbod dan vastgesteld. De broninformatie moet in de metadata zitten: waarover gaat het, welke periode, wat is de populatie, welke dimensies? Er moet wel realtime toegang tot de metadata zijn, anders is de data niet vindbaar. Het is het handigst om de data te dupliceren bij de portal en met de kopieën te werken. De data in de portal moet dan wel up to date gehouden worden. Welke toekomstvaste velden (metadata) zijn in combinatie met andere registers relevant, zodat ook data behorend bij andere registers kunnen worden gevonden? Koppeling met Stelselcatalogus?? Ik denk dat het te divers is, vanwege alle verschillende aanbieders. Dan zou je in z’n algemeenheid moeten kijken hoe de velden geclassificeerd kunnen worden. Welke rol kunnen bestaande metadata-standaarden (zoals OWMS) hierbij spelen? OWMS is minimale eis. Naast typering van het bestand als geheel moet ons type data worden beschreven in termen van populatie, variabelen, dimensies en tijdvak waarop de data betrekking heeft. Via welke methodiek/proces kan een aanbieder de velden in het register up to date houden? Met “register” wordt bedoeld de informatie in de portal? Bij elke nieuwe publicatie wordt een nieuwe versie van een bestand beschikbaar gemaakt (push) en toegankelijk gemaakt door de betreffende metadata in de portal te uploaden, inclusief de link naar de data zelf. De leverancier houdt de data dan up to date. Welke (meta)informatie heeft een potentiële afnemer nodig om te weten of zij de data kan hergebruiken. Gelaagd: eerst per onderwerp/thema, dan meer specifiek, zie B14.
Antwoord
Op welke wijze kunnen afnemers automatisch gesignaleerd worden over wijzigingen in de (metadata) velden en in de achterliggende Open data? Zie B15: bij publicatie van nieuwe versies (inclusief nieuwe typen bestanden, nieuwe onderwerpen), afhankelijk van de technische mogelijkheden van de portal via abonnementen, RSS, etc. Liefst niet alleen op niveau van tabel/bestand, maar ook op onderwerp/thema, geografie, etc. Dit is een event driven structuur, de leverancier moet het signaal afgeven.
B18.
Hoe zorg ik dat uit te faseren datasets worden gecommuniceerd?
Antwoord
Status (per versie) in metadata, data niet langer beschikbaar. Daarnaast: data nog wel beschikbaar, maar meer recente versie daarnaast.
B19.
Welke ideeën heeft u nog meer ?
Antwoord
Geen antwoord.
B17.
Versie1.0
Pagina: 14
Casusbeschrijving CBS
C.
De wijze waarop de ontsluiting / infrastructuur wordt ingericht (via welke Systematiek publiceer ik mijn data?
C20. Antwoord
Welke technische randvoorwaarden/criteria zijn er voor de systematiek voor datapublicatie vanuit een overheidspartij? Beschikbaarheid en performance van dataservers in relatie tot de afnamebehoefte. Lijkt niet direct een issue, zeker als data wordt afgenomen door brokers en app-bouwers die data repliceren en daarmee eindgebruikervraag afdempen.
C21.
Welke rol zou cloud-technologie hierbij kunnen spelen?
Antwoord
Schaalbaarheid wordt vooralsnog niet als een probleem gezien. Elke leverancier moet voor zichzelf bepalen wat in zijn beleid past. Te vroeg om nu al vooruit te lopen.
C22.
Onder welke voorwaarden kan cloud-technologie een rol spelen?
Antwoord
Geen reactie.
Versie1.0
Pagina: 15
Casusbeschrijving CBS
D.
EU-beleidskaders
D23.
Wat zijn de relevante ontwikkelingen binnen de EU-beleidskaders?
Antwoord
Vooral het creëren van bewustzijn, voorwaarden scheppen dmv richtlijnen en standaarden. Vooralsnog lijkt datagebruik eerder lokaal/nationaal dan internationaal?
D24.
Wat zijn de toekomstige EU-ontwikkelingen en hiermee verwachte beleidskaders?
Antwoord D25.
Antwoord
Versie1.0
Is lastig om dit heel concreet te benoemen. Wat zijn de effecten hiervan op het publiceren, vinden en te hanteren systematiek op korte en langere termijn? Of op andere gebieden zoals bijvoorbeeld de realiseerbaarheid van de implementatie van deze richtlijnen binnen een organisatie? Technisch gezien niet veel. Zal voornamelijk gaan over de wijze waarop de metadata worden vormgegeven en de wijze waarop datasets vanuit verschillende landen met elkaar kunnen worden gecombineerd. Kortom over de processen rondom een dataset.
Pagina: 16
Casusbeschrijving CBS
E.
Lessons learned webrichtlijnen
E26. Antwoord
Zijn de ontwikkeling op het gebied van webrichtlijnen vergelijkbaar met de ontwikkeling bij opendata en standaarden? Dit model is niet automatisch system to system. Dit neemt niet weg dat er geen lessen toepasbaar zijn. W3C en de manier waarop standaarden tot stand komen gaat langzaam en is een moeizame weg. Er zijn al wel veel standaarden, dus het is raadzaam om niet allemaal nieuwe standaarden uit te vinden, maar om de juiste te selecteren. Maar wees selectief hierin. Op de pas-toe-leg-uit vragenlijst staan standaarden die te domein specifiek geformuleerd zijn, bijvoorbeeld de stuff standaard.
E27.
Welke lessen kunnen worden meegenomen vanuit webrichtlijnen?
Antwoord
Geen antwoord.
Versie1.0
Pagina: 17