Data, tools en infrastructuren Rollen en verantwoordelijkheden Laurents Sesink
‘Nederlands-Vlaamse samenwerking bij de digitalisering van het erfgoed’ Antwerpen, 21 juni 2012
Waarom wetenschappelijke data delen
Validatie van onderzoek Gedragscode. Data tot 5 jaar na onderzoek beschikbaar houden.
Niederlande Renommierter Psychologe gesteht Fälschungen
Hergebruik van data
De laatste 10 jaar is er een verandering met betrekking tot het principe van het delen van onderzoeksdata. Overheid: OECD Principles and Guidelines for Access to Research Data from Public Funding. Wetenschappelijke organisaties: Berlin Declaration on Open Access. DANS wordt gefinancierd om dit beleid te implementeren in het wetenschappelijke domein.
Wat is DANS?
Een instituut van de Koninklijke Nederlandse Academie van Wetenschappen (KNAW) en de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO). Voorgangers DANS: Steinmetz archief (1964), Nederlands Historisch Data Archief (1989). Missie: de permanente toegang van wetenschappelijke data in Nederland voor de toekomst garanderen. (beginnend met data van de humaniora and sociale wetenschappen).
DANS Beleid
Het is niet belangrijk waar data gearchiveerd wordt als de repository voldoet aan internationale standaarden en richtlijnen met betrekking tot trustworthiness Onderzoek financiers moeten onderzoekers verplichten om hun data in een TDR te deponeren. Onderzoekers moeten hun data deponeren/delen: Open als het kan, beschermd als het moet.
Rollen en verantwoordelijkheden
Onderzoek financiers: Stimuleer en verplicht ◦ Audit en certificering van digitale repositories ◦ Data management paragraaf in projectvoorstellen ◦ Deponeren of delen van onderzoek data in een TDR
Data repositories: ◦ Conformeer aan de richtlijnen van een TDR ◦ Geef permanente toegang tot onderzoek data
Data producenten: ◦ Produceer excellente data ◦ Deponeer data in een TDR
Data consumenten: ◦ Gebruik data op een betrouwbare wijze ◦ Geef wetenschappelijke waardering aan de producent van de data (refereer!)
Data is hot!
Neelie Kroes (VicePresident of the European Commission responsible for the Digital Agenda): “Data is the new gold” Rome, April 2012: Open science culture – open sharing of data, software, publications, educational materials DMP in Horizon 2020
Nederlandse overheid en wetenschappelijke data
ARVODI KADASTER CBS
Data repositories: Conformeer aan internationale standaarden en richtlijnen. •
•
•
BASIC CERTIFICATION is granted to repositories which obtain DSA certification EXTENDED CERTIFICATION is granted to Basic Certification repositories which in addition perform a structured, externally reviewed and publicly available self-audit based on ISO 16363 or DIN 31644 FORMAL CERTIFICATION is granted to repositories which in addition to Basic Certification obtain full external audit and certification based on ISO 16363 or equivalent DIN 31644.
See: www.trusteddigitalrepository.eu
Data Seal of Approval 5 Kriteria 16 Richtlijnen Onderzoek data: Kunnen gevonden worden op het Internet Zijn toegankelijk (duidelijke rechten en licenties) Zijn in in bruikbaar formaat Zijn betrouwbaar Zijn refereerbaar (persistent identifier)
www.datasealofapproval.org
3-7-2012
Data producent: Onderzoekers moeten hun data delen/deponeren in een TDR
Bij DANS in het Elektronische Archivering Systeem (EASY) Elders in een TDR (3TU.datacentre, The Language Archive)
Hiervoor zijn nodig: Data archiverings richtlijnen Onderzoek data management training en advies
Wetenschappelijke waardering
Hoe de impact van wetenschappelijk data als resultaat van onderzoek te meten Citeren Download gegevens Community reviews
Data intensieve wetenschap
Digitale data zijn in grote aantallen aanwezig Nieuwe onderzoeksvragen Nieuwe methoden en technieken Nieuwe zoek, browse, analyse en visualisatie tools
Onderzoek infrastructuren
Discipline (onderwerp) gerelateerd Hoge (initiële) investering Aanzienlijke onderhoud kosten (In)ternationale samenwerking ◦ Juridische structuur ◦ Businessmodel ◦ European Research Infrastructure Consortium
Benodigde infrastructuur Research Data Research Infrastructures
Research Publications
Software Research Information Educational Resources
Interoperabiliteit: standaarden & systemen
Persistent Identifiers
Metadata
Rollen en verantwoordelijkheden
Domein specifieke diensten ◦ CLARIN, DARIAH, CESSDA etc.
Gemeenschappelijke diensten ◦ DASISH, EUdat
Digitale duurzaamheid ◦ APARSEN, Planets
Kosten en wetenschappelijke waardering ◦ ?
Lopend onderzoek versus permanente toegang/preservatie
Static Open
Less functionality
Een uitdaging voor alle stakeholders
Datasets Data explosie Toename van data deponeringen 20000 ◦ E-science 15000 10000 ◦ Beleid (Open Access mandaten, etc.) 5000 Nieuwe (complexe) data formaten 0 2007 2008 2009 ◦ Audio Visual, GIS, 3D Nieuwe mogelijkheden voor disseminatie en (her)gebruik onderzoek data ◦ Visualisatie/analyse tools, verrijkte publicaties, Onderzoek Infrastructuren (ERIC) Meer wetenschappelijke disciplines ◦ Sociale wetenschappen, humaniora, levenswetenschappen, technische wetenschappen. Ondersteuning door middel van een vast jaarlijks budget
(7 months 2010
Naar nieuwe financieringsmodellen
Toegang tot onderzoek data is om niet KNAW en NWO financieren de kern diensten van DANS Data deponeerder betaald een eenmalige bijdrage ◦ Kleine datasets ◦ Grote datasets Onderzoek financiers ◦ Alloceer middelen voor data management in project voorstellen