Ervaringen en aanbevelingen op het gebied van datamanagement Geleerde lessen van zes pilotprojecten
Eindrapport ‘Regie in de Cloud’-project werkpakket 3
Introductie • Onderzoekers in zes pilotprojecten hebben ervaring opgedaan met het maken van een datamanagementplan (DMP) voor goed beheer van hun onderzoeksgegevens. • Samen met onderzoeks-ondersteuners hebben zij plannen gemaakt die als voorbeeld kunnen dienen voor anderen die zorgvuldig willen omgaan met hun onderzoeksdata of moeten voldoen aan de eis die financiers aan ze stellen.
Zes pilot projecten • • • •
•
•
TU Delft / geowetenschappers zijn met een standaard vragenlijst (The Data Curation Profile) ondervraagt over het beheer van de onderzoeksdata van het RainGain project. UvA heeft een standaard vragenlijst ontwikkeld voor hun Research Data Management Support. De vragenlijst is getest met verschillende onderzoeksgroepen. RIVM heeft voor twee datasets vooral gelet op duurzaamheid (continuïteit van de dataopslag), standaarden (voor opslag- en uitwisseling) en niveaus van beveiliging. NHTV / Digital Media kreeg met het opstellen van een datamanagementplan de gelegenheid om richtlijnen op te stellen voor opslag en beheer van onderzoeksdata. De verschillende aspecten van onderzoeksdata zijn in kaart gebracht. Universiteit Twente / Centre for Medical Imaging (CMINEN) heeft gekeken naar de beeldgegevens voor onderzoeksprojecten en de technische infrastructuur die nodig is om kwaliteit en beschikbaarheid van de data te garanderen, mogelijke risico’s te minimaliseren en de data te archiveren. Met behulp van een template met een uitgebreide vragenlijst zijn alle aspecten van de onderzoeksdata beschreven. Universiteit Utrecht / sociale & organisatiepsychologie (SOP) heeft met het DMP richtlijnen neergezet voor de opslag en beheer van onderzoeksdata die de basis vormen voor een publicatie van een onderzoeker. Met deze richtlijnen moeten reviewers en collega’s de onderbouwing van de publicatie terug kunnen vinden in de ruwe data.
Inhoud eindrapportage • Ervaringen bij het proces van het schrijven van een datamanagementplan (DMP) • Ervaringen omtrent de inhoud van een datamanagementplan • Aanbevelingen over de next steps op het gebied van datamanagement
HET PROCES
Aanbevelingen bij de totstandkoming van een datamanagementplan (DMP)
Proces van een DMP Wie zijn betrokken? • In het proces zijn mensen nodig die het maken van een datamanagementplan (DMP) echt belangrijk vinden en die het plan ook zelf willen maken. Dit kunnen onderzoekers zijn, of ondersteuners vanuit de bibliotheek • Commitment van het management/sleutelfiguren is noodzakelijk, vooral voor het kunnen vrijmaken van de benodigde tijd om te werken aan een DMP • Geen DMP zonder betrokkenheid van de onderzoekers, maar vraag niet teveel tijd.
Proces van een DMP Wie zijn betrokken? • De afdeling Bibliotheek/Mediatheek ondersteunt bij voorkeur de totstandkoming van een DMP met kennis van de ontsluiting van data. • Betrek de ICT afdeling vroeg in het proces. Soms is die betrokkenheid erg nodig, soms niet. Dit hangt af van de benodigde oplossing. Hoe eerder je weet of het nodig is, hoe beter het is.
Proces van een DMP De doorlooptijd • De doorlooptijd van het schrijven van een DMP is erg afhankelijk van het type organisatie. In sommige organisaties gaat het snel, in andere duurt het juist lang. Van te voren is dus moeilijk in te schatten hoe lang het duurt, maar meestal minstens 3 maanden doorlooptijd • Gebruik een template van een DMP of liever nog een uitgewerkt DMP als input, want dat versnelt het proces. Voorbeelden en templates zijn te vinden op de SURF pagina • Ervaring met het maken van DMP’s of vormen van dataopslag versnelt het proces. Betrek dus personen die ervaring hebben.
Proces van een DMP Timing • Het tijdstip waarop gestart wordt met het maken van een DMP moet goed getimed worden. Als een onderzoeksorganisatie nog niet gestart is, kan al een deel van een DMP gemaakt worden, echter niet alles kan vooraf worden ingevuld. • De opstart van een nieuw onderzoek, terwijl de onderzoeksgegevens nog niet beschikbaar zijn, lijkt een goed startmoment. • Datamanagement invoeren als al veel onderzoeksgegevens opgeslagen zijn, is lastiger, omdat dan veel werk extra gedaan moet worden.
Proces van een DMP last, but not least: Beeldvorming • Onderzoekers spreken vaak uit geen behoefte te hebben aan datamanagement. Het belang van datamanagement moet voor hen concreet gemaakt worden. Persoonlijk contact en support is daarbij wezenlijk • Vermijdt het gebruik van vakjargon zoals “metadata”. Sluit aan bij het taalgebruik van de onderzoekers • Gebruik richting onderzoekers niet de term “datamanagement” en “datamanagementplan”, want dit klinkt bureaucratisch en tijdrovend. Gebruik liever de term “beheer onderzoeksgegevens”.
Proces van een DMP Beeldvorming (2) • Veel onderzoekers denken dat een DMP per definitie leidt tot het openbaar maken van de onderzoeksgegevens. Bespreek van te voren of zij dit willen en zo ja in welke mate • Bij onderzoek gefinancierd uit de 3e geldstroom bestaat vaak terughoudendheid in het open beschikbaar stellen van onderzoeksdata, vanwege vragen rondom het eigenaarschap van de data. Maak hierover zo mogelijk goede afspraken • Doe aan voorlichtingssessies voor onderzoekers over het beheer van data • Biedt jonge onderzoekers (AIO’s) een cursus aan op het gebied van datamanagement
DE INHOUD VAN EEN DMP
Aanbevelingen over de inhoud van een DMP
Inhoud van een DMP • De invulling van een DMP kan vele vormen hebben: – Een “zo gaan we het doen” beschrijving – Een template voor het verzamelen van wensen van onderzoekers – Een set richtlijnen voor onderzoekers
• Een DMP is eigenlijk nooit af; het plan blijft aangepast worden totdat de data is opgeslagen, nadat het project is afgerond. • Kosten zijn soms lastig in beeld te brengen, maar vormen toch een belangrijk onderdeel van een DMP.
Inhoud van een DMP Doelstelling De doelstelling van een DMP kan divers zijn: – Het verlenen van toegang tot de data voor gebruik door een groep van onderzoekers of andere partijen – Het faciliteren van de vindbaarheid van data voor andere partijen – Het linken van data aan publicaties/papers/thesis e.d. – Het mogelijk maken van verificatie door reviewers – Het voldoen aan eisen van EU of NWO in verband met subsidievereisten – Het inzichtelijk maken van alle aspecten die goed data management mogelijk maken.
Inhoud van een DMP Onderzoeksfase Bepaal voor welke onderzoeksfase het DMP wordt geschreven: • gedurende het onderzoek • voor beperkte opslag na afloop van het onderzoek (bijvoorbeeld 5 jaar) • voor langdurige archivering (meer dan 10 jaar) • voor alle situaties die een combinatie zijn van de hiervoor genoemde mogelijkheden.
Inhoud van een DMP Doelgroep • Schrijf een DMP op het niveau van een onderzoeksgroep of op het niveau van een faculteit. Het schrijven van een DMP voor een onderzoeksgroep is gemakkelijker. Vermijdt echter het maken van een DMP voor 1 onderzoeker. • Betrek in het DMP de eventuele samenwerking tussen onderzoeksgroepen en/of externe (commerciële) partijen, of “paper & pencil” groepen.
Inhoud van een DMP De opslag van data • Bespreek de manier van dataopslag, en let hierbij op het mogelijke gebruik van data op de lange termijn, indien mogelijk onafhankelijk van specifieke programmatuur • Ontsluit de opslagen data met behulp van beschrijvingen van de data, zoals metadata of codeboeken • Het deponeren van data bij DANS voor langdurige opslag is eenvoudig. Gebruik dit ervaringsfeit om eventuele weerstand weg te nemen. • Deponeren in een archief (zoals DANS of 3TU.Datacentrum) is NIET synoniem aan je data open stellen of delen met anderen.
Inhoud van een DMP Techniek en standaarden • Sluit aan bij de standaarden die in een specifieke onderzoeksgroep gebruikelijk zijn • SURFconext is een goed hulpmiddel voor het vormgeven van toegang tot onderzoeksdata voor partijen in het hoger onderwijs.
Inhoud van een DMP Cloud (1) • De keuze voor een cloudoplossing is het gevolg van de eisen en wensen van de onderzoekers, en geen beleidsmatige beslissing op instellingsniveau • Met name de omvang van het netwerk in combinatie met de omvang van de onderzoeksbestanden bepaalt of een cloudoplossing mogelijk is tijdens de onderzoeksfase • (inter-)nationale wetgeving bepaalt in hoge mate welke cloudoplossingen mogelijk zijn en welke niet • Een cloudoplossing bepaalt niet in welke mate data toegankelijk is voor anderen; dat wordt bepaald door de beveiliging van de data, de metadatering en de keuze van het formaat van de data.
Inhoud van een DMP Cloud (2) • Toepassing van cloudoplossingen tijdens de uitvoering van een onderzoek zijn vaak lastig, vanwege netwerkvereisten. Het toepassen van cloudoplossingen bij archivering van de onderzoeksdata na afloop van het onderzoek is vaak wel mogelijk. • Het ontwikkelen van een “dropbox”functionaliteit aan (inter-)nationale eisen is zeer gewenst; bij voorkeur zoals “datastage” van Oxford.
Hoe nu verder?
Aanbevelingen voor acties van instellingen en SURF
Hoe nu verder? Acties binnen de instellingen (1) • Verzorg een (beperkte) cursus Datamanagement voor jonge onderzoekers, zodat zij het belang gaan inzien van aandacht voor datamanagement tijdens het onderzoek. Dit bespaart kosten later in het onderzoek. • Vergroot de kennis binnen ICT afdelingen op het gebied van de benodigde ondersteuning van onderzoek. Dit zal de ondersteuning door ICT aan onderzoekers ten goed komen.
Hoe nu verder? Acties binnen de instellingen (2) • De spraakverwarring over de gebruikte termen op het gebied van datamanagement, big data, DMP’s, metadata is groot. Kies voor de eigen instelling eigen termen om te beschrijven wat belangrijk is • Maak een centraal beleid op het gebied van datamanagement, maar begin met eenvoudige richtlijnen op hoog niveau, en laat onderzoeksgroepen zelf veel ruimte voor eigen invulling.
Hoe nu verder? Mogelijke acties voor SURF (1) • Ontwikkel een dropbox functionaliteit voor onderzoekers die voldoet aan de Europese regelgeving • Lever een bijdrage aan het creëren van bewustwording en training door bijvoorbeeld sessies in het SHB • Biedt op termijn een centrale infrastructuur voor de opslag van onderzoeksgegevens, ook tijdens de lopende onderzoeksfase, en koppel deze met CRIS.
Hoe nu verder? Mogelijke acties voor SURF (2) • Creëer een nationaal kenniscentrum voor nieuwe ontwikkelingen en innovaties • Geef inzicht in de initiatieven die op het gebied van datamanagement lopen op nationaal en internationaal niveau. Op termijn mogelijk ook meer regie daarop door SURF? • Stroomlijn de verschillende overleggen binnen SURF.