Data in Publiek-Private Projecten Huidige implementaties Wouter Bokhove & Bob Hulsebosch - Novay
Colofon Data in Publiek-Private Projecten Huidige implementaties SURFfoundation PO Box 2290 NL-3500 GG Utrecht T + 31 30 234 66 00 F + 31 30 233 29 60
[email protected] www.surf.nl Auteurs Wouter Bokhove - Novay Bob Hulsebosch - Novay
In opdracht van SURF en STW Eindredactie Wilma Mossink, Keith Russell - SURFfoundation
SURF is de ICT-samenwerkingsorganisatie van het hoger onderwijs en onderzoek (www.surf.nl). Deze publicatie is digitaal beschikbaar via de website van SURFfoundation: www.surffoundation.nl/publicaties
© Stichting SURF Oktober 2011
Deze publicatie verschijnt onder de Creative Commons licentie Naamsvermelding 3.0 Nederland.
Inhoudsopgave
Managementsamenvatting ............................................................................................... 5 Management Summary ..................................................................................................... 6 1
Inleiding .................................................................................................................. 7 1.1 Over deze publicatie ............................................................................................7 1.2 Open Access.......................................................................................................7 1.3 Data in publiek-private projecten ..........................................................................8 1.4 Werkwijze ..........................................................................................................9
2
Huidige implementaties ......................................................................................... 11 2.1 Analyse ........................................................................................................... 11 2.2 Nieuwe ontwikkelingen ...................................................................................... 13 2.3 Samenvatting ................................................................................................... 15
3
Open Access barometer ......................................................................................... 19 3.1 Open Access..................................................................................................... 19 3.1.1 Onderzoekers ...................................................................................... 19 3.1.2 Uitgevers ............................................................................................ 21 3.1.3 Bedrijven ............................................................................................ 23 3.2 Publicatie van onderzoeksdata ............................................................................ 23 3.2.1 Onderzoekers ...................................................................................... 23 3.2.2 Uitgevers ............................................................................................ 30 3.2.3 Bedrijven ............................................................................................ 31 3.3 Publiceren in publiek-private projecten ................................................................ 32 3.3.1 Onderzoekers ...................................................................................... 32 3.3.2 Uitgevers ............................................................................................ 33 3.3.3 Bedrijven ............................................................................................ 33 3.4 Samenvatting ................................................................................................... 34 3.4.1 Onderzoekers ...................................................................................... 34 3.4.2 Uitgevers ............................................................................................ 35 3.4.3 Bedrijven ............................................................................................ 35
4
Conclusies en aanbevelingen ................................................................................. 37
Appendix A – Oplossingen voor de publicatie van onderzoeksdata ................................. 41 Appendix B – Interview vragenlijst ................................................................................ 49
3
Managementsamenvatting Dit document beschrijft de resultaten van een verkennend onderzoek naar de publicatie van onderzoeksdata in publiek-private projecten. Het onderzoek is gebaseerd op een inventarisatie van de huidige oplossingen voor de publicatie van onderzoeksdata. Deze oplossingen omvatten datacollecties georganiseerd in datacentra rond disciplinaire of thematische onderzoeksactiviteiten, data-archieven en repositories gericht op opslag en hergebruik van onderzoeksdata en datacollecties georganiseerd rond wetenschappelijke tijdschriften. Tevens wordt een aantal nieuwe ontwikkelingen en nationale en internationale initiatieven beschreven, zoals e-Research, het Parelsnoer Initiatief en CLARIN. Daarnaast zijn interviews afgenomen bij betrokkenen van universiteiten, kennisinstellingen, uitgevers en bedrijven. De inventarisatie van de huidige oplossingen, de nieuwe ontwikkelingen en initiatieven en de analyse van de interviews hebben geleid tot de volgende aanbevelingen voor onderzoeksfinanciers: (1) hanteer een discipline-afhankelijke aanpak (2) stimuleer en verplicht datapublicatie bij disciplines waar het al gemeengoed is en waar een infrastructuur voor datamanagement beschikbaar is (3) stimuleer en faciliteer bij disciplines waar het nog geen gemeengoed is (4) stimuleer samenwerking en uitwisseling van data via online e-Research samenwerkingsplatformen.
5
Management Summary This document sets out the results of an exploratory study of the publication of research data in the context of public-private projects. The study is based on a survey of the current solutions for publishing research data. These comprise data collections organised at data centres according to research activities for a particular discipline or theme; data archives and repositories focusing on storage and reuse of research data; and data collections organised according to academic journals. A number of new trends and national/international initiatives are also described, for example eResearch, the „Parelsnoer‟ initiative, and CLARIN. Interviews have been held with representatives of universities, knowledge institutions, publishers, and businesses. Surveying the current solutions, new trends and initiatives, and analysing the interviews have generated the following recommendations for the bodies that fund research: (1) adopt a discipline-dependent approach (2) encourage publication of datasets in disciplines in which it is normal practice and where an infrastructure is available for data management, and make such publication obligatory; (3) encourage and facilitate in disciplines in which such publication is not yet normal practice; (4) encourage collaboration and the exchange of data via online e-Research collaboration platforms.
6
1
Inleiding
1.1
Over deze publicatie
Dit rapport is opgesteld in het kader van het SURFshare programma, waarin ook aandacht wordt besteed aan het verbeteren van toegang tot data. Onder dit thema zijn studies1 uitgevoerd waarin diverse aspecten werden bestudeerd. Onder meer is gekeken naar de vraag welke data moet worden opgeslagen en wat de juridische mogelijkheden en beperkingen zijn om data her te gebruiken. In het verlengde van deze studies is het project DiPPP (Data in Publiek-Private Projecten) opgestart. Dit heeft tot twee studies geleid, waar dit er een van is, naar de mogelijkheden om data te delen in publiek-privaat gefinancierde projecten.
1.2
Open Access
Voor de publicatie van onderzoeksresultaten wordt steeds meer gebruik gemaakt van Open Access (OA) publicatie. OA publicatie is het zonder beperkingen beschikbaar stellen via internet van de resultaten van onderzoek. OA publicatie is een middel om onderzoeksresultaten breder beschikbaar te maken voor gebruikers van die resultaten, waar ook ter wereld. Onder invloed van de Berlin Declaration2 is er een beweging in gang gezet om onderzoek OA te publiceren. Deze verklaring is inmiddels ondertekend door oa. NWO en alle Nederlandse universiteiten. In deze verklaring wordt niet alleen gesproken over het publicatie van onderzoeksdata in de vorm van wetenschappelijke publicaties, maar ook over de onderliggende onderzoeksdata. “Open access contributions include original scientific research results, raw data and metadata, source materials, digital representations of pictorial and graphical materials and scholarly multimedia material.” (Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, 2003) De eerste jaren na het uitkomen van de Berlin Declaration was het debat rond OA erg emotioneel. Inmiddels is de commotie rondom OA publicatie enigszins gedaald. Onderzoekers raken steeds meer vertrouwd met OA en worden in toenemende mate gestimuleerd door universiteiten en onderzoeksfinanciers zoals NWO om OA te publiceren. “Open Access is important for optimal dissemination of scientific results.” (Prof. Detlef Lohse, professor of Physics of Fluids, Flyer „UT Publications‟, Universiteit Twente) De uitgevers beginnen ook beter grip te krijgen op het business model rond OA. Er ontstaan nieuwe tijdschriften die volledig OA zijn. Ook worden bestaande „traditionele‟ tijdschriften omgezet naar OA tijdschriften. Zowel het opzetten als het omzetten gebeurt door de traditionele uitgevers, maar ook door onderzoekers of onderzoeksgebieden. Desondanks is het aantal artikelen dat via OA publicatie verschijnt nog relatief klein ten opzichte van het aantal artikelen dat verschijnt in tijdschriften die via een abonnement toegankelijk zijn. De traditionele tijdschriften hebben vaak nog een betere citatie-index, waardoor ze voor veel onderzoekers erg aantrekkelijk blijven om in te publiceren. Zeker ook gezien het feit dat onderzoekers door veel onderzoeksfinanciers worden afgerekend op een citatie-scores. De nieuwe business modellen rond OA zorgen voor een verandering in de geldstromen. In de „traditionele‟ situatie betalen de universiteitsbibliotheken abonnementsgelden aan de uitgevers, die daarmee wetenschappelijke artikelen beschikbaar stellen aan de onderzoekers van die universiteiten. Tegenwoordig is het ook mogelijk voor een onderzoeker om toegang tot een individueel artikel te kopen.
1
http://www.surffoundation.nl/toegangtotdata
2
http://oa.mpg.de/lang/en-uk/berlin-prozess/berliner-erklarung/
7
Het business model van OA tijdschriften kent een aantal varianten. In de meeste gevallen betaalt de onderzoeker een bedrag aan de uitgever als het artikel geaccepteerd is door de reviewers. Aangezien er in de meeste onderzoeksvoorstellen nog geen budget is opgenomen voor dit soort uitgaven, gaat dit ten koste van andere (groeps-)budgetten. In andere gevallen zorgt de onderzoeksfinancier alsnog voor de financiering. Er bestaan ook stimuleringsfondsen voor OA bij universitaire bibliotheken. Ook NWO heeft een „Stimuleringsfonds Open Access-publicaties‟3, waar subsidie aangevraagd kan worden voor OA publicatie van onderzoek dat door NWO gefinancierd is. Er zijn ook een groot aantal OA tijdschriften die zijn opgericht door een instituut uit een bepaalde discipline. Deze tijdschriften zijn zowel voor auteurs als voor de lezers gratis en worden gefinancierd door de instituten zelf. Een andere ontwikkeling die zich de laatste jaren afspeelt, is het publiceren van additionele informatie bij een wetenschappelijk artikel. Dit gebeurt zowel bij de traditionele tijdschriften, maar misschien nog wel meer bij OA tijdschriften, omdat deze van nature meer georiënteerd zijn op de online publicatie van resultaten en daarmee meer online faciliteiten aanbieden. Het publiceren van deze zogenaamde supplementaire of verrijkende data, zoals figuren en grafieken, maar ook onderzoeksdata neemt steeds meer toe4. Onderzoeksdata kan in dit verband een zeer grote verscheidenheid aan zaken betekenen: meetresultaten, foto‟s, algoritmes, SOPs (Standard Operating Procedures), etc. Het publiceren van onderzoeksdata roept automatisch vragen op met betrekking tot de publieke beschikbaarheid van deze data. Als de resultaten van onderzoek in de vorm van wetenschappelijke publicaties publiek toegankelijk moeten zijn, geldt dan niet hetzelfde voor de onderliggende onderzoeksdata? En, moet het dan niet ook verplicht worden om onderzoeksdata te publiceren? En, is dat altijd mogelijk en/of wenselijk. En zo nee, waarom niet en wat moet er gebeuren om het wel mogelijk te maken?
1.3
Data in publiek-private projecten
STW financiert als onderdeel van NWO technisch wetenschappelijk onderzoek. Dit wordt bij voorkeur uitgevoerd in publiek-private samenwerking, waarbij de private partijen een (financiële) bijdrage leveren of kennis en/of middelen inbrengen. Ook de resultaten die voortvloeien uit dit onderzoek worden veelal gepubliceerd, maar er kan ook sprake zijn van een belangenconflict, waarin de onderzoekers uit de academische wereld graag willen publiceren, maar de private partij een commercieel belang heeft om dit niet te doen. In de projecten die STW financiert worden hier van tevoren afspraken over gemaakt. Private partijen krijgen de gelegenheid om eventueel patenten of octrooien aan te vragen voordat het onderzoek gepubliceerd wordt in een wetenschappelijk tijdschrift. Er is echter nauwelijks ervaring met het publiceren van onderzoeksdata in dit soort projecten. Het publiceren van onderzoeksdata in publiek-private projecten roept ook allerlei vragen op. Als onderzoeksdata in dit soort projecten gepubliceerd wordt, kan en/of moet dit dan ook publiek toegankelijk zijn? Wat zijn de belangen die spelen bij het publiceren in dit soort projecten? Welke belemmeringen kunnen er zijn? Hoe kunnen die belemmeringen worden weggenomen? Van wie is de data eigenlijk? Welke rol kan STW spelen? Met toevoeging van de publiek / publiek-private dimensie aan de twee eerder beschreven dimensies, wordt de onderzoeksruimte driedimensionaal, zoals schematisch is weergegeven in Figuur 1. Eén as beschrijft het onderscheid dat gemaakt kan worden tussen de publicatie van wetenschappelijke artikelen enerzijds en het publiceren van onderzoeksdata anderzijds. Voor beide soorten publicatie is het van belang of de publicatie traditioneel (gebruik makend van abonnementen om toegang te verlenen tot publicaties) dan wel via Open Access verloopt. Tenslotte is het ook relevant of het onderzoek publiek gefinancierd is of dat ook private partijen betrokken zijn bij de financiering.
3 4
http://www.nwo.nl/nwohome.nsf/pages/NWOP_82LC99 http://www.surffoundation.nl/verrijktepublicaties
8
Figuur 1. Driedimensionale onderzoeksruimte
Ondanks het feit, dat vooral het OA publiceren van onderzoeksdata in publiek-privaat gefinancierde projecten onder de scope van dit onderzoek valt, zijn ook de overige dimensies relevant. Het is daarnaast ook mogelijk, dat bepaalde dimensies bij bepaalde assen geen (of beperkte) invloed hebben. Zo is het bijvoorbeeld misschien niet relevant of de publicatie van onderzoeksdata in publiek-private projecten „traditioneel‟ of via OA verloopt.
1.4
Werkwijze
STW wilde het inzicht vergroten in de ontwikkelingen rond OA publicatie in het algemeen en de OA publicatie van onderzoeksdata in het bijzonder, met name in publiek-private projecten. Allereerst is een serie interviews gehouden met ervaringsdeskundigen uit de academische wereld, uitgevers, kennisinstellingen en ervaringsdeskundigen uit de industrie. Deze interviews gaven een beeld van de opvattingen, behoeften en barrières met betrekking tot OA publicatie (van onderzoeksdata). De interviews tonen hoe men staat tegenover het publiceren van onderzoeksdata en hoe dit gefaciliteerd zou kunnen worden en hoe men in publiek-private projecten staat tegenover de publicatie van wetenschappelijke artikelen en onderzoeksdata. Voordat deze interviews konden worden afgenomen was het van belang te weten welke oplossingen op dit moment bestaan voor de publicatie van onderzoeksdata en welke kenmerken deze oplossingen hebben met betrekking tot technische mogelijkheden, de aard van de data, de mogelijkheden voor OA publicatie en de gebruikersgroepen. Hiervoor zijn een aantal nationale en internationale initiatieven bij universiteiten, uitgevers en discipline-gebonden organisaties vergeleken. Dit is uitgevoerd in het kader van het project DiPPP (Data in Publiek-Private Projecten).
9
2
Huidige implementaties
Dit hoofdstuk beschrijft de resultaten van de desk research die is uitgevoerd naar de huidige implementaties bij nationale en internationale universiteiten, uitgevers en kennisinstellingen. Hierbij is nadrukkelijk voortgebouwd op de studie, die als onderdeel van het programma „Toegang tot Onderzoeksdata‟ (zie Figuur 2) in opdracht van SURFfoundation is uitgevoerd door Pleiade Management & Consultancy in november 2010. Deze studie heeft geleid tot het rapport „Organisatorische aspecten en duurzame opslag en beschikbaarstelling onderzoeksdata‟5.
2.1
Analyse
In de studie worden de oplossingen voor het aanbieden van onderzoeksdata gecategoriseerd op de volgende type databronnen: datacentra, data-archieven en datacollecties rond wetenschappelijke tijdschriften. Datacentra zijn meestal verbonden aan een onderzoeksfaciliteit en zijn dan ook gericht op een specifieke discipline. Voorbeelden van datacentra zijn het datacentrum van LOFAR, NODC, het KNMI, LISS en CRAWDAD. Deze laatste is een voorbeeld van een oplossing die zich richt op een niche op het gebied van draadloze netwerken. “Earlier this week I was talking with one of our CRAWDAD data contributors. He was pleased to see his dataset being so widely used, but he was disappointed to see that in many papers using CRAWDAD data the paper does not cite the CRAWDAD dataset well. In many cases, he noted, a paper might cite the dataset but not mention the authors of the dataset or cite the paper that originated the dataset. Such citations are important form of recognition -- one that is *essential* if we are to continue to encourage people to share the data they've collected. Some papers refer to the XYZ dataset -- but there might be two XYZ datasets in CRAWDAD, or multiple revisions of the dataset. For scientific clarity is important to cite the specific dataset using its canonical name; the CRAWDAD metadata page gives you bibtex to make this easy. When there is also a published paper that first described the dataset, please cite *both* the dataset and the paper. Many thanks for your ongoing use of CRAWDAD. Please remember to ensure that the dataset contributors are given full credit for their work.”, e-mail naar de CRAWDATA mailinglijst van Professor David Kotz, Dartmouth College (10 november 2010)6 Data-archieven zijn vaak gericht op één of meerdere disciplines en dragen zorg voor de langetermijn opslag en beschikbaarstelling van onderzoeksdata. Voorbeelden van data-archieven zijn DANS, het data-archief van het Max Planck Instituut, het 3TU datacentrum, Genbank en (beperkt) de datarepositories van de individuele universiteiten, zoals DSpace van Cambridge en IQSS bij Harvard. IQSS is gebaseerd op een open-source applicatie Dataverse Network (DVN), die door Harvard zelf is ontwikkeld voor het publiceren van data. Gebruikers en instellingen kunnen ervoor kiezen data te deponeren in de DVN van Harvard zelf (IQSS) of zelf een (al dan niet Open Access) DVN op te zetten.
5
Graaf, M. van der. Organisatorische aspecten duurzame opslag en beschikbaarstelling onderzoeksdata. s.l. : Stichting SURF,2010 http://www.surffoundation.nl/nl/publicaties/Pages/Organisatorischeaspectenduurzameopslagenbeschikbaarst ellingonderzoeksdata.aspx 6
http://listserv.dartmouth.edu/scripts/wa.exe?A2=CRAWDAD-USERS;iHQMtg;20101110151159-0500
11
Een aantal wetenschappelijke tijdschriften, zoals bijvoorbeeld Nature, kent de eis dat datasets, die aan een publicatie ten grondslag liggen, beschikbaar moeten zijn. Onderzoekers kunnen deze datasets zelf beschikbaar stellen via de tijdschriften of via een link naar een datacentrum of dataarchief. Voorbeelden van dit type data-archieven zijn ICPSR, UKDA-Store, Pangaea, ESSD en Acta Crystallography A. De laatste twee zijn tijdschriften die zich richten op het publiceren van data. Appendix A toont een overzicht van de onderzochte oplossingen. De huidige oplossingen hebben een aantal aspecten gemeen: Er is aandacht voor het beschikbaar maken van metadata. Deze metadata moeten de onderzoekers (de hergebruikers) ondersteunen bij het vinden en beoordelen van de onderzoeksdata. Er is aandacht voor het vindbaar maken van de onderzoeksdata via (uitgebreide) zoekfunctionaliteiten. Over het algemeen kan gezocht worden binnen de metadata (zelfs als de onderzoeksdata niet zonder meer toegankelijk zijn) en in sommige gevallen ook in de onderliggende onderzoeksdata zelf. De meeste oplossingen koppelen een dataset aan een unieke identifier (bv. DOI). Een unieke identifier maakt het onder andere mogelijk om te refereren naar datasets. Oplossingen bieden bijna altijd de mogelijkheid om datasets op een niet-Open Access wijze te publiceren. Zo wordt de onderzoeker vaak de mogelijkheid geboden om de onderzoeksdata onder embargo te publiceren. Dit wil zeggen, dat de overige onderzoekers pas na een half tot een heel jaar toegang kunnen krijgen tot de onderzoeksdata. Onderzoeksdata mag vaak vrij gebruikt worden onder voorwaarde van bronvermelding. De gebruikersgroepen zijn vaak beperkt tot de „eigen community‟. Er is weinig aandacht voor de kwaliteit van onderzoeksdata. Er is zeer beperkt aandacht voor de juridische kanten van het beschikbaar stellen van onderzoeksdata (bv. de eigendomsrechten). Er zijn ook duidelijke verschillen tussen de onderzochte oplossingen: Er is een grote verscheidenheid aan standaarden voor de beschrijving van metadata. Deze standaarden kunnen generiek zijn, maar ook discipline- of zelfs oplossingsafhankelijk. De metadata beschrijven vaak high-level informatie met betrekking tot de onderzoeker en het onderzoek. De beschrijving van de data zelf (bv. hoe deze is verkregen en de betekenis van de resultaten) is vaak goed minder gespecificeerd en gestandaardiseerd. Er is een grote verscheidenheid aan bestandsformaten, die geaccepteerd worden voor het deponeren van onderzoeksdata. Dit is o.a. te wijten aan het feit, dat tussen (maar ook binnen) verschillende disciplines gebruik gemaakt wordt van zeer uiteenlopende typen onderzoeksdata, maar ook door de verschillende doelen met betrekking tot de lange-termijn beschikbaarheid van de onderzoeksdata. Data is niet altijd vrij toegankelijk. In sommige gevallen is registratie vereist en in een enkel geval is het zelfs noodzakelijk om eerst een verklaring te tekenen voordat toegang verkregen kan worden tot de data. Niet alle oplossingen maken duidelijk hoe de houdbaarheid op de lange termijn verzorgd wordt. Dit heeft betrekking op zowel de bestandsformaten als op de algehele infrastructuur. In sommige gevallen worden naast het beschikbaar stellen van data extra diensten aangeboden, zoals trainingen, analyse software of visualisatie tools. In één onderzocht geval wordt zelfs de mogelijkheid geboden om te koppelen met RIS (een systeem voor citaties). In een beperkt aantal gevallen kunnen onderzoekers – na registratie – rechtstreeks data deponeren. In de meeste gevallen heeft de desbetreffende organisatie zelf een rol in het beschikbaar maken van de data in het archief. Deze rol varieert van goedkeuring tot intensieve controle en begeleiding tijdens het maken van de datasets. Ook voor bedrijven is soms mogelijk om datasets te deponeren. Er wordt niet altijd een duidelijke link gelegd tussen de dataset en de auteur(s) daarvan (bijv. met DAI). Dit maakt het verwijzen lastiger en daarmee het geven en verkrijgen van credits moeizaam. De onderzochte oplossingen maken vaak deel uit van een grotere infrastructuur of zijn juist de ingang tot verschillende kleinere infrastructuren. Op landelijk, Europees, en internationaal niveau
12
wordt de toegang tot datasets steeds meer gefaciliteerd door centrale databases of centrale toegang tot databases. Dit heeft een positief effect op de vindbaarheid van onderzoeksdata. De daadwerkelijke opslag van de datasets gebeurt vaak wel op institutioneel niveau. Het is opvallend, dat er een aantal tijdschriften en onderzoeksfinanciers zijn, die publicatie van onderzoeksdata verplicht stellen. De NIH (National Institute of Health) is een goed voorbeeld van een onderzoeksfinancier die veel aandacht besteedt aan datapublicatie, onder andere met een beleid met betrekking tot het delen van data7. De Europese Commissie verwacht voor haar 8e Kaderprogramma dat projecten meer aandacht besteden aan data management en open content 8. Ook de NSF (National Science Foundation) heeft een duidelijk beleid ten aanzien van datapublicatie9. Als publicatie van data verplicht is, zijn „geschikte‟ oplossingen noodzakelijk en in de praktijk zijn deze ook beschikbaar gekomen. Bij de NSF heeft de verplichte paragraaf in het onderzoeksvoorstel over datamanagement ertoe geleid, dat deze paragraaf nu door onderzoekers wordt gebruikt om zich te onderscheiden van anderen. De NSF over de gewenste inhoud van het “Data Management plan”7: This supplement should describe how the proposal will conform to NSF policy on the dissemination and sharing of research results (see AAG Chapter VI.D.4), and may include: 1. 2. 3. 4. 5.
the types of data, samples, physical collections, software, curriculum materials, and other materials to be produced in the course of the project; the standards to be used for data and metadata format and content (where existing standards are absent or deemed inadequate, this should be documented along with any proposed solutions or remedies); policies for access and sharing including provisions for appropriate protection of privacy, confidentiality, security, intellectual property, or other rights or requirements; policies and provisions for re-use, re-distribution, and the production of derivatives; and plans for archiving data, samples, and other research products, and for preservation of access to them.
2.2
Nieuwe ontwikkelingen
Naast de hierboven beschreven bestaande oplossingen voor het ontsluiten van data, zijn er verschillende andere ontwikkelingen en initiatieven die van belang zijn. In de eerste plaats is er de ontwikkeling van e-Research. e-Research kan gedefinieerd worden als het op een coördineerde manier delen van data, tools en kennis tussen onderzoeksinstellingen en onderzoekers die geografisch verspreid zijn om een bepaald doel te bereiken. Het inzetten van ICT speelt hierbij een onderscheidende en belangrijke rol. ICT maakt het online samenwerken mogelijk (bijvoorbeeld via video conferencing en het delen van onderzoeksmiddelen zoals data). e-Research moet het mogelijk maken om sneller en goedkoper tot nieuwe wetenschappelijke doorbraken en innovaties te komen. Om e-Research te faciliteren zijn er verschillende online samenwerkingsplatformen in ontwikkeling. SURFconext10 en MyExperiment11 zijn goede voorbeelden hiervan. MyExperiment is een dienst die e-Research mogelijk maakt door het eenvoudig delen van digitale resources, met name workflows. SURFconext maakt het voor onderzoekers mogelijk om data op een gecontroleerde manier te delen met andere onderzoekers in zogenaamde virtuele samenwerkingsverbanden. Momenteel betreffen dit alleen publieke samenwerkingsverbanden tussen kennisinstellingen, maar verbreding naar publiek-private verbanden is niet uitgesloten. SURFconext zal de huidige op MS Sharepoint gebaseerde SURFgroepen12 dienst voor het delen van content op korte termijn vervangen. SURFgroepen werkt goed voor het delen van Word en PDF documenten maar is minder geschikt voor het delen van onderzoeksdata omdat deze te afwijkend en omvangrijk zijn. SURFconext biedt nog veel meer online samenwerkingsfunctionaliteit dan slechts het delen van content.
7
http://grants.nih.gov/grants/policy/data_sharing http://ec.europa.eu/information_society/digital-agenda/index_en.htm 9 http://www.nsf.gov/bfa/dias/policy/dmp.jsp 10 http://www.surfconext.nl 11 http://www.myexperiment.org 12 http://www.surfgroepen.nl 8
13
Gerelateerd hieraan is het Project Podium Plus13. Het doel van het project is om de drempels voor wetenschappers te verlagen door data-opslag in een applicatie te plaatsen. Uitgangspunt is dat de onderzoeker aan de knoppen zit en bepaalt wie er toegang tot de data krijgt. De onderzoeker kan zelf kiezen met wie hij bereid is zijn data te delen. Er kan toegang worden verleend voor bepaalde gebruikers of er kan voor worden gekozen dat iemand eerst een mailtje aan de onderzoeker stuurt om toegang te vragen. Tot nu toe maken er tien wetenschappers gebruik van deze dienst; deze dienen als voorlopers voor een bredere uitrol. Het project is gericht op de middellange termijn. De lange termijn opslag zou via 3TU Data Centrum/DANS kunnen plaatsvinden. Podium Plus is, net als DiPPP, onderdeel van werkpakket „Toegang tot Onderzoeksdata‟ in het SURFshare programma14. Binnen dit werkpakket valt o.a. ook het CARDS project, waarin men ondersteuning wil bieden aan onderzoekers om hen te helpen om data op een voor hen efficiënte en adequate manier te managen. Onderstaande afbeelding toont de relatie tussen alle projecten binnen dit werkpakket.
Figuur 2. Overzicht van de activiteiten in het werkpakket 'Toegang tot Onderzoeksdata' uit het SURFshare programma
Een ander interessant voorbeeld is het Parelsnoer Initiatief15. Het Parelsnoer Initiatief (PSI) is een samenwerking tussen de acht universitair medische centra (UMC‟s). PSI, opgericht in 2007 door de Nederlandse Federatie van Universitair Medische Centra (NFU), verzamelt op inter-universitair niveau klinische data en biomaterialen. Klinische data worden in de UMC‟s verzameld en vervolgens opgestuurd naar de centrale databank van PSI. Voor het verzamelen van deze data zijn strikte richtlijnen opgesteld. Zo maakt PSI gebruik van pseudonimisatie voor het beschermen van de privacy van de patiënten en moeten onderzoekers eerst toestemming vragen om de data te mogen gebruiken. Om ervoor te zorgen dat alle UMCs op dezelfde wijze klinische gegevens verzamelen en registreren, is het Parelsnoer Informatiemodel (PIM) ontwikkeld. Daarin staan gestandaardiseerde instructies waarmee ICT‟ers van de UMCs applicaties kunnen ontwikkelen voor de registratie en hergebruik van gegevens. Het op eenduidige wijze vastleggen van data in de centrale infrastructuur van PSI maakt het mogelijk om ze onderling te vergelijken. Dit komt de betrouwbaarheid van de onderzoeksresultaten ten goede. Door het gebruik van het PIM is uitbreiding naar nieuwe disciplines in de toekomst eenvoudig mogelijk. http://www.surffoundation.nl/nl/projecten/Pages/PodiumPlus.aspx http://www.surffoundation.nl/toegangtotdata 15 http://www.parelsnoer.org 13
14
14
Ook internationaal wordt er in verschillende projecten aan de weg getimmerd om data voor een bredere groep onderzoekers gemakkelijker beschikbaar te maken. Een voorbeeld hiervan is het CLARIN (Common Language Resources and Technology Infrastructure for the Humanities and Social Sciences) project16. Via dit project moeten digitale archieven in Europa, van bijvoorbeeld media, bibliotheken en musea, op een uniforme manier toegankelijk worden voor onderzoekers en andere belangstellenden. Hiermee moet er straks een eind komen aan de huidige wirwar van technische systemen en copyright- en licentieregels. Basis voor de toegang is een federatie van digitale content providers. Onderzoekers en belangstellenden kunnen via een enkel contract met deze federatie op een uniforme manier toegang krijgen tot alle content. Deze nationale en internationale ontwikkelen laten duidelijk zien dat er op verschillende manieren gewerkt wordt aan het ontsluiten van data. De aanpakken zijn niet gebaseerd op OA maar maken het wel gemakkelijker om data te delen met een bredere groep gebruikers. Hiermee wordt op een andere manier tegemoet gekomen aan het toegankelijk maken van data dat met publieke middelen verkregen is.
2.3
Samenvatting
Op basis van de analyse van de beschikbare oplossingen kan algemeen gesteld worden, dat er niet heel veel oplossingen te vinden zijn. Voor zover er wel oplossingen zijn, zijn deze vaak verbonden aan een bepaalde discipline. Dit zijn vaak de disciplines waarin een sterke behoefte is om data te delen. Deze behoefte heeft ervoor gezorgd, dat een geschikte oplossing is ontstaan. De behoefte gecombineerd met de beschikbare infrastructuur zorgt ervoor, dat het heel gebruikelijk is om onderzoeksdata te publiceren in deze disciplines (of dat het zelfs ongebruikelijk is om dat niet te doen). Voor de meeste oplossingen geldt wel dat deze sterk in ontwikkeling zijn. Deze conclusies worden ook onderschreven door een bericht in Nature17. Dit artikel stelt ook, dat er veel oplossingen worden opgezet, maar dat onderzoekers maar weinig gebruik maken van de geboden oplossingen. Het is naïef om te verlangen, dat onderzoeksdata altijd via Open Access gepubliceerd moet worden. In bepaalde gevallen is dit niet mogelijk of wenselijk. Zoals de huidige implementaties ook laten zien, zullen er altijd mogelijkheden moeten zijn om data (tijdelijk of deels) af te schermen, zodat onderzoekers eerst zelf de investering, in termen van tijd en geld, kunnen terugverdienen bijvoorbeeld als patenten of publicaties. Desondanks zijn er voldoende aandachtspunten voor de huidige implementaties om het (her-)gebruik en het deponeren van onderzoeksdata verder mogelijk te maken en te stimuleren. Er zou meer aandacht besteed moeten worden aan het vindbaar maken van data middels het toevoegen van meta-informatie. Dit zou niet alleen de onderzoekers en het onderzoek moeten beschrijven, maar met name ook de datasets zelf. De ontwikkeling van standaarden op dit gebied (wellicht discipline-afhankelijke standaarden) zijn vereist om versnippering te voorkomen en acceptatie en hergebruik te stimuleren. Voor zover er versnippering optreedt doordat er meerdere standaarden ontstaan binnen een discipline, is het niet ondenkbaar dat er door „marktwerking‟ automatisch consolidatie plaatsvindt; de populairste standaard(en) blijven over, terwijl de minder populaire standaarden zullen verdwijnen. Bij de standaardisatie van metadata moet rekening worden gehouden met de disciplineafhankelijke eisen. Onderzoeksdata is namelijk pas (her)bruikbaar als de context waarbinnen de data verkregen is, volledig duidelijk is. Tegelijkertijd kan een centralisatie en consolidatie van de verschillende oplossingen ervoor zorgen, dat expertise op het gebied van datamanagement optimaal en efficiënt kan worden ingezet. Een centrale oplossing vereist een meer generieke beschrijving van onderzoeksdata. Ook voor multidisciplinair onderzoek heeft een generieke beschrijving de voorkeur, zodat onderzoeksdata uit verschillende disciplines gemakkelijker te 16 17
http://www.clarin.eu Nelson, B. (2009). Data sharing: Empty archives. Nature , 461
15
begrijpen is voor onderzoekers uit andere disciplines. Er moet dus een balans gevonden worden tussen een generieke oplossing en specifieke oplossingen.
Figuur 3. De balans tussen generieke en specifieke oplossingen
Hoewel bij een aantal oplossingen al aandacht wordt besteed aan de langdurige beschikbaarstelling van onderzoeksdata, zou meer onderzoek gedaan moeten worden naar hoe dit het beste kan worden verzorgd. De langetermijnstrategie zal ook invloed (moeten) hebben op de bestandsformaten die geaccepteerd worden voor het deponeren van onderzoeksdata. De voorkeur zal ook moeten gaan naar formaten, die direct bruikbaar zijn als bron voor verder onderzoek en niet specifiek gebonden zijn aan (een bepaalde versie van) een specifiek software product. Om de kwaliteit van de aangeboden onderzoeksdata te garanderen, bieden de conclusies van het onderzoek, zoals beschreven in het rapport „Over kwaliteit van onderzoeksdata‟ (Graaf M. v., 2010) voldoende aanknopingspunten. Ook dit rapport is geschreven in het kader van het SURFshare programma „Toegang tot Onderzoeksdata‟ (zie Figuur 2). Naast de kwaliteit van onderzoeksdata is ook de kwaliteit van de data-archieven van belang. Hiervoor bestaan wel enkele initiatieven, of zijn deze in ontwikkeling. Zo heeft DANS het Data Seal of Approval (DSA) opgesteld en wordt er gewerkt aan een ISO en DIN standaard. Een combinatie van DSA en audits op de standaarden zal leiden tot een classificatie voor repositories in de categorie brons, zilver of goud. Zoals in het onderzoek naar de kwaliteit van onderzoeksdata is gebleken, is er ook voor het publiceren van onderzoeksdata een sterke behoefte aan een discipline-afhankelijke benadering. De grote heterogeniteit zorgt voor verschillende eisen en wensen met betrekking tot dataformaten, standaarden voor de beschrijving van metadata, visualisaties, vindbaarheid, toegankelijkheid, etc. Voor de institutionele en generieke oplossingen is het noodzakelijk om de juiste balans te vinden tussen het aanbieden van algemene en specifieke functionaliteiten. Voor de discipline-specifieke oplossingen is het noodzakelijk om op grote lijnen te zorgen dat bijvoorbeeld metadata eenvoudig gedeeld kan worden en dat unieke identifiers eenduidig worden toegepast. Ondanks het feit, dat er op internationaal niveau wel wordt samengewerkt om de toegang tot onderzoeksdata te faciliteren, blijft er een grote versnippering van oplossingen. Door het ontbreken en/of het beperkte gebruik van een gemeenschappelijke identificatie van (data-)auteurs en datasets (bv. DAIs en DOIs) is het ook niet goed mogelijk om onderzoeksdata van één auteur eenvoudig te lokaliseren in verschillende depots. En zelfs als auteurs herkenbaar zijn in verschillende depots zal het voor de onderzoeker lastig blijven om alle data van een auteur te kunnen vinden. Het vakgebied van datapublicatie is duidelijk volwassen aan het worden; er wordt veel onderzoek gedaan, er zijn veel stappen genomen naar professionalisering van oplossingen en er wordt intensief samengewerkt waar dat mogelijk is. De komende jaren zal deze groei zich ongetwijfeld verder doorzetten en dit zal hopelijk leiden tot een overzichtelijk landschap waarin professionele archieven beschikbaar zijn met voldoende functionaliteiten, zodat onderzoekers hun eigen onderzoeksdata eenvoudig kunnen deponeren, al dan niet met ondersteuning van de archieven, en data efficiënt kunnen hergebruiken en combineren.
16
Naast de technische aspecten zou ook aandacht besteed moeten worden aan de juridische aspecten, zoals de eigendomsrechten van onderzoeksdata, de financieringsvoorwaarden van onderzoeksfinanciers18 (Ringnalda, de Bruin, & de Cock Bunning, 2011).
18
Ringnalda, A., de Bruin, R., & de Cock Bunning, M. (2011). Open Access en Data in Publiek-Private Samenwerkingen bij Onderzoeksfinanciering. CIER. 17
3
Open Access barometer
Dit hoofdstuk bevat een analyse van de interviewresultaten. Voor dit onderzoek zijn negentien – hoofdzakelijk telefonische – interviews gehouden met wetenschappers, medewerkers van kennisinstellingen, uitgevers en de industrie (zie Figuur 4). Een tweetal onderzoekers is tevens editor van een OA tijdschrift. De opinies van deze onderzoekers zijn te vinden onder zowel de noemer „onderzoekers‟ als de noemer „uitgevers‟. Gezien het beperkte aantal geïnterviewden per doelgroep is er geen statistische analyse gedaan van de resultaten, maar zijn de belangrijkste bevindingen verzameld en in een breder verband geplaatst.
Figuur 4. Relatie tussen doelgroepen interviews
De interviews hebben plaatsgevonden aan de hand van een vragenlijst. Per doelgroep is een aparte vragenlijst ontwikkeld met vragen in een aantal categorieën: Open Access publicatie in het algemeen, publicatie van onderzoeksdata, publicatie in publiek-private projecten (van onderzoeksresultaten in de vorm van wetenschappelijke publicaties en de onderliggende onderzoeksdata). In de laatste twee categorieën is ook gevraagd naar de impact van Open Access. De onderzoeksvragen passen allemaal binnen de driedimensionale ruimte, zoals afgebeeld in Figuur 4. De vragenlijsten, die als leidraad hebben gediend tijdens de interviews, zijn te vinden in Appendix B.
3.1
Open Access
3.1.1
Onderzoekers
Onderzoekers zijn allemaal bekend met Open Access als methode om wetenschappelijke artikelen te publiceren, maar bij sommige wetenschappers bestaat de indruk, dat OA tijdschriften van lagere kwaliteit zijn. Dit komt met name door het review proces. Een inzichtelijk en kwalitatief goed review proces is van groot belang en in een aantal interviews was dit een kritiekpunt op de OA tijdschriften. De Open Review van artikelen, waarbij artikelen in een vroeg stadium gepubliceerd kunnen worden en eerst door een publieke review heen gaan, werd door sommigen niet als een betrouwbare methode gezien wegens de ondoorzichtigheid en de mogelijke lage kwaliteit van de vermeende reviewers. Deze kritiek is wellicht gebaseerd op ervaringen uit de beginfase van OA publicatie.
19
In de huidige praktijk gelden voor een groot aantal OA tijdschriften dezelfde eisen met betrekking tot peer review als voor de traditionele tijdschriften. Eén geïnterviewde, die ook editor is van een OA tijdschrift, had ook een aantal argumenten waarom de kwaliteit van OA tijdschriften wel goed (en misschien wel beter is dan bij traditionele tijdschriften): Omdat artikelen direct openbaar gemaakt worden, zorgt OA ervoor dat auteurs erg kritisch staan tegenover de kwaliteit van hun eigen artikelen; De openbare review zorgt ervoor, dat reviewers geen „oneigenlijke‟ argumenten kunnen aandragen waarom een artikel kwalitatief slecht (of juist goed) is; Open review sluit volledig aan bij de moderne manier van communiceren door de review juist openbaar via het internet te laten lopen. De snelheid waarmee sommige OA tijdschriften kunnen publiceren wordt wel gezien als een pré. Daarnaast bieden OA tijdschriften vaker de mogelijkheid om minder wetenschappelijk innovatieve artikelen te publiceren, zoals overzichtsartikelen of afscheidsredes van hoogleraren. Onderzoekers die multidisciplinair onderzoek doen noemen als voordeel van OA, dat ze ook toegang hebben tot artikelen die buiten de reguliere scope van hun onderzoek vallen. Bijvoorbeeld, bij technische universiteiten ontbreekt vaak de toegang tot medische tijdschriften; onderzoekers die multidisciplinair onderzoek doen (bv. op het gebied van techniek en menskunde) hebben hier last van. Het gebruik van OA tijdschriften is sterk wisselend. De doorslaggevende factoren om te kiezen voor een bepaald tijdschrift zijn - voor alle geïnterviewde wetenschappers – de kwaliteit van het tijdschrift, de impactfactor en het lezerspubliek. Open Access is van ondergeschikt belang, hoewel er wel een neiging is om te kiezen voor een OA tijdschrift in het geval er twee gelijkwaardige tijdschriften zijn. Of het feit dat er (meestal) directe kosten mee gemoeid zijn om te publiceren in een OA tijdschrift als een belemmering wordt gezien, lijkt afhankelijk te zijn van het vakgebied of de onderzoeksgroep; sommige groepen hebben „geld zat‟. Voor andere groepen geldt dat de kosten voor een publicatie in geen verhouding staan met de kosten voor het onderzoek (bijvoorbeeld als er gebruik gemaakt wordt van dure apparatuur), maar voor anderen geldt dat de kosten wel degelijk in de afweging wordt meegenomen. Voor deze groepen hebben stimuleringsfondsen zoals bijvoorbeeld het “NWO Stimuleringsfonds voor Open Access” of het “Fonds Open Access publiceren” van de TU Delft wel degelijk een toegevoegde waarde. Dit geldt zeker zolang de kosten voor Open Access publicatie nog niet op grote schaal worden opgenomen in de begroting van een onderzoeksproject. De fondsen die worden opgezet om OA te stimuleren, het opzetten van universiteitsrepositories en het uitdelen van flyers (zoals op de Universiteit van Twente) laten zien dat er op beleidsniveau wel wordt nagedacht over OA. Eén geïnterviewde onderzoeker vermeldde echter wel, dat het beleid van de universiteit niet altijd duidelijk is. Zo is er beperkte duidelijkheid over wie zorgt voor het deponeren van artikelen in de universiteitsrepositories, of dat altijd is toegestaan en wie toegang heeft tot deze databases. Eén onderzoeker noemt het opzetten van nieuwe OA tijdschriften onwenselijk, omdat er al een overdaad aan tijdschriften is waardoor het voor onderzoekers steeds moeilijker wordt om goed zicht te houden op alle voor de onderzoeker relevante artikelen. Het omzetten van bestaande tijdschriften naar OA zou wat deze onderzoeker betreft een beter idee zijn. Eén onderzoeker beschreef hoe het publiceren van een wetenschappelijk paper eigenlijk in de eindfase van het onderzoek zit. In de loop van het onderzoek zijn er al verschillende momenten geweest waarop de onderzoeker zijn onderzoek heeft kunnen delen met zijn peers, bijvoorbeeld op congressen en conferenties. De kennis is dus grotendeels al gedissemineerd. Het publiceren is in dat geval eigenlijk niets meer dan het opschrijven van het onderzoek, zodat de onderzoeksfinanciers de impact van het onderzoek (in de vorm van citaties) kunnen beoordelen. De perceptie van de kwaliteit van een OA tijdschrift bepaalt zowel de bereidheid om in zo‟n tijdschrift te publiceren als de belangstelling om zo‟n tijdschrift te gebruiken als bron van informatie.
20
3.1.2
Uitgevers
Kengetallen STM (International Association of Scientific, Technical and Medical Publishers) [5] • • • • • • • • • • • •
2000 uitgevers, waarvan 30% wetenschappelijke societies, 4% universitaire uitgevers en 64% onafhankelijke uitgevers 110.000 – 120.000 werknemers 16 miljard dollar omzet in 2008 5.5 miljoen onderzoekers 25.400 peer-reviewed wetenschappelijke tijdschriften 1.5 miljoen artikelen per jaar Meer dan 90% van de artikelen is online beschikbaar 1.5 miljard artikelen worden per jaar gedownload Onderzoekers lezen ongeveer 270 artikelen per jaar en besteden ongeveer 30 minuten per artikel Reviewers reviewen ongeveer 8 artikelen per jaar en besteden ongeveer 5 uur per review 3400 – 4300 peer-reviewed OA tijdschriften 2% artikelen gepubliceerd in OA tijdschriften, 5% artikelen gepubliceerd onder „delayed‟ OA, minder dan 1% in hybride model
Ondanks het feit, dat de markt voor OA nog steeds vrij klein is (ongeveer 5% van de wetenschappelijke publicaties wordt beschikbaar gemaakt via OA), houden de geïnterviewde uitgevers zich wel met dit onderwerp bezig en bieden ze ook mogelijkheden voor OA publicatie aan. Eén geïnterviewde partij noemt zichzelf zelfs een OA uitgever. De mogelijkheden voor OA publicatie behelzen zowel de „gouden‟ weg (het publiceren in tijdschriften die volledig OA zijn) als de „groene‟ weg (publicatie van artikelen door de auteur in het repository van de universiteit of in een thematisch archief), maar ook „delayed‟ OA toegang is gebruikelijk. Hierbij worden artikelen na een bepaalde tijd, typisch 12 maanden, toegankelijk voor iedereen. Ook zijn er zogeheten hybride tijdschriften waarin de auteur per artikel zelf voor OA kan kiezen. Zolang de uitgever betaald wordt voor de geleverde diensten (bv. organiseren van de review en het publiceren en beschikbaar stellen van de artikelen) maakt het niet zoveel uit of dit gebeurt via abonnementsgelden die betaald worden (bv. door universiteitsbibliotheken) of dat de auteur (bv. via de onderzoeksfinancier) betaalt voor de publicatie van een artikel. “Many publishers remain concerned that Green open access (self-archiving) is essentially parasitical on journal publishing, with no sustainable business model of its own should it (as they fear) undermine journal subscriptions”, The STM Report19 Bij het bepalen van een impactfactor zoals gemeten door Thomson Reuters, die door veel onderzoeksfinanciers gebruikt wordt als kwaliteitskenmerk voor onderzoekers, hebben nieuwe (OA) tijdschriften een nadeel, omdat er pas na drie jaar een impactfactor berekend kan worden. Doordat de impactfactor van een tijdschrift een belangrijk argument is voor de tijdschrift-keuze van een onderzoeker hebben deze nieuwe tijdschriften dus last van een lage impactfactor. Hiermee is een vicieuze cirkel ontstaan, die doorbroken zal moeten worden. Een OA onderzoeker-editor20 beschreef dat ook het omgekeerde het geval is: een tijdschrift met een hoge impactfactor zal veel worden gelezen en de artikelen daarin zullen veel worden geciteerd en auteurs zullen graag in zo‟n tijdschrift willen publiceren. Hierdoor blijft de impactfactor hoog. Deze vicieuze cirkels (zie Figuur 5) zorgen ervoor, dat de „massa‟ van onderzoekers slechts traag richting OA beweegt. Een alternatief voor het opzetten van een nieuw OA tijdschrift is daarom het omzetten van een bestaand tijdschrift naar OA. Binnen het project „Clearing the gate‟21 zal onderzocht worden hoe onderzoeksfinanciers deze vicieuze cirkels kunnen doorbreken.
19
Mark Ware, M. M. (2009). The stm report: An overview of scientific and scholarly journal publishing. Oxford: International Association of Scientific, Technical and Medical Publishers. 20
21
Een onderzoeker, die tevens editor is van een OA tijdschrift
SURFfoundation. (2011). Clearing the gate, Leaflet. unpublished. 21
Figuur 5. Twee vicieuze cirkels, die de adoptie van OA remmen
Een geïnterviewde wees ook op de beperkingen van de huidige berekeningen en over de initiatieven van PLOS op dit gebied om tot een eerlijkere meting van de impact van onderzoek te komen op basis van metingen op artikel-niveau22. So • • • • • • •
far the data […for article-level metrics…] includes: Article usage statistics - HTML pageviews, PDF downloads and XML downloads Citations from the scholarly literature – currently from PubMed Central, Scopus and CrossRef Social bookmarks - currently from CiteULike and Connotea Comments – left by readers of each article Notes – left by readers of each article Blog posts – aggregated from Postgenomic, Nature Blogs, Bloglines and ResearchBlogging. Ratings – left by readers of each article
Het argument van de onderzoekers met betrekking tot de impactfactor, zoals beschreven in de vorige sectie, wordt niet altijd zuiver gebruikt volgens een geïnterviewde uitgever. Ondanks het feit dat dit voor nieuwe tijdschriften wel wordt onderschreven, zijn er ook bestaande tijdschriften met een goede impactfactor, die de mogelijkheid bieden tot OA publicatie. Ook bij deze tijdschriften wordt niet op grote schaal gebruik gemaakt van de mogelijkheid voor OA. Ook het argument dat OA ervoor zorgt, dat derdewereldlanden ook toegang moeten kunnen krijgen tot de resultaten van onderzoek, werd door een geïnterviewde uitgever als grotendeels achterhaald bestempeld. In 2000 is in samenwerking met de Wereldhandelsorganisatie (WHO) het HINARI23 (Health InterNetwork Access to Research Initiative) programma opgezet waarmee ontwikkelingslanden gratis, vrije toegang krijgen tot artikelen in de biomedische en gezondheidswetenschappen. In 2003 heeft dit programma met AGORA (Access to Global Online Research in Agriculture) navolging gekregen op het gebied van agrarische wetenschappen en in 2006 met OARE (Online Access to Research in the Environment) op het gebied van de milieuwetenschappen. Een OA onderzoeker-editor vertelde dat niet alleen onderzoekers in derdewereldlanden last hebben van de beperkte toegankelijkheid tot belangrijke onderzoeksresultaten, maar ook veel onderzoekers in de „westerse‟ wereld hebben geen toegang tot alle relevante betaalde tijdschriften. Deze onderzoeker beschreef ook hoe deze programma‟s
22 23
http://article-level-metrics.plos.org/ http://www.who.int/hinari
22
onder druk van de trend tot OA zijn opgezet. Zonder OA zou dit, volgens deze onderzoeker, niet gebeurd zijn. Deze OA onderzoeker-editor noemde ook het business model van de traditionele uitgevers achterhaald. Het belang om te publiceren (en daarmee geciteerd te worden) ligt immers bij de auteur van een artikel en het is dus ook niet vreemd om daar ook de kosten neer te leggen. Daarnaast zorgen de huidige contracten met de uitgevers ervoor, dat er ook veel „lucht‟ wordt verkocht, dat willen zeggen, dat er door universiteiten betaald wordt voor tijdschriften en artikelen, die niet gebruikt en gelezen worden. Het model waarbij de auteur betaalt, zal dus altijd efficiënter zijn. 3.1.3
Bedrijven
Individuele onderzoekers van bedrijven worden over het algemeen niet afgerekend op basis van de wetenschappelijke output. De impact factor is dan ook minder van belang. Toch blijft het voor het bedrijf als geheel belangrijk om zichtbaarheid te creëren in de wetenschappelijke wereld. Daarmee worden argumenten ten aanzien van het verkrijgen van impact, zoals genoemd door academische onderzoekers, ook voor het bedrijfsleven relevant. Het belang van zichtbaarheid en reputatie in de wetenschappelijke wereld is voor sommige bedrijven ook belangrijk om voor onderzoekers een interessante werkgever te zijn. Er lijkt daarbij geen specifieke voor- of afkeur te bestaan voor het publiceren in een OA tijdschrift. Dat er voor het publiceren in een OA tijdschrift directe kosten voor (de werkgever van) de auteur van toepassing zijn, kan ook voor bedrijven invloed hebben op de keuze in welk tijdschrift gepubliceerd zal worden. Voor bedrijven zijn patentaanvragen vaak veel belangrijker dan wetenschappelijke publicaties, omdat ze daarmee hun uitvindingen kunnen beschermen. Dit komt enerzijds overeen met het uitgangspunt van OA met betrekking tot het publiek maken van resultaten, maar anderzijds lijnrecht tegenover het uitgangspunt, dat deze resultaten vrij bruikbaar moeten zijn. Ook als er geen patentaanvragen worden gedaan en onderzoeksresultaten ook niet gepubliceerd worden in wetenschappelijke tijdschriften, worden onderzoeksresultaten wel intern beschreven, bijvoorbeeld om het omzetten van onderzoek naar een product te faciliteren.
3.2
Publicatie van onderzoeksdata
3.2.1
Onderzoekers
In de wetenschappelijke wereld bestaat een zeer grote verscheidenheid aan opvattingen over wat onderzoeksdata is. Dit blijkt ook sterk afhankelijk van het vakgebied en bepaalt ook deels wat onderzoekers willen publiceren (en gepubliceerd zouden willen zien). Voor sommige onderzoekers betreft het meetresultaten, anderen noemen figuren en diagrammen, beelden, protocollen en algoritmes of analysesoftware. Figuur 6 toont een classificatie van onderzoeksdata24 waarbij een onderscheid wordt gemaakt tussen kwantitatieve data (bv. experimentele data), kwalitatieve data (bv. annotaties of foto‟s), originele samples (bv. biologische monsters) en research tools (bv. computer software of protocollen).
24
Data Acquisition, Ownership, Management and Sharing. (n.d.). (Eastern Michigan University) Retrieved February 23, 2011, from Responsible Conduct in Research Institution: http://www.rcr.emich.edu/module3/c_7acquisition.html 23
Figuur 6. Classificatie van data: kwantitatief (links boven), kwalitatief (rechts boven), originele samples (links onder), research tools (rechts onder)
In veel gevallen is het niet duidelijk welk type onderzoeksdata gepubliceerd zou moeten worden: zijn het de aan een artikel onderliggende onderzoeksdata in de vorm van x,y-waarden waarop een grafiek is gebaseerd of gaat het om alle data, die gebruikt is om het artikel te kunnen schrijven (zodat het onderzoek gereproduceerd kan worden) of gaat het om alle onderzoeksdata die tijdens het onderzoek verkregen is. Figuur 7 toont een classificatie van data, waarbij de grafische representatie van data (bv. grafieken of lage resolutie beelden) over het algemeen gepubliceerd wordt in een wetenschappelijk artikel, de verwerkte data (bv. tabellen of geconstrueerde hoge-resolutie beelden) als verrijking kan worden toegevoegd bij een verrijkte publicatie en de ruwe(re) data (bv. meetdata en –signalen) separaat als onderzoeksdata bij een data-archief gepubliceerd kan worden. De onderzoeksdata die in het wetenschappelijke artikel terecht komt is in de meeste gevallen voldoende om het onderzoek goed te kunnen begrijpen, maar de verwerkte of de ruwe data is nodig om het onderzoek te kunnen controleren of reproduceren.
24
Figuur 7. Classificatie van data (van boven naar beneden): ruwe data, verwerkte data, grafische representatie van data (Data Acquisition, Ownership, Management and Sharing)
Het is ook niet altijd duidelijk wat „alle‟ onderzoeksdata inhoudt (Figuur 8). In veel gevallen wordt een dataset verzameld, die gebruikt kan worden voor meerdere wetenschappelijke artikelen (bv. een longitudinale studie van LISS, de DNA sequentie van een micro-organisme of een acquisitie van LOFAR). Dit kan op verschillende manieren gebeuren. In de eerste plaats kan de analyse van de volledige dataset leiden tot verschillende inzichten, die tot verschillende artikelen kunnen leiden. Ook kan een volledige dataset op verschillende manieren gebruikt worden (bv. eerst wordt gekeken naar één set van parameters en vervolgens naar een ander set); op deze manier wordt de dataset dus meerdere keren volledig deels gebruikt en leidt dit zo tot verschillende publicaties. Tenslotte kan een dataset ook zoveel informatie bevatten, dat de analyse van een deel van de dataset (bv. 100 van de 10000 experimenten) al tot een publicatie kan leiden; op deze manier kan één dataset dus meerdere keren deels volledig worden gebruikt. Welk deel van de dataset in elk van deze gevallen gepubliceerd moet worden, is niet altijd eenvoudig te bepalen.
25
Figuur 8. Volledige dataset, dataset die volledig deels gebruikt is, dataset die deels volledig gebruikt is
Extra complicaties die door onderzoekers genoemd zijn, zijn de dynamiciteit en de „halfwaardetijd‟ van datasets. Sommige datasets zijn constant aan verandering onderhevig of worden zeer regelmatig aangevuld met nieuwe data. Het versiebeheer en het verwijzen naar dit soort datasets levert additionele eisen aan de technische oplossing. In sommige vakgebieden gaan de ontwikkelingen dusdanig snel, dat datasets hun wetenschappelijke waarde snel verliezen (bv. een specificatie van een Integrated Circuit (IC) uit 2010 zal de voorkeur genieten boven die uit 2008). Het opzetten van archieven waarin dit soort datasets gedeeld kunnen worden, heeft dan dus niet zoveel toegevoegde waarde Naast onderzoeksdata wordt ook regelmatig supplementaire of verrijkende data genoemd. Dit betreft data, waarvoor geen plaats is in het artikel en die ook niet strikt noodzakelijk is om het artikel te kunnen begrijpen, maar die wel een ondersteunende functie kunnen hebben, zoals additionele figuren, tabellen, foto‟s, video‟s, analyse software, etc.. Veel tijdschriften bieden de mogelijkheid om supplementaire data (online) toe te voegen aan een publicatie. Onderzoekers zien dit als een positieve ontwikkeling en maken hier graag gebruik van. Voor het wel of niet publiceren van onderzoeksdata zijn verschillende argumenten genoemd. De volgende belemmeringen worden gezien: • Het is veel werk voor de onderzoeker om al zijn data op een goede manier te managen en publiek te maken op een manier dat anderen er wat mee kunnen; • Het ontbreken van standaarden voor het beschrijven van de metadata speelt in een aantal vakgebieden een grote rol; • Onderzoekers worden beoordeeld op basis van wetenschappelijke publicaties; datapublicaties leveren „niets‟ op; • Onderzoekers staan te weinig stil bij het belang van datamanagement en datapublicatie. • Onderzoeksdata kan verkeerd geïnterpreteerd of zelfs misbruikt worden; • Andere onderzoekers kunnen fouten ontdekken aan de hand van gepubliceerde onderzoeksdata en/of met „lastige‟ vragen komen; • Onderzoeksdata mag niet gepubliceerd worden in verband met privacy; • Onderzoeksdata kan niet gepubliceerd worden, omdat het voor anderen onmogelijk is om alle omstandigheden waaronder data verzameld is, goed te begrijpen; • Ook als onderzoeksdata beschreven is in een wetenschappelijke publicatie kunnen (ongepubliceerde) details nodig zijn om onderzoek te kunnen reproduceren; • Onderzoeksdata is verkregen op een dusdanig unieke wijze, dat deze niet bruikbaar is voor anderen; • Het verkrijgen van onderzoeksdata is dusdanig kostbaar geweest dat de onderzoeker deze eerst zelf optimaal wil benutten; • Onderzoeksdata geeft een voorsprong op concurrerende groepen; • Onderzoeksdata is verkregen in samenwerking met private partijen (zie ook sectie 3.3); • Het controleren van onderzoek met behulp van de onderliggende onderzoeksdata zal toch (bijna) niet gebeuren, omdat dit zeer tijdrovend is; • Het eigendomsrecht van de onderzoeksdata is niet altijd duidelijk. Dit geldt in het bijzonder ook voor onderzoeksdata die verkregen is in afgeronde samenwerkingsverbanden;
26
• • •
Er is geen beloning voor het publiceren van onderzoeksdata (bv. in de vorm van citatie scores); Het wordt nauwelijks verplicht noch gestimuleerd door de onderzoeksfinanciers; Er is al zoveel informatie, dat het voor onderzoekers steeds moeilijker wordt (ie. steeds meer tijd kost) om al het relevante onderzoeker te lezen. Als er ook nog onderzoeksdata gepubliceerd zou worden, zou er geen tijd meer overblijven voor het eigen onderzoek.
Figuur 9. Onderzoekers worden 'bedolven' onder een overvloed aan informatie
•
Het wetenschappelijke artikel bevat alle informatie, die nodig is om onderzoek te begrijpen (en eventueel te herhalen of controleren); het is niet nodig om de onderzoeksdata te publiceren.
De volgende redenen om onderzoeksdata wel te publiceren zijn genoemd door de geïnterviewden: • • •
•
Publicatie van onderzoeksdata maakt controle van onderzoek mogelijk; Artikelen, die (een link naar) onderzoeksdata bevatten worden meer gelezen en meer gerefereerd; Publicatie van onderzoeksdata maakt hergebruik en combinatie van onderzoeksdata mogelijk. Combinatie van verschillende datasets (uit verschillende wetenschappelijke disciplines) kunnen leiden tot nieuwe inzichten en nieuwe onderzoeksgebieden; Publicatie van onderzoeksdata kan werk besparen van onderzoekers, die willen voortbouwen op het onderzoek. De „traditionele‟ situatie, waarin een onderzoeker onderzoeksdata (bv. een model) „omzet‟ in een wetenschappelijk artikel en een andere onderzoeker dit wetenschappelijke artikel weer om moet zetten in bruikbare onderzoeksdata (bv. het model) kan worden vereenvoudigd. Dit is schematisch weergegeven in Figuur 10;
27
Figuur 10. Rol van onderzoeksdata en de mogelijkheden van publicatie geïnspireerd door Data Tutorial25
• • •
Er is zoveel onderzoeksdata, dat deze niet allemaal door de onderzoeksgroep zelf verwerkt kan worden; Onderzoeksdata is uiteindelijk van „de gemeenschap‟ en niet van de onderzoeker; Publicatie van onderzoeksdata is verplicht door het tijdschrift waarin het wetenschappelijke artikel gepubliceerd wordt.
Een opmerking moet geplaatst worden bij het „privacy‟ argument, dat vaak snel genoemd wordt als het om onderzoek gaat waarbij mensen (patiënten) betrokken zijn. Er zijn echter ook onderzoekers, die de regels zodanig interpreteren dat onderzoeksdata – mits op de juiste wijze geanonimiseerd – wel gepubliceerd kan worden. Deze onduidelijkheid zorgt ervoor, dat onderzoekers snel geneigd zijn om privacy-gevoelige onderzoeksdata niet te publiceren. Het rapport “De juridische status van ruwe data; een wegwijzer voor de onderzoekspraktijk”26 besteedt uitgebreid aandacht aan dit vraagstuk. Dat een onderzoeker geen voorstander is van de publicatie van onderzoeksdata (ofwel via OA ofwel op andere wijze) betekent overigens niet, dat een onderzoeker geen data wil delen. In consortia, maar ook in informele samenwerkingsverbanden wordt veel onderzoeksdata uitgewisseld. Meerdere onderzoekers hebben aangegeven juist voorstander te zijn van een min of meer persoonlijke peer-to-peer uitwisseling van onderzoeksdata, omdat de onderzoeker op deze manier volledige controle houdt over het gebruik van de dataset en ervoor kan zorgen, dat de data juist geïnterpreteerd wordt. Als er sprake is van onderzoeksdata met een beperkte houdbaarheid, zorgen de onderlinge contacten er ook voor, dat er met de nieuwste inzichten en resultaten kan worden gewerkt. Onderzoekers vinden elkaar (en elkaars datasets) naar aanleiding van wetenschappelijke artikelen of tijdens wetenschappelijke bijeenkomsten. Deze contacten leiden dan vervolgens weer tot nieuwe samenwerkingsverbanden. De geïnterviewde onderzoekers hebben niet aangegeven dat er behoefte is aan formalisering van deze informele samenwerkingsverbanden. Op deze manier is het delen van data door onderzoekers dus reactief in plaats van proactief.
25
Data Tutorial. (n.d.). (UCLS - College of Letters and Science - Division of Social Sciences) Retrieved February 23, 2011, from ISSR Social Science Data Archive: http://www.sscnet.ucla.edu/issr/da/tutor/tutdata.htm 26 de Cock Bunning, M., Ringnalda, A., & van der Linden, T. (2009). De juridische status van ruwe data; een wegwijzer voor de onderzoekspraktijk. Utrecht: Stichting SURF. 28
Met betrekking tot het ontbreken van een beloningsstructuur voor het publiceren van data worden een aantal oplossingen gebruikt en genoemd. In de eerste plaats kan men verwijzen naar een artikel waarin de dataset oorspronkelijk beschreven is. Op deze manier wordt de bestaande citatiesystematiek „misbruikt‟. Een andere oplossing, die met name goed bruikbaar is als er daadwerkelijk wordt samengewerkt, is het opnemen van de onderzoeker die de dataset gegenereerd heeft als medeauteur van een artikel. Als onderzoekers data willen delen, stellen ze daar vaak wel een belangrijke voorwaarde bij; namelijk dat de onderzoeker zelf het eigendom (copyrights) en controle houdt over de toegang tot de data. Ze doen dit bij voorkeur in eigen beheer. Deze voorwaarde komt enerzijds voort uit de beweegredenen zoals hierboven beschreven (bv. angst voor misbruik, angst voor misinterpretatie, veroudering van de resultaten), maar er zit ook een minder concrete kant aan. Veel onderzoekers houden gewoon graag de controle over hun „eigen‟ onderzoeksdata. Het beperken van de toegang gaat wel in tegen het uitgangspunt van OA, dat resultaten voor iedereen vrij toegankelijk moeten zijn. “Daarom hanteert DANS het principe „Open als het kan, beschermd als het moet‟ ”, Over DANS27 De stelling “wat met publiek geld gefinancierd is, moet ook publiek toegankelijk worden”, wordt wel algemeen onderschreven, maar niet altijd op dezelfde manier geïnterpreteerd met betrekking tot het publiceren van onderzoeksdata. Een geïnterviewde onderzoeker beweerde bijvoorbeeld, dat de wetenschappelijke publicatie voldoende is en dat deze stelling niet van toepassing is op de onderliggende onderzoeksdata. Als onderzoeksdata gepubliceerd wordt, is vindbaarheid en bruikbaarheid niet altijd gegarandeerd. De geïnterviewde onderzoekers noemen het ontbreken van geschikte metadata-standaarden en dataformaten als belemmering (en als eis voor een geschikte oplossing voor het openstellen van onderzoeksdata). De meeste onderzoekers benoemen ook het belang van een embargo periode waarin de onderzoeker alleen zelf toegang heeft tot de onderzoeksdata. Dit moet door de oplossingen gefaciliteerd worden. Eén onderzoeker beschreef hoe andere onderzoekers datasets wel beschikbaar maken (bv. als dat verplicht wordt door een tijdschrift), maar dan op een wijze waarop deze data nooit door anderen gebruikt kan worden (bv. door het gebruiken van eigen bestandsformaten, het publiceren van lage resolutie foto‟s of het (laten) ontbreken van metadata). In sommige gevallen willen onderzoekers zelf de volledige controle houden over de datasets en publiceren deze datasets dan via hun eigen website. Dit levert grote problemen op met betrekking tot vindbaarheid. De beschikbaarheid op de lange termijn kan op deze manier niet gegarandeerd worden. Zo refereerde één geïnterviewde onderzoeker naar een dataset die door deze onderzoeker in het verleden gepubliceerd was, maar die nu niet meer is terug te vinden. Als de publicatie van onderzoeksdata verplicht zou worden gesteld door onderzoeksfinanciers, is het belangrijk dat dit bij aanvang van een project reeds bekend is. Het is, zoals hierboven al beschreven, voor de onderzoeker tijdrovend en niet eenvoudig om de onderzoeksdata op zo‟n manier te beheren en beschrijven, dat deze gepubliceerd kan worden. Dit wordt nog veel tijdrovender en gecompliceerder als dit pas achteraf wordt geëist. Onderzoeksfinanciers zouden het proces van data-aggregatie, -opslag, -beheer en –archivering kunnen faciliteren door bijvoorbeeld training of het aanbieden van best-practices. Het delen van onderzoeksdata is tenslotte slechts een klein deel van de onderzoekscyclus, zoals afgebeeld in Figuur 11. Aandacht voor datamanagement zal niet alleen leiden tot betere vaardigheden op dit gebied, maar ook voor meer bewustwording voor het belang hiervan.
27
http://www.dans.knaw.nl/content/over-dans
29
Figuur 11. Cyclus van onderzoeksdata
De plaats waar data gepubliceerd wordt, maakt voor de onderzoekers die data willen publiceren, niet zoveel uit. Dit mag door uitgevers georganiseerd worden, maar ook door instituut of disciplinegerelateerde organisaties. Een belangrijke voorwaarde is echter wel, dat er voldoende (inhoudelijke) kennis van zaken is, dat opslag voor de lange termijn gegarandeerd is en dat de data makkelijk vindbaar is. Dit betekent bijvoorbeeld, dat er vanaf het wetenschappelijke artikel in ieder geval een link zou moeten zijn naar de bijbehorende onderzoeksdata. Volgens één geïnterviewde onderzoeker is zo‟n link zeker vereist omdat onderzoeksdata alleen relevant is in de context van het artikel. Stellingen vanuit deelnemers SURFnet seminar “Datamanagement en researchinfrastructuren” op 7 april 2011 over uitdagingen van datamanagement28: • • • • •
Onderzoekers en beleidsmakers hebben geen interesse in datamanagement Structurele financiering datamanagement nodig Instellingen missen actieve houding m.b.t. opslag en vrijgeven onderzoeksdata Focus van datamanagement ligt teveel op techniek, i.p.v. culturele aspecten Kostenbewustzijn van dataopslag moet meer aandacht krijgen
3.2.2
Uitgevers
De positie van de wetenschappelijke uitgevers op het gebied van Open Access, maar ook op het gebied van de publicatie van onderzoeksdata is reeds in november 2007 uiteengezet in de „Brussels Declaration on STM Publishing‟29. De geïnterviewde uitgevers onderschrijven deze verklaring nog steeds. De geïnterviewde uitgevers zien niet direct een rol voor de uitgevers in de publicatie en lange termijn bewaring van onderzoeksdata zelf. Dat wil zeggen, de opslag van onderzoeksdata zou plaats moeten vinden in institutionele of thematische archieven en niet in de database van de uitgevers. Voor zover uitgevers nu wel mogelijkheden bieden voor het publiceren van data doen ze dit vooral ter ondersteuning van het artikel en met name naar aanleiding van de wensen van hun klanten, de onderzoekers. Ze zien deze dienst vooral als een vanzelfsprekende uitbreiding van de bestaande diensten en zien (vooralsnog) geen geschikt betalingsmodel om hier geld mee te verdienen. Het probleem van het gebrek aan standaardisatie in metadata-formaten en de verscheidenheid aan bestandsformaten wordt wel onderkend door de uitgevers, maar zij zien hierin vooral een rol voor de onderzoekers en vakgebieden zelf. 28 29
http://www.surf-academy.nl/archief/event/?id=388 http://www.stm-assoc.org/public_affairs_brussels_declaration.php
30
Aangezien de processen rondom de publicatie van artikelen en onderzoeksdata wel grote gelijkenissen vertonen, zien uitgevers wel hun toegevoegde waarde in het begeleiden van dit proces. Hierbij wordt gedacht aan het integreren van het uploaden van datasets in een bepaald repository met het uploaden van het artikel of het organiseren van een peer-review proces rondom datasets. Een belangrijk deel van de discussie rond het faciliteren van de publicatie van onderzoeksdata door uitgevers is het business model. Geen van de geïnterviewde uitgevers ziet hier echter mogelijkheden; het faciliteren van verrijkte publicaties wordt veelal gezien als additionele dienst. Een uitgever heeft in een pilot-project wel de kosten onderzocht van een verrijkte publicatie; ten opzichte van een „gewone‟ publicatie lagen de kosten ongeveer 2 keer zo hoog! Deze kosten zaten met namen in de extra begeleiding van de auteur, het maken van verbindingen tussen de data en het artikel en redactionele aandacht hiervoor en voor de representatie van de gepubliceerde data door middel van speciale tools. Eén geïnterviewde uitgever zag ook een rol voor de uitgevers in het bruikbaar maken (en houden) van de gepubliceerde onderzoeksdata en ontwikkelt hier ook tools voor. Een andere geïnterviewde geeft hierbij wel aan dat er gezocht wordt naar uniforme oplossingen voor de grote verscheidenheid aan problemen. “Iedereen is op zoek naar de silver bullet.”, geïnterviewde uitgever “One size fits all” solutions will not work.”, Brussels declaration Zoals eerder beschreven zijn de onderzoekers op het moment dat een artikel geschreven wordt meestal al bezig met nieuw onderzoek en hebben minder aandacht voor het afronden van het „oude‟ onderzoek. Deze beperkte betrokkenheid kan dan volgens een geïnterviewde ook voor een gebrek aan motivatie zorgen om de onderzoeksdata nog gereed te maken voor publicatie. 3.2.3
Bedrijven
Bedrijven publiceren zelf nauwelijks onderzoeksdata die gegenereerd wordt uit eigen onderzoek. De belangrijkste reden die hiervoor wordt aangedragen is dat onderzoeksdata commerciële waarde hebben, die verloren gaat als deze (OA) gepubliceerd zou worden. Het feit, dat onderzoeksdata commerciële waarde heeft, zorgt niet alleen bij bedrijven voor een terughoudendheid op het gebied van de publicatie van onderzoeksdata. Doordat onderzoekers ook steeds meer toepassingsgericht, en daarmee commerciëler, (moeten) werken, wordt dit argument ook door onderzoekers regelmatig genoemd. Net als bij academische onderzoekers stuit het delen van onderzoeksdata binnen samenwerkingsverbanden (met andere bedrijven of universiteiten) voor bedrijven op minder weerstand, zolang de onderliggende overeenkomsten maar duidelijk zijn met betrekking tot het publiceren van de resultaten. Dat wil zeggen, zolang de bedrijven maar de mogelijkheid hebben om publicatie van resultaten tegen te houden, zodat bijvoorbeeld een patent aangevraagd kan worden. Anderzijds kan het publiceren van onderzoek er overigens ook voor zorgen, dat anderen (bv. concurrenten) bepaalde uitvindingen niet meer kunnen patenteren, waardoor de uitvinding dus bijvoorbeeld bruikbaar blijft voor het hele vakgebied. Het publiceren van onderzoeksdata impliceert mogelijk ook een onderhoudsverplichting cq. een verplichting om in te staan voor een zekere kwaliteit. Voor bedrijven zal het eventueel publiceren van onderzoeksdata dan ook mogelijk gepaard gaan met uitgebreide disclaimers en eisen ten aanzien van integriteit en authenticiteit. Bedrijven hebben niet alleen moeite met het publiceren van hun eigen onderzoeksdata, maar ook als een bedrijf zou willen investeren in het commercialiseren van (publiek betaald) onderzoek, is het wel wenselijk, dat dit onderzoek niet reeds publiek gemaakt is.
31
Net als bij universiteiten is ook binnen bedrijven datamanagement niet altijd even goed georganiseerd, waarbij het wel duidelijk is dat onderzoeksdata beter beheerd en beschreven wordt (en dus beter voor publicatie gereed is) naarmate het onderzoek meer het karakter van productontwikkeling krijgt. De onderzoeksdata in latere stadia van productontwikkeling heeft echter een veel grotere commerciële waarde waardoor deze – vanuit bedrijven gezien – weer minder voor publicatie geschikt is. Het standpunt van bedrijven ten aanzien van het publiceren van onderzoeksdata in publiek-private projecten wordt verder beschreven in sectie 3.3.3.
3.3
Publiceren in publiek-private projecten
3.3.1
Onderzoekers
Publiek-private projecten zijn projecten waarin een private onderneming en een publiek gefinancierde instelling samenwerken waarbij de private onderneming een deel van de investering voor zijn rekening neemt. In publiek-private projecten moet een balans gevonden worden tussen de belangen van de onderzoeker en de belangen van het bedrijf dat het onderzoek deels financiert. Over het algemeen betekent dit, dat bedrijven de mogelijkheid hebben om een patent of octrooi aan te vragen op het moment dat het resultaat dit mogelijk maakt. Voor de onderzoeker betekent dit meestal uitstel, maar geen afstel, van publicatie. Een dergelijke vertraging, van typisch enkele maanden, is voor veel onderzoekers geen probleem. Verschillende geïnterviewde onderzoekers noemen, dat wetenschappelijke publicaties ook voor het bedrijfsleven van belang zijn. Ze kunnen daarmee bijvoorbeeld laten zien hoe hoogstaand hun product of dienstverlening is. “OA in het algemeen en voor data in het bijzonder botsen met het uitgangspunt van STW om participerende bedrijven in gesubsidieerde projecten een „competitive edge‟ te geven.”, geïnterviewde onderzoeker Met betrekking tot het publiceren in publiek-private projecten worden door de wetenschappers een aantal belemmeringen genoemd. De meest genoemde belemmering voor de publicatie van onderzoeksdata in publiek-private projecten is dat er voor private partners geen of nauwelijks motivatie is om onderzoeksdata te publiceren; integendeel, onderzoeksdata levert voor de industrie vaak een unieke positie, die commercieel van groot belang is. Een geïnterviewde onderzoeker stelde, dat ook onderzoek dat niet gunstig is voor een bedrijf, gepubliceerd wordt. Dit betekent dus, dat er situaties zijn waarin een bedrijf er belang bij heeft om onderzoeksresultaten niet te publiceren, omdat het negatieve effecten kan hebben op de business van zo‟n bedrijf. Dit zou dan een reden kunnen zijn voor een bedrijf om de publicatie van de resultaten (in de vorm van een wetenschappelijke artikel dan wel in de vorm van onderzoeksdata) tegen te houden. Het hangt in dat geval af van de gemaakte afspraken en de onderzoeker af of dit toch gebeurt. In het geval van langdurige samenwerking tussen een onderzoeksgroep en een bedrijf heeft ook de onderzoeker een belang om de relatie goed te houden en dus ervoor te kiezen, dat onderzoek niet gepubliceerd wordt. Het belang van de relatie geldt overigens ook bij onderzoeksresultaten die een grote commerciële waarde hebben voor een bedrijf. Een andere onderzoeker vroeg zich af wie zich sterk gaat maken voor de publicatie van onderzoeksdata in publiek-private projecten. Zoals hiervoor al gesteld, zijn er genoeg redenen te noemen waarom onderzoeksdata niet gepubliceerd zou moeten worden. Op dit moment is er dus geen partij die het publiceren stimuleert. De meeste geïnterviewde onderzoekers zien hier vooral een rol voor de financiers van onderzoek. De wijze waarop onderzoeksdata verkregen is, is volgens een geïnterviewde onderzoeker wel van belang voor het al dan niet publiceren van deze onderzoeksdata. Als de investering van een bedrijf in een bepaald project vooral bestaat uit het inbrengen van data die binnen het bedrijf zelf is verkregen, is het een stuk minder waarschijnlijk, dat ze genegen zijn deze data te publiceren dan
32
als de investering van de bedrijven bestaat uit het financieren van onderzoekers, die op de universiteit data genereren. Op het moment dat universiteiten en bedrijven gaan samenwerken op het gebied van onderzoek worden altijd afspraken gemaakt over de publicatie van onderzoeksresultaten. De geïnterviewde onderzoekers noemen deze afspraken over het algemeen duidelijk. Als er toch onduidelijkheid is of er onverhoopt sprake is van een meningsverschil, zijn de teksten van de contracten meestal niet de leidende factor, maar wordt in onderling overleg een oplossing gezocht. Een langdurige samenwerking tussen een onderzoeksgroep en een bedrijf is meestal in beider belang (en juridisch „getouwtrek‟ in niemands belang). 3.3.2
Uitgevers
Uitgevers zien weinig van de discussies tussen onderzoekers en de private sector met betrekking tot de publicatie van wetenschappelijke artikelen en onderzoeksdata. Wat wel duidelijk is, is dat binnen de commerciële onderzoekswereld meer gelezen dan geschreven wordt. “Als er een commercieel belang is bij het doen van onderzoek, is er ook een commercieel belang om de onderzoeksdata van dat onderzoek niet openbaar te maken.”, geïnterviewde uitgever Een geïnterviewde uitgever vermoedt, dat als commerciële partijen dan toch onderzoeksdata zouden willen publiceren, ze waarschijnlijk eerder met een traditionele, commerciële uitgever zullen gaan praten over het publiceren van onderzoeksdata, omdat deze uitgevers een beter gevoel zullen hebben bij het commerciële belang van de onderzoeksdata. 3.3.3
Bedrijven
Een kanttekening die door één van de geïnterviewden werd gemaakt, is dat ongenuanceerdheid en onzorgvuldige formuleringen ten aanzien van eisen met betrekking tot de publicatie van onderzoeksdata uit publiek gefinancierd onderzoek (bijvoorbeeld in het beleid van de Europese Unie) een risico vormen voor het samenwerken tussen universiteiten en bedrijven. Dit wordt onder andere onderschreven door Business Europe. Business Europe, waar onder andere ondernemingsorganisatie VNO-NCW lid van is, heeft in februari 2010 een statement naar buiten gebracht waarin het standpunt wordt beschreven ten aanzien van Open Access in Europese onderzoeksprogramma‟s30. Dit statement refereert zelf ook naar een pilot op het gebied van de OA publicatie van wetenschappelijke artikelen binnen het FP7 programma31. Behalve een aantal randvoorwaarden voor Open Access in het algemeen wordt in het statement van Business Europe ook gesteld, dat het stimuleren van de (OA) publicatie van onderzoeksdata het voor bedrijven minder aantrekkelijk zal maken om te participeren in dit soort onderzoekstrajecten, omdat de mogelijkheden worden beperkt om de onderzoeksresultaten te beschermen. “Een verplichting tot het publiceren van onafhankelijke onderzoeksdata is bezwaarlijk; je moet oppassen dat je niet meer waarde vernietigt dan dat je creëert.”, een geïnterviewde uit het bedrijfsleven Voor de samenwerking met private partners heeft de EUA (European University Association) een handboek samengesteld met richtlijnen ten aanzien van publiek-private samenwerkingen 32. Dit handboek geeft wel allerlei richtlijnen over hoe omgegaan zou kunnen worden met intellectueel eigendom, maar onderzoeksdata wordt hierin niet genoemd.
30
Open Access in the EU‟s research programmes, BUSINESSEUROPE position paper (23 February 2010) http://ec.europa.eu/research/science-society/document_library/pdf_06/open-access-pilot_en.pdf 32 Responsible Partnering, Joining Forces in a World of Open Innovation: Guidelines for Collaborative Research and Knowledge Transfer between Science And Industry (October 2009) 31
33
Onderzoeksdata heeft in veel gevallen een commerciële waarde. Het kan daarom – volgens alle geïnterviewde bedrijven – nooit zo zijn, dat publicatie van wetenschappelijke artikelen maar zeker ook van onderzoeksdata verplicht wordt als onderzoek (deels) gefinancierd wordt door publieke middelen. Bedrijven willen altijd de mogelijkheid hebben om de publicatie van onderzoeksresultaten minstens uit te kunnen stellen, zodat op basis van de onderzoeksdata patenten ingediend kunnen worden en zo de gemaakte investeringen beschermd kunnen worden. Eén van de geïnterviewden refereerde naar onderzoek waaruit blijkt dat de helft van de in privaat gefinancierd onderzoek opgedane kennis weglekt via jobhoppers, toeleveringspartners en conferenties. Dit is ook een reden waarom ook privaat onderzoek door de overheid gesubsidieerd wordt. Het kan, volgens de geïnterviewde, nooit de bedoeling zijn dat de resultaten uit dergelijk gesubsidieerd onderzoek openbaar gemaakt moeten worden. Ondanks het feit dat dit ook geen onderdeel is van het huidige beleid, kan de eerder genoemde ongenuanceerdheid hiervoor wel als een risico beschouwd worden. Het feit, dat de overheid middels subsidies privaat onderzoek financiert om ervoor te zorgen dat het voor bedrijven mogelijk blijft om te investeren in onderzoek, staat haaks op de voorwaarde om de resultaten uit publiek-private projecten openbaar te maken. Enerzijds worden bedrijven gecompenseerd voor het weglekken van kennis die is opgedaan door private investeringen en anderzijds moeten de resultaten van publiek-private investeringen vrijelijk beschikbaar worden gesteld. Eén van de geïnterviewden geeft aan dat een bedrijf eventueel best bereid is om het publiceren van onderzoeksdata af te kopen en daarmee de rechten op deze data te verkrijgen. De waarde van onderzoeksdata is niet altijd goed in te schatten en kan ook mede worden bepaald door de bedrijfsstrategie; bij een nieuwe strategie kan oude onderzoeksdata opnieuw waardevol blijken. Dit maakt het lastig om bedrijven te stimuleren na een bepaalde periode alsnog onderzoeksdata te publiceren. Ook contractuele afspraken (met bijvoorbeeld andere bedrijven) kunnen het moeilijk maken om onderzoeksdata te publiceren.
3.4
Samenvatting
De interviews laten een beeld zien, dat de conclusies van eerder (Europees) onderzoek, van PARSE.insight33, RIN34, Feijen35 en de Europese Commissie36, met betrekking tot de publicatie van onderzoeksdata onderschrijft. Deze sectie toont de belangrijkste bevindingen op basis van de interviews. De bevindingen zijn per groep (onderzoekers, uitgevers, bedrijven) verdeeld over de drie dimensies, zoals beschreven in sectie 1.3. 3.4.1
Onderzoekers
Open Access • De acceptatie van OA tijdschriften zal geleidelijk verlopen door twee vicieuze cirkels: o Onderzoekers publiceren bij voorkeur in de tijdschriften waarin ze altijd al publiceerden, omdat deze tijdschriften een hoge impactfactor hebben en gelezen worden door hun collega‟s in het vakgebied. Hierdoor worden deze tijdschriften dus ook veel gelezen en geciteerd en blijft de impactfactor dus hoog. o (Met name nieuwe) OA tijdschriften hebben geen of een lage impactfactor waardoor onderzoekers niet snel in deze tijdschriften zullen publiceren. Hierdoor worden deze tijdschriften ook niet veel gelezen en geciteerd en blijft de impactfactor dus laag. • Het beleid van de universiteiten en onderzoeksfinanciers op het gebied van OA is niet helder voor de onderzoekers. 33
PARSE.insight (2010). Insight into digital preservation of research output in Europe RIN (2008) To Share or not to Share: Publication and Quality Assurance of Research Data Outputs 35 Feijen, M. (2011). What researchers want. Utrecht: SURFfoundation. 36 European Commission. (2010). Riding the wave: how Europe can gain from the rising tide of scientific data. Brussel: Europese Unie 34
34
Publicatie van onderzoeksdata • De heterogeniteit van onderzoek en bijbehorende onderzoeksdata vereist een heterogene aanpak; • Onderzoekers moeten controle kunnen houden over het gebruik tot hun onderzoeksdata (bv. onderzoeksdata onder embargo publiceren of toegang tot de onderzoeksdata kunnen beperken); • Een beloningsstructuur voor het publiceren van data kan een belangrijke stimulans zijn; • Het moet mogelijk zijn om zowel de kwaliteit van gepubliceerde datasets als van repositories te beoordelen; • Er moet duidelijkheid komen met betrekking tot de publicatie van patiëntgegevens. Wat mag wel? Wat mag niet? Hoe kan privacy gewaarborgd blijven en onderzoeksdata maximaal hergebruikt worden? • Door hulp te bieden aan onderzoekers kunnen de datamanagement competenties worden verhoogd en daarmee ook het bewustzijn; • Onderzoeksfinanciers hebben de mogelijkheid om onderzoekers te dwingen om over de beschikbaarstelling van onderzoeksdata na te denken; • Voor de lange termijn beschikbaarheid en vindbaarheid van onderzoeksdata is standaardisatie van metadata beschrijving noodzakelijk en een duidelijk standpunt met betrekking tot bruikbare dataformaten. Ook het gebruik maken van unieke identifiers voor auteurs en datasets is noodzakelijk. • Als een oplossing geen bewaring voor de lange termijn kan garanderen, moet samenwerking worden gezocht met datacentra die dat wel kunnen. Publiek-private projecten • Het verplichten van de publicatie van onderzoeksdata in publiek-private projecten kan zorgen voor minder bereidheid tot samenwerking van bedrijven. • Voor zover er al meningsverschillen ontstaan tussen onderzoekers en het bedrijfsleven ten aanzien van de publicatie van artikelen en/of onderzoeksdata, worden deze (bijna) altijd in goed overleg opgelost. Verdere formalisering van de afspraken zou ervoor kunnen zorgen, dat bedrijven minder snel willen samenwerken. 3.4.2
Uitgevers
Open Access • De traditionele uitgevers zijn reactief met betrekking tot Open Access. Dat wil zeggen, dat ze OA aanbieden, omdat daar (beperkte) vraag naar is; • Uitgevers willen betaald worden voor de diensten die zij leveren op het gebied van het organiseren van de review en het publiceren en beschikbaar stellen van onderzoeksresultaten. Het business model is minder belangrijk. Dat wil zeggen, dat het niet zoveel uitmaakt of de huidige structuur met abonnementsgelden (deels) vervangen wordt door een model waarbij de auteur of de onderzoeksfinancier betaalt voor publicatie. Publicatie van onderzoeksdata • Uitgevers willen liever geen rol in de publicatie van onderzoeksdata voor zover het de opslag en lange termijn toegang tot deze data betreft of de standaardisatie van gegevensopslag; • Uitgevers zien – mede gebaseerd op hun ervaring met het publicatieproces –een rol voor zichzelf in het faciliteren van het proces van de publicatie van onderzoeksdata. Publiek-private projecten • Uitgevers hebben weinig zicht op de discussie tussen onderzoekers en de private sector met betrekking tot de publicatie van wetenschappelijke artikelen en onderzoeksdata; • Als er concrete vragen (en daarmee opportunities) zijn vanuit de markt, zullen de uitgevers bereid zijn om functionaliteiten te bieden voor het publiceren van onderzoeksdata in publiekprivate projecten. 3.4.3
Bedrijven
35
Open Access • Publicatie van data zorgt voor zichtbaarheid in en discussie met de wetenschappelijke wereld en zorgt ervoor dat een bedrijf een interessante werkgever is voor onderzoekers; • Open Access speelt nauwelijks een rol in de keuze van een tijdschrift voor het publiceren van onderzoeksresultaten; • Patentaanvragen zijn veel belangrijker dan wetenschappelijke publicaties. Publicatie van onderzoeksdata • Onderzoeksdata heeft vaak een commerciële waarde, waardoor publicatie daarvan onwenselijk is; • Bedrijven zullen niet willen investeren in het commercialiseren van onderzoeksresultaten als deze resultaten reeds publiek zijn gemaakt. Publiek-private projecten • Als publicatie van onderzoeksdata in publiek-private projecten verplicht wordt gesteld, zullen bedrijven terughoudend worden om nog samen te werken; • Bedrijven willen altijd de mogelijkheid houden om publicatie van onderzoeksresultaten tegen te houden, zodat patenten kunnen worden aangevraagd; • Ongenuanceerdheid en onzorgvuldige formuleringen (in bv. Europese beleidsstukken) ten aanzien van eisen met betrekking tot de publicatie van onderzoeksdata en publiek gefinancierd onderzoek vormen een risico voor het voortbestaan van publiek-private samenwerkingen; • Het enerzijds subsidiëren van privaat onderzoek om het weglekken van het rendement uit onderzoek te beperken en het anderzijds verplichten tot openbaar maken van onderzoeksresultaten uit publiek-private projecten is niet met elkaar in overeenstemming.
36
4
Conclusies en aanbevelingen
De commotie die na het opstellen en tekenen van de Berlin Declaration ontstond rondom het OA publiceren van publiek gefinancierd onderzoek is inmiddels gedaald. Hoewel nog volop in ontwikkeling, is OA een geaccepteerde manier van publiceren geworden. De „traditionele‟ uitgevers hebben, zij het misschien reactief, gereageerd op deze stroming door bestaande tijdschriften om te zetten naar OA, OA opties aan te bieden in gesloten tijdschriften of door het oprichten van nieuwe tijdschriften die volledig OA zijn. Voor de meeste onderzoekers is OA geen onbekend fenomeen meer. De voordelen van snelle publicatie en volledige toegankelijkheid worden geroemd. Onderzoeksfinanciers en instellingen dragen hun steentje bij om OA verder te stimuleren. Dat is nodig, want er worden ook nog een aantal nadelen onderkend aan het OA publiceren. In de eerste plaats vereist het betalen voor het publiceren een andere geldstroom. Om ervoor te zorgen dat onderzoekers budget beschikbaar hebben voor OA publicatie zullen deze kosten moeten worden opgenomen in de begrotingen van onderzoeksprojecten. Onderzoeksfinanciers zouden dit kunnen stimuleren. Een ander probleem is het feit dat veel OA tijdschriften een lage impactfactor hebben. Hierdoor zijn onderzoekers geneigd om in de „traditionele‟ tijdschriften te blijven publiceren. Deze hebben vaak een hogere impactfactor en voorzien hiermee in de eis van de onderzoeksfinancier. Voor private partijen die participeren in het gesubsidieerde onderzoek lijkt het niet uit te maken of onderzoeksresultaten OA of „traditioneel‟ gepubliceerd worden, zolang het maar in een door het vakgebied geaccepteerd tijdschrift gebeurt. Nu OA publicatie van wetenschappelijke artikelen steeds meer gemeengoed begint te worden rijst de vraag of ook de onderliggende onderzoeksdata openbaar beschikbaar zou moeten zijn. Er zijn inmiddels verschillende initiatieven gaande om dit mogelijk te maken. In Nederland zijn DANS en het datacentrum van de 3TU hiervan een voorbeeld; op internationaal niveau zijn GenBank en Acta Crystallography A goede voorbeelden. Echter, het aantal oplossingen voor het OA publiceren en delen van data is beperkt en wordt gekenmerkt door een sterke discipline-afhankelijke aanpak en een gebrek aan standaardisatie. Het lijkt erop dat in disciplines waar data een belangrijke rol speelt voor de voortgang van het onderzoek er al faciliteiten en standaarden voor het opslaan, vinden en delen van onderzoeksdata gerealiseerd zijn. Er is dus duidelijk een discipline-afhankelijke aanpak nodig voor het stimuleren van het publiceren van data, ongeacht of dit via OA of traditioneel zou moeten gebeuren. De meeste uitgevers zitten hier vooral reactief in waarbij de focus vooral ligt op het faciliteren van het publiceren van onderzoeksdata waarop een wetenschappelijk artikel gebaseerd is (en minder op volledige datasets of databases). De meeste uitgevers faciliteren dan ook het verrijken van publicaties met bv. extra grafieken, filmpjes, foto‟s en/of ruwe data. Het publiceren van supplementaire gegevens in zogeheten Verrijkte Publicaties kan worden gezien als een voorloper van het publiceren van onderzoeksdata. Uitgevers stellen nauwelijks eisen aan de dataformaten of metadata beschrijvingen en zien dit ook niet als hun rol. Andere uitgevers, zoals Nature, eisen dat de gehele dataset onderliggend aan de publicatie gepubliceerd wordt. In het algemeen gesteld zijn er nog maar erg weinig oplossingen voor het OA publiceren van onderzoeksdata. Hieraan liggen een aantal oorzaken ten grondslag. De belangrijkste zijn dat onderzoekers opzien tegen de overhead die datamanagement met zich meebrengt, ze bang zijn voor misinterpretatie van hun data en dat er geen (wetenschappelijke) beloning is voor het publiceren van data (in tegenstelling tot het publiceren van wetenschappelijke artikelen). De overhead komt vooral voort uit het feit dat datamanagement als een complex geheel van verschillende aspecten moet worden beschouwd. Zonder een juiste instelling onder de onderzoekers, geaccepteerde afspraken over dataformaten en metadata, een technische infrastructuur voor het opslaan en delen van data, en een bijbehorend juridisch kader zal een onderzoeker niet zo snel tot publiceren van data overgaan. Het afdwingen hiervan door onderzoeksfinanciers of het belonen ervan zal niet helpen als een volledig ecosysteem voor het eenvoudig beheren van data ontbreekt. Per discipline zal bekeken moeten worden wat de huidige stand van zaken is in termen van behoefte, aanwezige standaarden en infrastructuur. Bij disciplines waar deze zaken op orde zijn en het publiceren van data al gemeengoed is geworden, strekt het de aanbeveling voor onderzoeksfinanciers om onderzoekers ook hiertoe te verplichten. De contractuele kant betreffende
37
het eigendom van data zou dan ook verder geformaliseerd kunnen worden37. Onderzoekers die hun data publiceren zouden hier ook een navenante beloning voor moeten krijgen. Bij disciplines waar een dergelijke infrastructuur ontbreekt zal de behoefte gepeild dienen te worden, in kaart gebracht moeten worden welke data relevant is en standaardisatie gefaciliteerd kunnen worden. Dit kan in samenwerking met uitgevers, onderzoekers en onderzoeksfinanciers. Best practices voor het ontsluiten van data in disciplines waar dit al gedaan wordt, kunnen hierbij ingezet worden ter inspiratie en motivatie. Bij de ontwikkeling van standaarden moet getracht worden de juiste balans te vinden tussen oplossingen die discipline-specifieke informatie kunnen bevatten en generieke oplossingen die multidisciplinair onderzoek mogelijk maken. Ondanks de belemmeringen zijn veel onderzoekers bereid om, via persoonlijke relaties en (kleine, gecontroleerde) samenwerkingsverbanden, data te delen. Hiermee wordt voorkomen dat data verkeerd geïnterpreteerd wordt en behoudt de onderzoeker de controle over de data. Deze manier van uitwisseling vindt typisch plaats in samenwerkingsverbanden die een meerwaarde hebben voor de onderzoeker en passen uitstekend in de opkomende trend van online samenwerkingsplatformen ofwel e-Research. Via dit soort platformen worden onderzoekers in staat gesteld om over de grenzen van onderzoeksgroepen, disciplines, universiteiten en landen data en andere resources met elkaar te delen op een flexibele en gebruikersvriendelijke manier. De ontwikkeling van SURFconext is hiervan een goed voorbeeld. Hiermee kan het delen van data op een natuurlijke manier gestimuleerd worden waardoor onderzoekers vertrouwd raken met datamanagement. Dit zal de ontwikkeling van standaarden voor dataformaten en metadatabeschrijvingen stimuleren. De stap naar OA publicatie van data zal dan makkelijker zijn. Onderzoeksfinanciers zullen het gebruik van dergelijke online samenwerkingsplatformen voor het uitvoeren van onderzoek moeten stimuleren. Tot slot de rol van private partijen in publiek-private gefinancierd onderzoek. Deze partijen hebben nauwelijks behoefte aan het publiceren van data. Onderzoeksdata heeft in veel gevallen teveel commerciële waarde en dit is een enorme belemmering voor datapublicatie. Ook hier geldt, dat daar waar het publiceren van data gemeengoed en essentieel is voor het onderzoek, de onderzoeksfinancier dit kan eisen. De kans is klein dat private partijen dit dan als belemmering zullen zien om mee te doen in publiek-private projecten. In disciplines die veel minder vertrouwd zijn met het publiceren van data kan afdwingen ervan leiden tot afname van private participatie wat ongewenst is. Enige voorzichtigheid dient hierbij dus betracht te worden. Gezien de beperkte houdbaarheid van data zou nagedacht kunnen worden over het publiceren ervan na het verlopen van een bepaalde termijn (bijvoorbeeld 2 jaar na afronding van het project). Samenvattend komen we tot de volgende aanbevelingen voor onderzoeksfinanciers om Open Access publicatie van data in onderzoeksprojecten te stimuleren. Deze aanbevelingen zouden input kunnen zijn voor een gedragscode rondom de publicatie van onderzoeksdata. Zo‟n gedragscode zou wel zeer zorgvuldig en genuanceerd geformuleerd moeten worden om er voor te zorgen dat het ook voor private partijen interessant blijft om samen te werken met publieke instellingen. •
Hanteer een discipline-afhankelijke aanpak voor wat betreft het stimuleren en faciliteren van datapublicatie;
•
Stimuleer en verplicht datapublicatie slechts bij disciplines waar dat al redelijk gemeengoed is en waar al een infrastructuur voor datamanagement aanwezig is. Dit geldt voor zowel volledig publiek als publiek-privaat gefinancierde onderzoeksprojecten. De hiermee opgedane ervaringen kunnen later ingezet worden voor andere disciplines. Zorg er in deze context voor dat de contractuele kant voor het eigendom en gebruik van data zorgvuldig afgedekt is. Er dient wel opgepast te worden dat private partijen niet afhaken bij dergelijke publicatie-eisen. Het stimuleren van datapublicatie zou bijvoorbeeld gedaan kunnen worden door het – net als gepubliceerde artikelen en patenten – meetellen van datapublicaties bij beoordelingen of het
37
Ringnalda, A., de Bruin, R., & de Cock Bunning, M. (2011). Open Access en Data in Publiek-Private Samenwerkingen bij Onderzoeksfinanciering. CIER. 38
verplicht opnemen van een datamanagement- en datapublicatieparagraaf in de voorstellen voor nieuwe onderzoeksprojecten; •
Stimuleren en faciliteren van datapublicatie bij disciplines waar dit nog geen gemeengoed is. Het verplichten heeft door het ontbreken van een navenante cultuur, tools, standaarden en technische infrastructuur geen zin. Als eerste zullen deze essentiële elementen van een ecosysteem ingericht dienen te worden voordat aan richtlijnen rond datapublicatie gewerkt kan worden. Denkbare activiteiten voor de onderzoeksfinancier hierbij zijn het peilen van de behoefte aan discipline-afhankelijke standaardisatie en ontsluiting voor hergebruik, het faciliteren van standaardisatie-activiteiten samen met onderzoekers en uitgevers, of het stimuleren van de uitwisseling van data met behulp van online samenwerking (zie volgende punt).
•
Stimuleer samenwerking en uitwisseling van data via online e-Research samenwerkingsplatformen als SURFconext. Voor de onderzoeker heeft samenwerken meerwaarde. Bijkomende effecten zijn dat de onderzoeker ervaring opdoet met het delen van data en dat er dientengevolge standaarden zullen ontstaan voor dataformaten en bijbehorende metadata. Uiteindelijk zal dit de stap naar OA publicatie van data makkelijker maken. Het stimuleren van het gebruik van e-Research samenwerkingsplatformen zou bijvoorbeeld gedaan kunnen worden door het beschikbaar stellen van een zo‟n platform door de onderzoeksfinancier of door het gebruik ervan als voorwaarde te stellen bij nieuwe onderzoeksprojecten.
39
Appendix A – Oplossingen voor de publicatie van onderzoeksdata Datacollecties georganiseerd in datacentra rond disciplinaire of thematische onderzoeksactiviteiten
LOFAR (LOw Freqency ARray)
website technische eisen
• • • • • • •
Metadata formaat beschreven in ICD (Interface Control Documents) Bestanden in HDF5-formaat (Hierarchical Data Format, versie 5) Gebruik van supercomputer voor verwerking van ruwe data via uitgestrekt glasvezelnetwerk Er is geen unieke identifier voor de data of de auteur Mogelijke embargo-periode (bv. 1 jaar) Registratie is vereist voor toegang tot datasets 'best effort' om data zo lang mogelijk beschikbaar te houden
gebruikersgroepen
• • • • •
Astrofysici Geofysici Landbouwonderzoekers ICT‟ers Data wordt opgeslagen door LOFAR
aard en omvang van de data
• • • •
Tijdelijke opslag van 2 petabyte Bij metingen: 1 à 2 petabyte / week Na verwerking: enkele terabytes / uur Gedistribueerd LOFAR archief (petabytes)
betrokken partijen
• • •
ASTRON Universiteit van Groningen Consortium van verschillende universiteiten en kennisinstellingen op het gebied van astrofysica, geofysica, landbouwonderzoek en ICT
opmerkingen
•
LOFAR zorgt voor analyse van de kwaliteit van de data (bv. storingen door mobiele telefoons) Er worden cursussen gegeven hoe om te gaan met LOFAR data
•
NODC (Nationaal Oceanografisch Data Committee)
website
http://www.nodc.nl
technische eisen
• • • • • • • •
Metadata beschreven m.b.v. CDI38 (Common Data Index) Gestandaardiseerde metadata vocabulair Uitgebreide zoek- en selectiefunctionaliteit „Data Access Restriction Tag‟ met toegangsinformatie (variërend van „onbeperkt‟ tot „geen toegang‟) Er is geen unieke identifier voor de data of de auteur Mogelijke embargo-periode (0 – 1 jaar) Registratie is vereist voor toegang tot datasets Opslag 'voor de eeuwigheid'
gebruikersgroepen
• •
Onderzoekers Data wordt gedeponeerd door NODC
aard en omvang van de data
• • • • •
NIOZ (Koninklijk Instituut voor Zeeonderzoek) beheert 'meetschip' Datasets per datapunt beschikbaar Oceanografische en mariene data In-situ en remote sensing observaties Bijna 50.000 datasets
betrokken partijen
• •
Aanvragende wetenschappers Rijkswaterstaat en diverse onderzoeksinstituten (oa. TNO, Deltares, IMARES, NIOZ)
38
Gebaseerd op de ISO19115 metadata standaard
41
opmerkingen
Veel hergebruik Uitgebreide kwaliteitscontroles Deelnemer in Pan-Europese SeaDataNet en internationale organisaties ICES en IOC-IODE
Datacentrum KNMI (Koninklijk Instituut Meteorologisch Instituut)
website
http://www.knmi.nl/datacentrum/
technische eisen
• • • • • •
(Deels) automatische generatie metagegevens Dataformaten niet erg aan verandering onderhevig TXT-formaat inclusief databeschrijving Datacentrum verzorgt archivering en beschikbaarstelling Mogelijke embargo-periode (0,5 - 1 jaar) Vrij bruikbaar onder voorwaarde van bronvermelding
gebruikersgroepen
•
Meteorologen
aard en omvang van de data
•
Verzameling van databases (Cesar, TEMIS, Satellite Earth observation, Chemistry and climate, European Climate Assessment & Dataset, KNMI meet- en waarneemgegevens)
betrokken partijen
• • • •
Wetenschappers KNMI (dataproducenten) Meteorologen (dataconsumenten) Wetenschappers wereldwijd (dataconsumenten) Data wordt gedeponeerd door KNMI
opmerkingen
• •
KNMI heeft een wettelijke verplichting tot archivering Hergebruik door gespecialiseerde communities
LISS (Longitudinal Internet Studies for the Social sciences)
website
http://www.lissdata.nl
technische eisen
• • • • • •
gebruikersgroepen
•
Onderzoekers op het gebied van survery onderzoek, marketing, micro-economie, etc. Data wordt gedeponeerd door LISS
aard en omvang van de data
• •
49 studies 2400 studie units
betrokken partijen
• • •
CentERData 5000 Nederlandse huishoudens (8000 individuen) Onderzoekers uit Nederland (ea.)
opmerkingen
•
Gesubsidieerd door NWO
•
Metadata beschreven m.b.v. DDI 3.0 (Data Document Initiative, versie 3.0) Codebooks met beschrijving gebruikte variabelen Dataformaat hoofdzakelijk SPSS en Stata Bevat (referenties naar) gerelateerde publicaties Registratie vereist voor toegang tot datasets Vrij gebruikbaar (niet-commercieel) onder voorwaarde van bronvermelding
CRAWDAD (A Community Resource for Archiving Wireless Data at Dartmouth)
website
http://www.crawdad.org
technische eisen
• • • • • •
Metadata beschreven m.b.v. eigen CRAWDAD metadata standaard Geen unieke identifiers Metadata bevat referentie naar bijbehorende artikelen Metadata bevat namen van onderzoekers Registratie vereist voor toegang tot datasets Vrij bruikbaar
gebruikersgroepen
• •
Onderzoekers op het gebied van draadloze netwerken 1645 onderzoekers van 851 instituten in 63 landen (mei 2009)
42
aard en omvang van de data (mei 2009)
• • •
55 datasets 237 artikelen 20 tools
betrokken partijen
•
University of Dartmouth
opmerkingen
• •
Gesubsidieerd door NSF (National Science Foundation) Inclusief tools voor verkrijgen en analyseren van data
Data-archieven en repositories, gericht op opslag en hergebruik van onderzoeksdata
DANS (Data Archiving and Networked Services)
website
http://www.dans.knaw.nl
technische eisen
• • •
• •
Ondersteuning voor beschrijven van metadata m.b.v. DDI (Data Document Initiative) en DCMI (Dublin Core Metadata Initiative) PI (persistent identifier) en DAI (Digital Author Identification) Lijst met preferred en geaccepteerde dataformaten (tekstverwerking, spreadsheets, statistische bestanden, beeldmateriaal, databases, platte tekst, mark-up, cartografische gegevens, GIS, audio en video) Registratie vereist voor toegang tot datasets "Open als het kan, beschermd als het moet"
gebruikersgroepen
• • •
Maatschappij-, gedrags- en geesteswetenschappen Toekomstige uitbreiding naar discipline-onafhankelijkheid Data wordt gedeponeerd door onderzoekers zelf (registratie is vereist)
aard en omvang van de data
• •
16.000 datasets 2000-3000 datasets per jaar toegevoegd
betrokken partijen
• •
KNAW NOW
opmerkingen
• • • •
Zorgt ook voor analyse en visualisatie van data DSA (Data Seal of Approval) voor kwaliteit Juridische paragraaf in deponeer-instructies Partner in Europese CESSDA (Council of European Social Science Data Archives), vertegenwoordiger van ICPSR (Inter-university Consortium for Political and Social Research)
MPI (Max Planck Instituut Nijmegen)
website
http://www.mpi.nl
technische eisen
• • • •
LAMUS (Language Archive Managements Upload System) Metadata beschrijving m.b.v. IMDI (ISLE Metadata Initiative) „Handle‟ voor unieke identificatie Open & Closed Access
gebruikersgroepen
•
500 - 2000 taalwetenschappers
aard en omvang van de data
• • •
400.000 bestanden 50 terabytes Satelliet-archieven
betrokken partijen
• • •
Max Planck Society Donders Institute for Brain, Cognition and Behaviour Data wordt gedeponeerd door onderzoekers (autorisatie door MPI is vereist)
opmerkingen
• • •
Verrijkingssoftware (bv. Elan, Sympathy, Lexus) Visualisatie (bv. Google Earth overlay) Deelnemer in CLARIN39 (Common Language Resources and Technology Infrastructure)
39
http://www.clarin.eu
43
3TU datacentrum
website
http://www.datacentrum.3tu.nl/
technische eisen
• • • • • • •
Metadata beschrijving m.b.v. DCMI (Dublin Core Metadata Initiative) DOI (Digital Object Identifiers) voor unieke identificatie Maakt gebruik van OPeNDaP (Open-source Project for a Network Data Access Protocol) en OAIS (Open Archival Information System) Deponeren in overleg Self-deposit (binnenkort) Registratie vereist (binnenkort) Open Access (embargo optioneel) & Closed Access
gebruikersgroepen
• •
Onderzoekers en onderzoeksgroepen 3TU Data wordt gedeponeerd in samenwerking met het 3TU datacentrum
aard en omvang van de data
• •
4000 datasets 15 terabytes
betrokken partijen
•
3TU bibliotheken (TU Delft Library, TU Eindhoven Information Expertise Centre, University of Twente Library & Archive)
opmerkingen
Genbank
website
http://www.ncbi.nlm.nih.gov/genbank/
technische eisen
• • • • • •
Uitgebreide zoekfunctionaliteit Uniek 'Accession Number' Eigen gestandaardiseerde bestandsbeschrijving Mogelijke embargo-periode Deponeren is verplicht bij sommige wetenschappelijke tijdschriften Open Access
gebruikersgroepen
• •
Wetenschappelijke community Data wordt gedeponeerd door onderzoekers zelf (registratie is vereist)
aard en omvang van de data
• •
Genetic sequences 177.385.297.156 base pairs en 59.608.311 entries
betrokken partijen
•
NCBI (National Center for Biotechnology Information) van NIH (National Institutes of Health)
opmerkingen
• •
Tools voor het genereren en deponeren van datasets Onderdeel van INSDC (International Nucleotide Sequence Databases)
DSpace©Cambridge
website
http://www.dspace.cam.ac.uk/
technische eisen
• •
• • •
Uitgebreide zoekfunctionaliteit Metadata beschrijving m.b.v. DC (Dublin Core) en andere standaarden CNRI (Corporation for National Research Initiatives) handle40 voor unieke identificatie van datasets Maakt gebruik van OAIS (Open Archive Information System) Ondersteunt Open en „bekende‟ bestandsformaten Data gratis beschikbaar voor iedereen
gebruikersgroepen
• •
Onderzoekers en medewerkers van de University of Cambridge Onderzoekers deponeren data zelf (registratie is vereist)
aard en omvang van de data
•
Papers, rapporten, artikelen, conferentie papers, technische rapporten, datasets, multimediabestanden, afbeeldingen, leerobjecten, administratieve bestanden, etc.
•
40
http://www.handle.net
44
betrokken partijen
•
University of Cambridge
opmerkingen
•
Gebaseerd op DSpace41
IQSS (Institute for Quantitative Social Sciences) Dataverse Network at Harvard University
website
http://dvn.iq.harvard.edu/
technische eisen
• • • • • • •
Uitgebreide zoekfunctionaliteit Gestandaardiseerde metadata beschrijving (cataloging information) CNRI (Corporation for National Research Initiatives) handle voor unieke identificatie van datasets Ondersteunt van OAIS (Open Archive Information System) Ondersteunt alle dataformaten Speciale ondersteuning voor dataformaten SPSS, Stata en GraphML Ondersteunt open en beperkte toegang
gebruikersgroepen
• •
Sociale wetenschappen Iedereen mag data deponeren (registratie is vereist)
aard en omvang van de data
• • •
307 „Dataverses‟ 39.076 studies 661.886 bestanden
betrokken partijen
• •
Harvard University Vele andere universiteiten en instellingen
opmerkingen
•
Gebaseerd op The Dataverse Network42
Datacollecties georganiseerd rond wetenschappelijke tijdschriften
ICPSR (Inter-University Consortium for Political and Social Research)
website
http://www.icpsr.umich.edu/
technische eisen
• • • • • • • •
Metadata beschrijving m.b.v. DDI (Data Documentation Initiative), DCMI (Dublin Core Metadata Initiative) PI (persistent identifier) Ondersteunt en stimuleert nieuwe data formaten Veel gebruikte dataformaten: SAS, SPSS, Stata, Delimited, ASCII Maakt gebruik van online data analyse systeem SDA (Survery Documentation and Analysis) en OAIS (Open Archive Information System) Mogelijke embargo periode Registratie vereist voor toegang tot datasets Ondersteunt open en beperkte toegang en confidentiële datasets
gebruikersgroepen
• •
Sociale wetenschappen Data wordt gedeponeerd door onderzoekers zelf (registratie is vereist) en gecontroleerd door ICPSR
aard en omvang van de data
• • •
Kwantitatieve data Kwalitatieve data (eg. transcripts, audiovisual) 500.000 bestanden (Social Sciences) in 16 collecties
betrokken partijen
•
700 academische instituten en onderzoeksorganisaties
opmerkingen
• •
Biedt trainingen aan Ondersteunt RIS (Research Information Systems) voor citaties
41
http://www.dspace.org
42
http://thedata.org
45
UKDA (UK Data Archive)
website
http://store.data-archive.ac.uk/store/
technische eisen
• • • • • • • •
Metadata beschrijvingen Uitgebreide zoekfunctionaliteit Toegangscontrole gedefinieerd door onderzoeker Verschillende dataformaten: statistische data (SPSS, SAS, Sata), databases (CSV, TAB), documentatie (RTF, ASCII, PDF, HTML, XML), audiovisueel (wav, aiff, mpeg-4, JPEG 2000, TIFF, JPG) e.a. Gebaseerd on Fedora 2.2.2 Ondersteunt Athens, Shiboleth en Open Archives Initiative (OAI) Toegang via „The UK Access Management Federation‟ Open & Closed Access
gebruikersgroepen
• •
Sociale wetenschappen & Geesteswetenschappen Data wordt gedeponeerd door onderzoekers zelf
aard en omvang van de data
•
203 projects
betrokken partijen
• • • • •
JISC (Joint Information Systems Committee) ESRC Overheidsorganisaties (UK) Onderzoekers en onderzoeksinstituten Bedrijven
opmerkingen
•
Verplicht OA voor ESRC-funded researchers (Economic and Social Research Council)
Pangaea (Publishing Network for Geoscientific & Environmental data)
website
http://www.pangaea.de/
technische eisen
• • • • •
Ondersteunt OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) DOI (Digital Object Identifiers) voor unieke identificatie Uitgebreide zoekfunctionaliteit Mogelijke embargo periode Open & Closed Access
gebruikersgroepen
• •
Aard- en milieuwetenschappen Data wordt gedeponeerd door Pangaea zelf (aangeleverd door onderzoekers)
aard en omvang van de data
•
Meer dan 400.000 datasets
betrokken partijen
• • •
AWI (Alfred Wegener Institute) MARUM (Center for Marine Environmental Sciences) Archief voor ESSD (Earth System Science Data)
opmerkingen
•
Links van Elsevier naar datasets in Pangaea en viceversa
EPAPS (Electronic Physics Auxiliary Publication Service) of the AIP (American Institute of Physics)
website technische eisen
• • •
Geen restricties in dataformaten, wel een lijst van „aanbevolen‟ formaten Vrije toegang tot „supplementaire‟ informatie Geen vrije toegang tot „artikel objecten‟
gebruikersgroepen
• •
Fysici Data wordt gedeponeerd door AIP (aangeleverd door onderzoekers bij indienen wetenschappelijke publicatie)
aard en omvang van de data
•
16 tijdschriften
betrokken partijen
• •
AIP (American Institute of Physics) 10 wetenschappelijke societies
opmerkingen
• •
Copyright blijft bij de auteur API neemt geen verantwoordelijkheid over inhoud.
46
ESSD (Earth System Science Data)
website
http://earth-system-science-data.net/
technische eisen
• • •
Eisen voor repositories: Persistent Identifier, Open Access, Liberaal Copyright beleid, Lange termijn beschikbaarheid „Bruikbaar voor de voorziene toekomst‟ Open Access
gebruikersgroepen
•
Atmosphere, Oceanography, Biosphere, Geology/Geosciences, Cryosphere, Hydrology/Soil science, Solar-terrestrial science
aard en omvang van de data
• •
± 30 papers (20110201) Data wordt decentraal opgeslagen (in lange-termijn repositories)
betrokken partijen
•
Copernicus
opmerkingen
• •
Peer-review & interactieve openbare discussie Data-tijdschrift
Acta Crystallography A
website
http://journals.iucr.org/a/
technische eisen
• • • •
Dataformaten: html, pdf Dataformaten supplementaire informatie: txt, pdf Extra: cif, 3d view, structure factors, scheme Hybrid Open Access (27 OA articles; since 2007)
gebruikersgroepen
•
Structural scientists
aard en omvang van de data
•
Publicaties sinds 1948
betrokken partijen
•
International Union of Crystallography
opmerkingen
•
Data-tijdschrift
47
Appendix B – Interview vragenlijst Introductie Open Access Open Access van onderzoeksresultaten is het zonder beperkingen beschikbaar stellen via internet van de resultaten (zowel publicaties als onderzoeksdata) van onderzoek. Open Access publicatie is een middel om onderzoeksresultaten breder beschikbaar te maken voor gebruikers van die resultaten (waar ook ter wereld). Onder invloed van de Berlin declaration is er een beweging in gang gezet om onderzoek OA te publiceren. Deze verklaring is inmiddels ondertekend door oa. NWO en alle Nederlandse universiteiten. Project DiPPP (Data in Publiek Private Projecten) STW financiert als onderdeel van NWO technisch wetenschappelijk onderzoek. Dit wordt bij voorkeur uitgevoerd in publiek private samenwerking, waarbij de private partijen een (financiële) bijdrage leveren. STW wil inzicht vergroten in de ontwikkelingen rond de Open Access publicaties. En in het bijzonder de hantering van de eigendomsrechten van kennis en gegevens (data) die ingebracht zijn door private partijen. Een manier om het inzicht te vergroten is een serie interviews met ervaringsdeskundigen uit de academische wereld, uitgevers en ervaringsdeskundigen uit de industrie. Deze interviews geven hopelijk een beeld van de opvattingen, behoeften en barrières met betrekking tot OA. Dit onderzoek wordt gezamenlijk door STW en door SURF gefinancierd en wordt uitgevoerd door STW, CIER en Novay.
Hoogleraren en onderzoekers 1.
Bent u bekend met Open Access (OA) voor wetenschappelijke publicaties?
2.
Maakt u zelf gebruik van Open Access Journals... om in te publiceren? i. Zo ja, in welke tijdschriften publiceert u en waarom? ii. Zo nee, waarom niet en in welke tijdschriften publiceert u wel? als bron van informatie? i. Zo ja, van welke bronnen maakt u gebruik en waarom? ii. Zo nee, waarom niet en van welke bronnen maakt u dan gebruik?
3.
Welke type onderzoeksdata gebruikt u in uw onderzoek?
4.
Heeft u behoefte om uw onderzoeksdata te publiceren? Waarom? Welke mogelijkheden biedt het publiceren van onderzoeksdata voor u? Welke belemmeringen ziet u voor het publiceren van uw onderzoeksdata?
5.
Heeft u ervaring met het het publiceren van uw onderzoeksdata? Heeft u informatie over het gebruik van deze onderzoeksdata door derden?
6.
Maakt u gebruik van gepubliceerde data van anderen? Als u gebruik maakt van data van anderen, waar vindt u dit data? Maakt u ook gebruik van data van bedrijven? Heeft u informatie over het gebruik van deze onderzoeksdata?
49
7.
Zou het publiceren van onderzoeksdata OA of via de traditionele uitgevers gedaan moeten worden? Waarom?
8.
Hebben de voor u relevante tijdschriften een eis (en/of faciliteiten) dat ook data wordt gepubliceerd? Moeten alleen de onderzoeksdata waarop het artikel berust worden gepubliceerd of alle gegenereerd onderzoeksdata? Voor wie moet de onderzoeksdata beschikbaar zijn (bv. redactie, reviewers, iedereen, ...)? Waar moet de onderzoeksdata gepubliceerd worden (bv. website van het tijdschrift, domein-specifieke website, website van onderzoeker zelf, ...)?
9.
Onder welke voorwaarden zou het openbaar stellen van uw onderzoeksdata voor u aanvaardbaar zijn? Welke eisen moeten worden gesteld?
10. Welke kosten worden voorzien bij het OA ter beschikking stellen van uw onderzoeksdata en publicaties? Hoe verhouden deze kosten zich tot uw huidige kosten voor publicatie? 11. Bent u op de hoogte van het bestaan van het NWO stimuleringsfonds Open Access? Zo ja, heeft u hier reeds gebruik van gemaakt? Zo nee, zou u hier gebruik van willen maken? 12. Met welke (type) private partners werkt u samen in publiek-private projecten? 13. Worden in uw publiek-private projecten afspraken gemaakt over publicaties en het publiceren van onderzoeksdata? Is er onderscheid te maken tussen publicaties en onderzoeksdata? Is OA van invloed op deze afspraken? Heeft u ervaring mee? 14. Welke belangen van uw private partners stimuleren het OA ter beschikking stellen van uw publicaties en eventueel uw onderzoeksdata? Is er onderscheid te maken tussen publicaties en data? Heeft u hier ervaring mee? 15. Welke belangen van uw private partners verhinderen het OA ter beschikking stellen van uw publicaties en eventueel uw onderzoeksdata? Is er onderscheid te maken tussen publicaties en data? Heeft u hier ervaring mee? 16. Hoe ziet u de toekomst van wetenschappelijke publiceren?
Kennisinstellingen 1.
Bent u bekend met Open Access (OA) voor wetenschappelijke publicaties?
2.
Biedt u zelf mogelijkheden voor OA publicatie aan?
3.
Zou onderzoeksdata ook gepubliceerd moeten worden? Waarom? Welke mogelijkheden biedt het publiceren van onderzoeksdata voor u? Welke belemmeringen ziet u voor het publiceren van onderzoeksdata?
4.
Zou het publiceren van onderzoeksdata OA of via de traditionele uitgevers gedaan moeten worden? Waarom?
50
5.
Biedt u faciliteiten voor het ter beschikking stellen van onderzoeksdata? Zo ja, welke? Wat zijn uw ervaringen?
6.
Er zijn tijdschriften waarbij publicatie van data vereist wordt. Moeten alleen de onderzoeksdata waarop het artikel berust worden gepubliceerd of alle gegenereerd onderzoeksdata? Voor wie moet de onderzoeksdata beschikbaar zijn (bv. redactie, reviewers, iedereen, ...)? Waar moet de onderzoeksdata gepubliceerd worden (bv. website van het tijdschrift, domein-specifieke website, website van onderzoeker zelf, ...)?
7.
Hoe zou een oplossing voor de publicatie van onderzoeksdata er volgens u uit moeten zijn? Welke eisen moeten worden gesteld?
8.
In hoeverre zit u businesskansen in het ter beschikking stellen van onderzoeksdata?
9.
Is de betrokkenheid van private partners van invloed op het publicatieproces? Is er onderscheid te maken tussen publicaties en onderzoeksdata? Is er onderscheid te maken tussen OA publicatie en publicatie via de traditionele uitgevers?
10. Hoe ziet u de toekomst van wetenschappelijke publiceren?
Uitgevers 1.
Bent u bekend met Open Access (OA) voor wetenschappelijke publicaties?
2.
Biedt u zelf mogelijkheden voor OA publicatie aan?
3.
Zou onderzoeksdata ook gepubliceerd moeten worden? Waarom? Welke mogelijkheden biedt het publiceren van onderzoeksdata voor u? Welke belemmeringen ziet u voor het publiceren van onderzoeksdata?
4.
Zou het publiceren van onderzoeksdata OA of via de traditionele uitgevers gedaan moeten worden? Waarom?
5.
Biedt u faciliteiten voor het ter beschikking stellen van onderzoeksdata? Zo ja, welke? Wat zijn uw ervaringen?
6.
Geeft u tijdschriften uit waarbij publicatie van data vereist wordt? Moeten alleen de onderzoeksdata waarop het artikel berust worden gepubliceerd of alle gegenereerd onderzoeksdata? Voor wie moet de onderzoeksdata beschikbaar zijn (bv. redactie, reviewers, iedereen, ...)? Waar moet de onderzoeksdata gepubliceerd worden (bv. website van het tijdschrift, domein-specifieke website, website van onderzoeker zelf, ...)?
7.
Hoe zou een oplossing voor de publicatie van onderzoeksdata er volgens u uit moeten zijn? Welke eisen moeten worden gesteld?
8.
Welke invloed heeft de tendens tot OA publicaties op uw businessmodel?
9.
In hoeverre zit u businesskansen in het ter beschikking stellen van onderzoeksdata?
10. Is de betrokkenheid van private partners van invloed op uw publicatieproces? Is er onderscheid te maken tussen publicaties en onderzoeksdata?
51
Is er onderscheid te maken tussen OA publicatie en publicatie via de traditionele uitgevers?
11. Hoe ziet u de toekomst van wetenschappelijke publiceren?
Industriële partners Deze vragen dienen beantwoord te worden in de context van uw publiek-private projecten die (deels) gefinancierd zijn met publieke gelden. 1.
Bent u bekend met Open Access (OA) voor wetenschappelijke publicaties?
2.
Maakt u zelf gebruik van Open Access Journals... om in te publiceren? i. Zo ja, in welke tijdschriften publiceert u en waarom? ii. Zo nee, waarom niet en in welke tijdschriften publiceert u wel? als bron van informatie? i. Zo ja, van welke bronnen maakt u gebruik en waarom? ii. Zo nee, waarom niet en van welke bronnen maakt u dan gebruik?
3.
Heeft u behoefte om uw onderzoeksdata te publiceren? Waarom? Welke mogelijkheden biedt het publiceren van onderzoeksdata voor u? Welke belemmeringen ziet u voor het publiceren van uw onderzoeksdata?
4.
Heeft u ervaring met het het publiceren van onderzoeksdata? Heeft u informatie over het gebruik van deze onderzoeksdata door derden?
5.
Maakt u gebruik van gepubliceerde data van anderen? Als u gebruik maakt van data van anderen, waar vindt u dit data? Maakt u ook gebruik van data van bedrijven? Heeft u informatie over het gebruik van deze onderzoeksdata?
6.
Zou het publiceren van onderzoeksdata OA of via de traditionele uitgevers gedaan moeten worden? Waarom?
7.
Hebben de voor u relevante tijdschriften een eis (en/of faciliteiten) dat ook data wordt gepubliceerd? Moeten alleen de onderzoeksdata waarop het artikel berust worden gepubliceerd of alle gegenereerd onderzoeksdata? Voor wie moet de onderzoeksdata beschikbaar zijn (bv. redactie, reviewers, iedereen, ...)? Waar moet de onderzoeksdata gepubliceerd worden (bv. website van het tijdschrift, domein-specifieke website, website van onderzoeker zelf, ...)?
8.
Onder welke voorwaarden zou het openbaar stellen van uw onderzoeksdata voor u aanvaardbaar zijn? Welke eisen moeten worden gesteld?
9.
Worden in uw publiek-private projecten afspraken gemaakt over publicaties en het publiceren van onderzoeksdata? Is er onderscheid te maken tussen publicaties en onderzoeksdata? Is OA van invloed op deze afspraken? Heeft u hier ervaring mee?
10. Hoe ziet u de toekomst van wetenschappelijke publiceren?
52