Koninklijke Nederlandse Akademie van Wetenschappen Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Advies van de Taskforce Data Archiving & Networked Services (DANS) aan de besturen van KNAW en NWO
December 2004
Advies van de Taskforce Data Archiving & Networked Services (DANS) aan de besturen van KNAW en NWO
December 2004
Data Archiving & Networked Services
3
Data Archiving & Networked Services
4
8 december 2004 Aan de besturen van knaw en nwo Geacht bestuur, Hierbij heb ik het genoegen u namens de Taskforce Data Archiving and Networked Services (dans) het bedrijfsplan Dans aan te bieden. In de afgelopen maanden is de vormgeving van dans onderwerp van bespreking geweest in de Taskforce, op basis van concept rapportages die door een ontwerpgroep, bestaande uit hoogleraren, waren aangeleverd. Ook is een concept voorstel in een workshopbijeenkomst aan onderzoekers, beleidsmakers en ambtenaren voorgelegd. Tenslotte is het voorstel voor het bedrijfsplan tegen het licht gehouden door Deloitte Management & ict Consultants. Op basis van deze rondes concludeert de Taskforce dat een groot draagvlak aanwezig is om te komen tot een nationale voorziening voor datainfrastructuur. Oprichting van dans is voor de wetenschapsbeoefening in ons land van grote waarde. De in het bijgaande rapport beschreven opzet en werkwijze van een dergelijke voorziening zijn naar de mening van de Taskforce adequaat om tot de gewenste verbeteringen te komen en de ambities waar te kunnen maken die in de intentieverklaring van 22 juni jl. zijn neergelegd. Het is verheugend dat knaw en nwo binnen een korte termijn tot deze uitwerking van dans hebben weten te komen. De Taskforce doet hierbij een krachtige aanbeveling aan de beide betrokken besturen tot daadwerkelijke oprichting van dans over te gaan, in lijn met de voorstellen zoals deze in bijgaand rapport worden gedaan. Graag brengen wij daarbij twee aspecten in het bijzonder onder uw aandacht. Voor een dergelijk centrum is continuïteit van de voorziening van zeer groot belang. Een langjarig commitment van de besturen van knaw en nwo is daarom een voorwaarde voor een succesvol dans. Een zware vertegenwoordiging in het bestuur (de raad) van dans, alsmede het vastleggen van langjarige financiële verplichtingen kunnen naar de mening van de Taskforce uitdrukking geven aan dit commitment. Ten tweede adviseert de Taskforce reeds in de beginperiode over te gaan tot het ontwikkelen van een monitoring- en evaluatieprocedure en een set van succescriteria. Deze kunnen dienen als instrumentarium voor een effectief en doelgericht bestuur van dans. Wij vertrouwen er op dat de beide besturen in onderling overleg tot besluitvorming zullen komen over de juridische vormgeving en de huisvestingslocatie van dans. Ten aanzien van de juridische vormgeving ligt er eveneens een advies van Deloitte ter tafel. In het algemeen onderschrijft de Taskforce de conclusies die in de beide rapporten worden verwoord ten aanzien van het bedrijfsplan en de juridische structuur. Wij hopen met dit rapport op bevredigende wijze aan uw verzoek te hebben voldaan en wachten verdere besluitvorming met grote interesse af. Met vriendelijke groet, namens de Taskforce dans, mw. mr. Yvonne C.M.T. van Rooy
Data Archiving & Networked Services
5
Management samenvatting
Data Archiving and Networked Services (dans) Wat is DANS? dans is een gezamenlijk initiatief van de Koninklijke Nederlandse Akademie van Wetenschappen (knaw) en de Nederlandse organisatie voor Wetenschappelijk Onderzoek (nwo). dans is opgericht om op nationaal niveau de toegankelijkheid van gegevensbestanden voor onderzoekers in de maatschappij- en gedragswetenschappen en in de geesteswetenschappen te verbeteren en voor de lange termijn te garanderen. dans beoogt (interdisciplinaire) samenwerking met en tussen onderzoekers te bevorderen. dans heeft de ambitie om op het gebied van onderzoeksdata op Europees niveau een voortrekkersrol te spelen. Waarom DANS? De drie voornaamste redenen om dans op te richten zijn: – De behoefte aan een betere aansluiting tussen data-archieven en behoeften van onderzoekers in het veld. – De noodzaak van technologische vernieuwing van de archieffunctie en de data-infrastructuur. – Een grotere efficiëntie door het creëren van één loket voor onderzoekers en dataproducenten waardoor tot nu toe versnipperde activiteiten worden gebundeld. Missie dans wil de best mogelijke condities creëren op het gebied van onderzoeksdata: één transparante data-infrastructuur met een kwaliteit die er internationaal uitspringt. Dans beoogt dé nationale faciliteit op het gebied van onderzoeksdata te worden. Onderzoekers kunnen in de toekomst voor data bij Dans terecht, waar die data ook zijn geproduceerd of worden bewaard en ontsloten, en ze kunnen vertrouwen op de kwaliteit, actualiteit en continuïteit van die data. Organisatie knaw en nwo zijn gezamenlijk verantwoordelijk voor dans en delen de initiële bekostiging. Zij creëren een gezamenlijke bestuurlijke vorm. dans krijgt de vorm van een gedecentraliseerd netwerk: één dans-centrum dat verantwoordelijk is voor de organisatie van de data-infrastructuur, daaromheen onderzoekers die een belangrijke rol spelen in de ontwikkeling van het archief, zowel voor wat betreft de wetenschappelijke content als voor wat betreft de dienstverlening. Onderzoekers spelen een bepalende rol in de ontwikkeling van dans via de zogenaamde thematische ontwikkelprogramma’s (top’s). In deze structuur zijn het de onderzoekers zelf die werken aan de archivering van onderzoeksgegevens en/of de verbetering van de infrastructuur. Start Om te beginnen zullen in het dans-centrum, na een assessment, het Steinmetzarchief en het Nederlands Historisch Data Archief (nhda) opgaan, alsmede het Wetenschappelijk Statistisch Agentschap (wsa). In het eerste jaar zullen daarnaast drie Top’s worden gestart. Het dans-centrum bestaat uit een directie en twee secties: [1] Archief en Beschikbaarstelling; [2] Ontwikkeling en Acquisitie.
Data Archiving & Networked Services
6
De startformatie van dans bestaat uit 20 fte, vier voor de directie en acht voor elk der secties. Het jaarbudget bedraagt ca. € 2,5 mln. Voor top’s zal aanvullende financiering nodig zijn. Thematische Ontwikkel Programma’s (TOP’s) De samenwerking met onderzoekers krijgt vorm door middel van Thematische Ontwikkel Programma’s (top), die op een bepaald vakgebied of thema gestalte geven aan de datainfrastructuur. top’s zijn bedoeld om databestanden met nationale en/of internationale reikwijdte beter toegankelijk te maken en/of ze te verrijken door harmonisatie met andere bestanden of door toevoeging van gegevens uit andere bestanden. Het kan gaan om afgesloten of lopende dataprogramma’s, om nieuwe initiatieven, of om verkenningen. In top’s kan ook worden samengewerkt met al bestaande lokale datacentra. Werkprogramma 2005 1. Opbouw en inrichting van het dans-centrum, incl. bestuurlijke en juridische context. 2. Opzetten c.q. aanpassen van archieftechnische infrastructuur incl. webportaal. 3. Selectie, in gang zetten en uitvoeren van de eerste top’s. 4. Opstellen communicatieplan. 5. Archivering en toegankelijkstelling van dataverzamelingen. 6. Cont(r)acten met dataleveranciers herzien. 7. Verkenning behoefte aan nieuwe data-archieven binnen de geesteswetenschappen en de maatschappij- en gedragswetenschappen. 8. Verkenning mogelijkheden om bestaande lokale datacentra op te nemen in het dans-netwerk. 9. Vertegenwoordiging in internationale organisaties en participatie in programma’s voor Europese data-infrastructuur.
Data Archiving & Networked Services
7
Data Archiving & Networked Services
8
Inhoud
1. De noodzaak van dans 11 2. Uitgangspunten en missie 13 2.1 Missie en contouren 13 2.2 Doelgroepen en reikwijdte 14 3. Opmaat voor een organisatiemodel 16 4. Gefaseerde opbouw dans 19 4.1 Werkzaamheden in fase 1 19 5. Structuur dans in hoofdlijnen 23 5.1 Bemensing en opstart 24 6. Organisatie dans 2005 26 7. Werkzaamheden in 2005 30 7.1 Organisatie 30 7.2 Huisvesting en voorzieningen 33 7.3 Werving en selectie 34 7.4 Formele kaders: licentiebeleid, privacy, ipr 34 7.5 Startformatie en begroting dans 34 Bijlage 1 – Thematische Ontwikkel Programma’s 40 Bijlage 2 – Matrix van vakgebieden en veelvoorkomende datatypen (huidige situatie) Bijlage 3 – Overzicht internationale organisaties 48 Bijlage 4 – Formele kaders 50 Bijlage 5 – Intentieverklaring dans 52
Data Archiving & Networked Services
46
9
Data Archiving & Networked Services
10
1. De noodzaak van dans1
dans is een gezamenlijk initiatief van knaw en nwo op het gebied van de infrastructuur voor onderzoeksdata. dans staat voor Data Archiving and Networked Services. Een Engelse naam omdat de ontwikkelingen in het onderzoek internationaal zijn en ook steeds meer in een Europese context2 plaats vinden (maar het acroniem klinkt toch Nederlands). Met dans op nationale schaal en als partner in een wereldwijd netwerk van data-organisaties wordt een belangrijke schakel in de wetenschappelijke productieketen gesmeed, vanaf het verzamelen van het basismateriaal tot en met de uiteindelijke publieke verantwoording over het werk. De archivering van wetenschappelijke data in de maatschappij- en gedragswetenschappen en in de geesteswetenschappen is van oudsher een zaak die van groot belang is voor de ontwikkeling van het onderzoek. In Nederland zijn in de loop der tijd dan ook verschillende organisaties ontstaan die zich specifiek toeleggen op data-archivering. Het afgelopen decennium is het vakgebied van data-archivering onder druk komen te staan, vooral door de steeds weer nieuwe mogelijkheden die de ontwikkelingen in de ict bieden. Deze ontwikkelingen hebben onvermijdelijk gevolgen voor de wijzen waarop primaire onderzoeksdata worden opgeslagen en toegankelijk gemaakt, maar bijvoorbeeld ook voor de opslag van en de informatie over onderzoeksresultaten, alsmede voor het duurzaam bewaren van onderzoeksresultaten en de publieke verantwoording over onderzoek. Op vrijwel al deze terreinen heeft de ontwikkeling van de ict – en met name het Internet – inmiddels geleid tot landelijke initiatieven (bijvoorbeeld dare, metis, e-depot kb) waarin betrokkenen samenwerken om de coördinatie te bevorderen en de transparantie en efficiëntie te verhogen3. Het positieve effect daarvan is in toenemende mate merkbaar, zowel in de grotere toegankelijkheid tot informatie als in de verbeterde mogelijkheden tot samenwerking. Op één belangrijk terrein is tot nu toe van zo’n eensgezind optreden nog geen sprake en dat betreft de onderzoeksdata in de geesteswetenschappen en de maatschappij- en gedragswetenschappen. Bezien in de internationale context4 is hier sprake van een achterstandssituatie. Er is een aantal oorzaken aan te geven waardoor de functie van data-archivering in Nederland onder druk is komen te staan5:
1
Dit ontwerp is het product van de Taskforce dans. Deze werd geadviseerd door een ontwerpgroep bestaande uit onderzoekers en een organisatieadviesbureau, Deloitte. De samenstelling van de taskforce, die onder leiding stond van mevrouw mr. Y. van Rooy, en van de ontwerpgroep staat in de intentieverklaring dans, bijlage 5. 2 Aan de ontsluiting van onderzoeksgegevens wordt internationaal veel belang gehecht, onder meer blijkend uit de Ministersconferentie van de oecd in januari 2004. Het achtergronddocument voor deze conferentie (Declaration on access to Research Data from Public Funding) brengt de situatie rond en het belang van vrije toegankelijkheid van publiek gefinancierde dataverzamelingen in kaart, evenals de daaraan verbonden thema’s van privacybescherming en auteurs- en eigendomsrechten. 3 dare staat voor Digital Academic REpositories, een programma dat onder auspiciën van surf instellingen ondersteunt in het ontwikkelen van institutionele repositories; metis is het systeem dat de universiteiten gebruiken voor de informatie over hun onderzoek; het e-depot van de kb bewaart artikelen en tijdschriften voor de lange termijn. 4 Zie http://www.nsd.uib.no/cessda/europe.html voor een overzicht van de Europese organisaties voor data-archivering in de sociale wetenschappen. 5 ‘Behouden toekomst. Een advies met betrekking tot de toekomst van de diensten van het Nederlands Instituut voor Wetenschappelijke Informatie’, oktober 2003, rapport van de Commissie Informatiediensten niwi aan het bestuur van de knaw. Naar zijn voorzitter, dr. N.M.H. van Dijk, kortweg commissie Van Dijk genoemd.
Data Archiving & Networked Services
11
– – –
De aansluiting tussen archieven en onderzoekers in het veld is in veel gevallen problematisch gebleken, waardoor slechts een fractie van het geproduceerde materiaal kon worden verzameld. Er is voorts onvoldoende geïnvesteerd in technologische vernieuwing van de archieffunctie, waardoor vaak niet meer dan elementaire dienstverlening kan worden verleend. Er is concurrentie waar dat niet nuttig en nodig is (bijvoorbeeld wsa/cbs-Steinmetz-archief).
Ook heeft ongetwijfeld in een aantal gevallen een zekere angst voor het informatietijdperk meegespeeld. Mede daardoor gebeurt het produceren, verzamelen, opslaan, verrijken en beschikbaar stellen van data hier ten lande nog te zeer versnipperd en ongecoördineerd. Overal in Nederland bevinden zich onderzoeksdataverzamelingen, sommige klein, andere groot, sommige makkelijk toegankelijk, andere moeilijk. Er zijn bovendien aanzienlijke verschillen in structuur, soorten gegevens, bruikbaarheid, voorwaarden enz. tussen de verschillende verzamelingen. De versnippering op zich behoeft in deze tijd geen groot probleem meer te zijn, immers de technologische mogelijkheden om via netwerkconstructies snel grote hoeveelheden data te transporteren zijn talrijk. Door de opkomst van het Internet is het mogelijk om het verspreide dataaanbod en de uiteenlopende dataproducenten en -aanbieders onderling te verbinden in een nationaal data-archiveringsnetwerk, dat bovendien verbonden kan worden met vergelijkbare internationale voorzieningen. Maar dat proces moet wel worden georganiseerd, anders is er geen garantie te vinden voor continuïteit, voor bewaring van data op de langere termijn en voor de kwaliteit van de data. Vanuit hun landelijke verantwoordelijkheid voor de data-infrastructuur hebben knaw en nwo nu dus de handen ineengeslagen om hier een inhaalslag te maken. Zij presenteren het ontwerp van een nieuwe organisatie op het gebied van onderzoeksdata: dans6.
6
Op 22 juni 2004 werd onder toeziend oog van de minister van ocw door knaw en nwo een intentieverklaring ondertekend ten behoeve van dans, zie bijlage 1.
Data Archiving & Networked Services
12
2. Uitgangspunten en missie
knaw en nwo zijn ervan overtuigd dat een bundeling van krachten een betere dienstverlening voor de Nederlandse onderzoekswereld zal opleveren, mits voldaan wordt aan de volgende vier uitgangspunten: – Eén organisatie voor geesteswetenschappen en maatschappij- en gedragswetenschappen, waarin wetenschappelijke kennis en technologische expertise op het terrein van digitale datastructuren (metadata, opslag en toegang tot data) in die wetenschapsgebieden aanwezig is. – Een flexibele opzet bestaande uit: – een gemeenschappelijke kern met een archief en ontwikkelfunctie (het dans-centrum); – thematische ontwikkelprogamma’s (top’s), opgezet vanuit concrete onderzoeksbehoeften en waarin onderzoekers direct participeren en vanuit dans expertise wordt ingebracht; – samenwerking met onderzoekscentra in het veld die een data-functie hebben. Zulke bestaande lokale datacentra (ldc’s) worden uitgenodigd te participeren in het dansnetwerk, in het bijzonder met het oog op de toegankelijkheid van data voor andere onderzoekers. Ook kunnen gezamenlijk top’s worden opgezet. – Een heldere missie gericht op versterking van de nationale data-infrastructuur, in samenwerking met het veld. – Landelijk draagvlak binnen de geesteswetenschappen en de maatschappij- en gedragswetenschappen, alsmede bij andere betrokkenen (publieke en private dataproducenten, intermediairs, overige gebruikers). Wat betreft het laatste uitgangspunt, het landelijk draagvlak, zal dans vanaf het begin onderzoekers en institutionele spelers zoveel mogelijk betrekken bij de plannen en voorgenomen projecten. Het eerste bewijs van die open houding is de workshop die op 25 oktober 2004 werd gehouden om dit plan in brede kring te bespreken. Aanwezig waren onderzoekers, dataproducenten, archiefinstellingen, (semi)overheid en andere belanghebbenden. dans zal in 2005 kort na de start een kick-off conferentie organiseren waarin het eerste werkprogramma zal worden bediscussieerd met betrokkenen. Daarnaast bieden de Thematische Ontwikkelprogramma’s voldoende aanknopingspunten voor een actieve rol van onderzoekers en dataproducenten. De overige drie uitgangspunten worden in paragraaf 2 en 3 verder uitgewerkt. 2.1 Missie en contouren In één zin is de missie van dans om onderzoekers in de geesteswetenschappen en de maatschappijen gedragswetenschappen permanente toegang te bieden tot digitale onderzoeksdata. dans zal daarvoor samen met onderzoekers in deze disciplines de best mogelijke condities creëren: één transparante data-infrastructuur met een kwaliteit die er internationaal uitspringt. dans beoogt dé nationale faciliteit op het gebied van onderzoeksdata te worden. Onderzoekers kunnen in de toekomst voor data bij dans terecht, waar die data ook zijn geproduceerd of worden bewaard en ontsloten, en ze kunnen vertrouwen op de kwaliteit, actualiteit en continuïteit van die data. dans wil daartoe niet alleen een modern archief zijn, waar data voor beide wetenschapsgebieden op verantwoorde wijze worden bewaard en ontsloten, maar ook en vooral een stimulator van samenwerking tussen onderzoekers die daarbij gebruik kunnen maken van hoogwaardige datafaciliteiten en services. Bijzondere aandacht besteedt dans daarbij aan de interdisciplinariteit van
Data Archiving & Networked Services
13
projecten (samenwerking van informatici en onderzoekers uit beide vakgebieden) alsmede aan de internationale (Europese) dimensie van projecten. dans creëert een betrouwbare plek waar onderzoekers vanzelfsprekend hun data deponeren en optimaal toegang hebben tot data en gebruik kunnen maken van een geavanceerde dienstverlening en expertise op internationaal niveau. dans wil de contacten tussen gebruikers en leveranciers van onderzoeksdata vergemakkelijken en verbeteren en daarmee ook nieuw onderzoek stimuleren. dans wil samen met de onderzoekers werken aan de middellange termijn agenda voor digitalisering en dataverzameling voor de geesteswetenschappen en maatschappij- en gedragswetenschappenen hiermee innovatief onderzoek bevorderen. dans kan deze missie alleen waar maken in samenwerking met onderzoekers. De diensten die worden ontwikkeld moeten nauw aansluiten bij de behoeften van de onderzoekers. Die aansluiting geschiedt door middel van thematische ontwikkelprogramma’s (afgekort top), die zijn bedoeld om op een bepaald deelterrein de data-infrastructuur vorm te geven.7 top’s dienen databestanden met nationale en/of internationale reikwijdte beter toegankelijk te maken en/of ze te verrijken door harmonisatie met andere bestanden of door toevoeging van gegevens uit andere bestanden. Het kan gaan om afgesloten of lopende dataprogramma’s, om nieuwe initiatieven, of om verkenninge. top’s worden gezamenlijk bemenst door onderzoekers uit het veld, medewerkers van dans en eventueel andere experts. De financiering zal deels van de deelnemers moeten komen, deels van externe (ook Europese of andere internationale) bronnen. dans gaat er vanuit dat hoe beter men er in slaagt de missie te bereiken, des te groter de kans is op externe financiering. Naast top’s, die in zekere zin een incubatorfunctie hebben, zijn er in de landelijke infrastructuur ook al meer uitgekristalliseerde datacentra met een expertise op een specifiek gebied (inhoudelijk dan wel methodologisch). In het dans-jargon heten die Lokale Datacentra (ldc). dans zal samenwerking met deze centra zoeken en er in ieder geval naar streven dat er een expertisenetwerk tot stand komt, zoals dat ook in sommige andere landen functioneert (bv. de Engelse Digital Preservation Coalition). Ook als bestaande centra zelfstandig blijven, zal dans er naar streven dat het voor de gebruiker geen verschil maakt waar een archief is gesitueerd: hij of zij kan rekenen op dezelfde toegankelijkheid, transparantie, betrouwbaarheid, service etc. Ook databases die bij de ldc’s blijven kunnen dus profiteren van de expertise van het dans-centrum waardoor in principe een ‘landelijke dekking’ tot stand kan komen met betrekking tot toegankelijkheid en betrouwbaarheid van kwalitatief goede data-archieven. Om als ldc binnen de dans-omgeving te worden erkend dient aan een aantal kwaliteitseisen en voorwaarden te worden voldaan; bv. de metadata moeten via het dans-loket toegankelijk zijn en ook bestellingen kunnen via dans verlopen (o.a. door deze vanuit dans door te leiden naar het ldc dat zorgt voor de afhandeling). Hiermee beoogt dans de bestaande infrastructurele voorzieningen stap voor stap te verbeteren, zodanig dat onderzoekers in de toekomst optimaal van de data gebruik kunnen maken. Naast het realiseren van updates van bestaande voorzieningen, of het verbinden en verbeteren van bestaande (deel)verzamelingen, neemt dans ook nieuwe initiatieven waar nodig of wenselijk, of ondersteunt het initiatieven uit het veld. Onderzoekers, dataproducenten, gebruikers, ictdeskundigen en institutionele belanghebbenden zullen in overleg bepalen waaraan behoefte is en hoe die behoefte het best kan worden bevredigd. 2.2 Doelgroepen en reikwijdte dans is bedoeld voor de geesteswetenschappen èn de maatschappij- en gedragswetenschappen. Weliswaar leven tussen die gebieden verschillende ideeën en behoeften (en trouwens ook binnen
7
Thematische ontwikkelprogramma’s (top’s) worden nader uitgelegd in bijlage 1.
Data Archiving & Networked Services
14
die twee gebieden afzonderlijk), maar knaw en nwo zijn er van overtuigd dat er voordeel kan worden gehaald uit gezamenlijk optrekken. Er is namelijk ook overlap in datagebruik en – toepassingen (bijvoorbeelld Historische Steekproef Nederland, Volkstellingen, Nationale Rekeningen) en in het type data (kwantitatief en kwalitatief: beeld, tekst, geluid, bijvoorbeeld caodata (aias, cpb), nkps (survey met deels diepte-interviews), Corpus Gesproken Nederlands (inl). Het samenbrengen van (technische) expertise in één organisatie, het creëren van één loket voor onderzoekers en dataproducenten, het faciliteren van multi- en interdisciplinair onderzoek, en meer in het algemeen de voordelen van economies of scale, vormen gezamenlijk voldoende reden om naar één organisatie te streven. Het is daarbij evident dat dans geen rigide structuur moet krijgen en juist er naar moet streven zo efficiënt en flexibel mogelijk oplossingen te vinden voor de behoeften in de verschillende vakgebieden en de veelzijdige onderzoeksvraag naar data. Zo zal dans zich bijvoorbeeld niet uitsluitend richten op grote kwantitatieve dataverzamelingen, maar ook aandacht hebben voor de behoeften in het kwalitatieve onderzoek. Maar dans zal onmogelijk alle expertise op elk gebied van data in huis kunnen hebben, hetgeen een reden temeer is om samen te werken met experts in de vakgebieden. De oplossingen die dans zoekt kunnen variëren al naar gelang de bestaande behoeften, maar zijn ook afhankelijk van wat er al is. Op sommige terreinen bestaat al een structuur die als uitgangspunt kan worden genomen (bv. het Nederlands Historisch Data Archief, nhda), op andere terreinen bestaan verschillende structuren die bij elkaar moeten worden gebracht (bijvoorbeeld het Wetenschappelijk Statistisch Agentschap, wsa, en het Steinmetzarchief), en op weer andere terreinen bestaan er plannen (bijvoorbeeld voor een tekstarchief). Ook zijn er op de universiteiten en bij onderzoeksinstituten dataverzamelingen die mogelijk opgenomen kunnen worden in de dans-structuur.
Data Archiving & Networked Services
15
3. Opmaat voor een organisatiemodel
Het slagen van de missie van dans is sterk verbonden met het organisatiemodel. Zoals gezegd zijn er in Nederland grote verschillen in de wijzen waarop onderzoeksdata toegankelijk zijn. Ook in het buitenland is er niet één model te vinden dat als ideaal eruit springt. Dat wil zeggen dat dans geen voorbeeld kan nemen aan een internationaal succesverhaal. Maar ook hier heeft elk nadeel zijn voordeel. dans kan nu zijn eigen choreografie schrijven, daarbij selectief gebruik makend van elementen uit buitenlandse voorbeelden. Het bouwen van een nieuwe organisatie op het gebied van onderzoeksdata is dus geen sinecure. Wat de buitenlandse ervaringen ons in ieder geval leren is dat het uiterst belangrijk is de juiste balans te vinden tussen het belang van de dataproducent(en), de (individuele) onderzoeker(s) en de meerwaarde van een brede toegankelijkheid van kwalitatief betrouwbare onderzoeksdata. De selectie van het aanbod, de kwaliteitszorg voor de documentatie van de data en de zorg voor herbruikbaarheid van data over een lange periode zijn typerende taken en verantwoordelijkheden van een centrale data-archief organisatie. Voor de gebruikers zijn betrouwbaarheid, vindbaarheid en transparante ontsluiting van beschikbare dataverzamelingen van groot belang. Bij de centrale organisatie kan de technologische en organisatorische ervaring uit verschillende velden bij elkaar komen en elkaar onderling versterken, bij onderzoekers in het veld zit over het algemeen veel expertise ten aanzien van de inhoud en het behandelen van specifieke data. Het komt er voor dans op aan die twee krachten zo goed mogelijk te combineren. De initiatiefnemers van dans, knaw en nwo, realiseren zich maar al te goed dat het vinden van een balans tussen individuele en collectieve belangen essentieel is voor het slagen van de missie van dans. De in paragraaf 2 gekozen uitgangspunten, en met name de structuur met een danscentrum, top’s en lcd’s bevatten naar de mening van de initiatiefnemers gezamenlijk de elementen voor die balans zorg kunnen dragen: –
Eén dans-centrum met twee functies: a.: ontwikkeling en acquisitie; b: archief en beschikbaarstelling.
De ontwikkelfunctie zal vooral tot uiting komen in de thematische ontwikkelprogramma’s (top’s). Van medewerkers hier wordt verwacht dat ze èn de nodige expertise hebben op technologisch gebied èn de vakgebieden goed kennen. De ontwikkelprogramma’s worden altijd met onderzoekers in het veld uitgevoerd. De archieffunctie zal niet het passief bewaren van data inhouden, maar een actief management van data, passend in de ideeën van het information life cycle management (waarin de gebruiker een belangrijke rol speelt). Dat kan alleen in nauwe samenwerking met onderzoekers. Een eerste kern wordt opgebouwd vanuit taken van het Nederlands Historisch Data Archief (nhda), het sociaalwetenschappelijk Steinmetzarchief en het Wetenschappelijk Statistisch Agentschap (wsa). Deze zullen – na een grondig assessment – het eerste gemeenschappelijke gezicht vormen van de nieuwe organisatie. –
Thematische Ontwikkelprogramma’s (top’s), om nieuwe terreinen te ontginnen of bestaande te verbeteren en/of te verbinden.
Data Archiving & Networked Services
16
De Thematische Ontwikkelprogramma’s beogen in te spelen op lokale ontwikkelingen in de verschillende wetenschapsgebieden. Waar nodig of gewenst zal dans initiatieven in gang zetten, in de vorm van top’s, die beogen de bestaande data-infrastructuur ‘dans-proof’ te maken. Initiatieven voor top’s kunnen ook, bij voorkeur, door het veld worden genomen (zie bijlage 1 voor een lijst van mogelijke top’s). Het kan bij top’s gaan om het verbeteren van de bestaande infrastructuur, of om integratie van losse initiatieven, of zelfs om geheel nieuwe initiatieven. Voor de top’s zal dans expertise inbrengen vanuit de centrale organisatie. De uitkomst van een top kan in principe twee vormen aannemen. Het specifieke data-archief wordt feitelijk opgenomen in de dans-kern of het archief blijft bestaan onder verantwoordelijkheid van een lokale onderzoeker of organisatie (in de vorm van een ldc). In beide gevallen zou het archief wel dans-proof moeten zijn, waardoor het voor onderzoekers in het gebruik en toegankelijkheid geen verschil uitmaakt welke van de twee uitkomsten er is. –
Lokale Datacentra (ldc’s), bestaande datavoorzieningen, waar door onderzoekers en/ of dataproducenten reeds aan data wordt gewerkt (archivering, verrijking, etc.), worden uitgenodigd binnen de dans-context te functioneren.
Er zijn in de landelijke infrastructuur bestaande datacentra met een expertise op een specifiek gebied. dans zal samenwerking met deze centra zoeken en er in ieder geval naar streven dat er een expertise netwerk tot stand komt, zoals dat ook in sommige andere landen functioneert (bv. de Engelse Digital Preservation Coalition). Deze datacentra kunnen de status van een ldc krijgen als ze aan een aantal kwaliteitseisen en voorwaarden voldoen. Een ‘wederdienst’ is dat deze ldc’s een beroep kunnen doen op de expertise en faciliteiten van dans. Met deze opzet wordt bereikt dat de data optimaal toegankelijk blijven (c.q. worden) en dat er niet wordt gecentraliseerd waar dat niet wenselijk of niet nodig is. Om het bovenstaande te verwezenlijken kiest dans voor een organisatie model dat de vorm heeft van een decentraal netwerk.8 Er is in dit model een centrale plek waar bepaalde verantwoordelijkheden (kwaliteit, continuïteit, trendwatching, internationalisering) worden neergelegd, maar ook decentraal zijn er (kleinere) hubs die een zekere macht (gezag) uitoefenen in hun specifieke omgeving. Deze hubs zijn verbonden met het centrum, maar hebben tevens hun eigen verantwoordelijkheden.9 In alle modellen speelt overigens de spanning tussen centraal en decentraal, dat wil zeggen de vraag welke functies in het centrale deel van de organisatie worden neergelegd en welke niet, en hoe dan vervolgens de relaties tussen de verschillende onderdelen worden vorm gegeven. Het model van het decentrale netwerk biedt naar de mening van knaw en nwo de beste mogelijkheden om werkendeweg flexibel en efficiënt (agile organization) oplossingen te vinden. Soms zal dat resulteren in opname van datacollecties in het centrale archief, en soms niet. Het bovenstaande leidt tot het volgende beeld van dans in het onderzoeksveld:
8
Dit decentraal netwerk model is te prevaleren boven twee andere organisatievormen die in het Internettijdperk in de organisatie-literatuur zijn te vinden (Alexander R. Galloway, Protocol. How control exists after decentralization, 2004: 29 e.v., mit Press, Cambridge Ma.). De eerste vorm is het zogenaamde centralized network (Foucault’s panopticon) waarin een centraal punt alle links kan overzien en besturen. De situatie in de wetenschappelijke wereld met zijn gedistribueerde kennis leent zich slecht voor deze vorm van organisatie en controle. Een tweede vorm die beter aansluit bij het decentrale karakter van de wetenschap is het zogenaamde distributed network. In dit model is er geen hiërarchie en in theorie maximale handelingsvrijheid voor elke participant. Het nadeel is dat een collectief geheugen niet zomaar ontstaat en dat leer- en kwaliteitsprocessen grotendeels toevallig zijn. 9 In het vorig jaar verschenen swr-rapport is een vergelijkbare structuur voorgesteld waarin naast een centraal dataservice centrum er regionaal zogenaamde topical expertise centers zijn. Networked Data Services. Towards a future data infrastructure for the social sciences in the Netherlands. An advisory report by the Social Sciences Council, Royal Netherlands Academy of Arts and Sciences, Amsterdam 2003.
Data Archiving & Networked Services
17
Schema I: dans in de onderzoeksomgeving
Top LDc
= thematisch ontwikkelprogramma = lokaal datacentrum = onderzoeksgroep met een data-archief
De organisatie is dynamisch van opzet. Er is een dans-centrum met een archief- en ontwikkelfunctie. Er zijn top’s om nieuwe of bestaande terreinen te ontwikkelen. top’s zijn altijd een samenwerkingsverband tussen onderzoekers/dataproducenten en dans-centrum. Onderzoeksgroepen kunnen ook samenwerken in een lokaal datacentrum. Indien dit dans-proof wordt kan het de status van ldc krijgen. dans zal er in ieder geval naar streven met de bestaande ldc’s een expertise netwerk te vormen. Ook de dataproducenten kunnen deel uit maken van dat netwerk.
Data Archiving & Networked Services
18
4. Gefaseerde opbouw dans
Het globale model voor dans in de omgeving moge duidelijk zijn, een garantie voor succes dat natuurlijk niet. dans zal soms initiatieven nemen die de kans lopen te mislukken. Er doen zich, zoals ook blijkt uit bijlage 1, tal van mogelijkheden voor tot het creëren van nieuwe Dans-onderdelen, maar ervaringen hier en in het buitenland leren dat er vaak weerstanden en belangentegenstellingen moeten worden overwonnen. Het voordeel van de dans-organisatie die ons voor ogen staat is tenminste, juist doordat er een centrum is waar informatie samenkomt, dat de kennis over een mislukking niet verloren gaat. Maar ook, dat de kennis over succes snel kan worden gedeeld. dans heeft natuurlijk vooral succes nodig. De meeste kans op succes ligt in een gefaseerde ontwikkeling. Immers, in de digitale wereld gaan de ontwikkelingen zo snel dat zelfs een paar jaar vooruitkijken al een hachelijke onderneming is. De fasering die we met dans voor ogen hebben stoelt op twee overtuigingen: in de eerste plaats bestaat door fasering de mogelijkheid om het globale plan dat we met de organisatie beogen tijdig bij te stellen als ontwikkelingen daartoe aanleiding geven; in de tweede plaats biedt fasering de beste kansen om initiatieven uit het veld flexibel in te passen. We zien twee fasen, een bouwfase en een oogstfase. In de eerste fase moeten drie dingen gebeuren: 1. Opbouw en inrichting van de kernorganisatie; incl. het ‘dans-proof’ maken van de bestaande structuren (nhda en Steinmetz/wsa). 2. In gang zetten en uitvoeren van de eerste top’s. 3. Verkenning gericht op: – Een behoefte-inventarisatie binnen de geesteswetenschappen en de maatschappij- en gedragswetenschappen. – De mogelijkheden om bestaande ldc’s op te nemen in het dans-netwerk. In de tweede fase wordt er geoogst: 1. Verdere vormgeving van de organisatie – kern en satellieten 2. Verdere uitgebouw, nationaal en ook internationaal (met name Europees). Door de opzet van de dans organisatie als decentraal netwerk kan deze uitbouw zeer efficiënt (modulair en schaalbaar) plaatsvinden; een verdere uitbouw betekent niet automatisch dat het centrale deel groter wordt, groei kan immers ook via de top’s en de ldc’s plaatsvinden. Hoe lang de beide fasen duren is moeilijk vooraf te zeggen, maar de schatting is dat de eerste fase ongeveer twee jaar duurt, de tweede ongeveer drie jaar. Daarmee zou dans dan in 2009 een volwaardige organisatie zijn. Het is van belang om bij de evaluatie (c.q. het opstellen van criteria waarop geëvalueerd gaat worden) rekening te houden met deze twee fasen. We beperken ons in deze notitie tot de eerste fase. 4.1 Werkzaamheden in fase 1 Om de opbouw van de kernorganisatie goed te laten verlopen moet aan twee voorwaarden zijn voldaan.
Data Archiving & Networked Services
19
In de eerste plaats zal er een goede directie en staf moeten worden aangetrokken. Hierin zal voldoende kennis en expertise aanwezig moeten zijn voor de vakgebieden die worden bediend, en tevens voldoende technologische en methodologische expertise. De directeur zal goede kennis moeten hebben op het terrein van de primaire processen van dans. Sommige functies in dans zullen gespecialiseerde kennis vereisen, maar in een veel gevallen zal het gaan om een combinatie van verschillende kennis en kundes. Het is aan de knaw en nwo om een aansprekende directeur met gezag in het wetenschappelijk veld te vinden, en vervolgens medewerkers van voldoende kwaliteit en met voldoende binding met de onderzoekswereld. In de tweede plaats zal er een realistisch werkprogramma moeten worden opgesteld, grofweg bestaande uit twee delen, een organisatorisch en een inhoudelijk deel. De aan te stellen directeur zal over beide delen nagenoeg even sterke ideeën moeten hebben. Om tot een efficiënte inrichting van de organisatie te komen moet in het eerste jaar veel werk worden verzet. Hier geven we kort een eerste globale agenda van zaken die binnen dans uitgewerkt moeten worden als onderdeel van de bedrijfsvoering. – – – – – – – – – – –
Opstellen communicatieplan en algemene presentatie van dans (bestuurlijk en aan de onderzoekers). Het opnemen van dataverzamelingen uit thans lopende of recent afgesloten projecten in het archief. Het opstellen en implementeren van procedures waarbij permanent access van onderzoeksgegevens structureel onderdeel is van een onderzoeksproject. Het inpassen cq. associëren van bestaande thematische/lokale datacentra aan de dansorganisatie. De opbouw dan wel aanpassing van de archieftechnische infrastructuur. De opbouw van het webportaal van dans, en vulling met basisinformatie. De uitbouw van het webportaal van informatie- naar transactiemedium (direct en remote access, levering bestanden). Het inrichten van de organisatie als zodanig, het bestuurlijk proces alsmede het selectieproces voor de top’s. Opstellen van algemene voorwaarden dans voor leveranciers en gebruikers in de toepasselijke juridische context. Uitwerken hernieuwd cbs-contract voor beschikbaarstelling en samenwerking. Internationale presentatie van dans en participatie in programma’s voor Europese datainfrastructuur.
Omdat het om de opbouw van een nieuwe organisatie gaat, ligt het in de rede dat de directeur voldoende vrijheid krijgt om de eigen inzichten voor de invulling tot uitdrukking te brengen. De dans-kern zal voorts uit medewerkers moeten bestaan die deze gevarieerde werkzaamheden aankunnen. dans zal dus bestaan uit mensen die vakinhoudelijke en technische expertise koppelen aan ondernemingszin. Projectleiders moeten – afgezien van hun vakinhoudelijke kennis – om kunnen gaan met belangentegenstellingen in het veld en ervaring hebben in het bij elkaar brengen van mensen die vanuit verschillende disciplines naar een probleem kijken. Inhoudelijk zal dans in de eerste periode vooral als een projectorganisatie functioneren. De structuur van de organisatie als geheel wordt daarop zoveel mogelijk afgestemd. De projecten in de eerste fase worden in drie groepen verdeeld en vormen de basis voor het eerste werkprogramma: ia Opbouw kern dans ib Thematische ontwikkelprogramma’s: top’s ic Verkenning, ldc’s, trendwatching en r&d
Data Archiving & Networked Services
20
In schema ziet dit er als volgt uit: Schema 1: projecten fase 1 Fase 1A – opbouw kern, afronding herfst 2005
Werkprogramma
Doel
Opbouw kern DANS: het creëren van één loket voor onderzoeksdata in de geesteswetenschappen en de maatschappij- en gedragswetenschappen.
1. Versmelting van het Steinmetzarchief en het WSA, na assessment, en herzien relatie met het CBS.
Het DANS-proof maken van dit conglomeraat.
2. NHDA – assessment.
Het DANS-proof maken van het NHDA, mede in het licht van het rapport Van Dijk.
Fase 1B – TOP’s looptijd tot eind 2006 Opzetten van Thematische Ontwikkelprogramma’s.
3. Afgesloten/ bestaande dataprogramma’s.
Harmonisatie, verrijking, archivering en ontsluiting van data uit afgesloten programma’s om deze veilig te stellen en toegankelijk te maken.
4. Lopende dataprogramma’s.
Samen met onderzoekers en organisaties in het veld lopende dataprogramma’s in DANS integreren. Samen met onderzoekers en organisaties in het veld bestaande initiatieven verder vormgeven en integreren in de DANS-organisatie.
5. Initiatieven voorgesteld en projecten in startfase.
Fase 1C – verkenning, trendwatching, R&D looptijd onbepaald Verkenning
6.Veldverkenning ten behoeve van inhoudelijke prioriteiten.
Samen met het onderzoeksveld prioriteiten voor DANS stellen.
Verkenning
7. Mogelijkheden tot samenwerking met LDc’s
Vormgeven aan een kwalitatief hoogwaardige nationale datainfrastructuur.
Voorbeeld van R&D
8. Ontwikkeling van open en uitbreidbare architectuur voor data opslag en documentatie.
Afstemming van de technische infrastructuur van DANS op nieuwe onderzoeks- en archiveringsbehoeften.
Voorbeeld van trendwatching
9. Participeren in internationaal wetenschappelijk debat over nieuwe digitale archiveringsstrategieën.
Leveren van fundamentele bijdrage aan de theorie en praktijk van digitale archivering.
Data Archiving & Networked Services
21
De projecten zullen elk voor zich moeten worden gedefinieerd in termen van heldere doelstellingen, planning en verwachte uitkomsten. Het moet daarbij ook duidelijk zijn wat succes- en faalfactoren zijn en waar de beslissingsmomenten liggen voor een go/no go. De directie van dans moet in de eerste fase niet bang zijn om projecten die niet van de grond komen af te stoten en daarvoor in de plaats andere te kiezen. Essentieel is de behoefte die in het veld leeft, en die moet blijken uit de bereidheid om te investeren in de initiatieven, in wetenschappelijke, personele en financiële zin. dans is stimulator, organisator en technisch archiveringsexpert, maar het draagvlak en de vakinhoudelijke onderzoeksexpertise moeten vanuit het veld komen. De organisatie van de kern van dans vloeit voort uit wat nodig is voor de genoemde projecten. Zo ligt het voor de hand dat bij de eerste twee projecten onder fase 1A. wordt voortgebouwd op wat er al is in de genoemde data-organisaties. Tegelijkertijd zullen deze onderdelen kritisch moeten worden bekeken in het licht van de nieuwe dans-doelstellingen (assessment). Voor de onder fase 1B. genoemde projecten is het vooral belangrijk dat optimaal gebruik wordt gemaakt van de aanwezige expertise in het veld. Hier gaat het vooral om coördinatie en aansluiting bij dans in termen van kwaliteit en toegankelijkheid. Bij de projecten onder fase 1C. zijn de verkenningen een absolute noodzaak om in het begin ter hand te nemen teneinde inzicht te krijgen in het veld, en tevens om commitment te verkrijgen. Voor de andere projecten onder fase 1C zouden onderzoekers min of meer de vrije hand moeten krijgen om samen met ict-deskundigen pilots op te zetten op de genoemde terreinen. Deze laatste vorm van projecten zal in het geheel van dans een bescheiden plek innemen, maar het is wel noodzakelijk om up-to-date te blijven. Ten overvloede zij het nogmaals gezegd: in top’s en projecten nemen altijd onderzoekers uit het veld deel.
Data Archiving & Networked Services
22
5. Structuur dans in hoofdlijnen
Een adequaat functionerend dans is het resultaat van een proces van ontwikkeling. Daarin gaat het niet alleen om de kern van dans en de satellieten daaromheen. dans dient draagvlak te verwerven in het gehele veld van de gedrags- en maatschappijwetenschappen en de geesteswetenschappen. Dat geldt ook voor het nog bredere scala van (publieke) dataleveranciers en overige gebruikers van wetenschappelijk relevante dataverzamelingen. Om dit proces te laten slagen moet de structuur van dans enerzijds flexibel zijn, en anderzijds voldoende gewicht hebben om hoogwaardige kwaliteit te leveren in het snel ontwikkelende veld van digitale dataservices. De beginstructuur vloeit voort uit de benodigde werkzaamheden in de eerste fase van dans. Het is mogelijk dat na die eerste ontwikkelingsfase voor een andere structuur wordt gekozen, die bijvoorbeeld meer is toegesneden op wat op dat moment tot stand is gebracht. De hoofdstructuur van dans bestaat uit een directie en daaronder een tweetal secties (mogelijk alternatieve benaming: taakgroep) voor de primaire taken archief en ontwikkeling. Gekozen is voor de benaming secties (en niet voor ‘afdelingen’ o.i.d.) om daarmee de flexibiliteit van de organisatie te onderstrepen. De secties bestaan uit een aantal vaste medewerkers, die naast hun taken in de sectie ‘uitgeleend’ kunnen worden aan projecten of top’s. De top’s en projecten bestaan uit medewerkers van de secties en onderzoekers of andere experts uit het veld. Deze gemengde werkwijze kan verschillende vormen aannemen, van licht (bv. samenwerking op afstand) tot zwaar (bijvoorbeeld iemand wordt tijdelijk gedetacheerd bij dans). Alleen zo is er de garantie dat de organisatie geen eiland wordt en dingen produceert waarvan niemand gebruik maakt. Om de flexibiliteit te vergroten, en bovendien te profiteren van lokaal aanwezige expertise streeft dans ernaar om een aantal medewerkers te hebben die parttime in dans en parttime bij een onderzoeksinstelling werken. We gaan in de ontwikkelingsfase dus uit van twee secties die de ‘uitvalsbasis’ voor de medewerkers vormen: 1. Sectie Ontwikkeling & Acquisitie Deze sectie (oa) is primair verantwoordelijk voor de acquisitie van data en de uitvoering van de thematische ontwikkel programma’s (top’s). Een van de eerste taken van dans zal zijn om een acquisitiebeleid te ontwerpen alsmede transparante procedures voor de selectie en financiering van top’s. Voor de beoordeling van mogelijke top’s zal een wetenschappelijke adviesraad worden ingeschakeld. Het is duidelijk dat financiering vanuit dans maar in beperkte mate kan plaats vinden, zodat gezamenlijk met de onderzoekers naar aanvullende financiering moet worden gezocht. De vakinhoudelijke specialisten in deze sectie hebben goede contacten in het veld en zijn goed op de hoogte van de mogelijkheden die zich daar voordoen en de behoeften die er bestaan. Een deel van deze medewerkers zal parttime worden aangesteld en/of tijdelijk gedetacheerd vanuit universiteiten of onderzoeksinstellingen. Medewerkers van de sectie oa hebben als hoofdtaak de opzet, ontwikkeling en begeleiding van top’s. Dat kan inhouden dat ze de leiding hebben van een top, maar vaak zal de top worden geleid door een onderzoeker uit het veld, afhankelijk van wie het initiatief neemt. Naast de top’s houden medewerkers van de sectie oa zich bezig met acquisitie van databestanden waarvoor ze dikwijls op locatie zullen vertoeven. Ook hebben zij een rol in de onderhandelingen met ldc’s om relatie met dans vorm te geven.
Data Archiving & Networked Services
23
2. Sectie Archief en Beschikbaarstelling De archiveringstaken worden ondergebracht in de sectie Archief en Beschikbaarstelling (ab). Deze sectie zorgt voor de intake, de data-documentatie, de opslag en het beheer, en bemiddeling bij beschikbaarstelling van de data. De taken van de groep worden uitvoerig beschreven in het oais Reference model onder de noemers Ingest, Data Management, Archival Storage, alsmede een aantal taken op gebied van Preservation Planning. De sectie ab is primair verantwoordelijk voor het feitelijke archief, de plek waar afgeronde projecten terechtkomen en toegankelijk worden gemaakt. Met dit laatste wordt echter niet bedoeld dat de werkzaamheden aan dat deel van het archief daarmee zijn afgesloten. Het archief is dynamisch, er worden services op ontwikkeld, en er wordt voortdurend aangevuld en mogelijk ook afgestoten. Ook kunnen medewerkers van deze sectie waar nodig worden ingezet bij top’s. De fysieke archivering wordt uitgevoerd onder verantwoordelijkheid van dans. Overwogen kan worden om de duurzame fysieke opslag en het technisch beheer van de databases uit te besteden aan een professionele externe partij, bijvoorbeeld de Koninklijke Bibliotheek. Datzelfde geldt voor het technisch beheer van de webbased dienstverlening. R&D, methodologie Binnen de twee secties is ook een r&d-component opgenomen. Dat is nodig ten behoeve van het up-to-date houden van de infrastructuur en het op de hoogte blijven van innovaties op het gebied van data-archivering. dans streeft ook naar het bijdragen aan innovaties op het gebied van digitale archivering. r&d is nodig om te voorkomen dat er snel weer een technologische achterstand optreedt. De strategieën, methoden en systemen zijn voortdurend in ontwikkeling en ook veranderen de behoeften van gebruikers voortdurend. Daarom ook is trend watching een belangrijk onderdeel van r&d, hetgeen overigens voor een belangrijk deel in samenwerking met anderen moet gebeuren gegeven de internationale omvang van de ontwikkelingen. Onderzoek kan inspelen op bepaalde trends die internationaal worden gesignaleerd, maar ook voortkomen uit behoeften van een van de secties, of uit het veld. Vooralsnog wordt in beide secties 2 fte voor de r&d functie gereserveerd. Er zal bij de medewerkers binnen beide secties ook voldoende methodologische kennis aanwezig moeten zijn, zowel ten behoeve van de systeeminnovaties als voor wat betreft de meer vakinhoudelijke methoden van dataverzameling. Dit klinkt voor de hand liggend, maar het wordt hier met nadruk opgemerkt omdat in het brede gebied dat dans wil bedienen een groot aantal verschillende datatypen bestaat en ook de methoden van dataverzameling nogal wat vakspecifieke kenmerken hebben (zie bijlage 2). Zoals al eerder opgemerkt is het ook evident dat dans niet alle expertise in huis kan hebben, en dus goed zal moeten samenwerken met lokale experts. 5.1 Bemensing en opstart Vooralsnog wordt gestart met een verdeling over de twee secties van 8 fte. Het is echter goed mogelijk dat na verloop van tijd een herverdeling over de secties plaats vindt. Sowieso zitten mensen niet vast in secties, daar ze regelmatig aan projecten of top’s zullen deelnemen. De top’s en projecten kunnen beide secties doorsnijden. Ook andere instituten en onderzoekers kunnen participeren in de projecten. Medewerkers kunnen ook worden gedetacheerd bij lokale datacentra (ldc’s) of andere dataverzamelingen in het veld. De secties vormen de organisatorische basis van dans; het chassis. De projecten – de Top’s in het bijzonder – zijn in die metafoor te zien als de motor van dans. Zij zorgen voor de voortbeweging. Ze vormen tezamen de kernactiviteiten die vorm geven aan de dans-organisatie.
Data Archiving & Networked Services
24
Het werkprogramma 2005 zal starten met twee projecten waarin bestaande structuren, nhda en Steinmetz-archief/wsa, zullen worden omgevormd tot een eerste dans-archief (fase 1A). Dat houdt in: 1. een verzekering van permanente opslag en behoud van de gegevens, volgens de beste archiveringstechnische praktijk; 2 ontsluiting van beschikbare data voor derden, via catalogisering en documentatie (metadata); 3 distributie van gegevens aan derden, zulks met inachtneming en bewaking van (intellectuele) eigendomsverhoudingen en privacy-overwegingen. Deze twee projecten hebben hetzelfde doel (onderdeel worden van het dans archief), maar vereisen een verschillende aanpak. In het geval van het nhda zal bij de inpassing expliciet rekening gehouden moeten worden met de aanbevelingen van de commissie Van Dijk (versterking van de acquisitie van data-archieven; beperking van het aantal en helderder criteria voor de selectie van projecten, die vooral moeten aansluiten bij de centrale taken van het data-archief; mogelijk hervatting van trainingen en stages voor onderzoekers).10 In het andere geval gaat het om de vorming van één loket door de integratie van Steinmetz-archief en wsa en een onderhandeling met cbs over de dataleverantie. Beide taken moeten in het eerste half jaar van dans voltooid kunnen worden. Naast deze twee projecten zullen in het eerste jaar in ieder geval twee of drie top’s worden opgezet op terreinen waarbij de archivering nog in de kinderschoenen staat, maar waarvan het veld al wel heeft aangegeven deel te willen nemen in dans. De selectie van deze top’s is afhankelijk van wat er vanuit de verschillende velden wordt aangedragen, maar uiteraard ook van de financiële en personele mogelijkheden. dans kan vanuit een basisfinanciering top’s in gang zetten, maar om ze te volbrengen is in de meeste gevallen met een zekere omvang extra ondersteuning onontbeerlijk. dans zal in samenwerking met het veld zich inspannen om dergelijke externe bronnen aan te boren. In bijlage 1 wordt een uitgebreide (maar lang niet volledige) lijst van mogelijkheden voor top’s gegeven. Het ontwikkelen van een selectieprocedure voor top’s zal een belangrijke taak zijn voor de dans-directie in de eerste periode. Het ligt voor de hand hiervoor de wetenschappelijke adviesraad in te schakelen.
10
Rapport commissie Van Dijk, p. 31-32; Zie noot 5.
Data Archiving & Networked Services
25
6. Organisatie dans 2005
Na het globale omgevingsmodel voor dans dat in schema 1 is weergegeven kunnen we nu het dans centrum meer reliëf geven. Wat het onderstaande schema aangeeft is dat er sprake is van een compacte organisatie in de kern, opgezet langs de twee primaire taken archief en ontwikkeling. De secties hebben onderscheiden taken, maar werken ook nauw samen aan de opbouw van de organisatie. Het duidelijkst gebeurt dit in de top’s, maar het gebeurt ook in de ontwikkeling van het data-archief en de één-loket service voor dataproducenten en de onderzoeksgemeenschap.
Figuur 2: Het DANS centrum
De directie, die samen met de sectiehoofden het management team van dans vormt, geniet een redelijk grote vrijheid om de dans-organisatie te ontwikkelen, maar zij wordt daarin begeleid door een Wetenschappelijke Adviesraad waarin onderzoekers en dataproducenten zijn vertegenwoordigd. Het is voorts aan de knaw en nwo om een bestuurlijke constructie uit te werken waarin enerzijds het langdurig commitment van deze beide organisaties aan dans is geregeld, anderzijds de verantwoording van de dans-directie aan beide organisaties. Directie en staf, 4 fte. De directie bestaat uit vier functies. Naast de directeur een (senior) beleidsmedewerker/ jurist, en een management assistent is er een financieel-economische functie noodzakelijk. De directeur is verantwoordelijk voor de algehele ontwikkeling van het beleid van dans, nationaal en internationaal, in het licht van de intenties van knaw en nwo. Hij/zij draagt zorg voor de uitvoering van het beleid, en geeft leiding en sturing aan de medewerkers en werkzaamheden binnen dans. Hij/zij geeft mede vorm aan het hrm-beleid. De management assistent en de beleidsmedewerker dragen zorg voor de bewaking van de programmaverplichtingen van dans en voor managementrapportages. dans kent daarnaast een aantal werkzaamheden op het vlak van
Data Archiving & Networked Services
26
bestuursondersteuning, beleidsvorming, verwerving van programmafinanciering, verrichten van haa lbaarheidsverkenningen, en het beleid, de regelgeving en het toezicht rond bewaking van privacy en rechtmatig gebruik van de data. Dat behoort tot het takenpakket van de beleidsmedewerker/jurist, die vanzelfsprekend expertise dient te hebben op het gebied van ict. Deze beleidsmedewerker krijgt bovendien als neventaak de rol van functionaris voor de gegevensbescherming (data protection officer) krijgt.11 Het deskundigheidsprofiel is in juridisch opzicht (en bij voorkeur financieeleconomisch opzicht) complementair aan dat van de directeur, die op dit terrein natuurlijk ook het nodige zelf doet. Het personeelsmanagement is een verantwoordelijkheid van de leidinggevenden. De beheersmatige ondersteuning wordt ondergebracht bij de management assistent. De invulling van de financieel-economische functie bevat twee aspecten. Aan de ene kant het aspect van de financiële administratie, aan de andere kant het aspect van de controller. De controller adviseert de directeur op het gebied van beleid ten aanzien van de bedrijfsvoering; schept voorwaarden voor de uitvoering van dat beleid, inclusief het beleid ten aanzien van de projecten. Verder bestaat de taak uit het adviseren over en toetsen en bewaken van de realisatie van het (financieel-economisch) beleid van dans; het vorm en inhoud geven van de administratieve inrichting en organisatie; het realiseren van een planning & control cyclus; het adviseren over en opstellen van de begroting en jaarrekening en het bewaken van de realisatie ervan. Afhankelijk van de uiteindelijke juridische status en institutionele ophanging van dans dient te worden besloten hoe deze functie en de twee aspecten worden ingevuld. Denkbaar is dat gebruik wordt gemaakt van de faciliteiten van de eventuele gastheer- en koepelorganisaties waarvan dans deel uitmaakt. Vooralsnog wordt hier 1 fte gereserveerd op niveau schaal 11, waarbij een verdeling van 0.4 controller (schaal 12) en 0.6 financiële administratie (schaal 7) werkbaar lijkt. Directeur Beleidsmedewerker / jurist * Secretaresse / management assistent Financieel-economische functie**
1.0 1.0 1.0 1.0
Totaal directie
4.0 fte
*met de taak van functionaris voor de gegevensbescherming (data protection officer) **te verdelen over een financieel-administratief en een controller deel Sectie ontwikkeling en acquisitie, 8 fte. De themamanagers zijn de leidende specialisten op het gebied van dataverzamelingen, zowel in methodologisch opzicht als qua toepassingsgebieden. Bij de start van dans dienen inhoudelijk tenminste de volgende gebieden door de themamanagers en applicatiespecialisten afgedekt te worden: – sociaal-wetenschappelijke survey-data – geografische dataverzamelingen – tekstcorpora en linguïstiek – retrodigitalisering – toegankelijkheid cbs-data 11
De swr beveelt in het rapport Networked Data Services aan om een onafhankelijke functionaris voor de gegevensverwerking (Engels: Data Protection Officer) aan te stellen. De Wet bescherming persoonsgegevens (Wbp) biedt organisaties de mogelijkheid om een dergelijke functionaris te benoemen. De noodzaak van een afzonderlijke data protection officer is echter twijfelachtig, omdat de taak in omvang beperkt is. De vereiste competenties en onafhankelijkheid voor deze rol behoren dan wel tot het functieprofiel van de beleidsmedewerker.
Data Archiving & Networked Services
27
Voor de dans-taken op het niveau van themamanager is een basiscapaciteit van 4.0 fte nodig. Uitgaande van het eerder uiteengezette concept van deeltijdfuncties in combinatie met een aanstelling als onderzoeker zal deze capaciteit verdeeld over meer dan vier medewerkers ingezet kunnen worden. Indien zij bijvoorbeeld voor 0.6 fte bij dans worden aangesteld dan zou het om 6 à 7 medewerkers kunnen gaan. Additioneel moet rekening gehouden worden met tijdelijke projectmedewerkers. Voor de start van dans moet worden geïnventariseerd welke capaciteit vanuit reeds lopende projecten bij de knaw en nwo wordt ingebracht in dans. Deze vragen doen zich bijvoorbeeld voor ten aanzien van het Iconclass project en de door dare gesubsidieerde ontwikkeling van het E-Depot voor de Nederlandse Archeologie. Voorlopig wordt hiervoor 1 fte gereserveerd, waarbij er eveneens van wordt uitgegaan dat daarvoor meerdere medewerkers kunnen worden aangesteld in parttime dienst, bijvoorbeeld 2 van 0.5 fte. Daarnaast omvat de internationale ontwikkelagenda een aantal thema’s die integrerend van aard zijn over de verschillende disciplines heen. De dans-medewerkers dienen in deze internationale professionele context actief bij te dragen aan de verdere ontwikkeling, en er zo voor te zorgen dat dans in vakmatig opzicht internationaal op de kaart komt. Om het ambitieniveau in te vullen dat dans tot de internationale voorhoede gaat behoren is een start met minimaal 2 fte noodzakelijk. Deze r&d-staf van informatiekundige specialisten voert de werkzaamheden in beginsel uit binnen het kader van top’s in Nederland en in internationale ontwikkelingsprojecten. Hoofd Themamanagers Top-medewerkers in tijdelijke dienst (wel vaste formatie) r&d
1.0 4.0 1.0 2.0
Totaal oa
8.0 fte
Sectie Archief en beschikbaarstelling, 8 fte Deze sectie zorgt voor de intake, de data-documentatie, de opslag en het beheer, en bemiddeling bij beschikbaarstelling van de data. De taken van de groep worden uitvoerig beschreven in het OAIS Reference model onder de noemers Ingest, Data Management, Archival Storage, alsmede een aantal taken op gebied van Preservation Planning. De fysieke archivering wordt uitgevoerd onder verantwoordelijkheid van de sectie. Overwogen kan worden om de duurzame fysieke opslag en het technisch beheer van de databases vanuit dans uit te besteden aan een professionele externe partij, bijvoorbeeld de kb. Het technisch beheer van de webbased dienstverlening behoort eveneens tot de taken van deze sectie. Medewerkers van deze sectie kunnen ook worden ingezet in top’s. Het verschaffen van toegang tot de catalogi en de datacollecties in verschillende data-archieven van dans, van top’s of bij externe beheerders (geodata, cbs), en het leveren van datasets dient zoveel mogelijk geautomatiseerd te worden, en via één webdienst van dans afgehandeld te worden. De ontwikkeling van de webbased dienstverlening vergt een investering in het eerste jaar, evenals het uniform toegankelijk maken van de bestaande catalogi van het Steinmetz Archief, wsa en nhda. Ook de bijbehorende gebruiksadministratie kan geautomatiseerd verlopen. Speciale verzoeken die niet geautomatiseerd afgehandeld kunnen worden, worden door de afdeling archivering of door een themamanager behandeld. De helpdesk voor eerstelijns ondersteuning van gebruikers is er één voor dans als geheel.
Data Archiving & Networked Services
28
Nieuwe onderzoekers dienen in het algemeen wegwijs gemaakt te worden in het deponeren en gebruik van de beschikbare dataverzamelingen. Inhoudelijk is dit een taak van senior onderzoekers op het vakgebied en van themamanagers en vakspecialisten van dans, doch in organisatorisch opzicht is het doelmatig deze activiteit centraal te ondersteunen. dans kan de contacten tussen wetenschappers en afdelingen intensiveren door gerichte scholingsactiviteiten te organiseren. Het contentbeheer van het webportaal, de voorlichting over dans alsmede de redactie van algemene documentatie over dans (brochures, leveringsvoorwaarden, faq’s, gebruikershandleidingen) en de ondersteuning van gebruikers zijn taken die worden uitgevoerd door de data-experts. Tenslotte moet rekening worden gehouden met een basiscapaciteit voor de on-site beschikbaarstelling van data door en bij het cbs. De medewerkers van de afdeling leveren (in samenwerking met de themamanagers en informatiekundigen van de afdeling o&a ook een bijdrage aan te entameren specialistische scholingsactiviteiten op het terrein van digitale archivering, metadata-standaarden, hergebruik van wetenschappelijke data, enz. Het onderzoek naar en de ontwikkeling van strategieën, methoden en systemen voor dataarchivering vergt veel aandacht. Het terrein is sterk in ontwikkeling, met nieuwe media, nieuwe bestandsformaten, bestandsstructuren en metadata en nieuwe zoektechnieken. dans zal zich steeds aan deze veranderingen moeten aanpassen, en nieuwe technische omgevingen implementeren ten behoeve van de basisfuncties. Met de ambitie dat dans in 2010 tot de erkende voorhoede in internationaal verband moet behoren is capaciteit voor research and development noodzakelijk. Ten dele zal deze capaciteit inzetbaar zijn in top’s. Hoofd ab Senior experts research data (Junior) experts research data ict beheerder/data base administrator ict ontwikkelaar
1.0 3.0 2.0 1.0 1.0
Totaal ab
8.0 fte
Startformatie dans Samenvattend leidt het bovenstaande tot de volgende formatie bij de start van dans: Directie en staf Sectie ab Sectie oa
4.0 fte 8.0 fte 8.0 fte
Totaal
20.0 fte
Data Archiving & Networked Services
29
7. Werkzaamheden in 2005
Volgens de intentieverklaring is de formele oprichting van dans voorzien voor 1 april 2005. Om dat mogelijk te maken dienen de besturen van knaw en nwo in december 2004 hun fiat te geven aan het bedrijfsplan dans, waarvan dit ontwerp een belangrijk onderdeel is. De periode tussen december en april zal enerzijds worden gebruikt om een aantal formele stappen te zetten in het proces van de vorming van de nieuwe organisatie, anderzijds zullen enkele kwartiermakers de taak krijgen de inrichting van dans in huishoudelijke zin te realiseren. Het eerste betreft de bestuurlijke afwikkeling binnen nwo en knaw, het tweede betreft de feitelijke huisvesting en inrichting die nodig is om dans op 1 april ook daadwerkelijk van start te laten gaan. Voor beide trajecten zal in overleg met knaw en nwo een draaiboek worden opgesteld. Voor de feitelijke start van dans wordt een scenario gemaakt nadat de knaw en nwo hun fiat hebben gegeven. Het door de taskforce uitgewerkte plan is voor wat betreft de organisatie en begroting tegen het licht gehouden door een externe adviseur, Deloitte. De paragrafen 7.1 en 7.5 hieronder zijn ontleend aan dat advies. 7.1 Organisatie12 Inleiding In deze paragraaf wordt nader ingegaan op de benodigde formatieomvang van het dans-centrum. Formatieomvang Bij de bepaling van de benodigde formatieomvang is uitgegaan van de criteria zoals benoemd in paragraaf 2.2 van het volledige rapport. Daarnaast zijn nog de volgende normen gebruikt: Span of control
Leidinggevenden sturen 7 tot 8 fte aan.
Beperkte overhead
Het dans-centrum heeft bij voorkeur een ‘beperkte overhead’. Dit laat zich vertalen door de volgende verhouding die gangbaar is voor een beperkte stafdienst: de stafformatie bedraagt circa 20 procent van de formatie ten behoeve van directe medewerkers (exclusief leidinggevenden).
Evenwicht
Aangezien niet met zekerheid kan worden vastgesteld op welke wijze het werkveld van dans zich zal gaan ontwikkelen, is bij het bepalen van de benodigde formatieomvang ervan uitgegaan dat bij de start van dans Archief & Beschikbaarstelling en Ontwikkeling & Acquisitie een vergelijkbare formatieomvang hebben.
Drie Tops
Er wordt gedacht aan de opzet van drie top’s in het eerste operationele jaar van dans, afhankelijk van de keuzemogelijkheden en de te stellen eisen aan een top.
12
De paragrafen 7.1 en 7.5 zijn gebaseerd op een advies Deloitte: It takes three to tango. De organisatie en financiële onderbouwing van Data Archiving and Networked Services (dans). Deloitte. November 2004. Het volledige rapport is beschikbaar.
Data Archiving & Networked Services
30
dans-proof maken
Het Nederlands Historische Data Archief (nhda), sociaal wetenschappelijk Steinmetzarchief en het Wetenschappelijk Statistisch Agentschap (wsa) dienen dans-proof te worden gemaakt. Dit betekent dat deze archieven beoordeeld worden op basis van de dans-normen en eventueel worden aangepast op basis van deze normen.
Data-aanvragen en aanbod dataarchieven
Het aantal benodigde data-experts is afhankelijk van de hoeveelheid data-aanvragen (levering van data aan onderzoekers op aanvraag) per tijdseenheid en het aanbod van data-archieven. Uitgangspunt voor de aanvragen zijn het aantal data-aanvragen van nhda, Steinmetz en wsa, rekening houdend met vergaande automatisering in het verwerken van deze aanvragen. Het aanbod van data-archieven is afhankelijk van het aantal top’s en van de acceptatie van dans in het wetenschappelijke werkveld.
Data-typen
Data-typen worden op verschillende wijze ontsloten en gearchiveerd. Voor een specificatie van de data-typen waarvan in de berekening is uitgegaan, wordt verwezen naar bijlage 2 van ‘Ontwerp dans’.
Directie en staf Dans staat onder leiding van een Directeur,13 waarvoor één fte beschikbaar is. Deze directeur wordt ondersteund door een staforgaan bestaande uit drie fte: een beleidsmedewerker/jurist, management assistent en financieel/administratieve functie ingevuld door twee medewerkers. Archief & Beschikbaarstelling Het proces van Archief & Beschikbaarstelling bestaat uit twee deelprocessen, namelijk het deponeren van data en metadata (archiveren en ontsluiten) alsmede het leveren van data aan onderzoekers op aanvraag (data-aanvragen). De benodigde formatieomvang voor Archief & Beschikbaarstelling is grotendeels afhankelijk van het aanbod van data en metadata en de vraag naar data. Daarnaast wordt het bepaald door het aantal verschillende soorten data-typen dat dans beheert. Voor het aantal data-aanvragen is vooralsnog uitgegaan van het aantal handelingen van het nhda, Steinmetz en wsa waarbij de dataaanvragen zoveel mogelijk geautomatiseerd worden verwerkt. Mede op basis van de diversiteit van de data-typen, is de inschatting dat voor de dagelijkse aanvragen twee fte voor data-experts nodig is. Daarnaast zijn data-experts betrokken bij het ‘dans-proof’ maken van de archieven van Nhda, Steinmetz en wsa. Dit zijn tijdelijke activiteiten maar na afronding zal het verwerken van het aanbod van data-archieven uit het wetenschappelijk werkveld tot het takenpakket behoren. Dit zal in de startfase naar schatting de inzet van drie fte vergen. Aandachtspunt hierbij is, kandidaten te selecteren die kennis hebben van meerdere data-typen. De data-experts zullen in toenemende mate particeren in Top’s en op locatie onderzoekers instrueren en ondersteunen bij het archiveren van hun databestanden. Bij de start van dans betreft dit 1 fte (bijv. ten behoeve van het E-Depot Nederlandse Archeologie en de andere dare data-projecten), maar in de loop der tijd zal dit aantal toenemen. 13
Voor het imago en legitimiteit van dans is het belangrijk dat functionarissen die de post van directeur in de toekomst zullen bekleden, in wetenschappelijke kring als autoriteiten op het vakgebied worden beschouwd. Daarnaast zullen deze functionarissen over expertise moeten beschikken op het gebied van de bedrijfsvoering en de primaire processen van dans.
Data Archiving & Networked Services
31
Voor de formatie-opbouw is het wenselijk een onderscheid te maken naar ‘junior’ en ‘senior’ data-experts, welk onderscheid vooral gebaseerd is op vooropleiding, kennis en ervaring. Dans zal met drie senior en twee junior experts research data van start gaan. ‘Bij de invulling van deze dansfuncties wordt een evenwichtige verdeling nagestreefd in expertise ten aanzien van de verschillende voor dans relevante datatypen en vakgebieden. Hoewel iedere indeling in datatypen enigszins mank gaat, zijn de belangrijkste hoofdgroepen:14 – kwantitatieve gegevens: statistische paketten, databases, spreadsheets, ruimtelijke data – kwalitatieve gegevens: tekstdatabases, ‘full text’, spraakgegevens – multimediale gegevens: beeld, video, geluid, grafische data Voor Archief & Beschikbaarstelling is investeren in ict Research & Development belangrijk, teneinde de nieuwste technologieën op het gebied van data-archivering toe te kunnen passen. Hiervoor is twee fte nodig: één functie ligt op het vlak van ict-beheer en database administration, de andere op het gebied van ict ontwikkeling. Deze functionarissen zullen nauw samenwerken met de r&d-medewerkers (informatiekundigen) uit de sectie o&a. Deze afdeling staat onder leiding van een hoofd Archief & Beschikbaarstelling, zijnde één fte, die direct vanaf de start van dans in functie is. Dit hoofd zal als meewerkend voorman optreden en zelf de meeste kennis en ervaring hebben van de senior experts research data. In totaal komt het aantal fte’s van Archief & Beschikbaarstelling hiermee op acht. Om een voorspoedige start te kunnen realiseren, zal het merendeel van deze fte’s vanaf het begin van dans ingevuld moeten zijn. Ontwikkeling & Acquisitie De formatieomvang welke nodig is voor Ontwikkeling & Acquisitie is gebaseerd op het aantal tops in het eerste jaar en de drie archieven (nhda, Steinmetz en wsa) welke in overeenstemming moeten worden gebracht met de dans-normen. Gedacht wordt aan de opzet van drie tops in het eerste operationele jaar van dans, afhankelijk van de keuzemogelijkheden en de te stellen eisen aan een top. Aangezien de eerste tops cruciaal zijn voor het imago van dans gaan we uit van een fulltime aanstelling voor de themamanagers van deze drie tops. Nadat de eerste ervaringen zijn opgedaan, kan voor latere Tops worden overgegaan op de inzet van parttime themamanagers. Het kan onderzoekers van universiteiten of andere wetenschappelijke instituten betreffen, die voor een deel van hun tijd deze taak op zich nemen. Dubbelaanstellingen zullen de band tussen dans en de wetenschap het sterkst maken. Het ‘dans-proof’ maken van de drie reeds bestaande archieven zal ook betrokkenheid van themamanagers vereisen. Hiervoor wordt twee fte ingezet. Op deze wijze verzamelen zij direct kennis en ervaring als het gaat om bestaande archieven en doen andere themamanagers kennis en ervaring op in de top’s. In totaal bedraagt het aantal fte’s voor themamanagers vijf. Zoals reeds vermeld, wordt de overweging meegegeven om themamanagers een tijdelijke en parttime aanstelling te geven. Dit verstevigt de band met het werkveld en verhoogt de flexibiliteit. Om de expertise op peil te houden is research & development van groot belang. Dit wordt verder versterkt doordat dans als onafhankelijk instituut niet langer ingebed is in de huidige infrastructuur op r&d-gebied. Voor Ontwikkeling & Acquisitie vereist dit de inzet van twee fte. Het verdient aanbeveling om bij de start van dans hiervan in ieder geval één fte te hebben bezet. De afdeling Ontwikkeling & Acquisitie staat onder leiding van een hoofd, één fte, welke direct vanaf de start van dans in functie is. Evenals het hoofd van Archief & Beschikbaarstelling zal ook deze functionaris de rol van meewerkend voorman vervullen. De totale formatie van Ontwikkeling & Acquisitie komt hiermee op acht fte.
14
Zie bijlage 2 voor een matrix van vakgebieden en veelvoorkomende datatypen.
Data Archiving & Networked Services
32
Totale benodigde formatieomvang In totaal heeft dans een formatieomvang van 20 fte, waarvan het merendeel bij de start zal zijn bezet. De opbouw is grafisch weergegeven in figuur 3.
Figuur 3. benodigde formatieomvang DANS in eerste operationele jaar.
Aanvullende overwegingen bij de benodigde formatieomvang Bij de bepaling van de benodigde formatieomvang is ervan uitgegaan dat dans als zelfstandige organisatie en werkgever voor de kernactiviteiten zelf medewerkers selecteert en in dienst neemt. Om effectief en efficiënt te blijven, zou dans in gesprek kunnen gaan met nwo en knaw inzake tijdelijke inzet van medewerkers van beide organisaties. dans zou daarmee tijdelijke pieken in de werkzaamheden op een efficiënte wijze kunnen opvangen, zonder extra kosten van werving en selectie en (te) langdurige contracten. ict-ondersteuning is belangrijk voor de uitvoering van de primaire processen van dans. Gegeven de snelle veranderingen in de ict en de relatief beperkte omvang van dans en de dalende kosten van ict-service providers is een aparte eenheid die zich met ict-beheer bezig houdt niet aan te bevelen. ict-ondersteuning kan voor dans op de langere termijn kwalitatief beter en goedkoper worden verkregen bij externen. 7.2 Huisvesting en voorzieningen In deze fase kan slechts op hoofdlijnen iets worden gezegd over de huisvesting en materiële voorzieningen voor dans. Voor de huisvesting van de dans-kern is naar schatting 400 m2 functioneel netto nodig. Wordt daarboven rekening gehouden met de huisvesting van een aantal tijdelijke projectmedewerkers dan zou daar nog 50 à 60 m2 bijkomen. In deze schatting is een aantal ruimtes niet begrepen: – ruimte voor scholingsactiviteiten en bijeenkomsten – lunchfaciliteiten – serverruimte
Data Archiving & Networked Services
33
Deze faciliteiten kunnen goed gedeeld worden met andere organisaties / eenheden op dezelfde locatie. Maar indien die mogelijkheden er niet zijn, zijn extra m2 nodig. Daarnaast moet worden onderkend dat dans beoogt te groeien. Daarom is het nodig een locatie te zoeken die daarvoor de benodigde rek biedt. dans zal voorts moeten beschikken over een snel intern netwerk, en via surfnet op een snelle aansluiting op Internet. De eigen infrastructuur zal bestaan uit een pc-netwerk en enkele servers. De productiefaciliteiten voor de gebruikers worden bij voorkeur ondergebracht bij een professioneel centrum. Voor het beheer en de beveiliging van de huisvesting wordt uitgegaan van dienstverlening vanuit een facilitaire organisatie. Naast de structurele huisvestings- en ict-kosten moet bij de start van dans rekening gehouden worden met éénmalige ontwikkelingskosten en inrichtingskosten, zoals: – de digitale toegankelijkheid en uitlevering van bestanden – de inrichtingskosten van (eventuele) nieuwe huisvesting – de ontwikkeling van een huisstijl en voorlichtingsmateriaal Bestuurlijk is van belang dat voor het eerste jaar voldoende éénmalig budget beschikbaar is om de materiële transitiekosten van het Steinmetz Archief, wsa en nhda naar dans te kunnen opvangen, en om een aantal inrichtingsprojecten te kunnen financieren. In het bedrijfsplan zal een indicatieve begroting voor deze inrichtingskosten worden opgesteld. 7.3 Werving en selectie Procedures voor werving en selectie volgen in principe de wegen die daarvoor gelden bij de twee initiatiefnemers voor dans (knaw en nwo). Omdat dans op een aantal posities medewerkers wil hebben die ook een baan hebben bij een universiteit of onderzoeksinstelling lijkt het voor de hand te liggen om de procedure van de knaw te volgen omdat daar de cao-nu geldt. 7.4 Formele kaders: licentiebeleid, privacy, ipr Op deze punten zal de directie Dans een beleid moeten formuleren. Aangenomen wordt dat hierbij uitgangspunt is bestaand beleid bij knaw en nwo. Hier zij vast opgemerkt dat ter bevordering van de opname van data in het archief het uiterst belangrijk is dat in de regelgeving en financieringsvoorwaarden van nwo, knaw, universiteiten en ministeries wordt opgenomen dat onderzoekers verplicht zijn hun data volgens bepaalde afspraken aan dans aan te leveren. Het deponeren van wetenschappelijke databestanden bij een nationale organisatie voor data-archivering is voor onderzoekers weliswaar niet wettelijk verplicht, maar de bewaring en toegankelijkstelling van digitale data is wel omgeven met diverse juridische kaders. In bijlage 4 geven wij de belangrijkste daarvan. 7.5 Startformatie en begroting dans Exploitatiebegroting In dit hoofdstuk wordt, op basis van de in het voorgaande uitgewerkte organisatiestructuur en formatie, een concept voor de exploitatiebegroting van Dans weergegeven. Bij het opstellen van deze begroting is uitgegaan van een aantal normen, die in het volledige rapportworden toegelicht. Vervolgens wordt in paragraaf 4.2 de concept exploitatiebegroting gepresenteerd, waarbij tevens wordt ingegaan op enkele onderwerpen die bijzondere aandacht verdienen.
Data Archiving & Networked Services
34
Uitgangspunten De exploitatiebegroting bestaat uit twee componenten, namelijk de uitvoeringskosten en de infrastructuur en licenties Bij het opstellen van de exploitatiebegroting is uitgegaan van een aantal uitgangspunten. Deze zijn in Tabel 1 weergegeven. Aansluitend aan de tabel worden ze toegelicht.
Componenten
Uitgangspunten
waarde
Uitvoeringskosten a)
Salarissen
– Fte’s: paragraaf 0‘benodigde formatie omvang’ – CAO Nederlandse Universiteiten met CAO onderzoeksinstellingen als basis – CAO schalen volgens aanname Deloitte
20 fte
b)
Sociale lasten
CAO Nederlandse Universiteiten
29,25%
c)
Overige personeelskosten
Normering Deloitte
6%
d)
Apparaatskosten
– Opslag per productief uur volgens norm Deloitte – 1.400 productieve uren volgens norm NIWI
€ 4,00
e)
Huur
Aantal m² per fte volgens opgave NWO Prijs per m² volgens opgave NWO
25 m² € 192,-
f)
Servicekosten (huisvesting)
Prijs per m² volgens opgave NWO
€ 128,-
g)
Kantoorautomatisering
Opslag per fte volgens basisbedrag publieke sector
€ 4.500,-
h)
Internationaliseringsbudget
Opslag per fte op basis van doelstelling DANS
€ 2.000,-
i)
Communicatie
Opslag op basis van totale exploitatiebegroting
1,5 %
j)
Kwaliteitscertificaat
Tarief per dag voor kwaliteitsaudit extern bureau
€ 1.400,-
k)
Overige centrale diensten
Opslag per fte volgens aanname Deloitte
€ 4.000,-
Infrastructuur en licenties l)
IT Architectuur en transitiekosten
PM-post voor de conversie van de archieven van NHDA, Steinmetz en WSA
m) Technisch- & applicatiebeheer
Externe ondersteuning door 1 fte, tegen een integrale fte prijs
n)
Licentie CBS
Licentiekosten zoals nu door WSA worden betaald
o)
Datacontracten WSA
WSA betaalt momenteel nog een bedrag voor datacontracten.
Tabel 1. uitgangspunten voor concept exploitatiebegroting.
Data Archiving & Networked Services
35
Uitvoeringskosten ad a Salarissen De berekening van de component salariskosten is weergegeven in Tabel 2. formatie
schaal
maandbedrag
jaarbedrag
subtotaal
Directeur
1
15
5.789
75.437
75.437
Beleidsmedewerker
1
12
4.423
57.633
57.633
Management Assistent
1
8
2.683
34.968
34.968
Financieel administratief medewerker
1
11
3.890
50.688
50.688
subtotaal
4
Directie en staf
207.559
Archief en Beschikbaarstelling Hoofd
1
13
4.798
62.519
62.519
Data-experts
5
11
3.890
50.688
253.438
R&D
2
11
3.890
50.688
101.375
subtotaal
8
417.331
Ontwikkeling & acquisitie Hoofd
1
13
4.798
62.519
62.519
Themamanagers
5
12
4.423
57.633
288.163
R&D
2
11
3.890
50.688
101.375
subtotaal
8
452.057
TOTAAL
20
1.088.150
Tabel 2. opbouw salariskosten.
Hierbij zijn de volgende aannames gemaakt: – De benodigde formatie is gebaseerd op het organogram hierboven en een volledige jaarbezetting. – Aangezien de daadwerkelijke functie-inhoud ten tijde van het schrijven van dit rapport nog niet bekend is, is de inschaling gebaseerd op aannames van Deloitte. – Het maandbedrag is berekend op basis van de cao Onderzoeksinstellingen met een correctie (-1,85 procent) naar de cao Nederlandse Universiteiten, salaristabel per 1 maart 2004. – Het jaarbedrag inclusief vakantiegeld is berekend door het maandbedrag te vermenigvuldigen met 12,96 en vervolgens te verhogen met een eindejaarsuitkering van 0,55 procent van het jaarsalaris.
Data Archiving & Networked Services
36
Ad b Sociale lasten De opslag voor het werkgeversdeel in de sociale lasten is inclusief premies voor de Ziekenfondswet, Arbeidsongeschiktheid, en pensioenen. Ad c Overige personeelskosten De opslag voor overige personeelskosten bevat de volgende kostensoorten: – Reiskosten woon-werk – Studiekosten (cursussen) – Kosten kinderopvang – Wervingskosten – Opleidingskosten – Overige personeelskosten Op basis van onze ervaringen met benchmarkstudies in het onderwijs, schatten wij deze kostenpost op zes procent van totale salariskosten. Ad d Apparaatskosten Onder de apparaatskosten vallen de kosten die benodigd zijn om de organisatie ‘draaiend’ te houden. Het gaat hier om de volgende kosten: – Vergader- en representatiekosten (bestuur) – Accountantskosten – Advieskosten – Kantoorbehoeften (inventaris, ict e.d.) – Verzekeringen – Drukwerk- en reproductiekosten – Documentatie en abonnementen – Kosten ondernemingsraad – pr-kosten – Overige organisatiekosten N.B. Hieronder vallen in principe geen personeelslasten, deze zijn ofwel direct (personeelskosten) ofwel indirect (overige centrale diensten). Benchmarkstudies wijzen uit dat de apparaatskosten gemiddeld € 4,- per productief uur bedragen. Ad e Huur De norm voor het aantal m² per fte is volgens opgave van nwo inclusief algemene ruimten als de hal, gang, toilet, etc. Ad f Servicekosten Naast huur wordt tevens een prijs per m² gehanteerd voor servicekosten. Dit betreft kosten voor schoonmaak, gebouwbeheer, telefonie en is conform opgave van nwo. Ad g Kantoorautomatisering Onder kantoorautomatiseringskosten worden de aan de werkplek verbonden kosten verstaan. In de praktijk worden hiervoor sterk wisselende bedragen gebruikt. In de Handleiding overheidstarieven 2005 wordt uitgegaan van een bedrag van € 2.401 per fte. Uit praktijkstudies blijkt echter dat deze norm te laag is. De opslag voor kantoorautomatisering is daarom verhoogd tot het niveau zoals gerapporteerd in de door sgbo uitgevoerde ict trendrapportage.
Data Archiving & Networked Services
37
Ad h Internationaliseringsbudget Teneinde een internationaal netwerk te kunnen opbouwen, alsmede continu op de hoogte te blijven van de laatste ontwikkelingen zal er regelmatig deelgenomen worden aan congressen en seminars. Hiervoor is een bedrag per medewerker opgenomen. Ad i Communicatie Voor het ontwikkelen van een communicatiestrategie en -plan en de out-of-pocketkosten voor de uitvoering van dit plan is een opslag gehanteerd van circa 1,5 procent van de totale begroting. Ad j Kwaliteitscertificaat Voor de organisatie van dans wordt naar verwachting een kwaliteitssysteem ontwikkeld, geïmplementeerd en getoetst. Voor wat betreft de ontwikkeling en implementatie van het kwaliteitssysteem wordt ervan uitgegaan dat dit door een medewerker van dans zal worden uitgevoerd. Voor de kwaliteitscertificering van dans zal echter een toetsing door een extern bureau plaats vinden. Deze toetsing zal ongeveer 2,5 dag in beslag nemen, inclusief voorbereiding en eindbeoordeling, à € 1.400,- per dag. Ad k Opslag overige centrale diensten Momenteel wordt er een bijdrage per fte betaald voor centrale diensten als p&o, receptie, en financieel economische zaken. Deze bijdrage bedraagt circa € 5.000. Omdat deze centrale diensten slechts zeer beperkt in de voorgestelde formatie van dans zijn opgenomen, is in de exploitatiebegroting de opslag voor overige centrale dienstverlening gehandhaafd. De hoogte van de opslag is verlaagd omdat een deel van deze centrale diensten onder andere kostensoorten is opgenomen (bijvoorbeeld receptie onder huisvestingskosten). Infrastructuur en licenties Ad l IT Architectuur en transitiekosten De archieven van nhda, Steinmetz en wsa zullen moeten worden geconverteerd en ontsloten conform de dans-normen. De kosten hiervan zijn echter afhankelijk van een aantal zaken die nu nog niet zijn vastgesteld, zoals onder meer – de dans-normen; – kwaliteitseisen; – mogelijkheden om gebruik te maken van software van zusterorganisaties. Daarom is hiervoor een pm-post opgenomen. Naar verwachting zal het benodigde budget tussen de € 50.000 en € 300.000 liggen. Ad m Technisch en applicatiebeheer Dit zijn de kosten van 1fte van een externe persoon, die het technisch en applicatiebeheer uitvoert. Ad n Licentiekosten CBS Er is nu sprake van jaarlijkse licentiekosten, welke door wsa aan het cbs worden betaald. Ervan uitgaande dat dit wordt overgenomen door dans, zijn deze kosten in de exploitatiebegroting opgenomen. Ad o Datacontracten WSA wsa betaalt momenteel nog een vergoeding voor bepaalde datacontracten, maar er zijn ook opbrengsten. Vooralsnog wordt ervan uitgegaan dat dans deze verplichtingen en opbrengsten overneemt. In de exploitatiebegroting wordt deze post tezamen genomen met de licentiekosten cbs.
Data Archiving & Networked Services
38
Concept exploitatiebegroting In Tabel 3 is een concept voor de exploitatiebegroting opgenomen. TOTAAL Uitvoeringskosten salarissen sociale lasten overige personeelskosten apparaatskosten huur servicekosten kantoorautomatisering internationaliseringsbudget communicatie kwaliteitscertificaat overige centrale diensten subtotaal
1.088.114 315.007 64.617 112.000 96.000 64.000 90.000 40.000 42.500 3.500 80.000 1.995.738
Infrastructuur en licenties IT Architectuur en transitiekosten Technisch & applicatiebeheer Datacontracten/licenties
99.229 450.000
subtotaal
549.229
TOTAAL
2.544.967 + PM
Directie & staf
Archief & Beschikbaarstelling
Ontwikkeling & Acquisitie
218.725 60.711 12.454 22.400 19.200 12.800 18.000
417.331 122.069 25.040 44.800 38.400 25.600 36.000
452.057 132.227 27.123 44.800 38.400 25.600 36.000
16.000 380.290
32.000 741.241
32.000 788.207
380.290
741.241
788.207
PM
Tabel 3. exploitatiebegroting.
Ten aanzien van de exploitatiebegroting verdienen de volgende punten bijzondere aandacht: – Opbrengsten: ten aanzien van de opbrengsten is nog te weinig zicht op de typen opbrengsten, de grondslagen van de opbrengsten, de zekerheid van de opbrengsten, en de (extern gefinancierde) projecturen. Derhalve is er in de exploitatiebegroting geen rekening gehouden met substantiële opbrengsten. – Indicatief karakter: bij het opstellen van de begroting zijn, waar nodig, normatieve uitgangspunten geformuleerd. De begroting heeft hierdoor een indicatief karakter.
Data Archiving & Networked Services
39
Bijlage 1 – Thematische Ontwikkel Programma’s
Wat zijn top’s? top’s zijn programma’s waarin samengewerkt wordt met onderzoek- en ontwikkelpartners, dus nadrukkelijk geen aangelegenheid van de dans-kern alleen. Enerzijds brengt dans expertise, menskracht en faciliteiten in, anderzijds kan dans fungeren als regiepartner bij het verwerven van financiering voor deze programma’s bij bestuurlijke partijen. dans richt zich samen met ontwikkelpartners per programma op de fondsenverwerving, niet alleen bij nwo en knaw, maar evenzeer bij organisaties als surf, de Taalunie, ocw en andere ministeries. Daarnaast is er meer en meer sprake van samenwerking op Europees en ander internationaal niveau, bijvoorbeeld in het kader van kp7. Thematische ontwikkelprogramma’s (Topical Programs) zijn in principe tijdelijk. De omvang en tijdsduur zijn afhankelijk van het doel van het programma: een haalbaarheidsstudie of (pilot)project ter verkenning van de mogelijkheden voor data-archivering op een nieuw gebied zal veel korter en kleiner zijn dan een programma waarin de data-ontsluiting op een vakgebied feitelijk ter hand wordt genomen. De looptijd van een top is maximaal 5 jaar. Bij afronding van een top moet de continuïteit van de toegang tot de data altijd zijn gewaarborgd. Hoewel topical programs niet dataverzameling, digitalisering of analyse zelf tot doel hebben, ligt aansluiting bij programma’s waarin data worden verzameld, gedigitaliseerd of geanalyseerd voor de hand. Topical programs worden steeds in samenwerking tussen dans en onderzoekers en/of andere experts opgezet. Deze samenwerking kan ook de vorm aannemen van personele uitwisseling en zal leiden tot een welomschreven eindproduct dat (mede) via het dans Archief ter beschikking wordt gesteld. dans werkt samen met onderzoeksgroepen om tot programmavoorstellen voor top’s te komen en daarvoor financiering te verwerven. Bij de uitvoering kunnen medewerkers uit de gemeenschappelijke dans-kern (tijdelijk en/of part-time) worden ingezet. Het programma zal in veel gevallen zijn thuisbasis vinden bij een onderzoeksgroep in een universiteit of wetenschappelijk instituut. Na afronding van het programma of belangrijke onderdelen worden de dataverzamelingen (mede) in het archief van dans opgenomen en toegankelijk gemaakt voor hergebruik. De bemensing van programma’s zal in het algemeen een mix zijn van senior-medewerkers die vanuit de deelnemende instellingen en dans hiervoor (partieel) vrijgemaakt worden, en projectmedewerkers in tijdelijke dienst. De vrijgemaakte medewerkers blijven in dienst van hun thuisorganisaties. De tijdelijke medewerkers worden aangesteld bij de penvoerende instelling van het programma. De top’s samengevat: – Doel: versterking en innovatie van de data-infrastructuur op een wetenschappelijk (deel-) gebied of thema. – Looptijd: minimaal 1 jaar, maximaal 5 jaar. – Continuïteit: bij afronding worden data in goede en geordende staat gedeponeerd in het dans Archief. – Aansluiting bij programma’s waarin data wordt verzameld, gedigitaliseerd en geanalyseerd. – Samenwerking van onderzoekers met gemeenschappelijke kern van dans, mede tot uiting komend in co-financiering.
Data Archiving & Networked Services
40
Lijst van mogelijke top’s In de afgelopen decennia zijn door onderzoekers in de maatschappij- en gedragswetenschappen en de geesteswetenschappen duizenden databestanden aangelegd, waarvan een deel ook door bestaande instituten en onderzoeksgroepen is gearchiveerd en toegankelijk gemaakt. Uiteraard zijn ook al voordat er sprake was van dans diverse grote data-programma’s uitgevoerd. Het betreft vaak door nwo, de knaw en/of surf (mede-) gefinancierde grote projecten op de terreinen van dataverzameling en digitalisering, dataverrijking en harmonisatie, data-ontsluiting en archivering. Sommige van deze grote dataprojecten zijn reeds korter of langer geleden afgerond, andere zijn lopend en weer andere verkeren in de startfase. Vervolgens zijn in de laatste maanden in verband met de opzet van dans door enkele (knaw-) instituten notities opgesteld die voorstellen doen voor de opzet van nieuwe decentrale archieven of thematische expertisecentra. Tenslotte is van veel individuele datasets en grote bestandscollecties het beheer in het geheel niet geregeld of is het materiaal ontoegankelijk. Er is een aantal gebieden waarop nog geen initiatieven bestaan en waar dans zelf initiatief zou moeten nemen om de data-archivering en –beschikbaarheid te verbeteren. Ter wille van de overzichtelijkheid maken we het volgende onderscheid: 1. Afgesloten/bestaande dataprogramma’s. 2. Lopende dataprogramma’s. 3. Initiatieven voorgesteld en projecten in startfase. 4. Mogelijke verkenningen op initiatief van dans. Ad 1. Afgesloten/bestaande dataprogramma’s 1.1. Harmonisatie en verrijking NKO’s Het Nationaal Kiezers Onderzoek heeft in Nederland een rijke bron aan gegevens opgeleverd die veel gebruikt worden door wetenschappelijke onderzoekers in binnen- en buitenland. Het is gekoppeld aan voortreffelijke nationale onderzoeksgroepen en is ook uitstekend internationaal ingebed. Hoewel de data in principe gearchiveerd zijn en zo toegankelijk zijn gemaakt, is dit onvoldoende volgens hedendaagse maatstaven. Een meta-database zou de precieze (methodologische) omstandigheden van elk onderzoek moeten bevatten, zou het gemakkelijker moeten maken vergelijkbare variabelen over de tijd en over de landen te vinden, zou meer regionale gegevens moeten bevatten en zou gebaat zijn bij een cohortsgewijze invulling van waarden en opvattingen, ontleend aan ander onderzoek. 1.2. Culturele veranderingen Er bestaat in Nederland een groot aantal brede onderzoekingen naar historische veranderingen in waarden en normen. Ook dit onderzoek (Culturele veranderingen van het scp, Sokon en Familieenquêtes Radboud Universiteit Nijmegen, European Value Study van de Universiteit van Tilburg) is verbonden met uitstekende universitaire onderzoeksgroepen en ook internationaal zeer goed ingekaderd. Al deze gegevens zouden bij elkaar gebracht moeten worden en via de ontwikkeling van een metadatabase ontsloten moeten worden voor wetenschappelijke onderzoekers. Een grondige methodologische evaluatie van de diverse steekproeven en wijze van dataverzameling is daarbij onmisbaar. Verrijking van de datasets met omgevingsfactoren en het op cohortsniveau invoeren van geaggregeerde kenmerken zou de bestudering van macro-microprocessen en van sociale veranderingen op een hoger plan kunnen brengen. 1.3. Arbeid en opleiding Op het gebied van Arbeid en Opleiding bezit Nederland een aantal uitstekende databases,
Data Archiving & Networked Services
41
verbonden aan gerenommeerde instituten en onderzoeksgroepen (naast het cbs), die ook internationaal ingebed zijn. Het overzichtelijk bijeenbrengen van deze data, de koppeling aan elkaar, en het toegankelijk maken van individuele gegevens zou bijvoorbeeld het onderzoek naar arbeidsmarktmobiliteit en naar de aansluiting tussen onderwijs en arbeid enorm vooruit kunnen helpen. 1.3. Schoolloopbanen en sociale herkomst Nederland beschikt over een lange reeks van databestanden (vanaf 1965, met voorlopers uit de jaren 50) waarin scholieren gevolgd worden gedurende vanaf de aanvang van het voorgezet onderwijs tot hun intrede in de arbeidsmarkt. Tezamen vormen zij een rijke bron van gegevens over trends in sociale ongelijkheid en daaraan ten grondslag liggende mechanismen. Deze data zijn momenteel wel toegankelijk via Steinmetz-archief en Wetenschappelijk Statistisch Agentschap, maar hier ontbreekt harmonisering en vertaling om de gegevens op een internationaal plan te brengen. 1.4. Archivering Digitaal Academisch erfgoed (ada, niwi en Meertensinstituut, gesubsidieerd door surf-iwi). In dit project dat in 2003 is afgesloten zijn 900 voor bewaring in aanmerking komende databestanden van het Meertens Instituut geïnventariseerd, gedocumenteerd, geconverteerd en opgeslagen. De toegang tot de data, die onder de verantwoordelijkheid van het Meertens Instituut valt, is nog niet goed geregeld. 1.5. Historische Databank Nederlandse Gemeenten In het project ‘Historische Databank Nederlandse Gemeenten’ zijn databanken van de universiteiten van Wageningen, Amsterdam en Nijmegen en het nidi met demografische, sociaal-culturele en economische basisgegevens over de Nederlandse gemeenten in de afgelopen twee eeuwen geïntegreerd. De data moeten nog worden toegankelijk gemaakt en gearchiveerd. 1.6. Project Integrale Geschiedenis In het project ‘Integrale Geschiedenis, noord Groningen en oostelijk Noord-Brabant 1770-1920’ is een groot demografisch databestand aangelegd. Dit bevat 44 bewerkingen van bevolkingsregisters op peiljaren in 10 voorbeeldgemeenten en ca. 6000 levensgeschiedenissen gegroepeerd in cohorten. Verder zijn per onderzoeksgemeente de geboorten, sterften, huwelijken en bevolkingstotalen per jaar verzameld. Dit materiaal wordt verwerkt tot regionale monografieën, waarbij wordt getracht de gegevens in de micro-sfeer zoveel mogelijk te doen aansluiten bij de macro-economische en sociale ontwikkelingen in de regio. De gegevens berusten bij de projectleiders aan de universiteiten van Groningen en Utrecht en zouden integraal toegankelijk moeten worden gemaakt. 1.7. Corpus Gesproken Nederlands In de periode 1998-2004 is in het kader van het project ‘Corpus Gesproken Nederlandse’ (cgn) gewerkt aan de aanleg van een databank voor het hedendaags Nederlands zoals dat door volwassen sprekers in Nederland en Vlaanderen wordt gesproken. De resultaten van dit project zijn in maart 2004 beschikbaar gekomen via de Centrale voor Taal- en Spraaktechnologie. Deze tst-centrale beheert, onderhoudt en ontsluit een verzameling van digitale materialen voor het Nederlands. Onderzoekers kunnen bij de tst-centrale terecht voor geluidsopnamen, gedigitaliseerde teksten, corpora voorzien van allerlei taalkundige annotaties, computationele mono- en multilinguale lexica en thesauri, woordsoorttaggers, lemmatiseerders, parsers etc. De tst-centrale is gehuisvest in het Instituut voor Nederlandse Lexicologie (inl) te Leiden en zijn dependance in Antwerpen.
Data Archiving & Networked Services
42
Ad 2. Lopende dataprogramma’s 2.1. Historical Prices and Wages In dit project wordt een internationaal data-archief van lonen en prijzen gevormd, dat deel uitmaakt van een netwerk van economisch-historische data-collecties in binnen- en buitenland. Het dataarchief bevat al een groot aantal bestanden (doorgaans Excel-spreadsheets) en elementaire documentatie en wordt beheerd door het Internationaal Instituut voor Sociale Geschiedenis (iisg). 2.2. Life Courses in Context In dit mede door nwo-Groot gefinancierde project wordt een virtueel collaboratorium opgebouwd voor de geschiedenis van de Nederlandse bevolking in de 19e en 20e eeuw. Het project bestaat uit twee componenten: digitalisering van een steekproef van levensgeschiedenissen die worden gereconstrueerd uit bevolkingsregisters, uitgevoerd onder auspiciën van het iisg; en digitalisering en beschikbaarstelling van de Nederlandse Volkstellingen 1795-1971, uitgevoerd door het niwi. 2.3. Netherlands Kinship Panel Study In dit longitudinale, mede door nwo-Groot gesubsidieerde, onderzoek naar familiebanden in Nederland wordt door middel van mondelinge vraaggesprekken en aanvullende schriftelijke enquêtes informatie verzameld over zo’n 10.000 personen. Het onderzoek is een samenwerkingsverband van het Nederlands Interdisciplinair Demografisch Instituut (nidi), de Universiteit Utrecht (uu), de Universiteit van Amsterdam (uva) en de Universiteit van Tilburg (uvt). De data worden toegankelijk gemaakt via een speciale website van het nkps data-centre, beheerd door het nidi. Ad. 3. Initiatieven voorgesteld en projecten in startfase 3.1. E-depot Archeologie Per 1 september 2004 is in het kader van dare het project ‘e-Depot Nederlandse Archeologie’ van start gegaan, een project van de universitaire faculteiten Archeologie, de Rijksdienst voor Oudheidkundig Bodemonderzoek en het niwi. Dit project beoogt een landelijke data-voorziening voor de Nederlandse archeologie op te zetten, waarin alle universiteiten, de rob en mogelijk een deel van de commerciële archeologie participeren. Er wordt een inventarisatie opgesteld van alle wetenschappelijk-archeologische databestanden bij de universiteiten en rob; een selectie van de databestanden wordt volledig gearchiveerd en ontsloten. Ook wordt een blauwdruk geschreven voor de vorm waarin een archeologische dataservice kan worden gecontinueerd. 3.2. Data Onderwijskundig Nederland Online Research (DONOR) Dit door surf gesubsidieerde dare-project is bedoeld om de toegankelijkheid van databestanden op het terrein van onderwijsonderzoek te bevorderen. Het project, dat in september 2004 van start is gegaan, beoogt naast het inventariseren, documenteren en publiceren van bestanden met gegevens over onderwijs op het Internet vooral de bouw van een tool voor geautomatiseerde databeschrijving en –opslag, data-archivering. Het project sluit aan op een ontwikkeltraject dat in januari 2004 is ingezet door het Instituut voor Toegepaste Sociologie (its) van de Radboud Universiteit Nijmegen, gericht op de vormgeving van een Expertisecentrum Databestanden Onderwijs Nijmegen.
Data Archiving & Networked Services
43
3.3. Taal- en tekstarchief Op het terrein van de Nederlandse taal- en letterkunde zijn de laatste decennia aanzienlijke investeringen gedaan in de aanleg en ontsluiting van tekstcorpora, lexicologische databanken, digitale literaire werken, spraakbestanden en andere databases. Ook door historici zijn tekstuele bronnen gedigitaliseerd en elektronisch gepubliceerd. Naast digitale representaties van geschreven en gesproken taal en literatuur zelf (in de vorm van tekst- en audiobestanden) zijn er ook tal van bestanden met ‘meta-informatie’, uiteenlopend van vragenlijsten en interviews tot bibliografische gegevens. In tegenstelling tot vele andere landen kent Nederland tot nu toe geen taal- en/of tekstarchief, hoewel onlangs een voorstel is gedaan om een tekstarchief voor het Nederlands geesteswetenschappelijk onderzoek op te richten.15 Het lijkt zinvol hierbij onderscheid te maken naar een taalkundige en een letterkundige component. Het is zinvol om een topical program te starten, waarin gedetailleerde bestandsinventarisaties worden gemaakt van de belangrijkste corpora op taal- en letterkundig terrein en een begin wordt gemaakt met de archivering. Tevens dient een voorstel te worden ontwikkeld voor een organisatorische vorm voor de continuïteit van de digitale tekstarchivering in Nederland. Ad 4. Mogelijke verkenningen op initiatief van dans 4.1. Historische gegevens Centraal Bureau voor de Statistiek Binnen het landschap van dataproducenten neemt het Centraal Bureau van de Statistiek een uitzonderlijke plaats in: de gegevens van het cbs zijn grootschaliger, breder en meer gezaghebbend dan andere databronnen. Tot midden jaren ’70 deponeerde het cbs gegevens met sociaalwetenschappelijk relevantie in het Steinmetzarchief. Na een onderbreking van ca. 10 jaar kwamen belangrijke cbs-bestanden weer ter beschikking via het Wetenschappelijk Statistisch Agentschap. Mede door de onderbreking tussen deze twee episodes in de jaren zeventig bestaat er grote zorg over behoud en toegankelijkheid van met name oudere cbs-gegevens. Het cbs zelf kan slechts in beperkte mate menskracht opbrengen om deze gegevens met grote historische relevantie (bv. die van de Arbeidskrachtentellingen) toegankelijk te maken. dans zou het geschikte kader zijn de vereiste inhaalslag te maken, zulks volgend op eerder door Nwo gefinancierde projecten om de gegevens van de Volkstellingen vanaf 1795 digitaal toegankelijk te maken, die door het niwi/nhda worden uitgevoerd. 4.2. Data Sociaal en Cultureel Planbureau Het Sociaal en Cultureel Planbureau is naast het Centraal Bureau voor de Statistiek mogelijk de belangrijkste leverancier van micro-data aan sociaal-wetenschappelijk Nederland. Met name door de regelmatige herhaling van grootschalige scp onderzoeken als het Tijdsbestedingsonderzoek (tbo, sinds 1975), het Aanvullend Voorzieningengebruikonderzoek, sinds 1979) en het Leefsituatieonderzoek (lso, sinds 1974 – later opgevolgd door pols van het cbs) herbergen een schat aan gegevens over sociale trends in ons land gedurende de afgelopen dertig jaar. Deze data zouden op een hoger plan gebracht moeten worden door onderlinge afstemming en harmonisering, vertaling en verrijking met metadata.
Het chi heeft een ontwerp neergelegd voor een tekstarchief binnen dans dat zich in het bijzonder zal richten op die geesteswetenschappelijk onderzoekers voor wie teksten het voornaamste bronmateriaal voor hun onderzoek zijn. De voorgestelde naam voor het tekstarchief luidt tango (Tekst Archief voor Nederlands Geesteswetenschappelijk Onderzoek). 15
Data Archiving & Networked Services
44
4.3. Pilot kwalitatieve gegevens Vergeleken met het meer kwantitatief gerichte sociaal-wetenschappelijk onderzoek staat de archivering van de resultaten van het kwalitatief onderzoek zich in de kinderschoenen. Niet alleen worden gegevens van kwalitatief onderzoek maar zelden hergebruikt, ook de facto standaarden voor opslag en archivering ontbreken. Relevante kwalitatieve data komen in velerlei vorm, bijvoorbeeld als geschreven antwoorden op open vragen, als video- of geluidsbeelden van interviews en demonstraties, als teksten van kranten en nieuwsuitzendingen, enz. De bewerkte databronnen zijn veelal ‘privé’-bezit van individuele onderzoekers. Ze zijn doorgaans nauwelijks toegankelijk voor andere onderzoekers en het risico van dataverlies is groot. Hier ligt een duidelijke ontwikkeltaak voor Dans die juist vanwege het bijeenbrengen van de geestes- en sociale wetenschappen voortreffelijk uitgevoerd zou kunnen worden in samenwerking met een goede wetenschappelijke onderzoeksgroep. 4.4. Kunstgeschiedenis en visuele cultuur Voor onderzoeksterreinen waarin beeldinformatie centraal staat, zoals in de kunstgeschiedenis of het interdisciplinaire onderzoek naar ‘visuele cultuur’, speelt het digitaal beschikbaar komen van beelddatabanken een belangrijke rol. Niet alleen door erfgoedinstellingen, maar ook door onderzoeksinstituten zijn de laatste jaren aanzienlijke beeldcollecties gedigitaliseerd. Deze zijn echter versnipperd toegankelijk in uiteenlopende systemen. Ook zijn grote databases aangelegd met meta-informatie, zoals het iconografische beschrijvingssysteem Iconclass. Het is wenselijk de stand van zaken op het gebied te verkennen en in samenwerking met onderzoekers de mogelijke opzet van een data-archief voor kunstgeschiedenis en visuele cultuur na te gaan.
Data Archiving & Networked Services
45
Data Archiving & Networked Services
+ Veel voorkomend o Af en toe voorkomend
Vakgebied / datatype Sociologie/politicologie Economie Geografie Psychologie Kwalitatieve maatschappijstudies Rechtswetenschappen Geschiedenis Kunstgeschiedenis Culturele studies Literatuurwetenschap Taalwetenschap Archeologie Mediastudies Statistisch pakket + + + ?
o
o +
DBMS o o o ?
+ + o
o + o
+
Spreadsheet o + o
+ + + o
o + o
Full text
+ + o + + + + o
?
Tekstdatabase
+
+
o
Spraak
o o +
+ + +
Beeld
+
o
o
Video
+
o
+
GIS
o +
CAD/Grafisch
Bijlage 2 – Matrix van vakgebieden en veelvoorkomende datatypen (huidige situatie)
46
Vakgebied
Herkomst data / Methode van dataverzameling
Sociologie/politicologie Economie Geografie Psychologie Kwalitatieve maatschappijstudies Rechtswetenschappen
Overheidsstatistieken, bedrijfsadministraties, surveys Overheidsstatistieken, bedrijfsadministraties, surveys Overheidsstatistieken, karteringen, surveys Observaties, metingen Gesprekken, dagboeken, observaties Gedigitaliseerde tekstdatabases, overheidsstatistieken
Geschiedenis
Gedigitaliseerde archieven
Kunstgeschiedenis Culturele studies Literatuurwetenschap
Digitalisering afbeeldingen; beschrijving van objecten, kunstenaars, stromingen Gedigitaliseerde archieven Gedigitaliseerde literaire teksten
Taalwetenschap
Gedigitaliseerde taal- en spraakuitingen
Archeologie Mediastudies
Opgravingen, land surveys Gedigitaliseerde archieven
Data Archiving & Networked Services
47
Bijlage 3 – Overzicht internationale organisaties
In internationaal verband zijn vier terreinen te onderscheiden waar dans zich op oriënteert. 1. Wetenschappelijke data archieven De wetenschappelijke digitale archieven in het buitenland, dikwijls nationale organisaties, vormen de belangrijkste peer group voor dans. Veel landen beschikken over digitale data-, tekst en/ of beeldarchieven ten behoeve van het wetenschappelijk onderzoek en onderwijs in (delen van) de sociale en geesteswetenschappen. Data-archieven in de sociale wetenschappen hebben de langste traditie; tekstarchieven ten behoeve van het taal- en literatuuronderzoek en historische data-archieven volgden. Data-archieven voeren geregeld internationale samenwerkingsprojecten uit (bijvoorbeeld om internationaal vergelijkend onderzoek te bevorderen, toegang tot data over grenzen heen mogelijk te maken, afstemming van collecties, internationale bemiddeling bij toegang tot data). Belangrijke internationale organisaties van data-archieven zijn: – icpsr – Inter-university Consortium for Political and Social Research (omvat tevens het belangrijkste Amerikaanse sociaal-wetenschappelijke data-archief in Ann Arbor, Michigan). – ifdo – International Federation of Data Organizations. – iassist – International Association for Social Science Information Service and Technology. – cessda – Council of European Social Science Data Archives. – hisdan – Historical Data Archives Network. – codata/icsu – Committee on Data for Science and Technology / International Council for Science (primair gericht op de natuurwetenschappen). 2. Methoden en technieken Wetenschappelijke gemeenschappen die zich bezig houden met computertoepassingen en methoden en technieken in de geestes- en maatschappijwetenschappen vormen een tweede relevante groep van organisaties. In het verleden werden deze groepen wel aangeduid met ‘alfa-informatica’ en ‘sociaal-wetenschappelijke informatica’, sinds zijn aanduidingen als e-humanities en e-social science in opkomst. Hier bevinden zich niet alleen belangrijke gebruikersgroepen, die data leveren en gebruiken, maar ook onderzoeksgroepen die onderzoek doen naar methoden en technieken voor verzameling, verwerking, afstemming, uitwisseling, analyse en presentatie van data (digitale producties en publicaties). De ontwikkelingen die zich hier voordoen zijn van direct belang voor dans, bijvoorbeeld: – ahc – international Association for History and Computing. – caa – Computers and Archaeology Association. – ach/allc – Association for Computers and the Humanities / Association for Literary and Linguistic Computing. – eva – Electronic imaging and the Visual Arts (reeks conferenties). – drh – Digital Resources in the Humanities (reeks conferenties).
Data Archiving & Networked Services
48
3. Archief- en bibliotheekwezen Archief- en bibliotheekwezen zijn de laatste jaren steeds actiever geworden op het terrein van digitale duurzaamheid en toegang tot informatie. Bij de archieven gaat het primair om behoud van en toegang tot overheidsinformatie, bij de bibliotheken primair om publicaties. Afstemming met betrekking tot archiveringsstrategieën en –methoden met deze sectoren is van groot belang. Daarnaast zijn de koppelingen tussen publicaties en onderliggende datasets punt van afstemming met het bibliotheekwezen. Organen in deze sector zijn: – ifla – International Federation of Library Associations. – ica – International Council on Archives. – dlm Forum on Electronic Records. – Erpanet – Electronic Resource Preservation and Access Network. – ecpa – European Commission on Preservation and Access. – ddi – Data Documentation Initiative. – niso – National Information Standards Organisation. 4. Standaardisatie organisaties Organisaties en werkverbanden die internationale standaarden vormen, vaststellen en propageren ten aanzien van data-formaten en metadata: – w3c – World Wide Web Consortium . – oai Community – Open Archives Initiative. – ist – Information Society Technologies. – iso – International Organization for Standards.
Data Archiving & Networked Services
49
Bijlage 4 – Formele kaders
Artikel 3 van de Archiefwet luidt: ‘De overheidsorganen zijn verplicht de onder hen berustende archiefbescheiden in goede, geordende en toegankelijke staat te brengen en te bewaren, alsmede zorg te dragen voor de vernietiging van de daarvoor in aanmerking komende archiefbescheiden.’ Hoewel digitale bestanden ook als archiefbestanden worden beschouwd, worden onderzoeksbestanden tot op heden in de praktijk niet als archiefbescheiden in de zin van de archiefwet behandeld. Er wordt tot nu toe door de universiteiten en andere wetenschappelijke instellingen geen archiefbeleid in de zin (van o.a. het bovengenoemde artikel) van de Archiefwet t.a.v. onderzoeksbestanden ontwikkeld. De grote vraag is of dat in de nabije toekomst wel zal gebeuren. Voor onderzoekers geldt wel de morele en wetenschappelijke plicht om hun onderzoek controleerbaar te maken. Tal van wetenschappelijke organisaties (oeso, knaw, Max Planck Gesellschaft, enz.) hebben dit in verklaringen, gedragsregels en dergelijke geformuleerd. dans dient open toegang (Open Access) tot wetenschappelijke databestanden te bevorderen, onder andere door afspraken te maken met wetenschappelijke organisaties in Nederland om tot verplichte deponering van bestanden in data-archieven te komen. De meeste wetenschappelijke data-archieven (waaronder ook Steinmetzarchief en nhda) hanteren een zogenaamde ‘overdrachtsovereenkomst’, die wordt gesloten tussen de onderzoeker die de data heeft gecreëerd en het archief. Hierin kunnen eventuele toegangsrestricties tot de data worden vastgelegd. Ook wordt de manier van verwijzen naar databestanden in publicaties geregeld. De laatste jaren zijn de open licentievoorwaarden van Creative Commons sterk in opkomst. Dit is een succesvol initiatief om de verspreiding van auteursrechtelijk beschermde literatuur, fotografie, muziek, film en wetenschappelijk werk via het Internet zoveel mogelijk te stimuleren zonder dat inbreuk op het auteursrecht wordt gemaakt. Auteurs kunnen door middel van een Creative Commons licentie precies aangeven welk gebruik vrij is en welke gebruiksvormen niet zijn toegestaan. Een Nederlandse versie van de cc licentie is inmiddels in ontwerp gereed. dans dient te bevorderen dat de auteursrechten rondom het gebruik van databestanden afdoende zijn geregeld. Veel onderzoeksbestanden bevatten gegevens over individuele (natuurlijke) personen. De privacybescherming wordt geregeld in de Wet bescherming persoonsgegevens (Wbp). Voor het verwerken van persoonsgegevens voor historisch, statistisch en wetenschappelijk onderzoek, is een aparte regeling in de wet opgenomen. Verdere verwerking van persoonsgegevens voor historische, statistische of wetenschappelijke doeleinden, wordt toegestaan indien de verantwoordelijke de nodige voorzieningen heeft getroffen ten einde te verzekeren dat de verwerking uitsluitend geschiedt ten behoeve van deze specifieke doeleinden. Dit houdt onder andere in dat de anonimiteit van personen in de uitkomst van het onderzoek is gegarandeerd. De verwerking van de gegevens mag uitsluitend plaatsvinden voor het doel van dit onderzoek. Voor het gebruik van persoonsgegevens in wetenschappelijk onderzoek is door de swr een gedragscode opgesteld. Van belang voor de regelingen voor toegang tot databestanden zijn voorts: – De Nederlandse Databankenwet (officieel de Wet van 8 juli 1999, Staatsblad 1999, 303), die de implementatie is van de Europese richtlijn inzake de rechtsbescherming van databanken van 11 maart 1996 heeft ook consequenties voor het Nederlandse databankenrecht. – oeso-richtlijn en principes voor toegang tot door de overheid gefinancierde onderzoeksdata. – De recent in werking getreden Wet op het Centraal Bureau voor de Statistiek bevat een aantal bepalingen met betrekking tot de gegevensverwerving door het cbs en voorwaarden waaronder
Data Archiving & Networked Services
50
–
het cbs gegevens kan stellen ten behoeve van statistisch of wetenschappelijk onderzoek. dans zal een bemiddelende rol spelen bij deze beschikbaarstelling. De bestaande sociaal-wetenschappelijke data-archieven hebben afspraken gemaakt over internationale dataleveranties en zogenaamde fishing zones. Dit laatste betreft het gebied waartoe het data-archief zijn acquisitie-activiteiten uitstrekt.
Binnen de juridische kaders zal dans moeten worden erkend als trusted partner voor belangrijke data-leveranciers (zoals het cbs), waarbij de toegang tot de data aan beperkingen onderhevig is. dans zal via overeenkomsten met de gebruikers garanderen dat aan de datarestricties kan worden voldaan, zonder dat het onderzoek daardoor ernstig wordt belemmerd. Functionaris voor de gegevensverwerking De swr beveelt in het rapport Networked Data Service aan om een onafhankelijke functionaris voor de gegevensverwerking (fg; Engels: Data Protection Officer) aan te stellen. De Wet bescherming persoonsgegevens (wbp) biedt organisaties de mogelijkheid om een dergelijke functionaris te benoemen. Deze houdt binnen de organisatie toezicht op de verwerking van persoonsgegevens en daarmee op de toepassing en naleving van de wbp. Meldingen van verwerkingen van persoonsgegevens kunnen bij deze functionaris worden gedaan. Tevens is hij een deskundig aanspreekpunt voor de verantwoordelijke. Ook kan hij als contactfunctionaris optreden voor de personen over wie persoonsgegevens worden verwerkt: klanten, personeelsleden en burgers. De noodzaak of wenselijkheid van een afzonderlijke fg is echter twijfelachtig, omdat: – dans niet zelf data verzamelt, maar slechts in tweede instantie gegevensbestanden ontvangt van data-leveranciers (of bemiddelt bij de toegang daartoe); de verzamelaar of leverancier van de data dient de naleving van de wbp al te hebben geregeld. – De databestanden die bij data-archieven worden gedeponeerd en die door sociaalwetenschappelijk onderzoekers worden geanalyseerd al geanonimiseerd zijn door de oorspronkelijke data-verzamelaar. – De individuele gegevens die bij historisch onderzoek worden gebruikt betreffen in het overgrote deel van de gevallen overleden personen. Meestal zijn deze individuele gegevens afkomstig uit voor iedereen toegankelijke archiefbronnen, die zich in openbare archiefbewaarplaatsen bevinden. Vaak zijn deze bronnen minimaal honderd jaar oud In de praktijk van het nhda zijn er slechts enkele bestanden, waarbij informatie over nog levende personen een belemmering voor deponering vormt. Het belangrijkste bestand is de Historische Steekproef Nederlandse bevolking, waarbij een deel van de 20e eeuwse personen wellicht nog in leven is. – Er bij weten van Steinmetzarchief en nhda nog nooit enige klacht is geweest van personen die zich in de bestanden van de data-archieven bevinden. Het verdient aanbeveling de (waarschijnlijk beperkte) fg-taak onderdeel te laten zijn van één van de medewerkers van dans. In het functieprofiel dient te zijn opgenomen dat deze medewerker beschikt over toereikende kennis van de privacyregelgeving en betrouwbaar is. Het vermogen om diplomatiek op te treden zal voorts in de praktijk van groot belang zijn. Het verdient aanbeveling om bij de start van dans een aantal van deze juridische issues (auteursrecht, privacy, databankenrecht) ter advisering voor te leggen aan hierin gespecialiseerde juristen, bijv. van het Instituut voor Informaticarecht (ivir) van de uva. De wetgeving omtrent datatoegang is sterk in beweging op het moment, dus is up-to-date kennis geboden.
Data Archiving & Networked Services
51
Bijlage 5 – Intentieverklaring dans
Intentieverklaring knaw/nwo inzake de Nederlandse data-infrastructuur in de Geesteswetenschappen en maatschappij- en gedragswetenschappen. Dans (Data Archiving & Networked Services) De besturen van knaw en nwo hebben de intentie te komen tot de oprichting van een nationale organisatie voor de wetenschappelijke data-infrastructuur in de Geesteswetenschappen en maatschappij- en gedragswetenschappen. Overweging De knaw en nwo bezitten momenteel elk eigen voorzieningen en faciliteiten op het gebied van data-infrastructuur. De internationale ontwikkelingen in de informatie- en communicatietechnologie, frequenter gebruik van grootschalige databestanden in toegepast onderzoek alsmede de gefragmenteerde organisatie van de huidige voorzieningen in Nederland maken een nieuwe opzet noodzakelijk. Daarmee wordt ook tegemoet gekomen aan de groeiende noodzaak tot coördinatie van behoeften in de kring van wetenschap en dataleveranciers. De oprichting van een gemeenschappelijke organisatie zal de volgende voordelen met zich mee brengen: – het creëren van één loket/aanspreekpunt voor gebruikers en dataleveranciers. – verbeterde voorzieningen voor dataontsluiting, data-archivering, toegankelijkheid en dataverrijking. – synergie- en schaalvoordelen t.a.v. kennis, bedrijfsvoering, huisvesting en automatisering. – versterking van de internationale positie van de Nederlandse data-infrastructuur. Missie De organisatie heeft ondermeer tot doel: – het stroomlijnen en faciliteren van de contacten tussen wetenschappelijke onderzoekers en leveranciers van databestanden. – het ontsluiten, archiveren en voor gebruik beschikbaar maken van wetenschappelijke relevante databestanden, volgens moderne standaarden. – het bevorderen van het (her)gebruik van deze databestanden. – het bieden van een naar buiten gerichte dienstverlening, waarbij sprake is van één loket voor gebruikers en stakeholders. Bovengenoemde punten zullen ook in internationaal verband worden nagestreefd. Naamgeving De organisatie zal aangeduid worden met de naam: Data Archiving and Networked Services. Een Engelse naamgeving wordt geprefereerd in verband met de internationale oriëntatie. Als werktitel zal het acroniem DANS worden gebruikt.
Data Archiving & Networked Services
52
Werkwijze knaw en nwo stellen per heden een taskforce in die bestaat uit: – Mw. mr Y.C.M.T. van Rooy, voorzitter (voorzitter cvb uu) – prof. dr. W.J. van den Akker (directeur Instituten Geestes- en Sociale Wetenschappen, knaw) – dr J.K. Koppen (directeur Maatschappij- en Gedragswetenschappen, nwo) – prof. dr. J. L. van Zanden (hoogleraar geschiedenis uu, onderzoeker iisg) – prof. dr. H.J. van den Herik (hoogleraar informatica um en rechtsinformatica ul) – dr J.B. Spaapen, secretaris (stafmedewerker directie knaw) – drs J.R. Nobel, waarnemer (Raadsadviseur cbs) De taskforce heeft tot taakstelling zorg te dragen voor de aanbieding van een bedrijfsplan voor de nieuwe organisatie aan het Bestuur van de knaw en het Algemeen Bestuur van nwo medio 2004. Ten behoeve van de totstandkoming van dit plan zal door de taskforce een ontwerpgroep worden ingesteld, bestaande uit drie gereputeerde velddeskundigen, aangevuld met secretariële ondersteuning op maat. De ontwerpgroep zal in opdracht van de taskforce een voorstel uitwerken voor de nieuwe organisatie. Internationale expertise en ervaringen zullen daarbij richtinggevend zijn. In het bedrijfsplan zullen tenminste de volgende onderdelen zijn opgenomen: – de organisatiestructuur; – de functies, taken en werkwijze van dans; – het werkterrein, de omvang, infrastructuur, functiestructuur en functiebeschrijvingen; – het financieringsmodel; – het type relatie met dataleveranciers (cbs, scp, rpb, cpb, rivm, ministeries e.a.); – de (centrale/decentrale) huisvesting en – de vormgeving van de relaties met de gebruikers. De organisatie zal worden opgericht onder gezamenlijk bestuur en beheer van de beide wetenschap sorganisaties. Tijdpad – ondertekening intentieverklaring – instellen taskforce – instellen ontwerpgroep – startbijeenkomst taskforce – tussenrapportage taskforce aan besturen – concept ontwerp gereed – bespreking concept in taskforce – invited workshop met toekomstige gebruikers en dataleveranciers – oplevering definitief ontwerp – bespreking definitief ontwerp in taskforce – besluit besturen knaw/nwo – –
inrichting nieuwe organisatie start dans
Data Archiving & Networked Services
22 juni 2004 22 juni 2004 22 juni 2004 23 augustus 2004 3 september 2004 15 september 2004 7 oktober 2004 25 oktober 2004 26 november 2004 3 december 2004 15 december (nwo) 21 december (knaw) januari – maart 2005 1 april 2005
53
Ondertekening
Bestuur en directie knaw,
Algemeen Bestuur nwo
namens deze,
namens deze,
Prof. dr. W.J.M. Levelt
prof. dr. P. Nijkamp
Den Haag, 22 juni 2004
Data Archiving & Networked Services
54