Wegwijzer Digitaal Deponeren
Voor de Nederlandse archeologie is het van belang dat de unieke digitale documentatie van archeologisch onderzoek voor de toekomst bewaard en toegankelijk blijft. Daarom is deze Wegwijzer Digitaal Deponeren speciaal geschreven voor de Nederlandse archeologie.
ARCHEOLOGIE Milco Wansleeben Marjolein van den Dries
ARCHEOLOGIE
De eerste hoofdstukken gaan in op het e-depot Nederlandse archeologie (EDNA), op de organisaties die daarbij betrokken zijn en op de onderzoeksmogelijkheden voor de toekomst. Daarnaast worden hier onderwerpen als het auteursrecht en het toevoegen van metadata (Dublin Core) toegelicht. Het tweede deel van deze Wegwijzer is meer praktisch van aard en geeft stap voor stap aan hoe het deponeren in het online archiveringssysteem van EASY in zijn werk gaat. Van begin tot eind wordt de gebruiker bij de hand genomen bij het proces van deponeren.
Wegwijzer Digitaal Deponeren
DANS (Data Archiving and Networked Services) is de nationale organisatie die zorgt voor de opslag en blijvende toegankelijkheid van onderzoeksgegevens in de alfa- en gammawetenschappen. DANS beheert bestaande data archieven en organiseert de data infrastructuur voor onderzoekers die het verzamelen, bestuderen en vastleggen van gegevens als onderdeel van hun activiteiten maken. DANS werkt ook aan de verdere ontwikkeling van data-infrastructuur op nieuwe gebieden. De Wegwijzer Digitale Deponeren wordt in de reeks DANS Data Guides uitgebracht als één van de gidsen die uitleggen hoe het deponeren in EASY voor specifieke vakgebieden in zijn werk gaat.
978- 90- 5260- 295- 0
ant
9 789052 602950
DANS Data Guide 3
An omslag_wegwijzer_kleur.indd 1
13-12-2007 9:32:25
Wegwijzer Digitaal Deponeren – Archeologie
2008 DANS © Sommige rechten voorbehouden / Some rights reserved. Voor deze uitgave zijn gebruiksrechten van toepassing zoals vastgelegd in de Creative Commons licentie [Naamsvermelding-NietCommercieel-GelijkDelen] 3.0 Nederland. Voor de volledige tekst van deze licentie zie: http://creativecommons. org/licenses/by-nc-sa/3.0/nl/ Gepubliceerd voor: DANS – Data Archiving and Networked Services Postbus 93067 2509 AB Den Haag T 070 3494450 F 070 3494451
[email protected] www.dans.knaw.nl isbn978-90-5260-295-0 Het papier van deze publicatie voldoet aan ∞ iso-norm 9706 (1994) voor permanent houdbaar papier. Vormgeving en opmaak: Ellen Bouma, Alkmaar Foto’s: Gerlo Beernink, www.gerlo.nl Uitgeverij Aksant, Cruquiusweg 31, 1019 AT Amsterdam, www.aksant.nl
Wegwijzer Digitaal Deponeren ARCHEOLOGIE
Milco Wansleeben Marjolein van den Dries
DANS Data Guide 3
a Amsterdam, 2008
Wegwijzer Digitaal Deponeren – Archeologie
Woord vooraf
Digitale duurzaamheid, het bewaren en toegankelijk houden van informatie die met behulp van een computertoepassing is vastgelegd, is een onderwerp dat al langere tijd in de Nederlandse archeologie de aandacht trekt. Ten tijden van de Betuweroute was een veel gehoorde vraag: waarom moeten we eigenlijk al die opgravingsgegevens in DigIT invoeren, als die bestanden straks toch niet meer toegankelijk en herbruikbaar zijn? De archeologie is zeker niet het enige vakgebied dat met dit probleem aan het worstelen is. Op alle maatschappelijke vlakken slaan we tegenwoordig heel veel informatie digitaal op, maar hoe gaan we dat voor langere tijd bewaren? Medio 2003 heeft een kleine groep van (ICT) archeologen zich het lot van de digitale archeologische bestanden aangetrokken. Een aantal discussiebijeenkomsten georganiseerd bij de RACM (voorheen de ROB) en Erfgoed Nederland (voorheen de SNA) hebben uiteindelijk geleid tot een succesvolle subsidieaanvraag bij SURF, de netwerkorganisatie voor het hoger onderwijs in Nederland. In het kader van het zogenaamde DARE programma (Digital Academic REpositories) is een pilot-project gestart op het gebied van het archiveren en ontsluiten van digitale archeologische gegevens en publicaties. “Simpelweg ervaring opdoen, gewoon door maar bij het begin te beginnen”, was het motto. Wat komt er allemaal bij kijken als we de complexe en uitgebreide digitale datasets van een opgraving duurzaam willen bewaren? Wat wordt er van de deponeerders verwacht en welke diensten moet een elektronisch depot leveren? Dit project kreeg als titel het ‘e-depot voor de Nederlandse archeologie (EDNA)’ en heeft uiteindelijk geleid tot een volledig functionerend online repository bij de KNAW, met een selectie van archeologische datasets en publicaties (www.edna.nl). Naast het stellen van voorbeelden en het vergroten van het bewust omgaan met onze unieke digitale gegevens, wil het e-depot ook voorlichting en advies geven, bijvoorbeeld door middel van deze Wegwijzer Digitaal Deponeren. Anno 2007, nu de aanvraag voor het vervolgproject EDNA II door NWO is gehonoreerd, gaat het bij het e-depot om meer dan alleen het elektronisch deponeren van data. Er wordt ook zorg gedragen voor alle rapporten die de afgelopen jaren zijn geproduceerd door de archeologische bedrijven. Naast de zorg voor de datasets wordt er vanuit het edepot, samen met de RACM, gewerkt aan de ontwikkeling van een digitale bibliotheek voor alle rapporten. De term ‘e-depot’ omvat het geheel (datasets en publicaties) maar in deze publicatie ligt de nadruk op de datasets. Deze Wegwijzer Digiaal Deponeren richt zich voornamelijk op de personen of organisaties die bestanden gaan deponeren in het e-depot voor de Nederlandse archeologie. Hij bevat zowel heel praktische informatie over bijvoorbeeld de te volgen deponeringsprocedure en metagegevens, als achtergrondinformatie over bijvoorbeeld de organisatorische inbedding en het auteursrecht. Deze gids is niet opgezet als leidraad voor of advies over het daadwerkelijk digitaal vastleggen van de archeologische (opgravings)gegevens. Enerzijds legt het e-depot geen verplichtingen op ten aanzien van de te gebruiken gegevensstructuur of het bestandsformaat. Alle bestanden worden in principe geaccepteerd, mits
5
6
DANS Data Guide 3
voorzien van voldoende beschrijvende informatie (metagegevens). Anderzijds geeft de Archaeology Data Service (ADS) in Engeland al een aantal Guides to Good Practice uit, waarin onderwerpen als het gebruik van CAD, GIS en databases in de archeologie uitstekend worden behandeld (zie: ads.ahds.ac.uk/project/goodguides/g2gp.html). In de Engelse gidsen wordt natuurlijk ook de digitale archivering besproken, maar specifiek voor de Engelse situatie. In deze gids ligt de nadruk op die zaken die direct of indirect te maken hebben met het duurzaam digitaal archiveren in het Nederlandse e-depot. De inhoud van deze Wegwijzer Digitaal Deponeren is voor verschillende doelgroepen geschikt. Enerzijds zijn er archeologische instellingen en personen met een beleidsmatige en organisatorische rol als bijvoorbeeld het bevoegd gezag, de opsteller van een programma van eisen of de directievoerder tijdens onderzoeksprojecten. Anderzijds zijn er veel onderzoekers heel pragmatisch bezig om gegevensverzamelingen aan te leggen en te analyseren. Dat gebeurt dan zowel bij het veldwerk als bij de analyse van specifieke materiaalcategorieën door de specialistische onderzoekers. Het eerste hoofdstuk gaat over de doelstellingen en uitgangspunten van digitale duurzaamheid en geeft een introductie op de problemen en mogelijkheden. In het tweede hoofdstuk wordt ingegaan op het organisatorische gedeelte en worden mogelijkheden en ideeën voor de toekomst geschetst. In hoofdstuk 3 wordt uitgebreid ingegaan op auteursrechten en copyright. De hoofdstukken 4, 5 en 6 behandelen het praktische gedeelte van het deponeringsproces: hoe gaat dit in grote lijnen in zijn werk en welke bestandsformaten worden geaccepteerd? Het laatste deel van deze Wegwijzer – hoofdstuk 7 – vormt de handleiding voor het deponeren van datasets in EASY. Hierin wordt uitgebreid uitgelegd hoe het deponeren van een dataset in dit online archiveringssysteem van DANS in zijn werk gaat, van het registreren als gebruiker tot en met de definitieve overdracht. Met het digitaal archiveren en duurzaam toegankelijk maken van archeologische informatie is er een wezenlijk nieuwe weg ingeslagen. Doordat digitale publicaties en onderliggende data op een muisklik afstand van elkaar gekoppeld kunnen worden, zullen de onderzoeksmogelijkheden voor archeologen sterk groeien. Dat geldt zowel voor de wetenschappelijk onderzoekers als voor de grote groep onderzoekers die momenteel in de commerciële (Malta) archeologie werkzaam is. Als we nu samen in staat zijn die stap te maken naar goed gedocumenteerde archeologische resources, die duurzaam online beschikbaar blijven, dan staat ons in de toekomst een faciliteit ter beschikking waarvan we de onderzoeksmogelijkheden nog niet kunnen overzien. Alle archeologische resources, (digitaal) beheerd door organisaties die daar speciaal voor zijn toegerust (DANS, RACM, KB, provinciale depots, DARE, etc.) ontwikkelen zich samen tot één geïntegreerde digitale onderzoeksinfrastructuur voor de Nederlandse archeologie. Een weg naar virtuele opgravingsdossiers, waarin de ‘eenheid van vondsten en documentatie’ dicht benaderd wordt. Daar zijn we nog lang niet – we maken nu slechts een eerste stap – maar het begin is er. Het e-depot voor de Nederlandse archeologie en deze publicatie zou niet tot stand zijn gekomen zonder het enthousiasme van de groep van onderzoekers die vanaf het eerste uur achter het initiatief hebben gestaan: Roel Brandt, Peter Doorn, Marjolijn Kok, Hans Kamermans, Martijn van Leusen, Rien Polak, Marcel Ras, Chris Sueur, Jeroen van der
Wegwijzer Digitaal Deponeren – Archeologie
Vliet en Ronald Wiemer. Marjan Balkestein heeft zowel in het pilot-project als bij deze publicatie een onvervangbare rol als kritische steun vervuld. Deze publicatie is mede tot stand gekomen dankzij de financiële bijdrage van SURF, in het kader van het DARE-programma.
7
8
Wegwijzer Digitaal Deponeren – Archeologie
Doelstellingen en uitgangspunten van digitale duurzaamheid
Inhoud
Woord vooraf 5 1. Doelstellingen en uitgangspunten van digitale duurzaamheid 13 1.1 Vier problemen bij de zorg voor digitale duurzaamheid 13 1.2 Strategieën voor digitale duurzaamheid 15 1.3 Blijvende toegankelijkheid 16 2. Het organisatorische en financiële kader van het e-depot 21 2.1 Verschillende organisaties, verschillende taken 21 2.2 Onderlinge samenhang: een virtuele eenheid 23 2.3 Toekomstvisie: een model voor het e-depot op de lange termijn 25 2.4 Een voorstel kostenmodel e-depot 25 3. Auteursrechten, copyright en het e-depot 31 3.1 Publicaties 32 3.2 Rapporten in opdracht 33 3.3 Datasets 34 4. Deponeringsprocedure 39 4.1 Vroegtijdig contact opnemen 39 4.2 Bestandsnamen 40 4.3 Versiebeheer en de bestandsselectie 40 4.4 Gegevens over de gegevens (metadata) 41 4.5 Overdracht aan het e-depot 42 4.6 Controle en conversie naar een archief formaat 43 4.7 Controle door de deponeerder 44 4.8 Licentie-overeenkomst en toegankelijkstelling 44 5. Metagegevens voor archeologische datasets 47 5.1 De Dublin Core projectbeschrijving 48 5.2 Qualified Dublin Core 50 5.3 De uitgebreide bestandenlijst 52 5.4 KNA-bouwstenen 54 5.5 Het codeboek 56
9
10
Wegwijzer Digitaal Deponeren – Archeologie
6. Te deponeren bestandstypen 61 6.1 Overzicht deponeerbare applicaties 62 Teksten 62 Gegevenstabellen 63 Statistische bestanden 64 Cartografische gegevens 64 Beeldmateriaal 65 Opmaak 66 Overige applicaties 66 6.2 Voorafgaand aan de deponering 66 7. Handleiding EASY 71 7.1 Inloggen en registreren als nieuwe gebruiker 72 7.2 Deponeren van een dataset 75 Pane 1. Primaire informatie en intellectueel eigendom 78 Pane 2. Beschrijvende informatie over het gehele onderzoeksproject 79 Pane 3. Beschrijvende informatie over de digitale bestanden 82 Pane 4. Uploaden van bestanden 82 Pane 5. Deponeren en overdracht 84 Pane 6. Samenvatting en versturen 85 7.3 Verwerking van de dataset door de data-archivaris 86 7.4 Controle van de presentatie in EASY 87 Bijlagen 1. Contactgegevens DANS en RACM 89 2. Elementen voor de beschrijving van de individuele bestanden 89 3. DANS Licentie overeenkomst archeologie 91 4. Afkortingen 96
Doelstellingen en uitgangspunten van digitale duurzaamheid
11
Doelstellingen en uitgangspunten van digitale duurzaamheid
–1– Doelstellingen en uitgangspunten van digitale duurzaamheid
Een archeologische opgraving is eigenlijk een vreemde manier om gegevens te verzamelen. Door het onderzoek zelf wordt namelijk onze bron van kennis over het verleden vernietigd. We kunnen het bodemarchief slechts één keer lezen. Dat betekent dat dit zorgvuldig moet plaatsvinden èn dat de documentatie van de opgraving goed en kompleet moet zijn. Die documentatie is het enige dat rest na afloop van het ‘destructieve’ onderzoek. De publicatie, waarin de bevindingen en conclusies van de onderzoekers is vastgelegd, vormt een belangrijk eindproduct. Maar de oorspronkelijke documentatie is de enige bron waarmee toekomstige archeologen een (her)onderzoek of (her)interpretatie kunnen uitvoeren. Zelfs als er archeologisch onderzoek met een non-destructief karakter is uitgevoerd, zoals materiaalstudies, veldverkenningen of geofysisch onderzoek, heeft de documentatie een belangrijke wetenschappelijke en cultuurhistorische waarde. Het is daarom wettelijk vastgelegd dat na voltooiing van het archeologisch onderzoek de vondsten en alle bijbehorende documentatie bij een depot moeten worden gedeponeerd. Andere onderzoekers worden daardoor in de gelegenheid gesteld kennis te nemen van de originele onderzoeksdocumentatie. De provinciale en gemeentelijke depots zijn aangewezen om te zorgen voor de lange termijn bewaring van vondsten en documentatie. Met de toegenomen inzet van computers bij het archeologische veldwerk en de analyse is ook de documentatie in toenemende mate digitaal beschikbaar. Deels gaat het hierbij om gedigitaliseerde gegevens, die ook nog op papier bestaan. Maar steeds vaker betreft het direct digitaal vastgelegd documentatie (‘digitally born’). Hierbij kan bijvoorbeeld gedacht worden aan de digitale fotografie of de toepassing van Total Station voor landmeetkundige metingen. De provinciale en gemeentelijke depots zijn prima in staat om de vondsten en analoge documentatie (veldtekeningen, ordners met formulieren en afgedrukte foto’s) duurzaam te archiveren. Het duurzaam archiveren van digitale gegevens is echter een complex en relatief nieuw onderwerp. Het simpelweg opslaan van een diskette of een cd-rom in een (brand)kast is helaas onvoldoende.
1.1 Vier problemen bij de zorg voor digitale duurzaamheid Digitale duurzaamheid voor de oorspronkelijke opgravingsdocumentatie vereist een aanpak van vier problemen tegelijkertijd. Onze digitale bestanden worden als het ware van vier kanten tegelijkertijd aangevallen: medium degradatie, veroudering van de hardware, veroudering van de software en het ontbreken van documentatie (metadata).
13
14
Wegwijzer Digitaal Deponeren – Archeologie
De levensduur van de media waarop de digitale bestanden staan is relatief beperkt. Hoewel de diverse bronnen het niet volledig met elkaar eens zijn, lijkt zelfs een cd-rom slechts een gegarandeerde levensduur van vijf à tien jaar te hebben (medium degradatie). Daarna is er een kans dat (delen van) de gegevens niet meer gelezen kunnen worden. Daarnaast blijkt de hardware waarmee de informatiedragers gelezen kunnen worden een zeer snelle ontwikkeling door te maken (hardware veroudering). Veel moderne PC’s beschikken al niet meer over een 3.5” diskette station. Nog oudere hardware zoals een 5.25” diskette-, ZIP- of WORM-drive zijn vrijwel nergens meer beschikbaar. Beide problemen, medium degradatie en hardware veroudering, kunnen door het regelmatig maken van een kopie van alle bestanden op een actueel digitaal medium worden ondervangen. Dit brengt echter een aanzienlijke beheerslast met zich mee voor de archiefinstelling, zowel wat betreft de beschikbaarheid van (oude) hardware als het tijdsbeslag. Bovendien zou dan pas een deel van de problemen van digitale duurzaamheid opgelost zijn. De bovenstaande problemen lijken relatief eenvoudig op te lossen, de veroudering van de software vormt een veel grotere boosdoener. De archeologische gegevens staan als een stroom van 1-en en 0-en op de digitale media en kunnen alleen zichtbaar gemaakt worden met een specifiek computerprogramma, dat weer onder een specifiek operating system draait. Zeer regelmatig worden er nieuwe versies van software uitgebracht. Niet zelden wordt bij de nieuwere software ook het (technische) bestandsformaat aangepast aan de nieuwe mogelijkheden. Het oude formaat wordt door een (beperkt) aantal nieuwe releases nog wel ondersteund en gegevens kunnen gewoon worden geïmporteerd, bewerkt en geconverteerd. Maar die ‘backward compatibility’ kent wel zijn grenzen. Daarnaast blijken archeologen veel programmatuur te gebruiken die specifiek voor één doel is geschreven. Deze maatsoftware, bijvoorbeeld voor de analyse van specifieke materiaalcategorieën of (meet)apparatuur, wordt vrijwel nooit ge-upgrade, maar simpelweg vervangen door volledig andere software met een geheel ander bestandsformaat. De leesbaarheid van de digitale archeologische documentatie is dus sterk afhankelijk van snel veranderende software. Het archiveren van de bestanden in het oorspronkelijke ‘native’ formaat is daarom voor de duurzaamheid een niet zo verstandige keuze. Naast de manier van archiveren is er nog het vierde probleem van digitale duurzaamheid: het ontbreken van metagegevens. De digitale gegevens kunnen veelal alleen worden hergebruikt door andere onderzoekers als heel duidelijk is omschreven wat de structuur en inhoud van de bestanden is. Metagegevens – “gegevens over de gegevens” – zijn een essentiële randvoorwaarde voor de digitale duurzaamheid. Bij elk bestand moet zonder meer duidelijk zijn van welk project het onderdeel uitmaakt, wat er in het betreffende bestand is gedocumenteerd en wat eventuele coderingen, afkortingen en conventies precies betekenen. De metagegevens hebben zowel betrekking op het gehele project, op afzonderlijke bestanden, als op de gebruikte variabelen en waarden. Aan het opstellen van metagegevens, zowel in vorm als inhoud, wordt in een volgend hoofdstuk meer aandacht besteed.
Doelstellingen en uitgangspunten van digitale duurzaamheid
1.2 Strategieën voor digitale duurzaamheid Digitale duurzaamheid is geen specifiek archeologisch probleem. Tal van andere onderzoeksgebieden en organisaties worden met dezelfde problemen geconfronteerd. Gespecialiseerde organisaties werken aan oplossingen en strategieën om de kans op verlies van de digitale informatie zo klein mogelijk te maken. Hieronder wordt aan de hand van het concrete voorbeeld van de gegevens van de Betuweroute de strategie beschreven die bekend staat als de conversie strategie. Dit is echter maar één van de manieren waarop de veroudering van de software opgelost zou kunnen worden. Voor de Betuweroute opgravingen is specifieke software op maat gemaakt: ‘Dig-IT’. Dit programma maakte gebruik van het zogenaamde TopSpeed bestandsformaat (Clarion database), dat momenteel vrijwel nergens meer in gebruik is. Op de cd-rom’s/dvd’s staan sommige databases alleen in het TopSpeed formaat opgeslagen, wat nu een reëel gevaar vormt voor het voortbestaan van de informatie. Als er via internet niet nog een viewer beschikbaar bleek te zijn (voor de huidige generaties PC’s en Operating Systemen), dan zouden de gegevens al verloren zijn gegaan. Het zou achteraf veel verstandiger zijn geweest de bestanden van de Betuweroute, direct nadat het project was voltooid, te converteren naar het duurzame komma gescheiden bestandsformaat. Dit is een eenvoudig (ASCII) tekst bestand waarin toch alle gegevens zijn vastgelegd en dat in vrijwel elke applicatie weer kan worden ingelezen. Dit csv (comma seperated values) format is een bekend uitwisselingsformaat voor tabellen en lijsten. Hierbij gaan weliswaar de vormgeving en database functionaliteit verloren, maar de primaire (basis)gegevens blijven leesbaar en beschikbaar voor (her)gebruik. Twee andere strategieën zijn ook het vermelden waard. Als de oorspronkelijke vormgeving een wezenlijk onderdeel van een digitaal document vormt, wordt veelal gekozen voor een emulatie strategie. Het bestand wordt in het oorspronkelijke (native) formaat gearchiveerd. Ook de software waarmee deze gegevens zichtbaar worden gemaakt, wordt in het archief opgeslagen. De software kan dan, te zijner tijd, opnieuw op een PC worden geïnstalleerd. De moderne PC’s zullen dat niet zondermeer toestaan, maar wel als er softwarematig een oude PC wordt nagebootst. Technisch is dit overigens geen eenvoudige oplossing. In Nederland is de Koninklijke Bibliotheek (KB) een voortrekker op dit gebied. Daarnaast bestaat er de zogenaamde migratie strategie. Hierbij worden de gegevens bij elke nieuwe versie van de software opnieuw opgeroepen en weer weggeschreven in het actuele bestandsformaat. Zo zou een Microsoft Word5 document, omgezet kunnen zijn in Word2000 en enkele jaren later zonder veel problemen weer in Word2003. Voor Microsoft-Word waren in Nederland echter Wordstar en WordPerfect populaire tekstverwerkers. De omzetting van Wordstar naar WP en van WP naar Word moet zeer goed worden begeleid, om er zeker van te zijn dat er bij die migraties geen gegevens verloren gaan of wijzigen optreden. Bepaalde functionaliteiten van WP zijn immers helemaal niet (op een vergelijkbare manier) aanwezig in Word. Software-migratie betekent dat alle bestanden in een archief continu in de meest recente versie moeten worden gehouden, hetgeen een enorm zware beheerslast met zich
15
16
Wegwijzer Digitaal Deponeren – Archeologie
meebrengt voor de archiefinstelling. Voor de potentiële hergebruiker is het een prettige strategie; alle gegevens zijn immers altijd in een actueel bestandsformaat op te vragen. Binnen de Nederlandse archeologie blijkt er heel veel verschillende hard- en software te worden gebruikt. Dit geldt zowel voor nu, als in het verleden en zowel tussen als binnen de diverse archeologische instellingen. Het Geografisch Informatie Systeem (GIS) dat bij het GIA (Rijksuniversiteit Groningen) wordt gebruikt voor het onderzoek in Italië (GRASS) verschilt van wat bij dezelfde instelling voor het onderzoek naar de steentijd in Nederland wordt gebruikt (ArcView). Voor hetzelfde soort steentijdonderzoek bij de Faculteit der Archeologie (Universiteit Leiden) weer MapInfo wordt toegepast. Uitwisseling van archeologische gegevens kan dus alleen als die in min of meer algemeen gangbare uitwisselingsformaten beschikbaar worden gemaakt. De conversie strategie lijkt daarmee eigenlijk twee vliegen in één klap te kunnen slaan. De eenvoudige tekstbestanden bieden zowel voor de duurzame archivering als voor de uitwisselbaarheid een goede oplossing. De beheerslast voor de archiefinstelling is dan beperkter dan bij migratie. Dit is een aspect dat, gezien de omvang en complexiteit van de digitale documentatie en de verwachte groei daarin, zeker niet uit het oog verloren mag worden. Maar ook de conversiestrategie is zeker nog niet volledig uitgekristalliseerd. Zo is er bijvoorbeeld veel discussie over of het gekozen archiefformaat uitsluitend een open, goed gedocumenteerde, standaard mag zijn. De facto zijn bijvoorbeeld TIFF (voor foto’s) en pdf (voor opgemaakte tekst) archiefformaten die veel worden gebruikt. Beide zijn echter gekoppeld aan specifieke software van softwareleverancier Adobe, daar waar respectievelijk de public domain archiefformaten PNG en SGML beter zouden zijn. De archiefinstelling zou, in de toekomst, wellicht een andere keuze willen maken. Juist op dit terrein van de digitale duurzaamheid vinden er momenteel veel ontwikkelingen plaats en is de opslag in XML-formaat sterk in opkomst. “Koffiedik kijken” in de toekomst blijft heel moeilijk en met de unieke digitale (opgravings)documentatie mag geen risico worden gelopen. Er is daarom, in navolging van tal van andere organisaties, gekozen voor een ‘hybride’ strategie. De gegevens, zoals gedeponeerd door de onderzoekers, worden in het oorspronkelijke (native) formaat opgeslagen. Daarnaast voert de archiefinstelling een (éénmalige) conversie uit naar een archiefformaat dat (inter)nationaal een (uitwisselings)standaard vormt. Eventueel kan dan vanuit de oorspronkelijke bestanden, bij toekomstige of verbeterde inzichten, een nieuwe conversie worden uitgevoerd.
1.3 Blijvende toegankelijkheid Archivering is nooit een doel op zich. Het duurzaam opslaan van de digitale bestanden van een archeologisch onderzoek heeft alleen zin als andere archeologen weer toegang tot de bestanden kunnen krijgen en die informatie kunnen hergebruiken voor hun eigen onderzoek. Het toegankelijk maken en houden van archeologische gegevens moet daarom de belangrijkste doelstelling zijn van een digitaal (data)archief. De technische infrastructuur voor het verspreiden van digitale gegevens is met het internet (World-Wide-Web) tegenwoordig geen probleem meer. Toch zijn er twee aspecten die daarbij niet onvermeld kunnen blijven. Ten eerste de hoge dynamiek van het WWW,
Doelstellingen en uitgangspunten van digitale duurzaamheid
die zorgt voor het komen en gaan van (grote aantallen) websites. Beheerders van webportals hebben een dagtaak aan het bijhouden van de (veranderende) webadressen in de hyperlinks. Dit staat in schril contrast met de manier waarop in het wetenschappelijk verkeer verwijzingen naar gebruikte bronnen wordt toegepast. De bronnen worden eenduidig, veelal in een strikt gestructureerde literatuurlijst, vermeld. Een dergelijke vermelding geeft aan waar een andere onderzoeker de bron opnieuw kan vinden, raadplegen en de getrokken conclusies kan verifiëren. Het onderzoek wordt daarmee herhaalbaar en toetsbaar gemaakt. Een verwijzing naar een document op een (inmiddels verdwenen) http-adres voldoet niet aan die vereiste. Digitale bronnen over archeologisch onderzoek kunnen wel via het WWW worden verspreid, maar het web-adres (de URL) moet altijd hetzelfde blijven. Ongeacht welke organisatie het betreft of op welke server de gegevens staan, een archeoloog moet een zogenaamde persistent URL kunnen gebruiken voor de verwijzing. Hoewel de leesbaarheid (herkenbaarheid) daar wellicht onder lijdt, zoals uit een voorbeeld van de UB Leiden http://hdl.handle.net/1887/593 mag blijken, is dit adres voor altijd gereserveerd voor deze digitale resource (bron). Een tweede aspect is de vindbaarheid van een digitale bron op het internet (resources). Daarbij spelen opnieuw de metadata een belangrijke rol. Een uniforme inhoudelijke beschrijving van een onderzoeksproject is de basis waarop (gespecialiseerde) zoeksystemen een gerichte ontsluiting van de archeologische bronnen kunnen aanbieden. Het zoeken in de vorm van “vrije tekst”, zoals dat nu via de vele zoekmachines op het WWW wordt aangeboden, is in dit opzicht te vrijblijvend. Alle projecten (en bestanden) moeten gestructureerd beschreven worden. Internationaal vormt de zogenaamde Dublin Core een metadata-schema dat een gerichte resource discovery mogelijk maakt. Het is een eenvoudig toe te passen beschrijving in een relatief beperkt aantal elementen. Zelfs specifiek archeologische kenmerken waarop vindplaatsen teruggezocht moeten kunnen worden – zoals datering, ligging en type – kunnen daarin worden vastgelegd. Beide elementen, de vindbaarheid op basis van Dublin Core en de permanente toegang door de persistent URL, vormen een voorwaarde voor een duurzaam digitaal archief. Alleen dan kan de ontsluiting van digitale archeologische documentatie een stabiele rol spelen in de (wetenschappelijke) archeologie. Vanuit de hierboven genoemde uitgangspunten en ideeën over de duurzame digitale archivering en ontsluiting heeft er een concrete uitwerking plaatsgevonden voor het elektronische depot voor de Nederlandse archeologie (EDNA). De manier van deponeren, opslaan en hergebruiken is vanuit deze visie vormgegeven. Er zijn concrete rechten en plichten opgesteld voor deponeerders en hergebruikers, in de vorm van aanleverprocedures en licentieovereenkomsten. Maar ook de taken en verantwoordelijkheden die het digitale archief op zich neemt en de dienstverlening die de gebruikers mogen verwachten, zullen in de volgende hoofdstukken worden verwoord.
17
18
Wegwijzer Digitaal Deponeren – Archeologie
Het organisatorische en financiële kader van het e-depot
19
20
Wegwijzer Digitaal Deponeren – Archeologie
Het organisatorische en financiële kader van het e-depot
–2– Het organisatorische en financiële kader van het e-depot
2.1 Verschillende organisaties, verschillende taken Deze gids richt zich op het archiveren van digitale documentatie van archeologisch (veld) onderzoek. Die digitale datasets staan natuurlijk niet op zich en vormen samen met de vondsten, analoge documentatie en de rapportage(s) de complete output van een archeologisch onderzoek. Het deponeren van digitale documentatie vindt dan ook plaats binnen de kaders van de archeologische monumentenzorg (AMZ) en/of het wetenschappelijk onderzoek en onderwijs. Het e-depot is zeker niet de enige belanghebbende op dit terrein. Er lijkt voor het elektronisch depot wel een duidelijk afgebakende rol weggelegd, maar in nauwe samenhang met de KNA (SIKB/ erfgoedinspectie), RACM, commerciële archeologische bedrijven en de (provinciale) depots. Een digitaal archief is een onderdeel van een groter archeologisch geheel. Archeologisch onderzoek in Nederland laat zich in een aantal opeenvolgende stappen onderverdelen. Deze stappen, zoals beschreven in de KNA, vormen de basis voor een zorgvuldige afweging van archeologische waarden bij ingrepen in de bodem. De volgende stappen vormen samen het archeologische proces: • bureauonderzoek (BO), waarbij op basis van bestaande informatiebronnen (Archis, kaarten, archieven, luchtfoto’s) een eerste inventarisatie wordt gemaakt van de archeologische waarden in en om het bedreigde gebied. • inventariserend veldonderzoek (IVO), dat zowel niet-gravend (ND, non-destructief: door middel van boringen, veldverkenningen of geofysische metingen) als gravend (P, proefsleuven) kan worden uitgevoerd. • opgraving (DO, definitief onderzoek) Bij elke stap worden de eventuele archeologische waarden nauwkeuriger vastgesteld. De verkenning (vaststelling van de archeologische locaties), kartering (vaststelling van de omvang) en waardering (vaststelling van de aard en ouderdom) leveren een steeds beter beeld op van datgene dat in de (onder)grond aanwezig is. Telkens vindt er een besluitvorming plaats, waarbij er een keuze gemaakt wordt om het terrein vrij te geven voor bebouwing of dat er nader onderzoek noodzakelijk is. De uiteindelijke, definitieve opgraving (DO) is daarvan de laatste stap. De onderzoeksresultaten en het selectieadvies worden bij elke fase in een rapportage vastgelegd. De uitvoerende partij doet hierin een aanbeveling, maar
21
22
Wegwijzer Digitaal Deponeren – Archeologie
het bevoegd gezag, veelal de betrokken overheid (gemeente, provincie, RACM) neemt het uiteindelijke selectiebesluit. Bij elk van de hier genoemde stappen worden er gegevens verzameld, verwerkt en geïnterpreteerd. De werkwijze, resultaten en conclusies worden beschreven in een rapport. Zowel de rapportage als de gegevens die daaraan ten grondslag liggen, zijn een belangrijke bron van informatie voor andere archeologen. Voor diegenen die in één van de daarop volgende stappen van het AMZ-traject werkzaam zijn, maar zeker ook voor het wetenschappelijk onderzoek. De resultaten van elke stap zouden, in ieder geval op termijn, beschikbaar moeten komen aan de Nederlandse archeologen. Dit geldt dus ook voor de onderliggende onderzoeksgegevens. Bij elk archeologisch veldonderzoek worden nieuwe gegevens verzameld en gedocumenteerd. Dit kan in de vorm van papieren formulieren en kaarten geschieden, maar in toenemende mate ook (direct) in digitale vorm. Die documentatie vormt bij een gravend inventariserend veldonderzoek (IVO-P) en een opgraving (DO) zelfs het enige en unieke bronnenmateriaal dat na afloop van het onderzoek van dat deel van de vindplaats over is. Ook een niet-gravend inventariserend veldonderzoek (IVO-ND) levert nieuwe gegevens op en zelfs een bureauonderzoek (BO) kan bestaande gegevens op een dusdanige manier bij elkaar brengen dat die producten zinvolle startpunten vormen voor toekomstig onderzoek. Tot voor kort waren in de KNA de volgende verplichtingen opgenomen voor IVO en DO: • het onderzoek vooraf registreren bij Archis (onderzoeksmelding) • de onderzoeksbevindingen na afloop melden bij Archis • de rapportage deponeren bij het bevoegd gezag en de RACM • de vondsten en documentatie deponeren bij een gemeentelijk of provinciaal depot. Die praktijk was sterk gebaseerd op papieren rapportage en documentatie (formulieren, veldtekeningen en foto’s). Nu veel documentatie (ook) in digitale vorm bestaat, is er een nieuwe situatie ontstaan, waarin de traditionele taakverdeling opnieuw zal moeten worden bezien. Formeel ligt de verantwoordelijkheid voor de archivering van de digitale documentatie bij de provinciale en gemeentelijke depots. De technische kennis en faciliteiten om duurzaam digitale documenten te kunnen bewaren, zijn echter minder eenvoudig dan het op het eerste gezicht lijkt. Daar is veel meer voor nodig dan een cd-rom in een archief- of brandkast leggen. In de praktijk betekent dit dan ook dat veel digitale gegevens niet duurzaam opgeslagen worden. In Engeland bestaat er al tien jaar een gespecialiseerde instelling als de Archaeology Data Service (ADS). Met de oprichting van het nationale data archief voor de alfa- en gammawetenschappen DANS door NWO en de KNAW, is er een mogelijkheid ontstaan om voor Nederlandse archeologie deze situatie te verbeteren. Op basis van de nieuwe behoeften en mogelijkheden is er een taakverdeling afgesproken tussen de betrokken partijen. Een taakverdeling die de specifieke mogelijkheden en expertise van de afzonderlijke organisaties zo goed mogelijk tot zijn recht moet laten komen. De RACM beheert met de Archis database een belangrijke index van archeologische onderzoeken en vindplaatsen. De bibliotheek van de RACM heeft een groot deel van alle analoge rapporten van het Malta-onderzoek. De vondsten en analoge documentatie worden, volgens de wettelijke afspraken, in de provinciale en gemeentelijke depots duurzaam opgeslagen.
Het organisatorische en financiële kader van het e-depot
Daar worden nu twee, voor de archeologie nieuwe, organisaties aan toegevoegd op basis van hun specifieke expertise op het terrein van digitale duurzaamheid. Enerzijds is dit de Koninklijke Bibliotheek (KB) met de faciliteiten en kennis voor het duurzaam archiveren van digitale publicaties. Anderzijds is dat DANS voor de duurzame archivering van digitale gegevensbestanden (datasets) van een archeologisch onderzoek. Toch verdient het de voorkeur om zo veel mogelijk te voorkomen dat archeologische instellingen en bedrijven met meer “loketten” te maken krijgen op het moment waarop vondsten, rapporten en documentatie gedeponeerd moeten worden. Als uitgangspunt is gekozen de RACM het loket te laten vormen voor alle publicaties. De digitale publicatie (pdf-document van het rapport) kan, samen met het analoge rapport, worden aangeleverd bij het Archis-meldpunt. De RACM slaat de digitale publicaties op in het eigen document management systeem (momenteel Livelink) en maakt deze toegankelijk via Archis. De RACM kan ook fungeren als intermediair voor de KB en kan er periodiek voor zorgen dat de pdf-documenten (met de juiste metagegevens) bij de KB terecht komen voor duurzame opslag. Bij de RACM worden in Archis ook de onderzoeksresultaten, in samengevatte vorm, vastgelegd. De digitale gegevensbestanden (datasets) worden bij DANS gedeponeerd. Daarbij maakt het e-depot gebruik van het online archiveringssysteem EASY van DANS. Bestanden kunnen ook per post op een digitale gegevensdrager of per e-mail worden aangeleverd. De vondsten en analoge documentatie gaan, zoals gebruikelijk, naar de provinciale of gemeentelijke depots.
2.2 Onderlinge samenhang: een virtuele eenheid Door de vondsten, publicaties en opgravingsdocumentatie (analoog en digitaal) te verdelen over tal van organisaties lijkt de “eenheid van vondsten en documentatie” verloren te gaan. Voor een deel is dit momenteel al het geval, maar de versnippering lijkt alleen maar toe te nemen. Dankzij de digitale infrastructuur is dat minder erg dan het op het eerste gezicht lijkt. Door te documenteren welke bronnen (resources), over welke vindplaatsen, bij welke archiefinstellingen zijn gearchiveerd, is een elektronische koppeling mogelijk. De betrokken instellingen zullen daartoe gaan samenwerken en informatie uitwisselen. Vanuit Archis kan dan direct doorgeklikt worden naar de bijbehorende publicatie in Livelink en vanuit een dataset bij DANS kan (na inloggen) direct de Archis onderzoeksmelding worden ingezien. De eenheid van vondsten en documentatie kan op deze manier “virtueel” worden gerealiseerd.
23
24
Wegwijzer Digitaal Deponeren – Archeologie
KB RACM bibliotheek
Archis
Network Service
DANS
Provinciale depots Gemeentelijke depots
In een gezamenlijke inspanning zal er de komende jaren naar worden gestreefd om tot een volledig geïntegreerde informatiestructuur te komen. Archis vormt een samenvatting van het archeologisch onderzoek, monumenten en vindplaatsen in Nederland. De bibliotheek van de RACM heeft een zo compleet mogelijk overzicht van alle analoge rapporten van (Malta-)onderzoek. De digitale versie van diezelfde rapporten zijn bij de RACM en de KB gearchiveerd en on-line toegankelijk. De fysieke vondsten en de analoge documentatie van archeologisch onderzoek worden uiteindelijk gedeponeerd bij een provinciaal of gemeentelijk depot. De digitale documentatie wordt bij DANS gearchiveerd en ontsloten. Bij het e-depot zal die virtuele eenheid van vondsten en documentatie op de volgende wijze worden ingevuld. Voor elke dataset die gearchiveerd wordt, zullen gerelateerde bronnen, die zich elders bevinden maar over dezelfde vindplaats gaan, direct aanklikbaar worden gepresenteerd. Daarbij kan worden gedacht aan links naar Archis waarnemingen, monumenten of onderzoeken, naar een publicatie in Livelink of in één van de universiteitsbibliotheken (DARE). Dit geschiedt op basis van de gegevens die de deponeerder aanlevert of eenvoudig kunnen worden opgezocht. DANS stelt de beheerders van archeologische informatie electronisch op de hoogte, op het moment dat een nieuwe dataset is gearchiveerd en toegankelijk is gemaakt. Als service aan de andere beheerders zullen, in overleg, index-pagina’s kunnen worden samengesteld. Daarbij kan bijvoorbeeld aan een (web)pagina worden gedacht waarop alle datasets uit één provincie bij elkaar staan, zodat daar direct vanaf de provinciale website naar verwezen kan worden. Ook zal, via een protocol als OAI of SOAP, metadata ter beschikking worden gesteld aan de beheerders van andere repositories of service providers. Iedere organisatie houdt in dit model haar eigen taak en brengt als het ware haar eigen faciliteiten en kennis in. Een samenwerking die onder het motto van “gedeelde expertise en gezamenlijke verantwoordelijkheid”, tot een archivering en ontsluiting van de archeologische gegevens moet leiden die veel beter is dan één organisatie alleen zou kunnen bewerkstelligen.
Het organisatorische en financiële kader van het e-depot
2.3 Toekomstvisie: een model voor het e-depot op de lange termijn Vanzelfsprekend is het belangrijk om ook over de organisatorische inbedding en de bekostiging van deze nieuwe diensten op de lange termijn na te denken. Dat is geen eenvoudige zaak, omdat een dergelijke structurele inbedding commitment en structurele budgettering van de organisatie(s) vraagt. Vragen die nu gesteld kunnen worden zijn bijvoorbeeld ‘wie neemt nu het voortouw’, en ‘waar ligt over vijf of tien jaar de verantwoordelijkheid’ Daarnaast zijn er vragen als ‘waar worden de kosten neergelegd’ en ‘welke dienstverlening moet daar tegenover staan’ Op nog lang niet alle vragen is er een antwoord, maar er zijn wel vast een aantal duidelijke uitgangspunten te geven. De (rijks)overheid heeft bij het schrijven van deze gids aangegeven mee te willen werken aan een elektronisch depot voor de Nederlandse archeologie. Echter van concrete en structurele (financiële)middelen is nog geen sprake. Via allerlei wegen wordt getracht het ministerie van Onderwijs, Cultuur & Wetenschap van het belang van het conserveren van dit unieke, digitale culturele erfgoed te overtuigen. Voorlopig wordt het echter aan het archeologische veld zelf overgelaten om tot een goede oplossing te komen en moet dit in goede overeenstemming gebeuren tussen de bedrijven, de wetenschap en de overheid. Tegelijkertijd wordt, via tal van subsidiegevers en –regelingen, getracht projectsubsidies te verwerven. Deze zijn echter altijd voor een beperkte periode en bieden met name financiële ruimte voor de ontwikkeling van specifieke (nieuwe) onderdelen. Digitale duurzaamheid is echter een zaak van de lange adem en structurele financiering. Omdat alle bovengenoemde partijen het belang van de zorg voor de digitale gegevens en de digitale duurzaamheid onderschrijven, is het zaak de continuïteit in het opgezette systeem te waarborgen. Aangezien het tot nu toe aan structurele financiële middelen ontbreekt, wordt hieronder een voorstel beschreven. Het hierbij genoemde voorstel voor een kostenmodel is vanuit het perspectief van DANS berekend.
2.4 Een voorstel kostenmodel e-depot Dit model is gebaseerd op twee aspecten. Enerzijds gaan we gebruik maken van bestaande, door de overheid gefinancierde, voorzieningen voor de duurzame opslag van digitale bestanden. In Nederland kennen we de Koninklijke Bibliotheek (KB) die een internationale voortrekkersrol vervult bij het duurzaam archiveren van digitale publicaties (pdf-documenten). Daarnaast is in 2005 de instelling DANS (Data Archiving & Networked Services) opgericht. DANS is ontstaan uit een fusie van een aantal data archieven van NWO, CBS en de KNAW en richt zich op de blijvende toegankelijkheid van onderzoeksdata in de alfa- en gammawetenschappen. DANS biedt de expertise en (technische) faciliteiten, waarmee het archeologisch data-archief van start is gegaan. Zowel de KB als DANS staan ervoor garant dat de gedeponeerde publicaties en datasets, tot in lengte van dagen, beschikbaar en toegankelijk blijven. Die zorg wordt ons door experts uit handen genomen. De RACM onderhoudt een nationale (geografische) database van archeologische onderzoeken, waarnemingen en monumenten: Archis. Aan Archis is een ‘Document:
25
26
Wegwijzer Digitaal Deponeren – Archeologie
Management Systeem’ (momenteel Livelink) gekoppeld, waarin achterliggende informatie (digitale documenten) zijn opgeslagen en opgevraagd kunnen worden. Naast deze reeds bestaande en door de overheid bekostigde systemen, lijkt het in de toekomst noodzakelijk dat ook de archeologen financieel moeten bijdragen aan het digitale archiveren. De digitale publicaties en datasets zullen bij het deponeren moeten worden verwerkt, geconverteerd en gearchiveerd. Die werkzaamheden zijn, zeker als de deponeerder zelf het nodige voorwerk heeft kunnen doen, beperkt van omvang. Desondanks blijven ze noodzakelijk. DANS, de KB en de RACM leveren daar, in de vorm van mankracht en faciliteiten, ook al een bijdrage aan. De duurzame digitale archivering zal echter niet zonder een bijdrage uit het archeologische veld kunnen draaien. Uitgangspunt daarbij is dat de digitale archivering alleen kostendekkend, non-profit, hoeft te zijn. Een eerste voorbeeld voor een kostenmodel is dat wat in Engeland bij de Archaeology Data Service (ADS) wordt gehanteerd. Deze rekent éénmalige deponeringsleges; op het moment van deponeren worden als het ware de kosten voor de duurzame archivering voor de lange termijn in één keer ‘afgekocht’. De hoogte van de deponeringsleges wordt daar berekend op basis van het aantal (verschillende) bestanden en de totale omvang (in kilobytes) van de gedeponeerde dataset. Er is berekend dat dit gemiddeld op 2 à 3% van de totale projectkosten neerkomt. Een dergelijk kostenmodel vinden wij voor de Nederlandse situatie minder geschikt. Daarvoor zijn twee redenen te noemen: • een kostenberekening op basis van het aantal bestanden of de omvang in Kb zal er toe kunnen leiden dat er bij voorkeur zo weinig mogelijk bestanden zullen worden gedeponeerd. De verleiding zou dan groot zijn om dan maar niet die honderden losse GISbestanden van MapInfo of al die digitale veldfoto’s van 2 à 3 MB te deponeren. Daarmee zou het doel, zoveel mogelijk bestanden bewaren en toegankelijk houden, weer volledig te niet worden gedaan. • De kosten voor de digitale archivering zouden pas achteraf kunnen worden bepaald, als alle definitieve bestanden zijn opgesteld. Terwijl het eigenlijk al vooraf, bij de offerte, duidelijk moet zijn welke kosten er aan het eind nog nodig zijn voor de deponering. De kosten moeten voor alle uitvoerders en onderzoeken gelijk zijn en vooraf bekend. Er zou op basis van bovenstaande overwegingen gekozen kunnen worden voor een kostenmodel, waarin voor elk project een vast tarief geldt, dat vooraf bekend is en geldt ongeacht het aantal bestanden of de totale omvang van de gedeponeerde dataset. Toch lijkt een gedifferentieerd kostenmodel wel noodzakelijk. Een grote opgraving zal veel meer digitale documentatie opleveren dan een inventariserend veldonderzoek. Voor datasets van inventariserend veldonderzoek (niet-gravend en gravend) moet een ander tarief gaan gelden dan voor definitief archeologisch onderzoek.
Het organisatorische en financiële kader van het e-depot
Ter verduidelijking en ter indicatie wordt hieronder een voorstel gegeven van de kosten waaraan momenteel gedacht kan worden. Deze raming is gebaseerd op de directe personele kosten, die gemaakt worden bij de primaire verwerking. Bij het streven om de digitale archivering op non-profit basis te laten functioneren, moet dan gedacht worden aan: • Kleine dataset: ongeveer € 400,= per onderzoeksproject Inventariserend veldonderzoek (niet-gravend; gravend), bureauonderzoek, archeologische begeleiding, specialistisch onderzoek. • Grote dataset: ongeveer € 800,= per onderzoeksproject Definitief archeologisch onderzoek (integrale opgravingsdocumentatie) Deze kosten zijn feitelijk eenmalige legeskosten, die bij deponering worden berekend om de afhandeling van de digitale informatie mogelijk te maken. Nu de verplichting tot deponeren pas kort in de KNA 3.1 is opgenomen, bestaat er nog een overgangssituatie. Alle datasets kunnen voorlopig nog volledig kosteloos worden gedeponeerd, een regeling die zeker nog even zal blijven bestaan. Dat geeft ons de tijd om te ervaren of de voor- en nadelen van een e-depot, zowel voor deponeerders als hergebruikers, tegen elkaar opwegen. Als die afweging positief uitvalt, is dat een extra overweging voor een mogelijk gezamenlijk financieringsmodel. Commerciële archeologische bedrijven kunnen en mogen de kosten voor de digitale deponering doorberekenen aan de opdrachtgever. In het voorgestelde kostenmodel zijn de tarieven vooraf bekend en voor alle bedrijven gelijk, zodat er geen concurrentieverschillen kunnen ontstaan. Voor academisch onderzoek van studenten, promovendi en onderzoekers ligt dit echter moeilijker. Er is veelal geen sprake van opdrachtgevers of een PvE, waarin is afgesproken welke documentatie digitaal zal worden vastgelegd. Universitair onderzoek dat via NWO of de KNAW wordt bekostigd zal een deponeringsparagraaf gaan bevatten. Daarin zal ook aan deze onderzoeker(s) de verplichting worden opgelegd de digitale onderzoeksresultaten bij een digitaal archief te deponeren. In overleg met de subsidiegevers wordt aan een gelijkwaardige legesregeling gewerkt. Ongeacht of het deponeren van datasets in de toekomst geld gaat kosten, is de vraag gerechtvaardigd wat de voordelen van een digitaal depot zijn. Allereerst zorgt het e-depot voor het duurzaam bewaren van de gegevensbestanden, die met veel investeringen zijn samengesteld. Een ander pluspunt is dat er voor alle onderzoeksprojecten een extra ‘etalage’ wordt gecreëerd. Als voorpagina van elk projectarchief wordt er een zogenaamde jump-off (start) pagina samengesteld (zie voorbeeld ACVU-HBS). Dit is een webpagina waarvoor de inhoud door het betreffende bedrijf, de organisatie of persoon kan worden aangeleverd, inclusief (bedrijfs)logo’s. De jump-off page staat altijd op een vaste URL en zal, bijvoorbeeld door zoekmachines, worden getoond als een gebruiker digitale informatie zoekt. Daarnaast stelt het e-depot van alle door een organisatie of bedrijf gedeponeerde datasets en publicaties een specifieke webpagina samen (bedrijven index).
27
28
Wegwijzer Digitaal Deponeren – Archeologie
Betalen voor hergebruik van de data vormt geen onderdeel van het kostenmodel. Hiervoor is bewust gekozen, het doel van het duurzaam archiveren van digitale gegevensbestanden is het kunnen hergebruiken van alle beschikbare archeologische informatie, bij elk toekomstig onderzoek. In de visie van het e-depot voor de Nederlandse archeologie zou er geen enkele drempel moeten bestaan om de bestaande gegevens te (kunnen) gebruiken en zeker geen financiële. Alle inspanningen die bij het archiveren worden geleverd, renderen alleen als alle archeologen eenvoudig en kosteloos toegang hebben. Dat is wellicht ongebruikelijk in een wereld waar doorgaans voor producten of informatie moet worden betaald, maar niettemin zeer goed verdedigbaar. Stel dat een archeologisch bedrijf een nieuw archeologisch onderzoek gaat uitvoeren en niet de kosten wil of kan maken om alle beschikbare, bestaande archeologische gegevens te kopen. De besluitvorming over ons unieke culturele erfgoed zou dan gebaseerd worden op onvolledige informatie – een situatie waar we niet naar willen streven en die momenteel ook niet bestaat. Het hier geformuleerde kostenmodel gaat uit van een gezamenlijke inspanning in tijd en geld. Samen kunnen we een faciliteit voor de Nederlandse archeologie creëren die ons op termijn heel veel (onderzoeks)mogelijkheden zal opleveren.
Auteursrechten, copyright en het e-depot
29
30
Wegwijzer Digitaal Deponeren – Archeologie
Auteursrechten, copyright en het e-depot
–3– Auteursrechten, copyright en het e-depot
Het uitgangspunt van de Auteurswet is enerzijds dat de maker van een werk moet worden beschermd, zodat deze zijn/haar inspanning op enigerlei wijze te gelde kan maken of er de intellectuele of wetenschappelijke credits voor kan krijgen. Anderzijds beoogt de Auteurswet ook de vrijheid van informatietoegang en -uitwisseling te bevorderen. Het auteursrecht omvat twee aspecten: • het exploitatierecht – Het exploitatierecht schenkt de maker van een oorspronkelijk werk het exclusieve recht om zijn/haar werk zelf openbaar te maken (naar buiten te brengen; te verspreiden) en te verveelvoudigen (kopiëren, drukken). Het bewerken of vertalen van een werk is ook een vorm van verveelvoudiging. Het exploitatierecht kan worden overgedragen of in licentie worden gegeven aan een andere persoon of organisatie. • het persoonlijkheidsrecht – Het persoonlijkheidsrecht is nauw verbonden met de persoon van de maker zelf. Het geeft de auteur het recht om verspreiding van zijn werk, onder een andere naam, zonder bronvermelding tegen te houden. Ook ingrijpende aanpassingen van een werk die zijn/haar goede naam zouden aantasten kunnen worden geblokkeerd. Het persoonlijkheidsrecht is niet overdraagbaar. De auteurswet, stammend uit 1912, is bij de laatste herziening in 2004 aangepast aan de huidige mogelijkheden van de digitale informatievoorziening. Er is nu onder andere opgenomen dat een verzameling van gegevens, systematisch of methodisch geordend, ook als een oorspronkelijk werk wordt aangemerkt (de “Databankenwet”). De bekendmaking langs elektronische weg, zoals het toegankelijk maken van een artikel op een computer of in een open of besloten netwerk wordt gezien als openbaarmaking en het kopiëren van digitale bestanden wordt als verveelvoudiging beschouwd. Een auteur kan, zoals vermeld, het exploitatierecht overdragen aan een andere (rechts) persoon. Een bekend voorbeeld is het overdragen van het copyright aan een uitgever. Hiermee geeft de auteur de uitgever het recht zijn/haar werk in de vorm van een artikel of boek te verveelvoudigen en openbaar te maken. De uitgever draagt de financiële risico’s en mag (het grootste deel van) het eventuele geldelijke gewin behouden. De auteur mag meestal hetzelfde werk niet ook op een andere manier (bij een andere uitgever of via een ander medium) exploiteren. De auteur heeft daartoe schriftelijk afstand gedaan van zijn overdraagbare gedeelte van het auteursrecht. Het in licentie geven is niets anders dan het verlenen van toestemming van een auteur aan een andere (rechts)persoon om bepaalde handelingen die vallen onder het auteursrecht uit te mogen voeren. Anders dan bij overdracht behoudt de maker bij een licentie het auteursrecht. Het verschil tussen overdracht en een licentie is vergelijkbaar met het ver-
31
32
Wegwijzer Digitaal Deponeren – Archeologie
schil tussen het verkopen en verhuren van een huis. Bij verkoop is er een nieuwe eigenaar, terwijl bij verhuur iemand alleen toestemming heeft om het huis te gebruiken. Om te zorgen dat informatie verspreid kan worden, beschrijft de Auteurswet een aantal uitzonderingen waarin de auteur beperkt wordt in zijn auteursrechten (de zogenaamde wettelijke beperkingen). In die gevallen mag het werk zelfs zonder toestemming van de maker worden gebruikt of verspreid. Het gaat daarbij om: • het gebruik voor wetenschappelijk onderzoek of onderwijs • het kopiëren voor eigen gebruik, oefening of studie • het door middel van een besloten netwerk beschikbaar stellen aan een groep bekende gebruikers • het verveelvoudigen van het werk met als doel het werk raadpleegbaar te houden, als het werk dreigt te vervallen of als de technologie in onbruik raakt (preserveringskopie) Op basis van bovenstaande informatie is voor het e-depot een visie ontwikkeld over de manier waarop er met de auteursrechtelijke aspecten omgegaan wordt. Uitgangspunt daarbij is dat de auteursrechthebbende zijn rechten niet hoeft over te dragen aan het edepot. Er is alleen sprake van een licentie, die het e-depot het recht geeft de gedeponeerde bestanden te mogen verspreiden. De auteur blijft volledig eigenaar van de gedeponeerde bestanden en mag ten allen tijde besluiten om dezelfde informatie ook via andere media te verveelvoudigen of openbaar te maken. Het e-depot verkrijgt alleen een non-exclusieve licentie om de bestanden te mogen archiveren en verspreiden. In het e-depot kunnen zowel publicaties als datasets worden opgenomen. Dat onderscheid zal hieronder worden aangehouden, om een helder beeld te kunnen schetsen.
3.1 Publicaties Archeologische publicaties worden soms uitgegeven door een externe (commerciële) uitgever. Het is afhankelijk van de schriftelijke afspraken die de auteur heeft gemaakt met de uitgever of hetzelfde document ook via elektronische weg mag worden verspreid. Maar zelfs als het copyright volledig is overgedragen, is het op basis van de wettelijke beperkingen toegestaan om de informatie voor wetenschappelijk onderzoek en onderwijs te archiveren en ontsluiten. Het e-depot mag dat document binnen de groep van Nederlandse archeologen beschikbaar stellen, bijvoorbeeld door het op een afgeschermde website te plaatsen (download) of een kopie ervan te verstrekken via een ander digitaal medium (bijv. op cd-rom). De digitale kopieën zijn echter uitsluitend bestemd voor eigen gebruik, studie of onderzoek. Bij publicaties die worden uitgegeven door de onderzoeksinstelling zelf, gaat het veelal om eigen publicatiereeksen (bijv. RAM, ASLU, ZAR) of om interne rapporten in een beperkte oplage (grijze literatuur). Doel van het produceren van deze publicaties is veelal niet de commerciële winst uit de verkoop van de uitgave. Het gaat primair om het vastleggen van de onderzoeksresultaten. Men is gebaat bij een zo groot mogelijke verspreiding van de bedrijfsproducten, zij het dat dit wel kostendekkend moet geschieden. Tegenwoordig worden veel rapporten daarom ook in elektronische vorm (pdf-documenten) via de
Auteursrechten, copyright en het e-depot
bedrijfswebsites beschikbaar gesteld. Het aanbieden van die rapporten via een repository (zoals bij de RACM of het e-depot) zal een extra etalage creëren en kunnen bijdragen aan een verdere beschikbaarheid van de archeologische onderzoeksresultaten en naamsbekendheid van de onderzoeksorganisatie.
3.2 Rapporten in opdracht Een specifieke auteursrechtelijke situatie lijkt zich voor te doen wanneer een gemeente of de Nederlandse Spoorwegen opdracht geeft tot een archeologisch onderzoek. Dit onderzoek wordt, tegen betaling, uitgevoerd door één van de archeologische onderzoeksbureaus die verbonden is aan een universiteit of zelfstandig gevestigd is. De vraag is dan bij wie het auteursrecht berust? Door de verlening van de opdracht tot een archeologisch onderzoek wordt er door een gemeente arbeidstijd, faciliteiten en expertise ingekocht. Expertise van het onderzoeksbureau die over een langere tijd en deels door eigen investeringen is opgebouwd en veel verder reikt dan de specifieke opdracht. De onderzoeker(s) treden daarbij niet in dienst bij de gemeente. De gemeente geeft ook niet een opdracht tot het vervaardigen van een specifiek product naar een door de gemeente exact voorgeschreven productontwerp. Dit maakt dat het rapport van een archeologisch onderzoek een uniek (literair) werk is, waarvan de auteur wordt beschouwd als de maker. De maker is in principe ook de auteursrechthebbende. Indien de maker in dienstverband werkzaam is bij een onderzoeksbureau zal deze werkgever veelal de auteursrechthebbende zijn; alleen bij meeste universiteiten houdt de onderzoeker zelf de auteursrechten. De gemeente bezit dus geen auteursrechten, tenzij anders in het onderzoekscontract schriftelijk is vastgelegd. De auteursrechthebbende heeft, zoals vermeld, het exclusieve recht het werk openbaar te maken of te verveelvoudigen, dus ook om een digitale versie van het rapport in een online informatiesysteem (Archis, Livelink of een andere publicatie repository) op te laten nemen. Bovenstaande situatie geldt als er geen nadere schriftelijke afspraken zijn gemaakt. Het is aan te bevelen om met een opdrachtgever wel expliciete afspraken te maken, bijvoorbeeld in het contract of de algemene voorwaarden van het onderzoeksbureau. Daarin kan schriftelijk worden geregeld dat de opdrachtgever ook of uitsluitend het recht op publicatie heeft of dat er een geheimhoudingsplicht voor de opdrachtnemer geldt (exclusiviteit). Twee voorbeelden van formuleringen uit bestaande algemene voorwaarden van (wetenschappelijke) onderzoeksbureaus illustreren de breedte van de mogelijkheden: • Zolang er geen nadere schriftelijke overeenkomst tussen opdrachtnemer en de opdrachtgever wordt aangegaan met betrekking tot de overdracht van het auteursrecht …, blijven deze rechten bij de opdrachtnemer. • Uitsluitend de opdrachtnemer en de opdrachtgever zijn gerechtigd tot het openbaar maken van de uit het onderzoek verkregen inzichten en resultaten. Binnen de universiteit mogen de uitkomsten van het onderzoek gebruikt worden in onderwijs en onderzoek. De inhoud van het onderzoeksrapport en de publicatie zijn het intellectuele eigendom van de (student-)onderzoeker(s). De opdrachtnemer en de opdrachtgever hebben het recht het
33
34
Wegwijzer Digitaal Deponeren – Archeologie
onderzoeksrapport en de publicatie in onbeperkte oplage in papieren of digitale vorm te vermenigvuldigen en verspreiden. In de algemene voorwaarden van een archeologisch onderzoeksbureau zou standaard een bepaling kunnen worden opgenomen dat het conform de KNA of de nieuwe vergunningverlening verplicht is om de publicatie (ook) digitaal aan te leveren aan een publicatie repository. De publicatie wordt daarmee beschikbaar gesteld aan een groep van geregistreerde archeologische gebruikers die de informatie voor het eigen archeologische onderwijs en onderzoek mogen gebruiken, maar niet verder mogen verspreiden of commercieel uitbaten. Op die manier wordt voorkomen dat er onduidelijkheid over het copyright ontstaat en archeologische informatie niet beschikbaar is voor verder archeologisch onderzoek of de reconstructie van ons verleden. Desondanks mogen opdrachtgevers natuurlijk beperkingen vastleggen in het contract ten aanzien van het openbaar maken van het rapport van het onderzoek dat in hun opdracht is uitgevoerd en gefinancierd. Een rapport dat de archeologische waarden van een nog te bebouwen deel van de gemeente beschrijft zou bijvoorbeeld bij de grondverwerving of bij maatschappelijke discussies een ongewenste rol kunnen spelen. De archeologische rapporten in het e-depot worden in principe niet vrij beschikbaar gesteld aan iedereen, maar zijn slechts toegankelijk voor de Nederlandse archeologen die de betreffende informatie nodig hebben. In specifieke situaties kan voor de rapporten toch een tijdelijk embargo worden afgesproken. Op termijn zou deze informatie echter altijd beschikbaar moeten komen voor het archeologisch onderzoek en het beheer van het culturele erfgoed.
3.3 Datasets De digitale gegevensbestanden (datasets) die ten grondslag liggen aan de publicaties, worden veelal niet afzonderlijk gepubliceerd. Binnen de archeologische wetenschap bestaat er al een lange traditie in het toevoegen van de brongegevens aan een publicatie in de vorm van bijlagen, catalogi, microfiches, diskettes of cd-roms. Veel commerciële uitgevers staan niet bepaald te trappelen om dergelijke omvangrijke bronpublicaties uit te geven. In de elektronische tijdschriften, zoals Internet Archaeology, zien we juist dat alle brongegevens en alle documentaire foto’s wel worden opgenomen. Het aantal pagina’s is immers ongelimiteerd en kleurenafbeeldingen kunnen zonder extra kosten worden opgenomen. Hiermee wordt andere onderzoekers de mogelijkheid geboden de onderzoeksresultaten te toetsen of voort te bouwen op de bestaande gegevens. Commerciële aspecten spelen dus bij datasets een kleine rol. Daar staat echter tegenover dat het intellectueel eigendom in de overwegingen wel degelijk meespeelt en beschermd is in de databankenwet van juli 1999. Veel onderzoekers zijn best bereid hun (basis)gegevens duurzaam te archiveren bij een e-depot, maar willen niet dat die gegevens door iedereen zo maar gebruikt kunnen worden. Er is veel tijd en moeite in gestoken om de gegevens te verzamelen en te ordenen. “Voor mijn wetenschappelijk onderzoek wil ik nog graag zelf van die investeringen kunnen profiteren”. Om daaraan tegemoet te komen kan een tijdelijk embargo worden afgesproken. Alle bestanden zijn wel duurzaam gearchiveerd, maar nog
Auteursrechten, copyright en het e-depot
niet toegankelijk. Er bestaat ook de mogelijkheid om alleen collega-onderzoekers toegang te bieden nadat de auteur daartoe al of niet schriftelijk is verzocht. “Ik wil graag weten wie mijn gegevens gaat gebruiken” is een veel gehoord verzoek. Ondanks het feit dat dit op basis van de wettelijke beperkingen eigenlijk niet noodzakelijk is, wordt met de auteursrechthebbende afgesproken dat de gedeponeerde bestanden bij het e-depot uitsluitend voor wetenschappelijk onderzoek en onderwijs mogen worden (her)gebruikt. De verspreiding vindt uitsluitend plaats binnen een groep van geregistreerde archeologen. Die onderzoekers mogen de bestanden voor eigen gebruik kopiëren, gebruiken en veranderen. In alle gevallen is dan echter een eenduidige bronvermelding noodzakelijk. De naam van de auteur(s), titel van de publicatie of het onderzoeksproject, datum van uitgifte/archivering en het unieke identificatienummer van het repository (persistent identifier/ persistent URL) moeten worden vermeld. De bestanden mogen door derden op geen enkele wijze verder worden verspreid of commercieel worden uitgebaat. De auteursrechthebbende kan deze voorwaarden voor hergebruik, naar wens, verder beperken of verruimen. Via de bijzondere bepalingen van de licentieovereenkomst kan dat, bij de deponering, tot in detail worden vastgelegd. Afgesproken wordt aan wie, vanaf wanneer, welke bestanden beschikbaar gesteld mogen worden. De ene auteursrechthebbende wil de bestanden juist wel volledig vrij geven (open access) en zelfs commercieel hergebruik toestaan, zolang er maar een bronvermelding wordt opgenomen. Een andere auteursrechthebbende wil juist de toegang tot de bestanden volledig en voor langere tijd afsluiten, om zelf eerst nog een bepaald onderzoek te kunnen afronden. Iedereen kan al wel de beschrijvende metadata van de gegevens bekijken, waardoor iedereen van de beschikbaarheid op de hoogte is en eventueel persoonlijk contact op kan nemen met de deponeerder. Er kan één afspraak voor alle bestanden in een dataset worden gemaakt, maar eventueel kunnen voor individuele bestanden aanvullende beperkingen gelden. Het e-depot hoopt hiermee een fijnmazig toegangssysteem te hebben opgezet waarin aan de meeste wensen van de deponeerders tegemoet kan worden gekomen. Samengevat geldt dus dat indien de deponeerder geen nadere afspraken maakt, voor alle bestanden in de gedeponeerde dataset de volgende bepalingen: • de beschrijvende gegevens (metadata) over de gedeponeerde bestanden worden vrij ter beschikking gesteld aan iedere internetgebruiker • de gedeponeerde bestanden worden uitsluitend beschikbaar gesteld aan geregistreerde archeologische gebruikers (beperkte gebruikersgroep) • de bestanden mogen uitsluitend voor onderzoeks- en onderwijsdoeleinden worden gebruikt (niet voor commercieel gebruik) • de bestanden mogen alleen voor eigen gebruik worden gekopieerd (geen verdere openbaarmaking) en bewerkt • het is verplicht om bij hergebruik een eenduidige bronvermelding op te nemen • de bestanden mogen door het e-depot worden geconverteerd als daar vanuit het oogpunt van digitale duurzaamheid de noodzaak toe bestaat (preservering) Zie ook de voorbeeld licentie-overeenkomst, zoals die bij de deponering wordt opgesteld (bijlage 3).
35
36
Wegwijzer Digitaal Deponeren – Archeologie
Deponeringsprocedure
37
38
Wegwijzer Digitaal Deponeren – Archeologie
Deponeringsprocedure
–4– Deponeringsprocedure
In dit hoofdstuk worden de concrete stappen die bij het deponeren van de digitale gegevens van een archeologisch onderzoek bij het e-depot aan de orde kunnen komen, uitgewerkt. De volgende stappen zullen nader worden belicht: 1. (vooraf) contact opnemen met het e-depot 2. conventies voor de bestandnamen 3. versie controle en selectie van de bestanden voor archivering 4. genereren van de metadocumentatie over de gegevens 5. overdracht aan het e-depot 6. controle en conversie door het e-depot 7. controle door de deponeerder 8. licentie overeenkomst en toegankelijkstelling
4.1 Vroegtijdig contact opnemen Digitale archivering omvat tal van technische en organisatorische aspecten, die zowel van invloed kunnen zijn op de werkzaamheden van het e-depot als van de deponeerder. Het aantal digitale bestanden dat tegenwoordig bij een archeologisch project wordt aangelegd, is behoorlijk groot. Het maken van een aanpassing, andere (naams)conventie of aanvullende metadocumentatie brengt soms veel werk met zich mee. Door vanaf het begin van het onderzoeksproject al rekening te houden met de uiteindelijke archivering, kunnen tal van werkzaamheden gaandeweg worden uitgevoerd en zal de extra inspanning, die nodig is ter voorbereiding op de archivering, tot een minimum beperkt blijven. Veel aspecten van het digitaal archiveren kunnen beter vooraf worden kortgesloten, dan dat er achteraf veel aanvullende handelingen nodig zijn. Deze beschrijving geeft een inzicht in het verloop van het gehele proces, van de voorbereidingen tot de uiteindelijke on-line toegankelijkstelling. Het biedt daarmee de informatie waarmee al gedurende het onderzoek rekening kan worden gehouden. Niet elke situatie zal echter al beschreven zijn of een pasklare oplossing kennen. Neem daarom bij twijfel liever in een vroeg stadium contact op met het e-depot voor overleg. Dit geldt zeker indien er heel specifieke software wordt gebruikt, waarbij onzeker is of de bestanden ongeconverteerd kunnen worden gedeponeerd. De vorm en inhoud van de beschrijvende (meta)gegevens kan ook een punt van vroegtijdig overleg zijn. Dat geldt bijvoorbeeld specifiek voor de beschrijving van (digitale) foto’s en (gescande) veldtekeningen. Deze zijn
39
40
Wegwijzer Digitaal Deponeren – Archeologie
immers vaak al beschreven in resp. de fotolijst en de tekeningenlijst. Dat is voor het edepot veelal voldoende, zodat een aparte vermelding van al deze digitale documenten in de metagegevens niet noodzakelijk is. Dat kan veel tijd en moeite besparen. In onderling overleg zal telkens naar een praktische en doelmatige oplossing worden gezocht. Archivering van de digitale gegevens van archeologisch onderzoek is zonder meer nuttig, maar het mag van de uitvoerder geen buitenproportionele inspanning vergen.
4.2 Bestandsnamen Voor de benaming van de digitale bestanden gelden geen algemene conventies. Van project tot project mogen de bestandsnamen verschillend en effectief worden gebruikt. Zo is het bij opgravingen vaak handig om uit de bestandsnamen direct het put- en vlaknummer te kunnen herleiden. Ook het gebruik van lange bestandsnamen (Windows, Macintosh, Linux, Unix) vormt geen probleem. Vanwege de leesbaarheid en de beperkte mogelijkheden van sommige operating systemen en cd-rom formaten, wordt geadviseerd de bestandnamen niet te lang te maken. Een maximum van 64 tekens vormt daarbij een goede richtlijn. De oude DOS standaard (maximaal 8 tekens, een punt en 3-letter extensie) is dus niet verplicht. Het gebruik van een extensie, door de meeste software automatisch ter herkenning toegevoegd, wordt wel sterk aanbevolen. Ook het gebruik van kleine letters en hoofdletters in de bestandsnaam is niet voorgeschreven. Daarbij is het echter wel belangrijk dat de bestandsnaam exact overeenstemt met de naam in de bestandenlijst. Een bestand genaamd CodeBoek_OpgravingsDatabase_Oss.txt is op sommige computerplatformen, een ander bestand dan codeboek_opgravingsdatabase_oss.txt. Het gebruik van spaties in bestandsnamen is toegestaan, maar wordt niet aanbevolen. Daar waar dat eenvoudig kan worden voorkomen, wordt het gebruik van een underscore ( _ ) geadviseerd. De belangrijkste beperking die ten aanzien van de bestandsnaam bij de archivering moet wordt opgelegd is, dat elke bestandsnaam binnen één onderzoeksproject volledig uniek is. Onafhankelijk van de directory waarin een document staat mag de bestandsnaam maar één keer voorkomen. Een digitale foto met de naam IMG0001.jpg in de directory /fotos/12mei2005 en een andere foto met de naam IMG0001.jpg in de directory / fotos/13mei2005 leveren in dit opzicht dus problemen op. Elke bestandsnaam komt binnen het projectarchief maar één keer voor en kan daarmee als unieke identificatie worden gebruikt.
4.3 Versiebeheer en de bestandsselectie Gedurende een (opgravings)project worden er heel veel digitale bestanden gemaakt. Daardoor is het belangrijk om al gedurende de looptijd effectief het versiebeheer ter hand te nemen. Soms wordt door meerdere personen aan dezelfde bestanden gewerkt of worden er kopieën gemaakt waarmee verder wordt gewerkt. Zorg voor een goede directorystructuur, waarbij duidelijk is en blijft waar de originele of laatste versie van de bestanden staan. Probeer alle medewerkers een zekere discipline bij te brengen om dit tot het eind
Deponeringsprocedure
toe vol te houden. Het is achteraf bijzonder lastig om uit te zoeken wat nu precies de laatste versie van een bepaald document is, zeker als daar op verschillende werkplekken aan is gewerkt. Niet alle bestanden die tijdens een onderzoeksproject worden gemaakt, zijn uiteindelijk geschikt of belangrijk genoeg om digitaal gearchiveerd te worden. Vanzelfsprekend komt alleen de laatste definitieve versie, die bij voorkeur een interne en/of externe controle heeft doorlopen, in aanmerking. In de praktijk blijkt dat de uiteindelijke onderzoeksgegevens veelal in slechts 20 tot 30% van alle bestanden zijn gevat. De overige bestanden zijn oudere versies, back-ups, ex/import-files naar andere applicaties en tijdelijke bestanden. De keuze tussen de oorspronkelijke gegevens en afgeleide, omgewerkte gegevens is niet altijd even scherp en evident. Twee voorbeelden waarin het wel helder is: als de oorspronkelijke gegevens in een database staan, hoeft de gekopieerde tabel waarmee in een spreadsheet een grafiek is gemaakt, niet apart te worden gearchiveerd. Alle honderden meetbestandjes, die direct uit een Total Station komen, worden vaak samengevoegd tot één hoogtemetingen bestand. Alleen die laatste archiveren is dan voldoende. Daarentegen: een CAD-tekening, waarin de gedigitaliseerde analoge veldtekening is vastgelegd, wordt vaak weer als basis gebruikt voor een GIS-bestand of een opgemaakte tekening in een publicatie. Het kan soms voor andere archeologen toch heel erg nuttig zijn, als beide bestanden gearchiveerd zijn. Bijvoorbeeld als de CAD-tekening alleen de sporen en putten bevat en er in de opgemaakte tekening genummerde structuren (huizen, spiekers, erven) zijn toegevoegd. Er is dan wezenlijke archeologisch informatie aan de opgemaakte tekening toegevoegd. Beide varianten dienen in dit geval gearchiveerd te worden, waarbij wel goed gedocumenteerd moet worden wat de exacte verschillen zijn. Ten aanzien van tijdelijke (probeer)bestandjes zou de discipline om die altijd in een specifieke subdirectory /tijd of /temp neer te zetten, veel onduidelijkheden kunnen voorkomen. Probeer gedurende het onderzoeksproject altijd een overzicht te houden over waar de belangrijke (oorspronkelijke, primaire, feitelijke) bestanden staan (netwerk, computer, disk, directory). Leg dit gaandeweg het onderzoek al expliciet vast in een (meta) document. Goed versiebeheer en een strikte bestandsselectie voorkomen dat er heel veel bestanden onnodig worden gearchiveerd. Wees selectief, mede om te voorkomen dat onnodig veel bestanden van metadata moeten worden voorzien. Kijk vanuit het standpunt van een andere archeoloog naar welke gegevens zinvol hergebruikt zouden kunnen worden.
4.4 Gegevens over de gegevens (metadata) De enige manier om te zorgen dat een andere archeoloog de gegevens van een onderzoeksproject kan gebruiken, is door heel goed te documenteren wat de gegevens exact betekenen. Niet alleen moet er expliciet uitgelegd worden bij welk project de gegevens eigenlijk horen, maar ook hoe en wat er tijdens het onderzoek is gedocumenteerd. Wat is analoog vastgelegd, wat is later alsnog gedigitaliseerd en wat is alleen als computerbestand beschikbaar? Op welke manier hebben de bestanden een naam gekregen en welke coderingen zijn gebruikt? Deze metagegevens verschaffen een andere archeoloog de
41
42
Wegwijzer Digitaal Deponeren – Archeologie
noodzakelijke informatie om de bestanden te kunnen begrijpen en hergebruiken. Goede metadata zal er ook voor kunnen zorgen dat de gegevens niet verkeerd worden begrepen of onjuist worden toegepast. Metagegevens hebben betrekking op verschillende aspecten van een projectarchief en worden voor verschillende doeleinden toegevoegd aan de bestanden. Bij het e-depot is er een driedeling gemaakt, die in afzonderlijke producten is vertaald. De meta-documentatie bestaat uit: 1. de metadata op projectniveau. Deze geven een beschrijving van het gehele onderzoeksproject en de context van de bijbehorende bestanden. Dit wordt vastgelegd in een projectformulier, dat gebaseerd is op de internationale Dublin Core metadata standaard. Het geeft een gestructureerde inhoudelijke beschrijving van een geheel project, waaronder de specifieke archeologische eigenschappen als de vondstlocatie, welk type site en welke datering. 2. de metadata op bestandsniveau. Deze geven zowel een technische als een inhoudelijke beschrijving van elk individueel bestand. Het wordt vastgelegd in een uitgebreide bestandenlijst, waarin een tiental kenmerken van elk bestand (kan) worden gedocumenteerd. Deels bestaat dit uit, (half)automatisch vast te leggen, technische metadata zoals de bestandsnaam, -omvang en applicatiesoftware. Deels betreft het archeologisch inhoudelijke of methodische aspecten. 3. de metadata op het niveau van de variabelen en coderingen. Deze worden vastgelegd in een zogenaamd codeboek. De beschrijving van de inhoud is sterk afhankelijk van het type bestand, de software en de manier van toepassen. Juist vanwege die grote variatie is er geen vast stramien voorzien, maar mag bij elk project en/of bestand(stype) voor een eigen codeboek worden gekozen. Een codeboek of datadictionary bestaat overigens bij veel projecten al, bijvoorbeeld in de vorm van een Programma van Eisen (PvE), een plan van aanpak of de referentietabellen in een database. Soms kan eenvoudig worden volstaan met een document waarin de aanvulling of afwijkingen ten opzichte van het PvE vermeld staan. Het is wel zaak die informatie bij elkaar te brengen in één of twee documenten, zodat een andere onderzoeker makkelijk de structuur en inhoud van de gegevensverzameling snel kan doorgronden. Voor meer achtergrondinformatie en een concrete invulling van de metadata wordt verwezen naar het volgende hoofdstuk, dat specifiek handelt over metagegevens voor archeologische datasets.
4.5 Overdracht aan het e-depot De overdracht van alle digitale bestanden, de complete dataset van een onderzoeksproject, geschiedt slechts één maal. Namelijk na het moment dat van alle bestanden de definitieve versie is vastgesteld en deze zijn goedgekeurd door de opdrachtgever en/of het bevoegd gezag. De bestanden kunnen in principe aan het e-depot worden overgedragen in alle gangbare bestandsformaten en op alle gangbare digitale media. Datasets worden bij voorkeur via het elektronische archiveringssysteem EASY van DANS direct online gedeponeerd
Deponeringsprocedure
door geregistreerde gebruikers. Het gebruik van EASY heeft als voordeel dat de Dublin Core beschrijving van het onderzoeksproject meteen bij het deponeren wordt afgehandeld. Voor een uitgebreide beschrijving zie het hoofdstuk 7: handleiding EASY. Heel grote datasets (van meer dan 100 MB) worden bij voorkeur toch per post, op cd-rom/dvd opgestuurd. In specifieke situaties kan zelfs op verzoek een externe harde schijf door het e-depot worden verstrekt. Opsturen per e-mail kan vanzelfsprekend ook, maar let daarbij op de totale omvang (maximaal 2 Mb) van de bijlage(n). Als er onzekerheid bestaat over een specifiek bestandsformaat of medium is het aan te raden vooraf contact op te nemen met het e-depot. In het hoofdstuk ‘Te deponeren bestandtypen’ staat een lijst van applicaties, waarvan de bestandsformaten zonder meer kunnen worden geaccepteerd. Een belangrijk aandachtspunt bij de overdracht is de zorg dat de bijbehorende metadata compleet en volledig is. Concreet wil dit zeggen dat elke deponering vergezeld moet worden door: • een ingevuld Dublin Core formulier (online formulier in EASY) met een algemene beschrijving van het onderzoeksproject. • een “uitgebreide” bestandenlijst. Hierin is in principe elk gedeponeerd bestand (één keer) opgenomen en beschreven. Voor databases geldt dat elke tabel apart gedocumenteerd moet worden. Metagegevens over (omvangrijk) beeldmateriaal, mogen echter in een bestaande, afwijkende bestandenlijst (fotolijst, tekeningenlijst) worden overgedragen. • een codeboek voor elk bestand waarvoor dat relevant is. Dit wordt door middel van de vermelding van de bestandsnaam van het codeboek in de “uitgebreide” bestandenlijst aangegeven. Samen met de gegevensbestanden en de bijbehorende metagegevens mag er ook een korte tekst (maximaal 500 woorden) en enkele afbeeldingen worden aangeleverd. Hiermee kan het e-depot een presentatie van het onderzoeksproject in EASY maken. Deze webpagina vormt de startpagina (jump-off page) voor de digitale dataset van het onderzoeksproject. Het gebruik van een (bedrijfs- of project)logo is daarbij toegestaan.
4.6 Controle en conversie naar een archief formaat Nadat het e-depot de bestanden en documentatie heeft ontvangen, zal er een controle worden uitgevoerd. Daarbij zal onder andere worden gecontroleerd of alle metadata compleet zijn, de bestanden op een medium staan en een formaat hebben dat verwerkt kan worden door het e-depot. Verder zal er (regelmatig) controle op computervirussen en integriteit (berekening checksum) plaatsvinden. Alle bestanden worden in het oorspronkelijk aangeleverde bestandsformaat (‘native format’) direct gearchiveerd. Deze oorspronkelijke bestanden worden alleen voor eventuele toekomstige conversies opgeslagen en (vooralsnog) niet beschikbaar gesteld. Daarnaast worden alle bestanden geconverteerd naar een bestandsformaat dat de digitale duurzaamheid het best lijkt te kunnen garanderen (zie het hoofdstuk over digitale duurzaamheid). De geconverteerde bestanden worden veelal in een eenvoudig (uitwisselings)tekstformaat
43
44
Wegwijzer Digitaal Deponeren – Archeologie
aan andere onderzoekers aangeboden. Uiteraard wordt hierbij rekening gehouden met de specifieke toegangsbeperkingen, indien die zijn afgesproken. De bestanden worden dus alleen in het ‘archief formaat’ via het e-depot toegankelijk gemaakt. Tegelijkertijd wordt er een lijst van gedeponeerde en geconverteerde bestanden samengesteld, die zal worden toegevoegd aan de licentieovereenkomst.
4.7 Controle door de deponeerder Voordat de dataset daadwerkelijk on-line beschikbaar wordt gesteld, wordt de deponeerder in de gelegenheid gesteld een controle uit te voeren. Na goedkeuring en/of ondertekening van de licentieovereenkomst wordt, rekening houdend met de gemaakte afspraken, de gedeponeerde dataset opengesteld.
4.8 Licentie-overeenkomst en toegankelijkstelling In de licentieovereenkomst wordt vastgelegd dat het e-depot de bestanden aan derden ter beschikking mag stellen voor persoonlijk hergebruik bij onderwijs en onderzoek. De deponeerder is en blijft eigenaar van de digitale bestanden en behoudt alle auteursrechten. Het e-depot krijgt slechts een niet-exclusief recht om de bestanden aan derden te mogen doorgeven. De deponeerder mag dus ook via andere media of andere organisaties dezelfde bestanden beschikbaar stellen en verspreiden. In de licentieovereenkomst kunnen specifieke toegangsrechten en tijdelijke embargo’s tot in detail worden vastgelegd. Voor de complete dataset, maar ook voor individuele bestanden, kan de mate van toegankelijkheid worden vastgelegd. Met het ondertekenen en terugsturen van de licentie-overeenkomst, waaraan de lijst van gedeponeerde bestanden is aangehecht, is de deponering afgerond. De project (jumpoff) webpagina en de metagegevens worden op internet beschikbaar gesteld en doorzoekbaar gemaakt. Tenzij anders overeengekomen, komen dan ook alle gegevensbestanden in het archiefformaat beschikbaar voor de andere archeologen. Het projectarchief zal, in principe, altijd op een vaste plek, door middel van de persistente URL toegankelijk blijven. In de licentieovereenkomst en op de webpagina wordt die URL nadrukkelijk vermeld, zodat er een eenduidige bronvermelding en verwijzing gebruikt kan worden. De bestanden in het e-depot mogen alleen door anderen worden gebruikt indien de bronvermelding wordt opgenomen. De oorspronkelijke deponeerder moet zijn/haar (wetenschappelijke) credit voor de aangeboden documenten kunnen krijgen. Het e-depot hanteert hiervoor de richtlijnen die binnen de wetenschappelijke wereld gangbaar zijn en bijvoorbeeld zijn vastgelegd in de gedragscode Vereniging Samenwerkende Nederlandse Universiteiten (VSNU) en het initiatief van de ‘Creative Commons’. Verdere verspreiding, commercieel gebruik of verkoop van documenten uit het e-depot is niet toegestaan zonder toestemming van de oorspronkelijke deponeerder.
Metagegevens voor archeologische datasets
45
46
Wegwijzer Digitaal Deponeren – Archeologie
Metagegevens voor archeologische datasets
–5– Metagegevens voor archeologische datasets
De rol van metadata – gegevens over de gedeponeerde digitale gegevensbestanden – mag niet worden onderschat. Bij het ontbreken van goede metadata wordt het feitelijke archiveren vrijwel een zinloze activiteit. De structuur en inhoud van de digitale bestanden zullen immers niet altijd vanzelf duidelijk zijn. Over welk project gaat het? Wat is de samenhang tussen al die bestanden van het project? Wat betekenen de gebruikte coderingen en conventies precies? Vragen die voor de oorspronkelijke, direct bij het onderzoeksproject betrokken, samensteller(s) van de digitale bestanden evident en duidelijk zullen zijn. Voor andere onderzoekers, die niet bekend zijn met het onderzoeksproject, maar wel de gegevens willen hergebuiken, zal dit echter expliciet moeten worden uitgelegd. Uitgangspunt voor de meta-documentatie is dan ook dat deze zo goed en volledig mogelijk moet zijn. Een andere onderzoeker moet zonder de oorspronkelijke samenstellers te hoeven raadplegen, de gegevens kunnen begrijpen en hergebruiken. Voor het maken van metagegevens worden veelal drie doelstellingen onderscheiden, te weten: • het bieden van een mogelijkheid om het bestaan van de dataset (digital resource) te ontdekken op het internet (resource discovery metadata) • het bieden van (technische) informatie ten behoeve van de duurzame digitale bewaring (preservation metadata) • het bieden van instructies over de manier waarop de gegevens gebruikt kunnen en mogen worden (re-use metadata) Deze driedeling loopt gedeeltelijk parallel met de niveaus waarop metadata kunnen worden toegekend. Er worden veelal drie niveaus onderscheiden, te weten: • een algemene beschrijving van het onderzoeksproject (study metadata) • de beschrijving van een individueel digitaal bestand (file metadata) • de beschrijving van de conventies en coderingen in een digitaal bestand (attribute metadata) Voor het documenteren van de digitale bestanden bestaan er tal van min of meer breed geaccepteerde beschrijvingssystemen. Deze metadatasystemen verschillen van vakgebied tot vakgebied (sociale wetenschappen; geografie) en/of van het bestandstype tot bestandstype (digitale foto’s; databases; GIS) en/of van softwareproducent tot producent (ArcView; Idrisi). Sommige metadata systemen zijn eenvoudig van opzet en beperkt in omvang (Dublin Core), daar waar andere complex en zeer omvangrijk zijn, bijvoorbeeld DDI (uit de sociale wetenschappen, Data Documentation Initiative) en FGDC (uit de ruimtelijke wetenschappen, Federal Geographic Data Committee).
47
48
Wegwijzer Digitaal Deponeren – Archeologie
Er is in deze gids een ‘shortlist’ geformuleerd, aangepast aan de archeologische situatie. Zo kent ons vakgebied een zeer grote variatie aan digitale gegevens en toepassingsoftware. De complexe aard en grote omvang van de archeologische datasets maken het gebruik van een uitgebreide of complexe metadata beschrijving onwenselijk. Dat zou simpelweg te veel tijd kosten. Gezocht is naar een goede balans tussen uniformiteit en werkbaarheid. Met een relatief beperkte set aan metadata velden moet toch elk van de drie hierboven genoemde doelstellingen kunnen worden afgedekt. Voor elk onderzoeksproject moet gelden dat de tijd die nodig is om de gegevens te documenteren, in verhouding staat tot de omvang van het gehele onderzoeksproject. Overigens valt de tijd die nodig is voor het documenteren veelal mee, in vergelijking tot de tijd die al is geïnvesteerd in het verzamelen en vastleggen van alle gegevens. Een tijdsbesparing kan ook worden verkregen als de oorspronkelijke onderzoekers al tijdens het project, of zo kort mogelijk nadat de bestanden zijn gemaakt, de metadata samenstellen. Wordt er wat langer mee gewacht, dan blijkt dat er heel veel meer tijd nodig is. Allerlei kleine dingen moeten worden achterhaald, die men toch al weer vergeten blijkt te zijn. Door het e-depot is ervoor gekozen om de drie onderscheiden niveaus te vertalen in drie concrete producten, die nauw aansluiten bij bestaande metadata standaarden. Er is voor de projectbeschrijving een formulier samengesteld volgens de Dublin Core standaard. De individuele bestanden worden inhoudelijk en technisch gedocumenteerd in de vorm van een uitgebreide bestandenlijst, die een strenge selectie van DDI en FGDC elementen bevat. Voor de variabelen en gecodeerde waarden in een bestand moet een naar eigen inzicht vormgegeven codeboek worden opgesteld. Deze drie concrete metadata producten worden hieronder nader uitgewerkt.
5.1 De Dublin Core projectbeschrijving Bij de beschrijving van het onderzoeksproject gaat het om een algemeen beeld van het onderzoek en/of de archeologische vindplaats. De beschrijving moet een eerste globale indruk geven van de het onderzoeksproject en de dataset. Hij wordt voornamelijk gebruikt voor de resource discovery. Voor de beschrijving is gekozen voor een internationale standaard, de zogenaamde Dublin Core (DC). Dit is een vrij eenvoudige en heel open beschrijvingsmethode. Zo bestaat de eenvoudigste variant van Dublin Core (unqualified DC) slechts uit vijftien beschrijvingselementen (velden), zoals: creator, title, subject, description, date en coverage. Dublin Core stelt geen van de vijftien elementen verplicht. Alleen die velden worden ingevuld, die relevant en bekend zijn voor het onderzoeksproject dat wordt beschreven. Het e-depot stelt dat een viertal ‘elementaire’ velden (creator, title, description en date) echter wel altijd ingevuld moeten worden. In principe is geen van de overige velden verplicht, maar voor elke vorm van metadata geldt dat het om een ‘verrijking’ gaat. Hoe meer metadata er wordt toegevoegd, hoe eenvoudiger het wordt om een bron (resource) terug te vinden of te hergebruiken. Bij DC wordt in principe bij elk element vrije tekst ingevuld. Dat kan heel kort in de vorm van enkele trefwoorden (bij subject) of een korte zin (bij title), maar ook in de vorm van een korte (tekst)alinea (bij description). De kadertekst geeft een eenvoudige Dublin Core beschrijving van een opgraving in Schipluiden.
Metagegevens voor archeologische datasets
Title Opgraving Schipluiden – Harnaschpolder (04hp) Creator Faculteit der Archeologie (Universiteit Leiden); Archol B.V. Description In het kader van de aanleg van de Afvalwaterzuiveringsinstallatie Haagse Regio (AHR) heeft in de periode mei – oktober 2003 een opgraving plaatsgevonden van een Neolithisch nederzettingsterrein. In dit document zijn de analoge en digitale documentatie van het veldwerk bijeengebracht. De vindplaats is opgegraven door middel van twee min of meer afzonderlijke strategieën. De vondsten uit de bewoningslaag(en) zijn, per put, verzameld in eenheden van 1 bij 1 meter. Er zijn daarbij meerdere vlakken aangelegd als de lithologie veranderde of de maximale verzameldiepte van 10 cm. was bereikt. Een deel van de vondstlaag is ook, op een 4 mm zeef, gezeefd. Met een onderlinge afstand van 12 meter is een 1 meter brede strook, dwars over lengterichting van het duin, op deze wijze bemonsterd. In de onderliggende afzettingen tekenden zich de grondsporen af, die in twee vlakken (70 en 80) zijn opgegraven. De vondsten zijn per grondspoor verzameld. Samen met de opgravingen in Wateringen (Raemaekers, 1997) en Ypenburg (Koot, 2001) biedt deze opgraving een gedetailleerd inzicht in de middenneolithische bewoning van W-Nederland. Subject opgraving; DO; velddocumentatie; Neolithicum; nederzetting; Swifterbant; Hazendonk; begraving; huisplattegrond Coverage Spatial: gemeente: Schipluiden (Harnaschpolder); plaats: Den Hoorn; toponiem: Noordhoorn; straatnaam: Noordhoornse weg Temporal: Midden-Neolithicum (ca. 3800 BC) Publisher AHR, Hoogheemraadschap Delfland Identifier Archol (shp54); AHR (04hp); RAAP (AHR2) Date De bestanden zijn gemaakt in de periode van mei tot oktober 2003 Rights Archol B.V. Relation De documentatie van de opgraving bestaat naast de digitale bestanden ook uit analoge documenten. De originele veldformulieren, vondstkaartjes, vlak- en coupetekeningen zijn bij de Faculteit der Archeologie, Universiteit Leiden. De analoge informatie is integraal digitaal beschikbaar. Directe digitale registratie heeft plaatsgevonden voor de TS-metingen (meetsysteem, vlakhoogtes, spoorhoogtes, puntvondsten) en de foto’s (digitale camera’s). Language Nederlands Type Primaire opgravingsgegevens Format De bestanden zijn in verschillende formaten: Access 2000 (mdb), Word 2000 (doc), AutoCAD 14 (dwg), MapInfo (tab), Surfer 8 (srf) en Mapsuite 2.2 (sdr, sur, top)
49
50
Wegwijzer Digitaal Deponeren – Archeologie
5.2 Qualified Dublin Core Voor archeologische projecten biedt de unqualified Dublin Core echter net iets te weinig mogelijkheden om een adequate beschrijving te kunnen geven. De belangrijkste doelstelling van de Dublin Core beschrijving ligt in het kunnen (terug)vinden van informatie op het internet. Voor archeologen is daarbij bijvoorbeeld het onderscheid tussen de ‘spatial coverage’ (ruimtelijke ligging) en de ‘temporal coverage’ (datering) van wezenlijk belang. Dit onderscheid wordt in de unqualified Dublin Core echter niet gemaakt. Daarvoor is een iets uitgebreidere metadataset, qualified Dublin Core, afgesproken. In qualified DC zijn er twee aanvullingen opgenomen, te weten: qualifiers en schemes. Bij het invullen van de qualified DC elementen kan heel precies worden gespecificeerd wat er mee wordt bedoeld. Bijvoorbeeld bij de datum (date) kan worden aangegeven of het daarbij gaat om de datum waarop het document is gemaakt (created) of waarop het document beschikbaar komt (available). Dit geschiedt met de zogenaamde DC-qualifiers. De meeste DC elementen hebben één of meer qualifiers, maar het gebruik van qualifiers is niet verplicht. Als er in de beschrijving geen qualifier is gebruikt, kan het in principe om elk van de betekenissen van datum gaan. Er is afgesproken dat het dan waarschijnlijk om de meest voorkomende (default) betekenis gaat. Bijvoorbeeld bij date geldt created als de default betekenis. Overigens kan in dit opzicht de implementatie van DC van organisatie tot organisatie verschillen. Bij het invullen van bepaalde DC-elementen geniet het gebruik van een vaste formulering of een beperkte (tref)woordenlijst de voorkeur. Als er bij de beschrijving een dergelijke thesaurus wordt toegepast, moet dit wel worden vastgelegd door de vermelding van een zogenaamd scheme. De waarde voor een datum wordt meestal volgens het W3CDTFschema (yyyy-mm-dd) vastgelegd. De waarde die bij dat element is ingevuld, moet dan natuurlijk wel aan dat schema (vaste formulering of gedocumenteerde woordenlijst) voldoen. Het gebruik van een schema is, wederom, niet verplicht. Er mag in principe altijd voor vrije tekst worden gekozen, maar de zoekmogelijkheden worden dan echter wel beperkter. De schema’s zijn een belangrijk middel om gestructureerd zoeken mogelijk te maken. Op basis van de gewenste zoekfunctionaliteit zijn er voor archeologische projecten in Nederland drie DC-elementen met een schema verplicht gesteld: • het type vindplaats (codering volgens Archis), • de datering (codering volgens Archis), • de geografisch ligging (in RD-coördinaten). Hierdoor wordt archeologen de mogelijkheid geboden om eenvoudig de datasets over bijvoorbeeld “Bronstijd grafvelden in Z-Nederland” op te vragen. Daartoe moeten dus de volgende drie elementen uit de qualified Dublin Core set worden gebruikt: DC-element qualifier subject coverage temporal coverage spatial
scheme Archis ABR Archis ABR DC:Point in RD
waarde GVX; GHX BRONS 142860; 380200
Metagegevens voor archeologische datasets
Uit dit voorbeeld blijkt dat de combinatie van qualifiers en schema’s de Dublin Core metadata standaard bijzonder krachtig en flexibel maakt en toch relatief eenvoudig te gebruiken. De DC standaard wordt op deze manier ook op tal van andere terreinen ingezet, zowel binnen als buiten de archeologie. Universiteiten maken proefschriften en publicaties, in het kader van het DARE programma van SURF, momenteel op deze wijze vindbaar. De cultuurwijzer (DEN; ICN) maakt gebruikt van DC en ook de KennisInfrastructuur CultuurHistorie (KICH) (RACM; LNV; Alterra) past een variant van DC toe. Het aansluiten bij een dergelijke, relatief breed gedragen de facto metadata standaard lijkt ook voor de archeologie alleen maar voordelen op te kunnen leveren. Dublin Core biedt ook mogelijkheden om (restricties op) de toegang tot de digitale documenten vast te leggen. Via het element ‘rights’ (qualifier: accessRights) kan het type toegang worden vastgelegd (open access; restricted; personal access; no access). Via ‘date’ (qualifier: available) kan worden aangegeven dat er pas vanaf een bepaalde datum (vrije) toegang aan de data gegeven mag worden (een tijdelijk embargo). Eventueel zou via ‘audience’ een specifieke (beperkte) doelgroep omschreven kunnen worden. Met het DC-elementen ‘rights’, ‘creator’ en ‘publisher’ kan duidelijk worden gedocumenteerd bij wie de auteursrechten precies liggen, zodat een goede bronvermelding en respectering van die (copyright)rechten kan plaatsvinden. Dublin Core biedt tenslotte ook de mogelijkheid om een samenhang tussen documenten in verschillende (digitale) archieven aan te geven. Via het element ‘identifier’ of ‘relation’ (met qualifiers) kan op een gestructureerde wijze worden aangeven dat er bijvoorbeeld in Archis een onderzoeksmelding bestaat over hetzelfde onderzoek. Daarmee kan een verwijzing worden getoond, waarmee automatisch doorgelinkt kan worden naar die (andere) bron op het internet. Voor de beschrijving van archeologische projecten lijkt de qualified Dublin Core prima te kunnen volstaan. Natuurlijk kunnen er van een archeologisch onderzoek nog veel meer aspecten worden beschreven. Zo vertonen de variabelen die in Archis voor een onderzoek of een waarneming worden vastgelegd, slechts een beperkte overlap met qualified DC. Qualified DC biedt een goede middenweg. Binnen de beperkte tijd die nodig is om een project te documenteren, worden toch voldoende inhoudelijke kenmerken vastgelegd om een project gericht (terug) te kunnen vinden. Via de gebruikersinterface van de webapplicatie van DANS (EASY) wordt de DC-beschrijving van een onderzoeksproject opgebouwd en vastgelegd. De deponeerder heeft daartoe geen uitgebreide kennis van de qualified Dublin Core standaard nodig. Bij de namen van de beschrijvingselementen is voor de Engelse taal gekozen. Dit betekent niet dat de beschrijvingen verplicht ook in het Engels moeten worden gemaakt. Als de inhoud van een databestand in het Nederlands is, is een Nederlandstalige metabeschrijving zelfs veel logischer. Een buitenlandse onderzoeker zal een project of een bestand wel kunnen vinden, maar loopt dan toch vast op het moment dat er in een datatabel de opmerking “deze afslag is verbrand” staat.
51
52
Wegwijzer Digitaal Deponeren – Archeologie
5.3 De uitgebreide bestandenlijst Naast de beschrijving van het onderzoeksproject als geheel is er een (meta)beschrijving nodig voor elk individueel bestand dat wordt gedeponeerd. Het gaat daarbij zowel om de technische als inhoudelijke metadata op het niveau van een bestand. In de onderstaande lijst zijn een aantal kenmerken opgenomen die voor de beschrijving van een digitaal bestand gebruikt zouden kunnen worden. Hierbij geldt wederom dat beschrijvende metadata een verrijking van het oorspronkelijke gegevens vormt. Hoe uitgebreider de inhoud nu wordt uitgelegd, hoe eenvoudiger het in de toekomst wordt om het digitale bestand te gebruiken. Net als voor andere metadata geldt dat er heel weinig velden verplicht zijn. Hoe meer des te liever, maar niet ten koste van een buitensporige inspanning. De onderstaande kenmerken vormen dan ook meer een lijst van aandachtpunten dan van daadwerkelijke verplichtingen. Zo zijn er kenmerken die niet voor elk bestandtype relevant zijn, waar andere kenmerken al direct duidelijk zijn op basis van de naam of extensie. De ruimtelijke beschrijvingselementen zijn natuurlijk alleen van toepassing op en heel belangrijk voor CAD-files of GIS-tabellen. Daarentegen is voor digitale foto’s de software weer niet van toepassing, omdat de digitale camera veelal direct jpg-bestanden oplevert, die met tal van applicaties kan worden bekeken. Het is wel belangrijk dat als er een codeboek nodig is om de inhoud van een bestand te kunnen begrijpen, dit in de bestandenlijst, via een exacte bestandsnaam, wordt vastgelegd. In de onderstaande lijst zijn de in vet weergegeven velden min of meer verplicht en staat tussen haakjes telkens een voorbeeld vermeld. file_name file_content
bestandnaam van het databestand (monsterlijst.xls) beschrijving van de inhoud (lijst van grond-, zaden- en houtmonsters) data_format algemene technische omschrijving (relationele database) software gebruikte software en versie (MS-Word, versie 2000) hardware gebruikte computersysteem (Intel-PC) original_OS oorspronkelijk Operating System (DOS) data_collector specifieke personen die verantwoordelijk zijn voor de inhoud (ingehuurde landmeetkundige) purpose specifieke doel voor het verzamelen van de gegevens in dit bestand (controlesteekproef) collection_mode methode van verzamelen (hoogtemetingen in een grid van 5 x 5 m.) analytic_units analyse/opslag eenheden, observaties, records (beschrijving per grondsporen) data_appreciation inschatting datakwaliteit, hergebruikswaarde of -beperkingen (5 à 10 cm. onzekerheid in de NAP-hoogtes) geog_cover het ruimtelijke dekkingsgebied (500 x 250 m. rondom het punt 134790/352200) geog_unit eenheden waarin de ruimtelijke coördinaten zijn gebruikt (in kilometers) mapprojection naam van de kaartprojectie of “lokaal meetsysteem” (RD) local_georef minimaal 2 referentiepunten, voor de conversie van locale naar landelijke coördinaten
Metagegevens voor archeologische datasets
source_document
(analoge) bron voor de digitale data (gedigitaliseerde veldtekeningen 1:50) othmat_citation naam van bestanden die gerelateerde, aanvullende informatie bevatten (zie ook het bijgevoegd PvE: bestek_schipluiden.doc) othmat_codebook exact bestandsnaam van het bijbehorende codeboek (monsterlijst_code.txt) notes aanvullingen en specifieke instructies voor (her)gebruik
Een minimale beschrijving van de bestanden zou dus tot de vier, in vet aangegeven, kenmerken beperkt kunnen blijven. Daarmee zal een andere archeoloog zich echter een onvoldoende duidelijk beeld van de inhoud van een databestand kunnen vormen. Gebruik, indien van toepassing, daarom zo veel mogelijk van de bovenstaande 19 kenmerken. Voor een nog nauwkeuriger beschrijving kan het aantal kenmerken eventueel verder worden uitgebreid met elementen uit de volledige lijst van beschrijvingselementen op bestandsniveau (zie bijlage 2). Het gebruik van bepaalde elementen zal afhankelijk zijn van wat de samenstellers belangrijk achten of wat op een relatief eenvoudige wijze (automatisch) beschikbaar is. Het oorspronkelijke doel – een andere archeoloog moet op basis van deze metadocumentatie de gegevens kunnen hergebruiken, zonder de oorspronkelijke samenstellers te hoeven raadplegen – moet daarbij niet uit het oog verloren worden. Tegenwoordig worden bij een opgraving honderden digitale foto’s gemaakt van vlakken, coupes, profielen en vondsten. Het moeten documenteren van alle digitale foto’s in de vorm van een uitgebreide bestandenlijst zou onevenredig veel (extra) werk met zich mee brengen. Op zich is dat ook niet nodig, omdat bij veel opgravingen al een digitale fotolijst wordt gemaakt van de (digitale) foto’s. Die lijsten voldoen veelal al direct of indirect aan de verplichte velden in de bovenstaande lijst. De bestandsnaam (fotonummer) en de bestandsinhoud (veelal put, vlak, spoor) zijn meestal al vastgelegd. Tegelijkertijd zijn de software en het codeboek in deze situatie niet van toepassing. Hetzelfde geldt eigenlijk ook voor de (gescande) veldtekeningen (vlak, profiel en/of coupetekeningen). De tekeningenlijst documenteert al voor een belangrijk deel de relevante kenmerken. Als daar de bestandsnaam van de scan aan toegevoegd kan worden, is dat voldoende voor de metadata. Beide voorbeelden geven aan dat het samenstellen van de metadata nooit mag uitmonden in het uitgebreid (opnieuw) beschrijven van talrijke bestanden. Bestaande informatie en een slimme naamsconventie voor de bestanden kan veel werk uit handen nemen. Zo kan bijvoorbeeld ook de beschrijving van een groep van bestanden, die veel metadata velden gemeenschappelijk hebben, veel tijdswinst opleveren. Een bekend voorbeeld in de Nederlandse archeologie vormen de talrijke MapInfo bestanden. Per put, per vlak en per deelaspect zijn er vier à vijf bestanden, zodat er bij een opgraving al snel honderden bestanden zijn. Enerzijds hoeft in de bestandenlijst alleen maar het .tab bestand opgenomen te worden. Alle andere bestanden zijn immers daaraan gekoppeld. Anderzijds kan bij de naamgeving van de files bijvoorbeeld de volgende conventie worden gehanteerd: <projectcode>_
_ _<deelaspect>.tab alp02_wp012_vl01_putcontour.tab alp02_wp012_vl01_grondsporen.tab alp02_wp012_vl01_coupelijnen.tab alp02_wp012_vl01_hoogtemetingen.tab
53
54
Wegwijzer Digitaal Deponeren – Archeologie
Hiermee wordt veel van de inhoud in één keer duidelijk. Automatisch kan uit de bestandnaam de informatie voor de uitgebreide bestandenlijst worden geëxtraheerd. Er blijven dan relatief weinig additionele kenmerken over, die handmatig aan de metadata moeten worden toegevoegd. Dat kan zelfs in één keer voor de gehele groep van bestanden met een specifieke query of copy-and-paste. Datzelfde geldt ook voor de technische metadata, zoals het type bestand, de software of de bestandsgrootte. Deze kunnen, met behulp van de juiste tools, eenvoudig (half)automatisch tot een bestandenlijst worden omgevormd of daaraan worden toegevoegd. De uitgebreide bestandenlijst zal veelal in een database of spreadsheet worden aangemaakt. Daarin komt elk metadata element, als variabele of kolom, slechts één keer voor. De bestandsnaam is de sleutel en kent natuurlijk altijd maar één mogelijke en unieke waarde. Daarentegen zouden bijvoorbeeld bij ‘data_collector’ meerdere personen ingevuld moeten kunnen worden. De meeste metadata systemen zijn gebaseerd op XML en daarin is een herhaling van hetzelfde element probleemloos mogelijk. In een database of spreadsheet is dat echter minder eenvoudig. In de gedocumenteerde bestandenlijst moet daarom voor de, ook volgens de internationale standaarden, toegestane oplossing gekozen worden om meerdere waarden door een punt-komma (;) van elkaar te scheiden (bijvoorbeeld: Butler, J.; Brongers, J.A.). Bij de bestandsbeschrijving mogen, vanwege de specifieke beperkingen van XML, geen speciale leestekens als & (ampersand) , < (kleiner dan) en > (groter dan) worden gebruikt. Ook quots (“, ‘, `), percentage (%), trema’s en umlauts worden bijvoorkeur zoveel mogelijk vermeden (liever coordinaten dan coördinaten). De uitgebreide bestandenlijst moet digitaal worden aangeleverd. Een voor de hand liggende vorm daarvoor is een databasetabel of een werkblad in een spreadsheet. De namen van de bestanden moeten exact overeenkomen met de bestandnamen, ook in het gebruik van hoofd- en kleine letters. Ook de metadata elementen moeten exact worden overgenomen uit bovenstaande lijst of bijlage 2.
5.4 KNA-bouwstenen In de KNA 3.1 is afgesproken dat er bij een opgraving een manier van documenteren mag worden gekozen die het best past bij de onderzoeksvragen en de uitvoerder. Het documenteren kan daarbij zowel analoog (formulieren), als gedigitaliseerd (gescande tekeningen) en/of direct digitaal (Total Station) gebeuren. De structuur van en de eindproducten waaruit de documentatie bestaat, mag van opgraving tot opgraving verschillen, maar moet wel op een uniforme manier worden beschreven. Daartoe zijn er zogenaamde bouwstenen – kleine, losse onderdelen van de documentatie – gedefinieerd, die in vrijwel elke opgravingsadministratie voorkomen. Als een andere (toekomstige) onderzoeker de documentatie van een opgraving wil gebruiken, zal hij aan de hand van de lijst van bouwstenen, snel en eenvoudig kunnen achterhalen waar iets is terug te vinden. Bijvoorbeeld de hoogte van de grondsporen (bouwsteen spoorhoogte) is bij deze opgraving vastgelegd op de analoge vlaktekening, naast elk grondspoor staat in rood een NAP waarde, zoals +3.12, vermeld. Of: bij deze opgraving
Metagegevens voor archeologische datasets
is de spoorhoogte terug te vinden in de digitale CAD-tekeningen, voor elke put is er een digitale tekening met een aparte layer (spoor_hoogte) met de via de Total Station ingemeten NAP-waarden (12.67). De lijst van mogelijk te kiezen/gebruiken bouwstenen is vast en voor iedere opgraving precies hetzelfde. Hierdoor is de inhoud flexibel en de beschrijving (metadata) gestandaardiseerd. Ook de bestandenlijst beschrijft de digitale eindproducten van een onderzoeksproject op een gestandaardiseerde manier, maar er zijn duidelijke verschillen met de bouwstenen. Ten eerste heeft de bestandenlijst alleen betrekking op de digitale eindproducten. Het is immers het overzicht van alle bij het e-depot aangeleverde bestanden, die duurzaam gearchiveerd gaan worden. Daarnaast is er waarschijnlijk ook een lijst van analoge eindproducten, zoals de tekeningenlijst, een lijst van ordners met de papieren formulieren of een lijst met publicaties. Deze worden veelal overgedragen aan een provinciaal depot. Ten tweede beschrijft de bestandenlijst precies wat er aan informatie in een digitaal bestand staat en dat kunnen meerdere bouwstenen zijn. Bijvoorbeeld: deze CAD-tekening bevat de volgende layers: putgrens, grondsporen, spoornummers, monsters (als puntsymbool met een nummer) en vondsten (als puntsymbool met een nummer). Daarentegen geven de bouwstenen voor elk klein deel van administratie aan waar dat is te vinden; dat kan zelfs in meerdere eindproducten zijn. De omtrek van de grondsporen (bouwsteen ‘spoor’) staat zowel op de analoge vlaktekening als in de gedigitaliseerde CAD-tekening (zie layer ‘grondsporen’). De (digitale) eindproducten en de bouwstenen vormen daarmee samen een matrix, waarin zowel vanuit de bouwstenen (rijen) als vanuit de eindproducten (kolommen) direct is af te lezen hoe deze opgraving is vastgelegd. Hieronder staat een eenvoudig voorbeeld van een matrix van de bouwstenen (rijen) en de eindproducten (kolommen) Veldformulieren (analoog) spoor
Veldtekeningen (analoog)
CAD-tekening (per put apart put##.dwg)
spoorformulier
Database (opgraving.mdb) tabel spoor
spoor_hoogte
tabel spoor_hoogte (geïmporteerd uit Total Station software)
sporenkaart
aanwezig, met daar- layers grondspoor en naast het spoornum- spoornummer mer (begint met S)
vondst_veld
vondstformulier
nummer (dubbel onderstreept)
puntsymbool met tabel vondst_v nummer, in de layer vondsten
monster_veld
vondstformulier
nummer in rode puntsymbool met kleur (begint met M) nummer, in de layer monsters
tabel vondst_v (categorie M*)
De bouwstenenlijst en bestandenlijst zijn daarmee dus complementair aan elkaar. Bij voorkeur wordt de bouwsteen-documentatie, naast bijvoorbeeld het PvE of het draaiboek, als een apart (tekst)document bij de deponering opgenomen.
55
56
Wegwijzer Digitaal Deponeren – Archeologie
5.5 Het codeboek Naast de beschrijving van elk individueel bestand is het ook nodig om een gedetailleerde beschrijving te geven van de inhoud van elk bestand. Het codeboek is een beschrijving van de inhoud van een digitaal document, waarin alle codes en conventies worden uitgelegd. De structuur van een codeboek kan vrij worden gekozen en mag worden afgestemd op het onderzoeksproject, op het PvE of de gebruikte computertoepassingen. Het belangrijkste is dat aan de hand van het codeboek de vorm en inhoud van het betreffende digitale databestand duidelijk moet zijn. Zonder misverstanden, zodat de gegevens op een juiste wijze (opnieuw) geanalyseerd kunnen worden. Codeboeken bevatten alle namen van de tabellen in een database, de werkbladen in een spreadsheet of de layers in een CAD-tekening. De betekenis van de namen van de variabelen in een databasetabel, spreadsheet of GIS-tabel moeten duidelijk worden gemaakt. De gebruikte coderingen voor de inhoud van de velden, moeten in een codelijst of referentietabel worden uitgelegd. Tenslotte moet bij numerieke velden aan een vermelding van de eenheden (in km.) en/of nauwkeurigheid (met twee decimalen) worden gedacht. Het codeboek vormt, samen met de kenmerken die beschreven zijn in de uitgebreide bestandslijst, de basis waarop een andere onderzoeker (in de toekomst) de digitale gegevens kan beoordelen en begrijpen. Het maken van een volledig codeboek zal dan ook de nodige tijd en aandacht kosten. Deze meta-informatie is echter voor de verschillende projecten die een organisatie uitvoert, veelal nagenoeg hetzelfde of is al op een of andere wijze beschikbaar. Bij de grotere onderzoeksprojecten wordt vooraf veel vastgelegd in het PvE. Dit bevat een gedetailleerde beschrijving van de onderzoeksmethoden en de (digitale) eindproducten waarin de resultaten moeten worden vastgelegd. Met aanvullende documentatie, waarin de afwijkingen worden vastgelegd, zou dat al een prima bruikbaar codeboek kunnen vormen. Het documenteren van alleen die zaken die tijdens het veldwerk anders zijn gegaan dan vooraf bedacht, kan echter soms ook onduidelijkheid scheppen. Overweeg dan of een apart codeboek toch niet beter is. In een database zijn veelal zogenaamde referentie-tabellen opgenomen, waarin de te gebruiken codes zijn opgenomen en uitgelegd. Ook de structuur van de tabellen (variabelen) en de samenhang tussen tabellen worden met de huidige database management software op een grafische wijze vastgelegd. Die informatie kan eenvoudig en op een gebruikersvriendelijke manier naar één tekstdocument worden geëxporteerd. Zo is er bijvoorbeeld in Microsoft Access een speciale ‘Documenter tool’ aanwezig. Aan het einde van een project kan hiermee eenmalig de ‘eindstand’ worden gedocumenteerd. Vanuit het oogpunt van de hergebruiker is één codeboek bij elk afzonderlijk bestand zeer gebruikersvriendelijk. Soms kan dat heel eenvoudig worden gemaakt. In veel gevallen zal er echter per groep van (gelijksoortige) bestanden, zoals voor alle Mapinfo bestanden of voor alle tabellen in een database, één gezamenlijk codeboek bestaan. Op zich vormt dit, zowel bij de archivering als het hergebruik, geen probleem. Het is wel zaak in de bestandenlijst dan bij alle bestanden waarvoor dat geldt, dezelfde naam van dat gemeenschappelijke codeboek te herhalen. Als er een codeboek in aanvulling op het PvE wordt gebruikt, is het verplicht om de digitale versie van het PvE een onderdeel van de gearchi-
Metagegevens voor archeologische datasets
veerde dataset te maken. In het codeboek staat dan alleen de afwijking ten opzichte van bijvoorbeeld de Arnhem Schuytgraaf specificaties. Een hergebruiker moet echter niet worden geconfronteerd met een complete e-mail correspondentie tussen de opdrachtgever en de uitvoerder waaruit alle kleine, grote, tijdelijke en definitieve veranderingen achterhaald zouden kunnen worden. Het is zaak om de uiteindelijke opgravingsdocumentatie in één of twee tekstuele codeboeken te beschrijven. In de uitgebreide bestandenlijst wordt vastgelegd welk codeboek voor welk digitaal bestand van toepassing is. Voor bijvoorbeeld dagrapporten of digitale foto’s is een codeboek niet van toepassing. In de bestandenlijst blijft dit veld (othmat_codeboek) dan vanzelfsprekend leeg (zie paragraaf 5.3). De codeboeken zelf worden in een duurzaam bestandsformaat als platte ascii-tekst of pdf-document (als de opmaak belangrijk is) aan het archief toegevoegd. Metagegevens over de digitale databestanden vormen een wezenlijk onderdeel van een gearchiveerde dataset. Zonder metadata is het geen bruikbaar digitaal archief. Door de driedeling in het qualified Dublin Core projectformulier, de gestructureerde (uitgebreide) bestandenlijst en het, naar eigen inzicht vorm te geven, codeboek lijken doel en middel redelijk op elkaar afgestemd te zijn. Het e-depot zal waar mogelijk trachten om adviezen en hulpmiddelen voor het vastleggen en verzamelen van metagegevens breed beschikbaar te maken. Vanzelfsprekend kan altijd, mits tijdig en in overleg, een andere praktische en werkbare overdrachtsvorm worden overeengekomen.
57
58
Wegwijzer Digitaal Deponeren – Archeologie
Te deponeren bestandstypen
59
60
Wegwijzer Digitaal Deponeren – Archeologie
Te deponeren bestandstypen
–6– Te deponeren bestandstypen
Binnen de Nederlandse archeologie wordt een zeer breed scala aan software gebruikt. Tal van applicaties worden en werden toegepast bij het vastleggen van teksten en onderzoeksdocumentatie. Sommige software is zeer algemeen gangbaar (geweest), daar waar andere applicaties zeer specifiek zijn. Bepaalde toepassingen zijn zelfs beperkt tot één instelling of één meetapparaat. Aan de ene zijde van de schaal staan bijvoorbeeld de huidige Microsoft Office applicaties als Word, Excel en Access. Aan de andere kant van de schaal staan bijvoorbeeld toepassingssoftware voor Sokia Total Station apparatuur (Mapsuite+) of de pollentekenprogramma’s als Tilia (Universiteit Leiden) en Grappa (Rijksuniversiteit Groningen). In principe zal het e-depot alle bestanden, zowel met gangbare als minder gangbare software gemaakt, kunnen en willen opnemen. Actuele bestandsformaten hebben daarbij wel de voorkeur, opdat de verwerking en de duurzame opslag eenvoudiger kunnen worden uitgevoerd. Maar ook oudere of verouderde bestandsformaten zullen, momenteel, nog kunnen worden geaccepteerd en verwerkt. Specifieke toepassingen kunnen echter problematisch zijn, bijvoorbeeld als het om op maat gemaakte software gaat, de aanschafkosten heel hoog zijn of alleen op een specifiek Operating Systeem draai(d)en. Daar waar nodig zal dan in overleg met de deponeerder worden gekeken hoe die bestanden voorafgaand aan de levering eerst geconverteerd moeten worden. Ook de implementatie – de manier van toepassen van een applicatie – kan, zowel nu als in het verleden, op heel veel verschillende manieren gestalte hebben gekregen. Bepaalde manieren van toepassen zijn good practice, bijvoorbeeld vanuit technische motieven of vanwege een internationale standaard. Enkele voorbeelden kunnen dit wellicht duidelijk maken. Het vastleggen van een lijst van gestructureerde gegevens zou bij voorkeur in een database(tabel) moeten plaatsvinden. Het vastleggen van diezelfde lijst in een spreadsheet programma is minder aan te bevelen, omdat dan controles op de inhoud en vorm minder eenvoudig geschieden. Daarentegen is het opstellen van een genormaliseerd databaseontwerp, volgens de gangbare praktijk, weer geen eenvoudige taak. Met een CAD- of tekeningopmaakprogramma kan database-informatie op een kaart worden gevisualiseerd. Dat verdient echter niet de schoonheidsprijs. Niet iedere (archeologische) instelling beschikt of beschikte in het verleden echter over GIS-software. Het is niet de taak en doelstelling van het e-depot om het gebruik van specifieke software of de implementatie daarvan voor te schrijven. Good practice bestaat immers uit tal van oplossingen. Zelfs minder voor de hand liggende manieren van toepassen, voortgekomen uit beperkte technische of financiële mogelijkheden of uit beperkte kennis, mogen nooit een reden zijn om datasets niet te archiveren. De inhoud van de databestanden kan worden omgezet en voorzien van duidelijke metadata, waarin juist die beperkingen
61
62
Wegwijzer Digitaal Deponeren – Archeologie
worden aangegeven. De gegevens worden, zonder een beoordeling of selectie te hoeven maken, toch beschikbaar gesteld aan andere onderzoekers. De computertoepassingen op archeologisch gebied vormen een zeer omvangrijk werkterrein. Voor de digitale archivering is dan ook specialistisch kennis van soft- en hardware noodzakelijk. Die kennis en ervaring is voor een deel bij het data-archief aanwezig, maar is deels gebonden aan de instelling of de persoon die de bestanden heeft gedeponeerd. Er zal in voorkomende gevallen dan ook samen naar praktische en duurzame oplossingen gezocht moeten worden.
6.1 Overzicht deponeerbare applicaties Hieronder volgt een lijst van applicaties waarvan de bestanden, bij het verschijnen van deze uitgave, zonder meer kunnen worden gedeponeerd bij het e-depot. Voor een actuele lijst wordt verwezen naar de website van het e-depot. Per toepassing (bestandstype) worden telkens een algemene omschrijving, specifieke aandachtpunten en technische aspecten vermeld.
Teksten Teksten als platte tekst Teksten zonder enige opmaak(codes), platte teksten. Geaccepteerd: ASCII-tekst: 7-bits, 128 stuur- en printbare tekens; Extended ASCII: 8-bits met charactersets als UTF-8 (unicode), UTF-16, ANSI (een specifieke extended ascii-tekenset, 256 tekens, in MS-Windows gebruikt voor diacritische tekens 130=é) of ISO-8859-1; Teksten met MS-DOS codepages, MS-Windows codepages, Apple codepages. Speciale aandachtspunten: • In platte tekstbestanden kunnen speciale leestekens (diacritische tekens) worden gebruikt, maar het (terug)lezen daarvan is sterk afhankelijk van de gekozen en gedocumenteerde charactersets (ASCII, unicode) en codepages. • Bij platte teksten kunnen tabellen door het gebruik van tabs en/of spaties worden (op) gemaakt. De vormgeving van die tabellen kan echter bij een andere lettergrootte of papierformaat gaan verspringen, waarbij de opmaak verloren kan gaan en de leesbeerheid aanzienlijk kan verslechteren. Markup-teksten Platte tekst, waarvan de inhoud is voorzien van tags die de betekenis of opmaak aangeven, zonder software specifieke coderingen.
Te deponeren bestandstypen
Geaccepteerd: html; sgml; xml Speciale aandachtspunten: • Hierbij dient bij voorkeur een schema (dtd; scheme) met de structuur van de tags te worden bijgevoegd. Teksten in proprietary software Tekstbestanden waarvan de opmaak wordt gegenereerd op basis van coderingen die gebonden zijn aan de software van een specifieke leverancier. Soms kan het daarbij om een min-of-meer breed gedragen standaard gaan. Geaccepteerd: Wordstar; WP; Word; Macwrite; OpenOffice; rtf; pdf; postscript
Gegevenstabellen Verzameling van gestructureerde (genormaliseerde) gegevens in de vorm van een lijst of tabel waarin voor alle waarnemingen dezelfde kenmerken zijn vastgelegd. Database (tabellen) Gaccepteerd: dBASE; Access; Foxpro; Clarion; Paradox; Filemaker Pro Spreadsheets (werkbladen) Geaccepteerd: Lotus 1-2-3; Quatro Pro; Excel Speciale aandachtpunten: • Individuele (platte) gegevenstabellen kunnen ook als tekst, value delimited, bestanden worden gedeponeerd. Per (tekst)regel worden dan alle kenmerken van één waarneming achter elkaar vermeld. Dat kan in de vorm van een vaste (kolom)opmaak (fixed width) of met behulp van een (veld)scheidingsteken. Er zijn daarbij een aantal gangbare delimiters mogelijk, zoals een komma (,), punt-komma (;), pipe (|) of tab. Bij het gebruik van leesteken om de velden van elkaar te scheiden moet er op worden gelet dat hetzelfde tekens niet ook in de inhoud van de velden (tekstwaarden) voorkomen. Het geniet daarom de voorkeur om bij tekstuele velden de waarde te omgeven door dubbele quotes (“). De Nederlandse notatie van een getalswaarde met een decimale komma (,) vraagt in dit opzicht om speciale aandacht op het moment dat de komma als delimiter wordt gebruikt. Het decimale scheidingsteken in getallen en geldbedragen moet dan bij voorkeur, voorafgaand aan het exporteren, op een decimale punt (.) worden ingesteld.
63
64
Wegwijzer Digitaal Deponeren – Archeologie
• De datadictionary, waarin de tabelstructuur (veldnamen, -lengte en -types, de sleutelvelden en de samenhang tussen de tabelen) en betekenis van de gebruikte afkortingen in de waarden (codeboek) worden gedocumenteerd, is belangrijke, aanvullende documentatie. Alleen hiermee wordt de inhoud van gegevenstabellen expliciet duidelijk voor andere onderzoekers. • Spreadsheets kennen niet de logische en syntactische controles van een database. In een kolom waar een getalswaarde ingevuld moet worden, kan in een spreadsheet zonder problemen een tekst worden ingevuld. Zo kan in een kolom vondstnummer de vermelding “onbekend?” worden opgenomen, zonder dat de software dat voorkomt. Op zich is dat, mits goed gedocumenteerd, geen probleem. Het heeft echter gevolgen voor de manier waarop andere gebruikers die gegevens weer kunnen inlezen. In principe moet zo’n kolom dan als tekstveld worden gedefinieerd en zijn er geen mogelijkheden (meer) voor een numerieke analyse (laagste; hoogste waarde).
Statistische bestanden Veelal platte (bewerkte) gegevenstabellen, die de basis vormen voor een statistische of grafische analyse. Geaccepteerd: SPSS (portable); SAS (alleen PC-versies); STATA Speciale aandachtspunten: • Omdat het veelal gaat om platte gegevenstabellen, is ook een aanlevering in value delimited vorm mogelijk. Daarbij gelden dan dezelfde aandachtpunten als bij de gegevenstabellen. • SPSS portable wordt veel toegepast omdat daarin ook de datadictionary en het codeboek zijn gevat (variabele- en value-labels)
Cartografische gegevens CAD Vectortekeningen, waarvan de positie van de cartografisch objecten in een betekenisvol (geografisch) coördinaatstelsel is vastgelegd. Geaccepteerd: AutoCAD (incl. Lite versies); SVG GIS (vector) Vectortekeningen, waarin naast de geografisch posititie, tevens inhoudelijke kenmerken (attributen) aan het cartografisch object gekoppeld zijn.
Te deponeren bestandstypen
Geaccepteerd: ArcView; ArcGIS; MapInfo; GML Speciale aandachtspunten: • ESRI Shape files en het mif/mid-export formaat van MapInfo worden veelal als uitwisselingsstandaard toegepast. • GIS-gegevens bestaan, naast de cartografische (vector)elementen, ook uit (platte) tabelinformatie, waarvoor een datadictionary nodig is om de inhoud te kunnen begrijpen en hergebruiken. GIS (raster) Ruimtelijke gegevens waarin de inhoudelijke informatie in de vorm van een serie van (raster)cellen is opgeslagen in een geografisch coördinaatsysteem. Geaccepteerd: Grass; Idrisi; Surfer; MapInfo Grid (Vertical Mapper)
Beeldmateriaal Bestanden waarin beeldinformatie is vastgelegd in de vorm van een serie pixels met een kleur (bitmap images). Dit beeldmateriaal kan zowel ontstaan door achteraf een analoog origineel te scannen (scans van veldtekeningen (vlak, profielen, coupes); (lucht)foto’s; dia’s; negatieven) als door een direct digitale registratie (foto’s met een digitale camera). Geaccepteerd: tif (tiff); gif; jpg (jpeg); bmp; png; PhotoCD en andere. Photoshop; Paint Shop Pro Specifieke aandachtpunten: • Er is (in de loop der tijd) een groot aantal verschillende bestandsformaten voor digitaal beeldmateriaal in omloop gekomen.Veelal kunnen deze, met de huidige software, eenvoudig worden omgezet. Dit kan zelfs geautomatiseerd plaatsvinden voor grote hoeveelheden bestanden. • De resolutie van een bitmap image is een veel besproken, maar relatief begrip. Het heeft ten eerste zowel betrekking op het aantal pixels (horizontaal oplossend vermogen, veelal uitgedrukt als dpi) als de kleurdiepte (het maximale aantal bits dat de kleur beschrijft). Tevens geldt dat het aantal dpi’s alleen een betekenis heeft in samenhang met de fysieke grootte van het origineel. • Bepaalde bestandsformaten ondersteunen slechts een beperkte maximale kleurdiepte (bijv. gif). • Bestandscompressie wordt, vanwege de grote omvang van de digitale beelden, zeer veelvuldig toegepast. Er zijn technieken die alle oorspronkelijke informatie ongemoeid
65
66
Wegwijzer Digitaal Deponeren – Archeologie
laten (lossless compressie), waar andere technieken (beperkt) informatieverlies tot gevolg hebben (lossy compressie). • Het breed toegepaste jpg-formaat kent door de manier waarop de compressie wordt uitgevoerd, met verlies aan inhoudelijke informatie, een specifiek probleem. Bij conversie ligt (aanzienlijk) kwaliteitsverlies op de loer. Als er bij digitale opnames (camerainstelling) een (zeer) kleine bestandsomvang wordt nagestreefd leidt dat uiteindelijk tot een beperkte (documentaire) kwaliteit.
Opmaak DTP Documenten waarin de (gehele) pagina-opmaak van een publicatie is vastgelegd, zowel met teksten als met afbeeldingen, noten, kaders en/of grafische elementen. Geaccepteerd: Quark Xpress; PageMaker; InDesign Opgemaakte tekeningen Vectortekeningen waarin de positie van de grafische (vector)objecten is vastgelegd. De positie van de objecten is niet in een geografisch coördinaatsysteem vastgelegd, maar in relatie tot de positie op “papier”. Geaccepteerd: CorelDraw; Freehand; Illustrator
Overige applicaties Virtual reality: VRML Meetresultaten van geofysische of landmeetkundige (incl. TS en GPS) apparatuur: tekstexport Bestanden met audio en video (fragmenten): WAV; MP3; MPEG; AVI Specifieke maatsoftware (bijv. Tilia; Grappa): tekst-export
6.2 Voorafgaand aan de deponering Bovenstaande lijst is niet uitputtend en kan dat ook nooit zijn. De ontwikkelingen op dit gebied volgen elkaar in hoog tempo op. Het e-depot tracht een zo breed mogelijk scala aan computerprogrammatuur en oude PC’s beschikbaar te hebben, dan wel over goede bestandsconverters te beschikken, waarmee specifieke formaten kunnen worden ingelezen, gecontroleerd en omgezet. De deponeerder mag in principe de digitale bestanden in zijn eigen (native) formaat aan het e-depot overdragen. Het e-depot zal zorgdragen voor een conversie naar een duurzaam archiefformaat.
Te deponeren bestandstypen
In voorkomende gevallen zal, in overleg tussen de deponeerder en het e-depot, moeten worden gekeken of er een (software)conversie nodig is en zal worden afgesproken door wie en hoe de conversie zal worden uitgevoerd. Geadviseerd wordt om, bij twijfel, reeds in een vroegtijdig stadium contact op te nemen met het e-depot. Ook voor verouderde bestandsdragers (media) zal, in overleg, worden bekeken of en hoe er een omzetting naar een actueel medium, ergens in Nederland, kan worden geregeld.
67
68
Wegwijzer Digitaal Deponeren – Archeologie
Doelstellingen en uitgangspunten van digitale duurzaamheid
69
70
Wegwijzer Digitaal Deponeren – Archeologie
Doelstellingen en uitgangspunten van digitale duurzaamheid
– 7– Handleiding EASY
DANS heeft een eigen document management systeem ontwikkeld, dat specifiek gericht is op het deponeren, duurzaam archiveren en opvragen van digitale gegevensbestanden (datasets). Dit systeem, dat EASY (electronic archiving system) heet, is nieuw en zal nog regelmatig met nieuwe functionaliteiten worden uitgebreid. Een gedrukte gebruikershandleiding als deze, gebaseerd op EASY v.1.3, kan daarom soms afwijken van de nu online beschikbare versie (easy.dans.knaw.nl). Op de website van het e-depot (www.edna.nl) is een pdf-versie van deze Wegwijzer Digitaal Deponeren beschikbaar. Dit hoofdstuk zal daarin worden bijgewerkt, om de ontwikkeling van EASY bij te kunnen houden. EASY is zowel bedoeld voor de deponeerder als voor de data-archivaris en de hergebruiker. In één web-based systeem is specifieke functionaliteit ingebouwd voor elk van de verschillende rollen en uit te voeren taken. In dit hoofdstuk komen alleen de stappen aan bod die een deponeerder moet doen om een dataset te kunnen uploaden. Voor data-archivarissen en hergebruikers komen afzonderlijke gebruikershandleidingen beschikbaar. Voor de deponeerder zijn de volgende stappen belangrijk: 1. Inloggen als EASY gebruiker 2. Deponeren van een dataset 3. Verwerking van de dataset door data-archivaris (activiteit e-depot) 4. Controleren van de presentatie in EASY Bij de ontwikkeling van EASY is zo veel mogelijk rekening gehouden met de wensen van de verschillende gebruikers en is door middel van een testpanel onderzocht of het gebruikersgemak (usability) en de functionaliteit voldoen. Feedback in de vorm van problemen, onduidelijkheden en nieuwe wensen wordt zeer gewaardeerd en kan bij DANS worden gemeld ([email protected]).
71
72
Wegwijzer Digitaal Deponeren – Archeologie
7.1 Inloggen en registreren als nieuwe gebruiker Ga in uw webbrowser naar: http://easy.dans.knaw.nl
Kies in EASY voor: Login (linker menu, bovenaan) Beschikt u nog niet over een eigen gebruikersnaam in EASY, dan kunt u zich op het inlogscherm (kies: Login) eerst registreren en een gebruikersaccount aanvragen, via Register now! Deze procedure is eenmalig. Na het invullen van alle gegevens zal via Register de procedure worden gestart waarmee een account wordt aangemaakt.
U krijgt, op het door u vermelde adres, een e-mail bericht. Volg de instructies in die e-mail om de registratieprocedure af te ronden.
Handleiding EASY
Vul de persoonlijke gegevens zo compleet mogelijk aan en kies: Save
U bent nu ingelogd bij EASY en het bovenste deel van het linkermenu zal aangepast zijn aan de taken die u binnen EASY kunt vervullen.
Het item van de menubalk dat in hoofdletters staat vermeldt, geeft aan waar u zich in EASY op dat moment bevindt. Het linkermenu geeft niet alleen direct toegang tot deze items, maar ook tot andere functies en datasets van andere vakgebieden in EASY. Hier kunt u via My Personal Information uw contactgegevens op een later tijdstip weer wijzigen (Edit). EASY zal via een e-mail bericht na verloop van tijd vragen of deze gegevens nog steeds kloppen. Gebruik bij voorkeur dat moment ook om uw wachtwoord te vernieuwen (Change Password).
73
74
Wegwijzer Digitaal Deponeren – Archeologie
Alle beschrijvende informatie over een onderzoeksproject en de bestanden (metagegevens) zijn altijd voor iedereen (geregistreerde en ongeregistreerde gebruikers van EASY) toegankelijk. Andere onderzoekers moeten immers in staat zijn om de digitale bronnen te kunnen ontdekken en beoordelen of de bestanden voor hun onderzoek waardevol kunnen zijn. DANS is in principe een voorstander van Open Access: alle digitale informatie is vrij toegankelijk voor iedereen. De gearchiveerde bestanden in EASY zijn echter uitsluitend toegankelijk voor andere geregistreerde EASY-gebruikers. De registratie verloopt volledig automatisch en met een geldig e-mail adres wordt niemand geweigerd. Veel archeologen hebben in de pilot-fase van het e-depot aangegeven dat archeologische publicaties en datasets vertrouwelijke informatie kunnen bevatten. Informatie waarvan de onderzoeker of de opdrachtgever niet altijd wil dat deze (direct) volledig vrij beschikbaar komt op het internet. Voor de Nederlandse archeologen is er dus een restrictievere toegang nodig dan standaard in EASY wordt toegepast. Tenzij de deponeerder zelf voor open access kiest, zijn de archeologische datasets in EASY alleen toegankelijk voor personen of organisaties die in de (Nederlandse) archeologie werkzaam zijn. Het e-depot kent wat dit betreft hetzelfde restrictieve toegangsbeleid als Archis. Ook dat is een informatiesysteem waarmee onderling, voor en door archeologen, informatie en kennis wordt uitgewisseld. Binnen het werkveld is er een vrije toegang tot elkaars onderzoeksresultaten, zodat we zo goed mogelijk in staat zijn de bestaande archeologische gegevens te gebruiken bij de planning van nieuwe onderzoeksprojecten of de interpretatie van de vondsten. In EASY geldt daarom (by default) een restricted access tot alle archeologische datasets. Alleen de gebruikers van EASY die ook als archeoloog geregistreerd staan, hebben toegang tot uw databestanden. Om als archeoloog toegang te krijgen tot alle (andere) archeologische datasets moet u aan de gebruikersgroep archaeologists worden toegevoegd. Op het scherm My personal information kunt u zien tot welke gebruikersgroep(en) u op dit moment behoort.
Op het moment dat u de eerste keer toegang wenst tot de bestanden van een archeologische dataset wordt er een e-mail bericht samengesteld dat aan DANS vraagt of u toegevoegd kan worden aan de group archaeologists. In principe moet elke archeoloog zondermeer en op korte termijn toegang tot de archeologische datasets kunnen krijgen. In individuele gevallen zal, in samenspraak met de RACM, door DANS nader worden onderzocht of iemand toegang krijgt. Daarbij zou bijvoorbeeld een archeologisch beroepsregister en/of de vergunningverlening een rol kunnen (gaan) spelen, maar in principe komen de personen die werkzaam zijn bij één van de volgende instellingen in aanmerking: • een archeologie opleiding aan een universiteit of hogeschool • een archeologisch bedrijf, dat zich bijvoorbeeld bezig houdt met advies, directievoering, uitvoerend (veld)werk – waaronder bureaustudies, verkenningen, opgravingen, begeleiding – en/of specialistisch onderzoek. • een archeologische afdeling of dienst van een gemeentelijke, provinciale en landelijke overheid
Handleiding EASY
of personen die een archeologische studie volgen aan: • een universiteit of hogeschool (masterstudenten voor een scriptieonderzoek) Het eventueel weigeren van de toegang tot de archeologische datasets zal altijd met opgave van de redenen worden gemeld. U kunt er als deponeerder ook voor kiezen om zelf de toegang tot uw dataset te blijven controleren. EASY biedt daarvoor een vorm van restricted access onder de naam: special permission. Een andere geregistreerde gebruiker van Easy zal u persoonlijk om toestemming moeten vragen, voordat de bestanden toegankelijk worden gemaakt voor die specifieke gebruiker. De groep gebruikers die een zogenaamde special permission request bij u kan indienen, is niet beperkt tot de Nederlandse archeologen, maar ook buitenlandse collega’s of wetenschappers uit een ander vakgebied kunnen een aanvraag doen. Op het moment dat een andere geregistreerde EASY gebruiker toegang wenst tot de bestanden van de door u op deze wijze “beschermde” dataset, wordt er een special permission request ingediend.
Nadat een andere onderzoeker de omschrijving van het onderzoeksproject waarvoor de gegevens nodig zijn heeft ingevuld, wordt dit verzoek bij u ingediend. U ontvangt een e-mail bericht waarin wordt vermeld dat er een special permission request voor één van uw datasets is binnengekomen en wordt verzocht om in te loggen in EASY. U kunt dan, op individuele basis, besluiten of u toegang tot de bestanden verleent of weigert. Bij de gebruiker die het verzoek heeft ingediend, zal bij de special permission request de status van het verzoek (uw antwoord) worden vermeld (Review request).
7.2 Deponeren van een dataset Kies eventueel eerst: Deposit Dataset (in het linker menu) Kies: Deposit Dataset!
EASY is opgezet om voor verschillende wetenschapsgebieden de duurzame archivering van datasets te kunnen verzorgen. Per discipline is het karakter van de datasets vaak zeer verschillend. Ook de beschrijvende informatie over dataset is discipline specifiek. Zo is
75
76
Wegwijzer Digitaal Deponeren – Archeologie
het voor archeologen bijvoorbeeld belangrijk om te kunnen zoeken op de datering en het type vindplaats. Informatie die in de metadata moet worden meegegeven, maar die bijvoorbeeld bij een sociaal wetenschappelijk onderzoek irrelevant is. In EASY is daarom enerzijds een algemeen en kort beschrijvingsformulier beschikbaar voor elk onderzoek (Social sciences and humanities). Anderzijds zijn er discipline specifieke beschrijvingsformulieren, archeologie is één daarvan.
Overigens worden de metagegevens van alle datasets van alle disciplines, op de achtergrond uniform vastgelegd met behulp van de (qualified) Dublin Core metadata standaard. Het Dublin Core beschrijvingssysteem wordt wereldwijd toegepast voor het kunnen (terug)vinden van elektronische informatie (electronic resources). Dit beschrijvingssysteem bestaat in principe uit slechts vijftien elementen. Dit maakt het heel eenvoudig, breed toepasbaar en adequaat genoeg voor het opzoeken van beschikbare digitale bronnen. Kies achter Archaeology voor: Start Hiermee wordt een proces in gang gezet waarmee er een qualified Dublin Core beschrijving van het onderzoeksproject wordt gemaakt en de bestanden ge-upload kunnen worden. De beschrijvende elementen zijn over meerdere schermen verdeeld en worden automatisch opgeslagen op het moment dat u naar een volgend/vorig scherm gaat. Via de knop Save wordt handmatig de opdracht gegeven om tussentijds de veranderingen op het scherm op te slaan. U kunt op ieder moment het beschrijvingsproces afbreken en er op een later tijdstip weer aan verder werken. Na het inloggen, verschijnt er automatisch een lijstje van (draft) datasets waaraan u op dit moment nog werkt (kies in het linker menu: My Deposited Datasets). Om de werkzaamheden te vervolgen, kiest u de Edit-knop achter de betreffende dataset. Ook het uploaden van de bestanden kan in één of meerdere sessies verlopen. Pas als u vindt dat alles volledig is afgerond, geeft u via Submit (op het laatste scherm) aan
Handleiding EASY
dat een data-archivaris bij DANS de taak van u mag overnemen. Na Submit verschuift de betreffende dataset in de lijst van My Deposited Datasets van Drafts naar Submitted en kunt u deze niet meer wijzigen, tenzij de data-archivaris u de dataset voor correcties of aanvullingen ‘teruggeeft’.
Voor de beschrijving van de archeologische datasets zijn er zes schermen (Panes) die doorlopen moeten worden, te weten: • primaire informatie en intellectueel eigendom • beschrijvende informatie over het gehele onderzoeksproject (research project) • beschrijvende informatie over de digitale bestanden (digital files) • opsturen van de bestanden (upload files) • toegangsrechten en hergebruiksvoorwaarden (rights) • controle en versturen (overview en submit) Dit lijkt in eerste instantie wellicht veel werk, maar dat valt in de praktijk bijzonder mee. Lang niet alle velden moeten worden ingevoerd. Verplicht zijn slechts zes Dublin Core velden, te weten: Title, Creator, Date created, Description, Access rights en License. Dit komt mede doordat datasets flexibel moeten kunnen worden beschreven, bijvoorbeeld voor onderzoeksprojecten in het buitenland of onderzoek dat niet in Archis wordt gemeld (zoals materiaalstudies en studentenprojecten). Het vastleggen van metadata wordt gezien als een verrijking. Hoe meer velden er nauwkeurig worden ingevuld: • des te beter de dataset kan worden (terug)gevonden, • des te beter de structuur en inhoud door een andere archeoloog begrepen kan worden en • des te kleiner de kans op misverstanden of verkeerd gebruik. Tegelijkertijd probeert EASY op twee manieren het beschrijven voor u zo gemakkelijk mogelijk te maken. Zo bestaat er de mogelijkheid om de metagegevens van een andere dataset, die u eerder in EASY heeft ingevoerd, te importeren en als basis te gebruiken voor
77
78
Wegwijzer Digitaal Deponeren – Archeologie
een nieuwe deponering. Daartoe moet u aan het begin van het deponeringsproces niet kiezen voor Deposit now!, maar voor Re-use achter één van de bestaande gedeponeerde datasets (Submitted of Published). Daarnaast bestaat er de mogelijkheid om, indien van toepassing voor het betreffende onderzoek, de overeenkomstige gegevens uit de bijhorende Archis-onderzoeksmelding te importeren. Op deze manieren is getracht de hoeveelheid werk voor de deponeerder zoveel mogelijk te beperken.
Pane 1. Primaire informatie en intellectueel eigendom
Het uniek identificeren van elk archeologisch onderzoek in Nederland is heel belangrijk. Alleen dan is éénduidig vastgelegd bij welk onderzoeksproject deze dataset hoort. In het verleden is daar vaak de combinatie van (gemeente), plaats en toponiem (HardinxveldGiessendam – Polderweg of Urk – P14) of de ROB-objectcode (52BN-201) voor gebruikt. Enkele jaren is in de Nederlandse archeologie sprake geweest van een CIS-code (Centraal Informatie Systeem, Archis). Daar Archis echter verschillende identifiers kent, bijvoorbeeld voor vondstmeldingen, waarnemingen en onderzoeksmeldingen, is dit tot op heden niet eenduidig toegepast. Met de RACM is nu afgesproken dat alle meldingsplichtige onderzoeksprojecten uniek geïdentificeerd moeten worden door middel van het Archisonderzoeksmeldingsnummer. Het vermelden van dit unieke nummer maakt het meteen mogelijk om de beschikbare informatie uit Archis in EASY te importeren. Er kan maar één onderzoeksmeldingsnummer bij een dataset worden vermeld. Dit eerste scherm bevat verder de primaire informatie over het onderzoeksproject waartoe de te deponeren bestanden behoren. Bij het citeren van een publicatie worden altijd de auteur(s), titel en datum gebruikt om naar te verwijzen. Een vergelijkbaar principe geldt
Handleiding EASY
ook voor datasets: de primaire verantwoordelijke voor het onderzoeksproject (projectleider), de naam waaronder het project bekend is (of titel van het rapport) en de datum waarop het onderzoek en de bijbehorende gegevens zijn afgesloten worden gedocumenteerd om te kunnen gebruiken bij het citeren. Daar wordt door EASY automatisch nog een uniek, duurzaam webadres (persistent URL) aan toegevoegd. Deze beschrijving kan, indien daar behoefte aan bestaat, bijvoorbeeld nog worden uitgebreid met aanvullende informatie over andere personen en organisaties (contributors, copyright holder, publisher) die bij de tot stand komen van de dataset een rol spelen. Een subtitel of een alternatieve titel (vertaald in een andere taal) kan ook als aanvulling worden gedocumenteerd. De alternatieve titel snijdt meteen een ander onderwerp aan, namelijk dat van de taal waarin de beschrijvende informatie moet wordt gedocumenteerd. Er wordt in EASY geen taal verplicht voorgeschreven, maar het advies is om dezelfde taal te gebruiken waarin de gegevens zijn vastgelegd. Bij datasets in het Engels, wordt een metabeschrijving in het Engels gemaakt. Als de inhoud van een database uit Nederlandstalige gegevens bestaat (type = vuursteen; grondspoornr = 3), is een Engelstalige beschrijving weinig zinvol. Een buitenlandse onderzoeker zal dan wel in staat zijn om aan de hand van de Engelstalige metabeschrijving de dataset te vinden, maar op het moment dat hij/zij deze gegevens wil hergebruiken, ontstaat er alsnog een taalprobleem. Vul de velden van het Dublin Core formulieren dan dus in het Nederlands in. Dit advies betekent wel dat een Nederlandse onderzoeker bij het zoeken trefwoorden in meerdere talen zal moeten invoeren, bijvoorbeeld steentijd en Stone age. Precies dezelfde beperking ondervinden we overigens dagelijks op het moment dat we op het internet iets willen opzoeken. Een vertaling van de titel (bij alternative title) van een Nederlandstalig onderzoek is een snelle, eenvoudige manier om de trefkans bij het zoeken te vergroten. Het idee achter Dublin Core is dat elk veld in principe herhaalbaar is. Dat wil zeggen dat als er meerdere primaire verantwoordelijken (creators) zijn, deze in aparte velden worden ingevoerd. Achter de meeste velden van het formulier staat een [+]-knop, waarmee een extra invulveld kan worden toegevoegd. Overigens staat Dublin Core het wel toe om meerdere waarden in één veld te plaatsen, mits deze waarden door een “; “ van elkaar gescheiden worden (creator: Jansen R.; Fokkens H.).
Pane 2. Beschrijvende informatie over het gehele onderzoeksproject Het tweede scherm bevat de informatie die het gehele onderzoeksproject inhoudelijk beschrijft. De samenvatting (description, waarmee in één alinea van vrije tekst het project gekenschetst wordt, en het toekennen van diverse trefwoorden (subject en coverage) vormen een belangrijk onderdeel.
79
80
Wegwijzer Digitaal Deponeren – Archeologie
Bij het invullen van de DC-elementen kan nader worden gespecificeerd wat er precies mee wordt bedoeld. Zo kent bijvoorbeeld het element datum (Date) de mogelijkheid om aan te geven of het daarbij gaat om de datum waarop het document is gemaakt (created) of waarop het beschikbaar komt (available). Dit geschiedt met de zogenaamde DC-qualifiers. Deze toevoeging staat, indien van toepassing, apart vermeld achter het DC-element. Het element coverage kent een onderscheid tussen de ruimtelijke locatie waar het onderzoek heeft plaats gevonden (coverage spatial) en de archeologische periode (datering) waarop het onderzoek betrekking heeft (coverage temporal). In Dublin Core is het gebruik van de qualifiers overigens niet verplicht. Als er geen nadere specificatie wordt opgegeven wordt het hoofdelement aangehouden of een default betekenis verondersteld. Dit zal overigens het kunnen terugvinden van een dergelijke resource slechts in beperkte mate beïnvloeden. Bij het invullen van de Dublin Core elementen wordt in principe vrije tekst gebruikt. U kunt, omdat u de dataset het beste kent, in uw eigen bewoordingen het best een beschrijving geven. Gebruik bij voorkeur korte formuleringen met begrippen die de datasets het
Handleiding EASY
best karakteriseren. Door de vrije tekst is het maken van een beschrijving heel eenvoudig, maar het systematisch opzoeken wordt een stuk lastiger. Een eindgebruiker zal moeten inschatten welke begrippen u in de vrije tekst heeft gebruikt. Binnen Dublin Core kan bij het invullen van de elementen ook gebruik worden gemaakt van een vaste formulering of woordenlijst. Soms is dit een international afgesproken trefwoordenlijst, zoals bij Type, waarvoor een zogenaamde DCMI-Type referentielijst bestaat (Dataset; Text; Image; Sound; Collection). Hetzelfde geldt voor Language (ISO639) en Format (Internet Media Type). Het gebruik van een trefwoordenlijst wordt vastgelegd met een zogenaamd schema (scheme). Ook het gebruik van een schema is niet verplicht en er kan nog steeds vrije tekst worden ingevuld. Daar waar een schema wordt gekozen, moet de inhoud van het veld natuurlijk wel in overeenstemming zijn met dat schema. Als er een schema (voor)gedefinieerd is, zijn de invulmogelijkheden beperkt via een keuzelijst. Sommige schema’s zijn specifiek voor de Nederlandse archeologie. Zo is er voor gekozen om bij Subject het ABR complextype (Archeologisch Basis Register, Archis 1992) te gebruiken om het type vindplaats te beschrijven en bij Coverage temporal worden de ABR-afkortingen voor de datering aangehouden. Door deze termen te gebruiken, wordt het mogelijk om gerichter te zoeken. Door de coördinaten te documenteren (coverage spatial point of box; scheme verplicht), kan de vindplaats automatisch op een verspreidingskaart worden getoond (geografisch zoeken). Zoals vermeld zijn de DC-velden herhaalbaar ([+]). Op dit tweede scherm zijn er bij enkele elementen ook meerdere opties/ gebruiksvormen gedefinieerd. Coverage spatial is er als vrij tekstveld, als een point (2 coördinaten) en als een box (4 coördinaten). Coverage spatial is geen verplicht veld, zodat u geen, één of meerdere van deze opties mag invullen. Een voorbeeld hiervan ontstaat op het moment dat u Archis gegevens heeft geïmporteerd: coverage spatial wordt 4 x herhaald voor provincie, gemeente, plaats en toponiem.
81
82
Wegwijzer Digitaal Deponeren – Archeologie
Pane 3. Beschrijvende informatie over de digitale bestanden
Het derde scherm bevat de (samenvattende) informatie over de gedeponeerde digitale bestanden. Het omvat zowel technische aspecten (type en formaat) als inhoudelijke kenmerken (language, date, source). Wederom zijn er per element soms meer manieren waarop een beschrijving gemaakt kan worden. Zo kent Format een vaste thesaurus (scheme) en een vrije tekst invoer. Sommige elementen zullen hier veelvuldig herhaald (moeten) worden, zoals Format. Gebruik dan bij voorkeur de [+]-knop.
Pane 4. Uploaden van bestanden
Handleiding EASY
Voor het opsturen van de bestanden van uw onderzoeksproject is een eenvoudige webgebaseerde File explorer beschikbaar, waarmee u de bestanden van Uw eigen PC naar EASY kunt kopiëren.
Hoe hier precies te handelen is echter afhankelijk van de omvang van uw datasets. Bij onderzoeksprojecten waarbij slechts een beperkt aantal digitale bestanden is aangemaakt, kan het uploaden één voor één gebeuren. Bij een omvangrijkere dataset wordt geadviseerd om eerst op uw eigen PC de gehele projectdirectory samen te bundelen tot één ZIP-bestand. Daarbij moet er op worden gelet dat de directory-structuur opgenomen wordt in het ZIP-bestand (soms is daar een speciale instelling van het ZIP-programma voor nodig). Bij het uploaden van het ZIP-bestand zal EASY deze gecomprimeerde file zelfstandig weer uitpakken (uncompress) en alle oorspronkelijke directories en files in één keer aanmaken. Dit proces heeft natuurlijk wel enige tijd nodig, zodat het uploaden trager kan verlopen. Bij zeer omvangrijke datasets (groter dan 100 MB) wordt geadviseerd om wel alle beschrijvende gegevens van een onderzoeksproject in te vullen, maar het uploaden achterwege te laten. Stuur de bestanden op CD-ROM of DVD naar DANS, alwaar een dataarchivaris de bestanden, bij de aangeleverde projectbeschrijving, in EASY zal plaatsen.
83
84
Wegwijzer Digitaal Deponeren – Archeologie
Pane 5. Deponeren en overdracht Het vijfde scherm bevat de informatie over de manier waarop u uw gegevens weer toegankelijk wil maken. Er is, onder License, een koppeling naar een oningevuld licentiecontract, zoals dat door DANS is opgesteld. In principe verleent u DANS alleen een licentie om de gedeponeerde bestanden langs elektronische weg voor u te mogen verspreiden. U geeft, via het vinkje voor ‘I accept the terms [….]’, aan dat u deze algemene voorwaarden accepteert.
EASY is echter zo opgezet dat de deponeerder zelf kan aangeven op welke manier de gegevens door DANS toegankelijk gemaakt mogen worden. Op dit scherm kunnen, via Access rights en Date available, de hergebruiksbeperkingen van de dataset precies worden vastgelegd. De metagegevens van het project en de bestanden zijn overigens altijd volledig openbaar. Voor de bestanden kan, via Access rights, worden gekozen uit de volgende opties: Open access: I. Voor alle geregistreerde EASY-gebruikers toegankelijk Restricted Access: II. Alleen voor de bij EASY geregistreerde archeologen (default instelling) III. Alleen voor een gebruiker die u vooraf, via een speciaal e-mail bericht van EASY (Special permission request), om toestemming heeft gevraagd.
Handleiding EASY
Other access: IV. EASY biedt geen toegang tot de bestanden en zorgt alleen voor de archivering. Dit is alleen mogelijk als de data op een ander (web)adres toegankelijk zijn. Vermeld dan bij Relation (requires) wel op welke URL dit het geval is. In principe (default instelling) worden de bestanden per direct beschikbaar gesteld. Er kan echter, via Date available, een tijdelijk embargo worden afgesproken voor maximaal twee jaar na de deponeringsdatum (met de mogelijkheid tot éénmalige verlenging). De hierboven door u gekozen hergebruiksbepalingen zullen in het definitieve licentiecontract, dat u zal worden toegestuurd, worden opgenomen. Aan die licentie zal ook een volledige lijst van gedeponeerde bestanden worden toegevoegd. Tenslotte kunt u beschrijven of er voor specifieke, met naam genoemde, bestanden afwijkende beperkingen moeten gelden. Daarvoor is een vrij tekstveld Remarks beschikbaar. Hier kan ook andere voor de dataset belangrijke informatie worden vastgelegd.
Pane 6. Samenvatting en versturen
Als alle verplichte velden zijn ingevuld en u volledig tevreden bent met de beschrijving van de bestanden kunt u via Submit het deponeringsproces afsluiten en de dataset overdragen aan een data-archivaris bij DANS. Bij het opsturen (submit) wordt gecontroleerd of alle verplichte velden (met een rood sterretje gemarkeerd) wel zijn ingevuld. Bij het succesvol opsturen verschijnt in het scherm de unieke door DANS aan de datasets toegewezen identificatie (persistent identifier).
85
86
Wegwijzer Digitaal Deponeren – Archeologie
Tevens ontvangt u een bevestiging per e-mail, waarin de metadata en licentie zijn opgenomen.
7.3 Verwerking van de dataset door de data-archivaris Een data-archivaris zal de dataset nu verder gaan verwerken. Dit zal bestaan uit het controleren van de Dublin Core-beschrijving en de leesbaarheid van de aangeleverde bestanden. Bij elke dataset moet er ook een aantal afzonderlijke metadocumenten zijn gevoegd (zie hoofdstuk metagegevens). Het gaat daarbij om een gedocumenteerde bestandenlijst (file metadata) en codeboeken (attribute metadata). Upload deze bestanden, als onderdeel van de dataset, mee in een aparte directory. Op basis van de bestandenlijst kan worden gecontroleerd of de dataset compleet is aangeleverd en alle bestanden adequaat beschreven zijn. Alle bestanden zullen, indien dat nog niet is gebeurd, door de data-archivaris naar een duurzaam digitaal bestandsformaat worden omgezet. Dit preservation format is veelal een eenvoudig tekstueel bestandsformaat dat ook voor de uitwisseling wordt gebruikt (csv, dxf, mif/mid). De bestanden worden zowel in het aangeleverde, oorspronkelijke (native) formaat gearchiveerd, als in het preservation format. In de presentatie van het onderzoeksproject worden uiteindelijk de bestanden alleen in het preservation format getoond. Dit om zo veel mogelijk onderzoekers, met hun eigen software, de kans te geven deze gegevens te gebruiken. De data-archivaris zal, als daar bijvoorbeeld om reden van duidelijkheid aanleiding toe is, bij de presentatie van de dataset de directory-structuur, de bestands- of foldernamen aanpassen. Daarnaast wordt de mogelijkheid geboden om voor een project een opgemaakte webpagina, project startpagina of jump-off page, te laten maken. Bij het deponeren moet u daarvoor zelf de tekst en afbeeldingen (waaronder eventueel project- of bedrijfslogo’s) aanleveren. Vooralsnog zal de data-archivaris deze pagina in EASY opmaken. Plaats de bestanden voor deze jump-off pagina bij voorkeur in een aparte folder bij het deponeren.
Handleiding EASY
7.4 Controle van de presentatie in EASY Als deponeerder krijgt u voor het online vrijgeven van de dataset de gelegenheid de presentatie (jump-off page, bestanden in preservation format en voorzien van file-metadata) te controleren. Daarna zal de dataset onder de door u gedefinieerde beperkingen toegankelijk worden in EASY. Daarbij zal de dataset, bij My deposited datasets, verschuiven van Submitted naar Published en is het deponeringsproces volledig afgerond.
87
88
Wegwijzer Digitaal Deponeren – Archeologie
– Bijlage 1 – Contactgegevens DANS en RACM
DANS Archeologische gegevensbestanden (datasets) Contactpersoon: Milco Wansleeben Postadres: Postbus 93067, 2509 AB Den Haag Bezoekadres: Anna van Saksenlaan 51, 2593 HW Den Haag Telefoon: 070 – 3494450 e-mail: [email protected] web : www.dans.knaw.nl e-archief : easy.dans.knaw.nl e-aanlevering: [email protected]
RACM (Locatie Amersfoort) Digitale archeologische publicaties ( pdf) Archis-meldpunt Contactpersoon: Arthur Sloos Postadres: Postbus 1600, 3800 BP Amersfoort Bezoekadres: Kerkstraat 1, 3811 CV Amersfoort Telefoon: 033 – 4217421 e-mail: [email protected] web: www.racm.nl e-archief: archis2.archis.nl livelink.archis.nl e-aanlevering: [email protected] Bibliotheek Contactpersoon: Joop VanderHeiden web: bibliotheek.archis.nl
Bijlagen
– Bijlage 2 – Elementen voor de beschrijving van de individuele bestanden
Beschrijvingselementen per bestand tag description file_category indelingsgroep file_name oorspronkelijke naam bestand file_content beschrijving bestandsinhoud archival_name bestandsnaam in archiefformat file_required naam noodzakelijk bestand (mif als archival_name mid) file_type technische bestandsspecificatie data_format digitaal gegevensmodel software toepassingsprogrammatuur hardware computertype original_OS operation system archival_format opslagformat (mif, mid, txt, csv) file_size grootte in Kb of Mb data_collector verzamelaar van de gegevens collection_date verzamelperiode time_period periode waarop de data betrekking hebben purpose verzameldoel collection_mode methode van verzamelen gegevens collection_situ omstandigheden bij verzamelen gegevens sample_proc steekproef methode analytic_units waarnemingseenheid instruments onderzoeksinstrumenten data_appreciation data kwaliteit inschatting control_ops data controle(s) clean_ops opschonen van de gegevens data_missing inschatting compleetheid case_quantity aantal waarnemingen var_quantity aantal variabelen geog_cover geografisch ligging (coordinaten, begrenzingskader) geog_unit geografische eenheden (km., m., graden) spatial_object ruimtelijke objecttype (vector, raster) vector_type soort vector objecten
89
90
Wegwijzer Digitaal Deponeren – Archeologie
Beschrijvingselementen per bestand tag description aantal vector objecten vector_count raster_type soort raster objecten row_count aantal rijen in raster column_count aantal kolommen in raster mapprojection lengte/breedte, kaartprojectie of locaal local_georef lokaal naar landelijk of lengte/breedtegraden altitude_datum hoogtemetingen referentieniveau depth_datum referentieniveau voor dieptebepaling, bijv. – maaiveld position_accuracy nauwkeurigheid positiebepaling altitude_accuracy nauwkeurigheid z-metingen source_document type en schaal brondocument (kaart, luchtfoto) source_lineage bronbehandeling, afgeleide informatie procedures othmat_label gerelateerd materiaal omschrijving othmat_citation gerelateerd materiaal verwijzing othmat_codebook bestandsnaam codeboek notes opmerkingen
Bijlagen
– Bijlage 3 – DANS Licentie overeenkomst archeologie
Licentie overeenkomst Bij deze licentie overeenkomst zijn de volgende partijen betrokken: de organisatie of de persoon die gerechtigd is de digitale dataset(s) over te dragen en in beheer te geven, hierna te noemen: de depotgever de organisatie die gerechtigd is de digitale dataset(s) te archiveren en te beheren, hierna te noemen: de depotnemer De depotgever is: De rechtspersoon, die geregistreerd is bij de depotnemer en waarbij de actuele, persoonsgegevens als dusdanig bij de depotnemer expliciet bekend zijn. De depotnemer is: Organisatie:
DANS, Data Archiving and Networked Services, namens de KNAW (Koninklijke Nederlandse Akademie van Wetenschappen) Vertegenwoordigd door: Dr. P.K. Doorn, directeur Postadres: Postbus 93067 Postcode: 2509 AB Plaats: Den Haag Land: Nederland Telefoon: (+31) (0)70 349 44 50 E-mail: [email protected]
91
92
Wegwijzer Digitaal Deponeren – Archeologie
De volgende artikelen zijn in deze licentie overeenkomst opgenomen: 1. De licentie a. De depotgever verleent de depotnemer een licentie om digitale databestanden, hierna te noemen ‘dataset’, op te nemen in het data-archief van de depotnemer. De depotnemer verkrijgt daartoe het recht de inhoud van de dataset over te brengen op een bij de depotnemer beschikbare drager, ongeacht op welke wijze en in welke vorm. b. De depotnemer is gerechtigd (substantiële delen van) de dataset aan derden ter beschikking te stellen, door verspreiding in enigerlei vorm. Depotnemer krijgt daarbij het niet-exclusieve recht om, al dan niet in opdracht van derden, een kopie van de dataset te maken, dan wel derden toestemming te verlenen een kopie te downloaden. 2. De depotgever a. De depotgever verklaart de (enige) rechthebbende te zijn van de dataset uit hoofde van de Databankenwet en (eventueel) de Auteurswet, dan wel in dezen te handelen met de toestemming van de (mede) rechthebbende(n). b. De depotgever vrijwaart de depotnemer van alle aanspraken die anderen jegens depotnemer zouden kunnen doen gelden ter zake van (de overdracht van) de dataset, de vorm en/of de inhoud ervan. 3. De depotnemer a. De depotnemer zal, naar beste vermogen en middelen, de gedeponeerde dataset duurzaam archiveren, leesbaar en toegankelijk houden. b. De depotnemer zal de dataset zoveel mogelijk ongewijzigd en in het oorspronkelijke software formaat houden voor zover dat mogelijk is, rekening houdend met de stand van de techniek en de kosten voor tenuitvoerlegging. De depotnemer heeft het recht om de vormgeving en/of functionaliteit van de dataset te wijzigen als dit noodzakelijk mocht zijn met het oog op de digitale duurzaamheid, verspreiding of hergebruik van de dataset. c. Indien voor één van de hierna gespecificeerde toegangscategorieën “Restricted access” of “Other access” gekozen is, zal de depotnemer, naar beste vermogen en middelen, zorgdragen voor doeltreffende (technische) voorzieningen teneinde te voorkomen dat onbevoegde derden (substantiële delen van) de dataset zouden kunnen opvragen of raadplegen. 4. De dataset a. De dataset waarop de licentie betrekking heeft, is in de bijlage bij deze overeenkomst nader gespecificeerd. Deze bijlage maakt integraal deel uit van deze overeenkomst. b. De depotgever verklaart dat de dataset overeenstemt met de daarvoor afgegeven specificatie. c. De depotgever verklaart dat de dataset geen gegevens of andere elementen bevat die in strijd zijn met de Nederlandse wet. d. De depotgever vrijwaart de depotnemer tegen alle aanspraken van anderen betreffende de inhoud van de dataset. e. De depotgever stelt de dataset aan de depotnemer ter beschikking op een wijze en via
Bijlagen
een medium dat door de depotnemer als geschikt wordt geacht. 5. Verwijderen (substantiële delen) van de dataset en/of wijzigen toegankelijkheid a. Indien daartoe zwaarwegende redenen bestaan heeft de depotgever het recht om depotnemer te verzoeken, de dataset tijdelijk of permanent niet ter beschikking te stellen aan derden. De depotnemer zal in dat geval de dataset wel in het data-archief behouden, maar vanaf dat moment derden niet langer toegang verschaffen tot de dataset. b. Indien daartoe zwaarwegende redenen bestaan heeft depotnemer het recht om de dataset geheel of gedeeltelijk uit het data-archief te verwijderen, dan wel de toegang daartoe tijdelijk of permanent te beperken of uit te sluiten. De depotnemer zal depotgever hiervan op de hoogte stellen. 6. Beschikbaarstelling aan derden a. De depotnemer zal de gehele dataset beschikbaar stellen aan derden, overeenkomstig één van de met depotgever overeengekomen toegangscategorieën: “Open access”, “Restricted access” of “Other access”, tenzij de depotgever gespecificeerd aangeeft dat individuele bestanden niet beschikbaar gesteld mogen worden. b. De depotnemer zal de dataset uitsluitend beschikbaar stellen aan derden, aan wie zij gebruiksbepalingen bekend heeft gemaakt. Tenzij met de depotgever anders is overeengekomen, gelden voor derden de algemene gebruiksbepalingen, zoals vastgesteld en beschikbaar gesteld door de depotnemer. c. Indien de toegangscategorie “Restricted access” is overeengekomen, zal de depotnemer de dataset uitsluitend beschikbaar stellen aan de personen en/of organisaties, die daartoe zijn aangewezen door de depotgever. d. Indien een dataset waarvoor een toegangscategorie “Other access” geldt en blijkens de door depotgever opgestelde specificatie, persoonsgegevens in de zin van de Wet Bescherming Persoonsgegevens WBP bevat (Wet Bescherming Persoonsgegevens, wet van 6 juli 2000, Staatsblad 302, artikel 9 lid 3 en artikel 23 lid 2), zal depotnemer de dataset uitsluitend ter beschikking stellen indien dit wettelijk is toegestaan, waaronder in ieder geval dient te worden begrepen het ter beschikking stellen ten behoeve van wetenschappelijk, statistisch of historisch onderzoek. e. In afwijking van het hiervoor bepaalde kan de depotnemer (substantiële delen van) de dataset beschikbaar stellen aan derden: • indien de depotnemer hiertoe wordt verplicht uit hoofde van wet- en regelgeving, een gerechtelijke uitspraak, of door een (toezichthoudende) instantie; • indien depotnemer ophoudt te bestaan en/of haar activiteiten op het gebied van dataarchivering beëindigt, aan een soortgelijke organisatie. f. De depotnemer zal, op basis van de door de depotgever verstrekte documentatie bij de dataset, de metadata vrij beschikbaar stellen en publiceren. Onder metadata wordt verstaan: de beschrijvende informatie met betrekking tot de digitale bestanden. Overige, door de depotgever verstrekte, documentatie bij de dataset wordt vrij beschikbaar gesteld en gepubliceerd. g. De algemene informatie over het onderzoek en de bij de dataset behorende metadata worden opgenomen in de databases en publicaties van de depotnemer, welke voor ieder-
93
94
Wegwijzer Digitaal Deponeren – Archeologie
een toegankelijk zijn. 7. Bepalingen met betrekking tot het gebruik door derden a. De depotnemer verplicht derden, aan wie zij (substantiële delen van) de dataset ter beschikking stelt, om in de onderzoeksresultaten, in welke vorm dan ook, een éénduidige bronvermelding op te nemen van de dataset waarvan de gegevens zijn gebruikt. b. De depotnemer verplicht degene(n), aan wie zij de dataset ter beschikking stelt, deze dataset heeft aangevuld, dan wel gewijzigd, zodanig dat er sprake is van een nieuwe dataset, ter zake van deze nieuwe dataset tot archiveren bij de depotnemer. 8. Overlijden depotgever Na het overlijden van depotgever, dan wel na opheffing of beëindiging van diens organisatie, vervalt een eventueel voor de dataset geldende beperkende toegangscategorie “Restricted access” of “Other access” en is automatisch de toegangscategorie “Open access” van kracht. 9. Aansprakelijkheid a. De depotnemer is niet aansprakelijk voor het geheel of gedeeltelijk verloren gaan van de dataset. b. De depotnemer is niet aansprakelijk voor eventuele schade als gevolg van een handelen of nalaten door derden, aan wie de depotnemer de dataset ter beschikking heeft gesteld. 10. Duur van de overeenkomst, beëindiging a. Deze overeenkomst gaat in op de datum van de ontvangst door de depotnemer, hierna te noemen de deponeringsdatum en geldt voor onbepaalde tijd. De licentieovereenkomst zal alleen worden beëindigd indien en voor zover dit niet langer noodzakelijk mocht zijn om eventuele rechten uit hoofde van de Databankenwet en/of Auteurswet te respecteren. b. In afwijking van het bepaalde onder artikel 10a. eindigt deze overeenkomst zodra de dataset permanent uit het data-archief verwijderd is op grond van artikel 5 van deze overeenkomst. c. Indien de depotnemer ophoudt te bestaan of haar activiteiten op data-archiveringsterrein beëindigt zal de depotnemer trachten de bestanden bij een gelijkwaardige instelling onder te brengen, welke de overeenkomst, indien mogelijk onder gelijkwaardige condities, met depotgever voortzet. 11. Toepasselijk recht Op deze licentie overeenkomst is het Nederlands recht van toepassing.
Bijlagen
Toegangscategorieën met betrekking tot de gearchiveerde dataset De dataset mag door de depotnemer worden gedistribueerd en ter beschikking worden gesteld op één van de hierna onder vermelde wijze, zulks mede met inachtneming van het in artikel 6 van de overeenkomst gestelde met betrekking tot persoonsgegevens. [Open access: onbeperkte toegang] I. Aan iedereen. De dataset mag door de depotnemer aan iedere, bij de depotnemer, geregistreerde persoon worden gedistribueerd en ter beschikking worden gesteld. [Restricted access: beperkte toegang] II. Uitsluitend aan, bij de depotnemer, geregistreerde personen en organisaties die behoren bij één van de nader gespecificeerde gebruikersgroepen. III. Uitsluitend aan, bij de depotnemer, geregistreerde personen en organisaties die vooraf contact hebben opgenomen met de depotgever. De depotgever geeft vervolgens toestemming om de gedeponeerde bestanden toegankelijk te maken of te verstrekken aan de met name genoemde geregistreerde gebruiker. [Other access: geen toegang via de depotnemer] IV. Door de depotnemer wordt op geen enkele wijze toegang tot de dataset verleend. Toegang tot de dataset wordt via een andere, nader met de depotnemer overeengekomen wijze gerealiseerd. De gespecificeerde wijze van toegankelijkstelling gaat in op de deponeringsdatum, tenzij de depotgever de gelegenheid wordt geboden en deze daar gebruik van wenst te maken om de toegankelijkstelling tijdelijk uit te stellen (“Delayed access”). Daarbij wordt door de depotnemer een maximum termijn van twee jaar wordt gehanteerd.
95
96
Wegwijzer Digitaal Deponeren – Archeologie
– Bijlage 4 – Afkortingen
ADS Archis DANS DARE DEN EASY EDNA GIS KB KICH KNA KNAW NWO PDF RACM ROB SIKB SNA SURF XML
Archaeology Data Service, University of York, UK Archeologisch informatie systeem, RACM, Amersfoort Data Archiving and Networked Services, KNAW/NWO, Den Haag Digital Academic Repostories, KNAW/ SURF Digitaal Erfgoed Nederland, Den Haag Electronisch ArchiveringsSYsteem, DANS e-depot voor de Nederlandse archeologie, RACM/ DANS Geografisch Informatie Systeem Koninklijke Bibliotheek, Den Haag KennisInfrastructuur CultuurHistorie, RACM, Amersfoort Kwaliteitsnorm Nederlandse Archeologie Koninklijke Nederlandse Academie van Wetenschappen, Amsterdam Nederlandse organisatie voor Wetenschappelijk Onderzoek, Den Haag Portable Document Format, Adobe Rijksdienst voor Archeologie, Cultuurlandschap en Monumenten (voorheen ROB), Amersfoort Rijksdienst voor het Oudheidkundig Bodemonderzoek (nu RACM) Stichting Infrastructuur Kwaliteitsborging Bodembeheer, Gouda Stichting voor de Nederlandse Archeologie (nu Erfgoed Nederland), Amsterdam Stichting SURF (1987) is een samenwerkingsverband waarbij ongeveer 60 universiteiten, hogescholen en onderzoeksinstellingen samenwerken aan grensverleggende ICT-innovaties Extensible Markup Language
Wegwijzer Digitaal Deponeren
Voor de Nederlandse archeologie is het van belang dat de unieke digitale documentatie van archeologisch onderzoek voor de toekomst bewaard en toegankelijk blijft. Daarom is deze Wegwijzer Digitaal Deponeren speciaal geschreven voor de Nederlandse archeologie.
ARCHEOLOGIE Milco Wansleeben Marjolein van den Dries
ARCHEOLOGIE
De eerste hoofdstukken gaan in op het e-depot Nederlandse archeologie (EDNA), op de organisaties die daarbij betrokken zijn en op de onderzoeksmogelijkheden voor de toekomst. Daarnaast worden hier onderwerpen als het auteursrecht en het toevoegen van metadata (Dublin Core) toegelicht. Het tweede deel van deze Wegwijzer is meer praktisch van aard en geeft stap voor stap aan hoe het deponeren in het online archiveringssysteem van EASY in zijn werk gaat. Van begin tot eind wordt de gebruiker bij de hand genomen bij het proces van deponeren.
Wegwijzer Digitaal Deponeren
DANS (Data Archiving and Networked Services) is de nationale organisatie die zorgt voor de opslag en blijvende toegankelijkheid van onderzoeksgegevens in de alfa- en gammawetenschappen. DANS beheert bestaande data archieven en organiseert de data infrastructuur voor onderzoekers die het verzamelen, bestuderen en vastleggen van gegevens als onderdeel van hun activiteiten maken. DANS werkt ook aan de verdere ontwikkeling van data-infrastructuur op nieuwe gebieden. De Wegwijzer Digitale Deponeren wordt in de reeks DANS Data Guides uitgebracht als één van de gidsen die uitleggen hoe het deponeren in EASY voor specifieke vakgebieden in zijn werk gaat.
978- 90- 5260- 295- 0
ant
9 789052 602950
DANS Data Guide 3
An omslag_wegwijzer_kleur.indd 1
13-12-2007 9:32:25