Data deponeren in zeven stappen Instructies voor archeologische data
Instructies voor het deponeren van archeologische data U staat op het punt om data te deponeren bij DANS in het online archiveringssysteem EASY. Deze handleiding, verdeeld in 7 stappen, helpt u hierbij. Uw data worden gearchiveerd volgens de richtlijnen van het internationaal erkende Data Seal of Approval1. De gebruikte documentatievelden (metadata) zijn in overeenstemming met de richtlijnen van de Dublin Core standaard2. Data deponeren in 7 stappen 1. Data voorbereiden Selecteer de relevante databestanden en controleer eventuele privacygevoelige aspecten en bestandsformaten. DANS heeft hier richtlijnen voor. 2. Naar EASY Log in op http://easy.dans.knaw.nl. Nieuwe gebruikers maken eerst een account aan. 3. Start het deponeren Ga in EASY naar ‘new deposit’, kies uw discipline en klik op ‘start deposit’. 4. Documentatie en toegangsniveau Beschrijf de dataset en bepaal of deze open access is, of toegankelijk onder bepaalde voorwaarden. 5. Databestanden uploaden Selecteer uw databestanden en klik op 'upload dataset'. 6. Databestanden versturen Accepteer de licentie-overeenkomst en stuur vervolgens met de knop 'submit' uw dataset naar DANS. 7. Publicatie door DANS DANS controleert de dataset en publiceert deze volgens het toegangsniveau dat u heeft aangegeven. Uw data zijn nu duurzaam gearchiveerd en blijvend toegankelijk voor anderen.
1 2
www.datasealofapproval.org http://dublincore.org
Deponeerinstructies voor archeologie | november 2012
2
Stap 1: Data voorbereiden Bij de voorbereiding van het deponeren moet u die data- en documentatiebestanden van uw onderzoek documenteren die zinvol zijn voor mogelijk hergebruik. Databestanden Het e-depot voor de Nederlandse archeologie is bedoeld voor originele en herbruikbare, digitale gegevens. Het karakter en de omvang van de gegevens zal per type onderzoek sterk verschillen. In principe komt alle documentatie die digitaal is vastgelegd in aanmerking voor archivering, zoals kaarten, veldtekeningen, foto's, tabellen en de publicatie. Bij voorkeur worden dan ook alle bestanden die relevant kunnen zijn voor toekomstig archeologisch onderzoek in het e-depot opgenomen. Op de website van het e-Depot voor de Nederlandse Archeologie3 leest u meer over het selecteren van de gegevens per type onderzoek. Metadata Naast de beschrijving van het onderzoeksproject als geheel is er een (meta)beschrijving nodig voor elk individueel bestand dat wordt gedeponeerd. Het gaat daarbij om een gedocumenteerde bestandenlijst en codeboeken. In het document archeologische metadata4 leest u meer informatie over het invullen van deze metadata. Voorkeursformaten DANS hanteert een lijst met voorkeursbestandsformaten5 (preferred formats). Van data die in een preferred format worden aangeleverd, kan DANS garanderen dat deze langdurig bewaard kunnen worden. Grootte van bestanden Bestanden tot 100 MB kunt u eenvoudig uploaden in EASY. Bij een omvangrijke dataset wordt geadviseerd om eerst alle bestanden samen te bundelen tot één ZIP-bestand. Bij het uploaden van het ZIPbestand zal EASY deze gecomprimeerde file zelfstandig weer uitpakken en alle oorspronkelijke directories en files in één keer aanmaken. Bij zeer omvangrijke datasets (groter dan 100 MB) wordt geadviseerd om wel alle beschrijvende gegevens van een onderzoeksproject in te vullen, maar het uploaden achterwege te laten. Stuur de bestanden op CD-ROM of DVD naar DANS. Een data-archivaris zal dan de bestanden in EASY plaatsen.
3 4 5
http://www.edna.nl/faq/onderzoekstype/vraag1.html http://www.dans.knaw.nl/content/data-archief/data-deponeren#deponeerinstructies http://www.dans.knaw.nl/content/data-archief/data-deponeren#voorkeursbestandsformaten
Deponeerinstructies voor archeologie | november 2012
3
St
Stap 2: Naar EASY
Ga naar https://easy.dans.knaw.nl en log in. Nieuwe gebruikers maken eerst een account aan via 'Register'. EASY is Engelstalig om data ook voor onderzoekers uit het buitenland te ontsluiten.
Afbeelding 1: Homepage EASY
Stap 3: Start het deponeren
Ga in EASY naar 'New deposit'. Vervolgens kiest u bij de discipline Archeologie voor 'Start deposit'.
Deponeerinstructies voor archeologie | november 2012
4
Stap 4: Documentatie en toegangsniveau Nadat u op 'Start deposit' heeft geklikt, ziet u de volgende 6 metadataschermen: 1. Primary information and intellectual ownership - Primaire informatie en intellectueel eigendom 2. Research project - Beschrijvende informatie over het gehele onderzoeksproject 3. Digital Files - Beschrijvende informatie over de digitale bestanden 4. Upload files - Upload van de bestanden 5. Rights - Toegangsrechten 6. Overview and submitting- Controle en versturen Documentatie Op deze schermen zijn zeven velden verplicht om in te vullen. Deze velden herkent u aan de rode asterisk *. Het vastleggen van metadata wordt gezien als verrijking. Hoe meer velden u invult, des te beter uw dataset vindbaar is. Bovendien kan een andere archeoloog de structuur en inhoud beter begrijpen. Hierdoor wordt de kans op misverstanden of verkeerd gebruik kleiner. U kunt de metagegevens van een eerder door u ingevoerde dataset in EASY importeren om als basis te gebruiken voor een nieuwe deponering, via 'My datasets' en de knop 'Reuse'. Daarnaast bestaat de mogelijkheid om de beschikbare informatie uit Archis in EASY te importeren (zie figuur 2, scherm 1). Het uniek identificeren van elk archeologisch onderzoek in Nederland is heel belangrijk. Alleen dan is eenduidig vastgelegd bij welk onderzoeksproject deze dataset hoort. Per dataset kunt u meerdere Archis-onderzoeksmeldingsnummers (voorheen CIS-code genoemd) vermelden door op het plusteken achter het veld te klikken. Taal U bent in EASY vrij in uw taalkeuze, maar het advies is om de taal te gebruiken waarin de gegevens zijn vastgelegd.
Deponeerinstructies voor archeologie | november 2012
5
Tussentijds opslaan Onderaan elk scherm vindt u de volgende knoppen:
: Onderbreek de deponeerprocedure : Sla tussentijdse wijzigingen op of
: Ga naar het vorige of volgende scherm
De beschrijvende elementen zijn over meerdere schermen verdeeld en worden automatisch opgeslagen op het moment dat u naar een volgend/vorig scherm gaat via de knoppen 'Next'/'Previous'. Via de knop 'Save draft' wordt handmatig de opdracht gegeven om tussentijds de veranderingen op te slaan. U kunt nu uitloggen bij EASY, op een later tijdstip weer inloggen en verder gaan waar u gebleven was. De eerder ingevoerde metadataset vindt u als ‘draft’ onder het kopje 'My datasets' zodra u weer bent ingelogd. Wanneer u op het vraagteken klikt, verschijnt er een help-scherm met aanvullende informatie over het desbetreffende metadataveld. Door op het plusteken te klikken, kunt u een extra veld voor hetzelfde item aanmaken. Toegangsniveau U kunt zelf aangeven op welke manier uw gegevens door DANS toegankelijk gemaakt mogen worden. De metagegevens van het project zijn altijd volledig openbaar. Voor de toegang tot de bestanden kan via 'Access rights' worden gekozen uit de volgende opties: Open access (voor alle geregistreerde EASY-gebruikers toegankelijk - standaard instelling) Restricted: archaeology group (alleen voor archeologen die bij EASY geregistreerd staan) Restricted: request permission (alleen voor een gebruiker die aan u vooraf, via een speciaal e-mailbericht van EASY, om toestemming heeft gevraagd) Other access (EASY biedt geen toegang tot de bestanden en zorgt alleen voor de vindbaarheid. Dit is alleen mogelijk als de data op een ander (web)adres toegankelijk zijn. Vermeld dan bij 'Relation' wel de betreffende URL. Overleg bij het kiezen van deze categorie eerst met DANS. In principe (standaard instelling) worden de bestanden per direct beschikbaar gesteld. Er kan echter, via 'Date available', een tijdelijk embargo worden afgesproken voor maximaal twee jaar na de deponeringsdatum.
Deponeerinstructies voor archeologie | november 2012
6
Tenslotte kunt u beschrijven of er voor specifieke, met naam genoemde bestanden afwijkende beperkingen moeten gelden. Daarvoor is een vrij tekstveld 'Remarks' beschikbaar. De door u gekozen hergebruiksbepalingen worden opgenomen in het definitieve licentiecontract, dat u per e-mail ontvangt. Aan die licentie zal ook een volledige lijst van gedeponeerde bestanden worden toegevoegd. Primaire informatie en intellectueel eigendom
Afbeelding 2: Primaire informatie en intellectueel eigendom Bij het citeren van een publicatie worden altijd de auteur(s), titel en datum van publicatie gebruikt om naar te verwijzen (zie afbeelding 2). Een vergelijkbaar principe geldt ook voor datasets. U documenteert de primair verantwoordelijke voor het onderzoeksproject (projectleider), de naam waaronder het project bekend is (of de titel van het rapport) en de datum (date created) waarop het onderzoek en de bijbehorende gegevens zijn afgesloten, zodat deze gegevens kunnen worden gebruikt bij het verwijzen naar de dataset. Daar wordt door EASY automatisch nog een uniek, duurzaam webadres (persistent URL) aan toegevoegd. Deze beschrijving kunt u, indien daar behoefte aan bestaat, nog uitbreiden met aanvullende informatie over andere personen en organisaties (contributors, rights holder, publisher) die bij het tot stand komen van de dataset een rol spelen. Een subtitel of een alternatieve titel kan ook als aanvulling worden gedocumenteerd. Door een Engelstalige titel te vertalen naar het Nederlands (bij 'alternative title') zal uw dataset vaker in zoekresultaten van andere onderzoekers verschijnen.
Deponeerinstructies voor archeologie | november 2012
7
Beschrijvende informatie over het gehele onderzoeksproject
Afbeelding 3: Projectbeschrijving Het volgende scherm (zie afbeelding 3) bevat de informatie die het gehele onderzoeksproject inhoudelijk beschrijft. De samenvatting (description), waarmee in één alinea van vrije tekst het project gekenschetst wordt, en het toekennen van diverse trefwoorden ('subject' en 'coverage') vormen hierbij een belangrijk onderdeel. Het element coverage kent een onderscheid tussen de ruimtelijke locatie waar het onderzoek heeft plaats gevonden (spatial coverage) en de archeologische periode (datering) waarop het onderzoek betrekking heeft (temporal coverage). Bij het invullen van de Dublin Core-velden maakt u in principe gebruik van vrije tekst. Gebruik voor de beschrijving bij voorkeur korte formuleringen met begrippen die de datasets het best karakteriseren. Binnen Dublin Core kan bij het invullen van enkele velden ook gebruik worden gemaakt van een keuzelijst. Zo kunt u bij 'Subject' het ABR complextype (Archeologisch Basis Register, Archis 1992) gebruiken om het type vindplaats te beschrijven en bij 'Temporal coverage' de ABRafkortingen voor de datering. Door deze termen te gebruiken, wordt het mogelijk om gerichter te zoeken. Het gebruik van deze keuzelijsten is niet verplicht en er kan nog steeds vrije tekst worden ingevuld. Door de coördinaten te documenteren (spatial coverage), kan de vindplaats automatisch op een verspreidingskaart worden getoond
Deponeerinstructies voor archeologie | november 2012
8
(geografisch zoeken). Spatial coverage is er als vrij tekstveld (voor het vermelden van bijvoorbeeld het toponiem, de plaats, de gemeente en de provincie) als een point (twee coördinaten) en als een box (vier coördinaten). Gebruik geen punten bij het invullen van de coördinaten. EASY kent automatisch een persistent identifier toe aan uw dataset. In het veld 'Identifier' voegt u zelf unieke kenmerken toe die uw onderzoeksproject of bestanden identificeerbaar maken. Te denken valt aan het ISBN nummer, het Archisonderzoeksnummer, het Archis Waarnemingsnummer, projectcode of rapportnummer. Via het veld 'Relation' kunnen aan elkaar gerelateerde datasets worden gekoppeld. U vult hiervoor de titel in, en indien mogelijk het webadres (URL). Het type relatie is te specificeren aan de hand van een keuzelijst. Meer informatie hierover leest u in de helptekst in EASY. Beschrijvende informatie over de digitale bestanden
Afbeelding 4: Informatie over digitale bestanden Het scherm 'Digital Files' (zie afbeelding 4) bevat informatie over de gedeponeerde digitale bestanden. Het omvat zowel technische aspecten (type en formaat) als inhoudelijke kenmerken (language, source, date). Bij het invullen van het datumveld kan gedacht worden aan de opgravingsperiode of het sluiten van het project. De datum van deponeren (date submitted) wordt automatisch aangemaakt bij het deponeren.
Deponeerinstructies voor archeologie | november 2012
9
Stap 5: Databestanden uploaden Via het veld ‘Upload dataset’ kunt u uw databestanden uploaden.
Gebruik de ‘Browse’-knop achter het metadataveld ‘Upload dataset’ om uw bestand te zoeken, selecteer het en klik op ‘Upload’ om de dataoverdracht te starten.
Afbeelding 5: Databestanden uploaden
Stap 6: Databestanden versturen Controle en versturen In dit scherm ziet u een overzicht van alle metadata die u heeft ingevuld en een lijstje van de bestanden die u heeft gedeponeerd (zie afbeelding 6). Zodra u aangeeft akkoord te zijn met de DANS Licence Agreement door het vakje aan te vinken, kunt u op ‘Submit’ klikken en de deponering afronden. De licentie geeft aan DANS het recht om de dataset op te nemen in het archief en deze ter beschikking te stellen onder de voorwaarden die de projectleider bij het deponeren heeft aangegeven. U geeft, via het vinkje voor ‘I accept the terms [….]’, aan dat u deze algemene voorwaarden accepteert. Bij het opsturen (submit) wordt gecontroleerd of alle verplichte velden wel zijn ingevuld. Bij het succesvol opsturen verschijnt in het scherm de unieke door DANS aan de datasets toegewezen identificatie (persistent identifier). Tevens ontvangt u als bevestiging per e-mail de licentie. Deponeerinstructies voor archeologie | november 2012
10
Hierna kunt u de dataset niet meer wijzigen of updaten. Als u toch wijzigingen wilt doorvoeren, neemt u dan contact op met een datamanager van DANS.
Afbeelding 6: Databestanden versturen
Stap 7: Publicatie door DANS Nadat u de data gedeponeerd heeft, verwerkt een datamanager van DANS uw dataset volgens een vastgesteld protocol6. Als aan alle voorwaarden is voldaan, maakt hij of zij de data publiekelijk toegankelijk volgens het toegangsniveau dat u heeft aangegeven en de eventuele embargo's. Naast het controleren van de Dublin Core-beschrijving en de leesbaarheid van de aangeleverde bestanden zullen alle bestanden, indien dat nog niet is gebeurd, door de datamanager naar een duurzaam digitaal bestandsformaat worden omgezet. Dit preservation format is veelal een eenvoudig tekstueel bestandsformaat dat ook voor de uitwisseling wordt gebruikt (csv, dxf, mif/mid). De bestanden worden zowel in het aangeleverde, oorspronkelijke (native) formaat gearchiveerd, als in het preservation format. In de presentatie van het onderzoeksproject worden uiteindelijk de bestanden alleen in het preservation format getoond. Op deze manier kunnen zo veel mogelijk onderzoekers met hun eigen software deze gegevens hergebruiken.
6
http://www.dans.knaw.nl/content/data-archief/data-vinden#dataverwerking
Deponeerinstructies voor archeologie | november 2012
11
Op basis van de bestandenlijst kan worden gecontroleerd of de dataset compleet is aangeleverd en of alle bestanden adequaat beschreven zijn. De datamanager zal, als daar bijvoorbeeld om reden van duidelijkheid aanleiding toe is, bij de presentatie van de dataset de directory-structuur, de bestands- of foldernamen aanpassen. Uw data blijven nu duurzaam gearchiveerd en kunnen door anderen gevonden en hergebruikt worden. Meer informatie Veelgezochte informatie over het deponeren van onderzoeksmateriaal kunt u vinden in het overzicht van FAQ's - Frequently Asked Questions.7 Bezoek de website www.edna.nl voor nadere informatie over het e-Depot voor de Nederlandse Archeologie. Bij vragen en problemen kunt u contact opnemen met een datamanager van DANS via archeologie at dans.knaw.nl of 070 34 46 484.
7
http://www.dans.knaw.nl/content/data-archief/data-deponeren
Deponeerinstructies voor archeologie | november 2012
12