Data Archiving and Networked Services
e-depot en de Pakbon
Hella Hollander 30 juni 2014
DANS is an institute of KNAW and NWO
Onderwerpen • • • •
Wat doen archeologen bij DANS? Pakbon? Iets met Sinterklaas? Internationale belangstelling via ARIADNE Toekomstdromen: archeologie van de toekomst!
E-Depot voor de Nederlandse Archeologie
Wat doen archeologen bij DANS? • EDNA pilot project 2004-2006 • EDNA II: retrospectief scanproject 2009-2010 • EDNA ingebed in organisatiestructuur DANS
2005-2009 • Subsidie Gratama / Universiteit Leiden =>Scannen analoge archeologische rapporten • Subsidie NWO =>Retrospectief archiveren datasets •
Ingebed in organisatiestructuur DANS
•
Kwaliteitsnorm Nederlandse Archeologie
2009-nu • NWO Odyssee-project (2009-2010) =>Werkvoorraad 1800 vindplaatsen
• Projecten om toegang te verbeteren Nationaal: KICH, Archis Internationaal: CARARE en ARIADNE • Continueren van archiveren en toegankelijk maken van datasets • Kennisdeling: Long-term preservation, preferred formats, Data Seal of approval, Data organisation, Data dissemination (SND Zweden, IANUS Duitsland)
2014: • 18.500 rapporten • 3.000 opgravingsarchieven • 1,5 miljoen files foto’s, GIS, tabellen en tekeningen
https://easy.dans.knaw.nl
Deposit Dataset
Title Alternative Title Creator Contributor Date created Rights holder Publisher
Import Archis metadata
+ (Academic) Title(s) Initials Prefix Surname Digital Author ID (DAI) Organisation
Repeat field
Description
Subject Temporal coverage Spatial coverage Spatial point Spatial box Identifier Relation
Rights Open access Unrestricted acces for all registered EASY users Access Access rights archaeology group Restricted: Access restricted for registered group members Date available
Restricted: request permission Remarks Registered users after depositor permission is granted
Other access Data accessible in another way or elsewhere
Diverse formaten en soorten data in EASY Foto’s
Afbeeldingen Scans
Publicaties
CAD digitale tekeningen / GIS kaartmateriaal
Tabulaire data (databases / spreadsheets)
Verslagen
Datasets in EASY
30 juni 2014: 22.345 archeologische datasets, 70% open access
Overview of a published dataset
Persistent Identifier
Abstract description
DANS is een instituut van KNAW en NWO
Overview of a published dataset
DANS is een instituut van KNAW en NWO
Data Archiving and Networked Services
Houtonderzoek: Digital Collaboratory for Cultural Dendrochronology (DCCD) Archief bij DANS http://dendro.dans.knaw.nl/
DANS is an institute of KNAW and NWO
Dendrochronology • Trees form ring growth patterns • Build ‘calendars’ from wood samples • Date wood samples by matching against calendars
pattern
calendar
Waar richt ARIADNE zich op? • • •
• • •
Advanced Research Infrastructure for Archaeological Dataset Networking in Europe Op 6 februari 2013 start met duur van 4 jaar. Opzetten Europese onderzoeksinfrastructuur voor integratie van archeologische datasets. Daarnaast worden tools ontwikkeld om onderzoekers toegang tot deze data te geven. DANS is een van de 24 partners van ARIADNE DANS draagt EDNA en DCCD bij aan dit netwerk De partners zijn afkomstig uit 16 Europese landen. Ook de Griekse en Engelse partners van DANS in het Europese infrastructuurproject DARIAH, Athena, Digital Curation Unit en Archaeology Data Service (ADS), nemen deel aan ARIADNE
Waar richt ARIADNE zich op? •In het ARIADNE-project staan het koppelen van metadata, het gebruik van GIS, maar ook technologieën als data mining en linked data centraal. Verder is de toegang tot niet-gepubliceerde veldwerkrapporten, of 'grijze literatuur', een specifiek aandachtspunt. Vaak vormt deze grijze literatuur een primaire bron van archeologische kennis.
EASY en DCCD:nieuwe functionaliteiten • Zichtbaar op de site – EASY: Pakbon upload – DCCD: verbeterde kaart en tijdlijn
• Niet zichtbaar maar machine leesbaar – DCCD: OAI-PMH & RESTfull API – EASY & DCCD: Aanzet tot ‘mappen’ van gebruikte termen
Pakbon, wat is dat? •
Na afloop van het onderzoek geven archeologen aan wat waar is gedeponeerd. De gegevens over de opgraving en vondsten worden via een standaard set beschrijvingen bij de verschillende depothouders, waaronder DANS, aangeleverd als een XML document.
Digitale ‘Pakbon’ : XML-standaard
• • • • • •
Project metadata Basis beschrijving van materialen en artefacten Inclusief ABR codeboek Unieke ID strings Nieuw onderdeel van de KNA Ontwikkeld door Nederlandse archeologische sector en ondergebracht bij het SIKB
ABR: ‘Archeologisch Basis Register’
Rijksdienst voor het Cultureel Erfgoed (RCE), 1992 Basis termen voor archeologiesche informatie systemen
Material: MAU (Goud) Beschrijving AFVAL Amulet/talisman Armband/armring (…)
Code AFVAL AMULET ARMBAND
Start
Eind
NEOLB NEOMB BRONSL
NTC NTC NTC
Nieuwe stap aan het begin van de deponeer procedure: Importeer (meta-)data uit andere bronnen (optionele stap)
Browse Import ‘pakbon’ Import Archis metadata
Upload
If you do not have a ‘pakbon’ or Archis metadata, proceed to step 2
We ask archaeological dataset depositors to send a file list with each dataset, describing their files using Data Documentation Initiative (DDI) metadata standards. Format conversions are registered in this filelist by the archivist.
file_name
file_content
software
othmat_codebook
remarks
V2_BORB.DBF – prospective results: profile details (dBase III file) V20_top.TAB – digital map: topography of the area (MapInfo file) RIMG0003.jpg: field photograph – table FOTOBEST connects filename to photo number in photo description table FOTOLST V20HK01.wmf: occurrence of charcoal at site 20
File metadata in EASY
View details Check file
Voordelen Pakbon • Minder werk bij deponeren • Bulk upload efficiënter • Pakbon geeft meer metadata – Gedetailleerder – Per bestand – Digitale koppeling tussen bv Archis en EASY
‘Mappen’ van metadata termen • Nodig voor betekenisvol linken • In ARIADNE eerst naar de termen van English Heritage – EASY: ABR (ABR+ in Pakbon) – DCCD: meertalige thesaurus… Veel uitdagingen; de lastig te ‘mappen’ termen Map naar meer algemeen en geef dat aan = Beter iets dan niets
Voorbeeld van ‘lastig mappen’ • •
NRV Nederzetting - Romeins villa (complex) http://purl.org/heritagedata/schemes/eh_tmt2/concepts/68653 A term for a type of house, with varying definitions according to period. Roman villas were high-status and usually associated with a rural estate, whereas Georgian and later period villas were often semi-detached, town houses. MONUMENT
HOUSE VILLA
Meer samenhang EASY en DCCD • Archeologisch onderzoek (rapporten in EASY) reconstructie verleden a.d.h.v. – Historische gegevens – Grondsporen (veldtekeningen in EASY) – Vondsten (Pakbon in EASY) materiaal categorieën • Aardewerk, metaal, bot, …, hout - DCCD dendrochronologische onderzoeks gegevens: datering en oorsprong hout
Samenvatting • • • • •
Archeologie op de kaart Interactie EDNA en DCCD ARIADNE: work in progress Efficiënt werken met de pakbon Linked data: de toekomst?
Data Archiving and Networked Services
E-depot en de Pakbon Vragen?
DANS is an institute of KNAW and NWO