Demonstratie en toelichting functionaliteiten e-Depot Zeeuws Archief In het kader van de marktverkenning naar e-Depots
Antwoorden op de vragenlijst 10 februari 2016
Generieke vragen 1. Voor welke onderdelen / functionaliteiten vindt logging plaats? In principe worden alle activiteiten rond het gebruik van het e-Depot gelogd in de vorm van audit trails. 2. Op welke wijze is vorm en inhoud gegeven aan informatiebeveiliging? Het e-Depot voldoet aan de BIR, de Baseline Informatiebeveiliging Rijk, die gebaseerd is op NEN-ISO 27001: Information technology - Security techniques - Information security management systems – Requirements. 3. Op welke wijze is vorm en inhoud gegeven aan openbaarheid en vertrouwelijkheid vanuit de Wbp en Wob? Het metadataschema voorziet in de toepassing van bepalingen omtrent vertrouwelijkheid. Zodra overbrenging aan de orde is moet, van de als vertrouwelijk bestempelde informatie, worden bepaald of, cq wanneer deze openbaar wordt. Het is vervolgens aan de archiefvormer, cq de beheerder van de informatie om te komen tot het correct nakomen van de wettelijke verplichtingen. Wbp en Wob regelen een zeer complexe realiteit. De uitvoering blijft in grote mate een kwestie van mensenwerk.
4.
Welke continuïteitsmaatregelen zijn getroffen rondom de e-depot voorzieningen 1
(organisatie, mensen, processen en techniek)? Het e-Depot behoort tot het primair proces van het Zeeuws Archief. Gegevens in het e-Depot (objecten en metadata) worden dubbel opgeslagen. Op dit moment wordt een uitwijk en een back-up op minimaal 75 km verwijderd van het gebouw van het Nationaal Archief ingericht. 5. Welke methodieken / controles / checksums worden toegepast om aan te tonen dat archiefobjecten en metadata authentiek (onveranderd) is? Het e-Depot ondersteunt MD5, SHA-1, SHA-256 en SHA-512 als fixity algoritmen. Standaard wordt gekozen voor SHA-1. 6. Wordt binnen het e-depot gebruik gemaakt van encryptie? Communicatie met het e-Depot vindt altijd versleuteld plaats, of via de Haagse Ring ofwel via HTTPs en FTPs. 7. Op welke wijze is voorzien in continuïteit voor de zorgdrager bij continuïteitsproblemen bij de leverancier? Er wordt op dit moment een uitwijklocatie in Groningen ingericht voor het geval zich een calamiteit mocht voordoen bij de leverancier. 8. Welke voorwaarden zijn verbonden aan een beëindiging van de overeenkomst tussen zorgdrager en leverancier? Deze worden vastgelegd in de samenwerkingsafspraken waarin is opgenomen binnen welke termijn de overeenkomst wordt beëindigd en welke voorzieningen er moeten worden getroffen om de exgest te realiseren. 9. Welke audits vinden er plaats rondom de e-depot voorzieningen en organisatie? Het Zeeuws Archief laat periodiek (externe en interne) audits uitvoeren op het beheer van de digitale informatieobjecten, conform de Eisen Duurzaam Digitaal Depot (ED3). 10. Welke rapportages / inzagemogelijkheden zijn er voor de zorgdrager beschikbaar rondom het e-depot (onder meer met betrekking tot opname, opslag, beheer, data management, preservatie, toegang en vernietiging)? Er is een aantal standaard rapportages voorhanden: File Formats File Formats - Details Ingest Summary Ingested Files Integrity Check History Not Identified Files Not Uniquely Identified Files 2
Transformed File Sets User Activity Het Zeeuws Archief kan desgewenst zorgen voor maatwerkrapportages.
Opname van Archiefobjecten 1.
Welke (digitaal duurzame) bestandsformaten kunnen worden opgenomen? Het e-Depot kan alle mogelijke bestandsformaten opnemen. Mochten bestanden tijdens de ingest niet herkend worden dan kan een ‘herkarakterisatie’ uitgevoerd worden. 2. Op welke wijze(n) moeten / kunnen archiefobjecten en metadata worden aangeleverd door zorgdragers? Archiefobjecten en metadata kunnen nu via FTPS worden aangeleverd. Op dit moment wordt er gewerkt aan een aanlevermogelijkheid via DigiKoppeling. 3. Welke metadatasets kunnen worden gebruikt? Alle metadatasets kunnen worden gebruikt zolang het xml-schema’s zijn. 4. Op welke wijze vindt mapping plaats tussen aangeleverde en toegestane metadata? Na afronding van de mapping op papier (van het metadataschema van de bronapplicatie naar één van de toepassingsprofielen) worden één of meer XSLT’s gebouwd om de transformatie te bewerkstelligen. 5. Op welke wijze wordt gecontroleerd of aangeleverde archiefobjecten en metadata op de juiste wijze zijn opgenomen? De ingest bestaat uit een aantal stappen waarin stapsgewijs een aantal validaties plaatsvindt. Het gaat daarbij onder andere over controle op hiërarchie en structuur.
Opslag van archiefobjecten 1. Op welke wijze worden metadata en archiefobjecten opgeslagen? Gezamenlijk of afzonderlijk? Eenmalig of redundant? De metadata worden opgeslagen in een database, terwijl de objecten zelf worden opgeslagen in Red Hat Gluster Storage. De opslag is gespiegeld, dus redundant. 2. Welke opslagformaten worden ondersteund (audio, video, mail, databases, websites, enzovoorts)?
3
Toonbaar zijn op dit moment: Afbeeldingen (JPEG, JPEG2000, TIFF, PNG, GIF), Audio (MP3 en OGG), Websites (WARC en ARC), eBooks (ePub), Email (EML), Documenten (PDF, MS-Word, PowerPoint, Word Perfect). In totaal kunnen 1066 formaten en versies correct worden herkend via de PRONOM Linked Data Registry, zodat bekend is welke tools nodig zijn voor het tonen of migreren van deze bestandsformaten. Alle overige bestandsformaten die nu nog niet kunnen worden herkend, kunnen wel worden opgenomen. Bij latere updates van de Linked Data Registry kan herkarakterisatie plaatsvinden om het bestand alsnog te laten herkennen. 3. Op welke wijze wordt informatie opgeslagen die in meerdere zaken / dossiers voorkomt? Als informatie in meerdere dossiers voorkomt, dan wordt die informatie meerdere keren opgeslagen. 4. Kan worden voorzien in behoud van functionaliteit van bronsystemen en –formaten? Bijvoorbeeld MS Excel? Ja. Bestanden worden integraal opgenomen en blijven ongewijzigd, ingebouwde formules blijven behouden, dat geldt voor alle bestandsformaten. Op dit moment kunnen nog niet alle bestandsformaten worden gerenderd, maar dat aantal groeit gestaag. 5. Is er een oplossing voor duurzame bewaring van GIS-objecten (inclusief functionaliteit)? GIS-objecten kunnen eveneens duurzaam worden bewaard. Ter toelichting: duurzaamheid heeft drie ‘lagen’. De duurzaamheid van de informatiedrager en de duurzaamheid van de bitsstream kunnen we garanderen voor alle bestandsformaten. Duurzame toegang verlenen door bijvoorbeeld te tonen kan nog niet voor alle bestandsformaten in het e-Depot, dit is o.a. het geval voor GIS. Dit kan de zorgdrager/archiefvormer wel door GIS-objecten te exporteren naar het eigen GIS systeem. Zie ook vraag 4. Dit wordt mogelijk voor steeds meer bestandsformaten. 6. Welke (database) maatregelen zijn getroffen om performance te waarborgen bij toename van het archief? De technische infrastructuur van het e-Depot is gevirtualiseerd en kan daarmee betrekkelijk eenvoudig worden opgeschaald. Bij performance problemen kan bijvoorbeeld het aantal Jobqueue servers (waar het eigenlijke werk plaatsvindt) worden uitgebreid. Op dit moment heeft het e-Depot in de productieomgeving twee Jobqueue servers. 7. Waar en bij wie vindt opslag plaats? Onder welke wetgeving? De opslag vindt plaats bij het Nationaal Archief in Den Haag, vallend onder de Nederlandse 4
(archief-)wetgeving. 8. Vindt opslag plaats op meerdere fysieke locaties? Zo ja, waar? Er wordt op dit moment gewerkt aan een back-up en uitwijk locatie in de provincie Groningen.
Metadatabeheer 1. Welke processen zijn er voor metadata management binnen het e-depot en in uw
organisatie? Het is mogelijk om metadata te editen en de hiërarchie aan te passen (met de beperking dat een dossier geacht wordt afgesloten te zijn en niet gewijzigd kan worden). Elke handmatige wijziging genereert de automatische aanpassing van de event history, aan de hand waarvan de roll-back functionaliteit indien gewenst de oorspronkelijke situatie kan terughalen. Op het moment dat metadata moeten worden aangepast wordt hiertoe opdracht gegeven en uitgevoerd. Als zorgdrager kun je contact opnemen met het Zeeuws archief waarna de wijziging (na validatie) wordt doorgevoerd. 2. Welke zijn geautomatiseerd en welke handmatig? Geautomatiseerd: Er is een herkarakterisatie workflow. Er zijn de workflows voor verwijderen en vernietigen (datamanagement workflows). Er is een workflow om metadataschema’s in elkaar om te zetten, wanneer de mapping tussen deze twee schema’s bekend is. Het editen van metadata is handmatig. Eventueel kunnen in de toekomst workflows als maatwerk worden gebouwd. 3. Wat moet / kan de zorgdrager uitvoeren? De zorgdrager moet een metadataschema (toepassingsprofiel) conform Nen-ISO 23081 implementeren in alle systemen waarin zich informatieobjecten bevinden. Aan de hand van het door de zorgdrager opgestelde organisatie-specifieke toepassingsprofiel moet hij er voor zorgen dat alle metadata die vereist zijn, ook zijn toegevoegd aan de op te nemen informatieobjecten. Op het moment dat deze informatieobjecten in het e-Depot moeten worden opgenomen, dient er een export uit het informatiesysteem te worden gemaakt. De zorgdrager is er voor verantwoordelijk dat deze export in het machine leesbare formaat ToPX2 wordt omgezet. Het Zeeuws Archief ondersteunt de zorgdrager bij dit proces. 4. Welke mogelijkheden zijn er voor aanpassing van het metadatamodel? Er zijn mogelijkheden om TopX aan te passen. Stakeholders kunnen de wensen voor aanpassing inbrengen. Gaat het om een gedeelde behoefte dan kunnen deze aanpassingen verwerkt worden. Daarvóór vindt een validatie plaats, onder andere of er met het doorvoeren van een wijziging geen conflict ontstaat met andere toepassingsprofielen zoals 5
TMLO.
Beheer 1. Welke beheerprocessen worden door de leverancier uitgevoerd? Alle beheerprocessen voor het e-Depot worden door het Zeeuws Archief in samenwerking met het Nationaal Archief uitgevoerd. Deze processen zijn incident management, problem management, configuration management, change management, operation management en security management. Daarnaast is er preservation, metadatamanagement en vernietiging van archiefbescheiden. 2. Hoe vindt functioneel, technisch en applicatie beheer plaats? Het functioneel, technisch en applicatiebeheer vindt plaats in de gestructureerde samenwerking tussen Zeeuws Archief en Nationaal Archief. Dit is vastgelegd in een Producten en Dienstencatalogus en samenwerkingsafspraken (zijnde andere PDC en samenwerkingsafspraken dan die tussen Zeeuws Archief en zorgdrager). 3. Welke methodieken worden gevolgd ITIL / ASL / BISL / COBIT? ITIL, ASL en BiSL 4. Welke beheertaken kan / moet de zorgdrager uitvoeren? De zorgdrager hoeft alleen zorg te dragen voor het aanleveren van informatieobjecten in de vorm van een kwalitatief goede SIP (Submission Information Package). 5. Worden afspraken vastgelegd in SLA’s / DVO’s? Er zijn generieke afspraken, die voor de samenwerking tussen het Zeeuws Archief en het aangesloten overheidsorgaan gelden. Deze staan in de Producten en Diensten Catalogus (PDC) en de Samenwerkingsafspraken. Deze samenwerkingsafspraken zijn vergelijkbaar met SLA’s/DVO’s. Er zijn daarnaast de specifieke afspraken voor de samenwerking tussen het Zeeuws Archief en een individuele zorgdrager. Deze staan in een addendum bij de Samenwerkingsafspraken. Specifieke afspraken worden altijd binnen de generieke afspraken gemaakt. De Samenwerkingsafspraken bevatten de kwaliteits- en prestatieniveaus van de te leveren producten en diensten. Daarnaast worden in deze Samenwerkingsafspraken ook de voorwaarden beschreven waaronder een overheidsorgaan deze producten en diensten afneemt. 6. Welke afspraken zijn er over monitoring, rapportages en te leveren prestaties? Deze zijn gedetailleerd beschreven in de samenwerkingsafspraken tussen het Zeeuws Archief en zijn zorgdragers. 7.
Hebben zorgdragers invloed op verdere ontwikkelingen van het e-depot? 6
Ja, via het Zeeuws Archief, dat vertegenwoordigd is in het gebruikersoverleg e-Depot Nederland. 8. Staat de leverancier open voor cocreatie? Zijn daar voorbeelden van? Ja, het is zeker mogelijk dat een zorgdrager invloed uitoefent op de door ontwikkeling van het e-Depot. In cocreatie of anderszins. Zie vraag 7 voor de reeds bestaande mogelijkheid. 9. Is er een gebruikersvereniging? Zie vraag 7
Preservatie planning 1. Welke ervaringen heeft de leverancier op het gebied van preservatie planning? Als archiefdienst heeft het Zeeuws Archief vele jaren ervaring met het opstellen en uitvoeren van beleid op gebied van preservering van analoge informatie. Preservering zit daarmee ‘in het DNA’ van het Zeeuws Archief, en was het een logische keuze om deel te nemen aan het landelijke kennisnetwerk preservation van de Nationale Strategie Digitaal Erfgoed. Daarin zitten vertegenwoordigers uit alle bij het beheer van digitale informatie branches (RCE, Beeld en Geluid, DANS, Koninklijke Bibliotheek). Uiteraard is het Zeeuws Archief ook lid van het kennisplatform Preservation waarin specifiek de Nederlandse archiefdiensten samenwerken en kennis delen. 2. Welke (organisatorische en technische) maatregelen zijn opgenomen in het e-depot om duurzame toegang tot archiefobjecten en metadata te garanderen? Het Zeeuws Archief hanteert hiervoor ED3, waarin organisatorische en technische maatregelen zijn opgenomen om duurzame toegang te garanderen. Het Zeeuws Archief is aangesloten op het preservation watch netwerk, het nationale en internationale netwerk van instellingen die de technologische ontwikkelingen en de opkomende issues voor duurzaamheid in de gaten houden en indien nodig omzetten in oplossingen om duurzaamheid te garanderen. Het Zeeuws Archief neemt daarnaast deel aan het kennisplatform preservation. Het e-Depot zelf is gemaakt om deze duurzame toegankelijkheid te ondersteunen. Er worden controles met checksums uitgevoerd, er wordt gebruik gemaakt van gestandaardiseerde metadataprofielen, we passen een technical registry toe, we karakteriseren en valideren en we maken gebruik van een preservation workflow die helpt om preservationstrategieën te kiezen en aan de hand daarvan preservation handelingen op geselecteerde archiefbescheiden uit te voeren. En er wordt gebruik gemaakt van een Collectie Beheer Systeem dat geschikt is om ook digital born archiefbescheiden te beheren. We sturen daarnaast aan op het gebruik van open tools, zodat vendor lock-in vermeden wordt. 7
3. Wordt er geregeld / real time gecontroleerd of archiefobjecten en metadata nog authentiek, integer en toegankelijk zijn? Ja, dit wordt geregeld en real time gecontroleerd door middel van het controleren van de fixity. 4. Wat wordt er van de zorgdrager verwacht op het gebied van preservatie planning? Welke kennis en kunde is noodzakelijk? Het is noodzakelijk dat de zorgdrager beschikt over een kwaliteitssysteem. In zijn eigen regelgeving moet de zorgdrager een bewaarstrategie opstellen waarin hij aangeeft hoe hij omgaat met de aspecten van preservation in zijn eigen organisatie. Verder zullen zorgdragers bij de inrichting van hun informatievoorziening rekening moeten houden met metadatering en open standaarden. Het plaatsen van informatieobjecten in het e-Depot kan daarna vrijwel naadloos plaatsvinden. Specifieke kennis en kunde bij de zorgdrager op het gebied van preservation planning is niet nodig.
Toegang 1. Ondersteunt het e-depot toegang voor verschillende doelgroepen? Ja, het e-Depot ondersteunt toegang voor archiefbeheerders middels een eigen interface, en ondersteunt koppelingen naar externe systemen via twee open standaarden: CMIS en OAIPMH. Binnen de koppelvlakken kan onderscheid worden gemaakt tussen volledige open data en data waarvoor een specifieke autorisatie nodig is. 2. Kan er onderscheid gemaakt worden voor toegang op basis van de Archiefwet en de Wet openbaarheid bestuur? Ja, op basis van vertrouwelijkheid (Wet openbaarheid bestuur) c.q. op basis van openbaarheid (Archiefwet). 3. Wie verzorgt het toegangsbeheer? Wat wordt van de zorgdrager verwacht? Bij alle archieven in het e-Depot verzorgt het Zeeuws Archief het toegangsbeheer. Van de zorgdrager wordt verwacht dat er nauwgezet wordt omgegaan met toegekende autorisaties en dat de bijbehorende metadata v.w.b. de rubricering op orde zijn. 4. Kan toegang worden verleend aan ketenpartners? Ja, dat kan, indien de nodige autorisaties zijn verleend. 5. Welke kanalen / middelen (kunnen) worden ingezet voor toegang? Zie vraag 1. De koppelvlakken zijn bruikbaar via internet en via de Haagse Ring, waar een 8
koppeling met GemNet gerealiseerd kan worden. 6. Welke zoekmogelijkheden zijn er beschikbaar? Zoeken op de aangeleverde metadata en - waar mogelijk - full text in de objecten. Verder kan worden gezocht via Wildcards en via Boleaanse operatoren. 7. Welke mogelijkheden zijn er om te zoeken op context / samenhang (bijvoorbeeld zaakdossiers)? Het is mogelijk te zoeken op alle metadata dus ook bijvoorbeeld op context-metadata. Desgewenst kunnen er zoekmogelijkheden worden ontwikkeld. Tot slot kan een zorgdrager in zijn eigen intra/internet een ‘stekker’ bouwen waarmee het e-Depot doorzoekbaar is. 8. Welke mogelijkheden zijn er voor de gebruiker om te controleren of de aangeboden informatie volledig en intact is? Om te beginnen garandeert de zorgdrager zelf dat de aangeboden informatie volledig en intact wordt aangeboden aan het e-Depot. Het Zeeuws Archief kan desgewenst een ingestlijst aanleveren aan de hand waarvan de zorgdrager dit kan controleren.
9. Wat wordt aan de gebruikers getoond (kopie / origineel)? In een digitale omgeving bestaan de concepten kopie en origineel niet. Er wordt immers altijd een kopie verstrekt. Het ‘origineel’ blijft achter op de harde schijf. Het e-Depot maakt wel onderscheid, tussen een masterexemplaar (bijv. TIFF), een presentatie-exemplaar (bijv. JPEG) en een preservation exemplaar (bijv. PDF-A).
Vernietigen 1. Op welke wijze is voorzien dat de zorgdrager de regie houdt over vernietiging?
Op het moment dat het Zeeuws Archief constateert dat informatieobjecten voor vernietiging in aanmerking komen wordt de zorgdrager om toestemming/accordering gevraagd. 2. Wat gebeurt er technisch bij vernietigen? Is weg ook echt weg? Ja, dan wordt het object definitief verwijderd. Er blijft echter altijd metadata achter (audit trail). 3. Op welke wijze is te zien dat informatie vernietigd is? Het informatieobject is niet langer op te vragen. 4. Hoe wordt omgegaan met te vernietigen informatie die in meerdere zaken / dossiers voorkomt? 9
Vernietiging van informatie in het ene dossier betekent niet dat hetzelfde informatieobject in een andere zaak / dossier ook wordt vernietigd.
10