Bewaren van digitale informatie: hoe kom je tot een goede beslissing? Hans Hofman Nationaal Archief Netherlands NCDD Planets dag Den Haag, 14 december 2009
Overzicht • Wat is het probleem? • Wat is er nodig? Hoe bepaal je de eisen? – De context van de organisatie – Eisen vanuit gebruik en – Collectieprofiel
• Het Planets planningsproces: reikwijdte en context, processtappen, conserveringsplan
De uitdaging • Grote en snel groeiende hoeveelheid digitale informatie – kwetsbaar • Snelle veranderingen in technologie • Risico van veroudering, beschadiging en verlies aan waardevolle informatie • (Pro‐)actieve en voortdurende aandacht en onderhoud noodzakelijk • Potentiële oplossingen fragmentarisch – goede infrastructuur ontbreekt nog – niet alomvattend
Planets Functioneel Model
eigendom bewustzijn verantwoordelijkheid object bewaaractie
conserveringsplan Beleid Organisatie
De planningsfunctie: van bewaarbeleid naar actie
Beleid/kader verta ling n
aar s o
ftware progr am
Plan ma
Actie/ uitvoering Terugkoppeling/ evaluatie
roce p s g in plann
Context: mandaat, organisatie
s
Evalueren van bewaarstrategieën • • • •
Verscheidenheid aan oplossingen en hulpmiddelen/software Elk daarvan heeft zijn sterke en zwakke kanten, maar … Eisen verschillen per omgeving Beslissing welke oplossing het beste is, is lastig en complex en vraagt zorgvuldig afwegings‐ en beslissingsproces • Evalueren van strategieën/tools om digitale informatie in stand te houden met behulp van representatieve steekproeven volgens specifieke eisen en criteria • Documentatie en verantwoording daarvan is essentieel
De stappen in het planningsproces
Definieer uitgangspunten
Documenteer aannames en beperkingen
Mandaat, objecten, en gebruikersgroepen
Doel van de planning
Wat is het beleid en wat zijn de richtlijnen en beperkingen?
Wat zijn redenen om een planningsproces te starten?
Collectie (profiel)
Omvang, type objecten, oorspronkelijke (technische) omgeving, gebruik
Voorbeeldobjecten
Softwareprogramma voor profilering (technisch)
Kiezen van voorbeeldobjecten/ records
Definieer de objecten die onderwerp zijn van de planning
Type
Omvang van collectie
Groeipercentage
Opslagformaat
…
Specificeer representatieve steekproef die de verscheidenheid aan essentiële kenmerken (wat moet altijd bewaard worden) dekt.
Identificeer de eisen
Beschrijf alle relevante kenmerken (op hoog en detail niveau) die in een bepaalde situatie gelden
Meestal 4 hoofdgroepen:
objectkenmerken (technische metadata ...) kenmerken van het intellectuele object (inhoud, context, samenhang, ...) proceskenmerken (schaalbaarheid, foutopsporing, ...) kosten (set-up, per object, HW/SW, personeel, ...)
Breng de beoogde doelstellingen met elkaar in verband (hiërarchisch)
bottom-up top-down
Eisen m.b.t objecten •
Wat moet worden bewaard? – – – – –
• • • • •
Inhoud Context Structuur Verschijningsvorm Gedrag
Authenticiteit Betrouwbaarheid Integriteit Bruikbaarheid (Accuraatheid)
Gebruikersperspectief • Doel van bewaring van digitale informatie is om (toekomstige) gebruikers bruikbare en authentieke informatie te kunnen bieden • Wat zijn de eisen van gebruikers? – gemakkelijke toegang – kennis over herkomst van documenten/ ze kunnen interpreteren – ze voor eigen nut en inzicht te kunnen hergebruiken
• Voorbeeldeisen: – sommige gebruikers willen graag dat alle informatie op een uniforme wijze wordt gepresenteerd – sommige gebruikers willen graag dat zij full‐text documenten kunnen doorzoeken (gevolg: migratie naar afbeeldingen is niet zinvol)
– …
Een eisen‐hiërarchie
Toekennen van meetbare eenheden • Criteria op laagste niveau moeten zo veel mogelijk objectief meetbaar zijn – – – –
Seconden per object Euro per object Resolutie en kleurdiepte …
• Subjectieve schalen waar nodig – Acceptatie van een opslagformaat – Hoeveelheid (verwachte) ondersteuning – …
Eisen‐hiërarchie (voorbeeld)
Evalueren van alternatieven Lijst van mogelijke acties: Migratie
Emulatie
Beide, andere...
Evaluatie is onafhankelijk!
Ontwikkelen en uitvoeren van experiment Toepassen
van elke actie op elke
steekproef Meten
van resultaten
Evalueren
van resultaten
Ontwikkelen en uitvoeren van experiment • Geef voor elk experiment gedetailleerd aan – wat de procedures en voorbereiding zijn – welke parameters zijn voor het integreren van ‘preservation services’ – wat het evaluatie/experiment plan is (workflow/volgorde van de stappen)
• Pas de geselecteerde potentiële conserveringstools toe op de steekproef van objecten – Deels geautomatiseerd door web‐services – Deels handmatig
Identificeren van mogelijke hulpmiddelen (acties)
Evalueer experiment • Evalueer het resultaat van elk alternatief voor elke tak van de eisenhiërarchie • Deels geautomatiseerd met behulp van tools – – – –
Vergelijken van objecten: XCL, Jhove, ImageMagick, ... Meten van ‚performance‘ Beoordelen van opslagformaten ...
• Resultaat: geëvalueerde eisenhiërarchie
Converteer de gemeten waarden • • • • •
Metingen gebeuren in seconden, euro, bits,… Moeten vergelijkbaar zijn Omzetten van gemeten waarden naar uniforme schaal Schaal 0‐5 Twee typen van omzetting – Numeriek – In categorieën • Resultaat: hiërarchie is klaar voor analyse
Stel relatieve wegingsfactoren in
Analyse results
Definitie van een conserveringsplan • ‘Een conserveringsplan definieert een serie bewaaracties die moeten worden uitgevoerd door een verantwoordelijke organisatie om een gesignaleerd risico m.b.t. een bepaald type digitale objecten (collectie) aan te pakken‘ • Het conserveringsplan is gebaseerd op bewaarbeleid/‐ richtlijnen, wettelijke eisen, organisatorische en technische beperkingen, gebruikerseisen en doel van bewaren. Het beschrijft de organisatorische context, de geëvalueerde alternatieve strategieën en de uiteindelijke definitieve beslissing alsmede waarom die genomen is.
De inhoud van een conserveringsplan 1. 2.
Identificatie Status Wat was de directe aanleiding voor dit plan? Is het goedgekeurd en zo ja, wanneer en door wie? Hoe verhoudt het zich met andere plannen m.b.t. eenzelfde type digitale objecten? 3. Beschrijving van de organisatorische setting 4. Beschrijving van de collectie (digitale objecten) 5. Doel en eisen 6. Documenteren van de beslissing ten gunste van een bepaalde conserveringsactie wat is de achtergrond van de beslissing beschrijving van de evaluatie van de alternatieven 7. Kostenoverwegingen 8. Trigger voor her‐evaluatie 9. Rolen en verantwoordelijkheden 10. Conserverings actieplan plan executable programma
Vragen?
www.planets-project.eu
[email protected] http://www.ifs.tuwien.ac.at/dp/plato/intro_documentation.html