digitaliseren “Archiveren kan je leren”, les 4 Sint-Niklaas, 29 november 2008 Willem Vanneste
digitaliseren is …
2
waarom digitaliseren?
conservering toegankelijkheid automatisering substitutie backup
3
conservering kwetsbaarheid gebruiksslijtage degeneratie analoge drager digitaliseren om verder informatie- of kwaliteitsverlies tegen te gaan digitaliseren om het analoge origineel te beschermen 4
toegankelijkheid digitaliseren om toegankelijkheid te vergroten moeilijk raadpleegbare dragers, technologische veroudering veel gevraagde documenten distributie en reproductie
5
automatisering digitaliseren binnen een werkproces overbruggen tijd en ruimte
6
substitutie digitalisering ter vervanging van het origineel om ruimte te besparen om degeneratie van origineel op te vangen
7
backup digitale kopie als extra veiligheidskopie voor kostbare/belangrijke documenten principe: hoe meer kopieën op verschillende plaatsen hoe meer kans dat de informatie niet verloren zal gaan
8
valkuilen afhankelijkheid soft- en hardware problematiek digitale archivering digitale bewaarstrategie nodig
9
planning digitaliseringsproject digitaliseringsproject beperkt zich niet tot scannen van documenten een goede planning en voorbereiding is essentieel om een effectief resultaat te bereiken
10
planning = antwoorden op
Waarom digitaliseren? Wat gaan we digitaliseren? Wie willen we bereiken? Wat zijn de kosten? Wie moet het werk doen en waar? Hoe moet het werk verlopen?
11
waarom digitaliseren? doelstellingen prioriteiten afstemming met core business
12
wat digitaliseren? Alles digitaliseren (en toegankelijk maken)? – Kosten – Tijdsduur
Overweeg selectie op basis van: – Fysieke staat – Inhoudelijke waarde – Afhankelijk van je doelstellingen
13
wie willen we bereiken? doelpubliek wat zijn hun noden en eisen?
14
wat zijn de kosten? Kosten identificeren – Personeel – Aanschaf hardware/software – Opslag – Management –…
Pas op voor verborgen kosten – Inzetten van eigen personeel – Gebruik van eigen infrastructuur – Onderhoud en herstellingen 15
kosten
selectie digitaliseren beschrijven beheerskosten
16
Wie en waar?
personeel infrastructuur samenwerking? uitbesteden?
17
Hoe moet het werk verlopen?
uittekenen workflow wie doet wat wanneer stappenplan kwaliteitseisen
18
workflow Welke stappen moet je ondernemen? Belang van een goede workflow: – Efficiënt – Productiviteit versus kosten (tijd/budget) – Kwaliteitscontrole!
Een workflow kan je opstellen voor: – Voorbereidend werk – Digitalisering – Beschrijving – Nazorg 19
bepalen kwaliteitvereisten In functie van je doelstellingen, middelen, budget, … Kwaliteit omschrijven? – “Er moet voldoende detail aanwezig zijn” – “De meest authentieke look moet behouden blijven” –… Vage omschrijvingen van kwaliteit laten niet toe om precieze technische vereisten te formuleren. 20
Kwaliteitsvereisten? Wat verstaan we onder kwaliteitsvereisten? – Inhoudelijke eisen (analoog) Kleinste betekenisvolle element? Inhoudelijke selectie?
– Vormelijke eisen (analoog) Overname van analoge artefacten? (ruis, scheuren, stof,…) In functie van de ‘authentieke look?’
– Bruikbaarheid Keuze van het juiste bestandsformaat en technische parameters in functie van de doelstellingen.
– Leesbaarheid Garantie op digitale leesbaarheid. Nu en in de toekomst!
21
Kwaliteitsvereisten het vastleggen van kwaliteitseisen gebeurt niet louter op basis van je doelstellingen maar van de fysieke kenmerken van de collectie in functie van de doelstellingen en de middelen (budget, personeel, logistiek,…) die je tot je beschikking hebt.
22
Technische parameters Het spreekt voor zich dat de kwaliteit van de hardware waarmee het analoge materiaal wordt omgezet zijn rol speelt. - beeldscanners: in welke mate zijn zij in staat de verschillende kleurschakeringen en details van het beeld te vatten? - geluid en video: geeft de afspeelapparatuur het analoge origineel wel correct weer? Is de hardware om het analoge signaal in een digtaal om te zetten van voldoende kwaliteit? De gebruikt apparatuur dient geijkt en nagezien in welke mate ze het analoge origineel eventueel vervormd. 23
Afbeeldingen/tekst Resolutie uitgedrukt in Pixels of Dots Per Inch (PPI of DPI): gangbare resoluties zijn 150, 300 en 600dpi Bitdiepte = aantal mogelijke variaties per pixel: – 1-bit = 2 mogelijke waarden > zwart/wit – 8-bit = 256 waarden > grijswaarden – 24-bit = 16,7 miljoen waarden > ‘ware kleuren’
Dynamisch bereik: 10-bit, 36-bit, ... Kleur: gebruikt standaard RGB-kleurenprofiel sRGB IEC 61966-2-1:1999 Artefacten: moiré, aliasing, noise, sharpness, … (zie Rapport Digitaal Beeldarchief, 2005, www.cdavid.be)
24
Geluid Sample-frequentie = aantal metingen van de geluidsgolf per seconde, bijvoorbeeld: – 44100 of 44,1 KHz = CD-kwaliteit – 192 KHz, 96 KHz, 48 KHz = masterkwaliteit
Sample-resolutie = aantal mogelijke variaties per meting. Hoe hoger de sample-resolutie hoe groter de mogelijke toonvariatie. – 16-bit = CD-kwaliteit – 24-bit = masterkwaliteit
Kanalen: 1 = mono, 2 = stereo (zie Rapport Digitaal Geluidsarchief, 2004, www.cdavid.be)
25
Video sample-frequentie – 4:4:4: Y:13,5 MHz, R-Y: 13,5 MHz, B-Y: 13,5 MHz – 4:2:2: Y:13,5 MHz, R-Y: 6,75 MHz, B-Y: 6,75 MHz
videoformaat: component (beeld bestaat uit meerdere signalen) frame-frequentie: 30 frames/seconde, 25 frames/seconde aantal lijnen: 720 lijnen bitdiepte: 10 bits aantal audiokanalen: 4
26
Bestandsformaten Masterkopie – maximale informatie, geen compressie of enkel lossless compressie – open gestandaardiseerd formaat – grote bestandsomvang
Raadplegingskopie – compressie – zo klein mogelijke bestandomvang – bij voorkeur open gestandardiseerd formaat
27
Bestandsformaten Afbeeldingen/tekst:
– masterkopie: TIFF (zonder compressie) of JPEG2000 (met lossless compressie) – raadplegingskopie: JPEG
Geluid
– masterkopie: WAVE (Windows) of AIFF (Mac) met PCM-codec – raadplegingskopie: MP3
Video
– masterkopie: AAF of MXF met M-JPEG2000-codec – raadplegingskopie: MPEG
28
Bestandsformaten Zie F. Boudrez, Standaarden voor digitale archiefdocumenten, eDAVID Antwerpen, 20012005 op www.edavid.be
Robèrt Gillesse e.a., Alternative File
Formats for Storing Master Images of Digitisation Projects, KB Den Haag, 2008 op www.kb.nl
29
Dragers “We bewaren documenten, géén dragers!” Veroudering dragers en bijhorende technologie vereist voortdurende omzetting van digitale bestanden naar nieuwe dragers. Offline dragers: CD, DVD, tape, … Storage-systemen (harddisk, tape-robots, …) Opslag is in eerste instantie een technische kwestie die er op gericht moet zijn de bitstream intact te bewaren. 30
digitale duurzaamheid 3 eisen voor digitale archiefdocumenten 1. uitvoerbaar zijn 2. visualiseerbaar zijn 3. begrijpbaar zijn
31
archiveringsstrategieën 1. bewaren technologie NOK 2. migratie 3. emulatie best combinatie van migratie en emulatie
32
DAVID-bewaarstrategie
33
Metadata In bestanden zelf Beeld: EXIF, IPTC en TIFF-tags Geluid: RIFF-WAVE-header Video: XML in XMF/AAF Voorbeeld TIFF-tags XML-container: cf. AIP-model van DAVID
34
Metadata Waar registreren? Onderscheid beheer en publicatie
35
Metadata-sets
Dublin Core PREMIS ISAD(G), ISAAR(CPF) …
“Mix and Match”-principe
36
Metadata-schema Eenvoud en flexibiliteit Inhoud, document en representaties Hiërarchie en structuur Unieke identificatie Technische informatie, geautoriseerde of gecontroleerd lijsten of invoer Wettelijke bepalingen Interoperabiliteit
37
inhoud vs representaties
38
hiërarchie
39
voorbeeldset
40
Toegankelijk maken Digitale collectie voor publiek beschikbaar stellen Diverse mogelijkheden en scenario’s
41
Toegankelijk maken 1. 2. 3. 4. 5.
Opzoeken stukken Aanvraag stukken Verwerken aanvraag Ophalen stukken Ter beschikking stellen
42
Modelscenario’s Laagtechnologische Hoogtechnologische
43
Laagtechnologische scenario Zoveel mogelijk bestaande infrastructuur CD of DVD Raadpleging op werkstation in de leeszaal
44
Hoogtechnologisch scenario Volledig geautomatiseerd Specifieke hard- en software On-line raadpleging
45
meer info www.edavid.be
46