HANDBOEK DIGITALISEREN
REPRODUCTIEFONDS VLAAMSE MUSEA NV www.reproductiefonds.be
[email protected] Abrahamstraat 13 9000 Gent T 09.235.47.30 F 09.235.47.39
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 1
Datum creatie: 1/03/2005
INHOUDSOPGAVE I. VOORWOORD....................................................................................................................................................................... 4 I.1. Situatieschets en de uitdagingen van het digitaal archiveren ....................................................................................... 4 II. THEORETISCHE BOUWSTENEN VAN EEN DIGITAAL ARCHIEF VOLGENS DE REGELS VAN DE KUNST.......................................................................................................................................................................................... 6 II.1. Inleiding ............................................................................................................................................................................ 6 II.2. Standaarden voor digitale archieven.............................................................................................................................. 6 II.2.a. Het belang van standaarden.................................................................................................................................... 6 II.2.b. Hiërarchie binnen de wereld van de standaarden................................................................................................ 7 II.2.c. Geschikte bestandsformaten voor archivering..................................................................................................... 7 II.2.c.1. Tekstdocumenten ............................................................................................................................................. 8 II.2.c.1.a. Officiële standaarden ................................................................................................................................ 8 II.2.c.1.b. Defacto standaarden................................................................................................................................. 8 II.2.c.2. Afbeeldingen ..................................................................................................................................................... 8 II.2.c.2.a. Bitmap/ rasterafbeeldingen ..................................................................................................................... 8 II.2.c.2.a.1. Officiële standaarden......................................................................................................................... 8 II.2.c.2.a.2. Defacto standaarden.......................................................................................................................... 8 II.2.c.2.b. Vectorafbeeldingen................................................................................................................................... 8 II.2.c.2.b.1. Officiële standaarden ........................................................................................................................ 9 II.2.c.2.b.2. Defacto standaarden ......................................................................................................................... 9 II.2.c.2.c. Meta afbeeldingen ..................................................................................................................................... 9 II.2.c.2.c.1. Officiële standaarden......................................................................................................................... 9 II.2.c.3. Audio.................................................................................................................................................................. 9 II.2.c.3.a. Officiële standaarden ................................................................................................................................ 9 II.2.c.3.b. Defacto standaarden................................................................................................................................. 9 II.2.c.4. Video .................................................................................................................................................................. 9 II.2.c.4.a. Officiële standaarden ................................................................................................................................ 9 II.2.c.4.b. Defacto standaarden................................................................................................................................. 9 II.2.c.5. Overzicht van geschikte en niet-geschikte bestandsformaten: ................................................................. 10 II.3. Bepalen van een archiefstrategie.................................................................................................................................. 10 II.3.a. Inleiding en stand van zaken................................................................................................................................. 10 II.3.b. Inkapseling.............................................................................................................................................................. 11 II.3.c Welke metadata bijhouden? ................................................................................................................................... 12 II.3.c.1. Archiefbeheer metadata ................................................................................................................................. 12 III.3.c.2. Technische metadata .................................................................................................................................... 12 III. DIGITALISEREN ............................................................................................................................................................. 13 III.1. Inleiding......................................................................................................................................................................... 13 III.2. Hoe succesvol digitaliseren? ....................................................................................................................................... 13 III.2.a. Zorg voor een goede voorbereiding................................................................................................................... 13 III.2.b. Besteed aandacht aan de kwaliteit van de digitalisering .................................................................................. 13 III.2.c. Kies een geschikt digitaal archiveringsformaat ................................................................................................. 13 III.2.d. Controleer en valideer.......................................................................................................................................... 13 III.3. Digitaliseren van tekst en afbeeldingen door scannen ............................................................................................ 14 III.3.a. Typologie scantoestellen...................................................................................................................................... 14 III.3.a.1. Doorvoerscanners......................................................................................................................................... 14 III.3.a.2. Glasplaat- of flatbedscanners ...................................................................................................................... 14 III.3.a.3. Drum-of trommelscanners .......................................................................................................................... 14 III.3.b. Scannerinterfaces.................................................................................................................................................. 14 III.3.c. Kwaliteitsvereisten moederkopie tekst of afbeelding ...................................................................................... 15 III.4. Digitaliseren van objecten door middel van digitale fotografie ............................................................................. 15 III.4.a. Evolutie van de digitale fotografie...................................................................................................................... 16 III.4.b. Typologie digitale fotocamera’s.......................................................................................................................... 16 De typologie van digitale fotocamera’s is gelijklopend met de typologie van analoge fototoestellen. Dit is begrijpelijk aangezien de digitale fotografie haar oorsprong vindt in de analoge fotografie. We onderscheiden volgende soorten digitale camera’s: III.4.b.1. Kleinbeeld digitale compactcamera’s – point and shoot - (35 mm) 1 6 III.4.b.2. Kleinbeeld digitale reflexcamera’s – dSLR - (35 mm) ............................................................................. 17 Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 2
Datum creatie: 1/03/2005
III.4.b.3. Middenformaatcamera’s met digitale rug .................................................................................................. 17 III.4.b.4. Technische camera’s met digitale rug......................................................................................................... 17 III.4.c. Over resolutie en megapixels, CCD en CMOS ................................................................................................ 17 III.4.c.1. Resolutie ......................................................................................................................................................... 17 III.4.c.2. Megapixels...................................................................................................................................................... 17 III.4.c.3. CCD................................................................................................................................................................ 18 III.4.c.4. CMOS............................................................................................................................................................. 18 III.4.c.5. Overzicht van vereiste resoluties (dpi) per eindtoepassing ..................................................................... 18 III.4.c.6. Minimale resoluties voor off-set druk ........................................................................................................ 19 III.4.d. Kwaliteitsvereisten moederkopie tekst of afbeelding ...................................................................................... 19 III.5. Digitaliseren van videomateriaal ................................................................................................................................ 20 III.5.a. Vereisten voor de digitalisering van analoog beeldmateriaal .......................................................................... 20 III.5.b. Typologie van randapparatuur............................................................................................................................ 20 III.5.b.1. De TV-tunerkaart ......................................................................................................................................... 20 III.5.b.2. Een externe omzetter................................................................................................................................... 21 III.5.b.3. Een IEEE1394-kaart.................................................................................................................................... 21 III.5.c. Kwaliteitsvereisten moederkopie videomateriaal ............................................................................................. 21 III.6. Digitaliseren van audiomateriaal ................................................................................................................................ 22 III.6.a. Kwaliteitsvereisten moederkopie audiomateriaal ............................................................................................. 22 IV. ONTSLUITEN ................................................................................................................................................................... 23 IV.1. Inleiding......................................................................................................................................................................... 23 IV.2. Juridische aspecten verbonden aan het verwerven en ontsluiten van audiovisuele archieven .......................... 23 IV.3. Ontsluiting door middel van software: beeldbeheer versus collectiebeheer ........................................................ 23 IV.3.a. Inleiding: Software voor beeldbeheer versus software voor collectiebeheer................................................ 23 IV.3.b. Software voor beeldbeheer.................................................................................................................................. 23 IV.3.b.1. Waarom? ........................................................................................................................................................ 23 IV.3.b.2. Aanbod op de markt .................................................................................................................................... 24 IV.3.b.3. Hoe het ideale beeldbeheersysteem selecteren?........................................................................................ 25 IV.3.c. Software voor collectiebeheer ............................................................................................................................. 25 IV.3.b.1. Waarom? ........................................................................................................................................................ 25 IV.3.b.2. Aanbod op de markt .................................................................................................................................... 25 IV.3.b.3. Hoe het ideale collectiebeheersysteem selecteren?................................................................................... 26 V. ARCHIVEREN .................................................................................................................................................................... 27 V.1. Inleiding .......................................................................................................................................................................... 27 V.2. Opslagmedia ................................................................................................................................................................... 27 V.2.a. Magnetische opslagmedia - Hard disks (& tapes) .............................................................................................. 27 V.2.a.1. Beschrijving ..................................................................................................................................................... 27 V.2.a.1.a. Harde schijf .............................................................................................................................................. 27 V.2.a.1.b Magneetbanden ........................................................................................................................................ 28 V.2.b Optische opslagmedia - CD en DVD .................................................................................................................. 28 V.2.b.1. Beschrijving ..................................................................................................................................................... 28 V.2.b.1.a. CD’s .......................................................................................................................................................... 28 V.2.b.1.b. DVD’s (Digital Video Disc )................................................................................................................. 29 V.2.b.2. Tips en aanbevelingen.................................................................................................................................... 30 V.2.c Conclusie en aanbevelingen in verband met bruikbare opslagmedia voor archivering. ................................ 31
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 3
Datum creatie: 1/03/2005
HET OPSTARTEN VAN EEN DIGITAAL ARCHIEF: THEORETISCHE BOUWSTENEN & PRAKTISCHE WERKWIJZEN
I. VOORWOORD I.1. Situatieschets en de uitdagingen van het digitaal archiveren Nu de digitalisering van diverse media sinds een aantal decennia een haast revolutionaire vlucht heeft genomen, worden we steeds vaker geconfronteerd met de alsmaar toenemende hoeveelheid digitale data. Sommige media gewagen al van een heuse digitale explosie 1 . Neem bijvoorbeeld de explosieve verkoop van digitale fototoestellen gericht op de consumentenmarkt en de daarmee gepaard gaande exponentiële toename van de hoeveelheid digitale foto’s die dagelijks worden genomen. Toch klagen fotofinishers over de afnemende hoeveelheid fotoprints die zij te verwerken krijgen: foto’s worden niet alleen steeds vaker digitaal aangemaakt maar ze worden ook steeds vaker uitsluitend digitaal bewaard en gepresenteerd. Daar waar vroeger foto’s werden afgedrukt en bewaard in fotodozen en albums worden digitale foto’s momenteel bewaard als fotobestanden in één of andere bestandenstructuur op een harde schijf of op cd-rom. Daarmee is de kous niet af want vroeg of laat wordt iedereen die op dergelijke wijze bezig is geconfronteerd met een aantal cruciale vragen. Vragen zoals: Bewaren wij de foto’s op datum, per onderwerp, per type foto? per toestel? Bewaren we alle beelden op de harde schijf van onze huiscomputer of maken we ook een kopie van de foto’s op een cd of dvd? Maken we een archief van al onze foto’s of enkel van een selectie van de allerbeste? Over het algemeen kan gesteld worden dat iedereen die digitale ‘content’ genereert - zoals men dit het IT vakjargon pleegt te noemen - vroeg of laat geconfronteerd wordt met de problematiek van het digitaal archiveren. Al gauw zal de betrokkene realiseren dat een digitaal archiefdocument in heel wat opzichten verschilt van een papieren archiefdocument. Zo is een digitaal document een flink stuk minder tastbaar dan een papieren archiefdocument doordat het wordt losgemaakt van de drager. Bovendien zijn digitale archiefdocumenten niet onmiddellijk leesbaar meer maar heb je één of andere vorm van technologie nodig om de data in een leesbare vorm om te zetten. Digitale archiefdocumenten worden ook telkens in verschillende verschijningsvormen wedersamengesteld zodat bij digitale archivering in feite niet zozeer meer in termen van ‘het origineel’ wordt gedacht. Telkens een digitaal document wordt opgevraagd wordt immers een kopie gemaakt van de aanwezige data/bitstream. Toch zijn er bij digitaal archiveren ook vraagstukken die al jaar en dag bij het klassiek archiveren de kop opsteken. Een van de vraagstukken heeft betrekking op de duurzaamheid van dragers waarop informatie is opgenomen. Net zoals papiersoorten verschillen in houdbaarheid, zullen ook digitale dragers zoals cd-roms verschillen in houdbaarheid. Later meer hierover. Digitale archivering is weinig vanzelfsprekend. Er kan zelfs gesteld worden dat er bij digitaal archiveren in eerste instantie meer vragen en aandachtspunten te kop opsteken dan bij klassieke archivering van papieren of analoge dragers. Waarom dan digitaal archiveren? Wel, wanneer digitale data op een eenduidige manier wordt bewaard dan wordt de raadpleegbaarheid of ontsluiting van de data een stuk sneller en minder arbeidsintensief. Ter illustratie: “Digitale Informatie explodeert», Wim De Preter - DE STANDAARD, Woensdag 7 maart 2007 Dries BEHEYDT Pagina 4 Datum creatie: 1/03/2005 Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32 1
Onderstaande vraagstukken moeten ons alvast wat inzicht geven in de materie van het digitaal archiveren. Een bij digitale archivaris die bij de pinken wil zijn, zoekt dus best voor elk van de vragen een antwoord, alvorens hij of zij start met het opzetten van een bruikbaar digitaal archief. - Hoe kan ik zeker zijn dat technologische evoluties in hard- en software mijn archief na verloop van tijd niet ontoegankelijk of onbruikbaar maken? - Hoe en waarop bewaar ik mijn digitale archiefdata? - Hoe breng ik structuur aan in mijn digitaal archief zonder het risico te lopen dat de gekozen structuur na verloop van tijd achterhaald is? - Hoe waarborg ik de authenticiteit van de gearchiveerde data? - Hoe maak ik op een veilige manier mijn digitaal archief toegankelijk voor anderen? Het doel van deze cursus is de lezer vertrouwd te maken met de heersende problematiek verbonden aan digitaal archiveren. Daarvoor introduceren wij de lezer eerst en vooral in de theorie van het archiefbeheer door middel van zogenaamde theoretische bouwstenen van een digitaal archief. Vervolgens bespreken we vanuit een meer praktisch oogpunt de verschillende courante archiveringstechnieken én de bruikbare opslagmedia. Aan het einde van deze studie moet de lezer in staat zijn om bovenstaande vragen te beantwoorden, rekening houdend met de particulariteiten van zijn of haar eigen situatie.
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 5
Datum creatie: 1/03/2005
II. THEORETISCHE BOUWSTENEN VAN EEN DIGITAAL ARCHIEF VOLGENS DE REGELS VAN DE KUNST II.1. Inleiding Vooraleer van start te gaan met digitaal archiveren is het van cruciaal belang om even stil te staan bij het concept digitaal archiveren en alles wat erbij komt kijken. Digitaal archiveren vertoont veel gelijkenissen met het klassiek archiveren van papieren dragers of materiële objecten maar het heeft ook belangrijke verschilpunten. Digitaal archiveren moet van bij de start met de nodige voorbereiding aangepakt worden zodat fundamentele problemen in een later stadium zoveel als mogelijk vermeden kunnen worden. Daarom maken we ons in dit hoofdstuk de theoretische bouwstenen van het digitaal archief eigen, zodat we met kennis van zaken de nodige software en hardware kunnen kiezen op maat van het beoogde, digitale archief.
II.2. Standaarden voor digitale archieven II.2.a. Het belang van standaarden Standaarden zijn belangrijk voor het verzekeren van de leesbaarheid van digitale archiefdocumenten op lange termijn. Er bestaan verschillende oplossingen voor het lange termijn leesbaarheidsprobleem: - migratie van de archiefdocumenten; - emulatie van de nodige hard-en softwareomgeving; Bij beide oplossingen zijn standaarden van levensbelang: bij een migratie worden immers archiefdocumenten omgezet naar een geschikt archiveringsformaat, dat meteen de status van standaard krijgt. Bij emulatie worden archiefdocumenten in een gestandaardiseerd bestandsformaat opgeslagen om ze leesbaar te houden binnen de aangelegde hard-en softwareconfiguratie. Wat zijn de voordelen verbonden aan het gebruik van standaarden? 1. Men vermijdt dat digitale archiefdocumenten afhankelijk zijn van de omgeving waarbinnen ze werden gecreëerd; 2. Men vermijdt dat digitale archiefdocumenten eerst moeten worden omgezet alvorens ze naar het digitaal archief worden overgebracht; 3. De digitale archiefdocumenten worden tenslotte ook op een uitwisselbare wijze opgeslagen. Mogelijke nadelen of kanttekeningen bij standaarden zijn: 1. Standaardisatieprocedures nemen tijd in beslag; 2. Officiële standaardisatie is niet altijd gewenst door ontwerpende ondernemingen aangezien ze voor een stuk de greep op hun product verliezen; 3. Vanuit commerciële redenen worden soms extra functionaliteiten bovenop standaarden aangeboden. Soms implementeren producenten standaarden op applicatiespecifieke wijze; 4. Niet voor elke computertoepassing zijn standaarden voorhanden. Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 6
Datum creatie: 1/03/2005
II.2.b. Hiërarchie binnen de wereld van de standaarden Standaarden kunnen per type achiefdocument hiërarchisch worden ingedeeld waarbij de aangelegde hiërarchie gebaseerd wordt op de zogenaamde ‘officiële status van de standaard’. Zo onderscheiden we: - de officiële of de jure standaarden. Dit zijn standaarden vastgelegd door officiële standaardiseringsorganisaties. - de defacto standaarden. Dit zijn standaarden vastgelegd door niet-officiële standaardiseringsorganisaties of afspraken die omwille van hun wijdverspreidheid de norm geworden zijn. De defacto standaarden worden op hun beurt onderverdeeld in drie categorieën: 1. open specificaties of aanbevelingen: vastgelegd door niet-officiële normerende organisaties 2. open standaarden: afhankelijk van één of meerdere producenten, gedocumenteerd en groot marktaandeel 3. gesloten standaarden: afhankelijk van één of meerdere producenten, niet gedocumenteerd, groot marktaandeel
II.2.c. Geschikte bestandsformaten voor archivering De officiële standaarden en de open specificaties en aanbevelingen genieten de voorkeur op de open en gesloten standaarden. De open en gesloten defacto standaarden zijn afhankelijk van één producent en kunnen bijgevolg te allen tijde worden gewijzigd. Open defacto standaarden zijn in tegenstelling tot gesloten defacto standaarden gedocumenteerd. OPGEPAST: voor de leesbaarheid op lange termijn biedt een officiële standaard a priori niet meer garanties dan een open specificatie of aanbeveling! Officiële standaardisatie en marktevoluties lopen immers niet altijd parallel. In veel gevallen loopt de officiële standaardisatie achter op marktevolutie zodat het soms voorkomt dat een officiële standaard bij de lancering al door gewijzigde marktomstandigheden deels achterhaald is geworden. Of een bepaalde specificatie echt als een “standaard” kan worden beschouwd, is bovendien afhankelijk van de implementatie door softwareproducenten en de toepassing door de eindgebruikers. De meest populaire wint! De wet van de kritische massa. Bits en bytes! Computers werken in binaire getallen. Alle informatie, gaande van tekst tot geluid, stilstaande en bewegende beelden moeten met andere woorden in binaire getallen worden omgezet. In zogenaamde codetabellen wordt vastgelegd welke alfanumerieke karakters, leestekens en controle tekens met bepaalde hexadecimale waarden overeenstemmen. MAAR, voor de meeste computertoepassingen is het louter tekstueel opslaan van gegevens conform een bepaalde codetabel niet voldoende. Naast tekstkarakters worden ook binaire tekens opgeslagen. Deze computertoepassingen maken, met andere woorden, een computerbestand waar zij – vaak volgens eigen recept of methode – deze gegevens in vastleggen. In principe kan elke fabrikant van computertoepassingen geheel zijn eigen zin doen. Toch zijn er in de loop der jaren, heel vaak omwille van commerciële redenen, fabrikanten op een zelfde manier computerbestanden gaan aanmaken of gebruiken, er is met andere woorden ook een vorm van standaardisatie ontstaan. In wat hierna volgt beschrijven we een aantal standaarden op het gebied van diverse computerbestanden.
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 7
Datum creatie: 1/03/2005
II.2.c.1. Tekstdocumenten II.2.c.1.a. Officiële standaarden -
platte tekst (.txt) Standard Generalized Markup Language (.sgml) HyperText Markup Language (.html)
II.2.c.1.b. Defacto standaarden -
eXtensible Markup Language (.xml) Tagged Image File Format (.tif, .tiff) HyperText Markup Language (.html) PostScript (.ps) Portable Document Format (.pdf) OpenOffice XML – (Open Document) Rich Text Format (.rtf) MS word (.doc)
II.2.c.2. Afbeeldingen De bestandsformaten voor de opslag van digitale afbeeldingen worden doorgaans in drie groepen verdeeld: de bitmap/rasterafbeeldingen (II.2.c.2.a.) – de vectorafbeeldingen (II.2.c.2.b.)–de meta afbeeldingen (II.2.c.2.c).
II.2.c.2.a. Bitmap/ rasterafbeeldingen De bitmap- of rasterafbeeldingen worden opgeslagen als een verzameling pixels gerangschikt in rijen en kolommen. Elk punt van de afbeelding (pixel) kan met een tabelcel worden vergeleken. De bitmap bevat de afbakening van de afbeeldingsruimte en de kleuren van de pixels binnen de afbeelding. II.2.c.2.a.1. Officiële standaarden
-
Tagged Image File format (.tif, .tiff) Joint Photographic Experts Group (.jpeg, .jpg) Portable Network Graphics (.png)
II.2.c.2.a.2. Defacto standaarden
-
Bitmap (.bmp) Graphics Interchange Format (.gif) Encapsulated Postscript (.eps) Digitaal Negatief (.dng)
II.2.c.2.b. Vectorafbeeldingen De vector of object-georiënteerde afbeeldingen zijn afbeeldingen die als samenstelling van vormen worden opgeslagen. Door middel van wiskundige formules wordt van elke vorm de x en y coördinaten bijgehouden. Vectorbestanden zijn met andere woorden bestanden die opgebouwd worden op basis van het verbinden van de lijnen tussen twee of meerdere punten. Zonder meer de belangrijkste eigenschap van de vectorafbeeldingen is dat dit soort afbeeldingen, in Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 8
Datum creatie: 1/03/2005
tegenstelling tot rasterafbeeldingen, geen vervorming vertonen bij schaling. De figuur kan met andere woorden oneindig groot worden gemaakt, er zal geen kwaliteitsverlies optreden. II.2.c.2.b.1. Officiële standaarden
-
NVT
II.2.c.2.b.2. Defacto standaarden
-
Scalable Vector Graphics (.svg) Drawing eXchange Format (.dxf) Drawing (.dwg)
II.2.c.2.c. Meta afbeeldingen Meta-afbeeldingen kunnen in één en hetzelfde computerbestand zowel een raster-als vectorversie van dezelfde afbeelding opslaan. De meta-formaten hebben hierbij als doel de uitwisseling tussen toepassingen en besturingssystemen gemakkelijk te laten verlopen. II.2.c.2.c.1. Officiële standaarden
-
Computer Graphics Metafile (.cgm)
II.2.c.3. Audio II.2.c.3.a. Officiële standaarden -
MPEG-audio (.mpeg, .mpg) Pulse Code Modulation (.pcm)
II.2.c.3.b. Defacto standaarden -
WAVE (.wav) Access Unit (.au) Audio Interchange File Format (.aiff) Free Lossless Audio Codec (.flac) OGG Vorbis (.ogg)
II.2.c.4. Video II.2.c.4.a. Officiële standaarden -
MPEG-video (.mpeg, .mpg) Motion JPEG-2000 (.mj2, .mjp2)
II.2.c.4.b. Defacto standaarden -
Advanced Authoring Format (.aaf) Material Exchange Format (.mxf) Audio Video Interleave (.avi) Quicktime (.qt, .mov) Flash (.swf)
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 9
Datum creatie: 1/03/2005
II.2.c.5. Overzicht van geschikte en niet-geschikte bestandsformaten: Data Type Text & Documenten
Stabiele langetermijnformaten ASCII Text, Microsoft Rich Text Format, Adobe PDF
Beelden en Foto’s Geluiden & Muziek
PNG, TIFF, JPEG MP3, WAV, AIFF
Films & Video Databases & Spreadsheets
MPEG (version 1, 2 or 4) ASCII Text, DBF-formaat
Onstabiele langetermijnformaten Microsoft DOC Formaat, andere tekstverwerkingsformaten GIF, BMP Windows Media, AU Format, RealAudio AVI, Quicktime, RealVideo Excel, Access, Filemaker
Bron: http://peripherals.about.com/library/weekly/aa041701a.htm
II.3. Bepalen van een archiefstrategie II.3.a. Inleiding en stand van zaken Met de theoretische concepten rond standaarden in het achterhoofd weten we al in welk formaat we de digitale data zullen bewaren. In een volgende stap denken we na over de manier waarop we de leesbaarheid van de volgens bepaalde standaarden opgeslagen data (bits and bytes) in de toekomst kunnen garanderen. We moeten met andere woorden een strategie vastleggen die we zullen volgen bij de aanmaak en het onderhoud van ons digitaal archief. Zonder een duidelijk beeld van de te volgen bewaarstrategie zal het immers onmogelijk zijn om de inhoud van het digitale depot op een gestructureerde manier te organiseren. Daarom staan we in dit deel stil bij de ontwikkeling van de meest ideale bewaarstrategie. Het bepalen van een ideale bewaarstrategie komt in praktijk neer op het onderzoeken van de wijze waarop in de toekomst, op basis van de gearchiveerde ‘bits and bytes’ men opnieuw de digitale archiefdocumenten op scherm kan reconstrueren. De manier waarop we dit mogelijk maken kwam al ter sprake bij het onderdeel waar het belang van standaarden werd toegelicht; in het bijzonder: migratie en emulatie. Onderzoek wees namelijk uit dat migratie en emulatie op dit moment de potentieel meest geschikte bewaarstrategieën zijn. Essentieel hierbij te onthouden is dat het bij migratie en emulatie niet uitsluitend over een ‘of-of’ verhaal gaat maar dat beide concepten complementair aan elkaar zijn: migratie en emulatie zijn elk het meest geschikt voor bepaalde types archiefdocumenten. Voor tekstdocumenten zal migratie de meest voor de hand liggende strategie zijn, voor dynamische archiefdocumenten echter zal een emulatie of een gecombineerde strategie van migratie en emulatie aangewezen zijn. Om zoveel mogelijk de blijvende leesbaarheid van gearchiveerde data te garanderen, is het verstandig om archiefdocumenten in zowel hun origineel bestandsformaat als hun archiveringsformaat in het digitale archief te bewaren. Wanneer er vervolgens in de nabij of verre toekomst de nodige soft-of hardware ontbreken, heeft men met deze bewaarstrategie maar liefst vier mogelijkheden om de aangelegde archiefdocumenten op scherm te reconstrueren: - emulatie van het originele bestandsformaat; - migratie van het originele bestandsformaat; - emulatie van een geschikt archiveringsformaat; Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 10
Datum creatie: 1/03/2005
-
migratie van een geschikt archiveringsformaat.
Bovengenoemde archiveringsstrategie 2 heeft talrijke voordelen: - Door zowel de originele als gemigreerde bestandsformaat in het archief mee op te nemen, anticipeert men op de technologische evolutie in de toekomst. Dit biedt de hoogst mogelijke leesbaarheidsgarantie. - Archiefgebruikers kunnen afhankelijk van hun voorkeur of de software waarover ze beschikken een digitaal archiefdocument zowel in de originele bitstream als een gemigreerde bitstream raadplegen - Door het archiveren van de originele bitstream blijft authenticatie mogelijk op basis van technologieën die gebaseerd zijn op de originele bitstreams. Originele bestanden blijven met andere woorden leesbaar in de programmatuur waarin ze initieel ook werden ingelezen.
II.3.b. Inkapseling Uit het onderdeel over de standaarden in bestandsformaten hebben we onder andere geleerd dat digitale (computer)bestanden vaak uit meerdere delen bestaan. Zo hebben we bij digitale fotobestanden bijvoorbeeld niet alleen de bitstream waaruit het beeld zelf is opgebouwd maar ook de zogenaamde metadata of beschrijvende informatie bij het beeld. Bij de keuze van een archiveringsmethode is het bijgevolg van heel groot belang om stil te staan bij het correct identificeren en relateren van de verschillende componenten van een digitaal archiefdocument. Deze componenten vormen immers een logisch geheel dat na overbrenging naar een archief nooit verloren mag gaan. Het gescheiden bewaren van de componenten van een digitaal archiefdocument is heel gebruikelijk en in vele gevallen ook onoverkomelijk maar het houdt altijd een risico in. Daarom verdient het de aanbeveling om in de opbouw van een (ontdubbeld) archief steeds metadata mee op te nemen in de computerbestanden die de documenten bevatten. Het toevoegen van metadata aan computerbestanden wordt ‘encapsulation’ of inkapseling genoemd. Inkapseling biedt onder meer volgende voordelen: - de metadata vormen een integraal onderdeel van het gearchiveerde digitale object en worden er onlosmakelijk mee verbonden; er moet dus niet steeds gezorgd worden voorlinks tussen digitale objecten en hun metadata. - alle componenten van een digitaal archiefdocument kunnen gemakkelijk samen worden getransfereerd of gemigreerd. - de digitale archiefdocumenten zijn zelfbeschrijvend. - de ingekapselde metadata kunnen te allen tijde van de digitale objecten worden losgemaakt of worden aangesproken (bvb Exif-readers). - inkapseling scoort beter bij risk assessment, dit houdt in dat rampgevallen minder grote impact hebben op data die op deze manier werd bewaard. In het geval bijvoorbeeld een databank met metadata crasht, zijn in het digitale depot nog steeds de ingekapselde archiefdocumenten aanwezig waaruit de metadata eenvoudig kunnen gereconstrueerd worden.
Deze strategie wordt onder andere door de werkgroep digitalisering DAVID, verbonden aan de Stad Antwerpen, als ideale archiefstrategie naar voren geschoven. Zie hiervoor ‘Handboek Digitaal Archiveren in de Praktijk’, F. BOUDREZ & Hannelore DEKEYSER.- 2003 – Stadsarchief Antwerpen. Dries BEHEYDT Pagina 11 Datum creatie: 1/03/2005 Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32 2
Mogelijke vormen om inkapseling mogelijk te maken: 1. Metadata opnemen in de computerbestanden die één bepaalde representatie van het archiefdocument bevatten. 2. Inkapselen van de verschillende representaties van hetzelfde archiefdocument in een zogenaamd containerbestand. Vanuit technisch oogpunt is de tweede vorm van inkapseling, het aanmaken van een containerbestand, te verkiezen. Bij de eerste vorm van inkapseling, voornamelijk het invullen van metadatavelden binnen in computerbestand, botsen we immers op technische beperkingen: - de ruimte binnen metadatavelden is klassiek te klein… er kan met andere woorden te weinig informatie ingevuld worden. - het aantal metadatavelden is eerder beperkt en beantwoordt niet noodzakelijk aan de noden van een digitale archivaris. - Voor het inlezen en invullen van metadata zijn specifieke programma’s nodig. Niets garandeert ons dat deze programma’s in de toekomst ook beschikbaar blijven.
II.3.c Welke metadata bijhouden? Metadata is een abstract en vrij interpreteerbaar gegeven. Om één en ander te concretiseren bekijken we in dit hoofdstuk welke metadata we precies voor optimale archiveringsdoeleinden dienen bij te houden.
II.3.c.1. Archiefbeheer metadata Als archiefdocument heeft een digitaal archiefbestand in de eerste plaats metadata nodig over de identiteit van elke archiefbestand (elk bestand moet een identiteit hebben en ook een authentiek karakter hebben zodat het van andere bestanden kan onderscheiden worden) maar ook metadata die de context beschrijven waarin het document tot stand kwam.
III.3.c.2. Technische metadata Ook een aantal technische gegevens die de gearchiveerde bitstreams documenteren waaruit de archiefdocumenten op scherm gereconstrueerd worden. Bij de selectie van essentiële metadata die mee ingekapseld dienen te worden, moet een archivaris een evenwicht trachten te vinden tussen de autonomie én de beheersbaarheid van de containerbestanden. Voorbeelden van metadata die voor inkapseling in aanmerking komen zijn ondermeer: Metadata als archiefdocument Metadata als digitaal object Unieke ID Identificatie van het bestandsformaat Titel Versienummer van het bestandsformaat Onderwerp Toegepast profiel van het bestandsformaat Auteur of verzender of geadresseerde Gebruikte codetabel Datum Relaties met andere archiefdocumenten Werkproces waarbinnen archiefdocumenten werden ontvangen, opgemaakt of beheerd
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 12
Datum creatie: 1/03/2005
III. DIGITALISEREN III.1. Inleiding Het digitaliseren van objecten, of het nu schilderijen, kaarten, foto’s, videobanden, geluidscassettes, kranten of documenten zijn, vereist in eerste instantie het gebruik van een digitaliseringsapparaat én een interface waarmee het apparaat communiceert met een computersysteem. Op die manier kan, technisch, een digitale representatie van een object worden gemaakt. Daarmee is echter de kous verre van af. Zoals we in eerdere hoofdstukken al hebben geleerd is een gebruiker, door het digitaliseren, immers niet alleen afhankelijk van de leesbaarheid van de dragers (dwz duurzaamheid van de dragers én de beschikbaarheid van apparatuur die deze dragers fysisch kunnen lezen) maar ook van de nodige softwaresystemen die de digitale bitstream kunnen interpreteren en omzetten naar een voor de mens interpreteerbare/leesbare vorm. Met het hoofdstuk over standaarden én het aanmaken van een bewaarstrategie nog fris in het hoofd is het dan ook begrijpelijk dat men bij het digitaliseren best onmiddellijk de output van de digitalisering, de zogenaamde digitale archiefdocumenten, in een geschikt – lees: gestandaardiseerd- bestandsformaat te bewaren.
III.2. Hoe succesvol digitaliseren? Vooraleer we een aantal technische digitaliseringsmogelijkheden bekijken, staan we even stil bij enkele tips en aanbevelingen om succesvol aan het digitaliseren te gaan.
III.2.a. Zorg voor een goede voorbereiding Digitalisering is een dure en arbeidsintensieve bezigheid. Het loont daarom om vooraf te overwegen of digitalisering voor alle objecten in het archief de meest aangewezen optie is. Bij grote hoeveelheden objecten met een verschillende prioriteit kan gefaseerd tewerk worden gegaan. Besteed ook vooraf voldoende tijd aan het oplijsten van welke metadata er bij het digitale document ingekapseld zullen worden, conform de gekozen archiveringsstrategie.
III.2.b. Besteed aandacht aan de kwaliteit van de digitalisering Maak een moederkopie van zo hoog mogelijke kwaliteit zodat het geschikt is voor zoveel als mogelijk toepassingen (in de toekomst) zoals bijvoorbeeld onderzoek, reproductie, uitvergrote presentatie. Indien na digitalisering bepaalde bewerkingen worden uitgevoerd op het digitaal bestand is het aangewezen ook onbewerkte versie van het moederbestand te bewaren. Besteed tenslotte ook voldoende aandacht aan de kwaliteit en de calibratie van de digitaliseringstoestellen vooraleer je begint te digitaliseren.
III.2.c. Kies een geschikt digitaal archiveringsformaat Moederkopieën worden het best bewaard in een archiveringsformaat dat gestandaardiseerd en voldoende verspreid is. Het moet bovendien zorgen voor een goed gestructureerde opslag van informatie, zonder verlies door compressie én het moet de mogelijkheid bieden om (zelfgedefinieerde) metadatavelden in te kapselen. Tenslotte is een archiveringsformaat het best zoveel mogelijk onafhankelijk van specifieke dragers of inleesapparatuur.
III.2.d. Controleer en valideer Controleer de gedigitaliseerde bestanden vooraleer ze worden opgeslagen op lange termijn dragers. Kijk hierbij na of de vooropgestelde bestandsformaten correct worden toegepast en of Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 13
Datum creatie: 1/03/2005
de naamgeving van de bestanden verloopt volgens vooraf vastgelegde richtlijnen. Controleer ook steeds of de vereiste metadata correct en volledig is ingevuld.
III.3. Digitaliseren van tekst en afbeeldingen door scannen Scannen, letterlijk vertaald als ‘aftasten’ is in feite het systematisch aftasten van een reëel object om het vervolgens om te zetten in digitale data. Deze data kan opgeslagen worden op een computer, waarna de data geanalyseerd of bewerkt kan worden. Het aftasten van objecten met behulp van scanners gebeurt volgens verschillende methodes, naargelang het type scanner (technologie). Het eindresultaat is sterk verschillend naargelang het soort scanner dat gebruikt wordt.
III.3.a. Typologie scantoestellen
III.3.a.1. Doorvoerscanners Een typisch voorbeeld van doorvoerscanners zijn filmscanners die negatieven scannen. Een negatiefrol of een stuk van een negatiefrol wordt in het toestel getrokken waarna het scantoestel het filmoppervlak aftast. Na ‘aftasting’ verschijnen de belichte delen afzonderlijk in de scannerinterface waarna de gebruiker kan selecteren welke foto’s er gescand dienen te worden.
III.3.a.2. Glasplaat- of flatbedscanners Een type scanner waarbij de te scannen documenten ook plat op een glazen plaat gelegd kunnen worden. Vooral handig bij afwijkende formaten en voor het scannen van bladzijden uit (dunne) tijdschriften en boeken.
III.3.a.3. Drum-of trommelscanners Trommelscanners bezitten een trommel met een precieus mechanisme, waarop de ‘opzichtoriginelen’ of de ‘doorlicht-originelen’ bevestigd kunnen worden. Vervolgens kan alleen dun, flexibel papier of folies ingescand worden. De trommel draait bij het scannen met hoge snelheid rond terwijl een aftastelement (waarin objectief, diafragma, foto-elektrische omvormer en de lichtbron zitten) in de richting van de as verschoven wordt en het origineel punt voor punt aftast. Trommelscanners zijn duur in aankoop en worden bijgevolg vooral gebruikt voor professionele scantoepassingen of voor toepassingen waar scherpte, formaat en bitdiepte van primordiaal belang zijn.
III.3.b. Scannerinterfaces Voor de koppeling met de PC zijn momenteel verschillende soorten interfaces mogelijk: 1. Parallelle printerpoort (bidirectioneel) 2. USB (versie 1 of 2 maakt veel verschil in snelheid) 3. SCSI, vooral bij de meer professionele machines 4. Firewire (IEEE 1394) 5. De Apple OS X machines en scanners werken ook veelal met USB 2.0, maar ze doen dit pas echt snel en goed vanaf Mac OS X versie 10.3 of 10.4 Voor het scannen van filmnegatieven, en diapositieven (kleinbeeld en/of middenformaat en/of grootbeeld) is het gebruik van een trommelscanner aangewezen. Sommige toestellen spannen de ekta’s bovendien op onder olie. Dit zorgt voor een sterke vermindering van zichtbare stofdeeltjes op het filmoppervlak. Na het scannen is er zodoende minder manueel correctiewerk aan het digitale beeldbestand. Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 14
Datum creatie: 1/03/2005
III.3.c. Kwaliteitsvereisten moederkopie tekst of afbeelding Kwaliteitsvereisten moederkopie 3 : * Bestandsformaten: TIFF (versie 6.0) − extensie Windows, Unix en OS/2: “.TIF” − extensie Mac: “.TIFF” * Compressie: geen * Byte-volgorde: “Intel” TIFF * Metadatavelden in de TIFF-header voor archiefmetadata: − Compression (tagnr. 259): 1 (=uncompressed) − DocumentName (tagnr. 269): bijv. bestandsnaam − ImageDescription (tagnr. 270): beschrijving van de afbeelding − Make (tagnr. 271): fabrikant van de scanner, video, apparatuur die werd gebruikt voor het maken van de afbeelding − Model (tagnr. 272): gebruikte scanner − Software (tagnr. 305): software naam en versienummer van de software die werd gebruikt voor het maken van de afbeelding − DateTime (tagnr. 306): datum van digitalisering (JJJJ:MM:DD UU:MM:SS) − Artist (tagnr. 315): bijv. naam van de archiefbeherende instelling − HostComputer (tagnr. 316): bijv. hardware, besturingssysteem − CopyRight (tagnr. 33432): houder van het copyright ! Opmerking 1: Deze tags bevatten een ASCII-veld (7 bits ASCII) waarvan de laatste byte ‘NUL’ moet zijn. ! Opmerking 2: Een TIFF-document is in zekere zin uitbreidbaar. Organisaties kunnen zelfgekozen tags (vanaf tagnr. 32768) aan TIFF-documenten toevoegen. Deze zogenaamde “private tags” worden beter vermeden, want ze kunnen immers leesbaarheids- en uitwisselingsproblemen opleveren en vereisen specifieke software. De “private tags” en hun inhoud kunnen verloren gaan, wanneer de afbeelding achteraf wordt bewerkt en opgeslagen met een applicatie die deze tags niet ondersteunt. Bepaalde applicaties voegen echter altijd één of meerdere “private tags” aan TIFF-documenten toe (bijv. PhotoShop, PageMaker, enz.). * Digitaliseringsparameters en veel gebruikte instellingen: − resolutie: 400 PPI, 300 PPI, 150 PPI − bitdiepte: * Kleurdiepte afbeeldingen: 24 of 48 bits/pixel * Grijswaarden afbeelding: 8 of 16 bits /pixel * Zwart-wit afbeelding: 1 bit/pixel
III.4. Digitaliseren van objecten door middel van digitale fotografie Digitale fotografie gebruikt, in tegenstelling tot de analoge of klassieke fotografie, elektronische media voor het opslaan van een beeld als binaire data. Deze techniek vergemakkelijkt het bewaren en het bewerken van beelden op computers. Ook het onmiddellijk tonen van de gemaakte opname evenals de mogelijkheid om opnames eenvoudig en permanent te wissen wordt aanzien als een wezenlijk verschil (verbetering) in vergelijking met de analoge fotografie. In wat volgt bekijken we beknopt de evolutie van de digitale fotografie en staan we even stil bij een aantal kernbegrippen in verband met deze recente vorm van fotografie. Tot slot bekijken we de praktische bruikbaarheid van digitale beeldbestanden voor diverse toepassingen.
Bron : http://www.expertisecentrumdavid.be/davidproject/teksten/Richtlijn9.pdf Dries BEHEYDT Pagina 15 Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32 3
Datum creatie: 1/03/2005
III.4.a. Evolutie van de digitale fotografie Digitale fotografie werd al gebruikt in de astronomie lang vóór het door het grote publiek werd gebruikt. De technologie voor beeldweergave en opslag, de zogenaamde CCD’s, die in astronomie wordt gebruikt is vrijwel gelijkaardig aan die gebruikt in digitale consumentencamera’s, maar dan met als grootste verschil dat zij over het algemeen uitsluitend zwart-witbeelden weergeven en de beeldsensor met vloeibare stikstof wordt gekoeld om beeldstoringen veroorzaakt door hitte te vermijden of te verminderen; vele astronomische instrumenten hebben immers een complete serie aan CCD’s, soms tot bijna één miljard pixel. Vandaag de dag gebruiken amateurastronomen ook eerder gewone digitale camera’s verkrijgbaar op de consumentenmarkt en zelfs webcams voor het uitoefenen van hun hobby. Hoewel digitale fotografie al een tijdje bestond, bleef het in eerste instantie een fenomeen dat zich leek te beperken tot gebruik in bepaalde sectoren. De jaren 2000 brachten echter verandering in dit gegeven en waar digitale fotografie eerst aarzelend werd geïntroduceerd als ‘nog een nieuwe’ fototechniek veranderde snel in een heuse revolutie waarbij de analoge fotografie steeds verder in de verdrukking kwam te staan. Eind 2002, waren al 2 megapixel camera’s te koop voor een prijs beneden 100 $. Tegelijkertijd werd ook de afdrukkwaliteit van digitale beelden verbeterd omdat meer en meer fotolaboratoria over de technologie konden beschikken om digitale prints op de klassieke (chemische) manier af te drukken op echt fotopapier. De kwaliteit en de duurzaamheid van deze afdrukken was een flinke stap vooruit in vergelijking met de vergankelijke inkjetprints die tot op dat moment werden gemaakt. Naarmate cameraproducenten de productie van de digitale fototoestellen verplaatsten naar Azië, bvb China) werden de toestellen steeds goedkoper om maken waardoor de toestellen snel de status van massaconsumptiegoed verwierven, vergelijkbaar met de opkomst van GSM-toestellen. Vele GSM-toestellen beschikken momenteel zelfs over een ingebouwde digitale camera. De opmars van digitale toestellen was niet meer te stuiten en de gevolgen voor de analoge markt waren dramatisch. De grote namen uit de ‘analoge wereld’ zoals KODAK, AGFA, MINOLTA kondigden de bijna volledige stopzetting aan van hun activiteiten in de branche van de analoge fotografie. Zo besloot Kodak begin 2004 om niet langer meer analoge fototoestellen te produceren. Twee jaar later volgde Nikon het voorbeeld van Kodak en kondigde het aan dat het enkel nog twee types analoge toestellen zou produceren: één instapmodel voor amateurfotografen (F10) en één professioneel toestel (F6).
III.4.b. Typologie digitale fotocamera’s De typologie van digitale fotocamera’s is gelijklopend met de typologie van analoge fototoestellen. Dit is begrijpelijk aangezien de digitale fotografie haar oorsprong vindt in de analoge fotografie. We onderscheiden volgende soorten digitale camera’s:
III.4.b.1. Kleinbeeld digitale compactcamera’s – point and shoot - (35 mm) Digitale compactcamera’s zijn, zoals het woord al zegt, fototoestellen die de klemtoon leggen op hun draagbaarheid en compactheid. Het zijn toestellen voor een brede consumentenmarkt met heel vaak een overdaad aan automatische functies om het nemen van geslaagde foto’s zonder al te veel voorkennis mogelijk te maken. Dergelijke toestellen hebben heel vaak niet de mogelijkheid om ongecomprimeerde beeldbestanden te genereren (zogenaamde RAW-bestanden) waardoor ze gecomprimeerde bestanden opleveren zonder eigen, ingekapselde metadata, meestal in het formaat .JPEG. Dit soort toestellen is daardoor, als enige van de toestellen uit deze typologie, af te raden voor wat betreft de aanmaak van digitale beeldbestanden voor een digitaal archief. Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 16
Datum creatie: 1/03/2005
III.4.b.2. Kleinbeeld digitale reflexcamera’s – dSLR - (35 mm) Een DSLR (Digitale Single Lens Reflex camera) of digitale spiegelreflexcamera is een fototoestel waarbij gebruikgemaakt wordt van dezelfde mechanische en optische principes als de analoge spiegelreflexcamera's (SLR's). Het verschil tussen de beide typen camera's is dat de klassieke achterwand met negatiefhouder vervangen wordt door een achterwand met een beeldsensor. Veel fabrikanten van dSLR's borduren voort op hun al bestaande conventionele SLR-systemen, waarbij accessoires als objectieven, flitsers en dergelijke op zowel "film" als digitale camera bruikbaar zijn. Bij gebruik van een ‘analoge lens’ op een digitale reflexcamera waarvan de beeldsensor niet van het “full-frame” type is, moet rekening gehouden worden met een verlies aan breedhoek van de betreffende lens. In dit geval zal een 28mm lens bijvoorbeeld een 42mm lens worden.
III.4.b.3. Middenformaatcamera’s met digitale rug Een middenformaatcamera is een fotocamera die gebruik maakt van een groter negatiefformaat dan een kleinbeeldcamera, en kleiner dan een technische camera. Bij middenformaat spreekt men klassiek over een formaat van 6x6. Dit betekent dat met negatieven in vierkante vorm wordt gewerkt met een afmeting van 6 cm x 6 cm. Producenten zoals PhaseOne en Imacon hebben voor dergelijke camera’s (bijvoorbeeld Hasselblad) zogenaamde digitale ruggen of achterwanden ontwikkeld. Dit is een gekoelde console die op de camera wordt bevestigd op de plaats van de klassieke achterwand met het filmtransportmechanisme. Daarbij is de oppervlakte en de vorm van de beeldsensor op deze achterwond gelijk aan een filmnegatief bij de analoge versie.
III.4.b.4. Technische camera’s met digitale rug Een technische camera is een type camera waarvan de opbouw bestaat uit twee delen: 1. Een optische balk of loopbodem, waarbij de loopbodem iets beperkter kan (maar niet hoeft te) zijn. Een loopbodem kan vaak opgeklapt worden tot een kleiner en makkelijker transporteerbaar pakket. 2. Daarop een filmhouder en een lenshouder, verbonden met elkaar door een balg. Door de lenshouder te verplaatsen kan de (verwisselbare) lens gefocust (scherpgesteld) worden op het filmvlak, of helemaal de basis van beeld vormen.
III.4.c. Over resolutie en megapixels, CCD en CMOS
III.4.c.1. Resolutie De resolutie drukt het scherpteniveau van een afdruk op papier of een beeldscherm uit. De beeldresolutie op een scherm wordt uitgedrukt in het aantal pixels per lijn, vermenigvuldigd met het aantal lijnen per beeld. Bijvoorbeeld: een resolutie van 1024 x 768 betekent dat er op elk van de 768 lijnen van het scherm 1024 pixels voorkomen. Bij printers of scanners spreekt men van pixels of dots (beeldpunten) per inch (ppi of dpi). Een doorsnee laserprinter heeft een resolutie van 300 dpi, dus 90.000 dots per vierkante inch.
III.4.c.2. Megapixels Een megapixel is gelijk aan 1 miljoen pixels. De resolutie van een digitale camera wordt doorgaans in megapixels aangegeven. Dit is dan de resolutie (of het aantal pixels) die op de digitale beeldsensor voorkomen. Om het correcte aantal pixels te weten vermenigvuldig je het Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 17
Datum creatie: 1/03/2005
aantal horizontale lijnen met het aantal verticale lijnen van de digitale foto. Zo is dus een camera die een foto produceert met een resolutie van 1280 x 960 pixels een 1.3 Megapixel camera en een 5 Megapixels camera zal dan een foto produceren van 2560 x 1920 pixels. Om technische redenen is het aantal pixels van de sensorchip vaak wat groter dan het effectieve aantal dat in de opnames gebruikt wordt; de randpixels worden dan niet gebruikt. Hierdoor kan het zijn dat een als 2,1 Megapixel geadverteerde camera toch foto's van maximaal 1600 x 1200 = 1,92 Megapixel maakt. Een camera met een sensor van 6,31 Megapixel (3110 × 2030) heeft bijvoorbeeld een maximum opnameformaat van 3008 x 2008 pixels (6,1 Megapixel)
III.4.c.3. CCD CCD staat voor Charge Coupled Device, en is het eerste courante type van digitale beeldsensoren in camera’s. Een chip die wordt gebruikt in digitale (video)camera’s en scanners, ter vervanging van de opnamebuis of film. De CCD bevat fotodiodes die licht omzetten in een elektronisch signaal. Hoe hoger de intensiteit van het ontvangen licht, des te sterker het omgezette elektrische signaal. Op die manier worden lichte en donkere partijen in een beeld omgezet in een variabel elektrisch signaal.
III.4.c.4. CMOS In 2003 begon de CMOS aan een opmars vooral op de markt van amateurtoestellen. CMOS is een beeldsensor die kleiner en zuiniger is dan de CCD. Vooral de kleinere oppervlakte maakt echter ook dat de CMOS in vergelijking met de CCD minder gevoelig is, meer ruis veroorzaakt en een lager dynamisch bereik heeft. Canon maakt gebruik van de CMOS technologie. Van CCD en CMOS worden ondertussen al verschillende types aangeboden, vaak als middel voor de producent om zich op technisch én marketinggebied te onderscheiden van andere producenten. Zo brengt Fuji al geruime tijd camera’s op de markt met de zogenaamde Super CCD. Dit zou een digitale sensor zijn waarvan de pixels in een honingraatstructuur op de sensor zijn geplaatst. Deze plaatsing zou een fijner, gedetailleerder beeld opleveren, omzeggens de producent.
III.4.c.5. Overzicht van vereiste resoluties (dpi) per eindtoepassing Toepassing Online toepassingen Online catalogi, screensavers, cdrom/DVD toepassingen Zeefdruk Bedrukking van objecten (tassen, Tshirts, …), kleine oplagen, extra grote formaten Off-set druk Grote oplagen, hoge kwaliteit
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Resolutie (DPI)
Formaten
72
Schermformaten: 800x600 – 1600x1200 (pixels)
150 - 240
A6 - 36m²
300
A6 - A1
Pagina 18
Datum creatie: 1/03/2005
III.4.c.6. Minimale resoluties voor off-set druk Megapixels voor verschillende afdrukformaten aan een resolutie van 300 dpi. Formaat (aan een resolutie van 300 dpi) Megapixels A6 2,2 A5 4,4 A4 8,7 A3 17,5 A2 34,8 A1 70,0 Afhankelijk van het soort toepassing, dit wil zeggen het minimum of maximum gewenste en/of bruikbare formaat, zal een cameratype moeten gekozen worden. In de onderstaande figuur worden cameratypes weergegeven in functie van de formaten en resoluties die de respectieve toestellen kunnen genereren.
Digitale ruggen voor grootformaat camera’s
Resolutie in Megapixel
Scanning
150
100 A1 50 Point & shoot
Digitale SLR (semi-)professioneel
1-shot / 3-shot
A2
3-shot
A3 A4 A5 A6
III.4.d. Kwaliteitsvereisten moederkopie tekst of afbeelding Kwaliteitsvereisten moederkopie 4 : * Bestandsformaten: TIFF (versie 6.0) − extensie Windows, Unix en OS/2: “.TIF” − extensie Mac: “.TIFF” * Compressie: geen * Byte-volgorde: “Intel” TIFF * Metadatavelden in de TIFF-header voor archiefmetadata: − Compression (tagnr. 259): 1 (=uncompressed) − DocumentName (tagnr. 269): bijv. bestandsnaam − ImageDescription (tagnr. 270): beschrijving van de afbeelding − Make (tagnr. 271): fabrikant van de scanner, video, apparatuur die werd gebruikt voor het maken van de afbeelding − Model (tagnr. 272): gebruikte scanner − Software (tagnr. 305): software naam en versienummer van de software die werd gebruikt voor het maken van de afbeelding Bron : http://www.expertisecentrumdavid.be/davidproject/teksten/Richtlijn9.pdf Dries BEHEYDT Pagina 19 Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32 4
Datum creatie: 1/03/2005
− DateTime (tagnr. 306): datum van digitalisering (JJJJ:MM:DD UU:MM:SS) − Artist (tagnr. 315): bijv. naam van de archiefbeherende instelling − HostComputer (tagnr. 316): bijv. hardware, besturingssysteem − CopyRight (tagnr. 33432): houder van het copyright ! Opmerking 1: Deze tags bevatten een ASCII-veld (7 bits ASCII) waarvan de laatste byte ‘NUL’ moet zijn. ! Opmerking 2: Een TIFF-document is in zekere zin uitbreidbaar. Organisaties kunnen zelfgekozen tags (vanaf tagnr. 32768) aan TIFF-documenten toevoegen. Deze zogenaamde “private tags” worden beter vermeden, want ze kunnen immers leesbaarheids- en uitwisselingsproblemen opleveren en vereisen specifieke software. De “private tags” en hun inhoud kunnen verloren gaan, wanneer de afbeelding achteraf wordt bewerkt en opgeslagen met een applicatie die deze tags niet ondersteunt. Bepaalde applicaties voegen echter altijd één of meerdere “private tags” aan TIFF-documenten toe (bijv. PhotoShop, PageMaker, enz.). * Digitaliseringsparameters en veel gebruikte instellingen: − resolutie: 400 PPI, 300 PPI, 150 PPI − bitdiepte: * Kleurdiepte afbeeldingen: 24 of 48 bits/pixel * Grijswaarden afbeelding: 8 of 16 bits /pixel * Zwart-wit afbeelding: 1 bit/pixel
III.5. Digitaliseren van videomateriaal III.5.a. Vereisten voor de digitalisering van analoog beeldmateriaal In dit onderdeel behandelen we de omzetting van analoog videomateriaal (bijvoorbeeld 8mm, Hi8, VHS, Betacam, video 2000) naar digitaal materiaal. Voor deze bewerking, die ook wel digitizing of sampling wordt genoemd is het belangrijk om te beschikken over: - een voldoende krachtig computersysteem, waarmee we meer specifiek een krachtige processor (minimum Pentium IV) en voldoende werkgeheugen (minimum 1 GB) bedoelen; - randapparatuur die zorgt voor de communicatie tussen het analoge bronmateriaal en het computersysteem waar dit materiaal, in digitale vorm, op moet terechtkomen.
III.5.b. Typologie van randapparatuur Analoog videomateriaal kan op verschillende manieren op een computersysteem worden gebracht. Hierna volgen beknopt enkele mogelijkheden:
III.5.b.1. De TV-tunerkaart Het apparaat dat van uw computer een digitale mediarecorder maakt, gaat door het leven als de tv-tunerkaart. In de meest eenvoudige vorm is het een kaartje dat een analoog antennesignaal omzet in digitale informatie. Daartoe bezit de kaart een aantal ingangen (Composite In, S-video en Line In audio) die door middel van een Scart-Cinch kabel o.a. met een videorecorder worden verbonden. Dit soort kaarten wordt in de meeste gevallen met opnamesoftware geleverd om beelden op te nemen en op DVD te branden. Installatie van een dergelijke kaart en software doet men het best op een computer met krachtige processor, voldoende RAM-geheugen en voorzien van een DVD-brander. Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 20
Datum creatie: 1/03/2005
III.5.b.2. Een externe omzetter Een externe omzetter is een afzonderlijk apparaat waar je enerzijds het audio- en videokanaal van een videorecorder op aansluit. In de omzetter wordt vervolgens het analoge signaal gedigitaliseerd en via een firewire aansluiting naar de computer doorgezonden. Op de computer kan de digitale opname vervolgens bewerkt worden en opgeslagen op een archiveermedium.
III.5.b.3. Een IEEE1394-kaart Een derde, maar minder aan te bevelen manier, is het aansluiten van een videorecorder op een digitale videocamera en de camera op zijn beurt via firewire aansluiten op de computer om zo het materiaal door te lussen van recorder via camera op computer. Niet alle digitale videocamera’s ondersteunen een dergelijke manier van werken of slechts gedeeltelijk waardoor de kans bestaat dat slechts een gedeelte van het materiaal gedigitaliseerd wordt (bijvoorbeeld enkel het videosignaal en niet het audiosignaal) waardoor er asynchrone opnames ontstaan.
III.5.c. Kwaliteitsvereisten moederkopie videomateriaal Kwaliteitsvereisten moederkopie 5 : * Bestandsformaat: AAF of MXF − Aandachtspunten bij AAF: * Sla alle ‘essence’ en metadata in het AAF-bestand op: vermijd pointers naar externe informatie * Sla geen producent- of softwaregebonden ‘essence’ of metadata (bijv. edit lists) in het AAF op, maar gebruik standaarden in de plaats * Codec: open, gestandaardiseerde codec (bijv. Motion-JPEG2000) * Compressie: geen (CCIR 601-ITU-R 601 standaard) of lossless compressie (bijv. MotionJPEG2000) * Metadatavelden: voor de registratie van metadata wordt XML gebruikt. De gebruiker kan zelf zijn eigen metadatamodel uitwerken - AAF en MXF zijn immers uitbreidbaar - of een bestaand XML metadataschema aanpassen. * Digitaliseringsparameters en veel gebruikte instellingen: − sample-rate: - 4:4:4: Y:13,5 MHz (NTSC: 858 samples/lijn; PAL: 864 samples/lijn) R-Y: 13,5 MHz B-Y: 13,5 MHz - 4:2:2: Y:13,5 MHz R-Y: 6,75 MHz B-Y: 6,75 MHz − videoformaat: component (beeld bestaat uit meerdere signalen) − frame-rate: 30 frames/seconde, 25 frames/seconde − aantal lijnen: 720 lijnen − bitdiepte: 10 bits − aantal audio kanalen: 4
http://www.expertisecentrumdavid.be/davidproject/teksten/Richtlijn9.pdf Dries BEHEYDT Pagina 21 Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32 5
Datum creatie: 1/03/2005
III.6. Digitaliseren van audiomateriaal III.6.a. Kwaliteitsvereisten moederkopie audiomateriaal Kwaliteitsvereisten moederkopie 6 : * Bestandsformaat: − Windows/Intel: WAVE,(B)WAV met RIFF-bestandsstructuur (Resource Interchange File Format) − Mac: AIFF * Codec: PCM (zowel voor (B)WAV(E) als AIFF) * Compressie: geen * Voorziene metadatavelden in de RIFF-WAVE-fileheader: * List chunk - “info”: datatype is “ASCIIZ” (NULL terminated string) * IARL - Archival Location: bijv. bestandsnaam of archiefnummer * IART – Artist: bijv. naam uitvoerder(s) * ICMT – Comments: commentaar, opmerking * ICOP – Copyright: copyright informatie * ICRD - Creation date: datum opname of digitalisering * IENG – Engineer: naam ingenieur * IGNR – Genre: genre * IKEY – Keywords: trefwoorden (gescheiden door “;”) * IMED – Medium: medium * INAM - Name/Title: beschijving/titel archiefdocument * ISFT – Software: naam digitaliseringssoftware * ISRC – Source: bron * ISRF – Source Form: vorm/type origineel document * ITCH – Technician: naam technicus * Format chunk - “fmt”: * Compression code: 1 (uncompressed) * Number of channels: 1(mono), 2(stereo) * Sample rate * Sampler chunk - "smpl": - Manufacturer - Product - Sample period * Voorziene metadatavelden in de AIFF-fileheader: * Common chunk - “comm”: * numChannels * numSampleFrames * sampleSize * sampleRate * Digitaliseringsparameters en veel gebruikte instellingen: - sample-frequentie: 192 KHz, 96 KHz, 48 KHz - sample-resolutie: 24 bits, 16 bits - aantal kanalen: 2 (stereo)
http://www.expertisecentrumdavid.be/davidproject/teksten/Richtlijn9.pdf Dries BEHEYDT Pagina 22 Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32 6
Datum creatie: 1/03/2005
IV. ONTSLUITEN IV.1. Inleiding Een van de belangrijkste motiverende factoren voor het opzetten van een digitaal archief is zonder twijfel de mogelijkheid om op latere tijdstippen de gearchiveerde informatie of objecten op een eenvoudige en snelle manier te kunnen raadplegen. Het zogenaamd ‘ontsluiten’ van het digitaal archief is zodoende het volgende logisch onderdeel in deze handleiding. Bij het openstellen van een digitaal archief aan derden zijn zowel juridische als technische aspecten verbonden. In wat hierna volgt behandelen we beide aspecten op een summiere wijze. De hoofdstukken moeten een aanzet zijn voor de lezer om zelf gericht op zoek te gaan naar die aspecten die voor zijn of haar plannen van toepassing zijn.
IV.2. Juridische aspecten verbonden aan het verwerven en ontsluiten van audiovisuele archieven
IV.3. Ontsluiting door middel van software: beeldbeheer versus collectiebeheer IV.3.a. Inleiding: Software voor beeldbeheer versus software voor collectiebeheer - Beeldbeheersoftware laat toe om digitale beeldbestanden te beheren: miniatuurversie bekijken, lokaliseren (op opslagmedium), toevoegen van metadata, geavanceerd zoeken, enz. De software kan overweg met verschillende types van bestandsformaten (.JPG, .TIF,.GIF, .EPS, …). De metadata is vaak van algemene aard zoals bestandsnaam, titel en beschrijving en weinig specifiek In hun meest commerciële vorm worden deze systemen ook vaak DAM-systemen, ofte Digital Asset Management systemen genoemd. Dit zijn toepassingen die bedrijven moet toelaten om beeldbestanden, logo’s, video-en geluidsbestanden te centraliseren, aan versiebeheer te doen + de toegang tot deze bestanden te beheren en te beheersen. - Collectiebeheersoftware is specifiek bedoeld voor het beheer van beeldcollecties van overheden, musea en grote erfgoedinstellingen. De beheerfuncties beperken zich niet tot het beschrijven van de beeldbestanden maar komen ook tegemoet aan de andere activiteiten van de gebruikers zoals het uitlenen van kunstwerken en het samenstellen van tentoonstellingen. De meta-informatie die de software kan verzamelen, is dan ook specifiek gericht op de museumactiviteiten.
IV.3.b. Software voor beeldbeheer
IV.3.b.1. Waarom? Software voor beeldbeheer moet de gebruiker ervan in staat stellen om zijn of haar verzameling aan digitale beelden op een logische en consistente manier te organiseren zodat het opzoeken van beeldmateriaal op een snelle manier kan verlopen. Typisch zullen deze programma’s de gebruiker Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 23
Datum creatie: 1/03/2005
verzoeken om aan de beelden metadata te koppelen en op basis van deze parameters de beelden in te delen.
IV.3.b.2. Aanbod op de markt De huidige systemen variëren van ‘freeware’ over ‘single user’-softwarepakketten tot geïntegreerde netwerktoepassingen met een prijskaartje van 5.000 Euro of meer. De uitdaging bestaat erin het systeem te kiezen dat aan de voordeligste kostprijs die functionaliteiten vervult die ervan verlangd worden (de specifieke vereisten verschillen van organisatie tot organisatie). Maatwerk op deze pakketten is vaak niet mogelijk of uitsluitend tegen een fikse meerkost. Hieronder zijn drie van de bekendste op volume-licenties gebaseerde beeldbeheersystemen opgenomen. Uiteraard bestaan er nog tal van andere systemen met meer of minder functionaliteiten en desgevallend een hogere of lagere licentiekost. EXTENSIS
FOTOWARE
CUMULUS
Extensis Portfolio 8
Fotoware FotoStation Pro of Classic
Canto Cumulus 7
www.extensis.com
www.fotoware.com
www.canto.com
Licentieprijs: 199,95$
Licentieprijs: 539$ - 599$
Licentieprijs: Prijs op aanvraag
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 24
Datum creatie: 1/03/2005
IV.3.b.3. Hoe het ideale beeldbeheersysteem selecteren? Volgende mogelijke selectiecriteria kunnen gehanteerd worden om een beeldbeheersysteem te kiezen dat op afdoende manier de toekomstige taken zal vervullen die haar zullen worden opgedragen: 1. Het aantal beelden dat binnen de gekozen licentie kan worden opgeslagen (kostprijs van de licentie); 2. Het aantal gebruikers binnen de gekozen licentie (kostprijs van de licentie) 3. Ondersteunen van de bestandsformaten .TIF en .JPEG; 4. Mogelijkheid tot het bekijken van miniatuurweergaven van de aanwezige beelden; 5. Mogelijkheden op het gebied van metadatabeheer; 6. Mogelijkheden van de ingebouwde zoekfunctie (incl. op de ingevoerde metadata); 7. Ongelimiteerd categoriseren van beelden; 8. Compatibel met het serverbesturingssysteem; 9. Compatibel met besturingssysteem individuele werkstations (Windows of Apple). Bij elke van de hierboven getoonde beeldbeheersystemen kan bovendien een proefversie gedownload worden om de toepassing gedurende een aantal dagen uit te proberen. Het is aan te bevelen deze systemen te testen. Bovendien geeft de gebruikershandleiding bij dergelijke volumelicentiegebaseerde software een goed beeld van de standaardmogelijkheden en eventuele (extra) uitbreidingsmogelijkheden.
IV.3.c. Software voor collectiebeheer
IV.3.b.1. Waarom? In tegenstelling tot beeldbeheersystemen zullen collectiebeheersystemen initieel niet vertrekken vanuit een beeld als een object maar eerder omgekeerd. Een bestaand kunstobject krijgt in het systeem een digitale representant waarvan één of meerdere beelden, naast de metadata en data over de traceerbaarheid van het kunstobject, eigenschappen zijn die aan dit virtuele object worden gekoppeld.
IV.3.b.2. Aanbod op de markt Het gros van de collectiebeheersystemen 'pur sang' richten zich in hoofdzaak op museumcollecties. De systemen omvatten zowel functionaliteiten voor het beschrijven van kunstobjecten als voor het traceren ervan. De meeste pakketten zijn ook gekenmerkt door een modulaire opbouw. De basisopbouw bevat steeds modules voor object beschrijving. Modules voor object tracering maken vaak niet of slechts gedeeltelijk deel uit van de basisopbouw. Deze modules en eventuele andere modules worden dan als optie aangeboden. Enkele systemen bieden ook een web optie aan die toelaat vanuit de beheersoftware een website te genereren om de informatie online aan te bieden. Prijskaartjes van deze systemen variëren sterk maar zijn in ieder geval stukken hoger dan voor een doorsnee beeldbeheersysteem.
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 25
Datum creatie: 1/03/2005
Hieronder worden een aantal van de bekendste collectiebeheersystemen opgesomd. Uiteraard bestaan er nog andere systemen op de markt. ADLIB met o.a. ADLIB Archief & ADLIB Museum
Questor Systems met ARGUS Collection Management System
GallerySystems met TheMuseumSystem, eMuseum en EmbaRK
MDA met MuseumPlus
PasTime Softw. Company met PastPerfect Museum Software
Commonwealth Historic Resource Management Ltd met The Visual Archiver
Re:discovery Software met Visual Re:discovery
Vernon Systems met Vernon CMS
IV.3.b.3. Hoe het ideale collectiebeheersysteem selecteren? Volgende mogelijke selectiecriteria kunnen gehanteerd worden om een collectiebeheersysteem te kiezen dat op afdoende manier de toekomstige taken zal vervullen die haar zullen worden opgedragen: 1. Beschikbaarheid van een degelijke module voor het beheer van digitale foto’s (inclusief metadata) en het bijhorende rechtenbeheer. 2. Het gebruik van ‘standaard’ databaseformaten als MSSQL, Oracle, MySQL, … Deze systemen garanderen dat alle data die via de beheersoftware in de databank worden ingevoerd ook via andere toepassingen (maatwerk, bestaande software) kunnen worden aangesproken. 3. Gebruik van standaarden voor uitwisseling van data: XML-import/export, ODBCcompliant. 4. Gebruik van thesauri. 5. Flexibiliteit om de software (bv. invoerschermen) aan te passen op maat. 6. Beschikbaarheid van een publiceermogelijkheid op internet. 7. De verspreiding en populariteit van de software. Naast de hoger vermelde selectiecriteria kan, bij de keuze van het meest passende collectiebeheersysteem, het ook aangewezen zijn even te rade te gaan bij CHIN, het Canadian Heritage Information Network. Deze Canadese organisatie (CHIN) ondersteunt de Canadese musea in hun opzet om alle musea online aanwezig te krijgen. Het CHIN legt hierbij vooral de nadruk op het creëren, presenteren en beheren van digitale informatie. Eind 2003 heeft het CHIN een evaluatie opgemaakt van de verschillende beschikbare beheersystemen. Hiervoor heeft zij de leveranciers van deze systemen uitgenodigd om aan deze evaluatie deel te nemen. De bedoeling van deze oefening was niet om een specifieke leverancier aan te bevelen maar om een instrument aan te reiken waarmee de musea op zoek kunnen gaan naar beheersoftware die voor elk van hen het meest geschikt is. De door het CHIN opgestelde checklists kunnen geraadpleegd worden op http://www.chin.gc.ca .
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 26
Datum creatie: 1/03/2005
V. ARCHIVEREN V.1. Inleiding De tot hiertoe beschreven stappen in het digitaliseringsproces toonden ons hoe we kwalitatief digitaal materiaal kunnen aanmaken, inventariseren en ontsluiten naar de buitenwereld. Deze stappen vergen in de meeste gevallen heel wat inspanningen. Het aanleggen van een kwalitatief digitaal bestand vergt een volgehouden arbeidsinspanning en het neemt tijd in beslag. Om te vermijden dat het eindresultaat van onze digitalisering geheel of gedeeltelijk verloren gaat, moeten we zeer zeker een degelijk back-up systeem opzetten. Deze laatste stap in de digitalisering van informatiedragers wordt heel vaak ofwel over het hoofd gezien ofwel verwaarloosd; met alle gevolgen vandien. In dit onderdeel bekijken we de twee meest courante/ gebruikelijke backupsystemen en geven we ook uitleg en tips om een afdoende back-up strategie uit te werken. Enkel op die manier kan immers de houdbaarheid van de digitale data voor de nabije en verre toekomst gegarandeerd worden.
V.2. Opslagmedia Een van de factoren die zal bepalen of digitale archiefdocumenten in de toekomst nog raadpleegbaar zullen zijn, is het medium of de drager waarop ze zijn opgeslagen. In wat volgt zal blijken dat men idealiter kiest voor een drager met de nodige duurzaamheid en dit om het aantal migraties van data in de toekomst te beperken. Hierna bespreken we de twee meest courante vormen van opslagmedia.
V.2.a. Magnetische opslagmedia - Hard disks (& tapes) De bouwstenen van digitale beelden zijn, zoals eerder al omschreven, bits. Bits zijn stukjes data met twee statussen, ofwel "nul" ofwel "één". Magnetische opslagmedia zoals harde schijven en tapes, kunnen beide statussen van elkaar onderscheiden door de magnetische eigenschappen van deze drager op die locatie te wijzigen. Het leuke aan magnetische dragers op dit moment is de omgekeerde evenredigheid van opslagcapaciteit en prijzen, zoals die zich momenteel in de markt voordoet. De processorenrace die een decennium geleden de computerindustrie in haar greep hield is vrijwel stilgevallen. Op dit moment is er eerder een revolutie in de capaciteit van (magnetische) opslagmedia aan de gang. De opslagcapaciteit neemt steeds toe terwijl de relatieve prijs van één eenheid opslagcapaciteit (Megabyte ->Gigabyte) steeds afneemt.
V.2.a.1. Beschrijving V.2.a.1.a. Harde schijf
Een harde schijf is een opslagmedium dat bestaat uit één of meer niet-flexibele ronde platen, gecoat met een micron dunne magnetiseerbare laag. Op een beweegbare arm (actuator) zitten de lees- en schrijfkoppen. Die arm bezit een spoel die beweegt tussen sterke magneten. Door de spoel van meer en minder spanning (Positief - Negatief) te voorzien kan de arm zeer precies worden gestuurd. De informatie wordt dus met een schrijfkop op de schijf gezet en weer terug ingelezen met behulp van de leeskop. Omdat hiervoor de kop moet worden verplaatst en soms moet worden gewacht tot het juiste gedeelte van de schijf onder de kop doordraait is de harde schijf een aantal ordes van grootte trager dan geheugen in geïntegreerde schakelingen. De opslagcapaciteit van harde schijven is de laatste decennia enorm toegenomen. Was in de begintijd Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 27
Datum creatie: 1/03/2005
een capaciteit van 10 MB heel normaal, tegenwoordig zijn schijven met een capaciteit van 1 Terabyte (1000 Gigabyte) courant verkrijgbaar. Gegevens die op de harde schijf zijn opgeslagen, blijven over het algemeen minstens 10 jaar intact. De levensduur van een harde schijf hangt voornamelijk af van twee dingen: de temperatuur en mechanische schokken. Bij de desktopcomputer die stil staat hoeft alleen op de temperatuur gelet te worden. Een vuistregel is dat bij iedere 10 graden hogere temperatuur de levensduur halveert. Er zijn dan ook speciale behuizingen en ventilatoren om harde schijven te koelen. Om gegevensverlies bij een falende schijf te beperken kunnen meerdere schijven in een Redundant Array of Independent Disks (RAID) configuratie gebruikt worden.
V.2.a.1.b Magneetbanden Een magneetband is een opslagmedium voor gegevens in de vorm van een band van kunststof waarop een dunne laag magnetiseerbaar materiaal is aangebracht, waarvan de magnetische deeltjes met een magneet (de schrijfkop) in een bepaalde richting gemagnetiseerd kunnen worden. Door een wisselende polariteit van de schrijfkop ontstaat er op de band een heel klein magnetisch veld waarvan de richting afhankelijk is van de plaats. Door een leeskop kan het magnetische veld van de deeltjes later worden gelezen en worden vertaald in een elektrische stroom. Op deze wijze kan informatie worden opgeslagen in de magnetische polarisatie van de deeltjes, en later worden teruggelezen.
V.2.a.2. Tips en aanbevelingen
Door hun relatief gunstige prijsverhouding (opslaghoeveelheid/prijs) zijn deze dragers geschikt voor het maken van tijdelijke veiligheidskopieën, back-up, maar niet voor het op lange termijn archiveren van digitale documenten. Zowel harde schijven als tapes vertonen vlug sporen van slijtage. Bovendien zijn voor het raadplegen van data op beide soorten dragers specifieke softwaresystemen nodig. Voor harde schijven is dat het besturingssysteem waarin de folderstructuur werd aangemaakt, bij tapes is dit de specifieke back-up software die werd gebruikt voor het (gecomprimeerd) bewaren van de te archiveren data.
V.2.b Optische opslagmedia - CD en DVD Optische opslagmedia zoals cd’s en dvd’s zijn schijven gefabriceerd in polymeer (kunststof) waarop een laser merktekens aanbrengt. Deze merktekens kunnen twee vormen aannemen zodat zij de bitstroom bestaande uit ofwel 0 ofwel 1 kunnen vormen. In wat hierna volgt bekijken we naast de werking en de samenstelling van dit type opslagmedium ook de relatieve bruikbaarheid voor archiveringsdoelstellingen.
V.2.b.1. Beschrijving V.2.b.1.a. CD’s
Een cd of compact disc (compacte schijf) is een optische schijf, die oorspronkelijk voor de opslag van muziek werd gebruikt (als vervanger van de grammofoonplaat van vinyl), maar die sinds een paar jaar na de introductie ook voor opslag van andersoortige gegevens wordt ingezet zoals de cd-rom en cd-video. De cd werd door Sony geïntroduceerd in Japan in het najaar van 1982. In het voorjaar van 1983 werd, ook door Philips, de cd in de Verenigde Staten en Europa geïntroduceerd. De cd-rom (waarbij 'rom' staat voor 'read only memory') wordt vrijwel uitsluitend in computers gebruikt. Cd-schijfjes (en bij uitbreiding ook dvd-schijfjes) zijn samengesteld uit een aantal lagen. Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 28
Datum creatie: 1/03/2005
Een klassiek cd-schijfje bestaat uit volgende lagen: 4. Beschrijfbare laag Beschrijfbare laag bovenaan de cd. 3. Laklaag Fijne laklaag aangebracht boven de data-en reflectielaag om deze lagen luchtdicht te verzegelen zodat ze niet kunnen oxideren. 2. Reflectielaag Een laag met metaalcomponent die laserstralen weerkaatst zodat de datalaag kan gelezen of beschreven worden. Voor de reflectielaag kan zilver, koper of goud gebruikt worden. Goud degenereert het traagst en is het meest aangewezen voor archiveringsdoeleinden. 1. Datalaag (polymer - polycarbonaat plastic) Data worden op deze laag aangebracht met een laserstraal in een spiraalspoor van kleine putjes.
[Figuur: Rubberdisc.com]
V.2.b.1.b. DVD’s (Digital Video Disc ) Dvd’s werden medio de jaren negentig ontwikkeld voor het distribueren van speelfilms. Hoewel de schijfjes initieel dus vooral voor bewegende (video)beelden werd ontwikkeld bleek al spoedig dat de schijfjes ook voor tal van andere toepassingen konden gebruikt worden. In 1990 ontwikkelden Toshiba en Time Warner een opvolger van de succesvolle Compact disc (cd), genaamd SuperDisc (SD). De ontwikkelaars van de Compact disc, Philips en Sony, wilden de gunstige marktsituatie niet verstoren met een opvolger en keken de kat langdurig uit de boom. Op het Philips’ Natuurkundig Laboratorium werd door de deskundigen echter al diep nagedacht over een opvolger. In 1994 presenteerden Philips en Sony de MultiMedia cd (MMCD). De capaciteit (speelduur) van SD was aanzienlijk hoger, namelijk 5 in plaats van 3,6 gigabyte, dan die van MMCD, echter de MMCD zou meer compatibel zijn met CD. Beide kampen namen hun posities in en het zag er naar uit dat de ‘formatenoorlog’ van VHS en Betamax zou worden herhaald. Na verloop van tijd zagen Philips en Sony in dat hun voorstel het niet zou halen, en men gooide de handdoek in de ring door Toshiba’s SD formaat te accepteren, op één uitzondering na: men wilde beslist niet de fysieke broncode van SD in de gezamenlijke standaard. Philips/Sony drongen sterk aan op de broncode, EFMPlus, die Kees Schouhamer Immink had ontworpen voor de MMCD, omdat die het mogelijk maakt de bestaande cd-servotechnologie toe te passen. De president van IBM, Lou Gerstner, assisteerde in de onderhandelingen tussen de twee kemphanen, en adviseerde de broncode EFMPlus te accepteren. Uiteindelijk gingen de elektronicafabrikanten overstag en accepteerden ze deze modificatie. De gezamenlijke standaard, dvd, werd in september 1995 beklonken. De capaciteit van dvd is 4,7 gigabyte in plaats van de oorspronkelijke 5 gigabyte daar EFMPlus 6 procent meer overhead nodig heeft om de betere speelbaarheid te garanderen. Teleurgesteld in de verdeelsleutel van de dvd-royalty's, begonnen Philips en Sony al binnen een jaar aan de ontwikkeling van de Blu-Ray Disc, die acht jaar later, in 2003, door Sony op de markt werd gebracht. Er zijn in 2005 twee kampen ontstaan die vechten om de opvolger van de dvd te worden. Dat is aan de ene kant Blu-ray gesteund door Philips, Sony en Apple, en aan de andere zijde is er Hd-dvd gesteund door Toshiba, NEC en Microsoft. Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 29
Datum creatie: 1/03/2005
V.2.b.2. Tips en aanbevelingen Archiefdocumenten worden het best op een optische drager van het type cd-r, opgeslagen. Aangezien er bij dvd’s nog steeds geen eensgezindheid is over een standaard en momenteel verschillende technologieën naast elkaar worden aangeboden is dvd op dit moment nog te vermijden als lange-termijndrager. Cd’s zijn, net zoals alle andere dragers, aan slijtage of degeneratie onderhevig. Met de gigantische hoeveelheid aan cd-schijfjes dat momenteel in omloop is, wordt ook meer en meer geschreven over de mogelijkheid tot degeneratie van dit opslagmedium. De afgelopen jaren werd dit verschijnsel door gespecialiseerde media met de term ‘cd-rot’ bestempeld. In het algemeen kunnen we stellen dat de levensduur van optische schijven afhangt van verschillende factoren: het type, de kwaliteit van het schijfje zelf, toestand van de schijf vóór de beschrijving, kwaliteit van het schrijven, behandeling van de cd’s en de plaats van bewaring. Onderzoek heeft uitgewezen dat data op een cd onder bepaalde omstandigheden zelfs al na twee jaar onleesbaar kan worden. Om cd’s te kunnen gebruiken als duurzaam opslagmedium voor digitale archiefdocumenten, moeten een aantal kwaliteitsvoorschriften in acht worden genomen. Deze vereisten hebben betrekking op de manier waarop we de cd’s behandelen en hoe we cd’s schrijven. Enkele tips voor een zorgvuldige behandeling van cd’s 7 : - Houd de cd bij de rand vast. Plaats geen vingers op de onder- of bovenkant van de cd. - De labelzijde van een cd is kwetsbaarder dan de datazijde. Schrijf dus niet met stift, balpen of potlood op de labelzijde van de cd. Kleef geen etiket of label op de bovenkant van de cd. - Vermijd krassen, stof of vlekken. Stof en vlekken kunnen verwijderd worden met een propere doek. Wrijf van de binnenkant van de cd naar de buitenkant. Wrijf niet in cirkels. Ook de manier waarop men de gegevens op een cd opslaat, heeft gevolgen voor de houdbaarheid ervan. Enkele tips voor het maken van degelijke cd’s 8 : - Verzeker je ervan dat de lege cd van goede kwaliteit is. Controleer of de cd geen krassen, vlekken of vingerafdrukken bevat. - Schrijf de cd in één sessie en sluit de cd onmiddellijk. Vermijd multisessie cd’s en plaats bij voorkeur geen muziekbestanden én databestanden op dezelfde cd. - Schrijf de cd’s niet aan hoge snelheid. Algemeen wordt 2x of 4x speed aanbevolen. Dit duurt wel langer, maar de kans op fouten is kleiner. - Controleer de cd op fouten. Herhaal deze controle regelmatig, bv. jaarlijks.
7
http://www2.vlaanderen.be/ned/sites/informatiebeheer/archief_richtlijnen/Algemene_richtlijnen_materiele_bewar ing.pdf 8‘ Digitaal Archiveren: Richtlijn en Advies 2: Duurzame cd’s’, F. BOUDREZ, DAVD Dries BEHEYDT Pagina 30 Datum creatie: 1/03/2005 Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
V.2.c Conclusie en aanbevelingen in verband met bruikbare opslagmedia voor archivering. Er kunnen zowel magnetische als optische dragers gebruikt worden voor archiveringsdoeleinden. Onafhankelijk van het type drager dat gebruikt wordt dient een digitale archivaris volgende aanbevelingen in ogenschouw te nemen: - Gebruik niet uitsluitend één type drager. Bewaar digitale data op verschillende types dragers – zowel optische als magnetische – zonder echter te overdrijven in het aantal soorten. Op die manier voorkom je dat door het in onbruik raken van de specifieke drager waarop gearchiveerd werd, dat je archief ontoegankelijk word en de geleverde archiveringsinspanningen voor niets waren. - Kies courante opslagmedia, dit wil zeggen opslagmedia die algemeen gebruikt worden en door verschillende producenten gemaakt worden. Kies daarenboven ook die dragers uitgerust met een technologie die ondertussen haar betrouwbaarheid en houdbaarheid heeft bewezen. Vergelijk in dit verband bijvoorbeeld even de verspreiding van de Iomega Jazz Drive met bijvoorbeeld de verspreiding van een cd-r of dvd. - Kies voor opslagmedia die niet snel degraderen. Alle dragers verslijten maar sommige types verslijten dubbel zo snel als andere. - Voer regelmatig controles uit op de dragers en de data aanwezig op de dragers. - Maak af en toe veiligheidskopieën van data. - Bewaar opslagmedia en kopieën op verschillende plaatsen in ideale omstandigheden (weg van overdreven vochtigheid, extreme temperatuurschommelingen). - In het geval van digitale foto’s kan een afdruk op ultrachroom fotopapier van lange houdbaarheid ook een aan te bevelen archiveringsvorm zijn naast de digitale archivering.
Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 31
Datum creatie: 1/03/2005
BIJLAGE: Krantenknipsel De Standaard, Woensdag 7 maart 2006. Digitale informatie explodeert – DE STANDAARD (epa) In 2010 zal de hele wereldbevolking 988 miljard gigabyte digitale data produceren. Deze voorspelling is afkomstig van de technologieconsultant IDC, die voor de eerste keer een wereldwijde raming heeft gemaakt van de omvang van het ,,digitale universum''. Als je 988 miljard gigabyte (of 988 exabyte) aan informatie in boekvorm op elkaar zou stapelen, zou je een toren hebben die 75 keer hoger is dan de afstand naar de zon. En dan spreken we nog maar over de digitale gegevens die in één jaar gecreëerd worden. In vergelijking met vorig jaar gaat het om een verzesvoudiging van de hoeveelheid digitale informatie. In 2006 werd volgens IDC 161 miljard gigabyte digitale informatie gecreëerd - zowel originele informatie als kopieën van bestaande informatie. Per hoofd van de wereldbevolking jong en oud, arm en rijk - is dat ongeveer 24 gigabyte. Het komt overeen met ongeveer drie miljoen keer de informatie die vervat zit in alle papieren boeken die ooit geschreven zijn. De duizelingwekkende cijfers geven een indicatie van de data-explosie die wordt veroorzaakt door de digitalisering van de samenleving en het gebruik van het internet. De IDC-studie werd gefinancerd door het Amerikaanse bedrijf EMC, de wereldmarktleider in digitale opslagsystemen. EMC zegt dat de meeste consumenten en organisaties niet klaar zijn om de toevloed aan digitale informatie te beheersen. De belangrijkste bron van die digitale vloedgolf is de vervanging van analoge door digitale media. Vooral foto, video en spraak nemen erg veel bytes in beslag. IDC schat dat er vorig jaar meer dan 150 miljard digitale foto's werden gemaakt met digitale fototoestellen en nog eens 100 miljard met gsm's. Tegen 2010 zouden er jaarlijks zelfs 500 miljard digitale kiekjes gemaakt worden. Ook het gebruik van digitale videocamera's - uitgedrukt in aantal minuten - zou tussen nu en 2010 verdubbelen. En het klassieke telefoonverkeer wordt steeds meer vervangen door goedkopere gesprekken over het internet - in digitale vorm. Nog een bron van digitale informatie zijn e-mails, die vorig jaar zonder spam al goed waren voor 6 miljard exabyte, en instant messaging (chatprogramma's). Meteen is ook duidelijk dat vooral particuliere gebruikers verantwoordelijk zijn voor de verwachte explosie aan digitale informatie. IDC schat dat zij tegen 2010 zowat 70 procent ervan in het leven zullen roepen. Tegelijk zal echter ,,minstens 85 procent'' van al die informatie op de ene of de andere manier door de handen - of beter gezegd de servers en datalijnen - van allerlei organisaties gaan. Denk maar aan het toenemende aantal websites dat foto's en filmpjes opslaat, telecomoperatoren die spraakverkeer via het internet aanbieden, of de fiscus die steeds meer belastingaangiftes via het internet krijgt. EMC roept organisaties daarom op om zich te bezinnen over de manier waarop ze met deze digitale big bang zullen omgaan. Het bedrijf wijst erop dat de hoeveelheid nieuwe informatie op het punt staat om groter te worden dan de bestaande opslagcapaciteit in de wereld. Zijn we klaar voor de digitale big bang? Van onze redacteur Wim De Preter Dries BEHEYDT Boek_Digitalisering Laatst gewijzigd op: 6/04/2007 11:32
Pagina 32
Datum creatie: 1/03/2005