Handreiking vervanging archiefbescheiden D OOR :
L EON VA N OOST ER OM ELV EO B .V. W W W.ELV EO.N L OOST ER OM @ELV EO.N L
De handreiking vervanging archiefbescheiden Door Archief 2020 • Versie 1.0 van 25 februari 2014
• In beheer bij het Nationaal Archief. • Evaluatie uitgevoerd april - juni 2015 • Eindrapport review: https://archief2020.nl/downloads/goed-goedgenoeg-eindrapport-review-handreiking-vervangingarchiefbescheiden • Aangepaste handreiking najaar 2015
Doel van de handreiking
•handvat om het gehele proces van vervanging op een verantwoorde manier te doorlopen, waarbij zowel de juridische, technische, als toetsingsaspecten zijn meegenomen.
Hoe we het bedenken
En hoe we er in de praktijk ermee omgaan
De titel van het eindrapport: GOED IS GOED GENOEG De conclusie
• De handreiking geeft een zeer volledig beeld van het totale proces van vervanging! • Maar: de handreiking schiet te kort als praktisch handvat!!
• Er is behoefte aan een compact hulpmiddel toegespitst op “routinematige vervanging”!!!
Waar schiet de handreiking dan te kort Eigenlijk nergens, tenminste als je hem goed leest. • Echter vaak wordt ten onrechte gedacht dat de Richtlijnen Preservation Imaging Metamorfoze in één van de drie varianten toegepast moet worden.
To Metamorfoze or not • De Metamorfoze richtlijnen zijn de hoogst denkbare richtlijnen binnen het erfgoedconserveringsprogramma van de Nederlandse overheid. • Bedoeld voor kunstwerken, museale collecties, erfgoedmaterialen enz. waarbij de detaillering en kleurreproductie die van het origineel MOETEN benaderen.
• Deze normen zijn nooit bedoeld geweest om standaard documentscanners of multifunctionals te controleren of te ijken!
Een proefje Metamorfoze Uitlichtingstoleranties
Waar hebben we in de praktijk mee te maken • Met low budget documentscanners (prijsrange € 5.000 tot € 8.000) • Met multifunctionals (de copiers op de gang)
• Met wijkteams en het op locatie gebruiken van hun smartphone of Ipad • Met burgers die thuis ook een scanner van € 119,95 hebben staan
MET GÉÉN VAN DEZE APPARATEN KUN JE VOLDOEN AAN DE EISEN VAN DE METAMORFOZE NORMEN !
Betekent dat dan dat we niet over kunnen gaan tot routinematig vervangen? Zeker niet, dat kunnen we wel degelijk. • Lees de handreiking digitale vervanging eens goed door en gebruik vooral je gezond verstand!
Vraag: is kleur een bepalend element • Is kleur een bepalend element? denk aan logo’s, arceringen fontkleuren, afbeeldingen, spreadsheets? • Is er sprake van zwart-wit foto’s, fijnmazige illustraties in zwart-wit, kleuren die geen bepalend element zijn of van een gering contrast tussen letter en achtergrond? • Is er behoefte om op de gedigitaliseerde bescheiden tekstherkenning door middel van Optical Character Recognition toe te passen? Is het antwoord op de bovenstaande vragen ‘nee’? Dan volstaat bitonale (zwart/wit) scanning!
Wanneer toch naar Metamorfoze • als de kleur van het brondocument meer dan alleen herkenbaar moet zijn, zoals het geval is bij erfgoedmateriaal, en het origineel zo dicht mogelijk moet benaderen, dan is het zaak de eventuele kleurafwijking vast te stellen. • Hiertoe moet minimaal de zogenaamde kleurzweem worden gemeten. Dat kan door het gebruik van de UTT testkaart[20] en –software.
Dus hoe gaan we om met de techniek Het voorgaande betekent niet dat we dus maar wat aan kunnen rommelen, vervanging is immers een onomkeerbaar proces! • Er zijn wel degelijk richtlijnen aan te geven die ook in de dagelijkse praktijk toegepast kunnen worden en die ons helpen bij het duurzaam routinematig vervangen en het risico op verlies van informatie tot het minimum beperkt.
Keuzes bij het starten van digitaal werken
UITBESTEDEN
ZELF DOEN
• Cultuur historische materialen
• Routinematige vervanging
• Grote gestructureerde archiefcollecties
• On demand
Waar laat ik het papier?
Technische keuzes IMAGING ASPECTEN
APPARATUUR
• Beeldkwaliteit • Resolutie (scherpte) • Kleurbehoud • Compressie
• Soorten scanners • Flatbed • Multifunctionals
• Foutmarges
• Doorvoerscanners • Groot formaat scanners
• Bestandsformaten
• Digitale achterwanden
• Metadata
• Boekscanners
Resolutie BITDIEPTE EN RESOLUTIE
Vaststellen van de resolutie, volgens handreiking vervanging Archief 2020 • 1 mm zespunts letter ‘e’ als uitgangspunt Met voldoende reproductie wordt bedoeld
• Letter loopt niet dicht • Alle lijnen en details van de letter zijn te onderscheiden • De lijnen van de letter zijn duidelijk van de achtergrond gescheiden • De letter is niet rafelig
Van 100 naar 1600 ppi 100 PPI
400 PPI
200 PPI
600 PPI
300 PPI
1600 PPI
Vaststellen van de resolutie, veilige keuzes 1. Zwart wit scannen documenten; 300DPI 2. Kleur scannen documenten;
200DPI
3. Scannen t.b.v. OCR;
300DPI óók bij kleur
4. Zwart wit scannen tekeningen;
200DPI
5. Historische documenten;
grijs of kleur 300 DPI
6. Zwakke documenten;
grijs of kleur 300 DPI
Een bitje meer of minder het menselijk oog kan van elk van de drie basiskleuren 256 helderheidgradaties onderscheiden, wat overeen komt met 16,7 miljoen kleuren.
Niet elke kleur geeft ook werkelijk nieuwe informatie door. Sommige kleuren kunnen samengevoegd worden, zonder dat dit echt opvalt. In de praktijk blijkt dat het menselijk oog maar ongeveer 16 helderheidsgradaties kan waarnemen. Kleuren die op elkaar lijken krijgen dezelfde kleurwaarde en men spreekt in dit geval van redundante (lees onnodige) kleuren. Redundante kleuren spelen in de compressietechnieken uiteraard een belangrijke rol. 20
Iets over kleur • De drie primaire kleuren rood, groen en blauw
• Wit is het aanwezig zijn van alle kleuren in gelijke mate • Zwart is het ontbreken van alle kleuren
Zwart/wit of kleur en de archiefregeling Handreiking Vervanging van Programma Archief 2020, Ministerie van OCW samen met gemeenten, waterschappen en provincies. • De grote afweging: Informatiefunctie en/of erfgoedbelang
• Risicoafwegingen 1. zijn er risico’s van toepassing? 2. hoe vaak komen deze voor?
3. wat is de impact bij verwaarlozing hiervan? 4. welke interne normen worden hierbij gehanteerd?
De compressiemogelijkheden bij de meeste scanners JPEG (Joint Photographic Editor Group) Quality (Kwaliteit) wanneer u JPEG-compressie kiest, selecteert u een van de kwaliteitsopties: • Concept: een maximale compressie waarbij het kleinste beeldformaat wordt geproduceerd. Niet geschikt voor vervangingseisen • Goed: een redelijke hoeveelheid compressie, maar toch met een acceptabele beeldkwaliteit. Niet geschikt voor vervangingseisen • Beter: enige compressie met een behoorlijke beeldkwaliteit. Geschikt voor vervanging van de veel bedrijfsmatige documenten • Best: een minimale compressie met een zeer goede beeldkwaliteit. Geschikt voor vervanging van de meeste bedrijfsmatige documenten en afbeeldingen • Superieur: de minste hoeveelheid compressie waarbij het grootste beeldformaat wordt geproduceerd. Geschikt voor vervanging van de meeste bedrijfsmatige documenten en afbeeldingen
Professionele productiescanners • Bij de high end productiescanners kan veel meer ingeregeld worden, zeker zaken als kleurcalibratie, witbalans en over het algemeen ook de compressiefactor bij JPEG export. • Bij een schaal van 0 – 100% is de veilige grens vaak 70%, afhankelijk van de kwaliteit van de bronmaterialen.
Compressiesoorten • ITU Groep 3 en 4 (alleen bitonaal) zwart/wit compressie
• JBIG, opvolger van groep 3 en 4 (Joint Bi-Level Image Expert Group) • LZW, compressie verliesloos vooral zwart/wit en grijs of bij kleurvlakken en lijnen, niet geschikt voor fotomateriaal.
• JEG, lossy compressie (ISO standaard) • JPEG2000, lossy en lossless (ISO standaard) • MRC-Compressie, combinatie van verschillende compressietechnieken, uitgevoerd in lagen (alleen in PDF en PDF/A)
Image Jpeg versus Jpeg 2000 1/2 Raw scan
20,5 Mb
Jpeg2000
Jpeg
PSD20
PSD 10
4,21Mb
4,62 Mb
Jpeg2000
Jpeg
PSD10
PSD8
2,13 Mb
2,57 Mb
Bron: Digitalisering ontrafeld, stadsarchief Amsterdam
Image Jpeg versus Jpeg 2000 2/2 Tiff
25,7 Mb
JPG2000 6,1 Mb JPG 12 4,6 Mb JPF 70
1,0 Mb
JPG 8
644 Kb
JPF 20
313 Kb
Hoe controleren we de standaard scankwaliteit dan wel • Optisch
• Leesbaarheid • Integriteit • 4 ogen principe
• Gezond verstand
Optisch Leesbaar Integer 4 ogen verstand
Juistheid • Is het document geheel gescand? • Zijn de documenten ‘recht’ gescand en is er, bijvoorbeeld door scheefliggen, geen tekst of beeld weggevallen? • Staat het beeld recht, dan wel incorrect horizontaal of verticaal op de pagina (juiste bladspiegel)? • Is het document overeenkomstig het origineel portrait of landscape gescand? • Zijn er tekeningen met valse vouwen gescand en dus met lijntjes die niet op het origineel staan? • Komen de afmetingen overeen met het origineel?
Volledigheid • Zijn alle documenten gescand? • Is van iedere pagina de voor en achterkant gescand? • Zijn alle bijlagen gescand? • Worden alle kleuren overgenomen? • Treedt geen kleurverlies op? • Zijn alle details compleet (zijn lijnen of letters onderbroken, mist er informatie aan de rand van het beeld, zijn beelden gecropt of incompleet) ? • Komen de kleuren overeen met die van het origineel (bv. dichtheid van zwarte vlakken, die te licht of te donker zijn)?
Hoe bepaal ik dan de beste scankwaliteit visueel • Kleinste detail nog leesbaar • Is scherpte gelijk aan het origineel. Geen halo’s of witte omrandingen bij tekst • Voldoende contrast (barcodes!!!!!!!!)
• Alle scanlijnen aanwezig, zowel horizontaal als verticaal • Zijn er scansporen aanwezig, vervuiling, transportrollers e.d. • Is er vervuiling zichtbaar, door b.v. lijmresten op de lenzen • Zijn er spiegelingen, vervormingen of andere onbedoelde effecten zichtbaar
Leesbaarheid • Het gaat er hierbij om dat ieder voor de inhoudelijke informatie van de documenten betekenisvol detail van het origineel dat met het oog te zien is op het origineel, op scan en print vergelijkbaar zichtbaar is. • Is het kleinste detail leesbaar gescand (het kleinste lettertype, duidelijke leestekens, ook bv. decimaalpunten of –komma’s)? • Is de scherpte van het beeld vergelijkbaar met het origineel (bv. minder scherp of te scherp, onnatuurlijke scherpte, halo’s rond de randen)? • Als Optical Character Recognition gebruikt wordt, klopt de tekst die wordt herkend? • Is er voldoende contrast? Voor tekstbestanden moet een hoog contrast bestaan tussen de tekst en de achtergrond. Afbeeldingen in grayscale moeten overeenkomen met het origineel. Er moet een heldere overgang zijn tussen wit en zwart van de scan (barcodes!). • Is sprake van verlies van scanlijnen, enkele of meerdere, in de scan, wit of zwart? • Is sprake van herhaalde scanlijnen of herhaalde pixel op opvolgende scans (consistente vlek op elke scan op dezelfde plek).
Aanwezigheid van artefacten Artefacten zijn afwijkingen die alleen visueel kunnen worden vastgesteld, zoals onder meer: • horizontale of verticale strepen; • pixelverstoringen door vet of vuil op de lens of glasplaat; • weerspiegelingen; • andere vervormingen en effecten.
Tijd voor de laatste vragen D A N K V O O R U W A A N D AC H T E N G R A AG T O T Z I E N S L E O N VA N O O S T E R O M W W W. E LV E O. N L O O S T E R O M @ E LV E O. N L G ERAADP LEEG DE, G EBRUIKTE BRONNEN: H A N D R E I K I N G D I G I TA L E V E R VA N G I N G V E R S I E 1 . 0 H A N D B O E K D I G I TA L I S E R E N VA N D O C U M E N T E N FA R O S TA D S A R C H I E F A M S T E R D A M D E N K E N N I S C E N T R U M D I G I TA A L E R F G O E D