Cursus 5: digitaal archiveren en op internet publiceren Jeroen Poppe
Turnhout 21-03-2013
2
Digitaal archiveren • Archiveren: • Bewaren • Terugvinden • Leesbaarheid garanderen
• Complexiteit digitale archivering cfr. papieren archivering > actieve
archivering • Probleem van de digitale duurzaamheid – Hardware – Software – Formaten – Veroudering (door voortschrijden technologie) – Verval (uit elkaar vallen) 3
Soorten digitale erfgoed objecten Erfgoed
Metadata
object
Digitaal geboren
MS Office
Gedigitaliseerd
Camera
8 mm film
Brief
4
Eigenschappen digitaal document Losse band tussen gegevens en drager Dossier kan op meerdere dragers opgeslagen zijn Dossier kan uit meerdere bestanden bestaan Bestand kan uit meerdere archiefdocumenten bestaan
Noodzaak van hard- en software Een digitaal document is niet dadelijk raadpleegbaar Je bent afhankelijk van computerapparatuur en computerprogramma’s De bits moeten geïnterpreteerd worden tot gegevens Dezelfde problematiek bij geluids- en filmopnames
Geen onderscheid tussen kopie en origineel > laat back-ups toe
5
6
Bestandsnamen Hoe kennen jullie bestandsnamen toe? Waarom werd gekozen voor deze manier van werken?
7
Bestandsnamen Betekenisvol Tijdrovend Interpretatieverschillen, fouten Bladeren Eindgebruikers? Kleinere projecten Digitaal geboren archief Geen databank Vb: Dorpstraat_winter.tif
Betekenisloos Automatisch Snel Uniform (voorloopnullen)
Content- en systeemonafhankelijker Massabewerking Migratie Databank (invloed op bestandsnamen) Vb: 000458.tif 8
Bestandsnamen Maximum 30 karakters Wel: a-z, 0-9, underscore (_) Geen spaties! Niet: \*/,”>?<| JJJJMMDD vb: 15 maart 1984 wordt 19840315. 9
Bestandsnamen Naam.ext Extensie: 3 tekens Bestandsformaat
Voorbeelden: 20050216_Kermis.tif SchoenerBootshow1980.jpg PetersInterview_19960730.mp3
Afkortingen mijden
10
Mappen Scans groeperen Vb: boek, dossier Bestandsnamen uniek per map Snellere werkwijze Verkeerde map? > Weg! Werkproces op orde
11
Kantoordocumenten
12
Kantoordocumenten Tekstbestand: Rekenblad: Presentaties:
ODF, PDF/A ODF, PDF/A ODF, PDF/A
E-mail:
Msg (XML, PDF/A)
13
Kantoordocumenten PDF/A
ODF Onveranderlijk
Hergebruik mogelijk
Raadpleegformaat
Bewaart onderliggende informatie
1 formaat voor alles
Bewaart oorspronkelijke look and feel 14
15
Opslagmedia Bekende opslagmedia zijn: (Draagbare) harde schijven (magnetisch) CD-ROMs & DVD’s (optisch) USB sticks Voor archieven zijn zogenaamde solid state opslag media (USB sticks en andere FLASH-geheugen systemen) een relatief nieuw fenomeen.
3 tot 4 jaar garantie 16
Opslagmedia Magnetische dragers (harde schijven)
Regelmatige kwaliteitscontroles waarschuwen voor dreigend informatieverlies Controle harde schijf > Crystal Disk Info http://crystalmark.info/software/CrystalDiskInfo/ind ex-e.html Vervangen wanneer hun kwaliteit daalt (preventie).
Een ‘rampenplan’ beschrijft hoe men best bij calamiteiten optreedt, zodat zoveel mogelijk informatie wordt gerecupereerd Voor elke drager wordt een veiligheids- en werkkopie gemaakt Verschillende exemplaren > verschillende locaties 17
Crystal Disk Info
18
Opslagmedia Magnetische dragers
NAS: Network-attached storage “Opslagcomputer” Verschillende harde schijven Verschillende computers op aangesloten RAID1 > 2 harde schijven RAID5 > 3 harde schijven Goedkoop: 300 € Synology, Qnap 19
Opslagmedia: optische dragers Nuttig om bij aankoop pc te zorgen voor een ingebouwde cd/dvd-brander Vroeger: verschillende formaten dvdrecordables Nu: dual-layer, multi-formaat lezers die elk type dvd kunnen lezen Bewaren in juwelcase Levensduur: 1 jaar? Meer info: Referaat Eric-Jan Keulemans http://www.faronet.be/files/bijlagen/e -documenten/referaat_keulemans.pdf 20
Opslagmedia Bewaartips
Apparatuur verdwijnt Niet bestand tegen: Zon Warmte Vocht
Etiket met duidelijke informatie (zonder drager te beschadigen) Om de vier jaar een kopie maken 21
Opslagmedia Bewaartips
Controlecijfers (checksum) maken?
vb.: md5summer www.md5summer.org
22
Online backup in “the cloud” www.box.net www.dropbox.com www.mozy.com www.backblaze.com
23
Opslagmedia Samenvatting
Gebruik verschillende types drager Kies courante opslagmedia Voer regelmatig controles uit op de dragers en de data aanwezig op de dragers Maak af en toe veiligheidskopieën van data Bewaar opslagmedia en kopieën op verschillende plaatsen in ideale omstandigheden
24
25
Langetermijnarchivering Zeer moeilijk! Contacteer dichtstbijzijnde archiefdienst
26
Bewaarstrategieën De verschillende bewaarstrategieën zijn:
• 1. 2. 3. 4. 5.
Afdrukken Technologie bewaren Emulatie Migratie Conversie
Geïnteresseerden vinden hierover meer informatie in de rapporten van e-David: www.edavid.be
27
Afdrukken Alles overgezet op een annaloog formaat, bvb. papier en microfilm Veel nadelen: Verlies van digitale voordelen: plaatsbesparend, zoekmogelijkheden… Niet alle essentiële informatie wordt afgedrukt Sommige digitale documenten moeilijk afdrukbaar (geluid, video, databanken, …) Het digitale document zal altijd beschouwd worden als origineel Niet goedkoop
28
Technologie bewaren De originele hard- en software bewaren, zodat de digitale documenten in hun originele vorm raadpleegbaar blijven. Veel nadelen: Kennis en onderdelen verdwijnen Je moet veel bijhouden: veel configuraties en programma’s voorhanden Verval van de dragers
In de praktijk is het onhaalbaar een dergelijk ‘computermuseum’ in stand te houden
29
Emulatie (virtualiseren) Nabootsing van hard- en/of software in een nieuwe omgeving Moderne computers doen zich voor als oude computers Lijkt een veelbelovende piste, maar toch nog veel nadelen Probleem met patenten voor beschermde software Voldoende kennis nodig Uitwisselen gegevens moeilijk https://www.virtualbox.org/ 30
Migratie Omzetting van document naar een standaardformaat dat geschikt is voor bewaring op lange termijn (TIFF, PDF/A,…) Vandaag de meest toegepaste en betrouwbaarste strategie voor bewaring van digitale documenten
31
Conversie Overzettingen van het digitaal document van een lagere naar een hogere versie van het bestandsformaat Bvb: MS Word 97 → MS Word 2003 → MS Word 2007 … Nadelen: Altijd verlies van gegevens Gebonden aan een fabrikant Heel snel nieuwe versie
32
Tweevoudige strategie? Bestanden worden gemigreerd naar een archiefformaat als TIFF of PDF/A, maar blijven ook in hun oorspronkelijke formaat bewaard Veilige methode: het blijft mogelijk om in de toekomst nieuwe strategieën toe te passen op het oorspronkelijke document, maar (als dat bijvoorbeeld geen goede resultaten oplevert) de informatie blijft nog te raadplegen in een gestandaardiseerd formaat
33
Samengevat “There is no easy way to insure your digital files will last.” (Library of Congress)
34
35
Digitaal archief structureren Digitale documenten moeten snel opspoorbaar zijn Noodzaak van een logische en overzichtelijke structuur Heel vaak niet geval, bvb. alles onder ‘Mijn documenten’ bewaard, onduidelijke bestands- en mapnamen,… In feite dezelfde problematiek als bij papieren documenten
36
Mappenstructuur Gebruik een boomstructuur voor de mappen die de werking van de archiefvormer weerspiegelt Zie het archiefschema van een papieren archief Maak een overzicht van de digitale mappenstructuur Druk deze af, de gebruiker kan die gebruiken als inventaris Voeg dit overzicht van de mappenstructuur bij de digitale drager
37
Mappenstructuur Een voorbeeld Overleg Raad van Bestuur Algemene vergadering Boekhouding Jaarrekening Inkomsten Uitgaven Projecten Tentoonstellingen Opendeurdag Opendeurdag 2010 OntwerpAffiche_20100510.pdf NOBrochure_WV_20100511.doc Voorbeeld: http://194.78.136.105/AMVB/docs/21_ordeningsplan.pdf AMVB & BBOT 38
Samenvatting archiveren Bestanden migreren naar geschikte standaarden Op geschikte dragers opslaan Een duidelijke mappenstructuur voorzien Eenvormige en heldere bestandsnamen gebruiken Regelmatige controle Dragers na 4 jaar vervangen
39
Archiveren Personal archiving http://www.digitalpreservation.gov/personalarchiving/ eDAVID http://www.edavid.be/ FARO http://www.faronet.be/vrije-tags/digitaal-archiveren
40
Registratie • Registreren: informatie vastleggen over document/boek/object • Excel, Access • Denk op voorhand na over wat en hoe je wil beschrijven, zeker
als dit door verschillende medewerkers wordt gedaan. Duidelijke afspraken vastleggen! • Verzamel voldoende informatie over je collectie (inhoudelijk + technisch) • Uniek identificatienummer voor elke digitale kopie •
Bijv. hkvl210001.tif
42
Registratie • Archivering van de context • Context is heel belangrijk om de inhoud van een archiefstuk
volledig te kunnen vatten • Wat was de functie? Wie creëerde het document? In welk dossier hoort het?
43
Dublin Core Basisstandaard voor registraties Dublin Core Metadata Element Set ISO 15836 Generiek (Resource): archiefstuk, boek, object Uitwisselbaar (XML, HTML) http://dublincore.org/
Dublin Core 15 velden Herhaling zelfde veld toegelaten Uniek kenmerk > verbinden met digitaal object Bepalen welke velden verplicht zijn Uniek kenmerk Titel
Dublin Core vertaling (DEN) Auteur/maker Onderwerp/trefwoord Omschrijving Uitgever Andere medewerkers Datum Titel
Bestandstype (vb: brief, boek,…) Bestandsformaat (vb: TIFF, A4) Bestandsidentificatie (Uniek) Bron (vb: dossier) Taal Relatie Dekking (periode, grondgebied) Rechten (vb: CC-licentie)
Dublin Core Beschrijvingsregels: Eén-op-één-principe: beschrijft een object, niet wat het object voorstelt Meermaals zelfde veld Uitbreiding ≠ Specifiëring Passende waarde invullen > doelgroep
http://dublincore.org/documents/usageguide/
48
Ontsluiting op het internet Je hebt objecten gedigitaliseerd en/of digitaal beschreven. Maar vervolgens wil je ze ook op het web publiceren. En misschien wil je je data ook wel toegankelijk maken voor aggregatoren of ‘harvesters’, zodat je collectie in andere omgevingen vindbaar worden? Je kan zelf je collectie online brengen, met je eigen software en domeinnaam. Maar overweeg ook om aan te sluiten bij een bestaand netwerk. Voorbeeld: Effectmeting ‘Nationaal Archief joins Wikipedia’ (NL): “Uit dit onderzoek blijkt dat gedigitaliseerd cultureel erfgoed dat beschikbaar gesteld wordt aan Wikipedia aantoonbaar veel vaker bekeken wordt. De beschikbaar gestelde collectie is in 4 maanden meer dan 2 miljoen keer bekeken op Wikipedia, in tegenstelling tot enkele honderden bezoeken aan de selectie op de beeldbank van het Nationaal archief zelf.” www.beeldenvoordetoekomst.nl 49
Ontsluiting op het internet Publiceer je gegevens op het web http://www.projectcest.be/index.php/Website Minimale eisen: Zorg ervoor dat je website met de gebruikelijke webstandaarden is ontwikkeld. Publiceer de inhoud van webpagina's in HTML of XML, in combinatie met CSS of XHTML Zorg ervoor dat de website aan de toegankelijkheidseisen beantwoordt. Internationale standaard is WAI WCAG 1.0 A. Een alternatief is het AnySurfer-label
Aanbeveling Vermijd een site volledig in Flash op te bouwen Hou rekening met de introductie van HTML 5
Gebruik een open datastructuur: http://www.den.nl/pagina/334/den-lab/ Verzeker de vindbaarheid
50
Ontsluiting op het internet Voorbeeld: een oud tijdschrift
Online aanbieden als pdf-document Bijvoorbeeld via www.issuu.com
51
Ontsluiting op het internet Voorbeeld: een handschrift
http://www.historischebronnenbrugge.be/
52
Ontsluiting op het internet Voorbeeld: Itinera Nova
53
Ontsluiting op het internet Voorbeeld: Itinera Nova
Binnen het kader van het project Itinera Nova zullen alle ca. 950.000 bladzijden van de registers van de Leuvense schepenbank ingescand worden, en dit op een termijn van tien jaar. De digitale beelden worden ter beschikking gesteld op de projectwebsite itineranova.be. De akten, van verkoop tot erfenis, van burenruzie tot schuldbekentenis, worden voorzien van een index en een volledige transcriptie. Een netwerk van vrijwilligers zal wiki-gewijs helpen bij de ontsluiting van deze rijke bron door mee te transcriberen.
54
Crowdsourcing Voorbeeld: oldweather.org
55
Crowdsourcing http://youtu.be/JHQyfev -zaM
56
Een beeldbank opzetten? Beeldbank vs. erfgoedbank? Beeldbanken = verzameling (gedigitaliseerde) afbeeldingen, opgeslagen in databank en ter beschikking gesteld op een website Erfgoedbanken = combinatie van media (beeld, tekst, geluid…)
57
Een beeldbank opzetten? Onderwerp www.hetvirtueleland.be www.rubensonline.be
Geografisch www.beeldbankbrugge.be www.ganshoren-ingezoomd.be
Collecties www.vlaamsekunstcollectie.be
…
58
Erfgoedplus.be Limburg & Vlaams-Brabant Verschillende erfgoedorganisaties (musea, bewaarbibliotheken, verenigingen, kerkfabrieken, heemkundige kringen, ...) werken mee en leveren gegevens en beeldmateriaal over hun collectiestukken aan. Erfgoedplus.be verzamelt al deze beschrijvingen in een databank, legt linken en verbanden tussen alle gegevens, en maakt deze gegevens doorzoekbaar op de website http://www.erfgoedplus.be/.
59
Zelf doen? Op middellange termijn komen er wellicht een aantal nieuwe mogelijkheden, die professioneel zijn maar toch betaalbaar Vb.: CollectiveAccess – www.collectiveaccess.org
60
Zelf doen? Op middellange termijn komen er wellicht een aantal nieuwe mogelijkheden, die professioneel zijn maar toch betaalbaar Vb.: Omeka – www.omeka.org
61
Toch geen budget? Voorbeeld: www.erf-goed.be
62
Toch geen budget? Voorbeeld: Picasa
63
Toch geen budget? Voorbeeld: Flickr
64
65
Auteursrecht http://www.youtube.co m/watch?v=dUH8yD37Y R4&feature=share&list= UUbro4WrCA6n6e1KNU bE3EaQ
66
Auteursrecht Ieder origineel werk is in principe beschermd door het auteursrecht Van kracht tot 70 jaar na de dood van de auteur Na 70 jaar: publiek domein Opsporen van rechthebbenden is echter vaak zeer arbeidsintensief Probleem: ‘orphan works’ / verweesde werken 67
Auteursrecht Auteur bekend? Vraag toestemming aan auteur of rechthebbende (= meestal erfgenamen) Stel een contract of overeenkomst op
Auteur onbekend? Voorzie het materiaal van een disclaimer Pas op met recent materiaal
68
Auteursrecht Verweesd werk Disclaimer (Archipelproject) “ Wij hebben de nodige inspanningen gedaan om de rechthebbenden van dit document te vinden, maar zijn hier helaas niet altijd in geslaagd. Bent u de rechthebbende of kent u deze persoon, neem dan zeker contact met ons op.”
69
Auteursrecht Voorbeeld: Beeldbank Lier
70
Auteursrecht Voorbeeld: Beeldbank Oostende
71
Auteursrecht: Creative commons
http://creativecommons.org/licenses/?lang=nl 72
Auteursrecht Een interessante publicatie
Auteursrecht en erfgoed Handleiding tot het vermijden van uitschuivers (2004) http://www.faronet.be/e-documenten/auteursrecht-en-erfgoed http://www.faronet.be/e-documenten/publicaties-archipel https://projects.ibbt.be/bom-vl/ > Deliverables
73
Portretrecht Altijd toestemming nodig van de geportretteerde Die zijn toestemming altijd kan herroepen Tot 20 jaar na de dood Met een bepaald doel > geen toestemming voor een ander doel
74
Andere juridische problemen? In Nederland ontstond recent discussie over het opnemen van dagbladen met een nationaal-socialistische signatuur in het online Historisch Krantenarchief van de Koninklijke Bibliotheek. Het ministerie van Justitie bracht een negatief advies uit over het op Internet ter beschikking stellen van de kranten, omdat het niet kan garanderen dat het Openbaar Ministerie niet tot vervolging zou overgaan wegens het 'vermenigvuldigen van strafbare uitingen'. Met andere woorden: het digitaal ontsluiten van oorspronkelijk materiaal uit de oorlogsjaren zou kunnen leiden tot een aanklacht voor verspreiden van haatdragende teksten.
Sinds kort zijn de kranten toch online op http://kranten.kb.nl 75
Meer informatie vinden www.heemkunde-vlaanderen.be Cursussen en advies www.projectcest.be
Alles over digitaal erfgoed
www.packed.be
De organisatie achter CEST
www.edavid.be
Digitaal archiveren/documentbeheer
www.amvb.be
Digitaal archiveren/documentbeheer op maat van kleine organisaties (project DIGIgids)
www.den.nl
Alles over digitaal erfgoed
77