2. Digitale archivering 2.1. technologisch drijfzand “Our time is the Golden Age of Deadmedia, most of them with the working lifespan of a pack of Twinkies.” Bruce Sterling1 “While many arguments for digitization are propagated by vendors and corporate technocrats (who may have other agendas of their own), the reality is that there is no "one" form of digitization, just as there is no one "truth" Jim Lindner2 “Whether we like it or not, we are today on the doorstep of an all&digital world”3, zo stelt professor Aleksandar Todorovic in zijn paper New Tendencies in television technology. De mogelijkheid om beeld en geluid te representeren in een stroom van bits en bytes, met nieuwe mogelijkheden voor productie, consultatie, distributie en reproductie als gevolg, heeft grote implicaties op alle vlakken van de culturele ordening. Digitale archivering – dat refereert naar verschillende methodes om digitaal materiaal levend te houden voor de toekomst4 & lijkt een evident en onafwendbaar uitvloeisel van het ‘mediaonafhankelijke’ digitale tijdperk. Het komt er op aan om er op een efficiënte manier mee om te gaan – en net op dat vlak zijn er nog heel wat barrières te overbruggen. De wrijving tussen het idee van een veilig en weerbaar archief en het technologisch drijfzand dat digitalisering met zich meebrengt is een van de belangrijkste kwesties voor mediacollecties. Het centrale thema bij het cultureel gebruik van deze technologieën is de lange termijn overleving en overlevering van informatie en de vraag hoe die weelde aan tekst, beeld en klank efficiënt kan gestructureerd en gerelateerd worden. Parallel groeit echter ook een algemene verontrusting dat cultureel waardevol materiaal reeds verloren is gegaan of op dit eigenste moment verdwijnt en meer nog, dat de informatie die vandaag aan een steeds sneller tempo wordt aangemaakt nog veel complexer is om consequent en consistent te archiveren. Bruce Sterling : “Bits have no archival medium. We haven’t invented one yet. If you print something on acid-free paper with stable ink, and you put it in a dry dark closet, you can read it in 200 years. We have no way to archive bits that we know will be readable in even 50 years. Tape demagnetizes. CDs delaminate. Networks go down.”5 Digitale archivering beoogt idealiter het behoud en beheer van data voor decennia, eeuwen en zelf langer. De opslagmedia, input en output elementen, programmeertalen, software applicaties en standaarden, noodzakelijk om informatie te vinden en interpreteren worden echter om de zoveel jaar herzien of vervangen. Lange termijn perspectieven zijn in die zin relatief en onvatbaar. Met die wetenschap definieert het invloedrijke OAIS referentiemodel ‘lange termijn’ als volgt: “A period of time long enough for there to be a concern about the impacts of changing technologies, including support for new media and data formats, and of a changing user community, on the information being held in a repository. This period extends into the indefinite future.” 6 De voortdurend aangroeiende archiefcollecties en creatie van content en de evoluerende complexiteit van digitale informatiebronnen zorgen ervoor dat de bestaande archiveringsmethodes drastisch moeten herzien worden. Digitale objecten vergen immers een complexer apparatus om gebruikt te kunnen worden: ze moeten zowel door
1
The Dead Media Project (http://www.wps.com/dead&media/index.html) Lindner, J., ‘Digitization Reconsidered’, AMIA Newsletter 33, 22&23, 29&30, 1996 (http://palimpsest.stanford.edu/byauth/lindner/digirecon.html). 3 Todorovic, A., New Tendencies in television technology, 2003. (http://161.58.124.223/todorovic.pdf) 4 Waters, D. , ‘Digital Preservation?’, CLIR Issues, november/December 1998. (http://www.clir.org/pubs/issues/issues.html) 5 Sterling, B., ‘Digital Decay’ in Depocas, A., Ippolito, J. , Caitlin J. (Ed.), Permanence Through Change, The Variable Media approach, 2003, p. 20. (http://variablemedia.net/e/preserving/html/var_pub_index.html) 6 OAIS Resources (http://www.rlg.org/longterm/oais.html) 2
73
machines als door mensen kunnen gelezen worden. In tegenstelling tot wat vaak wordt aangenomen is digitale informatie allesbehalve secuur, maar in grote mate efemeer. Filip Boudrez van het David project van Stadsarchief Antwerpen: “Pas wanneer men vanaf het digitaliseringsmoment met digitale archivering op lange termijn rekening houdt, is het mogelijk om gedigitaliseerde documenten in de toekomst te blijven raadplegen en de kwaliteit ervan intact te houden. Zonder een duidelijke bewaarstrategie voor digitale documenten loopt men het risico meer informatie en kwaliteit te verliezen in vergelijking met het 'generatieverlies' in de analoge wereld, of zelfs het hele document kwijt te raken. Niet meer raadpleegbare gedigitaliseerde audio&visuele opnamen worden immers als verloren beschouwd”7. Digitalisering is dus absoluut geen oplossing voor de technologische veroudering van analoge afspeelapparatuur, wel integendeel. Door te digitaliseren wordt men afhankelijk van hard& en software voor de reconstructie van geluid& en beeldopnamen. Bovendien evolueren de formaten, standaarden, software etc. voor de verschillende types van digitale (net als elektronische) informatie aan verschillende tempo’s, wat de complexiteit voor het ontwikkelen van efficiënte lange termijn preservatiestrategieën nog bemoeilijkt. Dit probleem berust op twee belangrijke punten8: • Product life cycle: de snelle en continue ontwikkeling van technologie in alle domeinen vergroot de nood om nieuwe producten te ontwikkelen, met betere karakteristieken. Dit betekent dat de levensduur van producten in de toekomst steeds korter wordt. • Product support cycle: de technische ondersteuning van een product verandert ook in termen van tijd. In het verleden werd steeds een garantie gegeven van meer dan tien jaar. Vandaag is dat tussen vijf en tien jaar en dalend.
Figuur 1: preservatie in de digitale wereld, “the irony of modern media”9
Paul Conwey schetste in de bovenstaande figuur de grote paradox: de mogelijkheden op het gebied van opslag en ontsluiting worden groter, de levensduur wordt schrikwekkend kleiner. De grote afhankelijkheid van complexe systemen die om de zoveel jaar aan een upgrade of vervanging toe zijn, brengen aldus een constant en
7
Boudrez, F., Videoarchivering: bruggen bouwen op technologisch drijfzand, DAVID/Stadsarchief Antwerpen, 2004 (http://www.antwerpen.be/david/website/teksten/Presentaties/Abstract_Technologisch_Drijfzand.pdf) 8 FIRST, State of the art reports, 2003, p. 205 (http://www.film&first.org) 9 Conway, P., Preservation in the Digital World, Washington, D.C.: Commission on Preservation and Access, 1996. (http://www.clir.org/cpa/reports/conway2/)
74
perpetueel onderhoud in het vooruitzicht. Paul Conway: “Future access depends on an unbroken chain of such migrations frequent enough to prevent media from becoming physically unreadable or obsolete before they are copied. (…) A single break in this chain renders digital information inaccessible, short of heroic effort.10" Een veel geciteerd voorbeeld in dit verband is BBC’s Contemporary Doomsday Project. In 1986 publiceerde de BBC een laserdisk met een multimediale database die een statistisch en visueel beeld schetste van het toenmalige Groot&Brittannië. Amper 15 jaar na de beëindiging van het project bleek de data niet meer leesbaar zijn, door een gebrek aan de nodige apparatuur en technologische ondersteuning. Het document moest gered worden met behulp van emulatietechnieken, ontwikkeld door verschillende universiteiten. Digitalisering en digitale archivering bieden dus veel mogelijkheden en voordelen, maar minstens evenveel gevaren. In de Guidelines for the preservation of digital heritage, een rapport dat de UNESCO opstelde in 2003, worden een aantal gevaren aangegeven, zoals de natuurlijke foutengeneratie, het verval van de drager, het gevaar van hacking en virussen, natuurrampen en, niet te vergeten, “business failure”11. Zoals Jeff Rothenberg stelt “Digital Records last forever – or five years, whichever comes first.”. Hij stelde een shortlist van grote gevaren van digitale archivering op12: • Verval of ‘evaporatie’ van bits door fysieke, chemische en magnetische effecten • Gelimiteerde levensduur van media = fysieke en logische formaat incompatibiliteit = onbeschikbaarheid van geschikte ‘drives’ of ‘controllers’ • Afhankelijkheid van incompatibele of gedateerde software. Digitale (=gecodeerde) data kan immers maar geïnterpreteerd worden met behulp van een software programma • Afhankelijkheid van gedateerde software omgevingen: I/O drivers etc. voor de software • Afhankelijkheid van gedateerde hardware. Je hebt hardware nodig om de geschikte software te kunnen draaien Tot zover een beeld van de doemscenario’s, die echter zowel voor digital&born documenten als gedigitaliseerd materiaal in bedwang kunnen worden gehouden mits het consequent implementeren en hanteren van digitale archiveringsprocedures en bewaarstrategieën.
2.2. digitale archiveringsprocedures13 Voor de archivering van digitale archiefdocumenten zijn in principe diverse archiveringsprocedures toepasbaar. Voor de archiefbeheerder is het van belang om de archiveringsprocedure te kiezen die het meest efficiënt is voor haar organisatie en haar archiefdocumenten. Het uittekenen van een goede archiveringsprocedure is een proces dat globaal gezien in twee stappen opsplitsbaar is: 1. het definiëren van de algemene criteria waaraan een archiveringsprocedure moet beantwoorden 2. het concreet invullen van de archiveringsprocedure op basis van een beslissingsmodel
10
In Rothenberg, J., Ensuring the longevity of digital information, Santa Monica, 1999 (http://www.clir.org/pubs/archives/ensuring.pdf) 11 UNESCO, Guidelines for the preservation of digital heritage, 2003 (http://unesdoc.unesco.org/images/0013/001300/130071e.pdf) 12 Rothenberg, J., Digital Preservation Summary, presentatie, april 2003 (http://www.pro.gov.uk/about/preservation/ digital/conference/slides/rothenberg.pdf) 13 Dit deel werd in grote mate overgenomen uit Boudrez, F., Dekeyser, H., DAVID. Digitaal Archiveren in de Praktijk. Handboek, Stadsarchief Antwerpen/ICRI, Antwerpen – Leuven, 2003. (http://www.antwerpen.be/david/)
75
2.2.1. Het OAIS Model Een invloedrijk preservatiemodel voor digitale documenten werd door de NASA geconstrueerd: het OAIS (Open Archival Information Systems) model14, niet opgemaakt als blauwdruk voor een werksysteem maar als een conceptuele structuur. Het model werd inmiddels als ISO&standaard vastgelegd en staat aan de wieg van het gros van de huidige modellen voor digitale archivering. De belangrijkste realisering van OAIS is het sensibiliseren van het begrip van de fundamentele voorwaarden die moeten voorzien worden bij de lange termijn bewaring van digitaal materiaal. Het complexe model kan gesimplificeerd weergegeven worden in een overzicht van de primaire onderdelen van een archiveringssysteem: • inname (‘ingest’): kwaliteitscontrole, registratie, beschrijving, extractie metadata, transformatie archiefdocumenten, enz. • lange termijn opslag (‘archival storage’) (fysiek beheer): goede materiële omstandigheden voorzien, vervangen dragers, foutopsporing (checksums), rampenplan, back&ups maken, leesbaar houden, enz. • toegankelijk maken (‘Acces’)(intellectueel beheer): beheren en bijwerken beschrijvingen en metadata, zoekmogelijkheden voorzien • beheer (‘data management’): formuleren beleid, overleggen met archiefvormers, standaarden vastleggen, beheer digitaal depot, bijhouden documentatie, opvolgen technologische veranderingen, enz. • ter beschikking stelling: archieftoegangen en archiefdocumenten beschikbaar stellen
Figuur 2: schematische voorstelling van het OAIS model
AIP = Archival Information Package: de metadata structuur voor langetermijnopslag. SIP = Submission Information Package: wat opgeslagen moet worden DIP = Dissemination Information Package: wat op vraag ontsloten wordt. Deze vijf functies vormen de sleutelprocessen in elke archiveringsprocedure voor digitale archiefdocumenten en overbruggen de documentenstroom tussen archiefvormer en archiefgebruiker. Hoe deze processen vorm krijgen is afhankelijk van de concrete invulling van de archiveringsprocedures.
2.2.2. Het DAVID&beslissingsmodel Het David project, gestart onder de vleugels van het Stadsarchief Antwerpen geeft drie soorten criteria waaraan elke archiveringsprocedure moet beantwoorden:
14
http://ssdoo.gsfc.nasa.gov/nost/isoas/
76
1. juridisch: het juridisch kader waarbinnen de archiveringsprocedure plaats vindt, houdt doorgaans een aantal beperkingen en/of verplichtingen in waaraan moet voldaan worden. In het algemeen dient rekening gehouden te worden met de bescherming van de persoonlijke levenssfeer, de openbaarheidsverplichtingen, de bescherming van het auteursrecht. Bovendien kan voor elk type archiefdocument nog andere specifieke wet& en regelgeving gelden. 2. archiefwetenschappelijk: de digitale archiefdocumenten dienen te beantwoorden aan een aantal archivistische kwaliteitsvereisten zoals digitale duurzaamheid, zo autonoom en zelfvoorzienig mogelijk, voorzien van de nodige metadata, gecontextualiseerd, enz. 3. implementatie: technologische infrastructuur, schaalbaarheid, gebruiksvriendelijkheid, medewerking en bereidwilligheid gebruikers, enz.
Figuur 3: het DAVID beslissingsmodel
Eens de algemene criteria gedefinieerd zijn, legt men in een volgende stap de bouwstenen van de eigenlijke archiveringsprocedure vast. Het DAVID&beslissingsmodel kan hierbij als leidraad dienen. Dit beslissingsmodel kan worden toegepast voor de archivering van allerlei soorten digitale archiefdocumenten. Op basis van het beslissingsmodel worden concrete keuzes gemaakt en wordt een antwoord geformuleerd op vier vragen: - WAT archiveren? - HOE archiveren? - WIE archiveert? - WANNEER archiveren?
77
Figuur 4: het DAVID beslissingsmodel 2
De vertrekbasis voor het beantwoorden van deze vier vragen is het informatiesysteem waarbinnen de archiefdocumenten worden opgemaakt, ontvangen of beheerd. Typisch voor het beslissingsmodel is dat het antwoord op één van de deelvragen mee het antwoord van de andere deelvragen zal/kan bepalen. Een antwoord op de HOE&vraag – de keuze van een bewaarstrategie en formaat – zal mee vastleggen WAT wordt gearchiveerd.
2.3. Bewaarstrategieën15 “When all data are recorded as 0s and 1s, there is, essentially, no object that exists outside the act of retrieval. The demand for access creates the 'object', that is, the act of retrieval precipitates the temporary reassembling of 0s and 1s into a meaningful sequence that can be decoded by software and hardware.” Abby Smith, Preservation in the Future Tense16 De laatste jaren werden een aantal uitgebreide initiatieven opgestart om het probleem van preservatie van digitale content te ontwarren. Het Library of Congress in de VS heeft recent 100 miljoen dollar ter beschikking gekregen voor het uitwerken van een National Digital Information Infrastructure and Preservation Program (NDIIPP)17. Het eerste onderdeel van het programma was een survey van de status van digitale preservatie binnen de Amerikaanse archieven. Tegelijk werden een aantal experts aangezocht om papers te schrijven over de preservatie van web sites, elektronische tijdschriften, digitaal opgenomen klank, digitaal bewegend beeld en digitale televisie18. Ook andere initiatieven zoals het CEDARS project 19, CAMiLEON20, NEDLIB21, de OCLC/RLG22
15
het grootste deel van dit hoofdstuk werd letterlijk overgenomen uit Boudrez, Filip, Digitale archivering: bruggen bouwen op technologisch drijfzand, Studiedag 'Video in Vraag: van analoge naar digitale beeldconservering', SMAK, 19 maart 2004. (http://www.antwerpen.be/david/website/teksten/Presentaties/ Abstract_Technologisch_Drijfzand.pdf) 16 Smith, A., Preservation in the Future Tense, Council on Library and Information Resources, 1998. (http://www.clir.org/) 17 http://www.digitalpreservation.gov/ndiipp 18 Building a National Strategy for Preservation: Issues in Digital Media Archiving, commissioned for and sponsored by the National Digital Information Infrastructure and Preservation Program, Library of Congress, 2002 (http://www.clir.org/pubs/reports/pub106/contents.html) 19 CEDARS, CURL Exemplars in Digital Archives. (http:/:www.leeds.ac.uk/cedars/) 20 CAMiLEON (http:/:www.si.umich.edu/CAMILEON/) 21 Networked European Deposits Library (NEDLIB) (http://www.kb.nl/coop/nedlib/) 22 OCLC/RLG Working Group on Preservation Metadata (http://www.oclc.org/research/pmwg/)
78
werkgroepen en in Vlaanderen, het DAVID project hebben gewerkt aan onderzoek rond preservatiestrategieën, voornamelijk gefocust op twee pistes: emulatie en migratie – of een amalgaam daarvan.
2.3.1. Migratie Auteur: Filip Boudrez, DAVID project, Stadsarchief Antwerpen23 Migratie is de bewaarstrategie waarbij digitale documenten naar een geschikt archiveringsformaat worden omgezet. Op die manier verzekert men zich ervan dat de digitale documenten kunnen geraadpleegd worden met andere hard& en software dan diegene waarmee ze werden gecreëerd. Aangezien geschikte archiveringsformaten bij voorkeur standaardformaten zijn, is dit de bewaarstrategie waarbij de digitale documenten naar een standaardformaat worden omgezet. Standaarden zijn in principe gedocumenteerd, stabiel en niet afhankelijk van één producent. Migratie wordt soms ook wel aangeduid met ‘transformatie’ of ‘normalisatie’ wanneer standaarden als doelformaat worden gebruikt. Voordelen van migratie als bewaarstrategie zijn onder meer: • archiefbeherende instellingen kunnen zelfstandig de migratiestrategie toepassen • digitale archiefdocumenten worden niet in een producent&, software& of versiegebonden bestand formaat bewaard • de specificatie van het bestandsformaat is beschikbaar: op basis van deze documentatie kan ten allen tijd een nieuwe viewer geprogrammeerd worden • beschikbaarheid van omzettingstools: er zijn niet alleen veel omzettingstools op de markt, migraties zijn ook gemakkelijk te realiseren met behulp van wijdverspreide computerprogramma’s De migratiestrategie heeft ook een aantal nadelen: • afhankelijkheid van beschikbare standaarden • kans op informatieverlies (bijv. wanneer het doelformaat bepaalde componenten van het oorspronkelijk formaat niet kan overnemen) Tot op heden is migratie de meest toegepaste bewaarstrategie voor digitale archiefdocumenten.Archiefinstellingen hebben ondertussen al een vrij veel expertise en ervaring inzake het gebruik van migratie opgebouwd zodat de risico's en de minpunten vrij goed ingeschat kunnen worden.
2.3.2. Emulatie Auteur: Filip Boudrez, DAVID project, Stadsarchief Antwerpen24 Bij emulatie wordt niet de originele hard& en software bewaard, maar wordt het vereiste platform op een toekomstige computerconfiguratie gereconstrueerd zodat de computerbestanden in hun oorspronkelijk formaat raadpleegbaar zijn. Emulatie kan op diverse niveaus worden toegepast. Men kan computerhardware, besturingssystemen, specifieke software of een combinatie van dit alles nabootsen. Emulatie is mogelijk op basis van configureerbare chips (emulatie door hardware) of op basis van computerprogramma’s (emulatie door software). Inmiddels bestaan verschillende visies op de wijze waarop emulatie voor digitale archivering kan worden toegepast: - Jeff Rohenberg: Emulation Virtual Machine25 23
verscheen eerder in Boudrez, F., Dekeyser, H., DAVID. Digitaal Archiveren in de praktijk. Een handboek, Stadsarchief Antwerpen/ICRI, Antwerpen/Leuven, 2003.
24
Ibid.
79
- Steve Gilheany: Turing Machine26 - Raymond Lorie: Universal Virtual Machine (data preservatie, programma preservatie27) - Cedars & Camileon project: Migration on request28 Emulatie heeft een aantal interessante voordelen: • in theorie kunnen de documenten in hun oorspronkelijk formaat gearchiveerd worden • alle originele eigenschappen en functionaliteiten blijven behouden • er gaan geen elementen verloren ten gevolge van omzettingen • de authenticiteit van de digitale archiefdocumenten is gemakkelijker te garanderen • documenten hoeven niet omgezet te worden telkens hun formaat in onbruik raakt • de kostprijs is niet afhankelijk van het aantal gearchiveerde digitale documenten Anderzijds zijn er ook een aantal nadelen aan emulatie verbonden: • emulatie is technisch complex: de nodige know&how en expertise voor ontwikkeling en onderhoud zijn niet intern aanwezig. Archiefbeherende instellingen zijn bijgevolg afhankelijk van externe diensten en partners. • emulatie heeft hoge ontwikkeling& en onderhoudskosten: kunnen archieven die nu voor deze benadering kiezen de financiële inspanningen in de toekomst blijven leveren? • de platformen waarop emulatieprogramma’s draaien, evolueren, wat op termijn omzettingen van of aanpassingen aan emulatieprogramma’s zal vergen • overkill: bepaalde emulatiebenaderingen gaan uit van de volledige reconstructie van de oorspronkelijke applicaties met alle functionaliteiten, terwijl in principe een viewer volstaat om het (statisch) archiefdocument weer te geven. Emulatie richt zich hoofdzakelijk op de lange termijn bewaring van systemen en software, terwijl de archivaris in eerste plaats de archivering van het digitaal archiefdocument beoogt. • de bescherming van het auteursrecht op hard& en software houdt restricties in voor reverse engineering en het bouwen van emulatoren • archiefvormers maken gebruik van tal van verschillende informatiesystemen, waarvan een aantal op maat van de organisatie zijn gesneden of ad hoc ontwikkeld zijn: archieven dienen over tal van emulatoren te beschikken en kunnen bepaalde kosten niet delen met andere archieven • emulatie van viewers voor gesloten of niet gedocumenteerde bestandsformaten op basis van reverse engineering is risicovol. Emulatie van viewers voor gestandaardiseerde en gedocumenteerde formaten is gemakkelijker en veiliger, maar blijft hoe dan ook technisch complex. Wordt emulatie dan toch voorafgegaan door een migratie naar een open, gedocumenteerd en gestandaardiseerd archiveringsformaat? • gebruikers werken met oude software en kunnen geen gebruik maken van technologische vernieuwingen • archieven beheren niet alleen digitale archiefdocumenten, maar ook emulatiehardware en &software en bijhorende documentatie de praktische haalbaarheid van bepaalde emulatiepistes zal pas in de toekomst blijken De promotoren van emulatie als digitale bewaarstrategie schuiven voornamelijk het behoud van het oorspronkelijk computerbestand met alle originele eigenschappen als belangrijkste argument naar voor. Men beklemtoont in het bijzonder de mogelijkheid tot bewaring van de ‘look and feel’ en de functionaliteiten, terwijl deze eigenschappen bij migratie veelal gewijzigd worden of verloren gaan. Ze stellen niet de vraag of alle ‘originele’ eigenschappen
25
Rothenberg, J., Bikson, T., Digital preservation: carrying authentic, understandable and usable digital records hrough time. report to the dutch national archives and ministry of the interior, 1999. (http://www.digitaleduurzaamheid.nl/bibliotheek/docs/final&report_4.pdf); Rothenberg, J., An experiment in using emulation to preserve digital publications, Den Haag, 2000 (http://www.kb.nl/coop/nedlib/results/emulationpreservationreport.pdf); Rothenberg, J., Avoiding technological quicksand: finding a viable technical foundation for digital preservation. a report to the council on library and information resources, Washington, 1999 (http://www.clir.org/pubs/reports/rothenberg/pub77.pdf); Rothenberg, J., Ensuring the longevity of digital information, Santa Monica, 1999 (http://www.clir.org/pubs/archives/ensuring.pdf). 26 http://www.archivebuilders.com/aba010.html 27 http://www.rlg.org/preserv/diginews/diginews5&3.html#feature2 28 http:/:www.rlg.org/preserv/diginews/diginews5&4.html#feature2
80
wel bijdragen tot de archiefstatus van een digitaal object en bijgevolg wel dienen gearchiveerd te worden, hoe de originele ‘look and feel’ kan gedefinieerd worden en of het behouden van de oorspronkelijke functionaliteiten wel noodzakelijk is. Ze beschouwen digitale archiefdocumenten louter als digitale artefacten waarvan alle eigenschappen behouden dienen te worden. Het is niet toevallig dat de grote emulatievoorstanders in de eerste plaats computerwetenschappers zijn, maar ook binnen de hedendaagse kunstwereld wordt emulatie voor heel wat elektronische en digitale werken als de meest valabele methode aangewezen (zie verder, hoofdstuk 4). Emulatie blijft globaal gezien een potentiële strategie die zijn nut voor de archivering van digitale archiefdocumenten kan hebben. In ieder geval heeft men nog maar beperkte ervaringen met emulatie als digitale bewaarstrategie. Er zijn nog maar weinig praktische en grootschalige emulatietoepassingen voor digitale archivering operationeel
2.4. Formaten Het Library of Congress definieert formaten als “packages of information that can be stored as data files or sent via network as datastreams (aka bitstreams, byte streams).”29 Deze omschrijving omvat • alle bestandsformaten - aangeduid door bestandsextensies (bvb.mp3 ) - aangeduid als Internet MediaType (bvb. text/html) - versies die evolueren over tijd (bvb. TIFF) - afleidingen voor meer specifieke doeleinden (bvb. TIFF&EP voor elektronische fotografie) • De gerelateerde formaten waarvan de familiale karakteristieken belangrijk zijn (bvb. WAVE als deel van de RIFF klasse) • De “wrappers” of containers, te onderscheiden op basis van hun onderliggende bitstreams (bvb. WAVE kan zowel LPCM audio (Linear Pulse Code Modulated, zoals op een CD) bevatten als meer gecompresseerde audio (zoals voor digitale telefonie)) • Gebundelde formaten, die verschillende bestanden bundelen tot een digitaal, multimediaal werkstuk (bvb. MPEG21, MXF en AAF) The Library of Congress werkt aan een theoretisch referentiekader dat alle digitale formaten identificeert en documenteert die veelbelovend zijn voor langetermijnbewaring. Er zijn zeven belangrijke factoren geïdentificeerd die in rekening moeten gebracht te worden bij de keuze van doelformaten. Ze gelden voor alle soorten digitale informatie, onafhankelijk van de gebruikte bewaarstrategie: migratie, emulatie of een hybride aanpak30. • Ontsluiting: Zijn specificaties en tools om technische integriteit te valideren beschikbaar voor de producenten en bewaarders van digitale content? Preservatie is afhankelijk van het begrip hoe informatie in digitale bestanden wordt gerepresenteerd in bits en bytes. Hier komt het belang van open formaten en Open Source naar voren en dan vooral de documentatie ervan. • Adoptie: Wordt dit formaat reeds gebruikt door de initiële producenten en gebruikers van informatiebronnen? Als een formaat wijdverbreid is, is de kans kleiner dat het formaat op korte termijn verdwijnt en zijn tools voor migratie en emulatie sneller voorhanden. • Transparatie: Is de digitale representatie of codering open voor directe analyse? Digitale formaten waarbij de onderliggende informatie simpel en direct beschikbaar is, zijn gemakkelijker om te migreren. Compressie onderdrukt transparantie. • Zelfdocumentatie: Bevat het bestandsformaat metadata om de data te lezen of zijn context te begrijpen? Zelfdocumenterende formaten, die descriptieve, technische en administratieve bevatten zijn duurzamer en minder kwetsbaar dan diegenen die gescheiden zijn van hun belangrijkste metadata.
29 30
http://www.digitalpreservation.gov/formats/intro/format_eval_rel.shtml zie http://www.digitalpreservation.gov/formats en http://www.loc.gov/rr/mopic/avprot/SoundSavings03.ppt
81
• Externe afhankelijkheden: refereert naar de mate waarin een specifiek formaat afhangt van specifieke hard& en software en bestuurssysteem en de complexiteit om daar in toekomstige technische omgevingen mee om te gaan. Voor dynamische content (interactief bvb.) is dit nog een stuk moeilijk en kostelijker dan statische content. • Impact van patenten: dit houdt verband met de softwarepatenten die in de V.S worden gehandhaafd en waar nu ook in Europa fel voor gelobbyd wordt (zie 2.6). Het bestaan van die patenten kan de ontwikkeling van Open Source encoders en decoders gevoelig dwarsliggen. Bovendien kunnen de prijzen voor commerciële software om content te transcoderen hoge licensiekosten incorporeren. Wanneer die licenties gebruiksroyalties aanrekenen, kan dat prijskaartje onvoorspelbaar en uitgebreid worden. • Technische beschermingmaatregelen: zoals reeds gesteld vormen technische DRM systemen zoals encryptie een hinderpaal voor archiveringspraktijk. Content mag niet beschermd worden door DRM systemen zoals encryptie. Formaten die gebonden zijn aan een fysieke drager of enkele kunnen gebruikt worden door een specifiek instrument zijn niet gepast voor preservatie, net als formaten die beperkt zijn in gebruik qua tijd of netwerkgebruik. Het gebruik van dit soort mechanismen is in de meeste gevallen optioneel en eerder gebonden aan de manier waarop een formaat wordt gebruikt in een commerciële context dan aan het formaat zelf. Afhankelijk van de karakteristieken, de verwachte kwaliteit en de functionaliteit van de content, zijn nog additionele factoren van toepassing. Voor klank en video zijn dit o.a. ook de ondersteuning van hoge resolutie, stereo en surround sound. Enkele formaten hebben speciale kenmerken die door wordt aangeduid als “functionality beyond normal rendering”, waarmee wordt verwezen naar de mogelijkheden om uitzonderlijke versies aan te maken van bepaalde informatietypes, afhankelijk van de noden van de gebruiker. Dit is bijvoorbeeld het geval voor MIDI files die nieuwe tonen en timbres mogelijk maken. Ook de zogenaamde rich-data content valt onder deze categorie: wanneer een bestand als master dienst doet, als basis voor verder gebruik. Dit is mogelijk van toepassing op klank en video.Op een rich&data klankopname is via normale afspeelapparatuur niet alle informatie hoorbaar, maar zo’n bestand kan wel worden aangepast of uitgebreid met minder kans op fouten dan wanneer ‘normale’ geluidskwaliteit zou toegepast zijn. In het geval van video kunnen bepaalde formaten (zoals MXF en Motion JPEG) ongecompresseerde video opslaan, wat voor preservatiedoeleinden de beste oplossing is. Maar de hoge datarate maakt dat de meeste computers dat bestand niet kunnen lezen. In een opslagsysteem zouden dergelijke bestanden beheerd worden in minder dan real&time en overgezet worden naar gecompreseerde files vooraleer ze te kunnen afspelen. Voor verdere richtlijnen en formaten voor het digitaliseren van tekst, afbeeldingen, websites, emails etc. verwijzen we naar de Digital Formats Web site van het Library of Congress en de richtlijnen van Filip Boudrez van het DAVID project31. Voor audio en video verwijzen we naar 3.1.
2.5. Economische en beleidsmatige aspecten van digitale preservatie “data archives do not do well with budget interruptions.” Richard L. Hess32 Digitaal archiveren vergt een uitgebreide onderbouw van technische oplossingen, standaarden, businessmodellen en personeel. Zonder betaalbare economische modellen kunnen evenwel zelfs de meest efficiënte technische oplossingen niet ingezet worden. Het grootste deel van het internationaal onderzoek is gefocust op de technische en technologische kwesties, slechts weinig aandacht wordt besteed aan de analyse van de sociale en economische mechanismen die digitale archivering moeten mogelijk maken. Een referentiemodel zoals OASIS toont wel de meeste inherente activiteiten, maar niet hoe dit alles moet georganiseerd worden of welke financiële implicaties dit heeft. De ervaringen met digitale archivering zijn nog jong en nog steeds in volle ontwikkeling, er is dan ook nog geen sprake van een eenduidig kader van ‘best practices’. Empirische data over de kosten van
31
zie o.a. http://www.antwerpen.be/david/website/teksten/Richtlijn9.pdf en http://www.antwerpen.be/david/website/teksten/DAVIDbijdragen/Standaarden.pdf 32 http://palimpsest.stanford.edu/byform/mailing&lists/amia&l/2004/01/msg00244.html
82
digitale preservatie zijn tot op heden niet beschikbaar, alhoewel instellingen zoals The Library of Congress33 en het Europese PrestoSpace project daar sinds kort werk van maken. Zeker is dat de kostcomponenten van digitale preservatie in meer dan een opzicht verschillen van ‘fysieke’ preservatie. De levensduur van fysieke documenten kan mits omzichtige behandeling of migratie naar stabiele dragers verlengd worden wanneer nodig, digitale informatie vraagt echter een perpetueel onderhoud. De continuïteit van digitale collecties kan zelfs door korte storingen in management en financiering bedreigd worden. Het Interpares project (International Research on Permanent Authentic Records in Electronic Systems) heeft het in dit verband over het belang van het ononderbroken archiefbeheer (‘unbroken custody’), naast de betrouwbare kwaliteiten van het archiefpersoneel (‘trusted custodian’), als voorwaarden voor (het vertrouwen in) een lange termijn bewaring van digitale objecten34.
Figuur 5: de context van digitale preservatie35
33
It’s about time, research challenges in digital archiving and long-term preservation, The National Science Foundation / The Library of Congress, augustus 2003. (http://www.digitalpreservation.gov/repor/NSF_LC_Final_Report.pdf) 34 http://www.interpares.org/ 35 http://www.library.cornell.edu/iris/tutorial/dpm/foundation/oais/
83
Figuur 6: het digitale preservatieproces36
Figuur 7: management en uitvoering van het preservatieproces37
Zoals uit bovenstaande figuren & uit een studie van Interpares & blijkt, moet voor digitale preservatie heel wat elementen in rekening genomen worden. Bovendien zijn er heel wat indicaties dat preservatie activiteiten in het digitale tijdperk in stijgende mate niet alleen perpetueel maar ook acuut en grootschalig zullen zijn. Brian Lovoie geeft in zijn rapport Of Mice and Memory: Economically Sustainable Preservation for the Twenty-first Century 38 drie sleuteldomeinen waarin preservatie vanuit een economisch oogpunt zal geredefinieerd worden.
36
Ibid. Ibid. 38 Lovoie, B., ‘Of Mice and Memory: Economically Sustainable Preservation for the Twenty&first Century’, in: Access in the Future Tense, Council on Library and Information Resources, Washington, D.C., april 2004. (http://www.clir.org/pubs/abstract/pub126abst.html) 37
84
1. Verantwoordelijkheden: De nieuwe informatietechnologieën hebben gezorgd voor nieuwe beslissingsmodellen binnen het preservatieproces. Dit heeft o.a. te maken met de diffusie tussen bewaarinstellingen en content providers. 2. Begrotingen: digitale preservatie moet gebeuren met kennis van IT en het bewustzijn dat preservatie eerder een ‘proces’ wordt dan een ‘event’. Dit heeft heel wat impact op de investeringspolitiek van instellingen en de overheid. 3. Organisatie: de tijdshorizon van preservatie krimpt & in het extreemste geval begint het preservatieproces al bij de creatie – met alle gevolgen vandien voor het collectiemanagement. Een digitale omgeving heeft onmiskenbaar een indringende invloed op de beheersprocessen, van selectie tot descriptie en kwaliteitszorg. Enkele traditionele procedures kunnen overbodig worden, andere kunnen geautomatiseerd of aangepast worden. Voor digitale documenten is de link tussen creatie en preservatie, zoals gesteld, veel belangrijker: de manier waarop een document is aangemaakt heeft een grote invloed op de preservatiemethode. Op dezelfde manier hebben de beslissingen die op het moment van het conserveren worden gemaakt een grote impact op de toegang tot de data. Instellingen met verantwoordelijkheden op het vlak van lange&termijn preservatie hebben dus efficiënte modellen nodig om het beheer en onderhoud van collecties richting te geven, om strategieën uit te bouwen en ontsluitingsniveau’s te definiëren. Het feit dat de technologieën voor digitale preservatie nog niet op punt staan en nog steeds in volle vaart evolueren maakt het echter moeilijk om over de nodige investeringen en kostenmodellen te beslissen. In een rapport van het Erpanet project worden volgende belangrijke kwesties aangehaald39: • De kosten beslaan alle activiteiten van creatie, registratie en ontsluiting. • Preservatie is een continu en actief proces • Preservatie is een lange termijn aangelegenheid die financieel consistent en consequent moet onderhouden worden In hetzelfde rapport wordt een overzicht gegeven van kostfactoren.
Objecten
Factoren/Aandachtspunten
Financiële gevolgen
Overwegingen
Invloed op de creatie
Minder invloed betekent meestal hogere kosten
Binnen een organisatie is het eenvoudiger om de creatie van documenten/informatieobjecten te beïnvloeden dan van buitenaf. Beleidsvoeringen, standaarden en procedures kunnen ondersteunend werken bij de creatie en het beheer
Bestaande objecten
Bestaande objecten vragen meer voorbereidend werk voor verwerking en opslag
Bestaande objecten, die vb. gemaakt werden met standaardsoftware vragen grotere inspanning naar voorbereiding en verwerking toe. Er bestaat ook meer risico dat de contextuele metadata ontoereikend zijn of zelfs ontbreken
39
http://www.erpanet.org/www/products/tools/ERPANETCostingTool.pdf. Van 20 tot 22 september organiseert Erpanet een nieuwe seminarie, deze keer met de focus op businessmodellen voor digitale preservatie.
85
Complexiteit
Groeiende complexiteit van objecten vragen meer onderhoud
Bewaarperiode
Objecten langer bijhouden brengt Het is van belang om objecten niet meer onderhoud met zich mee langer dan nodig bij te houden
Evaluatie/waarde
De intrinsieke waarde van de informatieobjecten moet bepaald worden. Consequente en betrouwbare evaluatie helpt ook om kosten te reduceren
Dit gaat samen met de bepaling van het risico dat het object verloren gaat
Specifieke vaardigheiden vereist
Voorbeelden van specifieke vaardigheden:
Vaardigheden
Complexe objecten zijn vaak multimedia objecten of samengestelde objecten die bestaan uit diverse soorten formaten. Ze kunnen ook dynamisch gedrag vertonen
Een consequent evaluatiebeleid helpt ook om alleen het hoogstnoodzakelijke over te houden
& begrip van de specifieke aard van digitale objecten & begrip van de beschikbare conservatiemethodes & Enz. Beschikbare vaardigheden moeten multidisciplinair zijn Goed getrainde, bekwame en ervaren mensen zijn duur, maar reduceren de totale kost
Kwaliteit valt moeilijk te definiëren en is sterk afhankelijk van de vereisten en de bedrijfscontext (i.e. conservatie die van toepassing is. Dit kan onder meer een voldoende aantal mensen inhouden, nodig om de vooropgestelde kwaliteitsnormen te halen
Training
Training moet up&to&date zijn en afgestemd op de specifieke functies van de job. Hiervoor zijn de nodige fondsen vereist
Snelle IT&ontwikkelingen en nieuwe inzichten op het gebied van digitale bewaring en strategieën vereisen doorlopende training
Ervaring
Naarmate de ervaring toeneemt, kunnen minder onvoorziene tegenslagen voorvallen
De informatieconserveringsdiscipline gaat voor op de technologie. Maar zonder technologie is conservatie onmogelijk
Standaarden
Door het gebruik van standaarden is minder eigen ontwikkeling nodig, dit maakt tegelijk duurzame oplossingen mogelijk
Standaarden blijven niet eeuwig bestaan, en er is een wijd keuzeaanbod
Standaarden
Mensen
Kwaliteit
Toch helpen standaarden om de kosten lager te houden
86
Metadata vormen een domein dat speciale aandacht vraagt. Algemeen gesproken: hoe minder metadata, des te lager de kosten. Standaardisering op het vlak van metadata (zowel op het vlak van syntax als semantiek) maken ook onderlinge bruikbaarheid mogelijk en efficiënte onderlinge bruikbaarheid maken eenvoudige en efficiënte uitwisseling, interactie en handel mogelijk
Workflow
Moet coherent en consequent zijn
Procedures en conservatiestrategieën komen samen in een workflow. Helpt om een goed tijdschema op te stellen
Uitvoering
Kosten omvatten mensen, Uitvoering en prestaties moeten materiaal. Geschikte en efficiënte geëvalueerd en regelmatig softwaretools minimaliseren gecontroleerd worden menselijke tussenkomst en laten de processen sneller verlopen
Processen
Elk proces zou op zich rendabel moeten zijn
Dit veronderstelt een analyse van te nemen stappen binnen elk proces en een evaluatie van de noodzakelijke vaardigheden en tools (de geschiktheid van de hulpbronnen)
Conservatiemethode
Elk type zal een ander kostenprofiel hebben
Mogelijke types methodes zijn migratie, het gebruik van XML of andere standaarden, procedures voor harvesting of capture, UVC& methode, enz. Redenen voor een gamma van methodes zijn vb. een heterogene verzameling van verschillende objecttypes, of de noodzaak om de slaagkans bij conservatie te verhogen
Praktijk
Standaardformaten vereisen ook minder onderhoud en ze maken migratieprocedures eenvoudiger
Systemen, Methodes en Technologieën
Het kan nodig zijn om verschillende conservatiemethodes naast elkaar te gebruiken
Validering van de methodes
Validatie van de potentiële slaagkans van een methode is noodzakelijk voor er gebruik van gemaakt wordt
Opvolging en validering moeten voortdurend plaatsvinden. Dit zal de kwaliteit van de conservatie van objecten bevorderen. Op dit moment staan de conservatiemethodes nog in hun kinderschoenen en ze zullen evolueren
Duurzaamheid
Methodes moeten gekozen worden vanuit de gedachte dat ze verschillende IT&generaties overleven
Essentieel om kosten te reduceren. Het ligt voor de hand dat methodes na verloop van tijd zullen evolueren door allerlei nieuwe inzichten, Het moet in zo'n gevallen eenvoudig zijn om ze in de praktijk aan te passen
87
Overdraagbaarheid
De gekozen conservatiemethodes moeten eenvoudige overdraagbaarheid naar andere of nieuwe systeemplatformen toelaten
Dit geldt zowel voor de methode zelf als voor de objecten die ze ondersteunen
Onderdelen
Technische infrastructuur moet geïmplementeerd en onderhouden worden
Welke componenten nodig zijn hangt af van: & De aspiraties & De complexiteit van de objecten & De gekozen conservatiemethodes & Topologie Soms lijken standaardsystemen goedkoper, maar op termijn zijn ze duurder (vb. leveranciers proberen eerst klanten van zich afhankelijk te maken)
Onderhoud
Het onderhoud van systemen, zowel om ze operationeel te houden als om ze actueel te houden
Uitvoering
Kosten omvatten mensen, materiaal. Geschikte en efficiënte softwaretools minimaliseren menselijke tussenkomst en laten de processen sneller verlopen
Flexibiliteit
Naar onderhoud op langere Het moet mogelijk zijn om tegen termijn toe en door de evoluties een lage kostprijs nieuwe op het vlak van IT. Snelle evolutie componenten toe te voegen op IT&vlak vraagt flexibiliteit in de toepassing
Voorzieningen
Locatie, beveiliging, veiligheidsvoorzieningen, back& up (beschikbare opslagruimte)
Conservatieklasse
Er kan een onderscheid gemaakt worden tussen het bewaren van bitstreams en van functionaliteit (dat het bewaren van bitstreams mee omvat)
Modulariteit
Tijdens het onderhoud en bij vervanging van (delen van) de infrastructuur kan modulariteit het financiële rendement verhogen
Het conserveren van bitstreams is goedkoper en eenvoudiger te realiseren dan het conserveren van functionaliteit. Functionaliteit kan tot op verschillende niveaus geconserveerd worden (vb. volledige functionaliteit veronderstelt emulatie van de originele technische omgeving)
88
Wetgeving en beleid
Wetgeving
Organisaties en hun zaken kunnen onderworpen zijn aan specifieke wetgeving, mogelijk moeten ze zich verantwoorden
Dit kan inhouden: verantwoording, toegankelijkheid, auteursrecht en privacykwesties
Beleid
Elke organisatie moet een conservatiebeleid beleid hebben om een consequent en financieel efficiënt beheer mogelijk te maken.
Beleidsvoering moet ingebed worden in en verbonden worden aan de ondernemingsactiviteiten (incl. risk management) Ze moeten geactualiseerd worden volgens nieuwe inzichten en de evolutie van technologieën en conservatiemethodes Interne of externe audits kunnen er toe bijdragen om beleid actueel te houden
Organisatie
Relaties opbouwen
Samenwerking met andere organisaties kan kostenverlagend werken door synergieën en economy&of&scale
Samenwerking kan bereikt worden via gezamenlijk onderzoek, gemeenschappelijk ondernemen,het delen van technische tools, infrastructuur, zowel als kennis. Vanuit een commerciëler standpunt kunnen activiteiten uitbesteed worden
Capaciteit uitbouwen
Uitbouwen van capaciteit is afhankelijk van de behoeftes van de organisatie, haar rol en verantwoordelijkheden
Verantwoordelijkheden
Omvat ook identificatie van alle betrokkenen
Figuur 8: kostfactoren van digitale preservatie40
Om deze factoren in te kunnen passen in een beleid, moet iedere organisatie zijn eigen behoeftes identificeren, afhankelijk van de economische en culturele context: • • • • •
Behoeftes op institutioneel vlak en de conserverings& en archiveringsschaal Juridisch kader Types van documenten die gepreserveerd moeten worden Consequenties voor organisatie, structuur en beleid Te gebruiken methodes, standaarden, technologieën, systemen
De kosten voor digitale preservatie zullen afhangen van de invulling van deze vijf factoren. Stephen Chapman stelde in een studie voor de Harvard University dat de inhoudelijke eigenschappen van het materiaal zelf in principe niet van belang zijn in termen van kosten41, refererend naar Kevin Ashley van the University of London Computer Centre die vaststelde dat preservatiekosten niet gelijk zullen zijn voor dezelfde materialen in verschillende archieven met verschillende functies. Wat wel een grote invloed heeft is de keuze van datakwaliteit: hoe meer compressie, hoe goedkoper. Hierdoor moeten vaak ook pragmatische curatoriale keuzes worden gemaakt: hoeveel materiaal kan je veroorloven om niet te bewaren? Moet er, ondanks grote risico’s, toch compressie gebruikt worden om zoveel mogelijk materiaal te kunnen behouden? Deze vragen spelen momenteel 40 41
http://www.erpanet.org/guidance/index.php http://jodi.ecs.soton.ac.uk/Articles/v04/i02/Chapman/
89
vooral voor audiovisueel materiaal, waar overigens bij het overzetten van analoog naar digitaal ook een hoge meerkost voor reiniging en restauratie meespeelt. Met digitaal archiveren wordt ongetwijfeld bespaard op ruimte en onderhoud (klimaatscontrole etc.), maar momenteel wegen die kosten nog niet op tegen perpetuele operationele kosten vanuit het perspectief van opslagmedia, IT management etc.. Als men het bovendien heeft over digitale archieven van ettelijk terabytes (wat voor video niet ondenkbaar is) moet men vaststellen dat dit tot op dit moment het monopolie is van grote omroepen en IT departementen van grote bedrijven, met goed opgeleid personeel en degelijke infrastructuur. De grote noden van videocollecties en de komst van digitale opslagmethodes hebben als gevolg dat kleinschalige instellingen nu ook voor grootschalige taken worden geplaatst en moeten beslissen uit de plethora van methodes, factoren en bijhorende (hoge) kosten welke nu het meest opportuun en waardevol zijn op korte, middellange en lange termijn. Gerelateerd is de vraag in hoeverre kan samengewerkt worden om kosten te besparen door het delen van bepaalde activiteiten, faciliteiten – opslag, migratie, … & en referentieservices, binnen dezelfde sector en misschien zelfs tussen verschillende sectoren. En dat zijn wellicht de moeilijkste beslissingen, ook omdat de keuzes een impact kunnen hebben op het organisatieproces en de verantwoordelijkheden binnen de instelling zelf. Niemand wil nu eenmaal macht of identiteit verliezen.
2.6. Juridische kwesties bij digitale archivering en ontsluiting “Libraries want to share content; publishers want to sell it. Museums strive to preserve culture, and artists to create it. Musicians compose and perform, but must license and collect. Users want access, regardless of where or how content is held. What all of these stakeholders (and more) share is the need to identify content and its owner, to agree on the terms and conditions of its use and reuse, and to be able to share this information in reliable ways that make it easier to find.” David Baerman42 Digitale archivering komt op verschillende manieren in het vaarwater van het auteursrecht – of omgekeerd. Een digitaal werk moet gekopieerd worden om in het archief opgenomen te kunnen worden, documenten moeten gereformateerd worden om toegankelijk te blijven en ten slotte is het ook de bedoeling het werk aan het publiek ter beschikking te stellen. Archiverende instellingen worden dus voor twee hamvragen gesteld: 1. hoe kun je op een legale manier documenten digitaliseren, reformatteren of digitaal ontsluiten? 2. Hoe kun je garanderen dat niemand de gedigitaliseerde documenten kan gebruiken zonder toestemming? De complexe problematiek van digitale archivering en de realiteit van de voorgestelde bewaarstrategieën zorgen voor heel wat juridische problemen en onduidelijkheden, zowel bij de digitalisering van analoog of ander materiaal, als de reformattering van digital&born data. Zowel bij migratie als emulatie is het origineel materiaal immers onderhevig aan manipulatie, waardoor de presentatie en de functionaliteit veranderd kunnen worden. De intellectuele rechten – in de eerste plaats auteursrechten & verbonden aan de content of de gebruikte software kunnen toebehoren aan verschillende individuen of organisaties. Digitale informatie kan beschermd zijn door een Digital Rights Management systeem & ontwikkeld om het ongeoorloofd kopiëren of distribueren te verhinderen – dat echter ook een hinderpaal kan zijn voor preservatie. In de Verenigde Staten is het hek reeds van de dam met de Digital Millenium Copyright Act), die het omzeilen van DRM bescherming strafbaar maakt. Zelfs het onderzoek naar de veiligheid van DRM systemen wordt strikt aan banden gelegd, waardoor ‘reverse engineering’ strafbaar wordt. De Europese Commissie lijkt dezelfde weg op te gaan. In de meeste gevallen geldt dat als de archiverende instelling niet over de toestemming beschikt van de rechtenhouders (auteur, producent of diegene bij wie de rechten zich bevinden) of ze niet vallen onder juridische statutaire uitzonderingen, ze niet kan overzetten op een digitaal formaat, migreren, emuleren of ontsluiten. Vooraleer gedigitaliseerd of gereformateerd kan worden moet
42
Bearman, D., G. Rust, S. Weibel, E. Miller, Trant, J., ‘A Common Model to Support Interoperable Metadata. Progress Report on Reconciling Metadata Requirements from the Dublin Core and INDECS/DOI Communities’, DLib Magazine 5, no. 1, Januari 1999. (http://www.dlib.org/dlib/january99/bearman/01bearman.html)
90
dus eerst de status van de auteursrechten van de documenten bepaald worden. Bij elke digitale bewaarstrategie moeten juridische kwesties in rekening genomen worden43: Juridische kwesties Migratie
Mogelijke alteratie van ‘look & feel’, functionaliteit of content.
Emulatie of regeneratie
Het maken van een nieuwe versie kan beschouwd worden als een vorm van herpublicatie. Ook is het proces van ‘Reverse Engineering’ (uitzoeken hoe bvb. een formaat werkt en op basis van die functies een nieuw formaat construeren) in sommige wetgevingen (bvb. in de VS) en voor sommige toepassingen uitdrukkelijk verboden.
Alle bewaarstrategieën
Voor het herhaaldelijk kopiëren van bitstreams moet de toestemming gevraagd worden aan de rechthebbende ‘Copy protected’ media kunnen het kopiëren of preserveren belemmeren. Het regelen van de rechten kan gecompliceerd worden als de content verschillende rechthebbenden heeft of de rechten van de software in handen zijn van een derde partij.
Figuur 9: juridische kwesties bij digitale bewaarstrategieën
Voor traditioneel archiefmateriaal bestaan er gevestigde juridische en institutionele kaders, wat in de meeste landen niet het geval is voor digitale documenten. Daarbij komt dat er meestal ook geen legale regelingen – lees: uitzonderingen & zijn bepaald voor archieven en bibliotheken (dit is bijvoorbeeld wel het geval voor het Koninklijk Belgisch Filmarchief, maar ook beperkt). De noodzakelijke toestemming moet dus nog gevraagd worden bij de houders van de auteursrechten. Alle twijfels kunnen uit de weg geruimd worden aan de hand van een licentie, voor zover de titularis van het auteursrecht identificeerbaar is en bereid een licentie af te sluiten. In andere gevallen kan het archief zich in sommige gevallen beroepen op de uitzondering voor wetenschappelijk onderzoek om een beschermd werk in de collectie op te nemen. Het lijkt onwaarschijnlijk dat een archief zich ooit voor een rechtbank zal moeten verantwoorden louter omdat het een werk opneemt in het archief. Het belang van de houder van een auteursrecht om een archief voor de rechter te slepen is vrij beperkt. Welke schade lijdt hij wanneer zijn werk geconserveerd wordt voor de toekomst? In welk opzicht verstoort de archivering de normale exploitatie van een werk? Het enig teer punt vormt de terbeschikkingstelling aan het publiek, aangezien dit eventueel wel de exploitatie van het werk in het gedrang kan brengen. Consultatie ter plaatse lijkt in elk geval tot de mogelijkheden te behoren, aangezien openbare uitlening expliciet buiten het monopolie van het auteursrecht valt, terbeschikkingstelling via het internet daarentegen ligt gevoeliger44. Soms wordt gekozen voor een pragmatische aanpak, als de rechthebbenden niet geïdentificeerd kunnen worden bijvoorbeeld. Er wordt in dergelijke gevallen een belangenafweging gemaakt tussen de belangen van de auteur (de exploitatierechten) en de belangen van het archief. Het eerder vermelde Internet Archive is een uitstekend voorbeeld van deze pragmatische aanpak. Dit archief verzamelt audio, video, software, teksten en websites die vrij beschikbaar gemaakt worden via het internet, tenzij de eigenaar aangeeft dat hij dit niet wenst. De bezoeker van de site moet zich aan de gebruiksvoorwaarden houden: het archief mag uitsluitend voor eigen studie en wetenschappelijke doeleinden gebruikt worden, bovendien moet de gebruiker alle toepasselijke wetten naleven. Strikt genomen gaat het hier om illegale kopies en illegale mededeling aan het publiek, maar omdat met ieders belangen rekening wordt
43
Schema op basis van Ayre, C., Muir, A., Right to Preserve?, Department of Information Science, Loughborough University. 2004. (http://www.lboro.ac.uk/departments/ls/disresearch/CLDP/DOCUMENTS/Final%20report.doc) 44 Dekeyser, H., Digitale Archivering: een juridische stand van zaken vanuit Belgisch perspectief, Deel 2: Auteursrecht, technische beschermingsmaatregelen en wettelijk depot, Antwerpen&Leuven, 2003. (http://www.antwerpen.be/david/website/nl/text_rapporten.htm)
91
gehouden, zijn er nog geen grote conflicten ontstaan45. De bestaande Open Acces en Open content&modellen bieden naar de toekomst toe zeker mogelijkheden om schemerzone uit te klaren (zie 1.4.3). In enkele landen werden reeds stappen ondernomen om uitzonderingen op te nemen in het auteursrecht. Uit het onderzoek van Michael Norris46 naar preservatieclausules in 25 landen, afgerond in juni 2004, kwamen enkele relevante initiatieven naar voren. • In Groot&Brittanië is er de Copyright, Designs and Patents Act van 1998,die stelt dat bibliotheken en archieven kopieën mogen maken om te preserveren of herstellen, van elk item, ook digitaal. Echter slechts in het geval dat de stukken eigendom zijn van de "permanent collection" en enkel "where it is not reasonably practicable to purchase a copy of the item". Deze lancunes werden onderzocht door het Copyright and Licensing for Digital Preservation Project (september 2002 – maart 2004), die mogelijke oplossingen voor de geïdentificeerde problemen aangaf47. • De US Digital Millennium Copyright Act van 1998 (DMCA)48 maakt het mogelijk voor publieke archieven om drie digitale kopieën te maken voor preservatie doeleinden en te kopiëren naar nieuwe formaten, maar enkel als de originele formaten gedateerd zijn. Tegelijk wordt echter het omzeilen van DRM bescherming en ‘reverse engineering’ verboden.De implicaties van de DMCA werden in 2003 onderzocht door Besek49. • Door de Canadian Copyright Act50 van 1997 kunnen archieven preservatiekopieën maken in andere formaten, "if the original is currently in an obsolete format or the technology required to use the original is unavailable". • Het auteursrecht in Australia51 van 1968 laat archieven toe kopieën te maken van documenten die beschadigd of in verval zijn, zonder vermelding van formaten. Digitale kopieën kunnen "[made] available online to be accessed through the use of a computer terminal installed within the premises of the library or archives". • In Nieuw Zeeland werd recent een verandering in de Copyright Act van 1994 voorgesteld52, om verheldering te brengen over de bestaande "technology&neutral" archiveringsuitzondering. Er wordt aanbevolen om dit te verduidelijken om digitale archivering door migratie of emulatie mogelijk te maken. • De database rechten in de lidstaten van de Europese Unie die de Europese richtlijn 96/9/EC betreffende de bescherming van databases hebben overgenomen maken het wettelijke gebruikers mogelijk om alles op een database toe te passen "which is necessary for the purposes of access to the contents of the databases and normal use of the contents by the lawful user" • De Europese richtlijn 2001/29/EG auteursrecht in de informatiemaatschappij bepaalt dat de Europese lidstaten een facultatieve uitzondering kunnen opnemen in het auteursrecht voor “de reproductie voor publiek toegankelijke bibliotheken, onderwijsinstellingen of musea, of door archieven die niet het behalen van een direct of indirect economisch of commercieel voordeel nastreven”, maar “die beperking of restrictie dient evenwel beperkt te blijven tot bijzondere gevallen welke onder het reproductierecht vallen. Die beperking of restrictie mag zich niet uitstrekken tot het gebruik in het kader van de onlinelevering van beschermde werken en ander materiaal (..). Het is derhalve wenselijk specifieke contracten en licenties te bevorderen die op een evenwichtige wijze deze instellingen begunstigen, evenals de doelstellingen die zij met deze verspreiding nastreven.” Er worden een aantal mogelijke uitzonderingen op het exclusief recht gegeven, waarvan slechts
45
Ibid. Norris, M., An International Survey of Archival, Preservation and Related Clauses in Copyright Law, 2004. (http://www.lboro.ac.uk/departments/ls/disresearch/CLDP/DOCUMENTS/Copyright%20survey.doc) 47 Ayre, C., Muir, A., Right to Preserve?, 2004. (http://www.lboro.ac.uk/departments/ls/disresearch/CLDP/DOCUMENTS/Final%20report.doc) 48 United States, 1998. The Digital Millennium Copyright Act of 1998: U.S. Copyright Office Summary. (http://www.copyright.gov/legislation/dmca.pdf) 49 Besek, J., 2003. Copyright issues relevant to the creation of a digital archive: a preliminary assessment. (http://www.clir.org/pubs/reports/pub112/contents.html) 50 Canada, 1997. Statutes Of Canada, 1997. C. 24 An Act to amend the Copyright Act, Second Session, Thirtyfifth Parliament, 45- 46 Elizabeth II. (http://laws.justice.gc.ca/en/C&42/) 51 Australia, 1968. Copyright Act 1968 (Act No. 63 of June 7, 1968 as amended in 2002). (http://clea.wipo.int/) 52 Tizard, J., Digital Technology and the Copyright Act 1994 : Policy Recommendations : Cabinet Paper, 2003. (http://www.med.govt.nz/buslt/int_prop/digital/cabinet/index.html) 46
92
een enkele verplicht is en twintig andere facultatief. De lidstaten kunnen zelf bepalen of ze die uitzonderingen al dan niet zullen opnemen in de nationale wetgeving. Geen enkele van de vermelde auteursrechtwetten laten echter toe om alle acties te ondernemen die nodig zijn voor de preservatie van gedigitaliseerde of digitale collecties. Bestaande uitzonderingen zijn beperkt in waarde, omdat ze slechts migratie of emulatie toelaten als de documenten in kwestie reeds verouderd of gedateerd zijn. Internationaal wordt verder onderzoek gevoerd en initiatief genomen: de Zweedse overheid heeft een decreet uitgevaardigd waarin de Koninklijke Bibliotheek gewettigd wordt om Zweedse websites te archiveren en de hele collectie publiek te ontsluiten53. De Franse overheid heeft een wet gestemd waarin gesteld wordt dat elke Franse website gearchiveerd moet worden. ‘The Joint Information Systems Committee’ (JISC) heeft ook een studie uitgevaardigd betreffende internet archivering in de Groot&Brittanië, EU , VS en Australië54. Er worden dus belangrijke signalen gegeven, maar er moet nog heel wat duidelijkheid komen vooraleer er kan sprake zijn van een systematisch en continu digitaal archiveringsbeleid. Ondanks of juist als gevolg van de manifestatie van Open Source en Open Content licenties, hebben enkele evoluties in de internationale wetgeving een verdere obstructie van digitale preservatie teweeg te brengen: de eerder vermelde bekrachtiging en bescherming van DRM systemen en de softwarepatenten. Vanuit de commerciële cultuursectoren is de druk om technische beveiligingsmaatregelen juridisch te beschermen de laatste jaren enorm opgevoerd. In hun visie moet de marktwerking het toetsingskader worden van het auteursrecht in plaats van andersom. De wetgever heeft door halsstarrig vast te houden aan bestaande wetten en zodoende het auteursrecht te drijven naar de hoogste mogelijke bescherming, alvast deze visie het voordeel van de twijfel gegeven. Het evenwicht tussen de rechten en de interesses van de auteur en die van het grote publiek is vervaarlijk aan het wankelen. Bovendien – maar dat is een ander verhaal – wordt de verhouding tussen het auteursrecht en het privacyrecht in een digitale omgeving door allerlei maatregelen en beperkingen wel erg fragiel. De rationaliteit van het recht op privacy kan immers doorgetrokken worden naar het toelaten van de consumptie van beschermde werken55. De Europese richtlijnen 2001/29/EG en vooral 2004/48/EC, omtrent de bekrachtiging van intellectuele eigendomsrechten (dient voor 29 april 2006 omgezet te worden) verbieden, net zoals US Digital Millennium Copyright Act, het omzeilen van technische beschermingsmaatregelen, ongeacht of de dader zich kan beroepen op een uitzondering van het auteursrecht. De lidstaten moeten er wel op toezien dat die beveiligingsmaatregelen geen onwenselijke gevolgen heeft voor de uitoefening van de uitzonderingen. Er worden momenteel nog discussies gevoerd rond privacykwesties, uitzonderingen en juridische standaardisering, maar de voorgestelde maatregelen zouden er in praktijk op neerkomen dat archiverende instellingen vaak geen andere keuze zullen hebben dan een licentie af te sluiten met de rechthebbenden. In sommige gevallen, wanneer content bijvoorbeeld beperkt is in tijd of afhankelijk is van specifieke hardware, is het probleem vanuit preservatiehoek nog wat complexer. Momenteel woedt op Europees niveau een hevig debat rond de legalisering van software patenten. De European Patent Office (EPO) is momenteel aan het lobbyen om in navolging van de Verenigde Staten en Japan ook in Europa deze patenten toe te passen. Op 18 mei 2004 is door de Europese Commissie een voorstel goedgekeurd, dat nog door het Europees Parlement moet worden gevaloriseerd. Het voorstel werd onthaald op een storm van protest. Het fundamentele probleem met software patenten is dat ze, in tegenstelling tot traditionele patenten niet gelden voor fysieke en concrete uitvindingen, maar voor ideeën. Een concept voor software is meestal heel breed en triviaal, zoals bijvoorbeeld “Organizing and displaying photographs based on time” & waar op 29 juli 2004 effectief een patent voor toegekend werd door de Amerikaanse Patent Office. De implementatie ervan vereist geen productielijnen, integendeel: een paar degelijke programmeurs kunnen in een beperkte tijd software applicaties ontwikkelen en zo alle verdere ontwikkelingen en vernieuwingen die onder dat bepaald concept
53
New decree for Kulturarw3, 2002:287 (http://www.kb.se/Info/Pressmed/Arkiv/2002/020605_eng.htm) Charlesworth, A., Legal issues relating to the archiving of internet resources in the UK, EU, USA and Australia: a study undertaken for the Jisc and Wellcome Trust. Jisc; Wellcome Trust, 2003. (http://www.jisc.ac.uk/uploaded_documents/archiving_legal.pdf) 55 Thijm, C.A., Privacy vs. Auteursrecht in een Digitale Omgeving, ITeR, Nationaal Programma Informatietechnologie en Recht, den Haag, 2001. (http://www.ivir.nl/publicaties/overig/alberdingk_thijm/ITeR& privacy&v&auteursrecht.pdf) 54
93
huizen, blokkeren56. Software patenten hebben vooral zware gevolgen voor de Open Source gemeenschap, maar ook voor elke kleine ontwikkelaar of gebruiker van software en het internet. Het gebruik van simpele JPEG bestanden bvb. kan een inbreuk op patenten betekenen, aangezien enkele JPEG extensies en codeerprincipes reeds gepatenteerd zijn. Na een agressieve campagne van de patenteigenaar om zijn monopolierechten te claimen, reageerde het JPEG Consortium met het statement dat JPEG niet langer een standaard is57. Ook voor de archiefwereld staan de sofware patenten in de weg van een efficiënte digitale preservatiepraktijk. Het is niet zozeer het bestaan va de patenten die een rol speelt, maar de voorwaarden die de patenteigenaar kiest op te leggen, die de kosten voor het gebruik van bepaalde formaten of tools kunnen opdrijven en de ontwikkeling van encoders en decoders kan bemoeilijken. De kerncomponenten van nieuwe standaarden zoals JPEG2000 en MPEG4 zijn geassocieerd met zogenaamde ‘pools’ die licenties bieden in naam van een aantal patenteigenaars. Dit simplificeert het licentieproces en verkleint de kans dat het ene patent agressiever zal worden uitgebuit dan de andere. Maar met de uitbreiding van formaten kunnen wel telkens nieuwe patenten worden bijgevoegd, zodat het risico bestaat dat die ‘pool’ langer bestaat dan de levensduur van de bevattende patenten. De ontwikkeling van nieuwe tools (voor emulatie bvb.) wordt op die manier wel heel moeilijk.
2.7. Digitale archivering in een internationaal perspectief 2.7.1. Nationale initiatieven Uit een studie naar nationale digitale archiveringsinitiatieven, in opdracht van het NDIIPP (National Digital Information Infrastructure and Preservation Program) van de Library of Congress58, blijkt dat er in geen enkele van de onderzochte landen een enkel nationaal initiatief bestaat, laat staan een ultieme oplossing. In de plaats zijn er verschillende afzonderlijke institutionele missies die uitgebreid worden naar het digitale domein, in sommige gevallen gecoördineerd door overkoepelende instellingen, zoals de Digital Preservation Coalition in Groot& Brittannië, het Digitale Erfgoed Nederland (DEN) en vooral het NDIIPP programma59. Ongeacht de vele verschillen in aanpak en visie, wijst Neil Beagrie in zijn rapport op enkele internationale tendensen: • Het bewustzijn van de kwesties rond digitale preservatie in het publiek, het beleid en de betrokken instellingen is laag. • Het is gemakkelijker om financiering te verkrijgen voor digitalisering voor toegang dan voor preservatie. De langtermijn behoeftes worden overschaduwd door het directe nut van ontsluitingsinitiatieven. In veel landen worden de nadruk gelegd op kortetermijn financiering, terwijl verhogingen van structurele subsidiëring noodzakelijk zullen zijn om digitale collecties te archiveren. • Er wordt op verschillende niveaus samengewerkt tussen instellingen, vooral op het vlak van onderzoek. Collaboratie en coördinatie van collectiebeleid blijkt moeilijker. Dergelijke overeenkomsten werken het best als de verschillende instituties kunnen terugvallen op hun eigen initiatieven en expertise en als alle partijen een win&win situatie kunnen bekomen. Het is zowel belangrijk om in&house expertise te ontwikkelen als om externe ervaring in te roepen. • Veranderende distributiepatronen. Steeds meer instellingen hebben geen fysieke kopieën meer, maar zorgen via digitale weg voor toegang. Het vertrouwen in de toekomstperspectieven is onzeker. • Een veranderende tijdshorizon voor preservatie. In het digitale domein moeten archiefinstellingen een veel nauwere relatie aangaan met producenten en distributeurs dan voordien noodzakelijk was. De selectie is veel
56
zie http://swpat.ffii.org/ http://www.softwarepatenten.be/ http://eff.org/Patent/ 57 Meer horrorverhalen op de website van de Foundation for a Free Information Infrastructure: http://www.ffii.org/) 58 Beagrie, N., National Digital Preservation Initiatives: An Overview of Developments in Australia, France, the Netherlands, and the United Kingdom and of Related International Activity. Washington, D.C.: Council on Library and Information Resources and Library of Congress, 2003. 51p. (http://www.clir.org/pubs/reports/pub116/contents.html) 59 http://www.digitalpreservation.gov/
94
•
•
• •
•
moeilijker omdat het vroeger moet gebeuren, zonder het voordeel van de tijd, die het historische belang van documenten en trends verheldert. Zoals ook uit vorig hoofdstuk blijkt, heeft geen enkel onderzocht land eenduidige juridische oplossingen voor het digitaal archiveren. De auteursrechten hebben in het algemeen aan belang gewonnen en de economische waarde van de intellectuele rechten is gevoelig gestegen. De commerciële behoefte om die rechten te beschermen kan dus in de weg staan van de noodzakelijke juridische uitzonderingen om digitaal te archiveren en ontsluiten. Globalisatie. Steeds meer preservatie initiatieven worden genomen buiten het nationale kader. Ook de IT industrie werkt op een globale schaal en speelt in op verschillende sectoren. Er zijn dus meer substantiële gemeenschappelijke kenmerken en noden tussen instituties en sectoren, wat internationale samenwerking meer potentieel bezorgt. Explosie van informatie. Het volume en de breedte van informatie vergroten drastisch. Digitale documenten hebben de traditionele documenten niet vervangen, zodat er een continue aangroei is van beiden. In de digitale omgeving is het niet langer nodig om verschillende kopieën te maken om documenten te publiceren. Een enkele kopie kan via een netwerk toegankelijk gemaakt worden voor iedereen met een PC en een internetconnectie. De grenzen tussen een ‘document’, ‘publicatie’ of ‘archiefkopie’ zijn vervaagd. Private verzamelaars spelen vaak een vitale rol in de preservatie van materiaal, meestal efemere media die niet gecureerd zijn in hedendaagse collecties, bijvoorbeeld het eerder aangehaalde Internet Archive of het bewaren van vroege computergames en emulators. De uitdagingen die digitale preservatie met zich meebrengt en de mechanismen tot bescherming van het auteursrecht kunnen dit in de toekomst vermoeilijken. Dit kan resulteren in een grotere verantwoordelijkheid bij institutionele selecties of het ontwikkelen van instrumenten ter ondersteuning van persoonlijke archieven.
Deze tendensen zullen op termijn een grote invloed hebben op verscheidene instellingen en sectoren en kunnen een ingrijpend effect hebben op de individuen en de maatschappij waarin ze fungeren. Digitale preservatie, aldus Beagrie, is niet enkel een kwestie van het cultureel erfgoed. Op lange termijn zal het ook het karakter van de informatiemaatschappij beïnvloeden. Overheden stimuleren dan ook wereldwijd ontwikkelingen naar de zogenaamde ‘eCultuur’, maar terwijl veel aandacht wordt besteed aan digitale ontsluiting en digitale werkprocedures, worden lange termijn kwesties over het hoofd gezien. Het nationale digitaliseringprogramma in Nederland is hier een uitzondering op. Sinds het verschijnen in 2002 van duidelijke, maar erg ambitieuze beleidslijnen, is het erfgoedveld in Nederland nagenoeg volledig gemobiliseerd om een digitale inhaalslag aan te vatten, waarbij vooral het idee van ‘interoperabiliteit’ en ‘samenwerking’ als fundamenteel gezien wordt. Belangrijke impulsen werden gegeven door de projecten Het Geheugen van Nederland, dat zorgt voor de gecentraliseerde digitalisering en ontsluiting van verschillende collecties van cultureel erfgoed en de ‘Cultuurwijzer’ van het DEN (Digitaal Erfgoed Nederland). Interoperabiliteit betekent idealiter dat de verschillende systemen & gegevensstructuren, thesauri, fysieke koppelingen, bandbreedtes, transactiesnelheden, veiligheid, privacy en intellectuele eigendomsrechten, metadata, software, …& op elkaar afgestemd worden, maar dat gaat echter steeds gepaard met een gering verlies aan zichtbaarheid, dat samen met het gevoel van autonomieverlies, het grootste obstakel vormt. In een studierapport van het Telematica Instituut wordt daarom een daadkrachtige overheidsaansturing en een goed gecoördineerde voorlichtings& en trainingscampagne aanbevolen, om een optimale interoperabiliteit te verkrijgen die het karakter en de behoeftes van gebruikers, aanbieders en subsidiegevers zo goed mogelijk integreert. Seb Herman besluit in zijn studierapport Digitalisering van cultureel erfgoed in Nederland dat “Nederland redelijk ver staat wat betreft het ontwikkelen van een nationaal sturend beleid en het opstarten van verscheidene overkoepelende of integreerbare digitaliseringinitiatieven. Toch is de kloof tussen beleid en onderzoek enerzijds en de dagelijkse problematiek van het praktijkveld anderzijds nog lang niet gedicht, en is er van een goed gesmeerde en gestroomlijnde nationale digitaliseringinspanning nog geen sprake.”60
60
http://www.culturelestudies.be/student/portal/cultureelerfgoed/index.htm
95
2.7.2. Europees en internationaal onderzoek naar preservatie van audiovisuele media en digitale archivering ”Europe’s cultural and memory institutions are facing very rapid and dramatic transformations.These transformations are not only due to the use of increasingly sophisticated technologies, which become obsolete more and more rapidly, but also due to a re-examination of the role of modern public institutions in today’s society and to related fast changing user demands. These trends affect all the functions of the modern cultural institution, from collection management and scholarly study, through restoration and preservation, to providing new forms of universal and dynamic access to their holdings.”61 Digicult rapport, 2002 Op internationaal gebied neemt UNESCO62 (‘United Nations Educational, Scientific and Cultural Organization’) een coördinerende functie in met betrekking tot behoud en beheer van cultureel erfgoed. In november 2001 werd de European Convention for the protection of Audiovisual Heritage boven het doopvont gehouden, in Oktober 2003 was het de beurt aan het Charter on the Preservation of Digital Heritage. Beide documenten werden opgemaakt als declaraties van principes, gebaseerd op een consensus. De opgestelde richtlijnen zijn niet bindend voor de lidstaten maar zijn voornamelijk bedoeld om initiatieven te inspireren en ondersteunen. Er wordt aangegeven dat niet alle documenten bewaard kunnen worden maar dat het verlies van erfgoedmateriaal “would waste much of the economic, social, intellectual and cultural potential that is inherent in ongoing use of these resources. It would also deny posterity the opportunity to build on current knowledge, and offer the future a distorted view of history.”63 Onder auspiciën van UNESCO wordt sinds 1983 ook het JTS Symposium georganiseerd, een internationale vergadering voor alle specialisten op het gebied van audiovisueel erfgoed, cinema en klank. De zeven organiserende ledenorganisaties zijn de op dit gebied internationaal hoogst aangeschreven instellingen, die verzameld zijn in het CCAAA (Co-ordinating Council of Audiovisual Archives Associations)64 platform, dat de taak op zich heeft genomen om beleidsvoorbereidend werk te verrichten in het belang van audiovisuele archivering. • AMIA & Association of Moving Image Archivists65 AMIA is sinds 1991 de grootste non&profit professionele ledenorganisatie voor individuen en organisaties die actief zijn op het gebied van preservatie van bewegend beeld. De activiteiten – o.a. publicaties, educatieve programma’s, conferenties, ..& zijn gericht op samenwerking op het vlak van acquisitie, preservatie en exhibitie, het ontwikkelen en promoten van standaarden en het organiseren en implementeren van nationale preservatiestrategieën en –initiatieven in de V.S.. • FIAF & International Federation of Film Archives 66 Het FIAF verenigt de international meest vooraanstaande instellingen in het veld van audiovisueel erfgoed en is gericht op het verzamelen, conserveren en vertonen van bewegend beeldmateriaal. Dit omhelst o.a. de ethische en juridische context, het promoten van filmcultuur en –studie en het stimuleren van samenwerking tussen de leden "to ensure the international availability of films and documents". • FIAT/IFTA & Internationale des Archives de Télévision67 Een internationale organisatie opgericht als een instrument om samenwerking te bekomen tussen omroepen en nationale audiovisuele archieven en bibliotheken, voor preservatie en exploitatie van bewegend beeld en klankmateriaal en geassocieerde documentatie.
61
The DigiCULT Report - Technological landscapes for tomorrow’s cultural economy - Unlocking the value of cultural heritage, Executive summary, Luxembourg: Office for Official Publications of the European Communities, 2002, p.5. (http://www.medicif.org/events/MEDICI_events/Www10/DigiCult%20findings.htm) 62 http://portal.unesco.or 63 http://www.nla.gov.au/ntwkpubs/gw/61/p04a01.html 64 http://www.ccaaa.org/ 65 http://www.amianet.org/ 66 http://www.fiafnet.org 67 http://www.www.fiatifta.org/
96
• IASA & International Association of Sound and Audiovisual Archives68 Het IASA functioneert als een medium voor internationale samenwerking tussen archieven die klank& en audiovisuele documenten bewaren, op het gebied van acquisitie en uitwisseling, documentatie en metadata, toegang en distributie, rechten, conservatie en preservatie. IASA is lid van het coördinerende Council of Audiovisual Archives Associations (CCAAA), een internationale alliantie die de belangen van overheden en internationale instellingen wil representeren. • ICA & International Council on Archives69 Een professionele organisatie voor de internationale archiefgemeenschap, gericht op het promoten van de preservatie, ontwikkeling en gebruik van het archieferfgoed. • IFLA & International Federation of Library Associations and Institutions 70 De international leidende instelling die de belangen van de bibliotheken en informatieservices representeert. • SEAPAVAA & Southeast Asia-Pacific Audiovisual Archive Association71 Een forum voor kwesties rond preservatie en ontsluiting van audiovisueel erfgoed, gericht op de regio Zuidoost Azië. Betreffende digitale archivering dragen vooral het in de V.S. gebaseerde InterPARES (The International Research on Permanent Authentic Records in Electronic Systems)72 en het aan The National Library of Australia verbonden PADI ( Preserving Access to Digital Information)73 in belangrijke mate bij tot theoretische en methodologische knowhow. Het consortium International Internet Preservation Consoritum richt zich specifiek op de preservatie van websites74. In Europa verzorgt het ECPA (European Commission on Preservation and Access)75 een coördinerende functie als platform gericht op overleg en samenwerking van bibliotheken, archieven en internationale instellingen en het sensibiliseren van overheden en gebruikers. Een eerste stap met betrekking tot de coördinatie van digitaliseringsprogramma's en beleid binnen de EU&lidstaten werd ondernomen in het kader van eEurope op de Europese top van Ministers in Feira (juni 2000). Dit werd in april 2001 onder Zweeds voorzitterschap uitgewerkt tot de zogenaamde Lund&afspraken76, die op hun beurt hebben geleid tot de oprichting van een Europees ministerieel netwerk, in de schoot van IST (Information Society Technologies programme) programma van de Europese commissie, Minerva en later MinervaPLUS 77 , gericht op het discussiëren, correleren en harmoniseren van activiteiten in de digitalisering van culturele en wetenschappelijke content. Het uiteindelijke doel is het ontwikkelen van een Europees platform voor het uitvaardigen van adviezen en richtlijnen over digitalisering, metadata, ontsluiting en conservering coördineren van nationale programma’s. Binnen datzelfde IST programma & vooral in het kader van het Fifth Framework Programme (1998&2002) en het Sixth Framework Programme (2002&2006) & en andere programma’s onder de vleugels van de Europese commissie werden onderzoeksprojecten gesubsidieerd die, zowel voor digitale archivering als preservatie van audiovisuele media tot belangrijke en invloedrijke resultaten hebben geleid78. • AURORA (AUtomated Restoration of ORiginal film and video Archives) | 1994 – 1999 voerde onderzoek naar tools om televisie archieven te restaureren. • BRAVA (BRoadcast Archives trough Video Analysis) | 2000 & 2002 Het vervolg op Aurora, gericht op de ontwikkeling van tools voor digitale restauratie van grote broadcastarchieven (video en film), voor herexploitatie doeleinden.
68
http://www.iasa&web.org/ http://www.ica.org/ 70 http://www.ifla.org 71 http://www.geocities.com/seapavaa/ 72 http://www.interpares.org 73 http://www.nla.gov.au/padi/ 74 http://netpreserve.org 75 http://www.knaw.nl/ecpa/ 76 http://www.cordis.lu/ist/ka3/digicult/lund_principles.htm 77 http://www.amitie.it/minerva 78 vanaf oktober 2004 lanceert Euclid International een on&line databank van projecten ondersteund met Europese middelen. (http://www.cupid.culture.info) 69
97
•
•
•
•
•
•
Het project werd gecoördineerd door het Franse INA (Institut National de L'Audiovisuel), in samenwerking met andere omroepen (RTP, RAI, BBC), universiteiten en expertisecentra op het gebied van audiovisuele media (Snell&Wilcox en VidiPax). PRESTO79 (Preservation Technology for European Archives) | 2000 & 2003 Aanleiding voor het project waren de grote conserveringsachterstanden bij audiovisuele archieven en de daaraan verbonden technische, operationele en financiële problemen. Binnen het project werden gereedschappen ontwikkeld die het mogelijk maken kostenbesparend en effectiever verouderde audio& en videoformaten te digitaliseren. De gereedschappen hebben betrekking op alle aspecten van dit proces: selectie, handling, conversie, distributie, toegangsautorisatie en lange&termijn opslag. De bedoeling was onderdelen van de verschillende ‘conserveringsketens’ te optimaliseren of waar mogelijk te automatiseren. In PRESTO hadden drie grote AV&archieven, BBC, INA en RAI de leiding. Zes andere AV&archieven (SWR, NRK, SVT, YLE, ORF en Beeld en Geluid) namen deel als lid van de Broadcast Archive User Group, oftewel de ‘BAUG’. In 2001 werd een uitgebreid onderzoeksrapport vrijgegeven over ‘existing and emerging technologies’80. Diamant81 (Digital Film Manipulation System) | 2000 –2002 Diamant onderzocht en ontwikkelde digitale restauratietechnieken voor film, die momenteel wereldwijd in prakrijk gebruikt worden, bijvoorbeeld voor de restauratie van Metrolopis en een recent ontdekte print van een vroege John Ford Western. AMICITIA82 (Management Integration of Cultural heritage In The Interexchange between Archives) | 2000 – 2002 Drie Europese omroepen (SWR, ORF en BBC) werkten samen met het Nederlands archief Beeld en Geluid en drie technische partners aan de bouw van een asset management systeem dat het mogelijk maakt met één zoekvraag snel en gelijktijdig de vier deelnemende archieven te doorzoeken en AV&materiaal uit deze collecties opnieuw te gebruiken. Een van de doelstellingen van dit project was het faciliteren van toegang tot elkaars audiovisuele collecties en het uitwisselen van gedigitaliseerde content, o.a. via een veeltalige thesaurus. Aangezien voor hergebruik een correcte en uitgebreide registratie van auteursrecht een eerste vereiste is, werd rechtenmanagement een speerpunt. OAF83: Open Archives Forum | 2001 & 2003 Een Europees informatie& en disseminatienetwerk rond open archieven en OAI (Open Archives Initiative) in het bijzonder. Het doel is om de clustering van verschillende actieve of geïnteresseerde IST en nationale initiatieven te faciliteren. Er werd o.a. een informatieve website ontwikkeld en vergelijkende studies van technische en organisationele kwesties ondernomen. De partners zijn de University of Bath&UKOLN (U.K.), Instituto di Scienza e Tecnologie dell'Informazione &CNR (Italië) en de Computer& and Media Service (Computing Center) van de Humboldt University (Duitsland). ECHO84 (European Chronicles On Line) | 2000 – 2004 Doelstelling van ECHO is het faciliteren van samenwerking tussen verschillende audiovisuele archieven door middel van een gezamenlijke zoekstructuur. Het geselecteerde materiaal zal via een webinterface toegankelijk zijn. Voor het automatisch extraheren van annotaties uit de content wordt gebruik gemaakt van een combinatie van spraakherkenning, taalinterpretatie en beeldherkenning. Voordat ECHO de content kan analyseren dient deze gedigitaliseerd te worden. Naast verschillende technische en academische organisaties participeren vier nationale audiovisuele archieven: Beeld en Geluid (Nederland), Memoriav (Zwitserland), Institut National de l'Audiovisuel (INA; Frankrijk) en Istituto di Luce (Italië). BIRTH85 | 2003 – 2006 Diverse televisie&archiefdocumenten die tot op heden moeilijk toegankelijk zijn doordat de dragers verouderd zijn of documentatie incompleet is, worden op een geavanceerde web&portal voor het eerst bijeen gebracht. Gerichte diensten voor omroepprofessionals, academici en het grote publiek worden op de portal ingezet om de uiteenlopende bronnen – ook foto’s, academische teksten, programmagidsen, uitzendschema’s en
79
http://presto.joanneum.ac.at beschikbaar op http://presto.joanneum.ac.at 81 http://diamant.joanneum.at 82 http://www.amicitia&project.de 83 http://www.oaforum.org/ 84 http://pc&erato2.iei.pi.cnr.it/echo. 85 http://www.birth&of&tv.org 80
98
•
•
•
•
•
•
•
krantenartikelen & op een dynamische wijze te presenteren.BIRTH wordt financieel ondersteund door het MEDIA PLUS programma van de Europese Commissie. Onder leiding van het in Oostenrijk gevestigde Joanneum Research zullen instellingen uit zes Europese landen het meest waardevolle materiaal uit hun collecties digitaliseren: BBC, Sound & Vision, ORF, RTBF, Südwestrundfunk en Noterik Multimedia. FIRST86 (Film Restoration and Conservation Strategies) | 2002 – 2004 FIRST wil de applicaties van digitale technieken voor het filmerfgoed onderzoeken, bestaande technieken evalueren, nieuwe onderzoeksvelden aanreiken, bijhorende economische, technische en structurele scenario’s schetsen en ‘best practices’ opstellen voor conservering, restauratie en distributie. Het consortium bestaat uit ACE (Association des Cinémathèques Européennes), Belgacom, RTBF, INA, ORF en EMF (European Multimedia Forum) DigiCULT87 | 2002 – 2004 Digicult zorgt voor een “technology watch” met betrekking tot de digitalisering van culturele en wetenschappelijk erfgoed. DigiCULT zal de huidige en toekomstige trends in verschillende technologiedomeinen volgen en analyseren en toekomstig onderzoek stimuleren. Resultaten en aanbevelingen worden vrijgegeven en gedistribueerd via Technology Watch Reports en nieuwsbrieven. ERPANET88 (Electronic Resource Preservation and Acces Network) | 2002 – 2004 Europees Consortiumgericht op het ontwikkelen van ‘best practices’ en een centralisering van kennis op het vlak van digitale preservatie van cultureel erfgoed en wetenschappelijke objecten. De partners zijn musea, bibliotheken, archieven, IT en software industrie, onderzoeksinstituten, overheidsinstellingen, creative industries, commerciële sectoren SCULPTEUR89 (Semantic and content-based multimedia exploitation for European benefit) | 2002 _ 2005 Dit project is gericht op de ontwikkeling van technologie en expertise om verschillende culturele archieven te beheren en ontsluiten. Het wordt gestuurd door tien partners, zowel uit de industriële, academische, R&D en culturele sectoren. De focus ligt op 3D en semantische netwerken. PORTAL (Production Organised Research Tool for Audio-visual Libraries ) en NODAL90 Het doel van Portal het spin&off project NODAL is het ontwikkelen van een pan&Europees netwerk die Europese audiovisuele archieven linkt in een gemeenschappelijke e&commerce platform: filmlibrary.tv. Partners zijn o.a. Belgavox, RTBF, RTL, ORF, INA en andere, technische partners. PRESTOSPACE91 | 2004 – 2007 Dit project bouwt verder op de resultaten van een groot deel van de vernoemde initiatieven en beoogt "Standardised Practices for Audiovisual Contents in Europe” en een “integrated solution for Audio&visual preservation and access”. Het objectief is om technische oplossingen en geïntegreerde systemen te ontwikkelen voor digitale preservatie van alle types van audiovisuele collecties, voor conservering, restauratie, opslag, archiefmanagement, inhoudsbeschrijving, distributie en toegang. Ook worden economische modellen uitgewerkt. Het principiële doel is het wegbereiden van zogenaamde “conserveringsfabrieken” die services kunnen leveren voor het behoud, beheer en ontsluiting van collecties. Dit ambitieuze project wordt voornamelijk voortgestuwd door de BBC, INA, RAI, 7 andere AV&archieven en instellingen, 15 Europese technische partners uit de commerciële IT sector en 6 Europese universiteiten EPOCH92 (European Research Network on Excellence in Processing Open Cultural Heritage) | 2004 &2008 EPOCH is een netwerk waar momenteel 85 Europese culturele instellingen (universiteitsdepartementen, onderzoekscentra, musea, commerciële bedrijven, ..) hun krachten bundelen om de kwaliteit en efficiëntie van het gebruik van informatie en communicatietechnologie voor het cultureel erfgoeddomein te verbeteren. Het netwerk zal werken aan de interdisciplinaire integratie van onderzoeksinitiatieven in vijf domeinen: - fieldrecording en datacapture - Metadata en standaarden - Reconstructie and Visualisatie
86
http://www.film&first.org http://www.digicult.info 88 http://www.erpanet.org/ 89 http://www.sculpteurweb.org 90 http://www.filmlibrary.tv 91 http://www.prestospace.org/ 92 http://www.epoch&net.org/ 87
99
- Onderwijs en communicatie van erfgoed - Duurzaamheid van erfgoedprojecten Belgische partners zijn Axell Communication scrlCulture, Heritage & Development – International, Ename Center for Public Archaeology and Heritage Presentation, Instituut voor het Archeologisch Patrimonium, het Sagalassos department van de K.U.L., de afdeling Monumenten en Landschappen van het Ministerie van de Vlaamse Gemeenschap en Virtual and Augmented Reality Technologies NV
2.8 Interoperabiliteit Zoals blijkt uit vorig hoofdstuk is niet enkel tussen de toenadering tussen de cultuursector en de IT industrie belangrijk om de problematiek rond digitale preservatie op te lossen, maar ook de relatie tussen de verschillende archiverende (en ontsluitende) instellingen. De uitbouw van overleg& en samenwerkingsmodellen kan leiden tot meer efficiëntie en slagkracht: een uitwisseling van expertise, een centralisatie van middelen en infrastructuur, een kostendeling of &verlaging. Interoperabiliteit tussen archieven komt uitgebreid aan bod in het toonaangevende OAIS referentiemodel (zie 2.2.1)93. Er wordt een onderscheid gemaakt tussen vier conceptuele modellen. 1. Onafhankelijke archieven Een onafhankelijk archief dient een enkele specifieke gebruikersgroep en het beleid is volkomen aangepast aan de behoeftes van die gebruikers, al dan niet met distributiemogelijkheden. 2. Coöpererende archieven Op een minimaal niveau bestaat de mogelijkheid dat archieven informatie uitwisselen.
Ing
Acc
OAIS
Ing
Acc
OAIS
Figuur 10: OAIS model, samenwerkende archieven met een wederzijds uitwisselingsovereenkomst. (Ing=Ingest, Acc=Acces)
Dit houdt niet noodzakelijk in date er gemeenschappelijke methodes zijn voor ontsluiting en disseminatie. Een hoger niveau van samenwerking kan bereikt worden als er gemeenschappelijke ontsluiting& en ingestmethodes worden ontwikkeld:
93
http://ssdoo.gsfc.nasa.gov/nost/isoas/
100
Method B
Ing
Acc
Method A
OAIS Adm
Adm
Adm
Consumer
Producer Method B
Ing
Acc
Method A
OAIS Adm
Adm
Adm
Figuur 11: OAIS model, samenwerkende archieven met gestandaardiseerde inname& en toegangsmethodes. (Ing=Ingest, Acc=Acces, Adm=Administration)
3. Federatieve archieven Deze vorm van samenwerking zou het mogelijk kunnen maken om informatie uit de verschillende archieven te vinden via een enkele zoeksessie, via een gemeenschappelijk cataloogmanagement. Die activiteit kan beperkt zijn tot een zoektool of het kan een gemeenschappelijke disseminatie zijn. Hier zijn verschillende digitale niveaus te onderscheiden: • • • • • • •
Syntax en datastructuren (bvb. XML) Toegangsmechanismes (bvb. WSDL94) Protocols (bvb. SRW95) Taal van de query (bvb. CQL96) Semantiek van de velden (bvb. Dublin Core) Semantiek van de content (bvb. AAT97) Zoekmogelijkheden (bvb. contentanalyse op basis van vorm, kleur, textuur)
94
WSDL (Web Services Description Language) beschrijft web services met XML. SRW (Search/Retrieve Webservice) is een op XML gebaseerd protocol, ontwikkeld om laagdrempelige zoekopdrachten en andere informatieontsluiting via het internet mogelijk te maken. Zie http://www.loc.gov/z3950/agency/zing/srwu/ 96 CQL (Common Query Language) is een formele taal om queries te representeren voor ontsluitingssystemen zoals webindexen, bibliografische catalogen, museumcollecties etc. zie http://zing.z3950.org/cql/intro.html 97 de Art & Architecture Thesaurus 95
101
Dissemination Information Package (optional)
Local Consumer
Acc
Acc
Ing
Global Consumer
Acc DM
Acc Ing
Ing
Common Catalogue
OAIS 1 Adm
Acc
OAIS 2 Adm
DM
Acc Adm
Acc
Dissemination Information Package (optional)
Local Consumer
Figuur 12: een OAIS federatie gebruik makend van een gemeenschappelijke catalogus. (Ing=Ingest, Acc=Acces, Adm=Administration, DM= Data Management)
4. Archieven met gedeelde functionele resources Het laatste conceptuele model heeft de hoogste graad van interoperabiliteit en laat het gemeenschappelijk gebruik van infrastructuur of informatiebronnen toe. Management ~ OAIS 1
Producer
Producer
Administration
Ingest
Access
Consumer
Access
Consumer
Archival Storage & Data Management Ingest
~ OAIS 2
Administration
Figuur 13: OAIS model, archieven met gedeelde ressources.
Het uitbouwen van dergelijke modellen in de praktijk is gebaseerd op onderzoek naar enerzijds gemeenschappelijke behoeftes, anderzijds gemeenschappelijke oplossingen. Die kunnen op verschillende
102
niveaus, in verschillende mate worden ingebouwd. In de Digicult rapporten van 200398 wordt er in het licht van de huidige en toekomstige mogelijkheden voor kennisuitwisseling een grote mate van interoperabiliteit aanbevolen, vooral op het gebied van digitale ‘asset management’ systemen, semantische systemen en ontsluiting van informatie voor educationele en onderzoeksdoeleinden via het internet. De pertinente vraag is hoe verschillende informatie, heterogeen in inhoud, vorm en structuur, kan samengebracht en geharmoniseerd worden in een transparant model. Het eerder besproken OAI (Open Archives Initiative) is zo’n model, die het technisch mogelijk maakt om, platform& en gegevensonafhankelijk, informatie met betrekking tot in databases beheerd cultureel erfgoed online aan te bieden. Dit model is echter vooral toepasbaar voor collecties met een groot aantal, relatief simpele en statische documenten. Het DEN (Digitaal Erfgoed Nederland) bouwt bijvoorbeeld op basis van het OAI (mhp) – Metadata Harvesting Protocol & aan een nationale infrastructuur voor het sector& en instellingsoverstijgend toegankelijk maken van informatie over cultureel erfgoed99. Het eerder besproken semantische web (zie 1.4.4.2) biedt ook perspectieven voor interoperabiliteit, vooral dan voor meer complexere objecten. Dit wordt onder andere gebruikt door het CIDOC Conceptual Reference Model (CIDOC CRM)100, waarmee impliciete en expliciete concepten en relaties binnen cultureel erfgoed documentatie beschreven worden. (zie 4.6.9).
Figuur 14: Het OAI project van DEN
98
http://www.digicult.info/textonly/publications.php http://www.den.nl/projecten/oai.html 100 http://cidoc.ics.forth.gr 99
103