FEDERAAL WETENSCHAPSBELEID
DWTI
REF:
DIENST VOOR WETENSCHAPPELIJKE EN TECHNISCHE INFORMATIE
Juni 2004
polisti\spidoc\doc\digi preserv\report_n
INFORMATIENOTA
DIGITALE BEWARING Document opgesteld door: ELENA PHALET De federale regering keurde eind april het voorstel van de Minister van Wetenschapsbeleid goed om een tienjarig digitaliseringsplan te ondernemen voor het wetenschappelijk en cultureel patrimonium van de Federale Wetenschappelijke Instellingen (FWI’s) en het Koninklijk Belgisch Filmarchief (KBF). Het totale budget zal 150 miljoen euro bedragen. Op basis van een voorbereidende studie die de te digitalizeren objecten inventariseert en de grote lijnen van een digitaliseringsplan uitzet, stelde het begeleidingscomité en de directeurs van de FWI’s en het KBF in maart 2003 een eindrapport op waarin niet alleen het belang wordt benadrukt van het digitaliseringsproces, maar ook van het bewaren van digitale objecten (digitale kopieën van analogische objecten of "born digital") op lange termijn. Voor dit laatste probleem, en de repercussies ervan op juridisch, organisationeel, technologisch en conceptueel gebied, zijn er op dit moment geen definitieve oplossingen. Deze grote uitdaging voor de toekomst van de kennismaatschappij wordt door alle experten onderkend (zie bijvoorbeeld de conclusies van het DigiCULT-verslag dat in 2002 aan de Europese Commissie werd overgemaakt) en de Europese Raad roept in de resolutie van 25 juni 2002 de Commissie en alle lidstaten op een voluntaristisch beleid te ontwikkelen inzake bewaring van digitaal cultuur en patrimonium. Deze informatienota geeft een overzicht van de stand van zaken van het onderzoek in deze materie, en van goede praktijken, ervaringen, aanbevelingen, … die voortkomen uit de veelheid van projecten, experimenten en initiatieven die op dit moment binnen Europa en over de hele wereld worden gevoerd. Een lijst met de belangrijkste informatieve bronnen werd opgemaakt voor de betrokken medewerkers van de FWI’s en het KBF. Nota nagelezen door J. Moulin. Voornaamste bronnen • BIBNUM (Département de la bibliothèque numérique de la Bibliothèque nationale de France), http://bibnum.bnf.fr/ • DigiCULT (Technology Challenges for Digital Culture), http://www.digicult.info/pages/index.php • Digitale Duurzaamheid, http://www.digitaleduurzaamheid.nl/home.cfm • PADI (Preserving Access to Digital information), http://www.nla.gov.au/padi/ • PRISM (Preservation, Reliability, Interoperability, Security, Metadata), http://www.prism.cornell.edu/ • RLG (the Research Libraries Group), http://www.rlg.org/
KEIZERSLAAN
4 - B -1000
BRUSSEL
- TEL . +32 (0)2 519 5640 –
FAX
+32 (0)2 519 5645 – E - MAIL
STIS @ STIS . FGOV . BE
-
WEBSITE WWW . STIS . FGOV . BE
INHOUDSTAFEL INLEIDING .......................................................................................................................................1 DEEL I. DIGITALE BEWARING: EEN OVERZICHT .....................................................................................3 I. II. III.
IV.
V.
Inleiding .......................................................................................................................3 Concept........................................................................................................................3 Digitale bewaringsstrategieën .......................................................................................4 1. Technologiebehoud ................................................................................................5 2. Emulatie..................................................................................................................5 3. Migratie ..................................................................................................................7 4. Inkapseling..............................................................................................................8 5. XML ........................................................................................................................9 6. Besluit.....................................................................................................................9 Belangrijke thema’s ....................................................................................................11 1. Standaarden ..........................................................................................................11 2. Metadata...............................................................................................................12 3. Selectiecriteria voor digitale bewaring...................................................................13 4. Juridische aspecten................................................................................................14 5. De verschillende actoren.......................................................................................16 6. Kosten...................................................................................................................17 Besluit: de belangrijkste trends voor de toekomst........................................................19
DEEL II. ACTIVITEITEN EN INITIATIEVEN VAN DE EUROPESE UNIE .........................................................21 I. II. III. IV.
Het Kaderprogramma voor Onderzoek en Technologische Ontwikkeling (Digicult) ....21 De Beginselen en het Actieplan van Lund ...................................................................21 De coördinatie van het digitaliseringsbeleid in de EU en het Minerva-netwerk............21 Nieuwe strategische uitdagingen ................................................................................23
DEEL III. ACTIVITEITEN EN INITIATIEVEN IN BELGIË ............................................................................25 I. II.
Inleiding: de verschillende overheden en digitalisering ...............................................25 De Federale Overheid ................................................................................................25 1. Modernisering van de Federale Wetenschappelijke Instellingen (FWI's).................25 2. Digitalisering van het erfgoed van de FWI's en het Koninklijk Belgisch Filmarchief (KBF): inventaris en strategische studie ................................................26 3. Recente ontwikkelingen: het digitaliseringsplan van de FWI's en het KBF..............27
BRONNEN ......................................................................................................................................29 I. II. III. IV.
Portaalsites en andere sites over digitale bewaring ......................................................29 Handboeken en richtlijnen .........................................................................................30 Overzichtsartikelen.....................................................................................................31 Thematische artikelen.................................................................................................32
VOETNOTEN ..................................................................................................................................35 Inleiding .................................................................................................................................35 Deel I. Digitale bewaring: een overzicht .............................................................................35 DeelI. Activiteiten en initiatieven van de Europese Unie ....................................................42 Deel III. Activiteiten en initiatieven in België ........................................................................43
INLEIDING België draagt met het patrimonium waarvoor de FWI instaan, op belangrijke wijze bij tot het gemeenschappelijk patrimonium van de mensheid, met name tot het wetenschappelijk, artistiek, historisch en natuurlijk patrimonium, zoals dat vandaag wordt opgevat en gevaloriseerd vanuit het oogpunt van een duurzame ontwikkeling van de planeet en in het kader van de mondialisering van de uitwisselingen. Het grote belang van deze bijdrage en van het daarmee gepaard gaande wetenschappelijk onderzoek staat niet in verhouding tot het geopolitieke gewicht van het land. De verzamelingen die België bezit, behoren tot de belangrijkste ter wereld enerzijds om historische redenen (enkele instellingen zijn meer dan honderd jaar oud) en anderzijds door hun aard, hun intrinsieke waarde of hun volume (Horizon 2005 – Witboek voor de modernisering van de FWI's). Het is dus van het allergrootste belang dit uitzonderlijk erfgoed te beschermen, te bewaren en toegankelijk te houden voor toekomstige generaties. Het digitalizeren en digitaal bewaren van culturele en wetenschappelijke documenten en objecten bieden hiertoe waardevolle mogelijkheden: allereerst omdat de toegankelijkheid ervan voor alle groepen gebruikers groter is dan ooit tevoren het geval was, maar ook omdat objecten die zeldzaam zijn of verloren dreigen te gaan omwille van bijvoorbeeld de fragiliteit van hun drager via digitalisering aan een geografisch onbeperkt publiek blijvend kunnen worden aangeboden. De mogelijkheden voor het creëren, overdragen en verrruimen van kennis zijn enorm. Maar ook digitaal erfgoed is in acuut gevaar van verloren te gaan: door de snelle veroudering van hardware en software die er toegang toe bieden, door onzekerheid over te gebruiken technologieën, over financiering, over wie de eindverantwoordelijkheid hoort te dragen, door een gebrek aan aangepaste regel- en wetgeving, ... Er is dan ook een dringende nood aan bewustmaking, zowel van het belang en de mogelijkheden die digitale bewaring van het erfgoed bieden, als van de risico’s die eraan verbonden zijn, en die slechts beheerst kunnen worden door een efficiënte lange termijnvisie te ontwikkelen. Een dergelijke strategie beïnvloedt de technologische keuzes die worden gemaakt, de kostenberekening en financiering, de procedures die ontwikkeld en toegepast worden, en de taakverdeling onder de verschillende actoren. Enkel als digitalisering vanuit dit standpunt benaderd wordt, kan blijvende toegankelijkheid tot en bruikbaarheid van het erfgoed worden gegarandeerd. Uit dit rapport zal echter ook blijken hoe complex deze materie is, en hoewel er reeds een groot aantal heel interessante onderzoeksresultaten en ideeën beschikbaar zijn, bestaat er geen definitieve checklist voor het digitaal bewaren van alle soorten en formaten van culturele en wetenschappelijke objecten. Toch moet er nu gehandeld worden om te vermijden dat onvervangbare materialen verloren gaan. Actieve samenwerking, internationaal en nationaal, is dan ook noodzakelijk voor het uitwisselen van kennis en vaardigheden, het opstellen van "best practices", het definiëren van standaarden, het identificeren van actoren en financieringsbronnen, ... Dit rapport bestaat uit 4 delen. Een eerste deel geeft een "state of the art"-beschrijving van digitale bewaring op dit moment: de belangrijkste technologische benaderingen worden beschreven, en een aantal centrale thema’s meer in detail toegelicht. Dit alles wordt geïllustreerd met verwijzingen naar onderzoeksprojecten en -organisaties die zich met de materie bezig houden. Om het overzicht van bronnen overzichtelijk te houden en bij het doel van dit rapport te laten aansluiten, hebben we de digitaliseringsprojecten geselecteerd, die ook onderzoek uitvoeren en publiceren. Wie DWTI
INFORMATIENOTA: DIGITALE BEWARING
1
geïnteresseerd is in een uitgebreidere lijst voorbeelden van digitale bewaringsprojecten die geen onderzoeksluik aanbieden, kan deze bijvoorbeeld vinden in het "Good Practice Handbook"1 van de Europese Unie, waar bij elke praktische richtlijn een selectie van de meest interessante referenties wordt opgesomd, of op de PADI (Preserving Access to Digital Information) website2 van de Nationale Bibliotheek van Australië die per thema dat belangrijk is voor digitalisering een overzicht geeft van artikelen, richtlijnen, bibliografieën, tijdschriften, en ook concrete projecten en case studies. Het tweede deel beschrijft hoe digitale bewaring op het niveau van de Europese Unie wordt aangepakt (de gesubsidieerde onderzoeksprogramma’s, de organisatie van informatieuitwisseling, ...) en wat de prioriteiten voor de toekomst zijn. In een derde deel komt de situatie in België aan bod, en meer specifiek op het federale niveau, waar de eerste aanzetten gegeven zijn voor een digitaliseringsplan van de Federale Wetenschappelijke Instellingen en het Koninklijk Belgisch Filmarchief. Het laatste deel geeft een overzicht van bronnen, opgedeeld in verschillende soorten: naast thematische websites over digitale bewaring (al dan niet in het kader van een concreet project), onderscheiden we richtlijnen en handboeken, overzichtsartikelen die de opportuniteiten en problematieken van digitale bewaring in het algemeen behandelen, en thematische artikelen, die dieper op een bepaald thema ingaan.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
2
DEEL I. DIGITALE BEWARING: EEN OVERZICHT I.
Inleiding
Dit eerste deel schetst kort de problematiek van digitale bewaring door een bespreking van het concept, een overzicht van de verschillende bewaarstrategieën met hun voor- en nadelen (technologiebehoud, emulatie, migratie, inkapseling, XML), en een korte bespreking van een aantal belangrijke thema’s (metadata, standaarden, selectiecriteria, juridische aspecten zoals copyright, de rol van verschillende actoren, kosten). Tenslotte geven we de richting van toekomstig onderzoek en ontwikkelingen aan. We vermelden ook de belangrijkste recente projecten, portaal- en andere websites, en gespecialiseerde organisaties. II. Concept In de verschillende omschrijvingen3 van digitale bewaring zijn er een aantal elementen die steeds terugkomen en verwijzen naar de belangrijkste aspecten van digitale informatieverwerking: het opslaan, bewaren van en toegang verschaffen tot digitale objecten op lange termijn. Over hoe "lange termijn" geïnterpreteerd moet worden, lopen de meningen uiteen. Terwijl Bennett spreekt over een termijn tot 50 jaar, omdat technologische veranderingen na deze periode onmogelijk accuraat genoeg in te schatten zijn om ze in een werkbare strategie op te nemen4, stellen Carroll en Hodge dat er op een periode van 2 tot 10 jaar al significante evoluties in technologieën en gebruikersgroepen te zien zullen zijn5, en dat nieuwe versies van databanken, spreadsheets en tekstverwerkers zelfs elke 2 à 3 jaar verschijnen, met tussentijdse aanvullingen en kleine updates6. Een strategische studie van DigiCULT ziet technologische innovatiecycli van 2 tot 5 jaar7. Hodge merkt op dat er in het discours over digitale bewaring recent een belangrijke accentverschuiving heeft plaatsgegrepen van het proces van digitalisatie naar digitale bewaring op langere termijn zelf, zodat het thema van blijvende toegankelijkheid van het materiaal centraal komt te staan in het beheer van digitale data8. Een efficiënte, verzorgde bewaringsstrategie is slechts een begin. De uiteindelijke bedoeling ervan is het digitaal object blijvend beschikbaar te stellen en bruikbaar te houden binnen een snel evoluerende technologische omgeving. Een digitaal object is namelijk per definitie maar consulteerbaar via een bepaalde software, die onvermijdelijk in onbruik zal geraken na verloop van tijd. Dat digitale objecten kwetsbaar zijn op een fundamenteel verschillende manier van analoge objecten, komt duidelijk tot uiting in de discussies over bewaringsstrategieën. De authenticiteit van een digitaal object kan relatief gemakkelijk aangetast worden, bijvoorbeeld doordat veranderingen aangebracht worden of kopieën gemaakt – met alle archivistieke en juridische implicaties vandien. Zo wordt het digitale object aan een aantal gevaren blootgesteld zoals verlies van data, foute interpretaties, verschillende circulerende versies die niet meer met het origineel te vergelijken zijn omdat dit verloren gegaan is, ... Het is dan ook belangrijk dat de bewaartechnieken de oorspronkelijke functie, betekenis en context van het object kunnen bewaren of hercreëren, zodat een gebruiker het digitale object juist kan interpreteren. Dat wil echter niet zeggen dat een digitaal object absoluut in zijn oorspronkelijke vorm bewaard moet worden. Belangrijker is dat de finaliteit van het object dezelfde blijft, en dat de essentiële componenten
DWTI
INFORMATIENOTA: DIGITALE BEWARING
3
volledig en ongewijzigd aanwezig blijven. Het aantal mogelijke digitale bewaarvormen is groot en voor elk object of serie objecten moet beslist worden welke vorm de meest geschikte is. Een goed overwogen strategie is dan ook essentieel voor digitale bewaring en maakt het voorwerp uit van veel onderzoek, zowel via concrete, locale projecten als via initiatieven om meer overkoepelende richtlijnen op te stellen. Sinds digitale bewaring op de agenda is komen te staan, zijn er in verschillende landen concrete projecten opgezet, die hun rapporten publiceren en ervaringen delen. Enkele voorbeelden zijn CEDARS (CURL Exemplars in Digital Archives, 1998-2002)9, CAMiLEON (Creative Archiving at Michigan and Leeds: Emulating the Old On the New, van 1999 tot 2002 (UK) en 2003 (US))10, PANDORA (Preserving and Accessing Networked Documentary Resources of Australia, van start gegaan in 1996)11, JSTOR (The Scholarly Journal Archive, opgestart in 1995)12, FEDORA (Flexible and Extensible Digital Object and Repository Archive, vanaf 1999)13, NEDLIB (Networked European Deposit Library, 1998-2000)14, VERS (Victorian Electronic Records Strategy, vanaf 1998)15, InterPARES (International Research on Permanent Authentic Records in Electronic Systems, 1999 tot – vermoedelijk – 2006)16, PRISM (Preservation, Reliability, Interoperability, Security, Metadata, 1999-2003)17, DAVID (Digitale Archivering in Vlaamse Instellingen en Diensten, 19992003)18 en het Testbed Digitale Bewaring (Digitaal bewaren van overheidsinformatie in Nederland, 2001-2003)19. Deze informatie wordt ook op overzichtelijke wijze samengebracht op thematische portaal- en andere websites zoals PADI (Preserving Access to Digital information)20, ERPANET (Electronic Resource Preservation and Access Network)21, RLG (the Research Libraries Group)22, ECPA (European Commission on Preservation and Access)23, DigiCULT (Technology Challenges for Digital Culture)24 en Digitale Duurzaamheid25. Op basis van al deze ervaringen en onderzoeksresultaten hebben een aantal gespecialiseerde instellingen en individuele auteurs getracht overkoepelende algemene richtlijnen en "best practices" op te stellen. Deze blijven eerder richtinggevend, omdat voor digitale bewaringsprocessen uiteindelijk alles afhangt van de concrete omstandigheden: de betrokken instelling(en), het doelpubliek, de uiteindelijke bedoeling van het project, de aard van de digitale of te digitaliseren objecten, het beschikbare budget, eventuele juridische beperkingen, ... Toch is het samenbrengen van geteste praktijken, richtlijnen en standaarden van groot belang, omdat dit een overzicht biedt, samenwerking aanmoedigt en zo voor grotere interoperabiliteit tussen de verschillende systemen en initiatieven kan zorgen. Zo kan de last van de grote hoeveelheden beschikbare digitale informatie en de onderhoudskosten die dit met zich meebrengt, gedeeld worden. Enkele voorbeelden van dergelijke publicaties zijn Preservation management of digital materials: a handbook, Beagrie and Jones, 200126, A framework of guidance for building good digital collections, ILMS, 200127, Good practice handbook, Minerva Working Group 6, 200328, Digitaal archiveren in de praktijk. Handboek, DAVID, 200429 en Guidelines for the preservation of digital heritage, Colin Webb voor de NLA in opdracht van UNESCO, 200330. III. Digitale bewaringsstrategieën Een digitaal object is afhankelijk van een bepaalde technologische omgeving om toegankelijk te zijn, en die zal onvermijdelijk na een aantal jaren verouderd geraken. Als er niet tijdig maatregelen getroffen worden, gaat daarmee ook het object zelf verloren. Er zijn dan ook een aantal strategieën ontwikkeld om dit tegen te gaan en digitaal materiaal tijdig te redden31.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
4
Deze strategieën kunnen opgedeeld worden in twee brede benaderingen. De eerste bestaat erin de oorspronkelijke technologische omgeving volledig te bewaren, om ook in de toekomst het digitale object weer te geven. Hierin onderscheiden we twee mogelijkheden: technologiebehoud en emulatie van technologie. Technologiebehoud betekent dat functionerende replica van alle hardware en software worden bewaard. Emulatie bestaat erin huidige en toekomstige computers te programmeren om verouderde, in onbruik geraakte systemen en platformen te emuleren. De tweede benadering wil het verouderen van digitale formaten rechtstreeks tegengaan. Ook hier kunnen we twee technieken onderscheiden: informatiemigratie en inkapseling. Met migratie bedoelt men het transformeren of converteren van het digitale object naar een ander formaat, onafhankelijk van de hard- en software gebruikt bij hun creatie. Bij inkapseling wordt een digitaal object samen met alle informatie die nodig is om het correct te gebruiken, gegroepeerd en bewaard. Vervolgens zullen we het gebruik van XML voor bewaarstrategieën meer in detail bespreken. Hoewel XML zowel bij inkapseling als bij migratie een rol kan spelen, verdient het toch van apart bekeken te worden omwille van de veelbelovende vooruitzichten die het biedt op vlak van informatieopslag en -uitwisseling, en bijgevolg voor digitale bewaring. Vermeldenswaard in deze context is het Testbed Digitale Bewaring in Nederland, waar op systematische wijze en zeer recent een aantal experimenten uitgevoerd zijn met het oog op het ontwikkelen van een goede strategie voor het bewaren van overheidsdocumenten. Voor de strategieën migratie, emulatie en XML werden telkens testen gedaan met verschillende materialen: tekstdocumenten, emails, spreadsheets en databanken van verschillende grootte en aard. Het Testbed is op dit moment bezig met het publiceren van de resultaten hiervan in de vierdelige serie Van digitale vluchtigheid naar digitaal houvast. Voor emails is XML de meest geschikte bewaarstrategie gebleken (deel 4)32 en voor tekstdocumenten een combinatie van PDF en XML (deel 3)33. Ook voor spreadsheets wordt omzetting naar XML aangeraden (deel 2)34. Deel 1 zal databanken behandelen maar is op dit moment nog niet beschikbaar. 1.
Technologiebehoud
Aanhangers van deze methode vinden het vooral belangrijk dat een digitaal object in exact dezelfde vorm wordt bewaard, zodat de functionaliteiten en de presentatie helemaal de oorspronkelijke zijn. En dit kan enkel gegarandeerd worden als ook de oorspronkelijke omgeving in identieke staat wordt bewaard: exact dezelfde software en hardware. Dit kan voor sommige digitale objecten – bijvoorbeeld voor zeer complexe multimedia objecten – een geschikte korte termijnstrategie zijn in afwachting van een definitievere oplossing, maar op langere termijn ontstaan er problemen in verband met kosten en onderhoud (technologieën verouderen, technische support van de verkoper verdwijnt, expertise verdwijnt, vervangstukken zijn niet langer beschikbaar, ...). Bovendien is de interoperabiliteit van een dergelijk systeem onbestaande: het object zal enkel toegankelijk zijn via de hardware die op specifieke locaties bewaard wordt, en nergens anders. 2.
Emulatie
Emulatie is een term uit de computerwetenschap die verwijst naar een verzameling van technieken die een bepaald apparaat of programma gebruikt in de plaats van een ander apparaat of programma, maar om hetzelfde effect te bekomen. Er wordt dus in feite een surrogaat gecreëerd voor een bepaald systeem, zodat het te bewaren digitale object in zijn oorspronkelijke vorm toegankelijk blijft op toekomstige computers35. Deze strategie heeft met de vorige gemeen dat de DWTI
INFORMATIENOTA: DIGITALE BEWARING
5
originele hardware en/of software bewaard blijft, evenwel niet door behoud van de technologische omgeving, maar wel via een emulatieprogramma, dat nieuwe en toekomstige computers het gedrag van deze gedateerde systemen doet nabootsen. Enkele vaak geciteerde voordelen van emulatie zijn de volgende. Emulatie bewaart het digitale object in zijn oorspronkelijke vorm, met dezelfde "look and feel" en dezelfde actieve of interactieve eigenschappen. Een ander voordeel is de efficiëntie: een enkele emulator volstaat voor een serie objecten die hetzelfde technologische platform nodig hebben (de kostprijs is dus niet afhankelijk van het aantal gearchiveerde digitale objecten), en eens de emulatiespecificaties opgesteld zijn, is er verder geen activiteit meer nodig tot het moment dat het object opnieuw gebruikt wordt. Emulatie wordt dan ook door sommige auteurs beschouwd als een lange termijnbewaringstratgie bij uitstek, zeker indien men niet zeker is van het belang van het object voor de toekomst. Verder lijkt emulatie geschikt voor alle digitale formaten (inclusief complexere digitale materialen, zoals executable files), en dit universele karakter maakt het een aantrekkelijke totaaloplossing. Over de kosten van emulatie als strategie lijkt er geen akkoord te zijn36 en is het wachten op de resultaten van op dit moment lopend onderzoek37. Daar staat tegenover dat naargelang systemen complexer worden, de emulatiespecificaties dat ook zullen zijn. Het zou kunnen dat alle aspecten van een systeem of applicatie emuleren zelfs niet mogelijk blijft. Bovendien zullen emulatoren zelf gemigreerd of geëmuleerd moeten worden als na verloop van tijd platformen en technologieën veranderen, zodat er verschillende lagen van emulatoren ontstaan. Bovendien kunnen archaïsche applicaties moeilijk zijn voor hedendaagse en toekomstige gebruikers om mee te werken, zodat extra presentatietools ingeschakeld moeten worden. Er is ook geen absolute garantie dat de opgestelde specificaties voor de oorspronkelijke hard- en software ook effectief in de toekomst een emulator zullen kunnen produceren. En voor de emulatiebenaderingen die een volledige reconstructie van het oorspronkelijke systeem beogen, kan er sprake zijn van "overkill": voor een statisch document volstaat al zeker een "viewer"-systeem. Er is duidelijk een akkoord tussen de verschillende auteurs en organisaties dat er nog verder praktisch onderzoek nodig is naar deze techniek. Een bekend aanhanger van de emulatiestrategie, die zowel theoretische analyses publiceerde als aan concrete projecten meewerkte (bijv. het NEDLIB project dat we al vermeldden) is Jeff Rothenberg38. IBM heeft research gedaan naar een UVC (Universele Virtuele Computer) waarop bestanden zouden gelezen worden met behulp van “views” in plaats van de oorspronkelijke software. Dat zou natuurlijk de emulatiespecificaties aanzienlijk vereenvoudigen39. Het CAMiLEON project onderzoekt, in samenwerking met CEDARS, emulatie als bewaarstrategie door een reeks technologische strategieën te ontwerpen en te evalueren. Naast het creëren en testen van emulatietools, wil CAMiLEON ook via gebruikersevaluaties en kostenanalyses conclusies trekken. De finale rapporten van dit project zijn nog niet gepubliceerd. Er zijn wel al een aantal publicaties beschikbaar, waaronder een artikel dat vaststelt dat gebruikers in feite geen verschil merken tussen eindproducten van migratie en van emulatie, hetgeen het voordeel van het bewaren van de oorspronkelijke eigenschappen dat aan emulatie wordt toegeschreven, relativeert40. Daarnaast kan men ook nog aanvoeren dat niet alle originele eigenschappen van een object behouden moeten blijven om het optimaal te kunnen gebruiken41. De conclusies van het CEDARS/CAMiLEON onderzoek naar de relatieve voor- en nadelen van migratie en emulatie gaan eerder in de richting van een overwogen amalgaam van deze DWTI
INFORMATIENOTA: DIGITALE BEWARING
6
technieken, aangezien ze elkaar aanvullen en elkaars nadelen zouden kunnen opvangen: emulatie vermijdt verlies van informatie door een serie opeenvolgende migraties, en bij migratie is er geen sprake van de risico’s verbonden aan de pogingen om een bepaalde omgeving opnieuw te creëren42. Een concreet voorbeeld: CAMiLEON heeft het BBC Domesday project, gecreëerd in 1986 en 15 jaar later in gevaar gebracht door technologische veroudering, gered door een dergelijke combinatie van emulatie- en migratiestrategieën, ook wel "migration-on-request" genoemd43. Bovendien lijkt emulatie eerder aangewezen voor objecten waar de "look en feel" en de functionaliteiten van een object essentieel zijn, terwijl migratie vooral is aangewezen als de inhoud en structuur van een object de essentiële, zeker te bewaren componenten zijn (c.i.). Ook DAVID besluit dat een overwogen combinatie van migratie- en emulatiestrategieën een bruikbare benadering is, die ook nog alle opties openhoudt voor de toekomst44. 3.
Migratie
Het Testbed Digitale Bewaring hanteert een eenvoudige en praktische definitie van migratie als "het overzetten van bestanden van een hardwareconfiguratie of softwareapplicatie naar een andere configuratie of applicatie"45. Drie belangrijke aspecten van migratie zijn "backward" compatibiliteit, interoperabiliteit en gebruik van standaarden. De complexiteit van een migratieproces is afhankelijk van het digitale object in kwestie: een tekstdocument is bijvoorbeeld eenvoudiger te migreren dan een multimedia object. Migratie lijkt inderdaad bij uitstek geschikt voor het bewaren van tekstdocumenten waar de concrete presentatie van een object minder belangrijk is, aangezien migratie eerder focust op hier en nu bepaalde inhouden toegankelijk maken, dan op technologie46. Voor digitale objecten waar formaat en inhoud verstrengeld zijn, zoals bijvoorbeeld bij multimedia objecten het geval is, wordt migratie moeilijker: het is mogelijk dat de verschillende componenten apart gemigreerd moeten worden, wat een complex proces wordt. De "backward" compatibiliteitsbenadering van migratie verwijst naar het feit dat softwareproducenten vaak conversiesoftware meeleveren als onderdeel van een nieuwe versie van een bepaalde software (zoals bijvoorbeeld het geval was bij Word 2000 voor Word 95 en 97). Dit is evenwel duidelijk niet betrouwbaar genoeg om een lange termijn-bewaring op te baseren: compatibiliteit duurt over het algemeen niet langer dan enkele generaties, en zelfs dan kunnen bepaalde eigenschappen of functies gewijzigd zijn. Men spreekt van interoperabiliteit als objecten van het ene platform of applicatie naar een ander overgezet kunnen worden. Dit vergemakkelijkt de toegang tot gemigreerde digitale objecten aanzienlijk: de specifieke software waarin een object gecreëerd is, is niet meer het enige programma waar het ook in gebruikt kan worden. Interoperabiliteit is dan ook een veelbelovend en belangrijk onderzoeksthema voor digitale bewaringsprocessen (dit thema komt ook terug bij de bespreking van XML als bewaarformaat), maar wordt moeilijker te verwezenlijken naargelang de gebruikte systemen complexer worden, hetgeen ook weer op een eerder korte termijnstrategie wijst. Ook is het opletten dat er geen informatie of functionalitieten verloren gaan, en dat de authenticiteit van het object intact blijft. Bij converteren naar standaarden wordt het object vanuit zijn oorspronkelijke formaat verplaatst naar een standaardformaat, dat gedocumenteerd is, stabiel en niet afhankelijk van één enkele producent. Zo moeten digitale objecten minder frequent gemigreerd worden dan bij omzetting naar een willekeurige nieuwere technologie. Een voorbeeld hiervan is de VERS-strategie die documenten systematisch omzet in PDF (om de oorspronkelijke presentatie te bewaren), en de metadata verpakt in XML47. Deze objecten zijn dus ingekapseld (zie ook de inkapselingsstrategie, c.i.), en als dusdanig zelfbeschrijvende objecten geworden. DWTI
INFORMATIENOTA: DIGITALE BEWARING
7
Standaardformaten zijn echter zelf ook aan evolutie onderhevig, en kunnen geen permanente toegang in de toekomst garanderen. Hoewel migratie op dit moment de meest gangbare strategie is48, wordt er ook veel kritiek op geformuleerd. De resultaten van migratie zijn onvoldoende voorspelbaar49. Door de transformatie van de oorpronkelijke bitstroom kan er een verlies aan informatie optreden: inhoud, structuur, presentatie of context van een digitaal object kunnen veranderen. Een reeks opeenvolgende migraties kunnen ook nog eens een cumulatief effect hebben. Dit is de hoofdreden waarom de UNESCO Guidelines for the Preservation of Digital Heritage migratie eerder indeelt bij de korte termijnstrategieën. Een migratieproces vraagt in feite een zorgvuldig onderzoek naar elke combinatie van het oorspronkelijke bestandsformaat van het object met het bestandsformaat waar het naartoe gemigreerd word. Een migratieproces op grote schaal is dan ook tijds- en arbeidsintensief: alle afzonderlijke bestanden en hun metadata (inclusief de metadata die betrekking hebben op de migratie zelf, om een accurate geschiedenis van het object bij te houden) moeten gemigreerd worden. Bovendien is migratie in feite een doorlopend proces – er zal steeds een volgende migratie nodig zijn. Een zorgvuldige strategische wake is nodig om juist te kunnen inschatten wanneer aan een volgende migratie begonnen moet worden. De kosten van migratie als bewaringsstrategie zijn dan ook moeilijk exact in te schatten, maar potentieel hoog. Omdat migratie een populaire strategie is, is er evenwel al heel wat onderzoek naar deze problemen en risico’s gebeurd en bestaat er al heel wat concrete informatie om op terug te vallen bij het uitvoeren van migratieprojecten50. Het Testbed Digitale Bewaring is van oordeel dat, hoewel migratie alleen niet zal volstaan, het toch steeds een belangrijk deel zal uitmaken van een bredere, pragmatische bewaringsstrategie op lange termijn. 4.
Inkapseling
Anders dan bij migratie, wordt een bestand met deze strategie wel in zijn oorspronkelijke vorm bewaard, maar ingekapseld samen met een serie instructies over de manier waarop het origineel geïnterpreteerd moet worden. Deze instructies zijn een gedetailleerde, formele beschrijving van het bestandsformaat en de betekenis van de data. XML, als een markup taal, is bij uitstek geschikt om deze inkapselende laag in te formuleren, zoals we reeds zagen bij het VERS-project (c.s.). Andere praktische toepassingen van het inkapselingssysteem zijn de Universal Preservation Format strategie51, en de Digital Rosetta Stone52. Het OAIS (Open Archival Information System)53, een conceptueel kader voor een archiefsysteem voor digitale bewaring op lange termijn (c.i.), beschrijft welke metadata met de objecten in AIPs (Archival Information Packages) opgenomen moet worden, zoals o.m. de oorsprong van het object, de context ervan (of de verhouding tot andere informatie buiten het ingekapselde object), en één of meer aspecten die het object in zijn uniciteit identificeren. Nadelen van deze methode zijn dat ze kan resulteren in enorme bestanden waarbij informatie nodeloos wordt gedupliceerd binnen collecties, en dat ingekapselde informatie nog steeds vatbaar is voor technologische veroudering: uiteindelijk zal de ingekapselde informatie toch ook gemigreerd moeten worden, al kan dit proces enige tijd uitgesteld worden. Inkapseling lijkt vooral aangewezen bij objecten in welbekende, in detail beschrijfbare formaten, waarvan de kans dat ze actief gebruikt zullen worden klein is.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
8
5.
XML
XML (eXtensible Mark-up Language)54 versie 1.0 werd in 1998 als een officiële W3C55 aanbeveling uitgebracht, en speelt een belangrijke rol op gebied van informatieopslag en -uitwisseling. XML is namelijk platform- en softwareonafhankelijk, hetgeen in het kader van zowel langdurige bewaring als interoperabiliteit een plus is. Het is namelijk doordat een object in een bepaalde vorm weergegeven moet worden, dat het van bepaalde software afhankelijk is, terwijl XML van een object de inhoud (in abstracte vorm), structuur en vorm gescheiden bewaart – dit wordt het inkapselingseffect van markup-talen genoemd. Met markup talen kunnen data geïnterpreteerd worden, los van specifieke grammatica’s of syntaxen, zodat bewaring over langere periode en met volledig behoud van de integriteit mogelijk wordt. Verder is XML een open standaard, die breed geaccepteerd is en veel wordt toegepast, en leesbaar is voor zowel mensen als machines. XML is ook uitbreidbaar, net als een natuurlijke taal, en controleerbaar via de W3C die een zorgvuldige selectie maakt van alle voorgestelde extensies. Bovendien is XML gratis56. De PADI-website voegt aan deze voordelen nog toe dat XML kan gebruikt worden voor alle formaattypes, en dat het potentieel voor het ontwikkelen van groeperende bewaarstrategieën voor gelijkaardige objecten ook heel aantrekkelijk is. XML zou echter zeer arbeidsintensief kunnen uitvallen als er een markup van een groot aantal documenten of objecten moet gebeuren. DigiCULT wijst er ook op dat XML een nieuwe benadering van structurering en hergebruik van inhouden toelaat: in XML opgeslagen informatie kan niet alleen via het Internet gepresenteerd worden, maar bijvoorbeeld ook op mobiele dragers zoals PDA’s en GSMs57. Twee voorbeelden van op XML-strategieën gebaseerde projecten zijn het DiVA project en het Xtensible Past project. DiVA (Digitala Vetenskapliga Arkivet of Digitaal Wetenschappelijk Archief, vanaf 2000) is het elektronische publicatiesysteem dat ontwikkeld en onderhouden wordt door de Universiteitsbibliotheek van Uppsala58. Het DiVA systeem is operationeel sinds januari 2003, en wordt ondertussen door 5 Zweedse en een Deense universiteit gebruikt. Het project werd opgezet als een praktische onderneming met een concreet doel, maar heeft ook voor onderzoek naar bewaringsstrategieën veel inspiratie opgeleverd59. Het Xtensible Past project (2003-2004) is een initiatief van NIWI en KNAW (Nederlands Instituut voor Wetenschappelijke Informatiediensten en Koninklijke Nederlandse Academie voor Wetenschappen) met de bedoeling een virtueel archief aan te leggen dat een gebruiksvriendelijke toegang verleent tot een grote collectie historische onderzoeksdata die op verschillende plaatsen beheerd wordt door het NHDA (Nederlandse Historische data Archief), de Erasmusuniversiteit en de Universiteit Utrecht, om uitwisselingen tussen wetenschappers aan te moedigen60. Het project heeft een dubbele bedoeling: enerzijds de mogelijkheden van XML als een bewaarstrategie voor heterogene onderzoeksdata op lange termijn analyseren, en anderzijds de mogelijkheden bekijken die XML en OAIS bieden om toegang te verschaffen tot een dergelijke collectie van data. Een finaal rapport van dit project is nog niet beschikbaar. Hoewel er ook voor XML nog heel wat onderzoek nodig is61, lijken de eerste resultaten veelbelovend, zoals we aan het succes van bovenstaande projecten en de reeds gepubliceerde resultaten van het Testbed Digitale Bewaring kunnen zien. 6.
Besluit
De tabel geeft een overzicht van voor- en nadelen van de belangrijkste bewaringstechnieken, en het soort digitale objecten waarvoor elk het meest geschikt is.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
9
Strategie Technologiebehoud
Voordelen - Oorspronkelijke vorm en uitzicht blijven bewaard
Emulatie
- Oorspronkelijke vorm en uitzicht blijven bewaard - Langdurige bewaring zonder actief onderhoud mogelijk - Hoeft niet voor elk digitaal object apart uitgevoerd te worden
Migratie
- Bewaren van verouderde technologieën is niet nodig - Actief beheer en onderhoud is mogelijk - Standaardformaten bieden stabiliteit en langdurige toegang
Inkapseling
- Metadata beschikbaar
XML
- Platform- en software onafhankelijk: interoperabiliteit! - Open standaard, breed geaccepteerd, gratis - Leesbaar voor mens en machine - Uitbreidbaar - Metadata beschikbaar - Groeperende aanpak voor gelijkaardige objecten mogelijk - Data kunnen op websites, GSMs, PDA’s, ... gepresenteerd worden
Nadelen - Verouderde technologie nodig voor toegang tot object: onderhoud wordt onmogelijk - Geen interoperabiliteit - Creëren van emulatiespecificaties is een complex proces - Geen garantie dat de specificaties in de toekomst een emulator kunnen creëren - Grote hoeveelheid informatie te bewaren - Emulator kan zelf verouderen - Kosten kunnen op termijn hoog oplopen - Geen garantie dat authenticiteit bewaard blijft - Geen metadata beschikbaar - Vraagt voortdurende inspanning voor onderhoud - Het formaat van het object kan in onbruik raken of niet langer bekend zijn - Grote hoeveelheden informatie te bewaren - Kan zeer arbeidsintensief en dus duur uitvallen
Toepassing - Zeer complexe multimedia-objecten die voor kortere tijd bewaard moeten worden - Objecten waar oorspronkelijke presentatie belangrijk is - Complexe digitale objecten (executable files) - Objecten waarvan de waarde niet gekend is en toekomstig gebruik onzeker - Ook mogelijk voor objecten in een minder gedocumenteerd formaat - Objecten die actief gebruikt worden - Objecten in een welbekend formaat - Eerder geschikt voor minder complexe objecten (vooral inhoud en structuur belangrijk) - Objecten die waarschijnlijk niet gebruikt of actief beheerd worden - Objecten in een welbekend formaat - Voor alle formaattypes
Een strategie die een efficiënte bewaring op lange termijn beoogt, kan evenwel verschillende technieken, of aspecten van verschillende technieken, combineren. Zo vermeldden we bijvoorbeeld eerder al dat zelfs na gebruik van emulatie een bijkomende migratie kan nodig zijn, of, zoals bij de VERS-strategie, migratie naar standaardformaten gecombineerd kan worden met een inkapseling van metadata. Interoperabiliteit is een sleutelwoord voor digitale bewaring: er is een enorme hoeveelheid digitaal materiaal beschikbaar, en geen enkele instelling kan dit allemaal beheren en beschikbaar houden. Het is dus belangrijk dat digitale informatie toegankelijk en uitwisselbaar is tussen de verschillende DWTI
INFORMATIENOTA: DIGITALE BEWARING
10
organisaties, instituties, bibliotheken, archieven, musea, ... onderling. Het ontwikkelen en gebruiken van standaardformaten is essentieel om interoperabele en bestendige systemen te creëren. Standaarden gebaseerd op XML lijken op dit moment het meest veelbelovend voor informatiebewaring en -uitwisseling. Concreet voor digitale bewaring kunnen we besluiten dat de meest succesvolle strategieën op dit moment op migratie naar XML-gerelateerde standaarden teruggaan62, hoewel er bijkomend onderzoek nodig is naar migratie van complexe objecten, de kost van migratietechnieken, en de performantie van de migratietools die op dit moment beschikbaar zijn. IV. Belangrijke thema’s 1.
Standaarden
Er is voor digitale bewaring een gestadige algemene trend naar meer standaardisatie en standaardgerelateerde activiteiten63. Open standaarden, waar veel documentatie over beschikbaar is en die conversie- en transformatieprocessen gemakkelijk en accuraat laten verlopen, zijn vanzelfsprekend interessant voor langdurige digitale bewaring en het verschaffen van blijvende toegang tot objecten. Ze bevorderen interoperabiliteit tussen systemen en automatisering van processen. Er bestaat nochtans discussie over het juiste belang en de exacte rol van standaarden in het geheel van het digitale bewaringsproces. Zo wijst Rothenberg erop dat ook standaardformaten achterhaald geraken, en dat een serie opeenvolgende migraties naar de nieuwe standaarden onvermijdelijk zal zijn. Volgens hem spelen standaarden eerder een rol als een korte termijnoplossing in afwachting van een volwaardige bewaringsstrategie. Hij ziet wel een rol voor standaarden in het leesbaar houden van metadata ("transliteratie")64. PADI gaat akkoord met de mening dat standaarden alleen niet volstaan voor digitale bewaring, gezien de verschillende noden en doelen van digitalisatieprojecten, en de snelle en niet te voorspellen technologische evoluties. Het lijkt onvermijdelijk dat er een grote hoeveelheid standaarden zal ontstaan die vrij snel zelf verouderd en vervangen geraken. PADI ziet standaarden eerder het bewaringsproces vergemakkelijken dan echt beheren65. Ook resultaten van het DAVID-project wijzen erop dat het ontwikkelen van standaarden veel tijd in beslag kan nemen, zodat standaarden de marktevolutie niet snel genoeg volgen. Standaarden worden ook niet altijd nauwgezet toegepast of geïmplementeerd, en niet alle standaarden zijn even wijdverspreid. Beagrie en Jones66 beschouwen standaarden ook als een potentieel belangrijk hulpmiddel bij digitale bewaring zowel bij de creatie van digitale objecten als bij de bewaringsprocessen (migratie, metadata bepalen, ...) zelf. Op het moment dat deze auteurs hun handboek uitbrachten, oordeelden ze echter dat standaarden ondanks dit potentieel nog geen grote praktische bijdrage hadden geleverd tot digitale bewaring. Dat standaarden tenminste een belangrijk hulpmiddel zijn voor digitale bewaring, staat voor de verschillende auteurs buiten kijf. Er zijn dan ook op een aantal belangrijke vlakken standaarden naar voren geschoven: voor metadata, voor technische bestandformatenen, voor dragers waarop digitale objecten worden bewaard, voor "persistent identifiers", en voor performantie-rating. Standaarden voor metadata worden in het volgende punt uitgebreid besproken. Het beste technische formaat om een digitaal object in te bewaren, hangt steeds ook af van het formaat van het originele object, en de eigenschappen die zeker bewaard moeten blijven. Er bestaat nooit 1 algemeen ideaal formaat. Voor elk soort object (tekst, beeld, databanken, video, audio, 3D, ...) zijn er de facto- of de jure-standaarden die door de meeste systemen probleemloos aanvaard en gelezen worden zoals PDF, XML, TIFF, JPEG, GIF, WAV, MP3, RealAudio, RealVideo, Quicktime, MPEG, VRML, Shockwave 3D67.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
11
Digitale objecten kunnen op magnetische of optische dragers opgeslagen worden, en voor beiden zijn standaarden in gebruik of ontwikkeling, zoals CDRom-XA, de Red Book-standaard voor audioCDs, Joliet, Universal Disk Format, ...68 "Persistent identifiers" garanderen dat digitaal materiaal ook in de toekomst geïdentificeerd en teruggevonden kan worden. De twee meest gebruikte systemen op dit moment zijn PURL (Permanent URL)69 en URN (Unique Resource Name)70, waarop het Handle Systeem71 gebaseerd is72. Performantie-rating is een specifiek bewaringsmetadata-element dat door de National Library of Medicine ontworpen werd en zich snel verspreidt. De rating vertelt een gebruiker welke webdocumenten permanent beschikbaar zullen blijven, en in welke mate de inhoud kan aangepast worden als de tijd verstrijkt ("Permanent" (unchanging/stable/dynamic), of "Permanence not guaranteed")73. Het OAIS (Open Archival Information System) referentiemodel, ontworpen door het CCSDS (Consultative Committee in Space Data Systems), een standaard voor een conceptueel kader van een archiefsysteem, bespreken we in het volgende punt. Het CCSDS heeft ondertussen verder werk geleverd over de producent-archief relatie, met het voorstel voor een "Producer Archive Interface Abstract Methodology Standard", dat een algemene methodologie schetst voor het opnemen van objecten in een archief. Als de interesse hiervoor blijft toenemen, zou dit zich tot een aparte standaard kunnen ontwikkelen74. 2.
Metadata
Voor digitale bewaring is dit een belangrijk maar complex onderwerp. Metadata zijn gestructureerde data over een bepaald informatiesysteem of -object, die het mogelijk maken dit object te beschrijven, te beheren, te bewaren, terug te vinden en te gebruiken. Drie soorten metadata worden onderscheiden: -
Descriptieve metadata maken het mogelijk een object te beschrijven, te identificeren en terug te vinden. Hiervoor is het meest gebruikte systeem Dublin Core75, dat een gestandaardiseerde set van metadata termen aanbiedt, een overzicht van concrete tools voor de productie, extractie en conversie van metadata, en richtlijnen voor het uitdrukken van Dublin Core metadata termen in bijvoorbeeld HTML en XML. Een ander breed geaccepteerd standaardensysteem voor descriptieve metadata is MARC (Machine-Readable Cataloguing Record)76, dat onder meer door de Library of Congress wordt gebruikt.
-
Administratieve metadata laten toe een object te bewaren en te beheren binnen een collectie. Hier vindt men bijvoorbeeld copyrightinformatie terug, technische bestandsformaatgegevens, informatie over authenticiteit en gebruiksgechiedenis, ... Een voorbeeld van standaardisatie van dergelijke elementen is A-Core (of Administrative Dublin Core)77.
-
Structurele metadata verbinden de verschillende componenten van complexe objecten. Omdat digitale objecten steeds in complexiteit toenemen, worden structurele metadata steeds belangrijker, in het bijzonder voor wetenschappelijke informatie. Een belangrijke standaardisatie die ook structurele metadata insluit is METS (Metadata Encoding and Transmission Standard), uitgedrukt in XML, op basis waarvan bijvoorbeeld een object gereconstrueerd kan worden, dat bestaat uit een combinatie van audio-, beeldbestanden en tekst.78 METS wordt gebruikt door o.m. FEDORA, de Harvard University en de Library of Congress.
Metadata die concreet voor het proces van digitale bewaring relevant zijn, worden bewaringsmetadata genoemd. Dit is een gespecialiseerde vorm van administratieve metadata, gecombineerd met aspecten van structurele metadata, die samen de processen van bewaring, DWTI
INFORMATIENOTA: DIGITALE BEWARING
12
beheer en toegankelijkheid van digitale objecten mogelijk maken door de volgende informatie aan te bieden: technische details van het bestandsformaat, de structuur, het gebruik van de digitale inhoud, de geschiedenis van alle veranderingen en ingrepen die het object ondergaan heeft, informatie i.v.m. authenticiteit, copyright, ...79 Verschillende concrete projecten en organisaties hebben geïsoleerde inspanningen geleverd om metadata-elementen en metadatasets te ontwerpen voor hun eigen digitaliseringsprojecten. Deze voorstellen gaan dan terug op particuliere noden. De OCLC/RLG Working Group on Digital Preservation80 werd in 2001 opgericht met als doelstelling een algemene, overkoepelende benadering voor bewaringsmetadata te ontwerpen. Op basis van 4 bestaande projecten81 die metadataschema’s hadden uitgewerkt, heeft deze Working Group in 2002 een algemeen kader voor digitale bewaringsdata afgeleverd, gebaseerd op het OAIS (Open Archival Information System referentiemodel)82. De Working Group concludeerde dat de verschillende projecten uiteindelijk voor gelijkaardige problemen en uitdagingen stonden, en dat het OAIS referentiemodel als een de facto standaard diende voor de meeste projecten. Het OAIS biedt een conceptueel kader voor een archiveringssysteem voor het bewaren en toegankelijk houden van digitale informatie op langere termijn. Het werd in mei 1999 ontworpen door de CCSDS (Consultative Committee in Space Data Systems) op vraag van de ISO, en na een herziening die het systeem ook geschikt maakte voor overheidsinstellingen, cultureel erfgoedorganisaties en de privésector, werd het in september 2001 erkend als een officiële ISOstandaard83. Het OAIS model vormde voor de Working Group een geschikt startpunt omdat het een brede categorisatie geeft van types informatie die bewaringsmetadata vormen. In hun finaal rapport vult de Working Group dit aan met een uitbreiding van de conceptuele structuur van het OAIS en met een set van concrete metadata-elementen voor praktische implementering, zodat een kader onstaat voor digitale bewaringsactiviteiten van verschillende aard84. Vertrekkend van dit conceptuele kader, nam daarna PREMIS (PREservation Metadata: Implementation Strategies) over om meer praktijkgerichte aanbevelingen en "best practices" uit te werken85. De resultaten hiervan worden in juni 2004 verwacht. Ondertussen baseert bijvoorbeeld het Preservation Metadata Scheme van de National Library of New Zealand zich op de resultaten van de eerste werkgroep, en tracht een evenwicht te vinden tussen de internationale standaard die de Working Group voorstelde en het eigen specifieke project86. Verder technisch onderzoek naar metadata is zeker nodig, bijvoorbeeld over de volgende problematieken: verdere standaardisatie van bewaringsmetadata voor verschillende soorten digitale objecten, en het automatisch genereren van bewaringsmetadata. 3.
Selectiecriteria voor digitale bewaring
Alle handboeken en richtlijnen in verband met digitalisering gaan akkoord dat het vastleggen van selectiecriteria voor te digitaliseren of in een verzameling op te nemen objecten een belangrijke stap is in de vorming van digitale collecties. Zo bekomt men samenhangende collecties, waar het voor beheerders en gebruikers duidelijk is wat erin teruggevonden kan worden. Ook is het zo mogelijk van eventueel prioriteiten te stellen voor digitaliseringprojecten. Procedures voor het evalueren en selecteren van materiaal dat bewaard moet blijven verschillen niet zoveel tussen analoge en digitale verzamelingen. Er moet aandacht zijn voor de waarde van een object voor toekomstige gebruikers, en voor de mate waarin het object aan de kerntaken van de digitaliserende instelling of aan de concrete doelen van het digitaliseringsproject beantwoordt. Gaat het er bijvoorbeeld om objecten beschikbaar te stellen die te delicaat zijn in hun originele versie, of slechts op één bepaalde plaatste consulteren? Wil men vooral een grotere toegankelijkheid van alle objecten garanderen?
DWTI
INFORMATIENOTA: DIGITALE BEWARING
13
Twee belangrijke verschillen tussen selectie van analoog en digitaal materiaal zijn de volgende: voor digitale objecten is de tijdspanne waarin over het belang en het al dan niet bewaren moet worden beslist, relatief kort. Een digitaal object kan verloren gaan terwijl men afwacht hoe de interesse erin zal evolueren87. Een beslissing om een digitaal object niet te bewaren, betekent veelal dat het onherroepelijk verloren gaat. Het kan dan ook nuttig zijn om naast de indelingen "zeker te bewaren" en "zeker niet te bewaren", een tussenoplossing van voorlopige bewaring te voorzien. Een ander aspect is dat het bij een digitaal object van belang is om nauwkeurig te bepalen welke kenmerken het zijn specifieke waarde geven, zodat deze zeker bewaard blijven in het digitaliserings- en bewaringsproces: is het belang van het object informatief, esthetisch of artistiek, vernieuwend, wetenschappelijk, historisch of cultureel, of ligt het in zijn interactieve eigenschappen? Selectiecriteria kunnen ook zeer concreet zijn: een instelling moet het opslaan en onderhoud van de collectie technisch en financieel aankunnen. Er kunnen dan ook bepaalde standaardformaten of metadata-beschrijvingen vereist zijn. Veelal zijn de belangrijkste criteria inhoudelijk van aard. Dit is zeker zo voor wetenschappelijke collecties, waar de selectie van teksten gebeurt op basis van verslagen van een expert reviewer, of van een "peer group"88. Een andere benadering is evenwel ook mogelijk: de Zweedse Nationale Bibliotheek bijvoorbeeld stelt dat een inhoudelijke selectie van "digital born" objecten veel te arbeidsintensief, kostelijk en tijdrovend zou zijn, en dat het bovendien onmogelijk is van nu te bepalen wat in de toekomst waardevol zal zijn. De selectie van te bewaren materiaal gebeurt door een geautomatiseerde zoekrobot die het .se-domein en web servers in Zweden doorzoekt. Daarna wordt een formele selectie doorgevoerd gebaseerd op de aard van de teruggevonden sites en documenten89. Een ander discussiepunt is hoever men moet gaan in het archiveren van digitaal materiaal: bewaart men bijvoorbeeld best een volledige website, of enkel concrete pagina’s die strikt stroken met de selectiecriteria? Bewaart men alle links met de gelinkte objecten erbij, enkel de links, uitsluitend de interne links, of links naar documenten op dezelfde webserver (in de veronderstelling dat de gelinkte documenten dan even lang beschikbaar zullen blijven als het oorspronkelijk geselcteerde object)? Belangrijk is in elk geval dat deze regels expliciet zijn en gedocumenteerd, en dat alle betrokken partijen erover akkoord gaan. Een aantal belangrijke projecten en organisaties publiceerden hun (discussies over) selectiecriteria en richtlijnen, zoals CEDARS90, JSTOR91 en InterPARES92. 93 Op de Minerva website (c.i.94) vindt men onder de uit de Europese lidstaten verzamelde "good practices" ook een overzicht van door geselecteerde projecten toegepaste selectiecriteria95. Nu een aantal digitaliseringsinitiatieven in een verder gevorderd stadium komen, waar al heel wat digitaal materiaal beschikbaar is, kan het nodig zijn selectiecriteria te herzien. Het PANDORA project van de National Library of Australia bijvoorbeeld publiceerde in 1996 de toenmalige selectiecriteria voor digitalisering96, maar moesten deze in 2003 aanpassen wegens een gebrek aan resources, waardoor een beperktere focus en duidelijkere prioriteiten nodig waren97. 4.
Juridische aspecten
Het volledige eerste deel van het DAVID Vademecum is aan juridische vraagstukken in verband met digitale bewaring gewijd98. Men kan ofwel door de wet, ofwel door een contract verplicht zijn bepaalde documenten te bewaren, of archivering kan gemotiveerd worden vanuit de waarde en het
DWTI
INFORMATIENOTA: DIGITALE BEWARING
14
belang van een document zelf. Omdat het DAVID-project focust op digitale bewaring in archieven, concentreeert het handboek zich vooral op de wettelijke verplichting tot archivering. Bij het bewaringsproces zelf zijn er drie belangrijke juridische aspecten waar rekening mee moet worden gehouden: -
De openbaarheidsverplichting: bestuursdocumenten moeten bewaard blijven, zowel om een efficiënte dienstverlening te garanderen, als voor de openbaarheid van het bestuur.
-
De bescherming van de persoonlijke levenssfeer: zowel bij de vorming van een archief als bij het beheer en disseminatie ervan moet rekening worden gehouden met strikte reglementering in verband met bescherming van de privacy.
-
Het auteursrecht: een auteur heeft het monopolie op de exploitatie van zijn werk, hetgeen tot gevolg heeft dat langdurige bewaring, en de processen die daarvoor nodig zijn, aan bepaalde voorwaarden zijn verbonden. Migratie en emulatie houden bijvoorbeeld steeds een copiëren van de inhoud van een object in. Naast concrete nationale wetgeving in verband hiermee zijn 3 internationale verdragen van belang: de Berne Conventie voor de Bescherming van Literair en Artistiek Werk99, de TRIPS Treaty (Trade Related Aspects of Intellectual Property Rights – dit verdrag legt zware straffen op voor inbreuk op auteursrechten)100, en de WIPO Copyright Treaty101. Artikel 9 van de Berne conventie stelt dat copiëren met als doelstelling bewaring toegelaten is onder bepaalde voorwaarden (nl. dat het normale gebruik van een werk niet in het gedrang komt, en dat de legitieme rechten van de auteur niet aangetast worden), en het WIPO verdrag breidt deze voorzieningen uit naar digitale informatie102.
Minerva heeft een sub-werkgroep die binnen de Europese context onderzoek doet naar bescherming van intellectueel eigendom bij digitaliseringsprojecten (c.i.)103. Het DAVID-project wijdt ook een speciaal rapport aan auteursrecht104. Als de auteur van een werk identificeerbaar is en bereid om een licentie af te sluiten, is dit de voor de hand liggende oplossing. Als dit onmogelijk is, kan een archief beroep doen op de uitzondering voor wetenschappelijk onderzoek en het beschermd werk toch opnemen in de collectie. Het concrete gebruik ervan – het gevoelige punt bij auteursrechtkwesties – kan dan pragmatisch worden geregeld, zoals bijvoorbeeld door het opleggen van bepaalde gebruiksvoorwaarden (enkel persoonlijk gebruik, ...). Het Reproductiefonds, een initiatief van de Vlaamse Overheid dat in de loop van 2005 echt van start zal gaan, heeft als één van zijn kerntaken het ontwikkelen van een kenniscentrum niet alleen in verband met technische, maar ook juridische aspecten van beeldrechten en beeldverwerking105. Voor het concrete beschermen van auteursrechten op digitaal materiaal wordt aan verschillende sporen gewerkt: propriëtaire systemen voor watermerking (bv. Digimarc106), het DOI systeem (Digital Object Identifier)107 en het elektronische handtekeningensysteem (bijv. XML Signature WG108), waarvan echter nog geen echt stabiele, algemeen aanvaarde standaarden zijn. DigiCULT bespreekt in zijn tweede Technology Watch Report de technologische aanpak van auteursrechtenbescherming, via "digital rights management" software en geautomatiseerde betalingssystemen109. Kortom, de juridische aspecten blijken allerminst onoverkomelijk. Ze vragen enkel aandacht en nauwkeurige analyse in het begin van een bewaringsproject, eventuele onderhandelingen, en een continuë waakzaamheid in het dagelijks beheer110. Vanzelfsprekend moet er rekening gehouden worden met de specifieke regelingen binnen het nationale rechtssysteem waar een project wordt uitgevoerd.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
15
Ook de regelingen voor het wettelijk depot zijn de afgelopen jaren geëvolueerd onder invloed van de toenemende hoeveelheid digitale informatie. Een overzicht van recente aanpassingen in wetgeving betreffende wettelijk depot voor digitale objecten vindt men terug bij Hodge111. 5.
De verschillende actoren
Het probleem van digitale bewaring werd eerst door instellingen onderkend die traditioneel instaan voor de bewaring van het erfgoed zoals bibliotheken en archieven, maar het besef groeit dat het probleem veel ruimer is, en dat ook andere instanties belang hebben bij een actieve betrokkenheid bij de problematiek: de overheid, onderzoeksinstellingen, musea, commerciële bedrijven die grote hoeveelheden data beheren, ICT vendors, ... Gezien de omvang en kostprijs van digitale bewaringsprojecten, is het belangrijk de verschillende belanghebbenden te identificeren, om tot samenwerkingen te komen112. Verschillende invalshoeken leggen andere accenten wat dit betreft. Lavoie (c.i.) onderscheidt voor zijn studie van een economisch duurzaam model voor digitale bewaring "right holders" (degenen die over de intellectuele rechten van het te materiaal beschikken), "beneficiaries" (degenen die baat hebben bij het digitaal opslaan van bepaalde materialen, zowel direct (gebruikers) als indirect (bibliotheken, erfgoedinstellingen, ...) en "archives" (die voor de implementatie en het beheer van bewaringssystemen zorgen)113. Hodge geeft een gedetailleerd overzicht van recente ontwikkelingen wat samenwerkingen en concrete initiatieven betreft114. Ruim de helft van de wetenschappelijke uitgevers ondernemen digitale bewaringsprojecten. Dit is een logisch gevolg van het feit dat een uitgeverij intellectuele eigendomsrechten beheert en economisch voordeel doet bij veelvuldig hergebruik van publicaties. Nationale bibliotheken ziet Hodge als de meest geschikte instanties om bewaringsprojecten op lange termijn te beheren, omdat dit in het verlengde ligt van het mandaat van wettelijk depot voor analoge publicaties. Uitgeverijen en bibliotheken nemen meer en meer gezamelijke initiatieven op gebied van digitale bewaring. Zo werkt de Koninklijke Bibliotheek van Nederland samen met Elsevier, Kluwer en BioMed Central om collecties digitaal te bewaren en beschikbaar te stellen aan het publiek volgens specifieke, formele overeenkomsten met elk van de uitgeverijen. Instellingen zoals onderzoeksuniversiteiten spelen ook een toenemende rol. Voor hen is digitalisering geen vervanging van, maar eerder een aanvulling op de traditionele wetenschappelijke publicatiemethoden, zoals tijdschriften, waar soms geruime tijd verstrijkt alvorens onderzoeksresultaten in het publieke domein komen. Ook musea zien meer en meer de voordelen van digitalisering. Zeldzame of kwetsbare artefacten worden zo toegankelijker, wetenschappelijk onderzoek wordt aangemoedigd, restauratieactiviteiten ondersteund, de verzekering gerustgesteld, ... Verder zorgen virtuele tentoonstellingen of rondleidingen voor een grotere bekendheid van musea, en stimuleren zo hun educatieve taak. Archieven zijn van meet af aan heel actief geweest in digitale bewaringspraktijken en -onderzoek, omdat zij over enorme hoeveelheden materiaal in heel diverse formaten beschikken en een duidelijke bewaarfunctie op lange termijn hebben. Archieven zijn onder meer actief in het opstellen van selectiecriteria voor objecten die in aanmerking komen voor digitale bewaring. Zo werkt de NARA (National Archives and Records Administration) bijvoorbeeld aan criteria specifiek voor selectie van wetenschappelijke data115. DWTI
INFORMATIENOTA: DIGITALE BEWARING
16
Derde partijen, of organisaties die diensten leveren op vlak van digitale bewaring zonder zelf eigenaar van het materiaal, uitgever of gebruiker te zijn, spelen ook een niet te onderschatten rol. Hieronder vallen in feite de nationale bibliotheken, die reeds apart besproken werden, en nonprofitorganisaties zoals JSTOR116 (c.s.). Overheden zijn op verschillende gebieden actief. Naast directe subsidies aan bibliotheken, archieven, musea, overheidsinstellingen, ... gaan er ook indirecte subsidies naar privé-initiatieven en gezamelijke publiek-privé initiatieven. Zo ondersteunt bijvoorbeeld het Directoraat-Generaal Information Society van de Europese Unie onderzoeksprojecten en innovatieve digitaliseringsprojecten over digitalisering, en het Nederlandse Ministerie van Onderwijs subsidieerde Elsevier Science voor het archiveringsproces van vaktijdschriften. De US Congress geeft aanzienlijke financiële steun aan het omvattende NDIIPP project (National Digital Information Infrastructure and Preservation Program)117, een samenwerkingsverband tussen verschillende bibliotheken, onderzoeksinstellingen, federale instellingen, ..., geleid door de Library of Congress, dat aanbevelingen doet over zowel beleidsopties als technische aspecten van digitale bewaring. Zowel subsidiëring als politieke bewustmaking vanuit de overheid is noodzakelijk voor digitale bewaring, omdat het noodzakelijke engagement voor een lange termijn niet vanuit de markt zal komen. Een andere rol voor de overheid is de creatie van wetgeving en richtlijnen die digitaliseringsinitiatieven ondersteunen en barrières wegnemen. Zo houden verschillende nationale beleidsinitiatieven in verband met "e-government" ook aanwijzingen voor digitalisering en bewaringsstrategieën in. In Australië wordt in richtlijnen in verband met "e-government" een infrastructuur bepaald voor digitale bewaring, waarin bijvoorbeeld metadata standaarden en "persistent identifiers" als essentiële componenten worden voorgesteld. Bepaalde privé-instanties subsidiëren ook digitale bewaringsprojecten, zoals bijvoorbeeld de Andrew W. Melan Foundation, die JSTOR, FEDORA, DSpace en LOCKSS financieel steunt. De Vereniging Digitaal Erfgoed Nederland geeft bijvoorbeeld tips voor het voorbereiden van een aanvraag voor financiering, samen met een lijst Nederlandse fondsen en Europese subsidiëringsmogelijkheden voor digitale bewaringsprojecten118. Een risico van privé- (en Europese!) subsidiëring is dat het enkel wordt uitgereikt voor onderzoeksen experimentele fases, maar stopgezet eens projecten in een operationele fase geraken 6.
Kosten
Naast de technische vragen die digitale bewaring oproept, is er ook een financieel luik dat aandacht verdient. Als digitale bewaring van experimentele projecten evolueert naar een algemeen toegepaste methode voor archieven, bibliotheken, musea, wetenschappelijke instellingen, ..., stelt het probleem van economische duurzaamheid zich. De informatie die hierover beschikbaar is, beperkt zich op dit moment tot financiële informatie over concrete projecten, en het ontwikkelen van kostenmodellen. Een overkoepelend economisch model is er (nog) niet. Lavoie wil daar met zijn paper The incentives to preserve digital materials een aanzet toe geven119. De auteur ziet de kwestie van de drijfveren voor digitale bewaring als de fundamentele vraag bij het opstellen van een dergelijk model. Hij definieert digitale bewaring als een "aftermarket service", een dienst die de waarde en de duurzaamheid van een object vergroot. Dit staat tegenover een primaire markt, waar men zich goederen en diensten aanschaft. Lavoie geeft een aantal mogelijke scenario’s voor digitale bewaring op basis van organisationele modellen van relaties tussen betrokken beslissingnemers, en stelt dan bij elk scenario de vraag naar drijfveren om de nodige financiële inspanning te doen. Hij concludeert dat die in onvoldoende mate aanwezig zijn: een digitale bewaringsmarkt zal enkel kunnen functioneren als er echte stimulansen voor digitale bewaringsprocessen gecreëerd worden. DWTI
INFORMATIENOTA: DIGITALE BEWARING
17
Hierover is verder onderzoek nodig, maar hij haalt reeds enkele voorbeelden aan: aangezien de persoon die het materiaal in eigendom heeft niet altijd degene is die voordeel doet bij de bewaring ervan, kan er met een subsidiesysteem gewerkt worden van de personen die winnen bij een bewaringsproject aan de eigenaars van het materiaal. En betalende toegang tot objecten kan profiteurs voorkomen, die afwachten tot andere instellingen de digitaliseringsinspanning doen om er dan gratis van mee te genieten. Andere sporen die nog moeten worden uitgediept zijn concrete prijsbepalende strategieën, case studies en verdere analyse van de "aftermarket"-status van digitale bewaringspraktijken. Zoals reeds vermeld, hebben een aantal auteurs modellen ontwikkeld om kost-elementen te identificeren. Een of een aantal basisformules die deze elementen ook effectief kwantificeren, zijn op dit moment onmogelijk te geven. Er zijn ten eerste onvoldoende data beschikbaar: digitale bewaring is te nieuw, de projecten zijn te recent en bieden nog geen duidelijk beeld van de inspanningen die op lange termijn nodig zijn. Bovendien zijn de technische strategieën nog volop in evolutie, en moeten de processen nog juister gedefinieerd worden en uitgetest in productieomgevingen. Verder zijn er veel variabelen bij de berekening betrokken (periode van bewaring, gebruikte technologieën en bestandsformaten, concrete strategie, hoe en aan wie wordt toegang verleend, hoeveel metadata worden opgeslagen, welke mengeling van arbeidsintensieve en geautomatiseerde processen zal gebruikt worden, ...). Op dit moment beperken de inspanningen zich dan ook tot beschrijvingen en check-lists van de voornaamste kost-elementen. Hiertoe zijn belangrijke bijdragen geleverd door de Task Force on Archiving of Digital Information120, door T. Hendley121, K. Russell voor het CEDARS project122, S. Sanett123, en ERPANET Cost Orientation Tool124. Algemeen zijn de verschillende instellingen en auteurs het erover eens dat een digitaal bewaringsproces duurder is dan het onderhouden van analoog materiaal, omdat er een continu, actief beheer nodig is gedurende een lange periode. De British Library publiceerde een studie die schat dat het onderhouden van een digitale collectie voor 25 jaar 20 keer duurder zou uitvallen dan het onderhouden van een papieren archief. Van zodra er meer dan 10.000 nieuwe publicaties per jaar in de collectie worden opgenomen, zou deze kostprijs weliswaar kunnen zakken tot 5 keer duurder125. Het is ook belangrijk dat van in het begin van een bewaringsproject een lange termijnvisie aangehouden wordt, waar men zich consistent aan houdt, anders zullen de kosten van een serie noodingrepen snel escaleren. De ware kost van een digitaal object moet dus over de volledige levenscyclus gezien worden. De waarde van een object blijkt uit het gebruik dat van een object wordt gemaakt in deze periode, stelt het Europese PRESTO-project, dus de bedoeling van een digitaal bewaringsproject is niet de algemene processen zo goedkoop mogelijk houden, maar de kost/gebruik ratio klein houden126. Hoewel deze benadering vanuit financieel opzicht logisch klinkt, moet er een voorbehoud bij worden gemaakt: is het wel mogelijk de waarde van een wetenschappelijk of cultureel object volledig te laten bepalen door de populariteit ervan bij zo groot mogelijke groepen van gebruikers? Door elektronische toegang te verlenen, kan bovendien de gebruikersgroep aanzienlijk toenemen. De kost-effectiviteit van een digitaal bewaringsproject kan wel aanzienlijk vergroot worden als verschillende instellingen samenwerken om collecties te onderhouden, als er minder lokale volledig uitgeruste bibliotheken, archieven, ... onderhouden moeten worden, als de langetermijnwaarde van de digitale collectie groter is dan de onderhoudskosten, en als er door elektronische toegang te verlenen ook meer gebruik van wordt gemaakt127. Over het financieren van digitale collecties door betalende toegang tot digitale producten en diensten is al heel wat onderzoek gebeurd, bijvoorbeeld door het PEAK project (Pricing Electronic Access to Knowledge)128, CLIR (Council on Library and Information Resources, Washington)129, en DWTI
INFORMATIENOTA: DIGITALE BEWARING
18
individuele auteurs130. Deze analyses hebben met elkaar gemeen dat ze zich concentreren op toegang tot informatie en diensten betalend maken, terwijl er ook de optie is van een prijs voor digitale bewaringsactiviteiten op te leggen. De Yale University Library en Elsevier Science werkten 5 verschillende benaderingen uit voor het financieren van het digitaal archiveren: eenmalige betaling, doorlopende archiveringskosten, het traditioneel bibliotheekmodel, betalen voor concrete diensten, en een hybride versie waarbij verschillende partijen een andere van deze rollen op zich nemen131. De meeste huidige commercialiseringsmogelijkheden voor digitale objecten bieden abonnementsystemen voor betalende toegang, die duurder kan worden naarmate meer gedetailleerde informatie of meer ondersteunende diensten worden gevraagd. Een recent voorbeeld is het British Library Sound Archive132, dat online vrije toegang verleent tot meer dan 2,5 miljoen geluidsopnames, en daarnaast een aantal betalende diensten voorziet, zoals levering van kopieën en spectrogrammen. Daarnaast zijn digitaliseringsinitiatieven ook meer en meer rechtstreeks op commercialisering gericht, zoals bijvoorbeeld het al eerder vermelde Reproductiefonds133, een initiatief van de Vlaamse Overheid dat vanaf 2005 beeldmateriaal van het Vlaamse culturele erfgoed digitaal ter beschikking wil stellen en commercialiseren, zoals bijvoorbeeld ook de Bridgeman Art Library134 (met adressen in Londen, Parijs, New York, en Berlijn) of de Réunion des Musées nationaux135 doen. Een ander voorbeeld is het Turning The Pages-project136 van de British Library voor digitalisering van boeken en manuscripten. In 1998 werd een eerste publicatie online gezet, de Lindisfarne Gospels, en het project is zowel inhoudelijk als technisch verder blijven ontwikkelen. Het Turning The Pages-systeem wordt nu ook commercieel aangeboden, met de mogelijkheid om naast de technologie ook logistieke ondersteuning en organisatorische hulp te verkrijgen137. V.
Besluit: de belangrijkste trends voor de toekomst
Een eerste, duidelijk waarneembare trend die enkel in belang zal toenemen, is het stijgende aantal initiatieven voor samenwerking en informatieuitwisseling in verband met digitale bewaring. Een multilaterale aanpak is de enige haalbare manier om digitale bewaring te verzekeren, gezien de enorme hoeveelheden materiaal die beheerd moeten worden, de technische complexiteit van het bewaarproces op lange termijn, en de aanzienlijke kosten die dit met zich meebrengt. Zowel de Europese Unie als UNESCO bijvoorbeeld benadrukken het belang van samenwerking en het creëren van netwerken, het delen van ervaringen, het verspreiden van "good practices" en standaarden en het uitwisselen van kennis en vaardigheden voor efficiënte digitale bewaring op lange termijn.138 Voorbeelden van concrete samenwerkingsverbanden zijn de Digital Preservation Coalition139, de NDIIPP140, en het PATCH project141. Dit laatste project is een geïntegreerd onderzoeks- en ontwikkelingsproject op initiatief van de Koninklijke Bibliotheek in Nederland, dat evenwel (nog) geen voldoende subsidies heeft kunnen vinden om van start te gaan. Met 16 andere organisaties uit 6 verschillende landen wou PATCH zich toeleggen op het probleem van permanente toegang tot digitaal materiaal, en daarvoor tools en methodologieën te ontwikkelen (de "PATbox"). Dit brengt ons bij een tweede trend: de aandacht van de verschillende actoren blijft toch nog vooral gevestigd op het verwerven van zoveel mogelijk digitaal materiaal, en dat op dit moment toegankelijk stellen. Een lange termijnvisie op toegankelijkheid ontbreekt nog dikwijls, en de nodige metadata en technologische aspecten die daarvoor essentieel zijn, blijven in grote mate onuitgediept142.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
19
Er wordt steeds meer nuttig werk verricht in verband met standaardisatie, via het samenbrengen van "best practices" van vele concrete initiatieven. Dit helpt mee om een grotere interoperabiliteit tussen systemen of collecties te bekomen, wat zoals reeds eerder aangehaald de enige efficiënte manier is om digitaal materiaal te beheren en beschikbaar te houden. Verschillende auteurs wijzen erop dat op het gebied van interoperabele systemen meer onderzoek nodig is, bijvoorbeeld naar gefedereerde archieven en goede omvattende search-functies143. Hodge wijst ook nog op het belang van de concrete "off-the-shelf" systemen voor digitale bewaring die recent door samenwerkingen tussen verschillende actoren ontwikkeld werden144. Deze systemen kunnen geïmplementeerd worden door andere instellingen, en hebben variabele niveau’s van aanpasbaarheid aan verschillende specifieke situaties en omgevingen. Sommigen kunnen aangekocht worden (wat de ontwerpers helpt hun eigen systeem en onderzoek financieel te steunen), anderen zijn beschikbaar als "open source" software. De belangrijkste zijn: het DSpace Institutional Digital Repository System145, DIAS (Digital Information Archive System)146, OCLC Digital Archive147, PANDAS (PANDORA Digital Archiving System)148, LOCKSS (Lots Of Copies Keep Stuff Safe)149, en FEDORA (Flexible Extensible Digital Object Repository Architecture)150. Een ander voorbeeld is het al eerder vermelde Turning The Pages-project151 van de British Library.152 Hier wordt niet enkel een technisch systeem aangeboden, maar ook organisatorische en logistieke diensten bij de implementering. Er blijven nog een groot aantal technische aspecten die meer onderzoek vragen. Zo wijst Hedstrom erop dat het beheren van digitale collecties op dit moment een zeer arbeidsintensieve bezigheid is, hetgeen duur uitvalt153. Onderzoek naar nieuwe tools die delen van dit proces zouden automatiseren, is een prioriteit. Het automatisch genereren, extraheren en beheren over tijd (uitbreiden, herzien, ...) van metadata is hier een voorbeeld van. Verder is er nog meer onderzoek naar voordelen, nadelen en kosten van de verschillende technologische bewaringsstrategieën nodig om te kunnnen komen tot echte evaluaties en het opstellen van beslissingsmodellen voor de meest geschikte strategie. Naast technologische vragen blijven er ook sociale, politieke en economische problematieken spelen. De vraag naar het ontwikkelen van concrete, toepasbare economische modellen valt hieronder. Zo’n model zou vanzelfsprekend een belangrijke rol spelen bij het ontwerpen van een bewaringsstrategie of het evalueren van verschillende opties. Lavoie zet een aantal sporen uit voor onderzoek naar een werkbaar economisch model voor digitale bewaring154. Ook beleidsopties en mogelijke motivaties voor engagement en investeringen in verband met digitale bewaring dienen verder uitgediept te worden, om op de meest efficiënte manier tot vruchtbare samenwerkingen tussen de verschillende actoren te komen. Verder zouden alle belangstellenden, heel concreet, baat hebben bij een overzicht van alle subsidiërende instanties en stichtingen, om de zoektocht naar onderzoeks- en projectgelden te vergemakkelijken. Samenvattend kunnen we stellen dat het uitwerken van een goed functionerende infrastructuur voor een betaalbaar, duurzaam en efficiënt syteem van digitale bewaring nog een aanzienlijke hoeveelheid onderzoek zal vragen.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
20
DEEL II. ACTIVITEITEN EN INITIATIEVEN VAN DE EUROPESE UNIE I.
Het Kaderprogramma voor Onderzoek en Technologische Ontwikkeling (DigiCULT)
DigiCULT (Digital Heritage and Cultural Content)155, een activiteit beheerd door het DirectoraatGeneraal Informatiemaatschappij156 van de Europese Commissie wil via onderzoek systemen ontwikkelen voor digitale bewaring en ontsluiting van alle soorten culturele en wetenschappelijke bronnen. DigiCULT maakte reeds deel uit van het IST-programma (Information Society Technologies) van het 5de Kaderprogramma voor Onderzoek en Technologische Ontwikkeling (KP voor OTO), en behoort binnen het 6de KP voor OTO (2002-2006) tot de thematische onderzoeksprioriteit IST. De onderzoeksprojecten en de projecten die technologische toepassingen ontwikkelen, de topnetwerken en coördinatieacties die zo door de Europese Unie gefinancierd worden, spitsen zich toe, onder andere, op digitalisering van het cultureel patrimonium en digitale bewaring op lange termijn157. Het DigiCULT Forum volgt de nieuwste technologische ontwikkelingen op, verzamelt de ervaringen van instellingen die ze gebruiken, en tracht in te schatten welke technologieën direct toepasbaar zijn, welke nog onderzoekswerk vereisen, en welke nieuwigheden beloftevol zijn en verder ontwikkeld dienen te worden. Deze informatie wordt samengebracht op de website www.digicult.info in de nieuwsbrief DigiCULT.info, 7 thematische analyses waarvan er op dit moment reeds 5 beschikbaar zijn158, en een jaarlijks Technology Watch Report (TWR). Het meest recente TWR behandelt de volgende thema’s: technologische interoperabiliteit tussen sectoren, standaarden, nieuwe benaderingen die een persoonlijke beleving van het erfgoed mogelijk maken, en mechanismen die een verrijkte reële en virtuele omgeving creëren159. II. De Beginselen en het Actieplan van Lund Het eEurope 2002-programma, dat de sleutelrol van digitalisering erkent voor het toegankelijk maken en houden van culturele en wetenschappelijke bronnen160, roept op tot concrete samenwerking tussen de lidstaten, aangezien succesvolle, duurzame digitalisering een aanzienlijke menselijke en financiële inspanning vraagt161. Een belangrijke stap hierin werd gezet op een bijeenkomst van vertegenwoordigers en experten van de lidstaten in Lund, Zweden, in 2001, op initiatief van de Commissie. De deelnemers formuleerden een aantal conclusies en aanbevelingen, die de Beginselen van Lund genoemd worden. Met deze principes werd een gezamenlijke strategie vastgelegd om een Europees kader voor digitalisering en digitale bewaring te creëren162. Op basis van deze strategie werd een concreet agenda ontworpen van activiteiten die door de Commissie en de lidstaten ondernomen moesten worden, het Lund-Actieplan163. III. De coördinatie van het digitaliseringsbeleid in de EU en het Minerva-netwerk Met de beginselen en het actieplan van Lund voor ogen nam de Europese Commissie een initiatief om het digitaliseringsbeleid van cultureel en wetenschappelijk erfgoed in EU te coördineren. Een groep van nationale vertegenwoordigers (National Representatives Group – NRG) werd opgericht waarin België vertegenwoordigd wordt door de Franse en de Vlaamse Gemeenschap, die bevoegd zijn voor culturele aangelegenheden. De NRG heeft een coördinerende functie, met bijzondere aandacht voor culturele en wetenschappelijke hulpbronnen en de bijdrage van publieke culturele instellingen164. Op de halfjaarlijkse vergaderingen worden nationale ervaringen uitgewisseld en samenwerkingen in een Europese context georganiseerd.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
21
Minerva (MInisterial NEtwoRk for Valorising Activities in digitisation)165 ondersteunt dit initiatief en het Lund-Actieplan sinds maart 2002 op logistiek, methodologisch en conceptueel vlak, en werd gefinancierd als begeleidende maatregel van het IST-programma (5de KP voor OTO). In de context van het Belgische voorzitterschap van de Raad van Cultuur in 2001 was het Ministerie van de Franse Gemeenschap hierbij betrokken. In 2004 werd het project binnen het 6de Kp voor OTO onder de naam "Minerva Plus" uitgebreid tot de 10 nieuwe lidstaten, Rusland en Israel. In september 2002 werd overeengekomen met de Franse, Vlaamse en Duitstalige Gemeenschappen dat het Federale Wetenschapsbeleid bij het opvolgen van het Lund-Actieplan voor de duur van het volledig Minerva-project zou worden betrokken via een ad hoc overleggroep. De Franse Gemeenschap die reeds een belangrijke rol speelde in het project, is verantwoordelijk voor de coördinatie en het secretariaat van deze overleggroep. Minerva neemt het secretariaat van de NRG-bijeenkomsten op zich, de implementatie van het Lund Actieplan en de coördinatie van 5 werkgroepen van experten, waarvan de werkresultaten op de Minervawebsite gepubliceerd worden: "benchmarking"; interoperabiliteit; "good practices" en competentiecentra; inventarissen, localiseren van digitale inhoud en meertaligheid; en kwaliteitsvolle toegang166. Verder verzamelt Minerva informatie in verband met en ervaringen van nationale digitaliseringsinitiatieven, zoals een overzicht van nationale profielen in verband met digitaliseringsactiviteiten, een overzicht van "good practices" en competentiecentra, richtlijnen voor digitalisering, en Europese en nationale regels voor webapplicaties. De meest recente bijeenkomst van de NRG vond plaats in november 2003167. Daar werden recente resultaten overlopen, een aantal korte termijnacties vastgesteld en enkele lange termijnkwesties aangesneden168. Tevredenheid was er onder andere over: -
de vooruitgang op het vlak van richtlijnen voor kwaliteitsregels voor culturele websites, waar een eerste versie van het handboek werd gepresenteerd 169;
-
de afwerking van het handboek voor "Good Practices"170,
-
de vooruitgang in verband met concrete digitaliseringsactiveiten, waar de klemtoon ligt op bewustmaking van het belang, uitwisseling van methodes, en ontwikkeling van een lange termijnstrategie ("Firenze agenda"171). Dit zal ook onder het Nederlandse voorzitterschap (vanaf juli 2004) opnieuw opgenomen en verder uitgewerkt worden;
-
de afwerking van een tekst over technische richtlijnen172 om nieuwe digitaliseringsprogramma’s te ondersteunen en interoperabiliteit daadwerkelijk aan te moedigen en een voorwaarde te maken voor financiering.
Onderwerpen waar op dit moment hard aan gewerkt worden, zijn bijvoorbeeld de Minerva Knowledge Base, waar alle gegevens in verband met digitalisering in Europa in terug te vinden zullen zijn (stand van zaken in de verschillende lidstaten, adviescentra, richtlijnen, resultaten van "benchmarking" en trainingen), tesamen met een "Who’s who"-sectie. Deze databank zal op de Minerva-website te consulteren zijn. Ook aan het kader voor benchmarking wordt veel aandacht besteed door de betreffende Minerva werkgroep. Het idee van met benchmarking te werken om waardevolle digitaliseringspraktijken te selecteren en uit te wisselen, stamt reeds van de bijeenkomst in Lund, en blijft veelbelovend in de verdere uitwerking173. Het Patras-Rome initiatief (zo genoemd omdat het op de agenda’s van zowel het Griekse als het Italiaanse voorzitterschap belangrijk was) focust op de maatschappelijke en economische waarde van digitale bewaring. Naast aandacht voor het werk aan technische richtlijnen, kwamen hier ook de noden van kleinere culturele organisaties aan bod. De verdere analyse van deze specifieke behoeften is opgenomen in het werkplan van Minerva Plus.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
22
IV. Nieuwe strategische uitdagingen De nationale experts wijzen op het belang van nieuwe interactieve technologieën, die goedkoper en gebruiksvriendelijker worden, en waarvan de populariteit dus snel zal toenemen174. Zo zijn er bijvoorbeeld Virtuele Realiteitsapplicaties en 3D-visualisering175 die steeds meer gebruikt worden in culturele erfgoedprojecten en de gebruiker een vernieuwende ervaring bezorgen176. Een zorgvuldige technologische wake en analyse van de mogelijkheden (technische problemen, interoperabiliteit, "best practices", …) is nodig, omdat deze nieuwe technologieën mogelijkheden bieden voor een nieuwe aanpak van interactieve, culturele evaringen. Reglementeringen rond intellectuele eigendomsrechten blijven culturele projecten bemoeilijken. De NRG besliste dan ook een aantal concrete initiatieven te nemen, zoals het organiseren van een training over dit onderwerp, de ontwikkeling van een model voor management van digitale intellectuele eigendomsrechten, het herzien van de implementatie van de Copyright Directive, en het bepalen van parameters voor een veilige en beschermde omgeving voor digitale erfgoedcollecties177. Het Ierse voorzitterschap organiseert in juni 2004 een conferentie over portaalsites vanuit het oogpunt van de eindgebruiker, aangezien steeds meer lidstaten het toenemende belang van portaalsites en cultuurnetten aangeven om een ruim publiek te bereiken en een uitgebreide waaier aan online diensten te kunnen aanbieden178. Het Lund-Actieplan wordt in 2005 afgerond. De NRG en Minerva bereiden een overzicht voor van zowel voortgezette als nieuwe doelen, acties en instrumenten, dat waarschijnlijk voorgesteld zal worden op de bijeenkomst in november 2004 onder het Nederlandse voorzitterschap. De Nederlandse vertegenwoordiger heeft al een bijdrage geleverd met zijn tekst Position paper on EU added value and post-Lund strategy179. Hij pleit hier voor de creatie van een "European area for digitised cultural resources" -- een vrij en onbeperkt toegankelijke Europese culturele ruimte. Deze ruimte ziet hij als een digitaal continuum, dat de beperkingen van portaal- en andere websites overstijgt: het is op het scherm van de gebruiker dat alles samenkomt. Hij pleit voor een benadering die voortbouwt op de verwezenlijkingen van Minerva, maar die de gebruiker en zijn ervaring centraal stelt, dit in tegenstelling tot het meer institutioneel gerichte Lund-perspectief.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
23
DEEL III. ACTIVITEITEN EN INITIATIEVEN IN BELGIË I.
Inleiding: de verschillende overheden en digitalisering
Sinds de staatshervorming van 1980 valt het cultuurbeleid (inclusief de erfgoedinstellingen zoals bibliotheken, archieven en musea) onder de bevoegdheid van de Gemeenschappen. Een aantal instellingen (de Federale Wetenschappelijke Instellingen), die een onverdeelbaar en kostbaar kapitaal vertegenwoordigen met niet enkel nationale maar ook internationale uitstraling, bleven onder de bevoegdheid van het Federaal Wetenschapsbeleid180. De Vlaamse181, Duitstalige en Franse Gemeenschap182 hebben, net als de federale overheid183, elk een overzicht van de stand van hun digitaliseringsprogramma’s opgesteld (zie ook de nationale profielen op de Minerva-website184). De Duitstalige en Franse Gemeenschap geven beiden aan dat ze (nog) niet over een omvattend digitaliseringsbeleid beschikken, maar dat er wel een aantal concrete digitaliseringsprojecten zijn gestart en informatienetwerken gevormd. De Franse Gemeenschap heeft bovendien een voorbereidende studie opgezet die een gecoördineerde aanpak van digitalisering moet voorbereiden door het inventariseren van de collecties, identificeren van geschikte technologieën, en inschatten van de nodige budgetten185. Voor Vlaanderen valt digitalisering onder het omvattende eFlanders-programma, dat aansluit op de krachtlijnen van het eEurope 2002-actieplan en het Digitaal Actieplan Vlaanderen voorstelt, met de volgende krachtlijnen: het voorzien in een hoogwaardige en toegankelijke infrastructuur, het ontwikkelen van een ware kennismaatschappij, het stimuleren van een digitaal Vlaanderen op vlak van zowel "e-government" als economie, en een inclusieve en democratische informatiesamenleving186. Daartoe is de coördinatiegroep Digicult Vlaanderen opgericht in september 2002. Binnen dit kader zal een concreet digitaliseringsbeleid voor het culturele en wetenschappelijke erfgoed uitgestippeld worden. Er zijn evenwel, net als in de Duitstalige en Franse Gemeenschappen, heel wat interessante concrete projecten aangevangen en (al dan niet systematisch) werk verricht in verband met inventariseren en "resource discovery", "good practices" en competentiecentra, kwaliteitsvereisten voor websites, en onderzoek naar digitalisering187. Ook is het initiatief genomen een ad hoc overleggroep (zie Deel II) op te richten voor de opvolging van het Lund-Actieplan en het Minerva-netwerk, waar de drie Gemeenschappen en de Federale overheid in vertegenwoordigd zijn188. II. De Federale Overheid Deze gegevens zijn vanzelfsprekend welbekend voor wie bij de Federale Wetenschappelijke Instellingen (FWI’s) betrokken is, en zijn dan ook voornamelijk bestemd voor lezers die niet tot het departement van het Federaal Wetenschapsbeleid behoren. 1.
Modernisering van de Federale Wetenschappelijke Instellingen: Horizon 2005
Op initiatief van de Minister van Wetenschappelijk Onderzoek en de Regeringscommisaris voor Wetenschapsbeleid werd in mei 2002 het Witboek voor de modernisering van de Federale Wetenschappelijke Instellingen: Horizon 2005 uitgebracht189. In juli 2003 trad de volgende regering aan, met de belofte de aanbevelingen van het Witboek te implementeren.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
25
De algemene doelstelling is de FWI’s op het hoogste internationale peil te brengen wat betreft de kwaliteit en sociale relevantie van hun onderzoek en dienstverlening, en te garanderen dat dit niveau gehandhaafd kan blijven. Daartoe stelt het Witboek acht actieprogramma’s voor. Het eerste actieprogramma is Gebruik van nieuwe informatietechnologieën om het patrimonium zichtbaarder, toegankelijker en bruikbaarder te maken, en de langdurige bewaring ervan te verzekeren. 2.
Digitalisering van het erfgoed van de FWI's en het KBF: inventaris en strategische studie
In maart 2003 leverde het bedrijfsconsulentenbureau Van Dijk het eindrapport af van de Studie in verband met de digitalisering van het cultureel en wetenschappelijk patrimonium van de FWI's en het Koninklijk Belgisch Filmarchief. In het kader van de studie werd een begeleidingscomité opgericht met vertegenwoordigers van alle FWI’s, het Koninklijk Belgisch Filmarchief (KBF) en de Programmatorische Federale Overheidsdienst (POD) Wetenschapsbeleid. Alle 217 collecties die door deze instellingen beheerd en gevaloriseerd worden alsook de fondsen van het Rijksarchief werden geïnventariseerd. De collecties bevatten meer dan 60 miljoen objecten van alle types: boeken, tijdschriften en andere tekstdocumenten, archieven, audiovisueel materiaal, kunstvoorwerpen, wetenschappelijke voorwerpen,... Er zijn grote verschillen tussen de graad van digitalisering die reeds doorgevoerd is in de verschillende instellingen. Tot op heden gebeurde de digitalisering eerder op een ad hoc basis, met de hulp van contractueel personeel en gefinancierd met speciale kredieten door bijvoorbeeld de POD Wetenschapsbeleid of de Nationale Loterij. In totaal, minder dan 1 object op 8 is momenteel opgenomen in een geïnformatiseerde catalogus en minder dan 1 object op 300 heeft een digitale kopie. Het werd onmiddellijk duidelijk dat het accent in de eerste plaats op de prioritaire fase van digitalisering zelf (catalogi en digitale kopieën van de objecten) en van digitale ontsluiting (toegang op het Internet) zou liggen. De directeurs van de FWI’s en van het KBF benadrukken weliswaar in hun eindconclusies dat digitale bewaring op lange termijn een concreet en permanent aandachtpunt is en dat bewustwording, voortdurende waakzaamheid en verder onderzoek vereist zijn. Bewaring is geen "populair" thema omdat het om een voortdurende kost gaat, maar er is geen alternatief. Om de opportuniteit en de prioriteit van digitalisering te bepalen, moet men met drempelcriteria en evaluatiecriteria rekening houden. Drempelcriteria laten toe om op een fundamenteel niveau na te kijken of digitalisering opportuun is: een inhoudelijk drempelcriterium is bijvoorbeeld of een verzameling aansluit bij de kerntaken van een instelling, een technisch drempelcriterium of het digitaliseren van het object via aanvaarde standaarden kan gebeuren, en een beheersmatig drempelcriterium of er voldoende garanties zijn dat ook op langere termijn financiële middelen gevonden kunnen worden voor het onderhouden van de digitale collectie. Evaluatiecriteria evalueren hoe belangrijk en dringend digitalisering is voor een collectie. Een inhoudelijk evaluatiecriterium is bijvoorbeeld de wetenschappelijke en culturele waarde van een verzameling, een technisch evaluatiecriterium of de objecten in hun analoge toestand in hun voortbestaan of kwaliteit bedreigd zijn, en een beheersmatig evaluatiecriterium bijvoorbeeld de vraag naar een voldoende grote doelgroep, financiering, of auteursrechtenproblematieken. De studie onderscheid 4 niveau’s van dienstverlening door digitalisering: het "provide access"niveau, waar bijvoorbeeld catalogi onder vallen, het "provide object"-niveau stelt afbeeldingen van objecten ter beschikking, het "provide knowledge"-niveau geeft extra beschrijvende of wetenschappelijke informatie over een object, en het "provide personalisation"-niveau houdt rekening met de individuele behoeften en interesses van een gebruiker. Aan elk niveau zijn natuurlijk niet alleen kosten, maar ook commercialiseringsmogelijkheden verbonden. De werkgroepen en het begeleidingscomité kwamen tot de volgende conclusies.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
26
Het "provide access"-niveau geniet de hoogste prioriteit. Het opstellen of verder uitwerken van digitale catalogi, niet alleen lokale catalogi maar ook collectieve catalogi waar een gebruiker via een enkel Internet-loket toegang to alle gelijkaardige collecties kan krijgen, is een kerntaak. Het "provide objects"-niveau zou enkel prioritair zijn voor een selectie van objectcategorieën, bijvoorbeeld deze op een fragiele drager, of veelgevraagde objecten. Voor het "provide knowledge"-niveau werd aanbevolen om bij het opstellen van datamodellen rekening te houden met het eventueel progressief toevoegen van meer informatie op een later tijdstip. Hierbij moet wel opgemerkt worden dat de administratieve, technische, juridische, wetenschappelijke, … informatie die in deze categorie valt, voor langdurige bewaringsstrategieën als metadata gezien worden, die een essentiële functie hebben voor een correct gebruik en interpretatie van objecten. Op basis van deze prioriteitenbepaling werden de kosten voor digitalisering en digitale bewaring op een termijn van 10 jaar geraamd op ongeveer 570 miljoen euro voor een "omvattend scenario". Een basisscenario van 150 miljoen euro zou echter al toelaten van een eerste kritische massa van documenten te digitaliseren, geselecteerd volgens kwaliteitscriteria bepaald door de aard van de verschillende collecties. Deze ramingen houden geen rekening met bewaringskosten op lange termijn, die bijzonder moeilijk in te schatten zijn.190 Praktisch gezien wijzen de studie en de hoofden van de instellingen er ook op dat het absoluut nodig zal zijn tot een gecoördineerde aanpak en een nauwe samenwerking tussen de verschillende instellingen te komen, waar dan ook actief aan gewerkt moet worden. Een centraal overlegforum en een ondersteunende technische cel zijn dan ook nodig om de verschillende digitaliseringsinitiatieven op elkaar af te stemmen en de efficiëntie te verhogen. 3.
Recente ontwikkelingen: het digitaliseringsplan van de FWI's en het KBF
Op dit moment werken een groot aantal van de FWI’s voort aan een aantal eigen, beperktere digitaliseringsprojecten met behulp van eigen budgetten en steun van het Federaal Wetenschapsbeleid191. Deze steun kadert onder andere in het omvattende "Meerjarig ondersteuningsprogramma voor de uitbouw van de informatiemaatschappij (2001-2008)"192 dat door het Federaal Wetenschapsbeleid wordt gefinancierd. Door steun bij het uitwerken van concrete innovatieprojecten wil het programma technologieën helpen uittesten voor het digitalizeren, verwerken, verspreiden en uitwisselen van informatie in de openbare en nonprofit sectoren. Op basis van de conclusies van de hierboven vermelde studie en van de aanbevelingen van het begeleidingscomité werden de grote lijnen van een meerjarig digitaliseringsplan opgezet voor een overkoepelende, grootschalige aanpak van de digitalisering van het erfgoed van de FWI’s en het KBF. Over belangrijke aspecten zoals standaarden, technologieën, richtlijnen voor prioritaire digitalisering, …moet in overleg beslist worden, rekening houdend met de eigenheid van de verschillende instellingen en collecties. Op 30 april 2004 aanvaardde de Ministerraad het voorstel van de Minister van Wetenschapsbeleid voor financiering van de digitalisering op middellange termijn (10 jaar) gebaseerd op het minimale kwalitatieve scenario dat in de hierboven vermelde studie werd geïdentificeerd. Voor een bedrag van ongeveer 150 miljoen euro zou het volgende verwezenlijkt kunnen worden: -
het volledig informatiseren van de catalogi;
DWTI
INFORMATIENOTA: DIGITALE BEWARING
27
-
het digitaliseren van alle collecties die een hoge prioriteit toegekend kregen (bijvoorbeeld doordat de drager fragiel is of omdat hun gebruik belangrijk is). Het gaat dan over 8,5 miljoen objecten (wat 14% uitmaakt van de totale inventaris)193;
-
het aanleveren van gevalideerde wetenschappelijke metadata en van administratieve metadata voor het optimaal beheer van de collecties 194.
-
de toegang verlenen tot de gedigitaliseerde bestanden via het Internet en/of op een aangepaste drager.
De financiering van dit plan steunt op twee pijlers. De helft van het budget moet komen van de eigen budgetten bij de FWI’s en het KBF alsook van bij de POD Wetenschapsbeleid. De tweede helft zal deel uitmaken van een lening aangegaan bij de Europese Investeringsbank.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
28
BRONNEN I.
Portaal- en andere sites over digitale bewaring
In het kader van concrete digitale bewarings projecten CAMiLEON (Creative Archiving at Michigan and Leeds: Emulating the Old On the New) http://www.si.umich.edu/CAMILEON/ CEDARS (CURL Exemplars in Digital Archives) http://www.leeds.ac.uk/cedars/ DAVID (Digitale Archivering in Vlaamse Instellingen en Diensten) http://www.antwerpen.be/david/website/nl/index2.htm FEDORA (Flexible and Extensible Digital Object and Repository Archive) http://www.fedora.info InterPARES (International Research on Permanent Authentic Records in Electronic Systems) http://www.interpares.org/ JSTOR (The Scholarly Journal Archive), http://www.jstor.org/ NDIIPP (National Digital Information Infrastructure and Preservation program) http://www.digitalpreservation.gov/ NEDLIB (Networked European Deposit Library), http://www.kb.nl/coop/nedlib/ PANDORA (Preserving and Accessing Networked Documentary Resources of Australia) http://pandora.nla.gov.au/index.html PRISM (Preservation, Reliability, Interoperability, Security, Metadata) http://www.prism.cornell.edu/ Testbed Digitale Bewaring (Digitaal bewaren van overheidsinformatie in Nederland) http://www.digitaleduurzaamheid.nl/home.cfm VERS (Victorian Electronic Records Strategy) http://www.prov.vic.gov.au/vers/ Thematische websites over digitalisering BIBNUM (Département de la bibliothèque numérique de la Bibliothèque nationale de France) http://bibnum.bnf.fr/ CLIR (Council on Library and Information resources) http://www.clir.org/ DEN (Digitaal Erfgoed Nederland) http://www.den.nl DWTI
INFORMATIENOTA: DIGITALE BEWARING
29
DigiCULT (Technology Challenges for Digital Culture) http://www.digicult.info/pages/index.php Digitale Duurzaamheid http://www.digitaleduurzaamheid.nl/home.cfm DPC (Digital Preservation Coalition) http://www.dpconline.org/graphics/index.html ECPA (European Commission on Preservation and Access) http://www.knaw.nl/ecpa/ ERPANET (Electronic Resource Preservation and Access Network) http://www.erpanet.org/ MINERVA (Ministerial NEtwoRk for Valorising Activities in Digitisation) http://www.minervaeurope.org/ Numérisation du patrimoine culturel http://www.culture.gouv.fr/culture/mrt/numerisation/index.htm Patrimoine canadien/Canadian Heritage http://www.chin.gc.ca/Francais/Contenu_Numerique/Preservation_numerique/ PADI (Preserving Access to Digital information) http://www.nla.gov.au/padi/ RLG (the Research Libraries Group) http://www.rlg.org/ II. Handboeken en richtlijnen Beagrie, N.; Jones, M., Preservation management of digital materials: a handbook, 2001 http://www.dpconline.org/graphics/handbook/index.html CEDARS guide to preservation strategies, 2002 http://www.leeds.ac.uk/cedars/guideto/dpstrategies/ CLIR, Building and sustaining digital collections: models for libraries and museums, 2001, http://www.clir.org/pubs/reports/pub100/pub100.pdf Digitaal Erfgoed Nederland en de Mondriaanstichting, Cultureel erfgoed digitaal: leidraad bij projecten, 2004, http://www.den.nl/Leidraad/h0inhoud.htm DAVID, Digitaal archiveren in de praktijk. Handboek, 2004 http://www.antwerpen.be/david/index.htm Institute of Museum and Library Services (ILMS), A framework of guidance for building good digital collections, 2001 http://www.imls.gov/pubs/forumframework.htm
DWTI
INFORMATIENOTA: DIGITALE BEWARING
30
Minerva Working Group 6, Good practice handbook, 2003 http://www.minervaeurope.org/publications/goodhand.htm Minerva Working Group 5, Handbook for quality in cultural websites (draft), 2003 http://www.minervaeurope.org/publications/qualitycriteria.htm NLA, Guidelines for the selection of online Australian publications intended for preservation, 1996, http://www.nla.gov.au/scoap/guidelines.html UKOLN & MLA The Council for Museums, Libraries and Archives, Technical guidelines for digital cultural content creation programmes, in opdracht van Minerva, 2004 http://www.minervaeurope.org/structure/workinggroups/servprov/documents/techguid1_0.pdf Webb, C., Guidelines for the preservation of digital heritage, in opdracht van UNESCO, 2003 http://unesdoc.unesco.org/images/0013/001300/130071e.pdf III. Overzichtsartikelen Bennett, J., A framework of data types and formats, and issues affecting the long term preservation of digital material, 1997 http://www.digitaleduurzaamheid.nl/index.cfm?paginakeuze=57&categorie=2 Cloonan, M. V., Sanett, S., Preservation strategies for electronic records: where we are now: obliquity and squint, American Archivist 65 (1) 2002 DigiCULT, Emerging technologies for the cultural and scientific sector, Technology Watch Report 2, 2004 http://www.digicult.info/pages/techwatch.php DigiCULT, Technological landscapes for tomorrow’s cultural economy. Unlocking the value of cultural heritage, The DigiCULT Report, 2002 http://www.digicult.info/pages/report.php Hedstrom, M., Research challenges in digital archiving and long term preservation, 2003, http://www.sis.pitt.edu/~dlwkshop/paper_hedstrom.html Hodge, G. & Carroll, B., Digital electronic archiving : the state of the art and the state of practice, 1999 http://www.icsti.org/icsti_reports.html Hodge, G., Best practices for digital archives: an information life cycle approach, 1999, http://www.dlib.org/dlib/january00/01hodge.html Hodge, G., Digital preservation and permanent access to scientific information : the state of the practice, 2004 http://www.icsti.org/icsti_reports.html InterPARES, The long-term preservation of authentic electronic records: Findings of the InterPARES project, 2001 http://www.interpares.org/book/index.cfm Lee, K.-H. e.a., The state of the art and practice in digital preservation, 2001, http://nvl.nist.gov/pub/nistpubs/jres/107/1/j71lee.pdf
DWTI
INFORMATIENOTA: DIGITALE BEWARING
31
The National Science Foundation and the Library of Congress, It’s about time. Research challenges in digital archiving and long term preservation, 2003, http://www.digitalpreservation.gov/repor/NSF_LC_Final_Report.pdf Rothenberg, J., Avoiding technological quicksand : finding a viable technical foundation for digital preservation, 1998 http://www.clir.org/pubs/reports/rothenberg/contents.html Task Force on Archiving of Digital Information, Preserving digital information: final report and recommendations, 1996 http://www.rlg.org/ArchTF/ UNESCO, Charter on the preservation of digital heritage, 2003, http://portal.unesco.org/en/ev.phpURL_ID=17721&URL_DO=DO_TOPIC&URL_SECTION=201.html Yale University Library and Elsevier Science, The Yale Electronic Archive: one year of progress, 2002, http://www.library.yale.edu/~okerson/yea/frontmatter.pdf IV. Thematische artikelen Boudrez, F., Standaarden voor digitale archiefdocumenten, 2003, http://www.antwerpen.be/david/website/teksten/DAVIDbijdragen/Standaarden.pdf Byrnes, M., Assigning permanence ratings to NLM’s electronic publications, 2000, http://www.rlg.org/events/pres-2000/byrnes.html CEDARS, Cost elements of digital preservation, 2000 http://www.leeds.ac.uk/cedars/documents/CIW01r.html Chapman, S. e.a., Digital conversion of research library materials: a case for full informational capture, 1996 http://www.dlib.org/dlib/october96/cornell/10chapman.html Dekeyser, H., Digitale archivering: een juridische stand van zaken vanuit Belgisch perspectief. Auteursrecht, technische beschermingsmaatregelen en wettelijk depot, 2004, http://www.antwerpen.be/david/website/teksten/Rapporten/Rapport8.pdf Erpanet, Workshop Report: XML for digital preservation, 2002 http://www.erpanet.org/www/products/urbino/Urbino%20Workshop%20Report.pdf Hedstrom M. & Lampe C., Emulation vs migration : do users care ?, 2001 http://www.rlg.org/preserv/diginews/diginews5-6.html#feature1 Heminger, A. R. e.a., Digital Rosetta stone: a conceptual model for maintainng long-term access to digital documents, 1998 http://www.ercim.org/publication/ws-proceedings/DELOS6/rosetta.pdf Hendley, T., Comparison of methods and costs of digital preservation, British Library research and innovation report 106, 1998 http://www.ukoln.ac.uk/services/elib/papers/tavistock/hendley/hendley.html
DWTI
INFORMATIENOTA: DIGITALE BEWARING
32
Holdsworth, D. en Wheatley, P., Emulation, preservation and abstraction, 2000 http://cedarsgw.leeds.ac.uk/CAMiLEON//dh/ep5.html Lawrence, G. W. e.a, Risk management of digital information: a file format investigation, 2000 http://www.rlg.org/preserv/diginews/diginews4-3.html#technical1 Lavoie, B., The incentives to preserve digital materials: roles, scenarios and economic decisionmaking, 2003 http://www.oclc.org/research/projects/digipres/incentives-dp.pdf Lorie R. A., Long-term archiving of digital information, IBM research report RJ10185, 2000 http://www.columbia.edu/cu/libraries/inside/projects/digital_archiving/RJ10185.pdf Marcum, D.B., Scholars as partners in digital preservation, 2001 http://www.clir.org/pubs/issues/issues20.html#scholars Müller E. e.a.,, The DiVA project – Development of an electronic publishing system, 2003 http://www.dlib.org/dlib/november03/muller/11muller.html NOF-digitise Technical Standards and Guidelines, 2003, http://www.peoplesnetwork.gov.uk/content/technicalstandardsv5.doc OCLC/RLG Working Group on Preservation Metadata, Preservation metadata and the OAIS information model. A metadata framework to support the preservation of digital objects, 2002 http://www.oclc.org/research/projects/pmwg/pm_framework.pdf Qenault, H., VERS: Building a digital record heritage, 2004 http://www.vala.org.au/vala2004/2004pdfs/13Quena.PDF Rothenberg J., An experiment in using emulation to preserve digital publications, 2000 http://www.kb.nl/coop/nedlib/results/emulationpreservationreport.pdf Russell, K., Why can’t we preserve everything? Selection issues for the preservation of digital materials, 1999, http://www.leeds.ac.uk/cedars/colman/ABS01.html Sairamesh, J. C. e.a., Economic framework for pricing and charging in digital libraries, 1996, http://www.dlib.org/dlib/february96/forth/02sairamesh.html. Sanett, S., The cost to preserve authentic electronic records in perpetuity: comparing costs across cost models and cost frameworks, 2003 http://www.rlg.org/preserv/diginews/v7_n4_feature2.html Seville, C. e.a., Intellectual property rights lessons from the CEDARS project for digital preservation, 2000 http://www.leeds.ac.uk/cedars/colman/CIW03.pdf Testbed Digitale Bewaring, Emulatie: context en huidige stand van zaken, 2003, http://www.digitaleduurzaamheid.nl/bibliotheek/docs/white_paper_emulatie_Ned.pdf Testbed Digitale Bewaring, Migratie: context en huidige stand van zaken, 2001 http://www.digitaleduurzaamheid.nl/bibliotheek/docs/white_paper_migratie.pdf Testbed Digitale Bewaring, XML en digitale bewaring, 2002, http://www.digitaleduurzaamheid.nl/bibliotheek/docs/white-paper_xml-nl.pdf
DWTI
INFORMATIENOTA: DIGITALE BEWARING
33
VOETNOTEN
INLEIDING 1
Good practice handbook, Minerva Working Group 6, 2003 http://www.minervaeurope.org/publications/goodhand.htm
2
http://www.nla.gov.au/padi/
DEEL I. DIGITALE BEWARING: EEN OVERZICHT 3
Zie bijvoorbeeld CEDARS Working Definitions of Commonly Used Terms: « Digital preservation/digital archiving : storage, maintenance and access to digital objects/materials over the long term», of Digital electronic archiving: the state of the art and the state of practice, Carroll & Hodge, 1999: « In this project, digital electronic archiving (DEA) is defined as the long-term storage, preservation and access to information that was « born digital » (created and disseminated primarily in electronic form) or for which the digital version is considered to be the primary archive. »
4
A framework of data types and formats, and issues affecting the long term preservation of digital material, J. Bennett, 1997 http://www.digitaleduurzaamheid.nl/index.cfm?paginakeuze=57&categorie=2
5
Digital electronic archiving: the state of the art and the state of practice, G. Hodge & B. Carroll, 1999, http://www.icsti.org/icsti_reports.html
6
Best practices for digital archives: an information life cycle approach, G. Hodge, 1999, http://www.dlib.org/dlib/january00/01hodge.html
7
Technological landscapes for tomorrow’s cultural economy. Unlocking the value of cultural heritage, The DigiCULT Report, 2002, http://www.digicult.info/pages/report.php
8
Digital preservation and permanent access to scientific information: the state of the practice , G. Hodge, 2004, http://www.icsti.org/icsti_reports.html
9
http://www.leeds.ac.uk/cedars/
10
http://www.si.umich.edu/CAMILEON/
11
http://pandora.nla.gov.au/index.html
12
http://www.jstor.org/
13
http://www.fedora.info
14
http://www.kb.nl/coop/nedlib/
15
http://www.prov.vic.gov.au/vers/
16
http://www.interpares.org/
17
http://www.prism.cornell.edu/
18
http://www.antwerpen.be/david/website/nl/index2.htm
19
http://www.digitaleduurzaamheid.nl/home.cfm
20
http://www.nla.gov.au/padi/
21
http://www.erpanet.org/
22
http://www.rlg.org/toc.html#toc
23
http://www.knaw.nl/ecpa/
24
http://www.digicult.info/pages/index.php
DWTI
INFORMATIENOTA: DIGITALE BEWARING
35
25
http://www.digitaleduurzaamheid.nl/home.cfm
26
http://www.dpconline.org/graphics/handbook/index.html
27
http://www.imls.gov/pubs/forumframework.htm
28
http://www.minervaeurope.org/publications/goodhand.htm
29
http://www.antwerpen.be/david/index.htm
30
http://unesdoc.unesco.org/images/0013/001300/130071e.pdf Op 17 oktober 2003 heeft UNESCO ook het Charter on the preservation of the digital heritage goedgekeurd. Een charter geeft enkel aanbevelingen die geen bindende kracht hebben, maar de tekst is een belangrijke intentieverklaring. http://portal.unesco.org/ci/ev.php?URL_ID=13367&URL_DO=DO_TOPIC&URL_SECTION=201&relo ad=1080551980
31
Verschillende organisaties en auteurs delen de strategieën anders in. Deze indeling is overgenomen van The state of the art and practice in digital preservation, K.-H. Lee e.a., 2001, http://nvl.nist.gov/pub/nistpubs/jres/107/1/j71lee.pdf Het Testbed Digitale bewaring onderscheidt technologiebehoud, afdrukken op papier, emulatie, inkapseling, virtuele machinesoftware, migratie en XML.. Op de PADI-website vindt men « refreshing », migratie, technologische emulatie en inkapseling terug. De UNESCO Guidelines for the Preservation of Digital Heritage (p. 122 e.v.) onderscheidt investment strategies (standaarden, data extractie en structurering, inkapseling, beperken van het aantal formaten, de "Universal Virtual Computer" (UVC) benadering), short term strategies (bewaring van de technologie, "backwards" compatibiliteit en versiemigratie, en migratie), medium- to long term strategies (evt. migratie en UVC, viewers, emulatie) en alternative strategies (niet-digitale benaderingen en dataherstel). Beagrie en Jones (2001) maken in het hoofdstuk Storage and Preservation de volgende indeling: migratie, emulatie, technologiebehoud, standaarden, "backwards" compatibiliteit, inkapseling, permanente identificatoren, conversie naar een stabiel analoog formaat, digitale archeologie.
32
http://www.digitaleduurzaamheid.nl/bibliotheek/docs/bewaren_van_email.pdf
33
http://www.digitaleduurzaamheid.nl/bibliotheek/docs/TD_integrale_versie.pdf
34
http://www.digitaleduurzaamheid.nl/bibliotheek/docs/Bewaren_van_spreadsheets.pdf
35
Emulatie: context en huidige stand van zaken, Testbed Digitale Bewaring, 2003, http://www.digitaleduurzaamheid.nl/bibliotheek/docs/white_paper_emulatie_Ned.pdf
36
Bijvoorbeeld: het Testbed Digitale Bewaring ziet de kosten als "potentieel laag" (Emulatie: context en huidge stand van zaken, p. 61) terwijl Beagrie en Jones (2001) in het hoofdstuk Storage and Preservation onder nadelen van emulatie vermelden: « (Emulation) is likely to be very costly unless it has economies of scale. New emulators need to be built for major computer paradigm shift; it is possible that these costs may even exceed the savings of repeated migration costs. ». Ook de UNESCO guidelines schatten de kosten hoog in, p. 141: « Emulation is technically complex, requiring a high degree of effort and specific expertise so it is likely to be very costly. »
37
Het CAMiLEON project, dat we verder in de tekst in meer detail bespreken, plant als één van de projectrapporten een studie van de kosten van verschillende emulatiemethoden. Dit kan, op proefondervindelijke basis, meer duidelijkheid scheppen over de problematiek. Zie http://www.si.umich.edu/CAMILEON/reports/reports.html
38
Jeff Rothenberg is de auteur van verschillende interessante artikelen over emulatie, waaronder een artikel over het NEDLIB project, An experiment in using emulation to preserve digital publications, 2000, http://www.kb.nl/coop/nedlib/results/emulationpreservationreport.pdf , en van een handboek Avoiding technological quicksand: finding a viable technical foundation for digital preservation, 1998, http://www.clir.org/pubs/reports/rothenberg/contents.html
39
Long-term archiving of digital information, IBM research report RJ10185, Lorie R. A., 2000, http://www.columbia.edu/cu/libraries/inside/projects/digital_archiving/RJ10185.pdf
DWTI
INFORMATIENOTA: DIGITALE BEWARING
36
40
Emulation vs migration: do users care? M. Hedstrom & C. Lampe, RLG Diginews Vol 5 nr 6, December 2001, http://www.rlg.org/preserv/diginews/diginews5-6.html#feature1
41
Digitaal archiveren in de praktijk. Handboek, DAVID, 2004, B. Bewaarstrategieën, p.4
42
CEDARS guide to preservation strategies, 2002, http://www.leeds.ac.uk/cedars/guideto/dpstrategies/ en Emulation, preservation and abstraction, Holdsworth, D. en Wheatley, P., 2000, http://cedarsgw.leeds.ac.uk/CAMiLEON//dh/ep5.html
43
http://www.si.umich.edu/CAMILEON/domesday/domesday.html
44
Digitaal archiveren in de praktijk. Handboek, DAVID, 2004, B. Bewaarstrategieën, p. 7
45
Migratie: context en huidige stand van zaken, Testbed Digitale Bewaring, 2001, http://www.digitaleduurzaamheid.nl/bibliotheek/docs/white_paper_migratie.pdf
46
Guidelines for the preservation of digital heritage, Colin Webb (NLA) in opdracht van UNESCO, p. 122
47
VERS Final report, 1998, http://www.prov.vic.gov.au/vers/published/final.htm
48
Preservation strategies for electronic records: where we are now: obliquity and squint, Cloonan, M. V., Sanett, S. in American Archivist 65 (1) 2002, p. 70-106: Het onderzoeksproject InterPARES concludeerde in 2001 dat van 13 ondervraagde archiefinstellingen, 4 migratie als bewaringsstrategie toepasten. Zie ook Hodge, C. (2004), p.2: « Other than the large data archives, which have existed for many years, archives have not yet faced large-scale technological changes. This means that migration remains the strategy for most of the materials of interest for libraries, archives and publishers. »
49
Risk management of digital information: a file format investigation, G.W. Lawrence e.a., 2000, http://www.rlg.org/preserv/diginews/diginews4-3.html#technical1, onderzoekt via een "risk assessment" methode van migratie de vereisten waaraan migratietools en -software zouden moeten voldoen. K.-H. Lee e.a., 2001, p. 97, besluiten: « However, none of the current migration methods of tools comes close to meeting all these requirements. »
50
Migratie: context en huidige stand van zaken, Testbed Digitale Bewaring, 2001, http://www.digitaleduurzaamheid.nl/bibliotheek/docs/white_paper_migratie.pdf
51
http://info.wgbh.org/upf/
52
Digital Rosetta stone: a conceptual model for maintainng long-term access to digital documents, A.R. Heminger e.a., 1998, http://www.ercim.org/publication/ws-proceedings/DELOS6/rosetta.pdf
53
http://www.rlg.org/longterm/oais.html
54
Voor een goed overzicht van wat XML juist is, en andere verwante standaarden zoals ASCII, SGML, XHTML, …, zie: XML en digitale bewaring, Testbed Digitale Bewaring, 2002, http://www.digitaleduurzaamheid.nl/bibliotheek/docs/white-paper_xml-nl.pdf
55
http://www.w3c.org
56
XML en digitale bewaring, Testbed Digitale Bewaring, 2002, http://www.digitaleduurzaamheid.nl/bibliotheek/docs/white-paper_xml-nl.pdf
57
Emerging technologies for the cultural and scientific sector, Technology Watch Report 2, DigiCULT, 2004, p. 41-66, http://www.digicult.info/pages/techwatch.php, en Thematic Issue 3: Towards a semantic web, http://www.digicult.info/pages/Themiss.php
58
http://www.diva-portal.se/
59
The DiVA project – Development of an electronic publishing system, E. Müller e.a., D-Lib Magazine Vol. 9 nr 11, November 2003, http://www.dlib.org/dlib/november03/muller/11muller.html
60
http://www.niwi.knaw.nl/nl/geschiedenis/projecten/xpast_copy1/toon
61
Zie bijvoorbeeld de vragen en discussiepunten opgeworpen tijdens de Urbino Workshop in oktober 2002: Urbino Workshop Report: XML for digital preservation, Erpanet, http://www.erpanet.org/www/products/urbino/Urbino%20Workshop%20Report.pdf
DWTI
INFORMATIENOTA: DIGITALE BEWARING
37
62
The state of the art and practice in digital preservation, K.-H. Lee e.a., 2001, p. 103. Zie bijvoorbeeld ook de resultaten van het Testbed Digitale Duurzaamheid.
63
Digital preservation and permanent access to scientific information: the state of the practice, G. Hodge, 2004, http://www.icsti.org/icsti_reports.html
64
Avoiding technological quicksand: finding a viable technical foundation for digital preservation, J. Rothenberg, 1998, http://www.clir.org/pubs/reports/rothenberg/contents.html
65
http://www.nla.gov.au/padi/topics/43.html
66
Preservation management for digital materials: a handbook, N. Beagrie & M. Jones, 2001, http://www.dpconline.org/graphics/handbook/index.html
67
Zie bijvoorbeeld Digital preservation and permanent access to scientific information: the state of the practice, G. Hodge, p. 32-36, Good Practice Handbook versie 1.2, 2003, Minerva Working Group 6, p. 86-94, Standaarden voor digitale archiefdocumenten, F. Boudrez, 2003, http://www.antwerpen.be/david/website/teksten/DAVIDbijdragen/Standaarden.pdf, Digitaal ArchiVeren rIchtlijn en aDvies nr 4: Standaarden voor bestandsformaten, http://www.antwerpen.be/david/website/teksten/Richtlijn4.pdf, NOF-digitise Technical Standards and Guidelines, 2003, http://www.peoplesnetwork.gov.uk/content/technicalstandardsv5.doc en Technical guidelines for digital cultural content creation programmes, UKOLN & MLA The Council for Museums, Libraries and Archives, in opdracht van Minerva, 2004, http://www.minervaeurope.org/structure/workinggroups/servprov/documents/techguid1_0.pdf Meer specifiek in een wetenschappelijke context vermeldt G. Hodge OpenGIS voor geografische systemen, Molfiles en SMILES voor chemische structuren, OpenOffice, en STEP voor productiedesign en –manufacturing.
68
Standaarden voor digitale archiefdocumenten, F. Boudrez, 2003, http://www.antwerpen.be/david/website/teksten/DAVIDbijdragen/Standaarden.pdf
69
http://purl.oclc.org/
70
http://www.ietf.org/rfc/rfc1737.txt
71
http://www.handle.net/index.html
72
Voor een algemeen overzicht in verband met"Persistent Identifiers", zie bijvoorbeeld Digital preservation and permanent access to scientific information: the state of the practice, G. Hodge, p. 5759 of de PADI website, http://www.nla.gov.au/padi/topics/36.html
73
Assigning permanence ratings to NLM’s electronic publications, M. Byrnes, 2000, http://www.rlg.org/events/pres-2000/byrnes.html
74
http://www.ccsds.org/review/rpa305/651x0r1.pdf
75
http://www.dublincore.org
76
http://www.loc.gov/marc/
77
http://dublincore.org/archives/2001/02/purl-dc-website/documents/notes/acore-20000719.htm
78
http://www.loc.gov/standards/mets/
79
Voor inleidende informatie over bewaringsmetadata, zie http://www.nla.gov.au/padi/topics/32.html, http://www.leeds.ac.uk/cedars/guideto/metadata/ of http://www.getty.edu/research/conducting_research/standards/intrometadata/index.html
80
http://www.oclc.org/research/projects/pmwg/wg1.htm
81
CEDARS, NEDLIB, NLA (National Library of Australia) en DRS (Harvard University’s Digital Repository Services). Daarnaast werken ook de DiVA en VERS-projecten met metadataschema’s, waarbij vooral opvalt dat VERS metadata gebruikt die ook het VERS-project zelf beschrijven.
DWTI
INFORMATIENOTA: DIGITALE BEWARING
38
82
http://ssdoo.gsfc.nasa.gov/nost/isoas/overview.html
83
In Digital preservation and permanent access to scientific information …, 2004, wijst G. Hodge erop dat OAIS uiteindelijk niet zo veelgebruikt is voor wetenschappelijke data hoewel het uiteindelijk oorspronkelijk voor dit soort informatie ontworpen is. Veel organisaties beschikken al over bestaande systemen die voort worden gebruikt. Als deze systemen verouderd geraken en interoperabiliteit noodzakelijker wordt, is het aannemelijk dat OAIS ook voor wetenschappelijke archieven steeds meer als conceptuele basis zal dienen.
84
Preservation metadata and the OAIS information model. A metadata framework to support the preservation of digital objects, the OCLC/RLG Working Group on Preservation Metadata, 2002, http://www.oclc.org/research/projects/pmwg/pm_framework.pdf
85
http://www.oclc.org/research/projects/pmwg/
86
http://www.natlib.govt.nz/files/4initiatives_metaschema_revised.pdf
87
Zie bijvoorbeeld: VERS: Building a digital record heritage, H. Qenault, 2004, « Lessons learnt from practical implementations, lesson 13 : Do something now », http://www.vala.org.au/vala2004/2004pdfs/13Quena.PDF
88
Zie bijvoorbeeld Scholars as partners in digitial preservation, D. B. Marcum, 2001, http://www.clir.org/pubs/issues/issues20.html#scholars
89
http://www.kb.se/kw3/ENG/Default.htm
90
Why can’t we preserve everything? Selection issues for the preservation of digital materials, K. Russell, CEDARS, http://www.leeds.ac.uk/cedars/colman/ABS01.html
91
http://www.jstor.org/about/
92
The long-term preservation of authentic electronic records: Findings of the InterPARES project, Part II: Choosing to preserve, 2001, http://www.interpares.org/book/index.cfm
93
Zie ook het bronnenmateriaal over dit onderwerp op de PADI website, http://www.nla.gov.au/padi/topics/9.html
94
Zie Deel II
95
http://www.minervaeurope.org/listgoodpract.htm#select
96
Guidelines for the selection of online Australian publications intended for preservation, 1996, http://www.nla.gov.au/scoap/guidelines.html
97
Australian online publications: selection guidelines for archiving and preservation by the NLA, 2003, http://pandora.nla.gov.au/selectionguidelines.html
98
Digitaal archiveren in de praktijk. Handboek, DAVID, 2004, http://www.antwerpen.be/david/
99
Berne Convention for the protection of literary and artistic work, WIPO, 1971, http://www.wipo.int/treaties/en/ip/berne/index.html
100
http://www.wto.org/english/tratop_e/trips_e/t_agm0_e.htm
101
http://www.wipo.int/documents/en/diplconf/distrib/94dc.htm
102
WIPO Copyright Treaty, art. VI: « The reproduction right, as set out in article 9 of the Berne convention, and the exceptions permitted thereunder, fully apply in the digital environment, in particular in the use of works in digital form. It is understood that the storage of a protected work in digital form in an electronic medium constitutes a reproduction within the meaning of article 9 of the Berne Convention. »
103
http://www.minervaeurope.org/structure/workinggroups/ipr.htm. Zie ook Deel II, III en V.
104
Digitale archivering: een juridische stand van zaken vanuit Belgisch perspectief. Auteursrecht, technische beschermingsmaatregelen en wettelijk depot, 2004, H. Dekeyser, http://www.antwerpen.be/david/website/teksten/Rapporten/Rapport8.pdf
105
http://www.reproductiefonds.be/
DWTI
INFORMATIENOTA: DIGITALE BEWARING
39
106
http://www.digimarc.com/
107
http://www.doi.org/
108
http://www.w3.org/Signature/
109
Emerging technologies for the cultural and scientific heritage sector, Technology Watch Report 2, 2004, DigiCULT, p. 119-144, http://www.digicult.info/pages/techwatch.php. Zie ook onder « Thematic Issues », Issue 1 : Integrity and authenticity of digital objects, 2002, http://www.digicult.info/pages/Themiss.php
110
Een overzicht van een concrete aanpak binnen een digitaliseringsproject vindt men bijvoorbeeld terug in Intellectual property rights lessons from the CEDARS project for digital preservation, C. Seville e.a., 2000, http://www.leeds.ac.uk/cedars/colman/CIW03.pdf
111
Digital preservation and permanent access to scientific information: the state of the practice, G. Hodge, 2004, p.15-18
112
Preserving digital information: final report and recommendations, Task Force on Archiving of Digital Information, 1996, p. 28: « In a time of such sustained flux and change, during which these various divisions of labor are taking shape, the most effective and affordable strategy for developing a system of digital archives is to assume a distributed, rather than centralized, structure for collecting digital information objects, protecting their integrity over the long term, and retaining them for future use. A distributed structure, built on a foundation of electronic networks, places archival responsibility with those who presumably care most about and have the greatest understanding of the value of particular digital information objects. Moreover, such a structure locates the economic and cultural incentives where they are most likely to prompt those preserving digital information to respond with the greatest agility to the changing digital landscape and to the shifting tides of technology. »
113
The incentives to preserve digital materials: roles, scenarios and economic decision-making, B. Lavoie, 2003, http://www.oclc.org/research/projects/digipres/incentives-dp.pdf
114
Digital preservation and permanent access to scientific information: the state of practice, G. Hodge, 2004, p. 18-26.
115
Strategic directions: appraisal policy. Appendix 2 – Special considerations for selected types of records, 2004, NARA, http://www.archives.gov/records_management/initiatives/appraisal.html#appendix_2. . De meeste handleidingen, richtlijnen en concrete projecten publiceren hun selectiecriteria. Een overzicht is bijvoorbeeld via PADI beschikbaar, http://www.nla.gov.au/padi/topics/9.html. Zie ook Deel I, IV, 3: « Selectiecriteria voor digitale bewaring »
116
http://www.jstor.org/
117
http://www.digitalpreservation.gov/
118
Cultureel erfgoed digitaal: leidraad bij projecten, DEN en de Mondriaanstichting, 2004, bijlage 2: Subsidie aanvragen, http://www.den.nl/Leidraad/h07bijlage2.htm
119
The incentives to preserve digital materials: roles, scenarios and economic decision-making, B. Lavoie, 2003, http://www.oclc.org/research/projects/digipres/incentives-dp.pdf.
120
Preserving digital information: final report and recommendations, Task Force on Archiving of Digital information, 1996, http://www.rlg.org/ArchTF/
121
Comparison of methods and costs of digital preservation, T. Hendley, British Library research and innovation report 106, 1998,http://www.ukoln.ac.uk/services/elib/papers/tavistock/hendley/hendley.html
122
Cost elements of digital preservation, K. Russell, 2000, http://www.leeds.ac.uk/cedars/documents/CIW01r.html
123
The cost to preserve authentic electronic records in perpetuity: comparing costs across cost models and cost frameworks, S. Sanett, 2003, http://www.rlg.org/preserv/diginews/v7_n4_feature2.html
124
http://www.erpanet.org/www/products/tools/ERPANETCostingTool.pdf
DWTI
INFORMATIENOTA: DIGITALE BEWARING
40
125
The preservation of digital material, T. Hendley, The British Library Research and Development Department, 1996. Niet online beschikbaar.
126
PRESTO shows how to preserve multimedia in the most cost-effective fashion, R. Wright, 2002, http://www.cultivate-int.org/issue7/presto/
127
Digital conversion of research library materials: a case for full informational capture, S. Chapman e.a., 1996, http://www.dlib.org/dlib/october96/cornell/10chapman.html
128
http://www.lib.umich.edu/retired/peak/
129
Building and sustaining digital collections: models for libraries and museums, CLIR, 2001, http://www.clir.org/pubs/reports/pub100/pub100.pdf
130
Bijvoorbeeld Economic framework for pricing and charging in digital libraries, J. C. Sairamesh e.a., 1996, http://www.dlib.org/dlib/february96/forth/02sairamesh.html. Zie ook het bronnenmateriaal over dit onderwerp op de Padi website, http://www.nla.gov.au/padi/topics/5.html.
131
YEA: The Yale Electronic Archive: one year of progress, Yale University Library and Elsevier Science, 2002, part II, « Lines of enquiry » http://www.library.yale.edu/~okerson/yea/frontmatter.pdf
132
http://www.bl.uk/collections/sound-archive/nsa.html
133
http://www.reproductiefonds.be
134
http://www.bridgeman.co.uk/index.asp
135
http://www.rmn.fr/
136
http://www.bl.uk/collections/treasures/digitisation3.html
137
http://www.armadillosystems.com/ttp_commercial/home.htm
138
Het bewaren van het geheugen van morgen – bewaring van digitale inhoud voor de toekomstige generaties, Resolutie van de Raad van 25 juni 2002, http://europa.eu.int/eurlex/nl/archive/2002/c_16220020706nl.html, en Charter on the preservation of digital heritage, UNESCO, 2003, http://portal.unesco.org/en/ev.php@URL_ID=17721&URL_DO=DO_TOPIC&URL_SECTION=201.htm l
139
De DPC is opgestart in 2001 met als doelstelling een digitaal bewaringsagenda voor de UK op te stellen door strategische allianties met publieke en privé-instellingen, nationaal zowel als internationaal. http://www.dpconline.org/graphics/index.html
140
National Digital Information Infrastructure and Preservation Program, c.s., http://www.digitalpreservation.gov/index.php
141
The PATCH project: integrating research and standardization of digital preservation, J. Steenbakkers, 2003, http://www.kb.nl/kb/hrd/dd/dd_projecten/patch.pdf
142
Digital preservation and permanent access to scientific information: the state of the practice, G. Hodge, 2004, http://www.icsti.org/icsti_reports.html
143
Bijvoorbeeld in It’s about time. Research challenges in digital archiving and long term preservation, The National Science Foundation and the Library of Congress, 2003, http://www.digitalpreservation.gov/repor/NSF_LC_Final_Report.pdf, Research challenges in digital archiving and long term preservation, M. Hedstrom, 2003, http://www.sis.pitt.edu/~dlwkshop/paper_hedstrom.html
144
Digital preservation and permanent access to scientific information: the state of the practice, G. Hodge, 2004, p. 44-50, http://www.icsti.org/icsti_reports.html
145
http://www.dspace.org/
DWTI
INFORMATIENOTA: DIGITALE BEWARING
41
146
http://www-5.ibm.com/nl/dias/index.html
147
http://www.oclc.org/digitalarchive/
148
http://pandora.nla.gov.au/manual/pandas/
149
http://lockss.stanford.edu/
150
http://www.fedora.info/
151
http://www.bl.uk/collections/treasures/digitisation3.html
152
C. s. onder Deel I, IV, 6.
153
Research challenges in digital archiving and long term preservation, M. Hedstrom, 2003, http://www.sis.pitt.edu/~dlwkshop/paper_hedstrom.html
154
The incentives to preserve digital materials: roles, scenarios and economic decision-making, B. Lavoie, 2003, http://www.oclc.org/research/projects/digipres/incentives-dp.pdf
DEEL II. ACTIVITEITEN EN INITIATIEVEN VAN DE EUROPESE UNIE 155
http://www.cordis.lu/ist/directorate_e/digicult/index.htm
156
DigiCULT valt onder Directoraat E van DG IST. Directoraat E is onderverdeeld in verschillende Units, en sinds maart 2004 is DigiCULT geïntegreerd in Unit 3 "Technology enhanced learning, cultural heritage", met Patricia Manson aan het hoofd.
157
http://www.cordis.lu/ist/directorate_e/digicult/projects.htm
158
De 5 reeds gepubliceerde rapporten behandelen authenticiteit en integriteit van digitale objecten, systemen voor digitaal management (DMS), het semantische web, en virtuele gemeenschappen en samenwerking. Zie http://www.digicult.info/pages/Themiss.php
159
Emerging technologies for the cultural and scientific heritage sector, Technology Watch Report 2, 2004, http://www.digicult.info/pages/techwatch.php
160
Dit wordt verder ondersteund door de volgende resoluties van de Raad: De plaats van cultuur in het Europese bestel (21/01/2002), Cultuur en kennismaatschappij (21/01/2002) en Het bewaren van het geheugen van morgen – bewaring van digitale inhoud voor de toekomstige generaties (25/06/2002).
161
Zie ook Deel 1: Digitale bewaring in het algemeen, waar duidelijk naar voren komt hoe zowel technische als organisatorische aspecten van digitale bewaring nog in volle ontwikkeling zijn, en risicobeheersing en het ontwerpen en toepassen van economische modellen bijgevolg nog zeer moeilijk is.
162
De beginselen van Lund: Conclusies van de vergadering van deskundigen, 2001, ftp://ftp.cordis.lu/pub/ist/docs/digicult/lund_principles-nl.pdf
163
Actieplan inzake de coördinatie van digitaliseringsprogramma’s en het digitaliseringsbeleid, 2001, ftp://ftp.cordis.lu/pub/ist/docs/digicult/lund_action_plan-nl.pdf. In 2002 werd dit Actieplan herzien, ftp://ftp.cordis.lu/pub/ist/docs/digicult/lundactionplanprogress.doc
164
http://www.cordis.lu/ist/directorate_e/digicult/eeurope.htm#nrg_on_digitisation_policies
165
http://www.minervaeurope.org/
166
http://www.minervaeurope.org/structure/workinggroups.htm
167
5th official meeting of the National Representatives group, Parma, november 2003, http://www.minervaeurope.org/structure/nrg/meetings.htm
168
http://www.minervaeurope.org/structure/nrg/documents/parma031119.htm
169
Handbook for quality in culturel websites (draft), Minerva Working Group 5, 2003, http://www.minervaeurope.org/publications/qualitycriteria.htm
DWTI
INFORMATIENOTA: DIGITALE BEWARING
42
170
Good practices handbook, Minerva Working group 6, 2004, http://www.minervaeurope.org/structure/workinggroups/goodpract/document/goodpractices1_3.pdf
171
http://www.minervaeurope.org/structure/nrg/documents/firenzeagenda031017draft.htm
172
Technical guidelines for digital cultural content creation programmes, UKOLN & MLA The Council for Museums, Libraries and Archives, in opdracht van Minerva, 2004, http://www.minervaeurope.org/structure/workinggroups/servprov/documents/techguid1_0.pdf
173
Zie de Minerva werkgroep in verband met benchmarking, http://www.minervaeurope.org/structure/workinggroups/benchmarking.htm, of een overzicht in Coordinating digitisation in Europe, Progress report of the National Representatives Group, 2003, p. xvii – xix, http://www.minervaeurope.org/publications/globalreport.htm
174
5th official meeting of the National Representatives group, Parma, november 2003, http://www.minervaeurope.org/structure/nrg/meetings.htm, p. 16-17
175
Het Turning the Pages-project van de British Library gebruikt bijvoorbeeld al 3D-representaties van boeken, http://www.armadillosystems.com/ttp_commercial/ttp_3d.htm; de DigiCULT.info nieuwsbrief nr 6 geeft een beschrijving van 3D multimedia tools om culturele erfgoed-objecten te archiveren, http://www.digicult.info/pages/newsletter.php
176
Emerging Technologies for the cultural and scientific heritage sector, Technology Watch Report 2, DigiCULT, 2004, p. 67-90, http://www.digicult.info/pages/techwatch.php
177
5th official meeting of the National Representatives group, Parma, november 2003, p. 16 http://www.minervaeurope.org/structure/nrg/meetings.htm
178
5th official meeting of the National Representatives group, Parma, november 2003, p. 16-17, http://www.minervaeurope.org/structure/nrg/meetings.htm
179
Position paper on EU added value and post-Lund strategy, E. Bruinsma, 2003, http://www.minervaeurope.org/structure/nrg/documents/positionpaper031115.htm
DEEL III. ACTIVITEITEN EN INITIATIEVEN IN BELGIË 180
Voor een overzicht van deze Federale Wetenschappelijke Instellingen, zie http://www.belspo.be/belspo/res/institut/esf_nl.stm
181
http://www.wvc.vlaanderen.be/cultuurdigitaal/vlaanderen/index.htm
182
http://www.cfwb.be/culture-internet/comETcoordin.htm
183
http://www.stis.fgov.be/docs/Belgium_Federal%20Profile_(2004).pdf
184
http://www.minervaeurope.org/structure/NRG/npp.htm
185
Les politiques ou programmes nationaux/régionaux de numérisation du contenu scientifique et culturel, 2002, Ministère de la Communauté française Wallonie-Bruxelles, http://www.minervaeurope.org/structure/NRG/npp/belgium/belgfrance.pdf
186
http://www.eflanders.be
187
National Status Rreport on NRG related activities in Belgium, 2002, http://www.wvc.vlaanderen.be/cultuurdigitaal/download/national_status_reportBelgium_english.pdf
188
Zie Deel II
189
http://www.belspo.be/belspo/home/publ/pub_ostc/esf/Witboek_nl.pdf
190
Zie Deel I, punt IV. 5
191
National/Federal/Regional policies and programmes of digitization of scientific and cultural content, 2003, Belgische Federale Overheid, p. 6, http://www.minervaeurope.org/structure/NRG/npp/belgium/belgfederal0312.pdf
DWTI
INFORMATIENOTA: DIGITALE BEWARING
43
192
http://www.belspo.be/belspo/fedra/prog.asp?l=nl&COD=I2
193
Van deze 8,5 miljoen objecten behoren er 5,1 miljoen tot het documentair patrimonium (91% van de totale inventaris hiervan), 1,9 miljoen tot het kunstpatrimonium (100%) en 1,5 miljoen tot het wetenschappelijk patrimonium (3%).
194
Zie Deel III, II, 2
DWTI
INFORMATIENOTA: DIGITALE BEWARING
44