DAVID Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Sofie Van den Eynde
FACULTEIT RECHTSGELEERDHEID INTERDISCIPLINAIR CENTRUM VOOR RECHT EN INFORMATICA TIENSESTRAAT 41 B-3000 LEUVEN
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Versie 2.0 Wettelijk depot D/2001/9.213/6 Antwerpen-Leuven, augustus 2001 Website DAVID-project: http://www.antwerpen.be/david E-mailadres:
[email protected]
2
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
INHOUDSTAFEL INHOUDSTAFEL........................................................................................................................ 3 I. INLEIDING.............................................................................................................................. 5 II. Het OAIS-Reference Model ...................................................................................................... 6 A. Achtergrond....................................................................................................................... 6 B.
Waarom OAIS als uitgangspunt?......................................................................................... 6
III. Public Key Infrastructure: Definities en technische achtergrond.................................................. 8 A. Een digitale handtekening, wat is dat? ................................................................................. 8 A.1
Hashing...................................................................................................................... 8
A.2
Asymmetrische Cryptografie ....................................................................................... 9
A.3
Handtekening-generatie ..............................................................................................11
A.4
Handtekening-verificatie ............................................................................................11
A.5
Tussenbesluit .............................................................................................................11
B.
Public Key Infrastructure...................................................................................................12
C.
PKI in tien vragen en antwoorden.......................................................................................14
IV. Wat moet er precies bewaard worden voor de bewaring op lange termijn van digitale informatie? ...................................................................................................................................................18 A. Inhoud..............................................................................................................................19 B.
Voorstellingsinformatie .....................................................................................................19 B.1
Fysieke laag ..............................................................................................................20
B.1.1 Beschrijving ..........................................................................................................20 B.1.2 Te archiveren metadata...........................................................................................21 B.2
Binaire laag...............................................................................................................21
B.2.1 Beschrijving ..........................................................................................................21 B.2.2 Te archiveren metadata...........................................................................................21 B.3
Structuurlaag.............................................................................................................22
B.3.1 Beschrijving ..........................................................................................................22 B.3.2 Te archiveren metadata...........................................................................................23 B.4
Objectlaag.................................................................................................................23
B.4.1 Beschrijving ..........................................................................................................23 B.4.2 Te archiveren metadata...........................................................................................24 B.5
Applicatielaag ...........................................................................................................25
B.5.1 Beschrijving ..........................................................................................................25 B.5.2 Te archiveren metadata...........................................................................................25 C.
interpretatieve informatie ...................................................................................................26
3
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
C.1
Authenticiteits- en integriteitsgaranderende informatie .................................................26
C.2
Herkomst van het informatieobject..............................................................................27
C.3
Semantische informatie ..............................................................................................27
C.4
Contextinformatie ......................................................................................................28
D. pakketinformatie ...............................................................................................................28 E.
pakketbeschrijving ............................................................................................................28
V. De verschillende fases van het digitale archiveringsproces in kaart gebracht aan de hand van het OAIS Reference Model................................................................................................................29 A. De spelers in het veld ........................................................................................................30
B.
A.1
De archiefvormer.......................................................................................................30
A.2
De klant ....................................................................................................................30
A.3
De archiefinstelling ....................................................................................................30
Vier fases .........................................................................................................................34 B.1
Invoer .......................................................................................................................34
B.1.1 Verschillende soorten informatiepakketten...............................................................34 B.1.2 Taken van de archiefinstelling tijdens de invoerfase .................................................35 B.2
Opslag ......................................................................................................................50
B.2.1 Archivering voor permanente bewaring ...................................................................50 B.2.2 Migratie / Emulatie ................................................................................................51 B.2.3 Maken van veiligheidskopieën van gearchiveerd informatiepakket............................53 B.2.4 Ontoegankelijk maken van de gearchiveerde informatiepakketten .............................53 B.3
Toegang en Data Management....................................................................................54
B.3.1 Onderhoud Data Management Databank..................................................................54 B.3.2 Ontvangen van een vraag tot raadpleging.................................................................54 B.3.3 Samenstellen van toegankelijk gemaakt informatiepakket.........................................55 B.3.4 Ter beschikking stellen van een toegankelijk gemaakt informatiepakket ....................55 B.3.5 Mogelijk maken van validering van de raadplegingsoperatie .....................................58 B.4
Beleid .......................................................................................................................59
Besluit: De rol van PKI bij digitale archieven.................................................................................60
4
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
I. INLEIDING Dit rapport heeft in de eerste plaats als bedoeling om te onderzoeken hoe PKI (Public Key Infrastructure) een rol kan spelen bij de archivering van digitale informatie. PKI is een kader van procedures, policies, personeel en applicaties, gebaseerd op Public Key Cryptography, aan de hand waarvan digitale informatie(stromen) kan (kunnen) beveiligd worden. Doorgaans vindt men de volgende definitie terug: “PKI is een systeem dat aan gebruikers van elektronische communicatiemiddelen digitale sleutelparen (telkens bestaande uit een private key en een public key) ter beschikking stelt, aan de hand waarvan zij hun elektronische communicatie kunnen beveiligen en authentificeren. Deze definitie sluit vooral goed aan bij een e-commerce scenario, waarbij de communicatiepartners elkaar voordien nooit ontmoet hebben. Het gebrek aan vertrouwen in de gebruikte technologieën en de onzekerheid omtrent de juridische gevolgen verbonden aan elektronische rechtshandelingen, heeft tot op vandaag het gebruik van elektronische informatie voor belangrijke transacties, zoals het sluiten van contracten via het Internet, in belangrijke mate afgeremd. Het is in deze context dat de recente juridische erkenning van de elektronische handtekening moet bekeken worden. 1 Het communicatieaspect is echter niet altijd aanwezig wanneer men digitale informatie gaat archiveren. De toepassing van PKI in een archiveringscontext, noopt daarom tot een uitbreiding van de klassieke definitie.2 De techniek van de digitale handtekening is één van de vele toepassingen van Public Key Cryptography.3 ” De digitale handtekening is een techniek die kan ingezet worden telkens wanneer de origine en de integriteit van digitale informatie moet vastgelegd worden. Voor digitale archieven zijn deze eigenschappen natuurlijk van het allergrootste belang. Om het nut van PKI in het algemeen en van de digitale handtekening in het bijzonder te evalueren voor de archiefwereld, is het nodig om een inzicht te krijgen in het proces van digitale archivering en de stappen die daarbij moeten gezet worden. We trachten in dit rapport op een zo begrijpelijk mogelijke wijze in kaart te brengen welke acties er allemaal moeten ondernomen worden om digitale informatie op een efficiënte manier te bewaren met oog voor de problemen die zich op lange termijn zullen voordoen, en gaan daarbij na waar in het proces de integriteit en de originaliteit van de te archiveren digitale informatie aan de orde is. Hiervoor lieten we ons inspireren door het OAISReference model.
1
DUMORTIER, J. en VAN DEN EYNDE, S., ‘De juridische erkenning van de elektronische handtekening’, Computerrecht, 2001, nr. 4. Beschikbaar op: http://www.antwerpen.be/david
2
Door het gebrek aan uniforme PKI-standaarden op dit moment, vindt men zoveel verschillende definities terug van PKI als er betrokkenen zijn. Het communicatie-aspect komt echter steeds opnieuw terug. Zie A Practical Guide to Public Key Infrastructure, Xcert International, 1999; http://webopedia.internet.com/TERM/P/PKI.html
3
5
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Eerst zullen we schetsen waarom deze bijna-standaard een goed uitgangspunt vormt om de levensloop van een digitaal archiefstuk van bij de archiefvormer tot bij de klant in kaart te brengen. Vervolgens proberen we uit te leggen wat de techniek van de digitale handtekening precies inhoudt en waarvoor deze techniek kan ingezet worden. Meteen zal duidelijk worden dat er een hele Public Key Infrastructure nodig is voor het gebruik van de digitale handtekening door archiefdiensten.
II. HET OAIS-REFERENCE MODEL A. ACHTERGROND Het Open Archival Information System is een model dat tot stand is gekomen in de schoot van het Consultative Committee for Space Data Systems (CCSDS) en de International Standardization Organization (ISO). Het CCSDS werd in 1982 opgericht door verschillende ruimtevaartorganisaties, waaronder NASA, met als doel zich bezig te houden met problemen rond informatiesystemen in de ruimtevaartsector. Sinds de jaren ‘60 hadden deze organisaties te kampen met verschillende technologische evoluties. In 1990 ging het CCSDS een samenwerking aan met ISO en werd lid van het technisch comité 20 (aircraft and space vehicles), subcomité 13 (space data and information transfer systems). ISO richtte zich tot SC 13 met het voorstel om een standaard te ontwikkelen met betrekking tot de archivering op lange termijn van digitale gegevens in het algemeen en met betrekking tot gegevens verzameld in het kader van de ruimtevaart in het bijzonder. Het CCSDS trad op als coördinator bij het ontwerpen van een Recommendation. Er werd geopteerd voor de ontwikkeling van een Reference Model met de bedoeling om algemene concepten en termen te definiëren. Het model spitst zich niet enkel toe op de ruimtevaartgemeenschap, maar richt zich tot alle disciplines die te maken hebben met de bewaring op lange termijn van digitale data, o.a. de archiefwereld, maar ook digitale bibliotheken, wetenschappelijke informatie - en documentatiecentra, bedrijven enz. Het model richt zich tot verschillende groepen: ontwerpers van archiefsystemen, de gebruikers van digitale archieven (zowel de archiefvormers als de klanten), de personen die het beleid bepalen inzake archivering (bijv. de wetgever) en de ontwikkelaars van archiefstandaarden.
B. WAAROM OAIS
ALS UITGANGSPUNT?
Waarom kiezen we het OAIS Reference Model als uitgangspunt om in kaart te brengen waar PKI zijn diensten kan bewijzen ten aanzien van een digitaal archief? Hiervoor zijn verschillende redenen: 1. Het OAIS Reference Model is goed onthaald door de verschillende disciplines die te maken hebben met de bewaring van digitale informatie op lange termijn. Heel wat digitale initiatieven o.a. uit de
6
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
bibliotheekwereld 4 , maar ook uit de archiefwereld, hebben het model geïmplementeerd voor de digitale bewaring van hun collecties. De bekendste organisatie uit de archiefsector die dit model aangenomen heeft is NARA, the U.S. National Archives and Records Administration. NARA inventariseert, bewaart en verschaft toegang tot de digitale documenten die aangemaakt worden door de verschillende departementen van de federale overheid van de Verenigde Staten. Men kan dus verwachten dat het OAIS Reference Model nadrukkelijk aanwezig zal zijn in heel wat toekomstige initiatieven met betrekking tot digitale archivering. 2. Het OAIS Reference Model is op dit moment een ISO ontwerp-standaard. Het werd voor goedkeuring overgemaakt aan ISO. Er wordt verwacht dat het binnen afzienbare termijn als volwaardige ISO-standaard zal aangenomen worden. Momenteel heeft het de status van CCSDS Red Book, wat wil zeggen dat het een Draft Recommendation is, die open staat voor commentaar. De term ‘Open’ slaat op het feit dat het model tot stand is gekomen in publieke fora en dat het open staat voor beoordeling door iedereen. Het slaat geenszins op het feit dat een archief dat aan het model beantwoordt, onbeperkt toegankelijk zou zijn voor alle klanten. 3. Het hoge abstractieniveau van het OAIS Reference Model en het technologie -neutraal karakter maken het tot een uiterst geschikt middel om uit te leggen waaraan een digitaal archief moet voldoen om voldoende waarborgen te bieden voor leesbaarheid en toegankelijkheid op lange termijn, onafhankelijk van de praktische en technische organisatie van de archiefinstelling. Het is dan ook geen model dat onmiddellijk kan geïmplementeerd worden. Het is een organisatiemodel dat op alle mogelijke archieven kan toegepast worden, geen kant-en-klaar draaiboek voor het uittekenen van een digitaal ondersteunde archieffunctie in een bepaalde organisatie. Als algemeen uitgangspunt is een dergelijk model erg bruikbaar, aangezien er niet één beste oplossing bestaat voor de archivering van digitale informatie. Er zal archiefinstelling per archiefinstelling en afhankelijk van de te archiveren informatie in een concreet geval, moeten bekeken worden hoe er aan de hand van het model voor een passende oplossing kan gekozen worden. 5 Daarvoor zullen er verschillende archivistische en technologische keuzes moeten gemaakt worden. Indien een archiefinstelling beslist om PKI te implementeren, zal er een PKI-model op maat van de archiefinstelling moeten uitgetekend worden, geïnspireerd door de gemaakte keuzes.
4
5
O.a. het Nedlib-project (Networked European Deposit Library). Dit project wordt gefinancierd door het Telematics Applications Programme van de Europese Commissie en het wordt geleid door de Koninklijke Nationale Bibliotheek van Nederland. Een van de resultaten van dit project is de ontwikkeling van een model voor de ontwikkeling van een Deposit System for Electronic Publications (DSEP), gebaseerd op het OAISmodel. De bedoeling was om de vereisten in kaart te brengen waaraan alle bibliotheken moeten voldoen, om zo tot een algemeen ontwerp te komen dat kan geïmplementeerd worden met oog voor de concrete situatie van de betreffende bibliotheek. Ook digitale archiveringprojecten hebben ervoor gekozen om het OAISmodel toe te passen, zoals het Cedars-project in het Verenigd Koninkrijk (http://www.leeds.ac.uk/cedars ). BAAK, P. en KOENEN, K., ‘Het geheugen als actieve kracht. De archieffunctie binnen de digitale overheid’, Programma Digitale Duurzaamheid, Den Haag, 1999, 13.
7
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
III. PUBLIC KEY INFRASTRUCTURE: DEFINITIES EN TECHNISCHE ACHTERGROND A. EEN
DIGITALE H ANDTEKENING, WAT IS DAT?
Een digitale handtekening is een techniek waarmee het mogelijk is om elektronische informatie te beveiligen op een manier waardoor zowel de origine van de informatie, als de integriteit van de informatie, kan worden geverifieerd. Het proces aan de hand waarvan de origine en de integriteit van informatie wordt gegarandeerd, wordt ‘authentificatie’ genoemd. In de digitale wereld is de authentificatie van elektronische informatie uitermate belangrijk. Wanneer er geen zekerheid bestaat over de origine en de integriteit van elektronische informatie, kan er geen sprake zijn van vertrouwen. In de veronderstelling dat de archivaris opereert in open netwerkomgeving, waar de communicatie partners elkaar nooit voordien ontmoet hebben, zoals op het Internet, is vertrouwen een noodzakelijke voorwaarde om digitale archiefstukken uit te wisselen (archiefvormer–archiefinstelling, archiefinstelling–klant). De techniek van de digitale handtekening kan gebruikt worden om allerlei soorten elektronische informatie te authentificeren, zoals e-mails, software, webpagina’s enz. In sommige gevallen komt het gebruik van de techniek van de digitale handtekening erg dicht bij de traditionele handgeschreven handtekening, bijv. bij de authentificatie van elektronische contracten. De digitale handtekening is een klein, versleuteld computerbestand (een geheel van elektronische gegevens) dat aan de te authentificeren elektronische informatie wordt gehecht. Dit computerbestand wordt verkregen door twee bewerkingen uit te voeren op de elektronische informatie: hashing en versleuteling. Om uit te leggen wat een digitale handtekening is, gaan we uit van een communicatiescenario, en nemen we aan dat de elektronische informatie die men wil authentificeren een elektronisch bericht is, dat door een verzender naar een bestemmeling wordt gestuurd.
A. 1
Hashing
Hashing is een techniek waarmee men elektronische informatie kan herleiden tot een unieke code van een beperkte lengte. Aan de hand van een hashing-algoritme (wiskundige functie) wordt er een hashing-code berekend voor het elektronisch bericht, ook wel de fingerprint genoemd. Net zoals een vingerafdruk, is de hashing-code uniek. Wanneer er tijdens de transfer ook maar één character zou veranderd worden aan het elektronisch bericht, dan levert dit een totaal andere hashing-code op. Door opnieuw de hashing-operatie uit te voeren op het elektronisch bericht, kan men dus controleren of de inhoud van het bericht intussen is gewijzigd.
8
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
We illustreren dit aan de hand van een voorbeeld. Stel dat we de inhoud van dit rapport als de inhoud van een elektronisch bericht op een beveiligde manier willen versturen. Het hashing-algoritme voor dit rapport zou er als volgt kunnen uitzien: “vervang elke letter van het alfabet door een getal en herschrijf dit rapport aan de hand van de getallen die met de letters overeenstemmen. Tel vervolgens al die getallen op en begin opnieuw te tellen vanaf nul telkens als de som van die getallen één miljoen wordt”. Uiteindelijk zal er een getal overblijven dat kleiner is dan 1 miljoen. Dat getal is de hashingcode. Als je echter één letter in de tekst van dit rapport zou veranderen, dan ziet de hashing-code er totaal anders uit. Het is duidelijk dat dit hashing-algoritme te eenvoudig is om voldoende zekerheid te bieden. Hashingcodes mogen niet voorspelbaar zijn. Dit wil zeggen dat het onmogelijk moet zijn om de hashing-code te voorspellen aan de hand van een bepaalde bewerking op een document bijv. het veranderen van gewone letters in hoofdletters. Het hashing-algoritme moet met andere woorden voldoende complex zijn. Bovendien moet de kans dat er hash-collisions worden gevonden, verwaarloosbaar klein zijn. Twee documenten die dezelfde hashing-code opleveren, moet statistisch gezien onmogelijk zijn. Alleen dan kan men er zeker van zijn dat het elektronisch bericht werkelijk ongewijzigd is gebleven.
A. 2
Asym m etrische Cryptog raf ie
De digitale handtekening is een techniek die gebaseerd is op cryptografie. Cryptografie is de wetenschap die onderzoekt hoe elektronische bestanden kunnen beveiligd worden. De meest bekende toepassing van cryptografie is het versleutelen (encryptie) van de inhoud van elektronische bestanden. Met encryptie wordt bedoeld het omzetten van een bepaalde boodschap van de oorspronkelijke en voor de mens begrijpbare tekst (de ‘plaintext’) in een voor niet-ingewijden onverstaanbare tekst (de ‘ciphertekst’). De omgekeerde operatie noemt men decryptie of ontsleuteling. Het versleutelen en ontsleutelen van het elektronisch bericht, gebeurt aan de hand van een geheime sleutel, die enkel de communicatiepartners kennen. Door de inhoud van het elektronisch bericht te versleutelen, voorkomt men dat anderen dan de communicatiepartners de inhoud van het bericht kunnen lezen. Bovendien weet men zeker dat ieder versleuteld bericht dat kan ontsleuteld worden met de geheime sleutel, afkomstig is van de andere partij, aangezien alleen de communicatiepartners de geheime sleutel kennen. Dit systeem, waarbij één geheime sleutel gedeeld wordt door de communicatiepartners, wordt symmetrische cryptografie genoemd. Symmetrische cryptografie heeft echter vele nadelen en is niet geschikt voor de beveiliging van elektronische communicatie in een open netwerkomgeving, zoals het Internet. De communicatiepartners moeten elkaar contacteren om de geheime sleutel uit te wisselen. Elektronische handel op het Internet zal echter veelal tussen onbekende partners plaatsvinden, die slechts eenmalige handelsrelaties met elkaar aanknopen. Tijdens deze uitwisseling kan de geheime sleutel ook onderschept worden door een derde. Bovendien zijn er steeds twee partijen in het bezit van de geheime sleutel, waardoor de éne communicatiepartner zich kan voordoen als de andere. Door het gezamenlijk gebruik van dezelfde sleutel heeft men dus nog geen volledige zekerheid over de identiteit van de afzender. Tenslotte zijn er op het Internet een oneindig aantal afzenders en bestemmelingen, waardoor elke afzender voor elke bestemmeling een afzonderlijke geheime sleutel nodig heeft.
9
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Symmetrische cryptografie is niet de enige vorm van cryptografie. Het versleutelen en ontsleutelen van het bericht kan ook met twee verschillende sleutels gebeuren. Dan spreekt men van asymmetrische cryptografie.6 De publieke sleutel is voor iedereen openbaar, en kan geraadpleegd worden in een soort elektronische gids waarin alle publieke sleutels van de deelnemers in het netwerk gepubliceerd worden. De private sleutel daarentegen is enkel aan de eigenaar ervan bekend. Nie mand mag dus zijn private sleutel bekend maken. Dit kan men vergelijken met de code van een bankkaart. Eigen aan asymmetrische cryptografie is nu dat een boodschap die met een bepaalde publieke sleutel versleuteld is, enkel met de overeenkomstige private sleutel kan ontcijferd worden. Daarom spreekt men van “sleutelpaar”. Om de inhoud van elektronische berichten te versleutelen met asymmetrische cryptografie, gaat men dan als volgt te werk: 1. De verzender zoekt de publieke sleutel van de bestemmeling op in de elektronische gids en gebruikt die publieke sleutel om het bericht te versleutelen. 2. Enkel de bestemmeling kan het bericht ontcijferen, want niemand anders beschikt over de private sleutel die bij de gebruikte publieke sleutel hoort. Door gebruik te maken van een sleutelpaar, kan het volstaan om voor iedere deelnemer in het netwerk een sleutelpaar te voorzien. De deelnemer kan dan telkens opnieuw hetzelfde sleutelpaar gebruiken, wie hij ook als communicatiepartner heeft op dat moment. Asymmetrische cryptografie was oorspronkelijk bestemd om de inhoud van elektronische berichten te versleutelen, zodanig dat niemand buiten de bestemmeling de inhoud van deze elektronische berichten zou kunnen lezen. Na verloop van tijd bleek dat ook andere toepassingen mogelijk waren, bijv. door de verzender te laten versleutelen met zijn eigen private sleutel in plaats van met de publieke sleutel van de bestemmeling. De publieke en de private sleutel kunnen beiden gebruikt worden, zowel om te versleutelen als om te ontsleutelen. Hun functies zijn onderling verwisselbaar. Dit leidde tot de techniek van de digitale handtekening. Op het eerste zicht lijkt het een dwaas idee om het bericht te versleutelen met de eigen private sleutel. Iedereen heeft immers toegang tot de publieke sleutel van de verzender, waardoor iedereen het bericht kan ontsleutelen en kan lezen. Deze werkwijze biedt echter zekerheid over de authenticiteit van elektronische berichten. Wanneer de publieke sleutel van de verzender past op het met de private sleutel versleutelde bericht, kan de bestemmeling er op vertrouwen dat het bericht afkomstig is van de beweerde verzender, aangezien alleen de verzender zijn eigen private sleutel kent. Met behulp van de techniek van de digitale handtekening kan het elektronisch verkeer plaatsvinden zonder dat de partijen elkaar voordien ontmoet hebben.
6
Dit wordt ook wel Public Key Cryptography genoemd (staat tegenover Private Key Cryptography), omdat er gebruikt wordt gemaakt van een sleutel die door iedereen gekend is en dus publiek is.
10
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
A. 3
Handtekening - g eneratie
Een digitale handtekening wordt als volgt gecreëerd: 1. Voor het elektronisch bericht dat moet ‘geauthentificeerd’ worden (een tekstbestand, software, een website enz), wordt er door de computer van de verzender een hashing-code berekend, die het resultaat is van een wiskundige bewerking gebaseerd op een hashing-algoritme. Deze hashingcode is de digitale vingerafdruk van het bericht. 2. Vervolgens versleutelt de verzender de hashing-code met zijn eigen private sleutel. Het resultaat van deze bewerking noemt men de ‘digitale handtekening’. De digitale handtekening wordt toegevoegd aan het bericht, en samen worden ze naar de bestemmeling verstuurd. Om het bericht te kunnen authentificeren, is het niet nodig om het bericht zelf in geëncrypteerde vorm te versturen. De authenticiteit van het bericht wordt geverifieerd aan de hand van de digitale handtekening. Deze verificatie gebeurt onafhankelijk van de vorm (leesbaar / geëncrypteerd) van het bericht.
A. 4
Handtekening - verif icatie
Om de authenticiteit van het bericht na te gaan, moet de digitale handtekening geverifieerd worden door de bestemmeling. Dit gebeurt als volgt: 1. De bestemmeling heeft het bericht (in principe in leesbare vorm) samen met de digitale handtekening ontvangen. De computer van de bestemmeling gaat nu opnieuw de hashing-code berekenen voor het ontvangen bericht. Is het resultaat hetzelfde als de hashing-code die de verzender meestuurde, dan zijn de gegevens intact gebleven. Indien er tijdens de transfer immers ook maar één character zou gewijzigd zijn, dan zou de berekening door de bestemmeling een andere hashing-code hebben opgeleverd. 2. De hashing-code die de verzender meestuurt, bereikt de bestemmeling in versleutelde vorm nl. als digitale handtekening. Aan de hand van de publieke sleutel van de verzender, die hij in een elektronische gids opzoekt, kan de bestemmeling nagaan of de versleuteling van de hashing-code wel degelijk met de private sleutel van de verzender is doorgevoerd, en bijgevolg of het bericht afkomstig is van de beweerde verzender.
A. 5
Tussenbesluit
Public Key Cryptography kan voor verschillende doeleinden gebruikt worden. De vertrouwelijkheid of ontoegankelijkheid van digitale informatie kan ermee bekomen worden. De versleuteling dient dan te gebeuren aan de hand van de publieke sleutel. Wordt de digitale informatie versleuteld met de private sleutel, dan is er sprake van de digitale handtekeningtechniek. Uit de beschrijving blijkt dat een digitale handtekening kan ingeschakeld worden, telkens wanneer de origine en de integriteit van digitale informatie moeten gewaarborgd worden.
11
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Het communicatiescenario is de klassieke wijze om de werking van de techniek van de digitale handtekening te beschrijven. Het is van belang om in te zien dat de techniek van de digitale handtekening ook haar diensten kan bewijzen ten aanzien van digitale informatie die opgeslagen is, zonder dat er sprake is van het verzenden van deze informatie over één of ander telecommunicatienetwerk. De origine en de integriteit van een archiefstuk dat zich in een archiefbeheerssysteem bevindt, kunnen net zo goed gewaarborgd worden met deze techniek.
B. PUBLIC KEY INFRASTRUCTURE De authentificatieprocedure aan de hand van de techniek van de digitale handtekening, is gebaseerd op het vermoeden dat de publieke sleutel werkelijk toebehoort aan de verzender. Dit vermoeden is echter helemaal niet zo vanzelfsprekend. Het risico bestaat dat iemand een sleutelpaar genereert en de publieke sleutel in de elektronische gids plaatst onder iemand anders’ naam. Op die manier kan men zich uitgeven voor iemand anders. Bovendien bestaat er geen band tussen het sleutelpaar op zich en een welbepaalde identiteit. Het sleutelpaar is gewoon een wiskundige functie. Daarom moet er zekerheid kunnen bestaan dat de publieke sleutel werkelijk toebehoort aan de persoon waarvan beweerd wordt dat hij de informatie versleuteld heeft. Er is dus meer nodig dan twee sleutels om de origine van digitale informatie, voor zeker te kunnen vaststellen: een Public Key Infrastructure. Om deze problemen op te lossen, werkt men met zgn. ‘certificaten’. Een certificaat is een soort digitale identiteitskaart. De gebruikers van het netwerk komen overeen dat iemand certificaten gaat uitreiken. De instantie die daarvoor wordt aangeduid, noemt men de ‘certificatie -autoriteit (CA)’. De CA wordt door alle gebruikers beschouwd als een onpartijdige en betrouwbare derde. In de Internetwereld wordt deze derde ‘Trusted Third Party’ of TTP genoemd. De CA controleert de identiteit van de eigenaar van de publieke sleutel en bevestigt in het certificaat de band tussen de publieke sleutel en deze identiteit. Ook een organisatie kan eigenaar zijn van een publieke sleutel, waarmee zij zich in het elektronisch verkeer kan kenbaar maken. De band met de private sleutel hoeft in het certificaat niet nog eens apart vastgelegd te worden, vermits de private sleutel onafscheidelijk met de publieke sleutel verbonden is. Hoe gaat dit nu in zijn werk en hoe ziet zo’n certificaat eruit? Bij de aanvang van haar activiteiten, zal de CA haar eigen sleutelpaar genereren, dat eveneens bestaat uit een publieke en een private sleutel. Met de private sleutel zal de CA het certificaat als volgt creëren: Om de identiteit te controleren, zal de CA doorgaans aan de certificaat-aanvrager (bijv. de archivaris of de archiefvormer) verzoeken om documenten voor te leggen die zijn identiteit bewijzen. Het zijn deze identiteitsgegevens die worden gecertificeerd. Wanneer het een natuurlijke persoon betreft, kan het gaan om de naam, de nationaliteit, het e-mailadres, de functie die een bepaalde persoon in een organisatie uitoefent enz. Ook een pasfoto, het paspoortnummer of vingerafdrukken kunnen een opgenomen worden in het certificaat.
12
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
De identiteitsgegevens worden samen met informatie over de publieke sleutel van de certificaathouder ‘getekend’ met de private sleutel van de CA. De CA zal dit enkel doen wanneer zij de identiteit van de certificaat-aanvrager heeft gecontroleerd en vastgesteld heeft dat het sleutelpaar werkelijk aan hem toebehoort. Het resultaat noemt men het certificaat. Het certificaat geeft met andere woorden aan wat het sleutelpaar voortaan bewijst. De CA zendt het certificaat naar de certificaat-aanvrager en houdt er zelf ook een exemplaar van bij. Wanneer een certificaat-houder digitale informatie wil authentificeren, voegt hij zijn certificaat toe aan de digitale informatie en de voor deze digitale informatie berekende digitale handtekening. De bestemmeling van de digitale informatie zal het certificaat verifiëren aan de hand van de publieke sleutel van de CA, net zoals een digitale handtekening geverifieerd wordt aan de hand van de publieke sleutel van de certificaat-houder. De publieke sleutel van de CA moet daarom ook openbaar worden gemaakt. Hierdoor weet de bestemmeling zeker door welke CA het certificaat werd uitgereikt. Wanneer hij die CA vertrouwt, zal hij de band tussen de publieke sleutel en de identiteit, zoals die in het certificaat door de CA is vastgelegd, aannemen. Men moet een onderscheid maken tussen identiteitscertificaten en kenmerkcertificaten. Identiteitscertificaten bewijzen de identiteit van de gebruiker (een natuurlijke persoon, een nietnatuurlijke persoon, een computerprogramma, een server enz.). Kenmerkcertificaten bewijzen een kenmerk van een titularis, zoals een hoedanigheid (bijv. een archivaris), een functie (bijv. medewerker bij het stadsarchief Antwerpen), een mandaat (bijv. het recht om archiefstukken aan klanten te overhandigen ter raadpleging). Het onderscheid tussen deze twee soorten certificaten is nuttig omdat de authentificatie van digitale informatie soms gebeurt op basis van de loutere identiteit van een persoon, soms op basis van de identiteit in combinatie met één of meer kenmerken, en soms louter op basis van één of meerdere kenmerken zonder verwijzing naar de identiteit. Het is mogelijk dat de certificatie van de identiteit van de certificaat-aanvrager niet gebeurt door de CA, die in dat geval enkel de certificatie van de publieke sleutel voor zijn rekening neemt. De certificatie van de identiteit gebeurt dan door een zgn. registratie -autoriteit (RA), waar de CA dan verder op vertrouwt bij het uitreiken van een certificaat. Buiten de typische identificatie en registratie functies van CAs, worden er ook andere diensten in verband met digitale handtekeningen geleverd door ‘Trusted Third Parties’, zoals diensten in verband met sleutelbeheer (bijv. het aanmaken van sleutelparen, het personaliseren van smart cards), tijdsstempeldiensten 7 , directory diensten8 enz. Het is duidelijk dat er naast sleutelparen een hele infrastructuur nodig is om authenticiteit te garanderen in een elektronische omgeving. Dit kader, ‘Publieke Sleutel Infrastructuur’ genoemd, dat bestaat uit een combinatie van hardware, software en procedures, is een kader waarbinnen men allerlei diensten gebaseerd op publieke sleutel cryptografie kan implementeren, en biedt een oplossing voor 7
8
Tijdsstempeldiensten kunnen aan de hand van een tijdsstempel de datum en zelfs het uur van een elektronische transactie vaststellen, of de datum of het uur van het bestaan van bepaalde elektronische informatie, zoals een digitale handtekening. Een directory service is een dienst die databanken met certificaten en andere relevante informatie met betrekking tot het elektronische authentificatiesysteem, on-line ter beschikking stelt.
13
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
o.m. sleutelbeheer, beheer van certificaten, toegang tot de registers enz. PKI is een belangrijk onderdeel van een beveiliging van de ICT omgeving.
C. PKI •
IN TIEN VRAGEN EN ANTWOORDEN
Waar haal ik mijn sleutelpaar?
Er zijn twee mogelijkheden: De gebruiker kan zelf zijn sleutelpaar genereren door een speciaal cryptografie programma te installeren. Asymmetrische algoritmes zijn ook op het Internet publiek beschikbaar. De laatste versies Internetbrowsers (MS Internet Explorer, Netscape) hebben de mogelijkheid zelfs ingebouwd om sleutelparen te genereren. Deze methode heeft als voordeel dat de private sleutel nooit door iemand anders dan de gebruiker gekend is, maar vereist wel een zekere expertise in hoofde van de gebruiker. Het sleutelpaar kan ook aangemaakt worden door een derde partij. Denk bijvoorbeeld aan de toepassing van het elektronisch bankieren, waarbij de meeste banken aan hun cliënten een sleutelpaar meegeven. Maar ook in open netwerken, zoals het Internet, kan hiervoor een beroep worden gedaan op een derde partij. Het is dan een certificatie -autoriteit of een dienst die instaat voor sleutelbeheer, die het sleutelpaar genereert. De derde partij moet de private sleutel op een beveiligde manier aan de gebruikers overhandigen (manueel of elektronisch). Ook moet alle informatie die betrekking heeft op de creatie van het sleutelpaar, evenals het sleutelpaar zelf, vernietigd worden, zodat alleen de gebruiker uiteindelijk de private sleutel kent. Voor welke methode er ook gekozen wordt, het is van belang om in te zien dat de sleutels op geregelde tijdstippen moeten vervangen worden, zodanig dat de mogelijkheden voor derden om de sleutels te ontcijferen, beperkt blijven. De cryptografische algoritmes die gebruikt worden om de inhoud van de documenten te versleutelen, zijn dermate complex dat het statistisch gezien onmogelijk is om de sleutel te kraken. Zelfs indien men de snelste computers zou inzetten om via de methode van ‘key exhaustion’ (het systematische en uitputtend gebruiken van alle mogelijke sleutels) uit een gekende publieke sleutel de corresponderende geheime sleutel af te leiden, dan nog zou het duizenden jaren duren om de private sleutel te vinden. De techniek staat echter niet stil, waardoor computers steeds sneller worden en algoritmes bijgevolg steeds makkelijker te kraken zijn. Op het moment dat een sleutelpaar gegenereerd wordt, staat het reeds vast dat het sleutelpaar ergens in de toekomst op een vrij gemakkelijke manier zal kunnen gekraakt worden. Cryptografen volgen de ontwikkelingen op dit vlak nauwgezet op, en proberen in kaart te brengen wanneer een sleutelpaar niet meer veilig is. De technologische evolutie is meteen ook de reden waarom een certificaat slechts gedurende een bepaalde periode geldig is. Dit is de periode waarbinnen men voorziet dat de sleutels niet zullen kunnen gekraakt worden.
14
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
•
Kan iemand met mijn private sleutel in mijn plaats digitale informatie authentificeren?
Het is duidelijk dat de techniek van de digitale handtekening staat of valt met het geheim houden van de private sleutel. Zodra de gebruiker zijn sleutelpaar ontvangen heeft of gecreëerd heeft, is het van het grootste belang dat hij de private sleutel geheim houdt. Wanneer een derde toch toegang zou krijgen tot de private sleutel, dan kan hij deze gebruiken om in naam van de gebruiker een elektronisch bericht te authentificeren. Voor het slagen van een Publieke Sleutel Infrastructuur, die volledig berust op vertrouwen, is het van groot belang dat de private sleutel nooit aan derden wordt doorgegeven en dat hij wordt beschermd tegen diefstal en ongeoorloofd gebruik.9 •
Hoe moet ik mijn private sleutel dan veilig bewaren?
Betrouwbare authentificatie hangt af van de beveiliging van de private sleutel. Wanneer de private sleutel niet op een veilige, ontoegankelijke manier bewaard wordt, dan kunnen de digitale handtekeningen die er mee gecreëerd zijn, niet vertrouwd worden. Cryptografische sleutels zijn zo complex dat de gebruiker ze niet zelf kan onthouden, zoals men bijv. een pincode kan onthouden. De private sleutel moet dus op de éne of de andere drager bewaard worden. De private sleutel kan bewaard worden op de harde schijf van de computer van de gebruiker. Toegangscontrole gebeurt dan via het ingeven van een paswoord of via een kaartlezer. Het nadeel van deze opslagmethode is echter de immobiliteit van de private sleutel. De gebruiker zal steeds zijn eigen computer nodig hebben om zijn digitale handtekening toe te voegen aan een elektronisch bestand. Daarom is het vaak beter om de private sleutel op een mobiele drager te plaatsen, zoals een smart card. Een smart card is een plastieken kaart met een ingebouwde chip waarop allerlei gegevens kunnen vastgelegd worden, die voor uiteenlopende applicaties kunnen gebruikt worden. De chip bevat o.a. ook een microprocessor. De informatie op de smart card wordt voorlopig nog beveiligd door paswoorden. In de toekomst zal dit wellicht gebeuren met behulp van biometrische kenmerken van een persoon, zoals vingerafdrukken. Dit is veel veiliger dan paswoorden, die gemakkelijk kunnen doorgegeven of gekraakt worden. Weinig computers zijn op dit moment reeds uitgerust met kaartlezers voor smart cards. •
Hoe verkrijg ik de publieke sleutel van de persoon die de digitale informatie geauthentificeerd heeft met behulp van een digitale handtekening?
De bestemmeling heeft de publieke sleutel van de ander nodig om de authenticiteit van de digitale handtekening te controleren. De publieke sleutel kan toegevoegd zijn aan de digitale handtekening en
9
Ook vanuit juridisch oogpunt is dit van groot belang, gezien het feit dat de techniek van de digitale handtekening kan gebruikt worden om een elektronische handtekening in juridische zin te plaatsen, en gezien de rechtsgevolgen die de wet daar aan verleent (zie DUMORTIER, J. en VAN DEN EYNDE, S., ‘De juridische erkenning van de elektronische handtekening’, Computerrecht, 2001, afl. 4, beschikbaar op http://www.antwerpen.be/david) . Geeft men zijn private sleutel prijs aan een derde, dan kan deze in naam van de ware eigenaar documenten ondertekenen.
15
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
is dan terug te vinden in het certificaat. Het is ook mogelijk dat de publieke sleutel moet opgehaald worden in een publiek toegankelijke databank, die bijv. via het Internet toegankelijk is gemaakt. Het communicatieprogramma van de bestemmeling, bijv. het e-mailprogramma, zal meestal automatisch de digitale handtekening controleren door de relevante databanken te doorzoeken. •
Hoe controleert de CA de identiteit van de certificaat-aanvrager?
Sommige certificaten worden afgegeven na een simpele controle van het e-mailadres van de certificaat-aanvrager. De garanties zijn hierbij minimaal, en een dergelijk certificaat kan dan ook enkel gebruikt worden om aan te tonen dat men steeds met dezelfde persoon te maken heeft. Men kan er geenszins uit afleiden dat het gaat om een echt bestaande persoon, waarvan de identiteit overeen komt met de identiteit van de certificaat-houder. Iedereen kan immers via een e-mailadres een andere identiteit aannemen. Andere certificaten worden pas uitgereikt nadat er voldoende bewijs werd verkregen van naam, adres en de andere identiteitsgegevens, die via het on-line registratieformulier door de certificaat-aanvrager werden verschaft. Dit bewijs wordt vaak bekomen door een beroep te doen op databanken met persoonsgegevens die in handen zijn van derden. De beste identiteitscontrole is natuurlijk om de persoonlijke verschijning te eisen van de certificaataanvrager. Sommige CAs vragen dat de certificaat-aanvrager persoonlijk met zijn aanvraag naar een notaris zou stappen, die dan de identiteit moet controleren en bevestigen. Andere CAs vereisen dan weer dat de certificaat-aanvrager zich persoonlijk aanbiedt bij een vertegenwoordiger van de CA met de nodige identiteitsbewijzen. •
Wat is de inhoud van een digitaal certificaat?
Een digitaal certificaat kan alle soorten informatie bevatten die nodig is om de certificaat-houder te identificeren. Meestal bevat het de naam (of het kenmerk) van de certificaat-houder, diens publieke sleutel, de vervaldatum van het certificaat (gebaseerd op de voorspellingen van cryptografen), de naam van de CA die het certificaat heeft afgeleverd en een serienummer. Soms kan er nog andere informatie toegevoegd zijn, zoals beperkingen op het gebruik van het sleutelpaar of andere identiteitsgegevens buiten de naam, zoals het e-mailadres. •
Wat is de vorm van een digitaal certificaat?
Opdat certificaten automatisch zouden kunnen gecontroleerd worden door de computer van de bestemmeling, is het van belang dat zij allemaal op dezelfde wijze zijn opgebouwd. Daarom is het nodig dat de CAs de internationale standaarden volgen, die zeer precies beschrijven welke elementen een certificaat allemaal moet bevatten. De opkomende standaard voor certificaten is het x.509 certificatenformaat. Deze standaard beschrijft precies welke binaire data er in het certificaat moeten
16
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
voorkomen. Momenteel is het x.509 formaat voor zgn. ’gekwalificeerde certificaten als standaard. 11
10
’ voorgedragen
De verschillende componenten van een certificaat zien er volgens deze standaard als volgt uit: versie van het certificaat, serienummer van het certificaat, algoritme waarmee de CA het certificaat versleuteld heeft, de naam van de CA, geldigheidsduur van het certificaat (bestaat uit twee data, nl. de eerste en de laatste dag waarop het certificaat geldig is), de naam van de certificaathouder, informatie over de publieke sleutel van de certificaat-houder en tenslotte het certificaat van de CA als die er een heeft. •
Zijn er omstandighede n waarin ik een certificaat niet mag vertrouwen, zelfs binnen de aangegeven geldigheidsduur?
Er bestaan vele omstandigheden waarin iemands certificaat niet meer mag gebruikt worden, ook al is de geldigheidsperiode nog niet verstreken. Indien het toch verder gebruikt wordt, mag het niet meer vertrouwd worden. Dit is bijv. het geval wanneer er twijfel is ontstaan over de vertrouwelijkheid van de private sleutel, of wanneer de in het certificaat opgenomen gegevens niet meer met de werkelijkheid overeenstemmen bijv. wanneer de archivaris zijn functie verlaten heeft. In dat geval is de band tussen het sleutelpaar en de identiteit of het kenmerk permanent of tijdelijk verbroken, waardoor de digitale handtekening niet meer kan geauthentificeerd worden. •
Hoe weet ik of ik een certificaat nog kan vertrouwen?
Wanneer een certificaat gecompromitteerd is door een van de omstandigheden vermeld onder de vorige vraag, dan moet de certificaat-houder het certificaat herroepen. Wanneer de CA aanwijzingen heeft dat het certificaat werd afgeleverd op grond van identiteitsgegevens die niet met de werkelijkheid overeenstemmen, dan zal de CA het certificaat uit eigen beweging herroepen. Er bestaan voor de bestemmeling twee manieren om na te gaan of hij het certificaat kan vertrouwen. Het komt er op aan na te gaan of het certificaat geldig was op het moment dat de digitale handtekening gecreëerd werd. De bestemmeling kan gebruik maken van zgn. ‘Certificate Revocation Lists’ (CRLs). Dit zijn lijsten die de herroeping van de door haar uitgereikte certificaten openbaar maken, en die door de CA van minuut tot minuut worden bijgewerkt en on-line worden ter beschikking gesteld. De controle bestaat er dan in dat de bestemmeling nagaat of het serienummer van het certificaat voorkomt in de lijst. Het spreekt voor zich dat de CA iedere herroeping zo snel mogelijk moet opnemen in de lijst, zodat de periode tussen de herroeping en de publicatie van de herroeping zo kort mogelijk wordt gehouden. De
10
‘Gekwalificeerde’ certificaten zijn certificaten die voldoen aan de voorwaarden beschreven in bijlage II van de wet van 14 juni 2001 houdende vaststelling van bepaalde regels in verband met het juridisch kader voor elektronische handtekeningen en certificatiediensten. Zie VAN DEN EYNDE, S., Digitale archivering: een juridische stand van zaken vanuit Belgisch perspectief. Deel 1, Leuven, ICRI, 2001, 87 p.
11
RFC (Request for Comment) nr. 3093. http://www.ietf.org/iesg/1rfc_index.txt
17
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
bestemmeling zal het certificaat immers vertrouwen, als de herroeping niet in de lijst is opgenomen. Deze methode wordt door de CAs het meest gehanteerd. De bestemmeling kan ook een beroep doen op een ‘Online Certificate Service Provider’. Hij stelt dan aan de CA de vraag of het certificaat met dat serienummer op dat moment nog geldig is en krijgt in real-time een antwoord van de ‘certificate status server’. Hiermee heb je echter geen zekerheid over de geldigheid van het certificaat op het moment van de creatie van de digitale handtekening. Hoe korter de tijd is tussen de creatie van de digitale handtekening en het verkrijgen van een antwoord, des te groter wordt het vermoeden dat dit wel zo was. •
Waarom zou ik de CA van mijn communicatiepartner vertrouwen?
Wanneer een gebruiker, wiens publieke sleutel gecertificeerd is door een CA, veilig informatie wil uitwisselen met een persoon, wiens sleutel gecertificeerd is door een andere CA, moeten beide gebruikers elkaars CA vertrouwen. Een manier om dit vertrouwen te verkrijgen, is via het systeem van ‘cross-certification’, waarbij beide CAs elkaars publieke sleutel certificeren. Een andere mogelijkheid is dat de twee CAs gecertificeerd worden door een derde CA, die dan optreedt als ‘root-CA’. Dit levert een hiërarchische CA-structuur op. De gemakkelijkste en meest voorkomende oplossing bestaat er in dat de CA de eigen publieke sleutel certificeert en deze op de eigen website plaatst. ‘Self-certification’ is mogelijk omdat de CAs die hier een beroep op doen, kunnen voortgaan op het vertrouwen dat zij inboezemen op basis van hun andere activiteiten, zoals het aanbieden van financiële diensten.
IV. WAT MOET ER PRECIES BEWAARD WORDEN VOOR DE BEWARING OP LANGE TERMIJN VAN DIGITALE INFORMATIE? 12
In de papieren wereld is de papieren drager datgene wat men in eerste instantie bewaart. Het bewaren van kwalitatief goed papier in goede staat is de enige en tevens een voldoende bewerking om de informatie die het bevat veilig te stellen voor de toekomst. In een digitale wereld gaat het echter niet op om de drager gelijk te stellen met de te bewaren informatie.13 Wanneer de juiste maatregelen genomen worden bij de archivering, overleeft digitale informatie immers de drager waarop zij is opgeslagen. De drager kan slechts gedurende een relatief korte termijn bewaard worden, omdat de
12
13
Dit deel kwam tot stand met de hulp van de onderzoeksgroep Document Architecturen van de afdeling Toegepaste Electronica en Optiek van de K.U.Leuven. Dit is te wijten aan het feit dat bewaartermijnen de levensduur van digitale dragers te boven gaan. Dat de digitale drager tijdens de bewaartermijn moet vervangen worden, staat op voorhand reeds vast. Bij papier is dit veel minder zeker. Zeker wanneer er een goede kwaliteit van papier werd gekozen (o.a. papier met een lage zuurtegraad) en dit papier in goede omstandigheden wordt bewaard, kan dit zelfs enkele eeuwen meegaan. Bewaartermijnen blijven meestal ver onder de levensduur van papier.
18
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
levensduur ervan, evenals van de hardware die nodig is om de drager te lezen, beperkt zijn. Een essentieel inzicht bij de bewaring van digitale informatie moet daarom zijn dat de bewaring zich enkel richt op de pure inhoud, meer bepaald op de data die deze inhoud voorstellen. In een digitale omgeving zullen die data steeds uit bitreeksen bestaan. Het zijn deze bitreeksen waarvoor de archivaris zorg moet dragen en niet meer zozeer voor de drager zelf. Het voorwerp van de bewaring heeft zich in de digitale wereld verlegd van de drager naar de data zelf.14 Voor de bewaring op lange termijn van digitale informatie is het uiteraard niet voldoende dat enkel die bitreeks geïdentificeerd en bewaard wordt in het archiefbeheerssysteem, die de informatie voorstelt waarvan de bewaring beoogd wordt. Opdat deze informatie voor een onbepaalde termijn efficiënt in zijn oorspronkelijke staat voorhanden zou zijn, moet er veel meer bewaard worden dan de inhoud alleen. Al deze informatie over de inhoud waarvan de bewaring beoogd wordt, noemt men ‘metadata’. Het komt er dus op aan om een informatiepakket samen te stellen dat alle elementen bevat die noodzakelijk zijn om de inhoud leesbaar en beschikbaar te houden op lange termijn. Hoe zo’n informatiepakket er idealiter uitziet, bekijken we in de volgende secties. In deel V analyseren we de verschillende fases bij de werking van een archiefbeheers systeem dat gebruik wil maken van het OAIS-model. Vooraf moet er opgemerkt worden dat de informatie die nodig is voor de la nge termijn bewaring van digitale informatie (de inhoud), ook meestal bitreeksen zijn. 15 Voorafgaand aan de archivering moeten er dus verschillende bitreeksen geïdentificeerd, geselecteerd en eventueel door de archivaris aangelegd worden.
A. INHOUD Op de eerste plaats moet natuurlijk de informatie waarvan de bewaring beoogd wordt, zijnde de inhoud, geïdentificeerd worden. Wat wil men bewaren: een tekst, een e-mailbericht, meerdere databanken enz.? Voor de geselecteerde inhoud moet het achterliggende data-object geïdentificeerd worden. Data zijn de voorstellingsvorm van informatie en kunnen cijfers, letters, symbolen (leesbaar voor de mens) of bits (onleesbaar voor de mens) zijn. In een digitale omgeving zullen de data steeds bits zijn. De bitreeks die de te archiveren informatie voorstelt, moet uiteraard bewaard worden.
B. VOORSTELLINGSINFORMATIE ²In een papieren omgeving vallen de data en de informatie samen: het geheel van de data is onmiddellijk begrijpelijk voor de mens. In een digitale omgeving is dit anders. Het geheel van bits moet eerst door een PC vertaald worden naar voor de mens begrijpelijke tekens. Bij de archivering van
14
Dit wil natuurlijk niet zeggen dat er geen zorg moet besteed worden aan de digitale drager. Immers, ook al staat de te bewaren informatie in principe los van elke drager, toch vergt het bestaan van een digitaal archiefstuk vanuit praktisch oogpunt een drager die de digitale informatie tijdelijk vasthoudt.
15
In sommige gevallen zou men ervoor kunnen opteren deze bijkomende informatie als hard copy te bewaren, omdat zij steeds moet beschikbaar blijven. Het is natuurlijk de uitdaging om te zorgen dat ook de heel belangrijke gegevens op lange termijn in digitale vorm kunnen bewaard worden, zodat er uiteindelijk niets meer op papier moet bijgehouden worden.
19
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
de inhoud moeten er bijgevolg maatregelen genomen worden die ervoor zorgen dat de bits die deze inhoud voorstellen, nog terug kunnen omgevormd worden naar voor de mens begrijpbare informatie. Dit is de problematiek van de leesbaarheid van de digitale informatie op korte termijn, ook wel de presenteerbaarheid genoemd. Met korte termijn bedoelen we dat de gearchiveerde digitale informatie vanaf het moment van de archivering (en op ieder moment daarna) leesbaar moet kunnen zijn. De impact van de veranderende technologie wordt in dit stadium nog niet mee in overweging genomen. Alle metadata die nodig zijn om de data leesbaar te houden op korte termijn, noemt men in het OAISmodel de ‘voorstellingsinformatie’. De voorstellingsinformatie maakt het mogelijk om de bits te herleiden naar voor de mens algemeen bekende data, zoals cijfers, letters, symbolen enz. De voorstellingsinformatie voegt dus betekenis toe aan de bits en deze informatie moet toelaten om de bitreeks te converteren in meer betekenisvolle informatie. Er moet een lange weg afgelegd worden van de data die op de drager staan naar de voor de mens begrijpelijke boodschap. In de informaticawereld wordt dit gewoonlijk voorgesteld aan de hand van vijf lagen van software, die nodig zijn om deze omzetting te kunnen voltooien. 16 Elke hogere laag van software is afhankelijk van de resultaten van de bewerkingen in de lagere lagen.
B. 1
Fysieke laag
B.1.1
Beschrijving
Alle digitale informatie, al dan niet reeds gearchiveerd, staat hoe dan ook op een drager. Door het ongrijpbare en vluchtige karakter van digitale informatie, lijkt deze enkel te bestaan op het beeldscherm dat als tijdelijke drager fungeert. Toch is er steeds een drager die deze informatie op een meer permanente wijze vasthoudt.17 De drager van gearchiveerde informatie hangt af van de wijze waarop de informatie werd gearchiveerd. Het is mogelijk dat de informatie op een externe drager werd gezet voor archiveringsdoeleinden bijv. op een CD-rom (= een optische drager) of op een diskette (= een magnetische drager). In de toekomst zal digitale informatie echter vooral in een netwerkomgeving gearchiveerd worden. 18 De drager is dan bijv. de harde schijf van de server. De functie van de fysieke laag bestaat erin om de informatie die op de drager staat, om te zetten naar een drageronafhankelijke bitreeks. De wijze waarop de informatie op de drager is weergegeven, kan immers niet door de computer gelezen worden. In het geval van een optische drager, gaat het bijv. om kleine kuiltjes in de schijf. Op een magnetische drager is de informatie voorgesteld aan de hand van magnetische ladingen. 19 De software die gebruikt wordt in de fysieke laag, zegt dus hoe je de bitreeks 16 17
18
19
Reference Model for an Open Archival Information System, annex E. VAN DEN EYNDE, S., Digitale archivering: een juridische stand van zaken. Deel 1, Leuven, ICRI, 2001, 58. Nu al zijn er enkele archieven die in een netwerkomgeving opereren. Zie het Finse EVA -project (Acquisition and archiving of electronic records network publications), http://www.lib.helsinki.fi/eva/english.html Optische dragers zijn dragers van informatie die op een schijf wordt vastgelegd in de vorm van kleine kuiltjes, die bij het inlezen door een laserstraal wordt afgetast. De lichtreflecties worden omgezet in een elektrisch signaal dat de oorspronkelijke data reproduceert. Optische dragers hebben twee grote voordelen nl. hun informatiedichtheid en bijgevolg hun hoge opslagcapaciteit en de contactloze uitlezing van de data,
20
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
van de drager moet halen. Deze software is opgeslagen in chips die zich bevinden in de apparatuur die gebruikt wordt om de drager te lezen. B.1.2
Te archiveren metadata
Informatie over de software die nodig is om de drager te kunnen lezen, moet mee gearchiveerd worden. De meeste hardware ondersteunt de software die nodig is voor de meest courante dragers, omdat er daarvoor standaarden zijn ontwikkeld. Het is dan voldoende om naar die standaarden te verwijzen. Zo is er de ISO 9660-standaard voor CD-roms.20 De meeste CD-roms zijn in ISO 9660 formaat beschreven. Deze standaard beschrijft onder andere de wijze waarop de informatie op de CDrom is opgeslagen.
Dragerafhankelijke
Drageronafhankelijke
informatie
bitreeksen
Bijv. magnetische impulsen
B. 2
Binaire laag
B.2.1
Beschrijving
10011010100011
In de binaire laag worden de lange bitreeksen opgedeeld in stukken van beperkte lengte. De software die in deze laag gebruikt wordt, bepaalt welke opeenvolgingen van 1-en en 0-en samen horen om betekenis te kunnen krijgen in een volgende laag. Simpelweg gezegd komt het er op neer dat in deze laag wordt gezegd hoe de bits moeten worden gegroepeerd tot ‘pakketjes’ of bytes. Het bestandssyteem, ook wel file system genoemd, is de software die hiervoor wordt aangewend. Het bestandssysteem is een onderdeel van het besturingssysteem. Er bestaan verschillende soorten bestandssytemen. Sommige systemen groeperen de bits per acht, andere per zestien, per tweeëndertig enz. B.2.2
Te archiveren metadata
Informatie over het gebruikte bestandssyteem moet voorhanden zijn. Een bepaald bestandssyteem draait meestal niet onder één bepaald besturingssysteem, maar ieder besturingssysteem heeft
20
waardoor slijtage bijna volledig wordt uitgesloten. Magnetische dragers zijn dragers die bestaan uit een magneetband die onder invloed van een magneetkop (een spoel die door middel van elektrische stroom een magnetisch veld oproept) wordt gemagnetiseerd. Hierdoor vertonen de microscopisch kleine deeltjes op de band een bepaald patroon. http://www.iso.ch Zie de zeer volledige webpagina over CD’s: http://www.disctronics.co.uk/cdref/cdrom/cdromspec.htm
21
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
gewoonlijk wel een voorkeur voor een bepaald bestandssysteem. Windows NT bijv. functioneert met NTFS (NT File System) als bestandssysteem, terwijl Windows 95 werkt met FAT (File Allocation Table). Meestal zal de informatie over het soort bestandssysteem niet apart mee moeten gearchiveerd worden, vermits het besturingssysteem uit zichzelf ‘weet’ hoe de bits gegroepeerd worden. In principe moet men dus enkel de naam en de versie van het besturingssyteem mee archiveren.
1 0 1 0 0 1 1 1 0 1 1 0 0 0 1 1 0 1 0 1 0 0 0 1 0 1 1 1 0
WEL
B. 3
Structuurlaag
B.3.1
Beschrijving
NIET
Deze laag is enkel van belang wanneer men een computerprogramma wil gaan archiveren. Een computerprogramma is digitale informatie die in een bepaalde programmeertaal is opgemaakt en waarmee de computer allerlei bewerkingen kan uitvoeren. Deze laag definieert hoe de bytes waaruit het programma bestaat, moeten gecombineerd worden tot op zich staande gehelen waarnaar de computer zich kan richten en die de computer kan interpreteren, zoals bijv. primitieve datatypes. Primitieve datatypes zijn de bouwstenen van software. Men spreekt onder andere van characters (karakters), integers (gehele getallen) en reals (kommagetallen). Een reeks van informatie die uit dezelfde datatypes bestaat, noemt men een array. Een voorbeeld van informatie uit deze laag die moet gearchiveerd worden, zou de omschrijving kunnen zijn van wat het programma onder een geheel getal verstaat (zie schema). De informatie over hoe de software is opgebouwd, zit vervat in de programmeertaal waarin de software is opgesteld. Wanneer men het gearchiveerde programma na een bepaalde periode opnieuw nodig heeft, is (informatie over) de programmeertaal niet voldoende om het programma bruikbaar te houden. Er zal er ook programmatuur nodig zijn die de broncode van het programma kan omzetten in code die leesbaar is voor de computer. De programmeertaal waarin de broncode is opgesteld, is immers niet leesbaar voor de computer. Het programma kan enkel draaien via de voor de mens onleesbare code die achter de broncode schuil gaat. Dergelijke programma’s die de broncode van software kunnen omzetten naar computercode, noemt men compilers of interpreters.
22
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
B.3.2
Te archiveren metadata
Bij de archivering van de broncode van een computerprogramma moet er informatie over de compiler gearchiveerd worden, zodat het na jaren nog mogelijk is om het computerprogramma te laten draaien op de computer. Want indien de te gebruiken compiler onbekend is, wordt de broncode onbruikbaar. Ook informatie over de gebruikte programmeertaal wordt best mee gearchiveerd, omdat hierin is gedefinieerd hoe de software moet geïnterpreteerd worden. Het heeft geen zin dat de broncode op zich leesbaar is voor de computer dankzij de omzetting naar machinetaal door de compiler, als niet duidelijk is hoe de elementen van die machinetaal moeten samengelezen en geïnterpreteerd worden.
10010111
10010111
10010111
10010111
= INTEGER
232 (nl. 4 x 8) gehele getallen zijn er mogelijk als een geheel getal op deze wijze is vastgelegd in de programmeertaal
B. 4
Obj ectlaag
B.4.1
Beschrijving
Binaire code op zich (bits en bytes) is niet begrijpbaar voor de computer. Aan iedere bitreeks beantwoordt er een hexadecimale code. Bij het inlezen van de informatie door de computer gebeurt er automatisch een omzetting van de bitreeks naar hexadecimale code. Deze code heeft wel betekenis voor de computer. Het hexadecimale talstelsel gebruikt zestien basisnummers alvorens deze basisnummers te combineren om het zeventiende nummer aan te duiden. Onderstaande tabel geeft een vergelijking van het decimale, het hexadecimale en het binaire talstelsel. Het vetgedrukte nummer geeft telkens aan waar de combinatie van de nummers begint.
23
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Binair
hexadecimaal
decimaal
0
0
0
1
1
1
10
2
2
11
3
3
100
4
4
101
5
5
110
6
6
111
7
7
1000
8
8
1001
9
9
1010
A
10
1011
B
11
1100
C
12
1101
D
13
1110
E
14
1111
F
15
1111
10
16
In deze laag wordt er software gebruikt om semantiek toe te voegen aan de structuur. Hexadecimale code is niet begrijpbaar voor de mens. Het bestandsformaat waarin de informatie is opgemaakt, bepaalt welk hexadecimaal getal overeenstemt met een bepaald voor de mens verstaanbaar gegeven (bijv. de letter A). Er moet dus een omzetting plaatsvinden. Er bestaan vele bestandsformaten, zowel open als gesloten bestandsformaten. Van een open bestandsformaat is algemeen bekend hoe de omzetting gebeurt en dus welke voor de mens verstaanbare data bij welke hexadecimale cijfers horen. Bij een gesloten bestandsformaat weet enkel de uitvinder van het formaat hoe de omzetting gebeurt. JPEG (voor beeldbestanden), MPEG (voor bewegende beelden en geluidsbestanden) zijn bijv. open bestandsformaten; Doc (voor tekstbestanden) en EBCDIC (ondersteund door IBM) zijn dan weer vendorafhankelijke bestandsformaten. B.4.2 Te archiveren metadata Een vermelding van het bestandsformaat moet mee gearchiveerd worden, zodat later de conversie nog steeds correct kan gebeuren naar voor de mens begrijpbare data. Er wordt best ook een beschrijving van het bestandsformaat mee gearchiveerd met het oog op de veroudering ervan waardoor het niet meer ondersteund wordt. Wanneer er een standaard bestaat over het bestandsformaat, kan het volstaan
24
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
om een verwijzing naar deze standaard te archiveren. 21 Men moet er dan wel op letten dat men de verwijzing naar de juiste (versie van de) standaard archiveert.
4A = k 92 = K 7D = ?
B. 5
Applicatielaag
B.5.1 Beschrijving Nu de informatie op een voor de mens verstaanbare wijze aanwezig is in de computer, betekent dat nog niet dat deze informatie ook waarneembaar is voor de gebruiker. Daarvoor is de laatste laag nodig, die zich op het hoogste niveau bevindt. In deze laag bevindt zich de applicatiesoftware, die als interface fungeert naar de gebruiker toe en die de betekenisvolle informatie waarneembaar maakt voor de gebruiker. B.5.2 Te archiveren metadata Een vermelding van de te gebruiken (versie van de) applicatiesoftware moet mee gearchiveerd worden.
Applicatiesoftware
Bestandsformaat
Adobe Photoshop Beeldbestandsformaten o.a. JPEG, TIFF Notepad Tekstbestandsformaten Word
Doc-bestanden
. . .
21
Bijvoorbeeld ISO/IEC 10646. ISO/IEC 10464 is de eerste geofficialiseerde standaard van een bestandsformaat (Unicode) dat alle characters van iedere taal in de wereld een unieke code toekent. http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html http://www.unicode.org http://www.mulberrytech.com/papers/unicode
25
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Datgene wat we tot hier beschreven hebben, wordt in het OAIS-model de structurele voorstellingsinformatie genoemd. In dit model bestaat er nog een tweede soort voorstellingsinformatie: nl. de semantische voorstellingsinformatie. Dit is de informatie zonder dewelke de inhoud niet begrijpbaar is voor de mens. Deze informatie behandelen wij onder de categorie van de interpretatieve informatie.
C. INTERPRETATIEVE INFORMATIE De voorstellingsinformatie is nodig om de leesbaarheid of de presenteerbaarheid van de gearchiveerde digitale informatie te garanderen. Aan de hand van deze metadata kan men achterhalen en voorstellen welke voor de mens verstaanbare data er schuil gaan achter de binaire data. Dit is wat men verstaat onder leesbaarheid op korte termijn van digitale informatie. Opdat men aan deze voor de mens verstaanbare data ook nog een betekenis zou kunnen toekennen, is er echter bijkomende informatie nodig. Deze metadata noemt men de interpretatieve informatie. Het zijn alle gegevens die ervoor zorgen dat men zich een mening kan vormen over de gearchiveerde inhoud o.a. met betrekking tot de authenticiteit, de relatie van de inhoud tot de omgeving waarin hij werd gecreëerd, de herkomst van de informatie enz. Deze informatie is niet in de eerste plaats bestemd om te worden verwerkt door de software van de computer, maar om te worden verwerkt door de mens, zodat deze zich een oordeel kan vormen over het digitale archiefstuk.
C. 1
Authenticiteits- en integ riteitsg aranderende inform atie
Vooreerst zijn er de metadata die de integriteit en de authenticiteit van het informatieobject aantonen. Deze informatie bevat de middelen aan de hand waarvan kan gecontroleerd worden of de gearchiveerde inhoud authentiek en integer is en documenteert deze authentificatiemiddelen. Werd er bijv. door de auteur van een document een elektronische handtekening gebruikt als authentificatietechniek, dan moet deze elektronische handtekening omgeven worden met de nodige randinformatie en zo opgeslagen worden. Deze informatie is typisch voor een digitaal archiefstuk. In de papieren wereld wordt de integriteit gegarandeerd door de drager. Authenticiteit blijkt er uit het gebruik van allerlei technieken zoals stempels, zegels, handtekeningen, watermerken, legalisatie van handtekening, enz. die eveneens met de drager verbonden zijn. Aan de hand van deze metadata kan men zich een oordeel vormen over de integriteit en de authenticiteit van de gearchiveerde informatie.22 Men kan er al dan niet een ‘echt’ en ‘integer’ stuk in zien.
22
Hoe deze authenticiteitsgaranderende informatie eruit ziet in de digitale context en hoe deze informatie leesbaar gehouden wordt, is het onderwerp van een volgende DAVID-rapport.
26
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
C. 2
Herkom st van het inf orm atieobj ect
Deze metadata documenteren de historiek van het informatieobject, zowel over de periode dat het archiefstuk zich bij de archiefvormer bevond, als over de periode in het archiefbeheerssysteem: wie is de archiefvormer, in welke sector situeert het stuk zich, functie van het stuk, wie heeft de verantwoordelijkheid (gehad) over het stuk tijdens het eerstelijnsarchiefbeheer, enz. De metadata die iets zeggen over de herkomst van het informatieobject, betreffen dus niet alleen de identificatie van de archiefvormer, zoals het begrip ‘herkomst’ meestal bedoeld is in de archiefterminologie.
C. 3
Sem antische inf orm atie
Deze informatie is de semantische voorstellingsinformatie in de zin van het OAIS-model, waar we hierboven naar verwezen. Het zijn de metadata die absoluut noodzakelijk zijn opdat de doelgroep de inhoud zou kunnen begrijpen. Zonder deze informatie is de inhoud voor hen betekenisloos. De doelgroep zal voor iedere archiefinstelling verschillend zijn. Voor publiekrechtelijke archiefbewaarplaatsen zal de doelgroep erg ruim zijn en omvat potentieel alle Belgische burgers. De archiefafdeling binnen een bedrijf zal daarentegen een kleinere en duidelijkere omschreven doelgroep hebben. Nemen we het voorbeeld van een tekst die is opgemaakt in een vreemde taal. Afhankelijk van de doelgroep zal de klant de vreemde taal herkennen. Een zeer ruime doelgroep zal een Engelse of Franse tekst waarschijnlijk herkennen als een Engelse of Franse tekst. Dit is niet meer zo evident wanneer de tekst is opgemaakt in het Spaans of Portugees. Wanneer het daarentegen gaat om de archiefafdeling van een vertaalbureau, dan zal de doelgroep wellicht veel meer talen herkennen. In sommige gevallen zal men dus mee moeten archiveren om welke taal het gaat. Een ander voorbeeld vinden we in de in het kader van het DAVID-project uitgevoerde case van de kiezersregisters. Een van de velden van het kiezersregister bestaat uit het postnummer van de gemeente waar de kiesgerechtigde zijn woonplaats heeft. Voor de naam van de gemeente, horend bij het postnummer, bestaat er geen veld. Omdat de postnummers over de jaren heen kunnen wijzigen, is het nuttig om de namen van de bijhorende gemeenten mee te archiveren, of op zijn minst het tijdstip waarop deze postnummers geldend zijn. Anders is het onmogelijk om een betekenis toe te kennen aan de viercijferige nummers. Deze informatie is op zich niet typisch voor een digitaal archiefstuk. Ook voor het papieren kiezersregister is het nuttig om de betekenis van de postnummers mee te archiveren. Deze metadata worden slechts typisch voor de digitale context, indien de informatie onbegrijpbaar is juist omwille van het feit dat ze in digitale vorm is opgemaakt. In heel wat toepassingen van de stad Antwerpen worden er bijv. codes gebruikt met de bedoeling om geheugenruimte uit te sparen. Zo worden er in de bevolkingstoepassing van Antwerpen wel meer dan twintig verschillende codetabellen gebruikt, onder andere een codetabel waarmee het land van herkomst wordt aangeduid. Er is dan vereist dat het voor de klant duidelijk is of een ‘F’ Frankrijk of Finland betekent. Deze betekenissen moeten bijgevolg in de semantische informatie worden opgenomen. 27
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
C. 4
Contex tinf orm atie
Tenslotte zijn er de metadata die relatie van het informatieobject beschrijven tot de omgeving waarin het werd gecreëerd. Deze metadata zijn, in tegenstelling tot de semantische informatie, niet noodzakelijk opdat de klant de inhoud op zich zou kunnen begrijpen, nl. een betekenis zou kunnen toekennen aan de voor de mens begrijpbare tekens. De contextinformatie is bestemd om deze betekenis te kunnen plaatsen in een ruimer kader en omvat informatie zoals de reden waarom het informatieobject werd gecreëerd en hoe de verhouding is tot andere informatieobjecten, die elders bestaan. Deze informatie is niet typisch voor een digitale archiefcontext. Ook voor een papieren archiefstuk moet er bijgehouden worden hoe het zich verhoudt tot de andere stukken in en buiten het archief. Deze metadata kunnen gebruikt worden bij het samenstellen van de pakketbeschrijving.
D. PAKKETINFORMATIE De inhoud, de voorstellingsinformatie en de interpretatieve informatie, vormen samen het te bewaren informatiepakket. De pakketinformatie is nodig om de verschillende onderdelen van het informatiepakket die op de drager staan, te kunnen afbakenen en te identificeren als samenhorend. Pakketinformatie behoort niet tot het te bewaren informatiepakket omdat ze niet bijdraagt tot de leesbaarheid en de begrijpbaarheid van de informatie waarvan de bewaring in de eerste plaats beoogd wordt. Het is een hulpmiddel om efficiënt met het informatiepakket te kunnen omgaan. Pakketinformatie kan bijv. bestaan uit de beschrijving van afspraken die er gemaakt zijn voor het toekennen van bestandsnamen of uit de beschrijving van de structuur van directories. Wanneer de bestanddelen van een informatie pakket de inhoud uitmaken van verschillende bestanden van een CDrom, dan moet in de pakketinformatie terug te vinden zijn hoe de bestandsstructuur van de CD-rom eruit ziet. Na een migratie waarbij het informatiepakket overgezet wordt naar een andere drager met een andere structuur, dan blijft de pakketinformatie in principe niet behouden. Deze moet opnieuw vastgelegd worden voor het informatiepakket op de nieuwe drager.
E. PAKKETBESCHRIJVING Pakketbeschrijvingsinformatie bestaat uit metadata die het informatiepakket beschrijven om de gezochte, relevante informatie snel te kunnen terugvinden. Het bevat alle informatie die nodig is om een klant toe te laten om gearchiveerde informatie die voor hem mogelijk van nut is, te vinden, te analyseren en op te vragen. De bron van de pakketbeschrijvingsinformatie is de inhoud en de interpretatieve informatie en wordt daaruit door de archivaris afgeleid. De pakketbeschrijvingsinformatie dient als input voor de toegangsmiddelen, zoals zoekfuncties en
28
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
autoreply-systemen. Het is een hele reeks van gegevens over de inhoud en moet voor ieder type archiefstuk afzonderlijk bepaald worden. Vaak voorkomende gegevens uit de pakketbeschrijving zijn: archiefvormer, datum van aanmaak, titel, functie van het archiefstuk, trefwoorden, openbaarheidsstatus…
In het OAIS-model worden al deze verschillende soorten metadata voorgesteld in de classificatie van informatieobjecten. Ook de metadata (voorstellingsinformatie, interpretatieve informatie, pakketinformatie en pakketbeschrijving) worden beschouwd als een informatieobject.
Informatieobject
Inhoud
Voorstellingsinformatie
Interpretatieve
Pakket-
informatie
informatie
Pakketbeschrijving
V. DE VERSCHILLENDE FASES VAN HET DIGITALE ARCHIVERINGSPROCES IN KAART GEBRACHT AAN DE HAND VAN HET OAIS REFERENCE MODEL
In deel III gingen we na welke informatieobjecten er vereist zijn voor de bewaring op lange termijn van digitale informatie, zodanig dat deze informatie leesbaar, begrijpbaar en toegankelijk is voor alle klanten uit de doelgroep. In dit deel beschrijven we de verschillende functionele fases die in een digitaal archiveringsproces aan bod komen, gebaseerd op de classificatie van de informatieobjecten. Of met andere woorden: welke acties moet men allemaal ondernemen om een efficiënte bewaring van het informatiepakket mogelijk te maken? De bedoeling van deze denkoefening is ons dichter te brengen bij de identificatie van een aantal problemen, waarvoor PKI een oplossing kan bieden.
29
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
A. DE SPELERS IN
H ET VELD
Tot hiertoe hebben we naar de personen die een rol spelen in het digitale archiveringsproces steeds gerefereerd als ‘men’. Maar welke partijen zijn er eigenlijk precies betrokken in het digitale archiveringsproces? Het OAIS-model onderscheidt drie betrokken partijen: de archiefvormer (producer), het Open Archival Information System en de klant (consumer). We verkiezen om niet te spreken over ‘consument’, maar over ‘klant’. Deze term is in de Nederlandse archiefterminologie algemeen gangbaar geworden, waaruit blijkt dat archiefinstellingen zich meer dan vroeger als dienstverleners zijn gaan opstellen.
A. 1
De archief vorm er
De archiefvormer is diegene die de te archiveren informatie heeft aangemaakt of ontvangen. Hij vervult vooral een rol in de eerste fase van het digitale archiveringsproces nl. de fase van de invoer (ingest) in het archief. In het DAVID-project gaat het om de Vlaamse instellingen en diensten in de mate dat zij als archiefvormer optreden. Hieronder vallen zowel de Vlaamse overheidsbesturen die in toepassing van de archiefwet hun archiefstukken niet mogen vernietigen (bijv. steden en gemeenten), als partic uliere archiefvormers die op eigen initiatief een archiefbeleid voeren (bijv. bedrijven, natuurlijke personen, families enz.). A. 2
De klant
De klant is een lid van de doelgroep ten behoeve waarvan de informatie bewaard wordt. De klant komt vooral voor in de laatste fase van het digitale archiveringsproces nl. de fase van de toegang. De doelgroepen voor de benutting van archieven zijn zeer verschillend: de ambtenaar op zoek naar een zaak die vroeger door zijn dienst werd behandeld, de persoon of overheidsdienst die zijn rechten wil veiligstellen, de burger die recht heeft op de blijvende openbaarheid van de bestuursdocumenten, de geïnteresseerde leek op zoek naar zijn roots, de wetenschappelijke navorser die een bepaald aspect van het maatschappelijk leven in het verleden wenst te onderzoeken23 enz. Het leesbaar en toegankelijk maken van archiefstukken vergt voor elke doelgroep een andere benadering.
A. 3
De archief instelling
De archiefinstelling is de organisatie van personen en systemen, die de verantwoordelijkheid heeft om informatie te bewaren en toegankelijk te maken en te houden voor de doelgroep. De archivaris staat aan het hoofd ervan. Er bestaan twee organisatievormen voor archiefinstellingen. De archiefinstelling kan los van de archiefvormer bestaan als afzonderlijke entiteit (bijv. het algemeen Rijksarchief), waaraan de archiefvormer de informatie ter archivering afgeeft. Een archiefinstelling bevindt zich op een andere plaats dan de archiefvormende organisatie. Het archief kan ook een functie zijn binnen de organisatie waarvan de informatie moet bewaard worden. Men spreekt dan over een ‘archiefdienst’. 23
http://arch.arch.be/TAKEN.HTML
30
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
De archiefdienst is meestal gevestigd in de archiefvormende organisatie, maar dit is niet noodzakelijk zo.24 Hoewel het element plaats zijn belang verliest in de digitale wereld, zullen deze organisatievormen ook blijven bestaan wanneer archiefinstellingen volop digitale archiefstukken zullen gaan archiveren, niet alleen omdat men met papieren archiefstukken zal blijven geconfronteerd worden, maar ook omdat de archivaris en de archieffunctie als instelling van belang zal blijven.
Organisatie
Organisatie
Archiefinstelling
Archiefdienst
De vraag is gerezen of de archiefinstelling als zodanig inderdaad nog zal blijven bestaan in de digitale wereld. De speciale eigenschappen van digitale informatie lijken immers een einde te maken aan het onderscheid tussen records and archives, tussen de records manager en de archivaris. Deze tweedeling is ontstaan tijdens de Franse Revolutie, die de archieven van het Ancien Régime van hun primaire functies heeft beroofd en er historisch archief van heeft gemaakt.25 De archieftaal is doordrongen geraakt van dit onderscheid, dat afkomstig is uit de Angelsaksische literatuur. De Duitstaligen noemen het recente archief Registraturgut en het permanent te bewaren archief Archivgut. In de Nederlandse taal wordt dit onderscheid aangeduid door te verwijzen naar bepaalde fasen in de levensloop van een archiefstuk. Men spreekt van dynamisch archief als men verwijst naar de stukken die nog courant gebruikt worden door de archiefvormer en waarbij de dossiers waarvan ze deel uitmaken voortdurend worden aangevuld. Semi-statisch archief (soms ook wel semi-dynamisch archief genoemd) bevindt zich nog steeds onder de verantwoordelijkheid van de archiefvormer, maar wordt niet meer courant gebruikt. Tijdens deze fase kunnen er in de organisatie voor deze records tussenarchieven worden ingericht om een eerstelijnsarchiefbeheer te kunnen voeren. Archieven in de statische fase tenslotte, zijn overgedragen aan een archiefinstelling, die speciaal is uitgerust voor de permanente bewaring van de archieven die niet voor vernietiging zijn aangewezen.
24
25
Het Stadsarchief Antwerpen bijvoorbeeld, maakt juridisch gezien deel uit van de archiefvormer, nl. de administratie van de stad Antwerpen, maar bevindt zich op een aparte locatie. THOMASSEN, T., ‘Archivarissen en records managers: zelfde professie, verschillende verantwoordelijkheden’, in Naar een nieuw paradigma in de archivistiek , HORSMAN, P.J., KETELAAR, F. en THOMASSEN, T. (ed.), Stichting archiefpublikaties, jaarboek 1999, 186.
31
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
RECORDS
Aanmaak
ARCHIVES
Overdracht naar archiefinstelling binnen of buiten de organisatie
Dynamische fase
Semi-statische fase
Statische fase
Ook de wetgeving is afgesteld geraakt op dit onderscheid. De archiefwet heeft voor de archiefstukken van de Rijksbesturen een overbrengingstermijn van honderd jaar ingevoerd. Dit wil zeggen dat de stukken geacht worden gedurende honderd jaar nog een administratief nut te hebben voor de archiefvormende overheid en dat ze gedurende deze termijn in principe bij de overheid zelf (of bij diens archiefdienst) moeten bewaard worden. In samenspraak met de archiefinstellingen wordt deze termijn nochtans doorgaans verkort.26 Ook in de openbaarheidswetgeving wordt het onderscheid bevestigd tussen bestuursdocumenten die zich nog bij de overheid bevinden en de bestuursdocumenten die reeds werden overgedragen aan de archiefinstelling. Art. 11 van de Wet van 11 april 1994 betreffende de openbaarheid van bestuur (B.S. 30 juni 1994) bepaalt dat haar bepalingen ook van toepassing zijn op de bestuursdocumenten die in een archief zijn neergelegd, behalve wanneer het om het Rijksarchief gaat of om het Rijksarchief in de Provinciën. Eenzelfde bepaling vinden we terug in de Wet van 12 november 1997 betreffende de openbaarheid van bestuur in de provincies en de gemeenten (B.S. 19 december 1997). Moet dit onderscheid nu opgeheven worden met de komst van digitale archiefstukken? Het proces van digitale archivering moet immers beginnen nog vóór de te archiveren informatie is aangemaakt. Reeds in de ontstaansfase van digitale informatie moeten er bijzondere maatregelen worden genomen om een efficiënte en permanente bewaring van informatie mogelijk te maken. Het vastleggen van een aantal essentiële metadata zal echter vaak pas kunnen gebeuren in de loop van de dynamische of de semistatische fase, zoals bijvoorbeeld gegevens over het formaat of over een migratie die werd uitgevoerd. Zo gesteld, lijken de beroepen van de records manager en de archivaris met elkaar te versmelten in het digitale tijdperk. Niets is minder waar. De functie van de archivaris is onontbeerlijk, ook in een digitale omgeving. Naarmate digitale archiefstukken ouder worden, verandert hun functie en rijzen er vragen over het nut van hun verdere bewaring. Enkel een geschoolde archivaris kan oordelen over de archiefwaarde ervan. De idee van een archiefstuk dat op bepaald moment onder hoede van een archivaris wordt geplaatst omdat de bewaring verantwoord is, blijft dus behouden. Het statisch archief blijft ook in het digitale tijdperk de bestemming voor de informatie die geen onmiddellijk nut meer 26
SUETENS, S., ‘De archiefwet’ in X. (ed.), Mediarecht Boeken, afl. 7, 1996, 19.
32
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
heeft voor het bedrijfsproces. Ook de records manager blijft behouden als de functie die deel uitmaakt van het bedrijfsproces van een organisatie, in die zin dat hij de informatie in een goede en geordende staat ter beschikking houdt voor de uitvoering van de taken van de organisatie. Wat er wel moet veranderen, is de afwachtende houding van de archivaris. Het heeft geen enkele zin meer, en het is zelfs af te raden, dat de archivaris passief blijft totdat hij de fysische macht krijgt over de archiefstukken op het moment dat ze in de archiefinstelling toekomen. 27 Het is dit wat men in de literatuur bedoelt men het verdwijnen van het onderscheid tussen de dynamische, de semi-dynamische en de statische fase van het archiefstuk. 28 De fases op zich blijven behouden, maar de archivaris zal nu ook in de dynamische en in de semi-statische actief moeten tussenkomen. In de digitale wereld is archivering geen activiteit meer die pas plaatsvindt op het einde van de levensloop van het archiefstuk wanneer de beslissing is gevallen dat het moet bewaard blijven. Bij overheidsinstellingen bestaat de neiging om het probleem van lange termijn-bewaring van digitale informatie bij de archiefinstellingen te leggen. Hoewel deze eenzijdige invalshoek ook voor papieren archiefstukken meer en meer verlaten wordt, is het vooral voor digitale archiefstukken een must dat er reeds bij het begin van de levenscyclus van het archiefstuk bewaringsmaatregelen worden genomen. Daarom lijkt het nuttig dat er in het kader van de Vlaamse Gemeenschap een samenwerkingsverband zou tot stand worden gebracht tussen de administraties en archiefinstellingen, teneinde records managers, IT managers en informaticaleveranciers binnen de overheid bewust te maken van dit probleem. 29 Dit moet ertoe leiden dat de archivaris in de toekomst meer zou betrokken worden bij het informatiebeleid van de overheid. Besluitend kunnen we zeggen dat we met de term ‘archiefinstelling’ de functie bedoelen die instaat voor de permanente bewaring, in tegenstelling tot de zorg die aan de archiefstukken wordt besteed door de archiefvormende dienst. Een archiefinstelling kan een afzonderlijke entiteit zijn, of ze kan deel uitmaken van de archiefvormende organisatie. Ook ten aanzien van digitale archiefstukken blijft de archiefinstelling in ieder geval behouden als expert inzake selectie van informatie met archiefwaarde, de permanente bewaring van deze informatie en het beschikbaar stellen ervan.
27 28
29
THOMASSEN, T., o.c., 187. Zie o.a. HOFMAN, H., ‘De digitale archivaris: een nieuwe wereld. De invloed van informatietechnologie op het archiefvlak’, in Naar een nieuw paradigma in de archivistiek, HORSMAN, P.J., KETELAAR, F. en THOMASSEN, T. (ed.), Stichting archiefpublikaties, jaarboek 1999, 214. MCKEMMISH, S., ‘Yesterday, Today and Tomorrow: a continuum of responsibility’, beschikbaar op http://www.sims.monash.edu.au/rcrg/publications/recordscontinuum/smckp2.html Naar analogie met het Nederlandse programma ‘Digitale Duurzaamheid’. Dit is een samenwerkingsverband tussen het Rijk, de provincies, de gemeenten en de waterschappen, en rijksarchiefdiensten. http://www.archief.nl/digiduur
33
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
B. VIER B. 1
FASES
Invoer
In deze fase wordt het archiefstuk ontvangen door de archiefinstelling en klaargemaakt voor opname in het archiefbeheerssysteem. De situatie zoals hierboven beschreven is ideaal. Er moet naar gestreefd worden dat al deze metadata voorhanden zijn en mee kunnen gearchiveerd worden. Maar de digitale informatie komt het archiefbeheerssysteem meestal zo niet binnen. Hierin ligt het onderscheid tussen een overgedragen informatiepakket, een te archiveren informatiepakket en een toegankelijk gemaakt informatiepakket. Deze verschillende concepten zijn nodig om te kunnen beantwoorden aan de realiteit dat de meeste overgedragen informatie niet voldoet aan de archiveringsvereisten op lange termijn, en tevens dat de toegankelijk gemaakte informatie niet noodzakelijk alle informatie (mag) bevat(ten) die door de archiefinstelling werd gearchiveerd. B.1.1
Verschillende soorten informatiepakketten
B.1.1.1 Informatiepakket Het basisconcept dat het OAIS-model gebruikt voor bewaring op lange termijn, is het ‘informatiepakket’. Een informatiepakket bestaat uit twee soorten informatieobjecten, enerzijds de inhoud (met bijhorende voorstellingsinformatie) en anderzijds de interpretatieve informatie. Een informatie-object bestaat op zijn beurt uit data (nl. bits) en de bijhorende voorstellingsinformatie. Hierboven legden we uit dat er voor de inhoud voorstellingsinformatie nodig is om deze inhoud leesbaar te houden op korte en op lange termijn. Maar dit is natuurlijk eveneens zo voor alle andere informatie die er naast de inhoud ook nog moet bewaard worden. Deze informatie bestaat immers ook uit voor de mens onleesbare bits. Ook voor de interpretatieve informatie is er bijvoorbeeld voorstellingsinformatie nodig. Ieder informatiepakket kan geassocieerd worden met twee andere soorten informatieobjecten, zijnde de pakketinformatie en de pakketbeschrijving. Onderstaande figuur stelt het concept ‘informatiepakket’ grafisch voor.
34
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
afgeleid van
identificeert
Pakketbeschrijving
Informatiepakket
beschreven door
Inhoud
Begrijpbaar gemaakt door
Pakketinformatie
afgebakend door
Interpretatieve informatie
Ieder informatiepakket bevat maximum één inhoudelijk informatieobject, een interpretatief informatie object, en wordt geassocieerd met exact één pakketinformatie -object. Het wordt ook geassocieerd met een onbeperkt aantal pakketbeschrijvingen die de toegang tot de inhoud vergemakkelijken. B.1.1.2 Overgedragen informatiepakket Het overgedragen informatiepakket is het informatiepakket dat door de archiefvormer aan de archiefinstelling wordt overgedragen. Dit informatiepakket is meestal niet geschikt voor onmiddellijke archivering omdat het niet aan alle archiveringsvereisten voldoet. Een overdracht dient immers steeds in goede, geordende en toegankelijke staat te gebeuren. De overdracht is het moment bij uitstek om de staat van het archief na te gaan. 30 B.1.2
Taken van de archiefinstelling tijdens de invoerfase
B.1.2.1 Het overgedragen informatiepakket ontvangen De overdracht van digitale informatie kan op verschillende manieren gebeuren. Het is mogelijk dat de drager met daarop de digitale informatie aan de archiefinstelling wordt overgedragen. Deze manier leunt het dichtst aan bij de wijze van overdracht van papieren archiefstukken: een fysische verplaatsing van de drager brengt de te archiveren informatie tot in de archiefinstelling. Een tweede mogelijkheid bestaat erin dat de digitale informatie via een telecommunicatienetwerk van de archiefvormer naar de archiefinstelling wordt gezonden. In dit geval gaat het om een fysische verplaatsing van de bits via de informatiesnelweg, bijv. via het Internet. Tenslotte kan de informatie ook zonder fysische verplaatsing onder de verantwoordelijkheid van de archiefinstelling komen te 30
COPPENS, H., Archiefbeheer in gemeenten en O.C.M.W.’s, Brussel, Algemeen Rijksarchief, 1997, 190. Bij sommige archiefinstellingen bestaat er de tendens om, in samenspraak met de archiefvormer, reeds vóór de overdracht toezicht uit te oefenen op de ordening en de staat van de archiefstukken.
35
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
staan. De informatie blijft dan op server van de archiefvormende organisatie staan, maar krijgt dan de status ‘gearchiveerd’ mee. Het is van belang om in te zien dat de overdracht, net zoals in de papieren wereld, slechts een juridische kwestie is betreffende de verantwoordelijkheid voor het archiefstuk. Een fysische verplaatsing van het archiefstuk is niet nodig om van een overdracht te spreken. Bij papieren archiefstukken is dit echter meestal wel het geval 31 , tenzij ze bijvoorbeeld bij de archiefvormende instantie worden gelaten omwille van plaatsgebrek in de archiefbewaarplaats. Ten aanzien van digitale archiefstukken zal de loutere overdracht van beheer en verantwoordelijkheid zonder enige fysische verplaatsing in de toekomst veel vaker voorkomen dan een overdracht die wel gepaard gaat met een fysische overdracht.32 In de beginfase van de omschakeling van papieren naar digitale archieven, waarin we ons nu volop bevinden, zal de overdrachtsprocedure nog heel nauw samenhangen met de klassieke, papieren procedures. Dit heeft te maken met het feit dat oplossingen voor problemen vaak geformuleerd worden vanuit paradigma’s, van waaruit we naar de wereld kijken. Vernieuwingen worden vaak bekeken vanuit het oude, heersende paradigma.33 Voor de archiefwereld betekent dit dat men in eerste instantie misschien geneigd zal zijn om terug te grijpen naar de klassieke archiveringsstrategieën, die echter niet bruikbaar zijn in de digitale wereld. Pas wanneer de digitale revolutie volledig zal worden begrepen en de consequenties ervan voor de archiefwereld duidelijk zijn, kunnen de voordelen van de digitalisering ten volle spelen. Het zich inleven in deze nieuwe situatie gebeurt echter steeds geleidelijk. Dit heeft te maken met het feit dat het papieren paradigma de archivarissen in de beginfase van de omschakeling nog steeds in haar ban zal hebben. 34 Een voorbeeld van het feit dat het digitale paradigma slechts moeizaam ingang vindt, is te vinden in het concept van de huidige tekstverwerkers, zoals MS Word. Hoewel de bedoeling van veel gebruikers erin bestaat om een onwijzigbaar elektronisch document te creëren als eindproduct, dat kan uitgewisseld worden via telecommunicatienetwerken, zijn de tekstverwerkers van 31
COPPENS, H., o.c., 188.
32
Het archief van de toekomst wordt in de literatuur voorgesteld als een netwerk van geordende databanken (o.a. HEDSTROM, M., ‘Electronic Archives: Integrity and Access in the Network Environment’, American Archivist, Vol. 58, Summer 1995, 313. De enige verplaatsing waarvan er in een dergelijke omgeving nog sprake kan zijn, is een verplaatsing in cyberspace. Volgens KUHN is een paradigma een theoretisch geheel waarover brede overeenstemming bestaat binnen een bepaald onderzoeksdomein, en dat als voorbeeld dient voor de 'normale wetenschapper' op het terrein. Wanneer het heersende paradigma aan het wankelen wordt gebracht door de komst van vernieuwingen, ontstaat er een crisis binnen de discipline en barst er een strijd los tussen de oudere vertegenwoordigers van de discipline en de nieuwkomers. Deze nieuwe generatie zal het nieuwe paradigma geleidelijk in zich opnemen en de problemen waarmee de discipline te kampen krijgt, oplossen vanuit dit nieuwe paradigma. De komst van de digitalisering heeft een crisis doen ontstaan binnen de archiefdiscipline. Archiveringsstrategieën zullen vanuit dit nieuwe digitale paradigma moet geformuleerd worden.
33
34
KUHN, Th. S., De structuur van wetenschappelijke revoluties, Boom Meppel, 1987, 4e druk. http://home.tvd.be/cr27486/Kuhn.html Denk bijvoorbeeld aan de omschakeling naar de Euro. In de beginfase zullen we onbewust de in Euro aangegeven bedragen blijven omrekenen naar Belgische frank. Het spreekt voor zich dat sommige mensen zich de nieuwe munt sneller zullen eigen maken dan anderen. Dit geldt ook voor de paradigmawijziging in de archiefwereld. Heel wat archiefinstellingen zijn er zich nu al goed van bewust dat het enkel gaat om de bewaring van de inhoud, en weigeren de dragers op zich.
36
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
vandaag nog steeds opgevat als hulpmiddel om een papieren document te genereren. We kunnen dit vergelijken met de vroegere typemachine, die werd ingezet om een onwijzigbaar eindproduct te maken. Immers, de meeste tekstverwerkingsprogramma’s hebben als resultaat een document waarvan de structuur en de lay-out worden weergegeven op het scherm. Wanneer deze elementen worden aangebracht met een tekstverwerker, hebben zij echter geen enkele betekenis ten aanzien van het elektronisch document. De onwijzigbaarheid wordt pas bereikt wanneer het resultaat wordt uitgeprint op een papieren drager.35 Merk ook op dat de huidige PC’s uiterlijk gezien veel weg hebben van de klassieke typemachine, waarbij het resultaat onmiddellijk zichtbaar is op het scherm als de elektronische versie van het papieren document. Zodra het digitaliseringsproces volledig zal zijn voltooid en onze handelwijze zal veranderd hebben, zal de archivering van digitale gegevensdragers stilaan verdwijnen. Een archiefinstelling met kasten vol CD-roms, die door de archiefvormer werden overgedragen, zal een zeldzaamheid worden. Zoals hierboven reeds werd aangehaald, moet men afstappen van het archiveren van gegevensdragers, vermits gegevensdrager en informatie niet meer samenvallen. Gegevensdragers zijn slechts tijdelijke hulpmiddelen om de digitale informatie vast te houden. Alleen in een netwerkomgeving kunnen de voordelen van digitalisering, zoals het wegvallen van de belemmeringen van plaats en tijd, ten volle benut worden. Het uitgangspunt bij digitale archivering moet zijn dat op termijn alle informatie op hetzelfde moment en overal ter wereld voor iedereen beschikbaar moet kunnen zijn. 36 Informatieleveranciers, en met name ook de archivaris, moeten vanuit dit standpunt leren denken en handelen. Bijgevolg zal de overdracht best gebeuren, hetzij via telecommunicatienetwerken, hetzij via het toekennen van de status ‘gearchiveerd’. Wanneer het archiefbeheerssysteem voor de opslag van de informatie gebruik maakt van een andere server dan die van de archiefvormende organisatie, zal er een transfer moeten plaatsvinden tussen deze twee servers. Deze situatie kunnen we vergelijken met de archiefinstelling als aparte fysische entiteit, los van de archiefvormende organisatie. Er moet dan ‘ruimte’ overbrugd worden bij de overdracht. In het geval van twee (of meer) aparte servers (die in principe naast elkaar kunnen staan), ligt de te overbruggen ruimte tussen de verschillende onderdelen van het netwerk. Dit heeft niets te maken met geografische ruimte. In het andere geval is er zelfs geen fysische verplaatsing van de informatie, zelfs niet via een netwerk. De archivaris zal met behulp van PKI deze status kunnen toekennen. Dit kan hij doen door het archiefstuk te versleutelen met zijn publiek sleutel. Op die manier zal alleen hij als archivaris met zijn private sleutel toegang hebben tot het archiefstuk.
35
Om een volwaardig elektronisch document te creëren, moet er een conversie gebeuren naar een formaat dat elementen zoals structuur en lay-out wel kan vasthouden, zoals PDF. PDF (Portable Document Format) is een bestandsformaat dat het ‘beeld’ van het elektronisch document vastlegt, als of er foto van zou worden genomen, en dat toelaat om deze ‘electronic image’ uit te wisselen en af te drukken, onafhankelijk van de PC of de printer die gebruikt wordt. http://www.adobe.com/products/acrobat/adobepdf.html
36
HOFMAN, H., ‘De digitale archivaris: een nieuwe wereld. De invloed van informatietechnologie op het archiefvlak’, l.c., 214; BAAK, P. en KOENEN, K., ‘Het geheugen als actieve kracht. De archieffunctie binnen de digitale overheid’, Programma Digitale Duurzaamheid, Den Haag, 1999, 15.
37
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Deze twee nieuwe manieren om een archiefstuk over te dragen, gelden natuurlijk alleen voor digitale archiefstukken. Het feit dat het element ‘plaats’ irrelevant worden in de digitale wereld, moeten we daarom toch enigszins relativeren. Papier zal immers altijd blijven bestaan als drager van informatie en de digitaal uitgebouwde archieffunctie moet ook de niet-digitale omgeving blijven erkennen en ondersteunen. Men zal blijven geconfronteerd worden met papieren archiefstukken die eveneens permanent moet gearchiveerd worden. Daarom argumenteerden we hierboven dat archiefinstellingen zullen georganiseerd blijven volgens twee modellen. Het archief als een verzameling van gearchiveerde informatie op een andere plaats dan binnen de archiefvormende organisatie, zal behouden blijven, hoewel een louter digitaal archief perfect kan functioneren onafhankelijk van elke geografische ligging. De overdracht via een telecommunicatienetwerk of het toekennen van de status ‘gearchiveerd’ moet zo snel mogelijk na de juridische overdracht gebeuren. Het digitale karakter van de archieven dwingt de archivaris immers om op zeer korte termijn maatregelen te kunnen nemen en bijgevolg moet ook het feitelijk beheer over de archiefstukken bij hem berusten. De wijzen van overdracht zullen in het digitale kader grondig veranderen. De archiefinstelling moet daarom voldoende uitgerust zijn om de digitale archiefstukken te kunnen ontvangen. Aanvankelijk zal zij digitale gegevensdragers in ontvangst nemen op een wijze die grotendeels dezelfde is als de in ontvangst name van papieren archiefstukken nl. het fysiek in handen nemen door de archiefinstelling. Wanneer de (voordelen van de) digitalisering volledig zal (zullen) zijn doorgedrongen, gebeurt de overdracht via telecommunicatiene twerken of door toekenning van de status ‘gearchiveerd’. Hierbij moet steeds voor ogen worden gehouden dat er, net zoals in de papieren wereld, een onderscheid bestaat tussen een overdracht in fysische zin en een overdracht in juridische zin. Enkel het toekennen van het feitelijke archiefbeheer aan de archiefinstelling, kan leiden tot de creatie van een te archiveren informatiepakket.
B.1.2.2 Kwaliteitsbewaking bij de overdracht Hoewel ze in het OAIS-model na de ontvangst van het overgedragen informatiepakket wordt behandeld, moet deze taak de eigenlijke juridische overdracht voorafgaan. De juridische overdracht mag enkel plaatsgrijpen als de archiefstukken aan alle voorwaarden voldoen die noodzakelijk zijn om bewaring op lange termijn te kunnen waarborgen. GOEDE, GEORDENDE EN TOEGANKELIJKE STAAT In de archiefterminologie vinden we steeds weer de bewoordingen dat de archiefstukken ‘in goede, geordende en toegankelijke staat’ moeten overgedragen worden. ‘Geordende staat’ betekent dat de archiefstukken zodanig zijn geordend dat zij binnen een redelijke termijn kunnen worden teruggevonden. Met ‘goede staat’ wordt het geheel van materiële condities aangegeven waaraan de gegevensdrager en de daarop vastgelegde informatie moeten voldoen om raadpleging nu en in de
38
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
toekomst te garanderen. ‘Toegankelijke staat’ heeft dan weer te maken met een goede ontsluiting naar de klanten toe. Binnen de archiefwereld zijn er allerlei technieken ontwikkeld om een archief in een geordende en toegankelijke toestand te brengen en te houden. Het opmaken van een goed ordeningsplan is hierbij een belangrijke stap in de goede richting. Dit is een plan, opgemaakt door de archiefvormende organisatie, met als doel het rangschikken van archiefstukken en archiefbestanden binnen een archief overeenkomstig een bepaald systeem. 37 Deze techniek is gebaseerd op een systematische weergave van de opdrachten van een organisatie, de daaruit voortvloeiende taken, handelingen en activiteiten die nodig zijn om die taken te realiseren, met daarbij telkens een opsomming van de archiefstukken die gevormd of ontvangen worden ter ondersteuning van die handelingen. Aan de hand van dit plan kan iedere medewerker van de organisatie aangeven waar de door hem afgehandelde stukken moeten terecht komen. Om de overdracht en de plaatsing in het statisch archief vlot te kunnen laten verlopen, maakt de archiefvormer een overdrachtslijst op. Dit is een soort checklist met een gedetailleerde beschrijving van de overgedragen archieven, waarvan de indeling overeenstemt met de indeling van het ordeningsplan. Naar aanleiding van de overdracht, wordt er op iedere verpakkingseenheid (bijv. op de archiefdoos) een volgnummer aangebracht. Aan ieder archiefbestanddeel binnen een verpakkingseenheid, wordt er bovendien nog eens een intern volgnummer toegekend. 38 Deze volgnummers komen dan ook voor op de overdrachtslijst bij de vermelding van de corresponderende overgedragen archiefbestanddelen. Op die manier kan de archivaris nagaan welke stukken precies worden overgedragen. Zo krijgt hij ook een zicht op de ordening die door de archiefvormer werd aangebracht. Het opmaken van een overdrachtslijst, gebaseerd op het ordeningsplan, en gecombineerd met het aanbrengen van volgnummers op de fysieke stukken, wordt in de papieren archieven gevolgd om de orde en toegankelijkheid, aangebracht door de archiefvormer, te kunnen handhaven. Overeenkomstig het structuurbeginsel moet de archiefinstelling deze orde immers mee overnemen in het statisch archief.39 De reden hiervoor is gelegen in het feit dat archiefstukken tot stand komen in het kader van werkprocessen en dat zij in die ontstaanscontext ook best worden bewaard. Wanneer archiefstukken bijvoorbeeld chronologisch geordend zijn, mag de archivaris ze in het statische archief niet alfabetisch gaan ordenen. De onderlinge samenhang van de archiefstukken en de context zouden dan immers verloren gaan. Enkel wanneer de ordening door de archiefvormende organisatie niet op een afdoende wijze werd doorgevoerd, kan de archivaris een archiefschema 40 voorstellen.
37
COPPENS, H., o.c., 71.
38
Dit is echter niet altijd zo. Dit kan een aanbeveling zijn van een bepaalde archiefdienst, maar het kan ook gebeuren dat er geen interne volgnummers worden toegekend, omdat het oorspronkelijke dossiernummer behouden blijft, ofwel dat het volgnummer van de archiefbestanddelen doorlopend is ongeacht de doos waarin verpakt.
39
Archieftermenlexicon voor Nederland en Vlaanderen http://www.kvan.nl Wat een ordeningsplan is voor de archiefvorming in de dynamische fase, is het archiefschema voor de ordening van het archief in de statische fase.
40
39
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Overdrachtslijst 1
Volgnummer
Volgnummer
Beschrijving
Verpakkingseenheid archiefbestanddeelarchiefbestanddeel
1
1
1
2
Bouwvergunningen overdracht 2001
1
3
1
4
2
1
2
2
3
1
De vraag rijst of deze procedure kan of moet gehandhaafd blijven voor digitale archiefstukken. De koppeling van de fysieke stukken aan de logische ordening met behulp van de volgnummers, is een typisch papieren werkwijze die er op gericht is om het werk van de archivaris te verlichten in een omgeving met tastbare archiefstukken. Op die manier is hij niet verplicht om alle archiefdozen te openen met de bedoeling om te controleren om welke archiefstukken het gaat. De archiefdozen zullen immers de archiefinstelling niet binnenkomen volgens de logische orde die de archiefvormer had aangebracht. Tijdens de overgangsfase, waarin nog digitale gegevensdragers zullen overgedragen en gearchiveerd worden 41 , blijft deze procedure nog steeds nuttig. De archiefstukken zullen in zekere zin nog tastbaar zijn en de dragers zelf moeten gemarkeerd worden met een volgnummer, dat eveneens in een papieren overdrachtslijst moet terug te vinden zijn. Wanneer een gegevensdrager slechts één archiefbestanddeel bevat, kan volstaan worden met het markeren van deze dragers. Komen er echter meerdere archiefbestanddelen per gegevensdrager in de vorm van verschillende bestanden, dan moeten deze bestanden eveneens op een identificeerbare wijze gemarkeerd worden.
41
Cf. supra
40
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Overdrachtslijst Volgnummer
Volgnummer
Beschrijving
Verpakkingseenheid archiefbestanddeelarchiefbestanddeel
1
1 1
1
Bouwvergunning CDRom
1:
BT-
overdracht-2001.pdf 1
2
1
3
1
4
2
1
2
2
Van zodra echter de overdracht zal gebeuren via een telecommunicatienetwerk, kunnen de stukken niet meer fysisch gemarkeerd worden. Het probleem blijft nochtans hetzelfde. Het zal niet volstaan om de archiefstukken in een willekeurige volgorde en zonder bijkomende informatie door te sturen naar de archiefinstelling. De archivaris zal er immers geen idee van hebben welk bestand welk archiefstuk bevat, ook al krijgt hij een overdrachtslijst (in digitale vorm) doorgestuurd met daarin de beschrijving van alle overgedragen stukken. Hij zal dan verplicht zijn om alle bestanden één na één te openen en te identificeren. Opdat de archivaris dus de geordende en toegankelijke staat van de digitale archiefstukken zou kunnen nagaan en beoordelen, is het van belang dat zij met de logische ordening in verband kunnen worden gebracht. Iedere kleinste verpakkingseenheid op digitaal vlak, zijnde het informatiepakket, moet bijgevolg identificeerbaar gemaakt worden voor de archivaris. Dit kan bijvoorbeeld gebeuren door ieder informatiepakket te voorzien van een duidelijke en uniforme naamgeving die overeenkomt met de naamgeving in de overdrachtslijst.
41
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Overdrachtslijst in digitale vorm Bestand 1 : bouwaanvragenArchiefvormer
overdracht-2001.pdf
Archief-
Bestand 2 :
instelling
bouwvergunningenoverdracht-2001.pdf
Bestand 1 :
Bestand 2 :
bouwaanvragen-
bouwvergunningen-
overdracht-
overdracht-2001.pdf
2001.pdf
100101…
101110… Overgedragen informatiepakketten
Hierbij is het nodig op te merken dat een digitaal archief tijdens de beginfase waarschijnlijk meer herordeningswerk van de archivaris zal vragen dan thans in de papieren archieven het geval is. Archiefvormers gebruiken nu meer en meer de ordenings- en toegankelijkheidssystemen die de informatietechnologie ter beschikking stelt. Het beheer van informatie binnen de bedrijfsprocessen gebeurt echter meestal niet volgens archivistische principes.42 Opslag van digitale bestanden gebeurt vaak op de eigen harde schijf, die alleen voor de gebruiker toegankelijk is en waar dus niemand het bestaan van kan nagaan. Bovendien vinden we vaak vele verschillende versies terug, waarvan de status onbekend is. Daarbij komt nog dat de gebruiker zelf de bestanden niet meer terugvindt door de onoverzichtelijke en onlogische wijze waarop de bestanden geordend zijn. In het beste geval wordt de informatie per dienst of departement op een schijf bijgehouden, waarop ieder een eigen privé-archief onderhoudt. Vaak gebeurt er zelfs helemaal geen registratie, laat staan een opslag, van informatie met een hoge archiefwaarde. Denken we maar aan e-mails. De klassieke brievenbus, waarvan de inhoud routinematig geregistreerd wordt, moet meer en meer plaats maken voor de mailbox. E-mails kunnen op een eenvoudige en onopvallende wijze door de geadresseerde op eigen initiatief vernietigd worden. Registratie ervan is in heel wat organisaties totaal afwezig. 43 Meer nog dan vroeger het geval was, is het daarom van het grootste belang dat de archivaris de keuze en het beleid inzake het digitale ordenings- en toegankelijkheidsproces bij de archiefvormers ondersteunt en begeleidt. Wat de goede, materiële staat van de drager betreft, moet de controle door de archivaris bij de overdracht eveneens vanuit een totaal andere invalshoek bekeken worden. Deze voorwaarde heeft alles
42 43
BAAK, P. en KOENEN, K., l.c., 20. SCHNEIDER, D., ‘E-mail – Just Another Record. A systems approach to incorporate e-mails into a records management environment’, E-doc Magazine, March/April 2000, 33.
42
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
te maken met de leesbaarheid van de informatie. Voor papieren archiefstukken kan het volstaan dat de papieren drager waarop de informatie is vastgelegd, in een goede conditie worden gebracht en gehouden door de archiefvormende instantie. Het is dan vooral een kwestie om kwalitatief goed papier te gebruiken en om dat papier in een stofvrije omgeving met de juiste omgevingstemperatuur en vochtigheidsgraad weg te bergen. Zoals gezegd zal men in het archief van de toekomst immers weinig of geen externe dragers meer archiveren. In een digitale omgeving wordt de leesbaarheid dan ook beïnvloed door andere factoren dan de conditie van de drager. De archivaris moet er zich bij de overdracht van vergewissen dat de archiefvormer alle nodige metadata mee overdraagt die nodig zijn voor de leesbaarheid van de informatie. Hierboven maakten we een onderscheid tussen de leesbaarheid op korte termijn, ook wel de presentaarbaarheid genoemd, en de leesbaarheid op lange termijn. Gegevens omtrent de leesbaarheid op korte termijn moeten steeds voorhanden zijn bij de overdracht van digitale archiefstukken. Dit is eigen aan het feit dat de data waaruit digitale informatie bestaat, nl. bits, niet leesbaar zijn voor de mens.44 Het gaat om de hierboven beschreven voorstellingsinformatie omtrent de leesapparatuur van de drager, omtrent het gebruikte bestandssysteem (bijv. NTFS), omtrent het bestandsformaat (bijv. .doc) en omtrent de applicatiesoftware (bijv. MS Word). De leesbaarheid op lange termijn komt in het gedrang wanneer er een tijdsperiode is verstreken die zo lang heeft geduurd dat er bezorgdheid is ontstaan over de impact van de veranderende technologie op de middelen die de leesbaarheid op korte termijn garanderen. De impact bestaat erin dat deze middelen (hardware, bestandssyteem, bestandsformaat en/of applicatiesoftware), die aangewend werden bij de aanmaak van het digitale archiefstuk, verouderd zijn door de snelle evoluties in het informaticalandschap en bijgevolg niet meer ondersteund worden. De digitale informatie zal dus na verloop van een dergelijke tijdsperiode niet meer kunnen gelezen worden bij gebrek aan de oorspronkelijke hardware, het oorspronkelijke bestandssyteem en/of de oorspronkelijke applicatiesoftware. Ook het oorspronkelijke bestandsformaat zal dan niet meer herkend worden door de nieuwe informaticaomgeving. Om digitale informatie toch leesbaar te houden op lange termijn, worden er grosso modo drie pisten aangereikt, waarvan het afdrukken van de informatie op papier en het mee archiveren van de technologie (nl. de oorspronkelijke hardware, het oorspronkelijke bestandssyteem (als deel van een besturingssyteem) en de oorspronkelijke applicatiesoftware) de minst aangewezen oplossingen zijn. 45 De migratie - en de emulatiestrategie lijken op dit moment de enige bruikbare opties te zijn. Zonder in te gaan op de details van beide strategieën en op de kwestie wanneer welke strategie best gevolgd wordt 46 , moet hier benadrukt worden dat de migratie of de emulatie, die eventueel werd uitgevoerd voor de overdracht aan de archiefinstelling, goed moet gedocumenteerd worden en dat deze documentatie mee moet overgedragen worden aan de archiefinstelling als metadata. Deze informatie is immers nodig om de ‘goede staat’ van de digitale informatie op het moment van de overdracht te controleren. Want indien de leesbaarheid van de overgedragen informatie niet gegarandeerd is op het moment van de overdracht, zal deze zeker naar de toekomst toe niet kunnen gewaarborgd worden door 44 45
46
Cf. supra. BOUDREZ, F., De archivering van digitale archiefbescheiden: beheersinventaris, informatielagen en beslissingsmodel als uitgangspunt, Antwerpen, Stadsarchief, 2001, 7. Zie hiervoor: BOUDREZ, F., o.c., 7 e.v.
43
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
de archivaris. De archivaris moet dus nagaan of de emulatie(s) en/of migratie(s) op een correcte wijze zijn gebeurd en of alle metadata voorhanden zijn om de historiek van deze bewerkingen te kunnen begrijpen. Wanneer er niet tijdig werd ingegrepen om de leesbaarheid op lange termijn te garanderen, dan moet de archiefvormer dit melden bij de overdracht, zodat de archivaris nog kan trachten dit te verhelpen. 47 De archiefvormer kan natuurlijk enkel de metadata overdragen die betrekking hebben op de leesbaarheid op lange termijn op het moment van de overdracht. Dit wil zeggen dat enkel informatie kan gegeven worden over de bewerkingen die werden uitgevoerd door de archiefvormer. Wat er verder met de digitale informatie zal gebeuren om de leesbaarheid te garanderen, is een zaak van de archiefinstelling. Hoewel de archiefinstelling pas het beheer over de digitale archiefstukken krijgt bij de (juridische) overdracht, is het toch aangewezen dat de archivaris de leesbaarheid op lange termijn van deze archiefstukken met een hoge archiefwaarde opvolgt van bij het ontstaan van deze stukken en, indien nodig, richtlijnen geeft over de te volgen strategieën. 48 De informaticadienst van een organisatie heeft immers niet altijd oog voor de problematiek van permanente bewaring.
VALIDATIE VAN DE OVERDRACHT
Naast de controle van het zich bevinden in goede, geordende en toegankelijke staat, komt daar in de digitale wereld nog een aspect bij nl. de validatie van de overdracht zelf. Hiermee bedoelen we dat de archivaris moet nagaan of de informatie die hij aangeboden krijgt voor archivering, niet gewijzigd is tijdens de overdracht (= integriteit van de informatie ). Bovendien moet hij er zeker van zijn dat diegene die de informatie aanbiedt, ook werkelijk de persoon of de organisatie is die over de te archiveren informatie beschikt, en niet iemand die zich voordoet als zijnde de bevoegde persoon of organisatie (= origine van de informatie ). Het spreekt voor zich dat de archivaris ook in de papieren wereld geen archiefstukken zal aanvaarden als hij merkt dat ze niet afkomstig zijn van de archiefvormende dienst of instelling. Hij heeft dan immers goede redenen om aan te nemen dat de archiefstukken zelf niet authentiek zijn. In een papieren omgeving dringt deze problematiek zich echter niet in dezelfde mate op zoals in de digitale wereld, en hij wordt dan ook niet behandeld in de klassieke werken over archivering en archiefbeheer. Met de overdracht van papieren archiefstukken gaat er immers steeds een fysisch contact gepaard tussen de
47
48
COPPENS, H., o.c., 131. Cf. de meldingsplicht van zichtbare schade, zoals schimmels en door vocht aangetast papier, in hoofde van de overdrager. Deze schade kan de leesbaarheid op lange termijn eveneens in het gedrang brengen indien zij niet wordt verholpen. Net zoals de archivaris voor het herstel van de schade aan papieren archieven soms een beroep moet doen op professionele restaurateurs, zal de ‘digitale’ archivaris soms een beroep moeten doen op computerspecialisten om de nodige emulatie- of migratie-inhaalbeweging te laten uitvoeren. Bijvoorbeeld het formaat waarin een document best wordt aangemaakt, de termijn waarbinnen voor dat formaat aan migratie moet gedacht worden, aanbevelingen betreffende het gebruik van zo ruim mogelijk ondersteunde applicatiesoftware… Dit kan vergeleken worden met de taak van de archivaris in de papieren wereld om te wijzen op de geringe houdbaarheid van bepaalde papiersoorten, om het gebruik van bepaald verpakkingsmateriaal aan te bevelen (zo heeft het Algemeen Rijksarchief mappen en archiefdozen laten ontwikkelen die beantwoorden aan de voorwaarden voor langdurige bewaring)…
44
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
(verantwoordelijke van de) archiefvormende organisatie en de archivaris (of één van zijn medewerkers), meestal doordat de archiefinstelling de fysische stukken ophaalt in de gebouwen de archiefvormende organisatie. Op die manier vindt de identificatie van de overdrager onbewust plaats. De archivaris zal zich nooit in een positie bevinden dat hij niet kan achterhalen wie de overdrager is. In een digitale omgeving is deze controle soms wel vereist, afhankelijk van manier waarop de overdracht van de digitale informatie gebeurt. Worden er voorlopig nog digitale dragers overgedragen en gearchiveerd, dan dient er een fysisch contact plaats te vinden en is er geen probleem. Wanneer de digitale informatie echter via een telecommunicatienetwerk naar de archiefinstelling wordt gestuurd, dan is er geen fysisch contact mogelijk. Diegene die zich aanbiedt met de informatie, kan dan in principe eender wie zijn. De geëigende manier om zich op Internet of in een ander netwerk kenbaar te maken aan zijn communicatiepartner, is met behulp van zijn digitale handtekening. De archiefvormer berekent dan de digitale handtekening voor het geheel van de informatiepakketten die moeten overgedragen worden en stuurt ze mee naar de archiefinstelling. Indien de archivaris de ontvangen informatie kan ontsleutelen met de publieke sleutel van de archiefvormer, weet hij zeker dat het pakket ook echt afkomstig is van de archiefvormer, aangezien alleen hij zijn eigen private sleutel kent. Wanneer de informatie op de locale server van de archiefvormende organisatie blijft staan voor de archivering, gebeurt er zelfs geen virtuele verplaatsing tussen de verschillende onderdelen van een netwerk door een overdrager die moet geïdentificeerd worden. Het is dan de server zelf die moet geïdentificeerd worden als toebehorend aan de archiefvormende organisatie. De server moet dan zijn digitale handtekening aanbieden aan de archivaris die de archiefstukken die op de server staan, wil gaan verzegelen met zijn publieke sleutel. Ter gelegenheid van de overdracht van digitale informatie moet ook de integriteit van deze informatie gecontroleerd worden. Bij papieren archiefstukken is het onmogelijk dat de data tijdens de overdracht wijzigen, vermits het papier en de verpakking integriteitsbeschermend werken. Dankzij het papier is de inhoud op een stabiele wijze vastgelegd. De verpakking fungeert als een soort enveloppe, waardoor de inhoud beschermd is tegen invloeden van buitenaf. Op digitaal niveau doet het probleem zich enkel voor wanneer de informatie voor de overdracht op een digitale gegevensdrager wordt geplaatst en wanneer er een telecommunicatienetwerk wordt gebruikt. Voor de digitale versie van het Antwerpse kiezersregister van de verkiezingen van 8 oktober 2000 werd de eerste piste gekozen. 49 Vóór de overdracht stond het kiezersregister in zijn origineel formaat op de mainframecomputer van de dienst burgerzaken. Naar aanleiding van de archivering werden alle bestanden op CD-rom geplaatst en zo overgedragen aan het stadsarchief. In dit scenario wordt er een kopie gemaakt op een andere drager om de overdracht te kunnen doen. Dit kan tot integriteitsverlies leiden wanneer er een fout gebeurt bij het kopiëren. Vermits de archiefvormer deze kopie maakt, is het aan hem om een integriteitscheck uit te voeren vóór de overdracht, bijv. door een hashingoperatie uit te voeren voor en na het maken van de kopie. Het is de archiefvormer die verantwoordelijk is voor de inhoud van wat hij overdraagt.
49
Deze keuze is ingegeven door het feit dat in de meeste administraties op dit moment nog geen PKI is uitgebouwd, waardoor een digitale overdracht nog niet voldoende beveiligd kan verlopen.
45
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
In het andere scenario moet er een soort enveloppe gecreëerd worden, zodat iedere wijziging die er tijdens de transfer zou plaatsvinden, onmiddellijk kan opgemerkt worden. De digitale handtekening, die gecreëerd werd om de origine van de informatie vast te stellen, kan hiervoor gebruikt worden. Het is hierbij aan te bevelen dat de archiefvormer de digitale archiefstukken niet onmiddellijk verwijdert van de harde schijf van zijn computer. Het nadeel van een digitale transfer is immers dat het wel mogelijk is dat de inhoud wijzigt tijdens de korte periode van de transfer. Wanneer de archivaris dit vaststelt, moet de overdracht opnieuw gebeuren. VERKLARING VAN OVERDRACHT In het OAIS-model moet er een bevestiging van de ontvangst volgen op de ontvangst van het overgedragen informatiepakket. Dit is nodig opdat op onbetwistbare wijze kan vastgesteld worden dat de beheersverantwoordelijkheid vanaf een bepaald moment bij de archiefinstelling berust. Voor papieren documenten gebeurt dit aan de hand van een verklaring van overdracht. Wanneer de archivaris vaststelt dat de kwaliteit van de archiefstukken gegarandeerd is bij de overdracht, wordt er een verklaring van overdracht opgemaakt. Deze verklaring is een overeenkomst tussen de archiefvormer en de archiefinstelling, waarmee de archiefvormer het beheer over bepaalde archiefstukken overdraagt aan de archiefinstelling en deze laatste verklaart ze op een bepaalde datum in ontvangst te hebben genomen. De beide betrokken partijen bekrachtigen de overeenkomst met hun handtekening. 50 Deze overeenkomst wordt opgemaakt in twee exemplaren en wordt bewaard in het overdrachtsdossier, waarin de overdracht omstandig is gedocumenteerd. Worden er digitale dragers overgedragen, dan wordt de verklaring op papier mee overgedragen met de dragers. Wanneer de overdracht via een telecommunicatienetwerk plaatsvindt, spreekt het voor zich dat ook de verklaring van overdracht digitaal zal opgemaakt en uitgewisseld worden. De techniek van de digitale handtekening kan hier gebruikt worden om een elektronische handtekening te plaatsen. Door het gebruik van de techniek van de digitale handtekening kan ook komen vast te staan dat de archivaris de overgedragen informatie wel degelijk heeft ontvangen. In de papieren wereld zijn er hierover nog nooit discussies ontstaan, maar naar aanleiding van een digitale overdracht zouden deze discussies wel eens kunnen ontstaan. Stel dat de archiefvormer de informatie na de overdracht verwijdert van de harde schijf, en achteraf blijkt dat de archiefinstelling deze nooit heeft ontvangen. Om dit te vermijden stuurt de archivaris de door hem elektronisch ondertekende verklaring van overdracht en het geheel van overgedragen informatiepakketten naar de archiefvormer, samen met de voor deze overgedragen informatiepakketten berekende digitale handtekening. Na een positieve controle van de digitale handtekening, weet de archiefvormer zeker dat de archiefinstelling de overgedragen informatiepakketten heeft ontvangen, en kan hij ze uit het eigen documentatiebeheerssysteem verwijderen. Past de publieke sleutel op de private sleutel van de archivaris, dan weet de archiefvormer zeker dat het de archivaris is die de stukken teruggestuurd heeft en bijgevolg ook ontvangen heeft. De digitale handtekening wordt immers berekend op basis van de overgedragen informatiepakketten. De teruggestuurde informatiepakketten en digitale handtekening
50
COPPENS, H., o.c., 192.
46
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
moet de archiefvormer na deze controle trouwens ook niet bewaren; de archivering zou het eigen documentatiebeheerssyteem dan alleen maar belasten in plaats van ontlasten. Men zou kunnen aanvoeren dat de overdrager, ter vervanging van een elektronische verklaring van overdracht, bij het verzenden van digitale informatie de ontvangstfunctie zou kunnen instellen, waardoor hij een bericht zal ontvangen wanneer de informatie toekomt, waarin bevestigd wordt dat de geadresseerde de informatie ontvangen heeft.51 Voor een overdracht naar aanleiding van archivering is deze werkwijze echter onbruikbaar, vermits het niet de ontvangst op zich is die moet vastgelegd worden, maar wel de bevestiging door de archivaris dat de stukken kwalitatief in orde waren bij de overdracht en dat hij ze in die staat in ontvangst heeft genomen. De archivaris moet zich dus na een grondige controle een oordeel vormen of hij de overgedragen stukken in de toestand waarin ze zich bevinden, kan en wil ontvangen. Deze beslissing kan niet door een automatisch reply-system worden genomen. Indien de stukken op de locale server blijven staan, dan zal de (datum van de) overdracht ook juridisch moeten vastgelegd worden, ook al vindt er geen fysische overdracht plaats. Vermits er geen fysisch contact plaatsvindt tussen de overdrager en de archivaris, is de meest praktische oplossing dat deze overeenkomst elektronisch wordt afgesloten en ondertekend. Een belangrijk onderdeel van de verklaring van overdracht, is de vermelding van de datum waarop de stukken zijn overgedragen. Is de overeenkomst in elektronische vorm afgesloten, dan zijn er theoretisch gezien twee mogelijkheden om een datum in dit elektronisch bericht op te nemen. De datum kan door de partijen vastgesteld worden en gewoon deel uitmaken van de tekst van de overeenkomst, zoals in de papieren wereld steeds het geval is. Elektronische berichten kunnen ook een datum verkrijgen doordat een derde partij deze datum vaststelt, de ‘Time-Stamping Authority’ (TSA) genoemd. 52 De procedure van het verkrijgen van een ‘time-stamp’ ziet er als volgt uit: de computer van de archiefvormer berekent een hashing-code voor de elektronisch aangemaakte verklaring van overdracht. Deze hashing-code wordt dan op een beveiligde manier over het Internet naar de TSA gezonden, die de datum en eventueel het tijdstip van het ‘time-stampen’ eraan toevoegt 53 , en vervolgens dat geheel ‘ondertekent’ met zijn private sleutel. Het resultaat noemt men de ‘time-stamp’ en wordt teruggestuurd naar de archiefvormer. De ‘time-stamp’ wordt aan de verklaring van overdracht toegevoegd en wordt mee elektronisch ondertekend. Indien men later de datum van de overdracht wil bewijzen, dan weet men aan de hand van de overeenstemmende hashing-codes (de hashing-code berekend op basis van de originele tekst en de ontsleutelde ‘time-stamp’) dat de datum werd toegevoegd aan de inhoud die achter de hashing-codes schuil gaat, of met andere woorden, dat het wel degelijk gaat om de datum van de verklaring van overdracht. ‘Time-stamping’ is een manier om de datum van een overeenkomst die op elektronische wijze werd gesloten, op een onbetwistbare wijze vast te leggen. Deze techniek is gebaseerd op de idee dat de 51
De meeste e-mailprogramma’s zijn met deze functie uitgerust.
52
Op dit moment zijn er al heel wat TSAs operatief op het Internet. Zie: http://www.cryptomathic.com/products/timeink.html , http://www.wisekey.com/swissetime/index.htm Bepaalde technieken zorgen ervoor dat de TSA steeds de correcte datum en tijd toevoegt aan de hashingcode.
53
47
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
getijdstempelde informatie moet bestaan hebben ten laatste op het moment dat de ‘time-stamp’ tot stand komt. Dit is logisch, vermits de ‘time-stamp’ berekend wordt op basis van de inhoud van de getijdstempelde informatie. De TSA doet dus in feite niets anders dan het vaststellen van een feit, nl. het bestaan van bepaalde elektronische informatie, en het toevoegen van de datum van deze vaststelling aan deze elektronische informatie. Met behulp van de techniek van ‘time-stamping’ kan dan ook enkel elektronische informatie een datum verkrijgen. De datum die voorkomt in een verklaring van overdracht, is echter de datum waarop de overdracht heeft plaatsgevonden. 54 Het gaat dus om de datum van een gebeurtenis die moet vastgelegd worden, niet om de datum van een feit. In een elektronische archiefomgeving bestaat er slechts één overdrachtsscenario waarbij de gebeurtenis van de overdracht blijkt uit het bestaan van elektronische informatie nl. het geval waarbij de te archiveren archiefstukken op de server van de archiefvormer blijven staan. De versleutelde toestand van de archiefstukken (met de publieke sleutel van de archivaris), wijst er op dat de stukken een gearchiveerde status hebben. Bijgevolg kan voor dit scenario de datum van de overdracht via de techniek van ‘time-stamping’ worden vastgelegd. De archivaris stuurt de hashing-code van de versleutelde archiefstukken naar de TAS, die de time-stamp berekent voor deze elektronische informatie. Deze time-stamp wordt teruggezonden naar de archivaris en toegevoegd aan de elektronische verklaring van overdracht, die dan elektronisch wordt ondertekend. De ‘time-stamp’ bewijst dat de versleutelde en dus ontoegankelijke archiefstukken bestonden op het tijdstip die zit vervat in de ‘time-stamp’, en bijgevolg dat de archiefstukken op dat tijdstip overgedragen waren. Time-stamping kan niet gebruikt worden om de datum van de overdracht in de overeenkomst vast te leggen, wanneer de overdracht gebeurt door het overleggen van gegevensdragers of via een telecommunicatienetwerk. In deze gevallen kan de overdracht immers niet afgeleid worden uit een geheel van elektronische gegevens. De datum van de overdracht moet dan in de overeenkomst zelf worden opgenomen door de partijen bij de overdracht.
Dit is een elektronische verklaring van overdracht
Dit zijn de versleutelde archiefstukken op de server TimeStamp
5687539073
GK%n6d5 0/^^q93H
hashingcode B.1.2.3 Generatie van het te archiveren informatiepakket
54
COPPENS, H., o.c., 193: “Het ondergetekende dienst- of instellingshoofd verklaart op een bepaalde datum de in de specificatie opgenomen bescheiden te hebben overgedragen aan de archiefbeheerder, die deze in ontvangst heeft genomen.” De datum slaat niet op de verklaring, maar op de overdracht.
48
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Vervolgens moet de archivaris op basis van het overgedragen informatiepakket het te archiveren informatiepakket samenstellen. De kans is zeer klein dat het overgedragen informatiepakket zonder meer kan gearchiveerd worden. Dit type informatiepakket heeft immers niet alle kwaliteiten die nodig zijn voor de bewaring op lange termijn van het inhoudelijke informatie-object dat het bevat. Dit mag blijken uit de volgende situaties die zich kunnen voordoen. Het is dan aan de archivaris om dit informatiepakket zodanig te transformeren dat het deze kwaliteiten wel bezit. Vooreerst is het erg waarschijnlijk dat de archivaris de overgedragen informatiepakketten moet opsplitsen of moet samenvoegen alvorens hij tot archivering kan overgaan. Het is bijvoorbeeld mogelijk dat een overgedragen informatiepakket moet opgesplitst worden in twee delen om een onderscheid te maken tussen de informatie die openbaar is en de informatie die gesloten moet blijven. Anderzijds is het ook mogelijk dat de archivaris verschillende overgedragen informatiepakketten samenvoegt omdat bijv. de voorstellingsinformatie steeds dezelfde is. Na een samenvoeging of een splitsing zal eventueel ook de pakketinformatie en pakketbeschrijving moeten aangepast worden. Verder spreekt het natuurlijk voor zich dat de archivaris sowieso bepaalde informatie zal moeten toevoegen, omdat de archiefvormer er niet over beschikt. De authenticiteits- en integriteitsgaranderende informatie is hiervan het meest typerende voorbeeld. Het is de archivaris die de digitale handtekening moet toevoegen aan de te archiveren informatie, die wordt berekend op basis van het inhoudelijke informatieobject. Het is immers deze informatie waarop de bewaring in de eerste plaats gericht is en die moet beveiligd worden. Het is essentieel dat enkel de archivaris deze informatie kan toevoegen. Eerst berekent de archivaris de hashing-code voor het inhoudelijke informatieobject. Deze versleutelt hij met zijn eigen private sleutel en bekomt op die manier een digitale handtekening. Deze digitale handtekening slaat hij samen met het inhoudelijke informatieobject op in het archiefbeheerssysteem. De versleuteling van de hashing-code is nodig, opdat enkel de archivaris toegang zou hebben tot deze hashing-code, en er niemand een valse hashing-code in de plaats zou kunnen zetten. 55 Ook welke semantische informatie er precies moet toegevoegd worden, zal de archivaris vaak zelf moeten inschatten, omdat de archiefvormer hiervoor helemaal niet gevoelig is. Denk aan de hierboven genoemde voorbeelden van de documenten in verschillende talen of de gebruikte codes. Er moeten in ieder geval duidelijke afspraken gemaakt worden over de aard van de informatie die de archivaris verwacht dat de archiefvormer mee overdraagt en het formaat waarin deze informatie moet staan. Maar het ligt in de lijn van de verwachting dat deze archivistische richtlijnen niet volledig zullen worden nageleefd, zeker niet tijdens de beginfase van digitale archivering van de stukken van een archiefvormer. De verantwoordelijkheid ligt dan opnieuw bij de archivaris. Het is bijvoorbeeld helemaal niet ondenkbaar dat de archiefvormer niet vertrouwd is met formaten die gericht zijn op het aanbrengen van semantische structuur in elektronische informatie en die erg geschikt zijn voor de bewaring van deze informatie op lange termijn, zoals XML. Tenslotte is het ook mogelijk dat de interpretatieve informatie vervat zit in het inhoudelijke informatieobject en dat de archivaris deze informatie zelf moet extraheren uit het overgedragen 55
De versleuteling van de hashing-code is eveneens nodig opdat de klant bij raadpleging van het archiefstuk in een on-line omgeving, zeker kan zijn dat het om een authentieke hashing-code gaat: zie verder.
49
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
informatiepakket. Deze informatie moet echter op een meer gestructureerde manier opgeslagen worden, omdat deze gegevens een belangrijke bron zijn om de archiefstukken toegankelijk te maken. Het is aan te bevelen dat de afspraken die gemaakt worden tussen de archiefvormer en de archiefinstelling erop gericht zijn om het overgedragen informatiepakket zoveel mogelijk te laten aansluiten bij het te archiveren informatiepakket dat eruit moet voortvloeien. Iedere toevoeging of wijziging die de archivaris aanbrengt bij de transformatie van overgedragen naar te archiveren informatiepakket moet gedocumenteerd worden in de corresponderende metadata ( voorstellingsinformatie bij wijziging van formaat, toevoegen van de authenticiteitsgaranderende informatie…) B.1.2.4 Generatie van pakketbeschrijvingsinformatie Nog voor de eigenlijke archivering, is het nodig dat de archivaris de pakketbeschrijvingsinformatie samenstelt. Deze informatie omvat alle gegevens die nodig zijn om de klant toe te laten om gearchiveerde informatie die voor hem mogelijk van nut is, te vinden, te analyseren en op te vragen. Het is de taak van de archivaris om deze elementen te identificeren en te extraheren uit het te archiveren informatiepakket of eventueel uit andere bronnen. Er zal hierbij veel aandacht uitgaan naar de openbaarheid van de archiefstukken. De pakketbeschrijvingsinformatie moet ook de unieke coördinaten bevatten van het te archiveren informatiepakket in het archiefbeheerssysteem. Deze informatie moet geïdentificeerd en afgezonderd worden opdat zij kan opgenomen worden in de tools die toegang verlenen tot de archiefstukken.
B. 2
Opslag
B.2.1
Archivering voor permanente bewaring
Als duidelijk is geworden welke informatie er precies allemaal moet gearchiveerd worden, is het te archiveren informatiepakket klaar om definitief ondergebracht te worden in het archiefbeheerssysteem. Hier moet de archivaris beslissen voor welke wijze van opslag er best gekozen wordt voor het betreffende te archiveren informatiepakket. Er zijn twee opties: •
Ofwel wordt het informatiepakket in een on-line netwerkomgeving bewaard, wat raadpleging van overal ter wereld op ieder moment mogelijk maakt. Op die manier kunnen er ook gemakkelijk verbanden worden gelegd tussen verschillende informatiepakketten. De informatie staat dan op de harde schijf van een PC of op de daarvoor voorbehouden serverruimte.
•
Ofwel is de drager waarop het informatiepakket bewaard wordt, niet on-line toegankelijk. Het gaat dan bijv. om CD-roms of diskettes die in een archiefkast bewaard worden. Het nadeel van deze laatste werkwijze is dat de raadpleging van de stukken steeds ter plaatse moet gebeuren. Op termijn is het de bedoeling dat alle stukken in een netwerkomgeving gearchiveerd worden. Het
50
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
beleid van de archiefinstelling op dit vlak en een tijdsschema waarbinnen de evolutie naar een netwerkomgeving dient plaats te vinden, moet worden vastgelegd in het archiefbeleid. De keuze voor de wijze van archivering is niet noodzakelijk afhankelijk van de wijze van overdracht. Worden er door de archiefvormer digitale gegevensdragers overgedragen ter archivering, dan kan de archivaris alsnog beslissen om het informatiepakket naar een netwerkomgeving over te zetten wanneer dit meer verantwoord is voor bijv. de raadpleging. Er moet in ieder geval voor opgelet worden dat bij iedere transfer binnen het archiefbeheerssysteem de authenticiteit gewaarborgd blijft. Dit kan problemen opleveren wanneer de digitale handtekening berekend werd op het te archiveren informatiepakket, maar wanneer dit pakket voor de archivering naar een andere omgeving getransporteerd wordt, waardoor de bitreeks van de gehandtekende informatie wijzigt. De waarde van de digitale handtekening gaat dan volledig verloren. De overdracht en de wijze van archivering worden in ieder geval best zo veel mogelijk op elkaar afgestemd. Bij opslag in een digitaal archief krijgt het risico voor vermenging een totaal andere betekenis. In de papieren wereld betekent dit dat archiefstukken fysisch terecht komen in archiefbestanden waar ze niet thuis horen. Er is het principe van eenheid van archiefbestand ingegeven door het bestemmingsbeginsel: ieder archiefstuk maakt deel uit van het archiefbestand van een organisatie waarvoor het naar zijn aard bestemd is en indien het is opgemaakt of ontvangen als onderdeel van het werkproces van de organisatie. In een digitale omgeving betekent dit dat een archiefbestand van een organisatie of van een persoon als een afzonderlijke entiteit moet terug te vinden zijn, maar de opslag zelf kan gebeuren op hetzelfde medium als een ander archiefbestand. Het is de software van het archiefbeheerssysteem die bepaalt in welke volgorde de op te slagen informatie op de drager zal staan. Deze problematiek heeft te maken met de kwestie van de toegang tot de archiefstukken.
B.2.2
Migratie / Emulatie
Wanneer de informatie definitief in het archief is opgeslagen, zal de archivaris stappen moeten ondernemen om de informatie leesbaar te houden op lange termijn. De archivaris mag echter niet wachten om maatregelen te nemen tot het moment waarop de impact van de veranderende technologie op de middelen die de leesbaarheid op korte termijn garanderen, voelbaar wordt. Van zodra het informaticapakket gearchiveerd is, dient de archiefinstelling een studie te voeren over de te nemen maatregelen en het tijdstip waarop deze best genomen worden, rekening houdend met de te voorspellen technologische evoluties, met de aard van de gearchiveerde informatie, afgewogen aan de hand van de inventaris van de digitale informatie bij de archiefvormer aanwezig, en met de historiek van de reeds uitgevoerde bewerkingen, hetzij door de archiefvormer, hetzij door de archivaris. Een bijzonder aandachtspunt is de vraag of de digitale handtekening een migratie / emulatie al dan niet overleeft. In het OAIS-model wordt er gekozen voor een migratie -strategie, zonder echt te verantwoorden waarom. De typologie van de digitale overheidsdocumenten voor de Stad Antwerpen heeft echter
51
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
uitgewezen dat er niet één beste oplossing is voor alle gevallen. 56 Beiden zullen hun diensten bewijzen, en soms zullen ze misschien samen moeten toegepast worden voor dezelfde informatie. De beschrijving in het OAIS-model van de soorten migratie die kunnen voorkomen, is wel interessant met het oog op het beantwoorden van de vraag in welke gevallen een digitale handtekening de migratie operatie niet overleeft. Migraties kunnen ingedeeld worden naargelang de risico’s op informatieverlies die de bewerking heeft voor het informatiepakket. Vooreerst is er wat OAIS ‘Refreshment’ noemt. Deze vorm van migratie komt erop neer dat er geen enkele bit wijzigt aan het gearchiveerde informatie pakket. Een voorbeeld kan zijn dat het gearchiveerde informatiepakket op een punt is gekomen dat het aantal ‘bit errors’ onverantwoord is geworden en dat er dus kopie moet gemaakt worden op een andere drager. Wanneer de equivalentie van deze kopie komt vast te staan (waarvoor de hashingtechniek kan gebruikt worden), kan zij de oorspronkelijk gearchiveerde versie vervangen. De digitale handtekening kan dan zonder meer gekopieerd worden, vermits de bitreeks van het inhoudelijke informatieobject hetzelfde is gebleven. ‘Replication’ is een variant van ‘Refreshments’. Bij ‘Replication’ is er de complicatie dat er wijzigingen moeten aangebracht worden aan de informatie die nodig is om het informatiepakket te kunnen terugvinden in het archiefbeheerssysteem. Dit is bijv. het geval wanneer de gemaakte kopie op een zelfde soort drager wordt geplaatst, maar die bijv. meer opslagcapaciteit heeft dan de oude drager. ‘Repackaging’ betekent dat de migratie leidt tot wijzigingen in de pakketinformatie. Het typevoorbeeld is hier het overzetten naar een ander soort drager, die een andere bestandsstructuur heeft. De verschillende onderdelen van het informatiepakket die op de nieuwe drager staan, zullen dan op een andere manier moeten afgebakend en geïdentificeerd moeten worden als samenhorend. De bitreeks van het inhoudelijke informatieobject wijzigt echter niet, zodat de digitale handtekening zonder problemen kan behouden blijven. ‘Transformation’ tenslotte houdt in dat de bitreeks van het inhoudelijke informatieobject gewijzigd wordt, ‘getransformeerd’ wordt. Deze vorm van migratie zal zich voordoen bij de omzetting naar een ander formaat. Wanneer bijvoorbeeld ASCII-code (8 bits) wordt omgezet in Unicode (16 bits), dan wordt in de nieuwe versie één character voorgesteld door meer bits dan in de oorspronkelijke versie. De corresponderende voorstellingsinformatie moet dan ook mee aangepast worden. De oorspronkelijke digitale handtekening gaat echter verloren en er moet een nieuwe ‘verzegeling’ plaatsvinden na migratie. Het behoud van authenticiteit en integriteit van het nieuwe informatiepakket moet door de archivaris gegarandeerd worden, zodat de klanten erop kunnen vertrouwen dat het inhoudelijk nog steeds om dezelfde informatie gaat, ook al is er van de oorspronkelijke bitreeks totaal geen sprake meer. Ieder migratieproces, hoe klein de risico’s op informatieverlies ook zijn, zal steeds uitvoerig moeten gedocumenteerd worden in de interpretatieve informatie.
56
BOUDREZ, F., Typologie van digitale overheidsdocumenten, Antwerpen, Stadsarchief, 2001, 11.
52
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
B.2.3
Maken van veiligheidskopieën van gearchiveerd informatiepakket
Telkens wanneer het informatiepakket opnieuw wordt vastgelegd voor permanente bewaring (bijv. na een migratie), dient er een veiligheidskopie gemaakt te worden. Dit sluit aan bij wat reeds eerder werd gezegd in het rapport ‘Digitale archivering: juridische stand van zaken. Deel 1’ omtrent de vormvereiste die oplegt dat er meerdere exemplaren moeten bewaard worden. Ondanks het feit dat een digitale drager een bedreiging kan vormen voor de informatie, omdat een digitale drager veel van de kwaliteiten moet prijsgeven die aan papier kunnen toegeschreven worden, waardoor vooral de te bewaren informatie zelf moet beschermd worden, eerder dan de drager 57 , is er bij elektronische informatie hoe dan ook sprake van een drager die de informatie vasthoudt. De enige oplossing om deze drager te beschermen tegen externe invloeden, bestaat erin om de informatie in meerdere exemplaren te bewaren. 58 Teneinde in geval van vernietiging, beschadiging of onbruikbaarheid van de drager volledig te kunnen terugvallen op de veiligheidskopie, moet niet alleen van het inhoudelijke informatieobject een kopie worden gemaakt, maar van het hele informatiepakket zoals het werd klaargemaakt voor archivering in het archiefbeheerssysteem. Het maken van deze kopie mag in geen geval uitgesteld worden. Beide exemplaren moeten idealiter tegelijkertijd gearchiveerd worden. Bovendien moet erover gewaakt worden dat de veiligheidskopie eveneens het origineel bevat. Het woord ‘veiligheidskopie’ is hier dus eigenlijk niet op zijn plaats. Beter is te spreken over ‘het tweede exemplaar’. Het reserve-exemplaar moet in ieder geval op een fysiek gescheiden medium geplaatst worden, die ruimtelijk gezien ook gescheiden zijn. Dit kan gebeuren door het informatiepakket op een verplaatsbare drager te zetten, die op een andere plaats bewaard wordt. De informatie kan ook over een telecommunicatienetwerk gestuurd worden, waardoor er elders een tweede exemplaar ontstaat. B.2.4
Ontoegankelijk maken van de gearchiveerde informatiepakketten
De archivaris moet zeker kunnen zijn dat er niemand op ongeoorloofde wijze toegang kan verkrijgen tot de gearchiveerde informatiepakketten om fraude te vermijden (ontoegankelijk maken voor derden). Ten aanzien van papieren archiefstukken bestaan er een aantal methoden om dit te vermijden. De toegang tot het archiefdepot moet formeel worden verboden en verhinderd (bijv. door bordjes ‘verboden toegang’ en door de mogelijkheid het archiefdepot af te sluiten zodanig dat enkel de personen die over de sleutel beschikken, er toegang toe hebben). Bovendien voorzien archiefinstellingen in een registratieprocedure voor alle leeszaalbezoekers. Toegang tot de archiefstukken moet met andere woorden steeds gebeuren via de omweg van een archiefmedewerker, die de stukken uit hun beschermde archiefomgeving weghaalt en de raadpleging vervolgens op een gecontroleerde manier laat verlopen.
57
58
De drager alleen volstaat niet meer om de integriteit en de duurzame beschikbaarheid van de inhoud te garanderen. VAN DEN EYNDE, S., Digitale archivering: een juridische stand van zaken. Deel 1, Leuven, ICRI, 2001, 58.
53
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Voor off-line toegankelijke digitale dragers kan deze procedure behouden blijven: zij worden in een gesloten archiefkast bewaard, waarvan alleen de archivaris (en zijn archiefmedewerkers) de sleutel hebben. Een netwerkomgeving daarentegen heeft precies de eigenschap dat dit door verschillende personen kan betreden worden. Het netwerk moet natuurlijk zo goed mogelijk beveiligd worden, maar men kan en zal steeds proberen in te breken in het archiefbeheerssysteem. Daarom moet de gearchiveerde informatie zelf ontoegankelijk gemaakt worden. Public Key Cryptography kan hiervoor aangewend worden door het inhoudelijk informatieobject te versleutelen met de publieke sleutel van de archivaris; enkel diegene die over de corresponderende private sleutel beschikt (zijnde de archivaris zelf) heeft toegang tot de inhoud. In principe is deze versleuteling reeds gebeurd wanneer de overdracht niet fysisch plaatsvond en de stukken op de server zijn blijven staan, nl. ter gelegenheid van het toekennen van de status ‘gearchiveerd’. B. 3
Toeg ang en Data Manag em ent
B.3.1
Onderhoud Data Management Databank
In een digitaal archief wordt de toegang tot de opgeslagen informatie geregeld vanuit de ‘Data Management Databank’. Deze databank bevat voor ieder opgeslagen informatiepakket de pakketbeschrijvingsinformatie op een gestructureerde manier, waarin de tools die het archiefbeheerssysteem toegankelijk maken voor de klanten de nodige informatie kunnen vinden om het gezochte informatiepakket terug te vinden. Van zodra de archivering een feit is, moet deze informatie hierin terug te vinden zijn. Deze databank moet up-to-date gehouden worden om een efficiënte raadpleging mogelijk te maken. De pakketbeschrijving van informatiepakketten die uit het archief verwijderd worden, wegens beperkte bewaartermijn, moet eveneens verwijderd worden. Het feit dat een informatiepakket openbaar wordt, na lange tijd gesloten te zijn geweest, moet weerspiegeld worden in de pakketbeschrijving, zodat de mechanismen die het stuk effectief ter beschikking stellen, ‘weten’ dat het informatiepakket openbaar is. Na een overplaatsing naar een andere drager, is het van belang te weten of de unieke coördinaten van het informatiepakket binnen het archiefbeheerssysteem veranderd zijn enz. B.3.2
Ontvangen van een vraag tot raadpleging
De archiefinstelling kan op verschillende wijzen geraadpleegd worden door klanten: De archiefinstelling kan een on-line dienst voorzien in de vorm van een eigen website als user interface, aan de hand waarvan de klant altijd en overal de archiefdienst kan bevragen. De klant kan een e-mail sturen naar de archiefdienst om het gezochte stuk aan te vragen. Het is ook mogelijk dat de klant zich ter plaatse persoonlijk aanbiedt om een stuk te raadplegen (walk in facility). Hoewel het Internetgebruik in Vlaanderen de laatste maanden spectaculair gestegen is,
54
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
blijft Internettoegang voor een relatief groot deel van de bevolking problematisch. 59 Het zich persoonlijk aanbieden zal dus voor heel wat mensen voorlopig de enige manier zijn om een vraag tot de archivaris te richten. B.3.3
Samenstellen van toegankelijk gemaakt informatiepakket
In het OAIS-model is de informatie die aan de klant wordt overgelegd slechts een ‘kopie’ van het gearchiveerde informatiepakket. In de digitale wereld mag de archivaris nooit de gearchiveerde informatie als zodanig in handen geven van de klant zonder dat hij zelf ook over die informatie blijft beschikken. Naast het gearchiveerde informatiepakket en het tweede exemplaar als veiligheidskopie, moet de archivaris met andere woorden nog een kopie creëren naar aanleiding van de raadpleging. Ook in de papieren wereld wordt de vrije raadpleging van de originele stukken beperkt en wordt er steeds een vervangingskopie ter inzage gegeven als die voorhanden is. Het voordeel van de digitale wereld bestaat erin dat deze ‘kopieën’ zeer snel kunnen gemaakt worden en dat ze eveneens als originelen kunnen bestempeld worden, wat voor de klanten een enorme meerwaarde betekent. In tegenstelling tot het gearchiveerde informatiepakket, dat speciaal is ontworpen voor bewaring op lange termijn, is het toegankelijk gemaakte informatiepakket zodanig samengesteld dat het beantwoordt aan de eisen van de klant en aan de openbaarheidsvoorwaarden. Stel dat de klant slechts één document wil raadplegen dat deel uitmaakt van een zeer groot informatiepakket bijv. de registers van de burgerlijke stand van een tienjarige periode. De archivaris zal de gevraagde informatie dan moeten afzonderen en overmaken aan de klant. De raadplegingskopie is dus niet noodzakelijk een exacte kopie van het gearchiveerde informatiepakket. De informatie die ter beschikking wordt gesteld moet wel het origineel zijn. Het is bijvoorbeeld ook mogelijk dat de gevraagde informatie naar aanleiding van de privacywetgeving moet geanonimiseerd worden.
B.3.4
Ter beschikking stellen van een toegankelijk gemaakt informatiepakket
B.3.4.1 On-line of Off-line De archivaris kan op verschillende manieren het toegankelijk gemaakte informatiepakket aanbieden aan de klant. Dit zal evenwel afhankelijk zijn van de toegang van de klant tot de nieuwe telecommunicatiemiddelen en eveneens van de graad van automatisering van de archiefinstelling. Het is bijv. mogelijk dat de archiefinstelling wel de mogelijkheid voorziet om via e-mail vragen te stellen over de aanwezigheid van bepaalde stukken, of zoekfuncties on-line ter beschikking stelt, maar dat de raadpleging van de stukken zelf online nog niet mogelijk is. In een eerste fase zullen een aantal archiefstukken nog niet on-line raadpleegbaar zijn, omdat ze vaak nog op digitale dragers bewaard worden die niet toegankelijk zijn via telecommunicatiemiddelen, zoals het Internet. De archiefinstelling kan de klant dan toch een aantal diensten on-line aanbieden, 59
Hoge Raad voor de werkgelegenheid. http://meta.fgov.be/pdf/pd/nldf7.pdf
Synthese
en
aanbevelingen,
februari
2001.
55
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
zoals archievenoverzichten en inventarissen aan de hand waarvan de klant zijn bezoek aan de leeszaal kan voorbereiden. Deze klassieke toegangsmiddelen zijn sterk verbonden met de fysische plaatsing van het archie fstuk in het archief, wat nodig blijft voor deze wijze van opslag. De raadpleging dient echter ter plaatse te gebeuren. In de leeszaal moet de nodige apparatuur worden voorzien om de dragers te kunnen lezen. Bij digitale archivering is het uiteindelijk te bedoeling om alle archiefstukken in een netwerkomgeving te bewaren. On-line raadpleging wordt dan wel mogelijk, hetzij onmiddellijk voor privacyongevoelige stukken die sowieso voor iedereen toegankelijk zijn, hetzij doordat de archivaris het gevraagde stuk via e-mail aan de klant bezorgt. Het on-line opzoeken van de stukken krijgt in deze context eveneens een andere betekenis, doordat er andere toegangen kunnen gecreëerd en gebruikt worden, die niet meer aan de fysische plaatsing is gebonden. Deze toegangen zijn gebaseerd op de pakketbeschrijvingsinformatie. B.3.4.2 Door de archiefvormer of door derden Bij de raadpleging kan een onderscheid gemaakt worden tussen raadpleging door de eigen medewerkers van de archiefvormende organisatie (bijv. in een gemeente door de gemeenteambtenaren) of door derden/klanten. Aan de archiefvormer wordt in de papieren wereld vaak uitlening toegestaan van de originele stukken. Uiteindelijk is het immers de archiefvormer die eigenaar blijft van de stukken. 60 De gemeentewet bepaalt evenwel ten aanzien van gemeentearchieven dat het college van burgemeester en schepenen ‘belet dat enig stuk uit de bewaarplaats weggenomen wordt’. Toch moet ‘bewaarplaats’ in dit voorschrift geïnterpreteerd worden als ‘het geheel van de dienstgebouwen’, zodat een efficiënt werkproces mogelijk blijft.61 De archiefvormer moet steeds over zijn eigen stukken kunnen blijven beschikken. Uitlening van de papieren archiefstukken is niet toegelaten ten aanzien van derden. Raadpleging dient door hen steeds onder toezicht te gebeuren in de leeszaal. De originelen mogen nooit direct toegankelijk worden opgesteld, de leeszaal mag nooit betreden worden met mantels en boekentassen en er wordt slechts één archiefstuk tegelijk in lezing gegeven, dat eerst moet worden teruggegeven aan de archiefmedewerker alvorens een nieuw stuk mag , waar er slechts één origineel van bestaat (in sommige gevallen twee), dat ten allen tijde in de archiefinstelling moet blijven. Bekijken we nu deze twee scenario’s naargelang de wijze van archiveren. Het toegankelijk gemaakte informatiepakket is zoals gezegd slechts een bewerkte kopie van het gearchiveerde informatiepakket, maar dat tevens de gevraagde originelen bevat.
60
Tenzij in de uitzonderlijke gevallen van schenking of koop van archiefstukken door de archiefinstelling. Archiefstukken van overheidsorganen maken deel uit van het openbaar domein en zijn dus in principe onvervreemdbaar. Hun archiefbestand kan enkel aan een archiefinstelling worden overgedragen via bewaargeving.
61
COPPENS, H., o.c., 350.
56
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Uitlening in een traditionele archiefcontext wil zeggen dat het enige origineel aan de klant ter beschikking wordt gesteld, waarna het terug moet keren naar zijn oorspronkelijke plaats in het archief. In een digitale omgeving is er echter niet noodzakelijk sprake van slechts één origineel. Het voordeel van digitale informatie is dat men een oneindig aantal originelen kan creëren. 62 Het toegankelijk gemaakte informatiepakket is slechts een bewerkte kopie van het gearchiveerde informatiepakket en de inhoud is tevens een origineel. In een digitaal archief kan en mag er geen sprake van zijn dat de archivaris ooit het enige origineel uit handen geeft. Uitlening in de strikte betekenis van het woord bestaat dus eigenlijk niet meer in een digitale omgeving. De archiefinstelling blijft ten allen tijde over de originele informatie beschikken. De medewerkers van archiefvormende organisaties kunnen dan op verschillende wijzen in het bezit worden gesteld van de gevraagde informatie.63 Wanneer de archiefstukken op off-line toegankelijke dragers bewaard worden, kan de archiefinstelling aparte digitale dragers voorzien die speciaal voor de medewerkers ter beschikking worden gehouden. Na de uitleenperiode moeten ze terugkeren naar de archiefinstelling. Voor stukken die niet frequent geraadpleegd worden, kan de archiefinstelling beslissen om de kopie pas te maken naar aanleiding van een concrete vraag. Is de gevraagde informatie gearchiveerd in een netwerkomgeving, dan wordt het begrip ‘uitlening’ nog problematischer. Niet alleen blijft de archiefinstelling gedurende de uitleenperiode in het bezit van de informatie, maar de medewerker beschikt meteen ook definitief over een eigen exemplaar wanneer de gevraagde informatie over het netwerk wordt gezonden via e-mail. Dit eigen exemplaar blijft aanwezig bij de medewerker, ook al zendt deze de gevraagde informatie na een bepaalde periode terug naar de archiefinstelling. Dit feit is op zich geen probleem omdat de archiefvormende organisatie meestal toch de eigenaar is gebleven van de archiefstukken, zolang ze maar tegelijk ook op een afdoende wijze gearchiveerd blijven door de archiefinstelling. Worden de stukken geraadpleegd door derden, dan geldt de regel dat de derde niet in het bezit mag gesteld worden van de stukken, niet alleen omdat het origineel in de archiefinstelling moet blijven in de best mogelijke archiefomstandigheden (dit probleem is opgelost in de digitale wereld door de mogelijkheid om meerdere originelen te creëren), maar ook omdat de derde vaak geen enkel recht heeft om de stukken bij zich te hebben. De raadpleging van het bevolkingsregister bijvoorbeeld, is onderworpen aan zeer strikte modaliteiten. 64 De terbeschikkingstelling van het gehele bevolkingsregister is uitgesloten, aangezien de wet verbiedt dat er personenlijsten uit de registers aan derden worden verstrekt.65
62 63
64
65
VAN DEN EYNDE, S., Digitale archivering: een juridische stand van zaken. Deel 1, 58 en 65. In veel gevallen zal de archiefvormende organisatie zelf een exemplaar behouden van wat er aan het archief werd overgedragen. Toch kan een beroep op de archiefinstelling nodig zijn omdat de leesbaarheid op lange termijn van de gearchiveerde stukken gegarandeerd is. Zie K.B. 16 juli 1992 betreffende het verkrijgen van informatie uit de bevolkingsregisters en uit het vreemdelingenregister (B.S. 15 augustus 1992). Art. 6 K.B. 16 juli 1992.
57
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Wanneer de archiefstukken op off-line toegankelijke dragers bewaard worden, dan kan de raadpleging van de kopieën hiervan enkel ter plaatse gebeuren via de in de leeszaal voorziene apparatuur. Het voordeel van de digitale wereld is dat de raadpleging zelf niet noodzakelijk meer onder toezicht van een archiefmedewerker dient te gebeuren. Er wordt immers slechts een kopie ter beschikking gesteld, die gewoon kan vervangen worden als er fraude wordt vastgesteld. De inspanning die vanwege het archief moet gebeuren om te garanderen dat de originele stukken ook nadien nog kunnen ter beschikking worden gesteld, verlegt zich dus van de periode tijdens de raadpleging, naar een moment ergens na de raadpleging (controle van de digitale handtekening), wat een aanzienlijke tijdswinst kan opleveren. Het is wel zo dat ieder geraadpleegd stuk afzonderlijk moet gecontroleerd worden. Hebben we te maken met een on-line raadpleging van de netwerkomgeving waarin de archiefstukken zich bevinden, dan krijgt de klant (zoals de medewerker van de archiefvormende organisatie: zie hierboven) definitief een eigen exemplaar ter beschikking van de gevraagde informatie, wanneer deze zou worden doorgezonden via e-mail. Deze manier van ter beschikking stellen van de gevraagde informatie moet dus zoveel mogelijk vermeden worden. Ten aanzien van derden moet er eerder gedacht worden aan een raadpleging on-line via de website van de archiefinstelling, waarbij de informatie op geen enkele wijze verplaatst wordt of kan gekopieerd worden. Maar dit is natuurlijk helemaal niet evident voor stukken die een individuele behandeling vragen, bijvoorbeeld omdat de openbaarheid naar iedereen toe niet vaststaat.66 E-mail is het geëigende middel om te beantwoorden aan een concreet verzoek tot raadpleging, maar hiermee verwerft de derde wel definitief een kopie.
B.3.5
Mogelijk maken van validering van de raadplegingsoperatie
In een netwerkomgeving, waarbij er geen contact is tussen de klant en de archivaris, is het van belang dat de raadplegingsoperatie gevalideerd wordt, zowel door de archivaris als door de klant. Vooreerst moet de archivaris (of het orgaan dat beslist over de openbaarmaking) kunnen nagaan wie de persoon is die zich aanbiedt. In een aantal gevallen bepaalt de wet immers dat enkel bepaalde personen toegang krijgen tot bepaalde stukken. Nemen we het voorbeeld van het kiezersregister van 8 oktober 2000 van de stad Antwerpen, dat gearchiveerd werd in een stadsarchief.67 Het gaat om een gearchiveerd gemeentelijk bestuursdocument, waarop de wet van 12 november 1997 betreffende de openbaarheid van bestuur in de provincies en de gemeenten van toepassing is. Deze wet bepaalt dat de inzage van een bestuursdocument op schriftelijke aanvraag dient te gebeuren. Via de website van het stadsarchief Antwerpen kan men het formulier ‘Aanvraag voor inzage van bestuursdocumenten’ downloaden, afprinten + ondertekenen en versturen naar het college of de betrokken dienst.68
66
BOUDREZ, F. en VAN DEN EYNDE, S., De digitale archivering van het kiezersregister, 20: Het verlenen van toegang [tot het kiezersregister] blijft echter steeds een afweging van de bevoegde overheid tot wie de archivaris zich in dat geval moet wenden.
67
En nemen we aan dat dit kiezersregister op het netwerk gearchiveerd werd, wat op dit moment echter nog niet het geval is. Met behulp van zijn digitale handtekening kan de aanvrager het aanvraagformulier elektronisch ondertekenen.
68
58
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
Het besluit van 25 februari 1999 van het college van burgemeester en schepenen bepaalt dat het bevolkingsregister, en afgeleide documenten zoals het kiezersregister, pas openbaar worden na honderd jaar, ingevolge de strikte regeling inzake de toegang tot het bevolkingsregister, die is ingegeven door privacyoverwegingen. Dit betekent niet dat het kiezersregister gedurende honderd jaar nooit geraadpleegd mag worden. Overeenkomstig het advies nr. 11/97 van de Commissie voor de bescherming van de persoonlijke levenssfeer betreffende de raadpleging van de bevolkingsregisters door genealogen, mag er ook voordien toegang worden verleend om wetenschappelijk onderzoek te verrichten. 69 Voor de raadpleging van een aantal documenten zal het dus van belang zijn dat de archivaris zeker weet wie zich via het Internet aanbiedt. Iemand met commerciële belangen kan zich bijv. voordoen als genealoog om zo toch een personenlijst te kunnen bemachtigen met het oog op direct marketing. Met behulp van zijn digitale handtekening kan een klant van de archiefinstelling zich identificeren in een netwerkomgeving. Vervolgens moet de klant die een archiefstuk op afstand raadpleegt, er zeker van kunnen zijn dat hij te maken heeft met een authentiek archiefstuk waarvan de inhoud na jaren in de archiefinstelling nog steeds integer is. De digitale handtekening die door de archivaris gecreëerd werd naar aanleiding van de archivering, moet daarom ook aan de klant worden ter beschikking gesteld naar aanleiding van de raadpleging. Zo kan de klant nagaan of hij te maken heeft met een authentieke hashing-code, berekend door de archivaris, en bijgevolg met een integer en authentiek archiefstuk. Deze digitale handtekening moet de klant op een veilige manier kunnen bereiken. Als de publieke sleutel niet past, betekent dit niet noodzakelijk dat het stuk niet authentiek of niet integer is. Het is ook mogelijk dat er fraude werd gepleegd tijdens de transfer. Daarom moet de informatie tijdens de transfer ontoegankelijk gemaakt worden door ze te versleutelen met de publieke sleutel van de klant.
B. 4
Beleid
De laatste fase doorkruist alle vorige fasen, in die zin dat er ten aanzien van elk van de fasen door de archiefinstelling een duidelijk digitaal archiefbeleid moet gevoerd worden, afhankelijk van zijn concrete noden. In plaats van een louter uitvoerende taak zal de archivaris meer en meer een beleidstaak moeten op zich nemen. Het gaat hier om het uittekenen van procedures, policies. Dit houdt in dat er keuzes zullen moeten gemaakt worden, waarbij de ene keuze onmiskenbaar een andere keuze beïnvloedt. Aansluitend bij de eerste fase, kan er gezegd worden dat het digitale archiefbeleid binnen de archiefinstelling niet alleen door de archivaris moet uitgetekend worden, maar dit, veel meer nog dan ten aanzien van papieren documenten, moet gebeuren in samenspraak met de archiefvormer, en meer bepaald met de informatieverantwoordelijken binnen de organisatie. Het archiefbeleid moet er immers 69
Zie BOUDREZ, F. en VAN DEN EYNDE, S., De digitale archivering van het kiezersregister, Antwerpen – Leuven, Stadsarchief Antwerpen – ICRI, 2001, 18 e.v.
59
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
toe bijdragen dat er optimaal kan voorzien worden in de informatiebehoefte van de bedrijfsprocessen, en, misschien nog belangrijker, dat de bedrijfsprocessen zodanig worden georganiseerd dat de archivering als het ware reeds kan beginnen bij de aanmaak van de informatie. Een goede wisselwerking tussen deze twee functies binnen de organisatie is van groot belang. Zo zal er moeten uitgemaakt worden hoe het overgedragen en het te archiveren informatiepakket het best op elkaar kunnen afgestemd worden, en verder welke informatie er van de archiefvormer verwacht wordt dat hij mee overdraagt. Bovendien moet ook duidelijk afgesproken worden in welke mate de archivaris technische hulp van de archiefvormer kan verwachten bij het archiefbeheer. De archiefinstelling zal ook een beleid moeten uitstippelen ten aanzien van de wijze van opslag, die mede zal beïnvloed worden door de manier waarop de archiefstukken overgedragen worden en de manier waarop de archiefinstelling ze ter beschikking wil stellen. Dit laatste is dan weer afhankelijk van de doelgroep en de mate waarin de leden ervan toegang hebben tot de nieuwe telecommunicatiemiddelen, zoals Internet en e-mail. De evolutie van de doelgroep en de situatie op dit vlak moet de archivaris nauwgezet opvolgen, om zo een idee te krijgen over het tijdstip waarop een volledige omschakeling naar een netwerkomgeving verantwoord wordt. Verder moet er ook gekeken worden naar de evoluties op technisch vlak en moeten de strategieën bepaald worden om deze evoluties het hoofd te bieden.
BESLUIT: DE ROL VAN PKI BIJ DIGITALE ARCHIEVEN PKI kan verschillende functies vervullen. Als besluit sommen we ze op en situeren we waar in het digitale archiveringsproces deze functies hun nut zullen bewijzen.
1. Integriteit: traditioneel wordt er onder deze functie verstaan dat aan de hand van PKI kan nagegaan worden of digitale informatie werd gewijzigd tijdens de tranfer. PKI kan echter ook gebruikt worden om te integriteit te controleren van digitale informatie, die gedurende een bepaalde periode werd opgeslagen. •
•
Validatie van de overdracht: bereiken de stukken de archiefinstelling zoals ze aanwezig waren bij de archiefvormer? q
Netwerk: voor de overgedragen informatie wordt er een digitale handtekening berekend en deze wordt meegestuurd.
q
Drager: er moet een integriteitscheck gebeuren vóór de overdracht wanneer de informatie vóór de overdracht naar een andere drager wordt gekopieerd. Hiervoor kan hashing volstaan. Versleuteling is niet vereist.
Toevoegen van de integriteitsgaranderende informatie : berekenen en mee opslaan van de digitale handtekening die de archivaris berekent op het moment van archivering (zowel voor het
60
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
gearchiveerde exemplaar als voor de veiligheidskopie). Bij latere raadpleging van het stuk blijkt uit de digitale handtekening of de opgeslagen digitale informatie al dan niet gewijzigd werd tijdens de periode van de opslag. 2. Origine : deze functie zorgt ervoor dat de origine van digitale informatie met zekerheid kan achterhaald worden. Maar het is opnieuw niet enkel de origine van elektronische communicatie die met behulp van een digitale handtekening kan komen vast te staan. Ook de bron van een archiefstuk dat reeds jaren geleden werd opgeslagen, kan vastgesteld worden. •
Validatie van de overdracht: wie draagt de stukken over? Dit heeft een invloed op het oordeel van de archivaris op de authenticiteit van de overgedragen stukken. q
Netwerk: De digitale handtekening die voor integriteitsdoeleinden bij de overdracht werd meegestuurd, kan eveneens dienen om de identiteit van de overdrager te achterhalen.
q
Locale server: de server moet zijn digitale handtekening aanbieden, zodat de archivaris kan nagaan of hij de stukken in de juiste netwerkomgeving archiveert.
•
Ondertekening van de elektronische verklaring van overdracht
•
Toevoegen van de authenticiteitsgaranderende informatie: de digitale handtekening die voor integriteitsdoeleinden bij de archivering werd berekend en opgeslagen, kan eveneens dienen om de origine van het stuk (als archiefstuk) naar aanleiding van de raadpleging op afstand vast te stellen. Wanneer de klant bij de raadpleging op afstand er zeker van kan zijn dat de hashing-code destijds door een echte archivaris verzegeld werd (en niet door eender wie) en sindsdien niet meer gewijzigd is, weet hij meteen ook zeker dat het stuk een authentiek archiefstuk is, en dus niet een stuk dat niet het archief als bron heeft.
•
Validering van de raadplegingsoperatie : de archivaris moet de identiteit kunnen nagaan van de persoon die zich aanbiedt op afstand. Deze persoon kan zich kenbaar maken aan de hand van zijn digitale handtekening.
3. Toegangscontrole : PKI bewijst ook zijn nut door de toegang tot digitale informatie, een elektronisch bericht of andere digitale informatie, voor te behouden aan bepaalde personen. •
Onmiddellijk na de archivering moet de archivaris de gearchiveerde stukken in het archiefbeheerssysteem ontoegankelijk maken: versleutelen met de publieke sleutel van de archivaris en in die toestand opslaan in het archief.
•
Validering van de raadplegingsoperatie : De digitale handtekening die omwille van de authenticiteit werd toegevoegd, evenals het gevraagde stuk zelf, moet de klant op veilige wijze bereiken. Als de publieke sleutel niet past, betekent dit niet noodzakelijk dat het stuk niet authentiek is. Het is ook mogelijk dat er fraude werd gepleegd tijdens de transfer. Daarom moet de
61
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
informatie tijdens de transfer ontoegankelijk gemaakt worden door ze te versleutelen met de publieke sleutel van de klant. 4. Non Repudiation: niet-ontkenning betekent dat de maker van digitale informatie niet kan ontkennen dat hij deze informatie heeft verzonden, ontvangen. Voor archivering is enkel de non repudiation of receipt functie van belang. Dit wil zeggen dat de geadresseerde van digitale informatie niet kan ontkennen dat hij deze digitale informatie heeft ontvangen. •
Non Repudiation of Receipt van de archiefstukken door de archivaris: de archivaris moet de digitale handtekening die hij berekent voor de ontvangen archie fstukken samen met deze archiefstukken naar de overdrager sturen.
•
Niet-ontkenning van de datum van de overdracht: berekenen van een time-stamp voor de door de archivaris versleutelde archiefstukken; Niet ontkenning van de datum van overdracht is enkel mogelijk aan de hand van PKI als de archivering gebeurt op de lokale server van de archiefvormer.
Verklaring van overdracht : elektronische handtekening Non repudiation of receipt : DH
Archiefvormer
Archief
Integer en Authentiek archiefstuk ?
Klant
Versleutelde tekst [elektronische handtekening] Digitale handtekening Time-stamp
Versleutelde digitale handtekening + tekst
Identificatie Integriteitscheck
62
DAVID – Wat archiveren en hoe? Op zoek naar de rol van PKI voor digitale archieven
BIBLIOGRAFIE Reference Model for an Open archival Information system (OAIS), Draft Recommendation for space data system standards, Red Book May 1999, Consultative Committee for Space Data Systems, CCSDS 650.0-R-1 Beschikbaar op http://www.ccsds.org/documents/pdf/CCSDS-650.0-R-1.pdf A blueprint for Representation Information in the OAIS model, HOLDSWORTH, D., SERGEANT, D., The Cedars Project, University of Leeds Beschikbaar op: http://gps0.leeds.ac.uk/~ecldh/cedars/nasa2000/nasa2000.html ISO “Reference Model for an Open Archival Information System (OAIS)”, Tutorial Slide-Presentation IEEE/GSFC Mass Storage Symposium, REICH, L., SAWYER, D., March 15, 1999. Beschikbaar op: http://www.loc.gov/rr/mopic/avprot/oais/OAIS/sld001.htm LAVOIE, B., ‘Meeting the challenges of digital preservation: the OAIS reference model’, OCLC Newsletter, No.243, January/February 2000, 26-30. Beschikbaar op: http://www2.oclc.org/oclc/pdf/news243.pdf Nedlib Contribution to the review of OAIS. Applying the OAIS Reference Model to the Deposit System for Electronic Publications (DSEP) Beschikbaar op: http://www.kb.nl/coop/nedlib/results/OAISreviewbyNEDLIB.html LUPOVICI, C., MASANES, J., Metadata for long term preservation, Nedlib, July 2000 Beschikbaar op: http://www.kb.nl/coop/nedlib/results/preservationmetadata.pdf DAY, M., Metadata for digital preservation: an update, december 1999, Ariadne Issue 22 Beschikbaar op http://www.ariadne.ac.uk/issue22/metadata/intro.html
63