Richtlijnen voor Websites rapportage drs. H.A. Hokke, P.J. Horsman MSc
eindrapport, februari 2006
Keizersgracht 630 1017 ER Amsterdam T (020) 524 1166 F (020) 595 1160
[email protected] www.archiefschool.nl
2
INHOUDSOPGAVE 1
Inleiding en leeswijzer
4
2
Terminologie
5
3 3.1 3.2 3.2.1 3.2.2 3.2.3 3.2.4 3.3 3.3.1 3.3.2 3.3.3
Archiveerbare website: object van onderzoek Inleiding Object van onderzoek Structuur en gedrag van een website Doel en functie van een website Context en inhoud Karakterisering website Duurzaam toegankelijk Duurzaamheid Object van archivering Reikwijdte eisen duurzame toegankelijkheid
Kwaliteit van informatie-OBJECTEN Inleiding Kwaliteitmodel Onderzoeksmodel Bronnen Indeling Kwaliteitseisen en attributen Inleiding Kwaliteit van de informatie 4.3.2.1 Integriteit 4.3.2.2 Authenticiteit 4.3.2.3 Betrouwbaarheid 4.3.3 Bruikbaarheid 4.3.3.1 Toegankelijkheid 4.3.3.2 Raadpleegbaarheid 4.3.3.3 Begrijpelijkheid 4.3.4 Beheerbaarheid 4.3.4.1 Adresseerbaarheid 4.3.4.2 Beveiligbaarheid 4.3.4.3 Verwijderbaarheid 4.3.4.4 Onderhoudbaarheid
7 7 7 7 9 10 11 12 12 12 14
4 4.1 4.2 4.2.1 4.2.2 4.2.3 4.3 4.3.1 4.3.2
15 15 15 15 16 17 18 18 18 18 19 21 22 23 23 24 25 25 25 26 27
5 5.1 5.2 5.2.1
Duurzame toegankelijkheid door archivering / opties voor archivering 28 Inleiding 28 Duurzame toegankelijkheid door archivering 28 Websites als unieke informatiebron 28
3
5.2.2 Archiveringssysteem 5.3 Implementatie van archivering 5.3.1 Archiveringfuncties toegepast op websites 5.3.1.1 Besturing 5.3.1.2 Archiveringsfuncties 5.3.2 Bestaande implementatiestrategieën: best practices voor ‘bevriezen’ 5.3.2.1 Het archiveren van de bron 5.3.2.2 Het archiveren van het eindproduct 5.3.2.3 Het archiveren van de interactie 5.3.2.4 Dateren van de pagina’s 5.3.2.5 Uitvoering 5.4 Conclusies ten behoeve van het raamwerk
30 32 32 32 33 35 36 37 38 38 39 40
6 6.1 6.2 6.3 6.4 6.5
41 41 42 45 57 61
Archiveringseisen geplaatst in het ICTU raamwerk Het raamwerk Begrippen Eisen geplaatst in het raamwerk Het overzicht van de eisen Overzicht van de richtlijnen
4
1
Inleiding en leeswijzer
De centrale onderzoeksvraag in het ICTU project webrichtlijnen 2 is: “Welke eisen kun je aan het ontwerp van een website stellen, zodat opslag en toegang tot de gecommuniceerde informatie (inhoud, structuur, presentatie en context) door de tijd heen gewaarborgd blijft, en wel zolang als wet- en regelgeving dat vereisen of de organisatie dat wenselijk acht.” Oftewel: wat is een archiveerbare website? Om deze vraag te kunnen beantwoorden heeft de Archiefschool een onderzoek opgezet dat bestaat uit een aantal fasen (zie onderzoeksvoorstel in de offerte). In deze Rapportage doen wij verslag van het uitgevoerde onderzoek. Dit onderzoek is uitgevoerd volgens de volgende deelvragen: 1. wat is een website? Dit deelonderzoek behelst een nadere definiëring van het object van onderzoek. Het definieert karakteristieke elementen van websites en bepaalt de aandachtspunten voor het duurzaam toegankelijk houden van websites. Zie hiervoor hoofdstuk 3 van deze rapportage. 2. wat zijn kwaliteitsaspecten van websites? Dit deelonderzoek gaat in op de kwaliteit van websites. Achterliggende gedachte is dat duurzame beschikbaarheid vooral tot doel heeft de kwaliteit van de informatie te behouden en toegankelijk te houden voor wie deze informatie op welk moment dan ook wil raadplegen. Zie hiervoor hoofdstuk 4 van deze rapportage. 3. wat zijn de opties voor archivering van websites? Dit deelonderzoek gaat in op de op dit moment bekende strategieën voor de archivering van websites. Het model van het archiveringssysteem biedt hiervoor een raamwerk. Achterliggende gedachte is dat een website zo moet zijn opgezet, dat archivering volgens de nu bekende strategieën mogelijk is. Zie hiervoor hoofdstuk 5 van deze rapportage 4. wat betekent dit voor het ontwerp van een website? Dit deelonderzoek vertaalt de conclusies uit de vorige drie deelonderzoeken naar eisen aan het ontwerp van websites. Het raamwerk in de webrichtlijnen dient hiervoor als basis. Zie hiervoor hoofdstuk 6 van deze rapportage. Tijdens de eerste bijeenkomst van de ICTU_AS-begeleidingsgroep webrichtlijnen is geconstateerd dat het hanteren van (dezelfde) definities belangrijk is. In hoofdstuk 2 is een aantal definities opgenomen. In de bijlage bij dit rapport zijn tekstvoorstellen voor de ICTU webrichtlijnen opgenomen.
5
2
Terminologie
De Archivistiek kent een eigen begrippenapparaat. In deze paragraaf geven we enkele basisbegrippen met hun definities die in het kader van het onderzoek van belang zijn. De archivistische terminologie is vergeleken met de begrippen die zijn gebruikt voor de ICTU webrichtlijnen. Waar termen bleken te ‘conflicteren’ doen we in deze versie van de rapportage een voorstel. De definities hebben in veel gevallen een lokale betekenis, dat wil zeggen dat ze gelden binnen de context van dit rapport. Archiveringsfunctie en -systeem De archiveringsfunctie is een persoonlijke of organisatorische functie met als doel het beheer en de beschikbaarstelling van procesgebonden informatie die de persoon of organisatie nodig heeft voor de uitvoering van haar taken of het afleggen van verantwoording. Een archiveringssysteem is het geheel van procedures, methoden, kennis, mensen, middelen en documenten, waarmee een persoon of een samenwerkingsverband van personen (een organisatie) de archiveringsfunctie vorm geeft. (P.J. Horsman Archiveren. Een inleiding (’s-Gravenhage, 2004) p. 39 Duurzaamheid Web duurzaamheid betekent dat webpagina’s altijd uniek adresseerbaar en vindbaar zijn, ook als er later wijzigingen in de structuur van de site worden gemaakt. (webrichtlijnen overheid.nl versie 1.1) Duurzaamheid [van een website] houdt in dat altijd aan alle internetgebruikers getoond kan worden hoe de website er op een bepaald moment in het verleden uitzag, zowel naar inhoud, structuur, vormgeving en functionaliteiten. (onderzoeksvoorstel archiefschool) Duurzaamheid houdt in dat te allen tijde inhoud, structuur, vormgeving, functionaliteiten en context van vastgelegde informatie in hun onderlinge samenhang te raadplegen zijn, zolang als de bewaring van die informatie noodzakelijk of gewenst is. (Voorstel voor een nieuwe archivistische definitie. Zie voor toelichting hierna paragraaf 3.3) Zoals elke definitie laat ook deze nog ruimte voor interpretatie en behoeft nadere toelichting.
Toegankelijkheid Een toegankelijke website is een website waarbij de inhoud van de site toegankelijk is voor zoveel mogelijk bezoekers, de bedoeling is dat er niemand wordt uitgesloten.
6
(webrichtlijnen overheid.nl versie 1.1) The availability of records for consultation as a result both of legal authorisation and the existence of finding aids. (Peter Walne (ed), Dictionary of Archival Terminology. 2nd revised edition. München: Saur, 1988.) Toegankelijkheid van een archief is de geschiktheid van een archiveringssysteem op een bepaalde tijd en plaats om een gebruiker met bepaalde competenties op een effectieve manier het archief te laten interpreteren, binnen de beperkingen die de omgeving van dat archiveringssysteem aan die raadpleging stelt. (Theo Thomassen ‘De veelvormigheid van de archiefontsluiting en de illusie van Toegankelijkheid’ in Toegang (S@P-jaarboek 2001) p. 17 Toelichting: binnen het kader van de webrichtlijnen kan de eerste definitie gehandhaafd blijven, met toevoeging dat ook de gearchiveerde inhoud toegankelijk is. Overigens zou de definitie wel een scherpere redactie behoeven, omdat de term gedefinieerd wordt met de term zelf.
Transactie Een actie met een gedefinieerde input en output. Een transactie geeft geen ongedefinieerd tussenresultaat. (Opmerking Roel Stap op versie 1.0 van de tussenrapportage) Toelichting. We nemen de term op, omdat ze in de discussies een rol speelde. In de regel zullen de transacties buiten de website plaats vinden, in back office applicaties.
Informatie-object Een als logische eenheid te onderscheiden hoeveelheid informatie, bedoeld om als zodanig aan een bepaalde doelgroep ter raadpleging te worden gegeven. Toelichting. ISO-NEN 15489 spreekt van archiefstukken, als zijnde een bepaalde categorie documenten. In een digitale omgeving is het begrip document minder vanzelfsprekend. We hanteren daarom het neutralere begrip informatie-object, in feite als equivalent van document. Een website is dus een platform voor een of meer informatie-objecten.
7
3
Archiveerbare website: object van onderzoek
3.1
Inleiding
In het bepalen wat een archiveerbare website is en hoe langdurig beheer van een website vorm kan krijgen is een eerste vraag natuurlijk wat een website is en wat duurzame toegankelijkheid inhoudt. De beantwoording hiervan schept duidelijkheid over het object waar de ICTU-eisen op van toepassing zijn. Dit hoofdstuk gaat in op beide vragen. De basis is een eerder uitgevoerde analyse van websites1, toegespitst ten behoeve van de opdracht van het ICTU. Destijds is een website gedefinieerd als: Een website is het medium, waarmee via het Internet informatie gepresenteerd wordt op een statische of dynamische manier, vaak in combinatie met technologieën voor tweezijdige communicatie en transactie, zoals e-mail, nieuwsgroepen of discussielijsten. In genoemd onderzoek is ook aangegeven dat een website zelf geen archiefstuk is, het is het medium dat informatie presenteert, of communiceert. Een website moet dus niet gezien worden als een drager van informatie, maar als een doorgeefluik, al dan niet met toegevoegde waarde (service). Deze invalshoek is door Roel Stap 2 (TNO) aangescherpt. Hij stelt dat een website te beschouwen is als een virtueel punt waar verschillende diensten /services (communicatieservice, transacties, voorlichting, etc) worden aangeboden. Paragraaf 3.2 werkt dit verder uit. Paragraaf 3.3 gaat vervolgens in op de vraag wat het object van archivering is: wat moet duurzaam toegankelijk gehouden worden? 3.2
Object van onderzoek
3.2.1
Structuur en gedrag van een website
Een eerste aspect van een website is de structuur en het gedrag van een website. Belangrijkste kenmerk van de structuur is dat een website bestaat en ontstaat vanuit verschillende elementen. De web pagina is de eenheid waarin de informatie via internet wordt gepresenteerd. Het w3 consortium definieert een webpagina als “a collection of information, consisting of one or more web resources, intended to be rendered simultaneously and identified by a single URI.”3 Iedere pagina wordt dus gevormd uit één of meerdere elementen die simultaan gepresenteerd worden. Elementen binnen een pagina zijn H.A. Hokke Blijvend beschikbaar. Onderzoek naar de Archivering van websites (Amsterdam, Archiefschool, ministerie van Verkeer en Waterstaat, 2003) zie: http://www.elo.nl/elo/Images/blijbeschik_tcm7020514.doc met H.A. Hokke Naar archivering van websites. Implementatieadvies (Amsterdam, Archiefschool, ministerie van Verkeer en Waterstaat, 2003) 2 Roel Stap commentaar op eerdere versie van dit rapport. 3 Zie www.w3.org/1999/05/WCA-terms/01 01-04-2005 1
8
tekst, afbeeldingen, multimedia toepassingen, links naar andere pagina’s, mogelijkheden voor interactieve communicatie, etc. De verschillende elementen binnen een pagina kunnen zelfstandig of samen met andere elementen een ‘logisch’ document vormen.4 Een website bestaat uit één of meerdere pagina’s, waaronder een home-page, die onderling met elkaar verbonden zijn en die via links verbonden kunnen zijn met pagina’s buiten de eigen website. In de definitie van het w3 consortium “a collection of interlinked Web pages, including a host page, residing at the samen network location.”5 Deze pagina’s kunnen variëren van eenvoudige html-pagina’s tot html-pagina’s die zijn samengesteld uit elementen uit verschillende bestanden en programma’s, eventueel afkomstig uit verschillende organisaties. Een voorbeeld hiervan is de combinatie van een website met een statistiekapplicatie of een Adobe Acrobat reader. Een website is herkenbaar aan een eigen identificatie (of locatie), de URL6. Deze unieke identificatie verwijst naar de plaats waar de informatie zich bevindt binnen het World Wide Web. Binnen een website kan een aantal pagina’s gegroepeerd zijn tot sub-sites rondom een thema of organisatieonderdeel met een eigen URL. Er is dan sprake van een afbakening op basis van inhoud. Zoals bijvoorbeeld de site www.vananaarbeter.nl, een website over projecten van de overheid die gericht zijn op het verbeteren van de bereikbaarheid en veiligheid in Nederland. Hoewel deze structuur op papier helder is, bleek uit een eerdere analyse7 dat niet iedere website hetzelfde is. Destijds is onderscheid gemaakt tussen statische en dynamische websites. Statisch wil zeggen dat de website aanbodgericht is, dat de pagina’s altijd op dezelfde (door de ontwerper bepaalde) manier verschijnen op het beeldscherm. Dynamisch wil zeggen dat ze afhankelijk van de vraag van de bezoeker van de site worden opgebouwd. Ook dit onderscheid simplificeert: websites, zowel statisch als dynamisch, kunnen worden gecombineerd met andere technologieën, waardoor verschillende diensten via de website worden aangeboden. Deze combinaties maken een website niet alleen dynamisch, een bezoeker kan zelf bepalen welke informatie hij/zij gepresenteerd krijgt, maar ook interactief, een bezoeker kan reageren en informatie toevoegen. Dit heeft bijvoorbeeld de vorm van tweezijdige communicatieservices, zoals e-mail, nieuwsgroepen of een discussieforum. De website fungeert feitelijk als een brievenbus (e-mail) of een prikbord (discussiepagina). Een voorbeeld van zulke interactieve pagina’s is te vinden via www.interwad.nl, via deze website is het mogelijk een discussie over het Waddenbeleid te voeren.
We geven ons er rekenschap van dat de term ‘document’ in een digitale omgeving aan waarde inboet. Niet zonder reden voorspelde John Mackenzie Owen zijn einde. 5 Zie www.w3.org/1999/05/WCA-terms/01 01-04-2005 6 http://www.w3.org/TR/2001/uri-clarification 16-9-2002. Volgens het W3 consortium is Uniform Resource Identifier (URI) de formele term voor de identificatie. Een URI kan verwijzen naar locatie (URL) of naam (URN) van de informatie. 7 Geanalyseerd zijn de websites van het ministerie van Verkeer en Waterstaat. De analyse is uitgevoerd in de periode juli – augustus 2002. Een verslag van deze analyse is te vinden in het rapport Blijvend Beschikbaar. 4
9
Een andere combinatie is met databases. De website wordt bijvoorbeeld gegenereerd uit een contentmanagementsysteem. Of de website fungeert dan als interface voor een database. De gegevens uit de database, het deepweb, worden binnen de structuur van de website gepresenteerd. Tenslotte verschillen websites in ‘look and feel’ en in functionaliteiten. Beide bepalen sterk het uiterlijk ofwel de vorm van een site. Het gaat hier om opmaak, vormgeving etc. En om het gedrag: links, animaties etc. Hier ligt ook een sterke relatie met de inhoud en het doel van de betreffende site. 3.2.2
Doel en functie van een website
Websites zijn ook te definiëren vanuit het (door de eigenaar) bedoelde gebruik: doel en functie van de website. Organisaties en personen maken websites om via internet informatie te verspreiden of te communiceren, dan wel om toegang te geven tot diensten die via achterliggende bedrijfssystemen worden aangeboden. Structuur en gedrag van een website kunnen dan ook niet los worden gezien van doel en functie van de website. Voor de overheid zijn websites instrumenten in de vormgeving van de elektronische overheid, waarmee de burger toegang krijgt tot alle voor hen relevante overheidsinformatie en gebruik kan maken van diensten waarvoor de gang naar het betreffende overheidskantoor niet noodzakelijk is. Via websites kan de overheid het beleid toelichten of de mening van de burger peilen. Daarnaast kan de burger via digitale loketten vragen stellen of diensten afnemen, zoals het aanvragen van vergunningen. Websites hebben voor de overheid dus een functie ten behoeve van: • publicatie: het informeren van de burger via éénrichting communicatie. • consultatie: tweezijdige communicatie, meestal 1-op-1 communicatie tussen overheid en burger, maar ook discussies.8 • transactie: tweezijdige communicatie waarbij een product of dienst wordt geleverd.9 Vooral de laatste functie is sterk in ontwikkeling. Een website ontwikkelt zich van een gegevensdager en communicatie-instrument naar een virtueel punt in het World Wide Web waar verschillende diensten bereikbaar zijn. Websites zijn grotendeels aanbodgericht, de organisatie of persoon bepaalt welke informatie of dienst via een website wordt verspreid. Een uitzondering zijn sites als wikipedia10, waar iedere individuele gebruiker informatie kan toevoegen en dus kan bepalen welke informatie 8 Hier wordt bewust niet gekozen voor het begrip “Interactie”. Het begrip Interactie wordt in de literatuur in meerdere betekenissen gebruikt, namelijk als term voor tweezijdige communicatie, als term voor functionaliteiten binnen website en als term voor een fase in de overgang naar de elektronische overheid. Binnen dit onderzoek naar de archivering van websites wordt tweezijdige communicatie, aansluitend bij het rapport Toekomst Overheidscommunicatie van de commissie Wallage, consultatie genoemd. Interactie wordt gebruikt voor de mate waarin een website dynamisch is en heeft dus betrekking op de functionaliteiten van een website. 9 Bij een transactie kan ook een derde partij betrokken zijn, zoals een ‘enabler’. 10 http://www.wikipedia.org
10
via de site beschikbaar is. Er is geen organisatie die de inhoud van de site bepaalt. Men zou kunnen zeggen dat de gebruiker daar zowel de rol van aanbieder als afnemer kan vervullen.
3.2.3
Context en inhoud
De laatste twee (voor archivering relevante) aspecten van een website zijn context en inhoud. Beide zijn zeer divers. De inhoud verschilt per website maar is natuurlijk wel gerelateerd aan zijn context. Uit de hierboven genoemde analyse van websites blijkt dat websites een rol spelen binnen verschillende soorten processen, zowel primaire processen als ondersteunende processen. Deze processen en de organisatie die ze uitvoert maken deel uit van de ontstaanscontext van de website. Er zijn vier typen processen te onderscheiden waarbij de overheid gebruikt maakt van websites: (1) zelfstandige communicatie processen. Dit zijn de processen die primair gericht zijn op informeren, het toegang geven tot openbare informatie, bijvoorbeeld over beleid of activiteiten. Er kan zowel sprake zijn van het geven van informatie op verzoek als van het geven van informatie uit eigen beweging. (2) beleidsprocessen. De processen waarin beleid en wetgeving ontwikkeld worden. (3) uitvoeringsprocessen. Hiermee wordt de uitvoering van het beleid bedoeld waarbij communicatie een rol speelt. Hierbij horen ook de dienstverleningsprocessen waarin de overheid een dienst of product levert. Naast communicatie kan bij deze processen ook sprake zijn van transacties.11 (4) ondersteunende processen. Dit zijn de processen die gericht zijn op het instandhouden van de organisatie en/of het ondersteunen van de primaire processen. Bijvoorbeeld personeelszaken, ICT, facilitaire dienst. Argumenten die de keuze voor wel of niet archiveren bepalen zijn af te leiden van de processen waarin de informatie een rol speelt.12
Het verschil tussen (1) en (3) is dat het laatste type proces tot doel heeft een rechtsgevolg te bewerkstelligen. 12 Zie hiervoor ook Hokke, H.A. Blijvend beschikbaar. Onderzoek naar de Archivering van websites (Amsterdam, Archiefschool, ministerie van Verkeer en Waterstaat, 2003) via: http://www.elo.nl/elo/Images/blijbeschik_tcm70-20514.doc 06-02-2006 ; Boudrez, F. Archivering van websites: een kwestie van waardering en ‘capture’ (2005) via: http://www.antwerpen.be/david/website/nl/index2.htm 06-02-2006 en Philips, Margaret E.; Cunningham, Adrian Keeping online information accessible for E-government and E-democracy (2005) via: http://www.nla.gov.au/nla/staffpaper/2004/phillips1.html 06-02-2006 11
11
3.2.4
Karakterisering website
Een website is dus meer dan een drager, het is een informatie-service die is geïmplementeerd met behulp van een aantal specifieke componenten. Kort gezegd valt een website te karakteriseren in termen van: • Context: de organisatie en het proces waarbinnen de website wordt gebruikt.13 • Het doel: de reden waarop de website is of wordt ontwikkeld; er kunnen meer doelen zijn. • De inhoud: de inhoudelijke boodschap die de website overbrengt; deze hangt samen met context en doel. • De websitestructuur: de uit elementen, links en identificatie (URL) opgebouwde pagina’s en site • Het gedrag of de vorm van de website, bestaande uit de ‘look and feel’ en de functionaliteiten Al deze verschillende componenten vormen samen een website. Verandert één van deze componenten (of erger: verdwijnt) dan bestaat de website niet meer. Dit maakt websites complex, zowel in gebruikte technologieën als in inhoud en doel. De complexiteit wordt vergroot door webontwikkelingen, zoals blogs, interactieve nieuwssites en door gebruikers gevulde encyclopedieën als wikipedia. Deze sites zijn heel interactief, zijn snel te veranderen, worden vaak gevuld vanuit verschillende bronnen, bestaan niet meer uit statische HTMLpagina’s maar worden ondersteund door databases, hebben vaak geen hiërarchische structuur meer, etc. Het is vooral deze complexiteit die een uitdaging is voor duurzame toegankelijkheid. Waar een simpele HTML pagina nog wel door het bewaren van een kopie te archiveren is, lukt dit niet meer voor een hele interactieve site die opgebouwd wordt vanuit een contentmanagementsysteem. Waar een paar pagina’s nog wel gerelateerd kunnen worden aan een bepaald proces (relevant voor het bepalen van de bewaartermijn van de informatie), kan dit niet meer bij grote overheidswebsites die ingezet worden bij alle taken van een ministerie. Waar de verantwoordelijkheid voor de inhoud van een publicatie-website nog wel bij het ministerie is neer te leggen, wordt dat bij discussiepagina’s waar meerdere mensen aan bijdragen al veel moeilijker. Complexiteit is dan ook een essentiële eigenschap van websites, het bepaalt in sterke mate de boodschap die overgebracht wordt. De website zelf is zowel medium als context van de informatie en bepaalt dus de wijze van archivering. Alleen bewaren van de inhoud, de te communiceren boodschap, lijkt dan ook niet voldoende.
Goedbeschouwd hoort ook de gebruiker tot de context. Voor zover gebruikers zich bekend maken of moeten maken en transacties aangaan, worden gegevens over deze opgeslagen bij de informatie die de transactie documenteert. 13
12
3.3
Duurzaam toegankelijk
3.3.1
Duurzaamheid
Het is een wens en in veel gevallen zelfs een wettelijke eis, dat de informatie die de overheid via haar websites verspreidt duurzaam toegankelijk is. Wat betekent dit? Duurzaamheid heeft twee dimensies. De eerste dimensie is gericht op het ontwerp de website. De website moet robuust en onderhoudbaar zijn. De definitie die de webrichtlijnen over web duurzaamheid geven drukt dit uit: “Web duurzaamheid betekent dat webpagina’s altijd uniek adresseerbaar en vindbaar zijn, ook als er later wijzigingen in de structuur van de site worden gemaakt.” (webrichtlijnen overheid.nl versie 1.1) Samengevat houdt dit in dat de door de overheid gepresenteerde informatie te allen tijde gevonden moet kunnen worden, ongeacht wat er met de website gebeurt. Unieke adressering ondersteunt dit. De tweede dimensie van duurzaamheid heeft betrekking op duurzaamheid door de tijd heen: de toekomstige beschikbaarheid van de overheidsinformatie die nu via websites wordt uitgewisseld. Je zou dit robuustheid door de tijd kunnen noemen. Deze vorm van duurzaamheid vatten we zo op dat informatie die ooit op de website ‘stond’, ook later nog opgevraagd kan worden, (natuurlijk alleen voor zover de organisatie deze informatie moest of wilde archiveren); dat de burger er op moet kunnen vertrouwen dat de informatie die hij / zij gepresenteerd krijgt authentiek en betrouwbaar is; dat deze informatie volledig is, etc. Dit alles ongeacht hoe oud deze informatie is, waar zij bewaard is of hoe beschikbaar wordt gesteld (via de originele website of anderszins). We stellen dan ook een aanvullende definitie van duurzaamheid voor: Duurzaamheid houdt in dat te allen tijde inhoud, structuur, vormgeving, functionaliteiten en context van de vastgelegde informatie in hun onderlinge samenhang te raadplegen zijn, zolang als de bewaring van die informatie noodzakelijk of gewenst is. Het gaat er om de (overheids)informatie te behouden en toegankelijk te houden voor wie haar op enig moment (morgen, volgend jaar, in de verre toekomst) zou willen raadplegen. De raadpleger moet er vanuit kunnen gaan dat gepubliceerde informatie te vinden, raadplegen en ook te vertrouwen is. 3.3.2
Object van archivering
Tot dusver hebben we ons nog niet duidelijk uitgesproken wát er nu duurzaam toegankelijk gehouden moet worden: wát is de te archiveren eenheid? In de begeleidingsgroep is veel gediscussieerd over deze vraag. Gaat het om de hele website of alleen de gecommuniceerde
13
inhoud (de informatie)? Gaat het of de website of afzonderlijke webpagina’s? Of liever de elementen / componenten waaruit pagina en website worden opgebouwd? De archivistische theorie stelt dat alleen die informatie voor archivering in aanmerking komt, die wordt gegenereerd en gebruikt in werkprocessen. Die informatie is vastgelegd, heeft een inhoud, een vorm en een context. In feite zijn het de logische eenheden (documenten) die gearchiveerd moeten worden. Uit welke elementen ze bestaan is van secundair belang. In de papieren wereld heeft de procesgebonden informatie de vorm van documenten, zoals brieven, memo’s, rapporten etc. Een document is een afgerond geheel, gemaakt om in die vorm een ‘autonome’ functie te vervullen in de werkprocessen. In de digitale omgeving kan informatie in een vergelijkbare vorm worden gegoten als in de papieren wereld, zij het dat de drager geen papier is. Het essentiële verschil met papieren documenten is dat wat op de drager (de harddisk, cd-rom, tape) staat niet is wat het beeldscherm laat zien. We moeten dus onderscheid maken tussen het logische document (datgene wat gecommuniceerd wordt) en de ‘fysieke’ digitale componenten waaruit het logische document bestaat. Wat betekent dit nu voor websites? Er lijkt overeenstemming te bestaan dat – in beginsel – de website als geheel niet het archiefstuk is. De website is ‘slechts’ medium en context van een bericht, dienst of service. Wanneer een organisatie hele websites archiveert is dat òf uit pragmatische overwegingen òf omdat alle pagina’s als archiefstuk in de zin der Archiefwet 1995 zouden moeten worden aangemerkt. Bij archiveren gaat echter niet alleen om de inhoud ‘sec’, of om het bewaren van de afzonderlijke componenten van de website, maar ook om de context. De website is te zien als een essentieel deel van de context waarin de informatie is vervat; de website geeft mede betekenis aan de informatie. In de discussie in de begeleidingsgroep hebben we gewerkt met de neutrale term informatieobject, zijnde ‘een als logische eenheid te onderscheiden hoeveelheid informatie, bedoeld om als zodanig aan een bepaalde doelgroep ter raadpleging te worden gegeven’. Deze eenheid bestaat uit inhoud, structuur, context en vorm van de informatie. Deze term geeft dan wel weer wat het te archiveren object is, maar de term is slechts functioneel in een archiefwetenschappelijk discours. Voor praktische richtlijnen is ze niet bruikbaar. Wij stellen dan ook voor de webpagina te beschouwen als manifestatie van het informatieobject. Een webpagina presenteert gelijktijdig de inhoud, structuur, context en vorm van informatie aan een bepaalde doelgroep en is daarmee een uitdrukking van het begrip informatie-object. De webpagina is een logische informatie eenheid met een eigen unieke identificatie (zoals gedefinieerd door W3). Het is immers de pagina die altijd uniek a dresseerbaar en vindbaar moet zijn. Dat wil niet zeggen dat pagina’s eenheden zijn die volledig op zichzelf staan, zij zijn onderdeel van een website. De website is feitelijk de context van de pagina. De relaties naar andere pagina’s maken dan ook deel uit van de pagina. Ook vanuit pragmatische redenen kan het aanbeveling verdienen webpagina en te archiveren informatie-object zoveel mogelijk te laten samenvallen. In de meeste website
14
archiveringsprojecten worden websites of webpagina’s gearchiveerd. Deze projecten kunnen als best practice dienen voor implementatiestrategieën voor websitearchivering.14 Dit betekent dus dat zowel context, inhoud, structuur als vorm van deze pagina bewaard moeten worden èn in hun onderlinge samenhang. 3.3.3
Reikwijdte eisen duurzame toegankelijkheid
Wanneer we spreken van duurzame toegankelijkheid van websites, gaat het dus om de logische informatie-objecten, niet om de website zelf. Deze informatie is te beschouwen als archief als ze is gegenereerd bij de uitvoering van een werkproces.15 De eisen die verderop in deze rapportage worden geformuleerd hebben dus betrekking op deze informatie-objecten. Het betreft de kwaliteitseisen waar deze informatie-objecten aan moeten voldoen (zie hoofdstuk 4) en eisen vanuit archiveringsoogpunt (zie hoofdstuk 5). Door DAVID16 is gesteld dat voor de archivering van een website naast de pagina’s ook het deep web, de neerslag van transacties en handelingen en tenslotte ook de metadata in aanmerking komen. Het deepweb17 en de neerslag van transacties en handelingen vallen grotendeels buiten de reikwijdte van het ICTU project (zie hiervoor ook de opmerkingen van de begeleidingsgroep bij het onderzoeksvoorstel). Alleen voor zover de transactie of het deepweb sporen nalaat in de website, worden deze betrokken in de eisen voor de website. In de discussies in de begeleidingsgroep heeft Hans Hofman er verschillende malen terecht op gewezen dat het archiveren van websites te veel als een geïsoleerd probleem wordt beschouwd. Een website maakt deel uit van de totale informatievoorziening (informatiehuishouding) van een organisatie en archiveringsvraagstukken moeten dan ook vanuit het geheel bekeken worden. Het in de vorige alinea geschetste probleem van deep web archivering is daarvan een goed voorbeeld. Archivering moet daar plaats vinden waar het proces (transacties, handeling) zo adequaat mogelijk gedocumenteerd wordt. Het zal dan bij websites vooral gaan om publicatie en communicatieprocessen en veel minder om transacties. De transactie wordt gearchiveerd via de betreffende applicatie, waarbij de website en web-pagina een element uit de context is. De bijbehorende archiveringseisen hebben dan ook geen betrekking op de website, maar op de bedrijfsapplicatie waarmee de transacties worden uitgevoerd.
14 Zie de archiveringsstrategieën in hoofdstuk 5 van deze rapportage en de bibliografie over website archivering Eerste Hulp bij Websitearchivering 15 Voor overheidsorganen betekent dit dat de als archief beschouwde informatie onder het regime van de Archiefwet 1995 valt en dus niet naar willekeur vernietigd of gewijzigd mag worden. 16 F. Boudrez, S. van den Eynde DAVID, archivering van websites (Antwerpen - Leuven, mei 2002) Via http://www.antwerpen.be/david/website/default.htm 28-02-2005 17 Deepweb = de eigenlijke transactie vindt plaats in een applicatie buiten de website, bijvoorbeeld in een database.
15
4
Kwaliteit van informatie-OBJECTEN
4.1
Inleiding
Archiveren van websites of beter: informatie-objecten die via de website worden gecommuniceerd, is niet alleen het duurzaam opbergen van informatie die haar actualiteit heeft verloren en daarom van het web verwijderd zou kunnen worden. Archiveren heeft vooral tot doel de kwaliteit van waardevolle informatie te behouden en de informatie toegankelijk te houden voor wie haar op enig moment zou willen raadplegen. Aan overheidsinformatie mogen hoge kwaliteitseisen gesteld worden, niet alleen wat inhoud betreft, maar ook wat vorm aangaat. De vraag die dit hoofdstuk aan de orde stelt is: aan welke kwaliteitseisen moet de informatie op websites voldoen om zodanig gearchiveerd te kunnen worden dat ze duurzaam toegankelijk blijft zonder onacceptabel verlies aan kwaliteit? Bij nadere beschouwing gaan de eisen verder dan archivering. Ze hebben voor alles betrekking op het maken van documenten. De ISO-NEN norm voor informatie- en archiefmanagement18 stelt dat organisaties hun activiteiten adequaat moeten ‘documenteren’. Dat is geen archiveringseis, maar kwalitatief goede documenten vormen de basis voor een kwalitatief goed en duurzaam archief. Dat geldt zeker voor informatie die publiek gemaakt wordt. Deze eisen zouden dan ook moeten samenvallen met de reeds geformuleerde eisen voor websites. Vanuit het archiveringssysteem geredeneerd is het ook de onderkenning van het simpele gigo principe: garbage in, garbage out. Kwalitatief goede documenten (informatie-objecten) dragen bij aan de kwaliteit van het archief. Of anders: kwalitatief goede websites dragen bij aan de toegankelijkheid van de overheidsinformatie. 4.2
Kwaliteitmodel
4.2.1
Onderzoeksmodel
We groeperen de verschillende sets kwaliteitseisen in een eenvoudig onderzoeksmodel. Hieronder schematisch weergegeven.
ISO-NEN 15489:2001 norm voor informatie- en archiefmanagement stelt expliciet dat een organisatie haar activiteiten moet ondersteunen met kwalitatief goede documenten. 18
16
Kwaliteitseisen informatie
Kwaliteitseisen toegankelijkheid
Archiveringssysteem Raadplegen
Opnemen
Technische karakteristieken van de informatie
Mogelijkheden en beperkingen van het archiveringssysteem
Bij het opnemen van te archiveren informatie maakt het archiveringssysteem een afweging tussen de gewenste duurzame kwaliteit van de aangeboden informatie, de (vooral technische) karakteristieken van de te archiveren informatie, de eisen die aan duurzame toegankelijkheid gesteld worden en de financiële en technische mogelijkheden die het archiveringssysteem zelf heeft. Die afweging zou kunnen leiden tot ‘onderhandelingen’ over de bijstelling van de kwaliteitseisen. Idealiter stemmen organisaties de technische karakteristieken van duurzaam te bewaren informatie af op de mogelijkheden en beperkingen van het archiveringssysteem. 4.2.2
Bronnen19
ISO-NEN 15489:2001-1 Norm voor informatie- en archiefmanagement geeft archiefdocumenten de volgende vier (kwaliteits)attributen: authenticiteit, betrouwbaarheid, bruikbaarheid en integriteit.20 We volgen deze indeling; omdat het een internationale standaard en een nationale norm is, beschouwen we het als de meest gezaghebbende bron.
Geraadpleegd zijn: Peter Horsman, “Archiefsystemen en kwaliteit”, in Naar een nieuw paradigma in de archivistiek. ’s-Gravenhage, Stichting Archiefpublicaties, 1999. (Jaarboek 1999 Stichting Archiefpublicaties). Blz 85-105; UBC: Luciana Duranti, Terry Eastwood, Heather MacNeil, Preservation of the integrity of Electronic Records. (Dordrecht: Kluwer, 2002) NEN-ISO: NEN-ISO 15489-1:2001. Norm voor informatie- en archiefmanagement. (Delft, NEN, 2001); BenB: Bewaren en bewijzen. (Delft: NEN, 1998); AW: Archiefwet 1995; Archiefbesluit 1995, Regeling duurzaamheid archiefbescheiden (Ministeriele regeling ex art. 11 Archiefbesluit 1995). AW/GT: Regeling geordende en toegankelijke staat archiefbescheiden; (Ministeriele regeling ex art. 12 Archiefbesluit 1995) Pittsburgh: University of Pittsburgh, Functional Requirements for Evidence in Recordkeeping http://www.archimuse.com/papers/nhprc/prog1.html 20 Hier hanteren we voorlopig nog de term document, waarmee we de kleinste eenheid bedoelen, die op zichzelf gelezen en begrepen kan worden. (dit is nog geen definitie). 19
17
Ook andere bronnen zijn relevant, zoals de Archiefwet 1995 en daarbij behorende uitvoeringsbesluiten en regelingen, en de onderzoeksresultaten van projecten aan de universiteiten van Pittsburgh en British Columbia. 4.2.3
Indeling
We delen de kwaliteitsattributen in drie groepen in, vanuit drie verschillende perspectieven: die van het document zelf (de ‘intrinsieke kwaliteit’, de eigenlijke attributen, dat wil zeggen de kwaliteit die behouden moet blijven om de oorspronkelijke bedoeling van de informatie zichtbaar te houden), die van de gebruiker (de attributen die essentieel zijn voor toegankelijkheid), en die van de beheerder (de attributen die effectief en efficient beheer mogelijk maken). Die drie groepen laten zich straks goed vertalen naar de kerntaken van archiveringssystemen: behoud van integriteit, mogelijk maken van raadplegen en preservering. In de indeling is die van ISO-NEN goed te herkennen. De vier eisen zijn verdeeld over de eerste twee groepen; de derde groep is een pragmatische uitbreiding – een gevolg van het gehanteerde kwaliteitsmodel: de website moet het het archiveringssysteem niet te moeilijk maken. De groepering wordt dan: • • •
Kwaliteit van de documenten (ISO-NEN: integriteit, authenticiteit en betrouwbaarheid) Bruikbaarheid (ISO-NEN: bruikbaarheid – toegankelijkheid, raadpleegbaarheid, vindbaarheid, leesbaarheid, interpreteerbaarheid) Beheerbaarheid (niet als zodanig in ISO/NEN / onderhoudbaarheid, beveiligbaarheid, verwijderbaarheid, adresseerbaarheid)
Bij deze groepering enige opmerkingen. Zoals iedere indeling is ook deze arbitrair en inwisselbaar. Bruikbaarheid is een zeer subjectief begrip. Het hangt af van de gebruiker en is in feite geen kwaliteitsattribuut van het document. Door contextuele informatie mee te archiveren wordt in het algemeen wel de bruikbaarheid vergroot. De derde groep is een samenvoeging van attributen die ontleend zijn aan de theorie over kwaliteit van informatie. We noemen die beheerbaarheid, daarmee vooral bedoelend de mate waarin het document zich laat beheren door een archiveringssysteem.21
G.P.A.J. Delen, H.J.Kouwenhoven en D.B.B. Rijsenbrij, Kwaliteit van producten. Rijswijk: CAP, 1991. Zie verder: Peter Horsman, ‘Archiefsystemen en kwaliteit’, in: P.J.Horsman, F.C.J.Ketelaar, Naar een nieuw paradigma in de archivistiek. ’s-Gravenhage, Stichting Archiefpublicaties, 1999, blz 85-120. 21
18
4.3
Kwaliteitseisen en attributen
4.3.1
Inleiding
De hierna volgende kwaliteitseisen hebben in de eerste plaats betrekking op het maken van documenten en het ontwerpen en implementeren van de media waarlangs ze worden gedistribueerd en openbaar gemaakt, zoals websites. Bij elk van de onderkende kwaliteitsaspecten vermelden we alvast de functionele eis die aan het archiveringssysteem gesteld moet worden, maar de verantwoordelijkheid voor de kwaliteitsattributen ligt in eerste aanleg bij de ‘maker(s)’. 4.3.2
Kwaliteit van de informatie
4.3.2.1
Integriteit
Kwaliteitseis te stellen aan het archiveringssysteem: Behoud van integriteit. ISO-NEN: De integriteit van een archiefstuk heeft betrekking op het feit dat het volledig en ongewijzigd is. [toelichting ISO] Het is noodzakelijk dat een archiefstuk wordt afgeschermd tegen ongeautoriseerde wijzigingen. Er wordt aanbevolen dat beleid en procedures met betrekking tot informatie- en archiefmanagement specificeren welke toevoegingen en annotaties gemaakt mogen worden in een archiefstuk, nadat het is gecreëerd, onder welke omstandigheden toevoegingen of annotaties mogen worden geautoriseerd en wie is geautoriseerd om ze te maken. Elke geautoriseerde annotatie, toevoeging of verwijdering in een archiefstuk zou expliciet moeten worden aangegeven en herkenbaar moeten zijn. Integriteit heeft als attributen: volledig en onveranderd Volledigheid is bij ISO-NEN ook een attribuut van betrouwbaarheid.
19
Attributen
Vereisten
Opmerkingen
Volledigheid. Een document is volledig wanneer het alle vormelementen heeft die noodzakelijk zijn voor het beoogde (juridische) effect.
• • • • •
De eisen betreffen de vorm en de weergave van de context van de informatie. Deze elementen moeten worden vastgelegd in de metadata. Verantwoordelijk daarvoor is de maker. Het gebruik van templates bevordert het maken van volledige informatie-objecten.
Volledigheid betreft hier de ‘intellectuele’ vorm, niet de inhoud; zie daarvoor nauwkeurigheid en juistheid.
Datering Identificatie van de actor Geadresseerde Handeling Titel of onderwerp (identificatie van de inhoud)
Bij websites wordt de geadresseerde niet expliciet in of via de site benoemd, impliciet is er natuurlijk wel een geadresseerde. Vastgelegd moet dan worden of de geadresseerde iedereen of een beperkte groep was. Onveranderbaarheid. Een document mag niet veranderd worden, tenzij iemand bevoegd is tot veranderen en die veranderingen moeten zijn gedocumenteerd.
• •
Procedures van wijzigen en verwijderen van documenten. Vastleggen (in metadata) van veranderingen, zichtbaar voor de gebruiker
De eisen zijn alle van procedurele aard. Je kunt aan een document niet zien of het veranderd is, tenzij het versiebeheer zichtbaar aan het document is toegevoegd. Het archiveringssysteem neemt in voorkomende gevallen de documenten op voordat ze veranderd worden, of houdt op andere wijze wijzigingen bij. Na archivering mogen inhoud en structuur van documenten in beginsel niet meer veranderd worden.
4.3.2.2
Authenticiteit
Definitie: ISO-NEN Een authentiek archiefstuk is een document22, waarvan kan worden bewezen dat het is wat het beweert te zijn, dat het opgemaakt of verzonden is door de persoon die beweert het te hebben opgemaakt of verzonden, en dat het opgemaakt of verzonden is op het tijdstip als aangegeven. 22
Document is hier opgevat als een ruim begrip dat ook databases, video, multimedia en dergelijke kan omvatten.
20
Toelichting ISO-NEN: Om de authenticiteit van archiefbescheiden veilig te stellen behoren organisaties beleid en procedures te implementeren en documenteren die de creatie, ontvangst, verzending, het onderhoud en vernietiging van archiefbescheiden controleren, om ervoor te zorgen dat personen die archiefbescheiden maken, geautoriseerd en geïdentificeerd zijn en dat archiefbescheiden afgeschermd zijn van ongeautoriseerde toevoegingen, verwijdering, verandering, gebruik en geheimhouding. Afhankelijk van wijze, vorm, of status van de transmissie (concept, origineel, kopie); de Nederlandse archivistiek noemt dit het ontwikkelingsstadium. Aan die stadia kunnen vervolgens vorm-kenmerken worden toegekend, die overeenkomen met die voor betrouwbaarheid. Voor documenten op websites nemen we aan dat de status die van origineel of kopie is. Attributen
Vereist
Opmerkingen
Identiteit
Referentienummer of code Naam van de actor en/of steller Doel van het document Datum van opstellen en publicatie
Voor een deel zijn de eisen gelijk aan die van integriteit en betrouwbaarheid. Het doel van het document legt ook het verband met het bedrijfsproces (handeling). In voorkomend geval zal ook een verwijzing naar wet- en regelgeving noodzakelijk zijn.
Oorspronkelijkheid De mate waarin het informatie-object hetzelfde is als dat wat op de website stond
Status
De eisen betreffen de (fysieke) vorm (lay-out) zoals de maker die bedoeld heeft. Indien die vorm bewaard zou moeten blijven, is het archiveringssysteem daarvoor verantwoordelijk. •
Het opnemen van vormkenmerken als actor (inclusief eventuele bekrachtiging), datum, werkproces waarin het informatieobject een rol speelde
De authenticiteit van webinformatie is in hoge mate afhankelijk van de wijze waarop de website is ingericht. Het moet de gebruiker duidelijk zijn van wie de website is.
21
4.3.2.3
Betrouwbaarheid
Definitie: ISO-NEN 7.2.3 Een betrouwbaar archiefstuk is een archiefstuk, waarvan de inhoud kan worden vertrouwd als een volledige en nauwkeurige weergave van de transacties, activiteiten of feiten waarvan het getuigt en waarop men zich kan verlaten bij de uitvoering van opvolgende transacties of activiteiten. Archiefbescheiden behoren te worden opgemaakt op het moment van de transactie of de gebeurtenis waarop ze betrekking hebben, of direct erna, door individuen die directe kennis hebben van de feiten of door hulpmiddelen die routinematig worden gebruikt in het bedrijfsproces voor de uitvoering van de transactie. Toelichting Duranti cs spreken van “trustworthiness” van de informatie. De betrouwbaarheid is afhankelijk van de mate van volledigheid, de procedure van totstandkoming en de betrouwbaarheid van de maker (actor, auteur). Die vorm van volledigheid is ondergebracht bij Integriteit. ISO-NEN lijkt zich hier vooral te richten op het maken van documenten. Vanuit archivering is nauwelijks te meten of een informatie-object (document) volledig en nauwkeurig in de zin van ISO is. Wel kan worden vastgesteld of alle vormelementen aanwezig zijn. Voor een kwalitatief goed archief is het van belang dat de kleinste bouwstenen, de documenten, een goede kwaliteit hebben, betrouwbaar zijn. Als archiveringseis wijkt ze niet af van wat van een goede administratie verwacht mag worden dat ze doet. Meetbare kenmerken of aspecten van betrouwbaarheid zijn: volledigheid, nauwkeurigheid, juistheid. Onderstaande tabel licht dit nader toe. Attributen Volledigheid De mate waarin het informatie-object overeenkomt met de bedoeling van de steller.
Nauwkeurigheid De mate van gedetailleerdheid waarmee het document de intentie van de auteur (actor) weergeeft
Vereisten
Opmerkingen Het archiveringssysteem is verantwoordelijk voor het behoud. Gezien de definitie van ISONEN zou het hier meer om de volledigheid van de inhoud gaan, dus de weergave van het feit. Als dat juist is, lijkt het ons voor archiveren minder van belang. De eisen zijn afhankelijk van doel van het document De eisen betreffen de eigenlijke inhoud (tekst, afbeelding etc). Verantwoordelijk is de maker. Het archiveringssysteem is verantwoordelijk voor het behoud. Bij archivering
22
eventueel vast te stellen welke mate van nauwkeurigheid vanuit gebruikersverwachting noodzakelijk is. Juistheid De mate waarin het document de feiten of intentie correct weergeeft.
•
Correcte en volledige weergave van het feit of wil, afhankelijk van het beoogde doel.
Niet bij ISO-NEN. Lijkt minder relevant voor archivering. De eisen betreffen de eigenlijke inhoud (tekst, afbeelding etc). Verantwoordelijk is de maker. Het archiveringssysteem is verantwoordelijk voor het behoud.
4.3.3
Bruikbaarheid
ISO-NEN 15489:2001 heeft als kwaliteitseis: Bruikbaarheid. Definitie ISO-NEN Een bruikbaar archiefstuk is een archiefstuk, waarvan de vindplaats bekend is, dat kan worden teruggevonden, weergegeven en geïnterpreteerd. Het behoort te kunnen worden weergegeven in directe relatie tot het bedrijfsproces of de transactie dat het heeft geproduceerd. De koppelingen met de context van archiefbescheiden moeten gewoonlijk informatie bevatten nodig om de transacties, waarbij ze zijn opgemaakt en gebruikt, te kunnen begrijpen. Het behoort mogelijk te zijn een archiefstuk binnen de context van bredere bedrijfsactiviteiten en functies te identificeren. De koppelingen tussen archiefbescheiden23 die een opeenvolging van activiteiten documenteren, moeten in stand blijven. De term is enigszins subjectief, of kan althans zo worden opgevat. We interpreteren hem in de zin van ISO-NEN: ‘het moet kunnen worden gebruikt’, dat wil zeggen aan een ‘gebruiker’ ter inzage worden gegeven, zodanig dat deze het kan vinden, lezen en begrijpen. We onderscheiden binnen bruikbaarheid de eisen van toegankelijkheid, raadpleegbaarheid en begrijpelijkheid . De term ‘Toegankelijkheid’ hanteren we in de zin van Access zoals gedefinieerd door Walne, Dictionary24: “The availability of records for consultation as a result both of legal authorisation and the existence of finding aids”. Daaraan kunnen we nog toevoegen de daadwerkelijke ‘levering’ van de informatie, als een fysiek document of op een beeldscherm.
Archival bond. Naar onze opvatting gaat het vooral om de relatie tussen documenten en proces. Een gegeven verband tussen documenten heeft evenwel ook betekenis, maar het is de vraag of je de ‘archival bond’ als eis mag opvoeren, zoals Duranti doet. 24 Peter Walne (ed), Dictionary of Archival Terminology. 2nd revised edition. München: Saur, 1988. 23
23
4.3.3.1
Toegankelijkheid
Definitie: Een toegankelijk gearchiveerd document is een document dat door gebruikers kan worden gevonden, geïdentificeerd en raadpleegbaar is (dat wil zeggen: geleverd kan en mag worden). Attributen
Vereisten
Vindbaarheid • In intellectuele zin, dat wil zeggen dat het gearchiveerde informatieobject op door de gebruiker ingegeven zoekkenmerken kan worden teruggevonden.
Aan het informatie-object worden metadata toegekend, waaronder tenminste: o Titel o Werkproces (of handeling) o Datum vervaardiging o Data publicatie op website o Auteur (Actor) o Trefwoorden
Ophaalbaar (traceerbaar, • identificeerbaar) Het (door de gebruiker) gevraagde informatie-object kan door het archiveringssysteem worden geïdentificeerd en opgehaald
Het informatie-object dient voorzien te zijn van: o Identifier o Vindplaats (adres)
4.3.3.2
Opmerkingen De Dublin Core metadata set is bij correcte toepassing voldoende voor het verzekeren van de vindbaarheid. De Dublin Core is immers een wereldwijd geaccepteerde standaard voor recource finding. Voor interpretatie (zie hierna) gelden aanvullende eisen. Voor tekstdocumenten geldt bovendien de eis dat ze vindbaar moeten zijn door zoekmachines op basis van full-text search. Gearchiveerde documenten moeten niet alleen vindbaar zijn, maar ook uit het archief gehaald kunnen worden. Dat wil zeggen dat het systeem moet weten waar ze zich fysiek bevinden. Met andere woorden, het object en de bijbehorende metadata dienen onlosmakelijk gekoppeld te zijn. Dat kan door middel van een identifier. Het archiveringssysteem is daarvoor verantwoordelijk. Zie ook: adresseerbaarheid. De enige eis die voor de webrichtlijnen van belang is, is die van het hebben van een unieke identificatie. De rest is verantwoordelijkheid van het archiveringssysteem.
Raadpleegbaarheid
Definitie: Informatie is raadpleegbaar als ze door de gebruiker mag worden ingezien en beschikbaar is voor feitelijke raadpleging is.
24
Attributen
Vereisten
Opmerkingen
Openbaarheid De formele inzagemogelijkheden en –beperkingen.
•
In de regel zal informatie die op een website heeft gestaan ook na archivering volledig openbaar zijn.25 Dat wil zeggen dat de default waarde “openbaar” is. Beperkingen kunnen ook voortvloeien uit copyright of auteursrechtelijke bepalingen.
Eventuele beperkingen die al tijdens de publicatie op de website golden, dienen in metadata te zijn vastgelegd.
Beschikbaarheid De fysieke mogelijkheid om het informatie-object te kunnen raadplegen
4.3.3.3
Beschikbaarheid heeft betrekking op de fysieke mogelijkheid tot raadplegen, niet alleen moet de informatie vindbaar blijven en ophaalbaar zijn, maar ook aan de gebruiker kunnen worden aangeboden. Het archiveringssysteem is daarvoor verantwoordelijk.
Begrijpelijkheid
Definitie De inhoud wordt in een zodanige vorm gepresenteerd dat de gebruiker de tekst of afbeelding kan lezen en de inhoud kan interpreteren. (Zowel op syntactisch als op semantisch niveau)
Attributen
Vereisten
Opmerkingen
Leesbaarheid De gebruiker kan het gevonden informatie-object lezen.
•
Voor een groot deel betreft de eis het archiveringssysteem, niet de website. De webrichtlijn om inhoud en structuur van de layout te scheiden, ondersteunt overigens deze eis. Voor het leesbaar zijn is hardware en software noodzakelijk. Het archiveringssysteem is verantwoordelijk voor de duurzame leesbaarheid van de gearchiveeerde informatie. De wijze waarop het systeem dat vormgeeft moet expliciet zijn vastgelegd. De maker is primair verantwoordelijk voor de creatie
Interpreteerbaarheid • Het gevonden informatie-object is
De informatie-objecten worden in een zodanig formaat opgeslagen dat ze door algemeen beschikbare browsers leesbaar kunnen worden gemaakt
Dit vereist metadata over herkomst (Actor, website) en
Uitgaande van de veronderstelling dat persoonlijke informatie die door individuen via de website aan overheidsorganen wordt verstrekt, elders gearchiveerd wordt.
25
25
door een gebruiker in de oorspronkelijke context plaatsen.
Bedrijfsproces (handeling).
van documenten die correct zijn te interpreteren. Voor het behoud van interpreteerbaarheid is het archiveringssysteem verantwoordelijk; dit zal in de regel contextuele informatie toevoegen. Die contextuele informatie moet zijn opgeslagen in de metadata.
4.3.4
Beheerbaarheid
NB Dus niet: “beheersbaar”. Definitie Informatie is beheerbaar (duurzaam) wanneer het archiveringssysteem technisch en financieel in staat is de gewenste kwaliteit van het archiefsysteem te behouden. De vooronderstelling is dat digitale documenten (of aggregaten) zodanig complex kunnen zijn dat het archiveringssysteem niet in staat is, hetzij door technische, hetzij door financiële beperkingen, deze duurzaam te beheren volgens de eisen die behoud van integriteit en verzekering van toegankelijkheid daaraan stellen. Het is dus zaak voor een organisatie beheerbare documenten te maken, dan wel de eisen ten aanzien van. integriteit en toegankelijkheid bij te stellen. 4.3.4.1
Adresseerbaarheid
Definitie: een document is adresseerbaar wanneer het van een persistente en unieke identificatie is voorzien. Attributen
Vereisten
Opmerkingen
Adresseerbaarheid Van een persistente en unieke identificatie te voorzien
•
Ook noodzakelijk voor een duurzame vindbaarheid.
4.3.4.2
Beveiligbaarheid
Als geheel herkenbare eenheid voorzien van een unieke persistent identifier.
De eis betekent dat de te archiveren informatie als een object herkenbaar moet zijn.
26
Definitie: te beschermen tegen ongeoorloofde raadpleging en te beveiligen tegen verlies of verminking. Attributen
Vereisten
Opmerkingen
Beveiligbaarheid Bescherming tegen dat wat niet geoorloofd is (raadpleging, verwijdering of wijziging).
•
Eventueel moeten ook delen uit documenten af te schermen zijn tegen ongeoorloofd raadplegen. (Zie Pittsburgh: redactable). Zie echter de eerder opmerkingen bij openbaarheid. Voor webinformatie is bescherming tegen ongeoorloofde raadpleging niet relevant.
4.3.4.3
Het is niet mogelijk om de informatie buiten de toegangsregels van het archiveringssysteem om te benaderen.
Verwijderbaarheid
Definitie: De mogelijkheid een document van de website te verwijderen en naar een archiveringssysteem over te brengen. Toelichting: Dezelfde eis wordt ook aan het archiveringssysteem gesteld. Attributen
Vereisten
Opmerkingen
•
Voor de noodzakelijke metadata is de maker primair verantwoordelijk.
•
•
•
Informatie-objecten kunnen afzonderlijk van de website worden verwijderd en gearchiveerd, wanneer de actualiteit is verstreken. Wanneer de website in zijn geheel uit de lucht gaat, worden alle daarvoor in aanmerking komende informatie-objecten gearchiveerd. Het is mogelijk om gearchiveerde informatie te verwijderen wanneer de bewaartermijn is verstreken. Afhankelijk van de selectiemethode zullen daarvoor Handeling of onderwerp en datum de benodigde metadata zijn.
Verwijdering kan ook plaats vinden geruime tijd nadat de informatie al van de website is gehaald en gearchiveerd. Verwijderbaarheid impliceert adresseerbaarheid. Expliciet vastleggen van de regels en criteria! – Dit valt buiten het ontwepr van de website. Is op systeemniveau.
27
4.3.4.4
Onderhoudbaarheid
Definitie: De mate waarin het document het archiveringssysteem in staat stelt de noodzakelijke kwaliteit van de documenten langdurig te behouden. Toelichting: de eis is pragmatisch; als de te archiveren informatie zeer/onnodig complex van structuur is, is het wellicht voor het archiveringssysteem vrijwel onmogelijk de longevity te garanderen, tenzij wellicht tegen hoge kosten. Dus een oproep het niet moeilijker te maken dan nodig is. Concept ontleend aan InterPares-1 Preservation Taskforce model. Attributen
Vereisten
Opmerkingen
Onderhoudbaarheid
•
Niet genoemd in de brondocumenten Onderhoudbaarheid is relatief, het hangt af van de eisen die aan met name behoud van fysieke vorm gesteld worden.
•
Mogelijkheid tot opslaan als een adresseerbaar informatieobject. Onderhoudbare vorm
Het is duidelijk dat wanneer informatie niet onderhoudbaar is om technische of financiële redenen, van effectieve archivering geen sprake kan zijn. Bij het ontwerpen van websites moet met de onderhoudbaarheid rekening worden gehouden.
28
5
Duurzame toegankelijkheid door archivering / opties voor archivering
5.1
Inleiding
Websites zijn een tamelijk nieuw fenomeen, net als de archivering ervan. De overheidswebsite, waartoe dit onderzoek zich beperkt, bevindt zich op het grensvlak tussen overheidsorganisatie en maatschappij. Het is een transmissiemedium dat een knoop is in het wereldwijde web, maar ook in het lokale netwerk. Daar liggen de kansen, maar ook de risico’s. Het unieke en efemere karakter maakt websites kwetsbaar, ze veranderen snel, de levensduur is kort. Op websites gepubliceerde informatie verdwijnt of is eenvoudigweg niet meer vindbaar. Dit is bijvoorbeeld een groot probleem in de academische wereld waar in publicaties steeds meer verwezen wordt naar websites en andere digitale publicaties. Maar ook burgers moeten er op kunnen vertrouwen dat ze overheidsinformatie kunnen (blijven) vinden, ook wanneer deze haar directe actuele betekenis heeft verloren. De derde deelvraag van dit theoretisch onderzoek behelst dan ook te inventariseren wat de opties voor archivering van websites zijn. Achterliggende gedachte is dat concepten en uitgangspunten voor archivering de duurzame toegankelijkheid van informatie ondersteunt. De website moet dan wel zo zijn opgebouwd dat archivering, zowel intellectueel als technisch, mogelijk is. Misschien is zelfs de tem ‘archiveren’ misleidend, het impliceert bevriezen van de informatie terwijl websites juist flexibel, dynamisch, actueel, etc. zijn. Waarom zou je de informatie duurzaam toegankelijk willen houden? Hoe kan archiveren daaraan bijdragen? Dit zijn de centrale vragen van paragraaf 5.2. Paragraaf 5.3 werkt dit uit naar een implementatie van websitearchivering in organisaties. Beide paragrafen leveren aanvullende eisen aan het ontwerp van websites, maar vooral richtlijnen voor het beheer van gearchiveerde websites. 5.2
Duurzame toegankelijkheid door archivering
5.2.1
Websites als unieke informatiebron
De vraag waarom je informatie op websites duurzaam toegankelijk zou willen houden heeft te maken met de functie en de waarde van die informatie26. Het gaat hier om de waarde voor de burger, maar ook om de waarde voor de overheidsinstelling die de website publiceert. Websites hebben vooral informatieve waarde, of het nu om voorlichtingsinformatie van (overheids)organisaties gaat of om sites over fietsen in China, websites zijn een belangrijke informatiebron. In de beginjaren van het World Wide Web was de website vaak nog een zie hiervoor ook de publicaties van het DAVID-project, bijvoorbeeld Filip Boudrez en Inge Schoups ‘Duurzame en archiveerbare websites’ in Praktijkgids management lokale besturen juni 2005 26
29
aanvulling op andere informatiebronnen en werd dezelfde informatie ook (of vooral) via traditionele papieren informatiebronnen verspreid. De huidige websites zijn vaak unieke informatiebronnen, waarvan de informatie niet in andere vorm beschikbaar is. De verandersnelheid van het World Wide Web bedreigt deze beschikbaarheid, zoals het voorbeeld hierboven over academische publicaties aantoont. Naast ‘actuele’ informatiebronnen met informatie over openingstijden, beleidsinformatie, vacatures, recente publicaties, vakantietips, etc. zijn websites relevante primaire bronnen geworden voor alle mogelijke onderzoeksdomeinen (historisch, sociologisch, cultureelantropologisch, etc). Je ziet dan ook dat veel website-archiveringsinitiatieven27 gericht zijn op het behoud en documenteren van deze bronnen. Een bekend Nederlands voorbeeld is Archipol, de verzameling websites van de Nederlandse politieke partijen. Het Documentatiecentrum voor de Nederlandse Politieke Partijen is enige jaren geleden gestart met het verzamelen van kopieën van deze politieke sites, na de constatering dat de reguliere informatiebronnen (de schriftelijke publicaties) door politieke partijen werden vervangen door websites (die natuurlijk zo actueel mogelijk zijn) en digitale nieuwsbrieven. Nu kopieert het DNPP periodiek de verschillende websites en maakt het DNPP extra kopieën bij actuele ontwikkelingen in de samenleving (zoals verkiezingen, maar ook direct na de moord op Pim Fortuyn). Ook de Koninklijke Bibliotheek en een aantal archiefdiensten (Amsterdam, Rotterdam) willen vanuit dergelijke overwegingen websites verzamelen. De snelle ontwikkelingen in websites maken dat de websites ondertussen meer zijn geworden dan alleen een bron van informatie. De websites en het World Wide Web zelf zijn object van onderzoek geworden. Een website van tien jaar geleden is nauwelijks nog te vergelijken met een hedendaagse website: de verandering van een eenvoudige HTML-pagina met informatie over bijvoorbeeld openingstijden naar interactieve pagina’s opgebouwd uit een CMS en ter ondersteuning van alle mogelijke werkprocessen in de organisatie. Ook het aantal websites en het gebruik van websites is enorm gegroeid en heeft z’n sporen nagelaten in de manier waarop mensen omgaan met informatie. Maar websites zijn ook meer dan informatiebronnen, webdesign wordt tot een eigen kunststroming. Websites hebben dus een historische en een culturele waarde gekregen, ze horen tot het erfgoed van een gemeenschap. Ze worden in het Unesco ‘Charter on the Preservation of Digital Heritage’28 art. 1 expliciet tot het digitaal erfgoed gerekend: Digital materials include texts, databases, still and moving images, audio, graphics, software and web pages, among a wide and growing range of formats. They are frequently ephemeral, and require purposeful production, maintenance and management to be retained”. Dit digitaal erfgoed dient toegankelijk te blijven voor toekomstige generaties en moet gevrijwaard blijven van verlies ten gevolge van technologische veroudering en andere risico’s (art. 2 en 3). De informatieve waarde van websites en het belang als cultureel erfgoed zijn twee belangrijke argumenten voor het duurzaam toegankelijk houden van websites. Voor Voor een overzicht van deze initiatieven, zie de bibliografie over websitearchivering Eerste Hulp bij Websitearchivering 28 Unesco Charter on the Preservation of Digital Heritage (oktober 2003) Via: http://portal.unesco.org/en/ev.phpURL_ID=17721&URL_DO=DO_TOPIC&URL_SECTION=201.html 27
30
overheidsorganisaties29 is een derde overweging eigenlijk net zo belangrijk, of misschien zelfs van primair belang. Zoals in hoofdstuk 2 aangegeven zijn websites instrumenten in het vormgeven van de elektronische overheid. De burger krijgt via de website toegang tot alle voor hen relevante overheidsinformatie, gebruik maken van de diensten die daar aangeboden worden, vragen stellen, etc. Dat betekent dat de burger aan die website rechten kan ontlenen, “het stond immers op de website”.30 De overheid moet zich dus kunnen verantwoorden over de informatie en diensten die zij via haar websites aanbiedt. Dat betekent dat overheidsorganisaties er zorg voor moeten dragen dat de informatie die zij via websites verspreidt vindbaar en leesbaar is én blijft, en wel in dusdanige vorm (integer, betrouwbaar en authentiek) dat de burger de bewuste informatie ook vertrouwt. De Raad voor Cultuur heeft hierover in 2002 een uitspraak gedaan in het advies over de ontwerp-selectielijst Overheidsinformatievoorziening: “De Raad is van mening dat van alle producten van overheidsinformatievoorziening die (onder andere) op burgers zijn gericht, een exemplaar van (alle versies van) het eindproduct bewaard zou moeten blijven.” 31 Met deze uitspraak stelt de Raad voor Cultuur zich op het standpunt dat websites onder de reikwijdte van de Archiefwet 1995 vallen. Aandacht voor de duurzame toegankelijkheid van websites kan dus vanuit verschillende invalshoeken worden gemotiveerd. Ze bevatten informatie die op korte of lange termijn van belang kan zijn voor de beantwoording van hele verschillende onderzoeksvragen. Aan die informatie kunnen rechten ontleend worden, wat dus betekent dat de organisatie die de informatie publiceert daarover verantwoording af moet kunnen leggen. En inmiddels horen ze tot het digitaal erfgoed, zowel op basis van inhoud als vormgeving als functie en gebruik. Archivering kan zorgen voor de duurzame toegankelijkheid van deze websites. 5.2.2
Archiveringssysteem
In recente archivistische publicaties32 wordt archivering beschouwd als een systeem: het archiveringssysteem. Het archiveringssysteem is geen concreet systeem, maar een concept dat zo volledig mogelijk beschrijft welke activiteiten een organisatie moet ontplooien om haar archieven beschikbaar te hebben, met alles wat daarvoor nodig is: de procedures, methoden, middelen etc. Dit systeem heeft drie kerntaken: duurzaam bewaren van informatie, behouden van de kwaliteit van die informatie en beschikbaar stellen van de informatie. Een archiveringssysteem is beschreven als ‘het geheel van procedures, methoden, kennis, mensen, middelen en 29 Deze overweging geldt natuurlijk voor alle organisaties en personen die informatie via een website publiceren, de ICTU webrichtlijnen hebben echter primair de overheidsorganisaties als doelgroep. 30 Een disclaimer, zoals in sommige gevallen voorkomt op een website, lijkt dan ook niet houdbaar. 31 Advies Raad voor Cultuur over Ontwerp-selectielijst overheidsinformatievoorziening over de periode 1945-1999 arc-2002.4316/2. De Raad voor Cultuur vindt de bedoelde ontwerp-selectielijst niet consistent als het gaat om toekennen van bewaartermijnen aan websites ‘(…) want de ontwikkeling van de website overheid.nl wordt wel voorgedragen voor bewaring, terwijl de neerslag van het ontwikkelen van een website voor de rijksoverheid waar informatie-, communicatie- en transactiediensten worden aangeboden volgens de lijst na 5 jaar vernietigbaar is’. 32 P.J. Horsman Archiveren. Een inleiding (’s-Gravenhage, 2004). ISO-NEN 15489:2001 spreekt van ‘archiefsysteem’ (vertaling van ‘record system’).
31
documenten, waarmee een persoon of een samenwerkingsverband van personen (een organisatie) de archiveringsfunctie vorm geeft’. Deze archiveringsfunctie is gedefinieerd als een persoonlijke of organisatorische functie met als doel het beheer en de beschikbaarstelling van procesgebonden informatie die de persoon of organisatie nodig heeft voor de uitvoering van haar taken of het afleggen van verantwoording. Deze archiveringsfunctie bestaat uit een aantal processen, algemeen te typeren als invoer, uitvoer, verwerkings- en besturingsprocessen. Invoer Het primaire invoerproces is opnemen van documenten in het systeem. Dit proces heeft als taak ervoor te zorgen dat de informatie onder controle komt van het archiveringssysteem. Het zorgt ervoor dat informatie beheerd kan worden en niet spoorloos verdwijnt. Het systeem weet dat het document bestaat, waar het is en het kent zijn kwaliteit en status. Opnemen wordt gerealiseerd door de verwerkingsprocessen registratie (registreren van de archiefstukken) en opslaan (fysiek toevoegen van documenten aan een archief). Uitvoer Het primaire uitvoerproces is beschikbaar stellen. Beschikbaarstelling zorgt ervoor dat wie informatie uit het archiefsysteem nodig heeft, de juiste documenten krijgt – tenminste als hij of zij tot raadpleging ervan bevoegd is. De verwerkingsprocessen ordenen, beschrijven, en bewaren maken dit proces mogelijk. Het proces ordenen legt relaties tussen documenten onderling en vooral tussen documenten en processen of zaken. Een classificatiesysteem geeft uitdrukking aan de ordening. Beschrijven is het (beknopt) weergeven in tekstuele vorm van kenmerken van archiefdocumenten, groepen van archiefdocumenten, hun onderlinge samenhang (structuur) en de context waarin ze zijn gegenereerd en gebruikt. Ordenen en beschrijven maken documenten vindbaar, maar ook interpreteerbaar en waardeerbaar. Het proces bewaren zorgt voor het behoud van de noodzakelijke kwaliteit van de documenten, hun authenticiteit, leesbaarheid, toegankelijkheid en fysieke conditie. Hier ligt een nauwe relatie met (informatie)beveiliging, het archief moet beschermd worden tegen wijziging, manipulatie en ongeoorloofde vernietiging. Het tweede uitvoerproces is verwijderen, voorafgegaan door waarderen en selecteren. Deze processen hebben als doel het bepalen hoe lang archiefdocumenten bewaard moeten worden en de redenen daarvoor, de administratieve verwerking van de waardering en de daadwerkelijke uitvoering van de bewaartermijn door verwijdering uit het archiveringssysteem.
32
Waarderen 33 is het toekennen van waarde aan documenten op verschillende momenten en binnen verschillende processen. Enerzijds is dit het bepalen welke documenten als archiefbescheiden moeten worden aangemerkt en in het archiveringssysteem moeten worden opgenomen. Anderzijds bepalen welke archiefbescheiden voor tijdelijke dan wel blijvende bewaring in aanmerking komen, al dan niet onder toekenning van bewaartermijnen. Het proces selectie regelt de administratieve verwerking van de tijdens het proces van waardering gemaakte keuzes door archivistische metadata aan de stukken toe te kennen. Verwijderen is het daadwerkelijk logisch en fysiek scheiden van de te bewaren en de te vernietigen stukken. Natuurlijk gevolgd door de daadwerkelijke vernietiging, het bewaren en eventueel het overdragen van archieven aan een archiefbewaarplaats (voor langdurige bewaring). Besturing Zoals elk systeem heeft het archiveringssysteem besturing nodig. van de beschikbaarheid van ‘resources’. Besturing bestaat uit het formuleren van informatie- en archiefbeleid, het bepalen van verantwoordelijkheden en het toedelen van middelen en voldoende en deskundig personeel.
5.3
Implementatie van archivering
5.3.1
Archiveringfuncties toegepast op websites
Archivering heeft tot doel informatie duurzaam beschikbaar te houden. Het toepassen van concepten en uitgangspunten van archivering in het ontwerp en beheer van websites draagt bij aan de duurzame toegankelijkheid van websites voor alle bezoekers. In de vorige hoofdstukken hebben we impliciet al een keuze gemaakt dat niet de website zelf wordt gearchiveerd, maar datgene dat er op gepubliceerd wordt. We hanteerden daarvoor de neutrale term informatie-object en hebben daarvan gesteld dat de ideale situatie is dat webpagina en informatie-object overeen komen. Implementatie van websitearchivering heeft betrekking op de besturing van het archiveringssysteem en de archiveringsfuncties waarderen & selecteren, beschikbaar stellen, beheren en opnemen. Hieronder is dit verder uitgewerkt. 5.3.1.1
Besturing
Formuleer een archiveringsbeleid voor de websites van de organisatie, hierin zijn opgenomen een beleidsstandpunt en worden verantwoordelijken voor website-archivering benoemd. Dit kan een afzonderlijk beleidsstandpunt voor websites zijn, maar integratie in bestaand informatie- en archiefbeleid valt aan te bevelen. Archivering van websites is immers geen op De definities voor de processen waarderen, selecteren en verwijderen zijn overgenomen uit Hans Waalwijk “Een bouwsteen voor de toren van Babel” in: dr. P. Brood e.a. red Selectie. Waardering, selectie en acquisitie van archieven (S@P jaarboek 2004, ’s-Gravenhage, 2005) p. 67 33
33
zichzelf staande activiteit, websites maken deel uit van de totale informatievoorziening binnen de organisatie. ISO-NEN 15489:2001 geeft nadere richtlijnen voor informatie- en archiefmanagement. Van belang is dat het informatie- archiefbeleid, het beleid voor ontwerp & beheer van websites en eventueel ook het communicatiebeleid op elkaar afgestemd zijn. Benoem ook de verantwoordelijken voor website archivering. Deze verantwoordelijkheid kan in de Documentaire Informatievoorziening gesitueerd zijn, maar de verantwoordelijkheid kan natuurlijk ook aan een webmaster worden opgedragen, maar dan met een bredere verantwoordelijkheid. Een aandachtspunt is de verandersnelheid van websites, vooral in relatie tot risicomanagement. Bij veranderingen waardoor informatie van de website verdwijnt (ook bij wijziging van bijvoorbeeld teksten) moeten maatregelen genomen worden om die informatie beschikbaar te houden. Best practice is dat deze informatie ‘bevroren’ wordt in een separaat archief met websites. De organisatie dient een archiveringsstrategie (of mengsel van verschillende strategieën) te bepalen voor het ‘bevriezen’ van de website. (zie ook paragraaf 5.3.2). Pas tot slot het vigerende beleid met betrekking tot selectie, ordening etc. toe op de website.
5.3.1.2
Archiveringsfuncties
Beschikbaarstellen. Beschikbaarstelling zorgt ervoor dat wie informatie uit het archiefsysteem nodig heeft, de juiste documenten krijgt – tenminste als hij of zij tot raadpleging ervan bevoegd is. Ordenen en beschrijven zijn de verwerkingsprocessen die dit ondersteunen. Voor websites betekent dit: • De informatie op de website is en blijft toegankelijk voor alle internetgebruikers, tot het moment dat deze informatie op basis van een selectielijst vernietigd wordt. De integriteit, authenticiteit en betrouwbaarheid blijft in tact, zodat de gebruiker de website kan vertrouwen. De informatie wordt gepresenteerd in de juiste context, zodat de gebruiker de informatie kan interpreteren en waarderen. • De pagina’s zijn vindbaar op basis van de oorspronkelijke URL en/of een index en/of een classificatie. • Als de informatie niet meer openbaar is kan gewerkt worden met wachtwoorden (zoals door Archipol gedaan wordt). • Bij internetgebruikers kan verwarring ontstaan als zowel contemporaine als gearchiveerde informatie beschikbaar is. Gearchiveerde websites lijken (natuurlijk) in vorm en structuur sterk op contemporaine websites. In het ontwerp van de website moet dit onderscheid aangebracht worden. • De relatie tussen de website en de processen waarbij zij ontstaan en/of gebruikt worden moet gelegd worden, net als de relatie tussen de website en andere archieven. Dat kan “in” de website (via het toevoegen van metadata), maar ook separaat van de website (in een apart document). Het website ontwerp moet wel de mogelijkheid bieden om een relatie te leggen met de context. • Aan de website moeten beschrijvingsgegevens toegevoegd kunnen worden over ontstaan en beheer van de website.
34
•
Aan de website moeten beschrijvingsgegevens toegevoegd kunnen worden die de relaties naar andere bestanden duidelijk maken.
Waarderen, selecteren en verwijderen Deze processen hebben als doel het bepalen hoe lang archiefdocumenten bewaard moeten worden en de redenen daarvoor en de administratieve verwerking van de waardering. Het bepalen van bewaartermijnen valt buiten de directe archivering, hiervoor kan de organisatie terugvallen op het geldende selectie-instrumentarium. Mocht dit niet aanwezig zijn, of mocht dit zich niet uitstrekken over websites, dan moeten de bewaartermijnen nog worden bepaald. Websites die in aanmerking komen voor permanente bewaring moeten overgedragen kunnen worden aan een archiefbewaarplaats. Voor websites betekent dit: • De bewaartermijn van websites moet, conform de binnen de organisatie geldende richtlijnen voor waardering en selectie, bepaald worden. • De website moet bestaan uit waardeerbare eenheden (pagina’s, sub-sites, thema’s). • De bewaartermijnen worden expliciet vermeld op de website of in de metadata. • De website, of delen van de website, moeten vernietigd kunnen worden als dit op basis van een selectielijst moet. o vernietiging dient onherroepelijk te zijn (ook de back-up dient vernietigd te worden) o Ongeoorloofde vernietiging mag niet plaats vinden. • De website, of delen van de website, moeten aan een andere organisatie (bijvoorbeeld een archiefbewaarplaats) overgedragen kunnen worden. o Dus de website moet “fysiek” ergens anders opgeslagen kunnen worden, geëxporteerd kunnen worden naar een andere beheersomgeving. Zie hiervoor ook proces opslag. o Rechten moeten overgedragen worden, zowel eigendomsrechten, maar ook beheersaspecten. Opname Opname zorgt ervoor dat de websites onder controle van het archiveringssysteem komen. Het zorgt ervoor dat informatie beheerd kan worden en niet spoorloos verdwijnt. Het systeem weet dat het document bestaat, waar het is en het kent zijn kwaliteit en status. Registratie en opslag zijn de twee belangrijke verwerkingprocessen die dit mogelijk maken. Bij websites kan opname op twee manieren geïmplementeerd worden. Allereerst betekent dit dat de contemporaine website tevens de ‘gearchiveerde’ website is. Dit kan alleen bij websites waar alleen informatie aan wordt toegevoegd. Bij een wijziging van inhoud of structuur van de website, waardoor niet is te achterhalen wat de informatie op een bepaald moment was, kan opname gerealiseerd worden door de opslag van een bevroren versie van de website in een ‘website-archief’. De website moet dergelijke export wel mogelijk maken. Paragraaf 5.3 .. geeft een overzicht van strategieën voor de export van een bevroren versie van de website. Voor websites betekent dit: • Zorg voor een overzicht van websites met te archiveren informatie-objecten. Hiermee geeft de organisatie ook uitvoering aan de Regeling geordende en toegankelijke staat, 2000.
35
• •
• •
•
Aan ieder informatie-object worden metadata toegevoegd over moment van publicatie, verantwoordelijke voor publicatie, organisatie en werkproces waar de website een functie bij vervult. De website in zijn geheel of afzonderlijke webpagina’s moeten te exporteren zijn naar een andere omgeving. Dus o Geen snapshot bescherming (tegen robots, crawlers) o Gebruik van persistente identificatie (methode van unieke adresseerbaarheid) Opslag in een andere omgeving betekent dat de URL aangepast moet worden. In deze URL kan ook de datum en tijdstip van opname in het webarchief worden verwerkt. Deze export zorgt voor dat naast de contemporaine website een ‘archief’ van gearchiveerde informatie-objecten ontstaat dat via de oorspronkelijke website benaderbaar is. De relatie tussen archief en website moet dus vastgelegd worden. Bij het ontwerp van de website moet er rekening mee gehouden worden dat vanuit de contemporaine website een relatie gelegd kan worden naar het betreffende gearchiveerde deel van de website. Na export naar een ‘website-archief’ moet de relatie tussen contemporaine en gearchiveerde worden gelegd.
Bewaren / beheren: Het zorgen voor het behoud van de noodzakelijke kwaliteit van de documenten, hun authenticiteit, leesbaarheid, toegankelijkheid en fysieke conditie. Toepassing: • De website moeten beschermd worden tegen wijziging, manipulatie en ongeoorloofde vernietiging van (delen van) de website. • De website valt ook onder regels voor informatiebeveiliging. • Mocht de website gewijzigd worden, dan moet deze wijziging gedocumenteerd worden. • De website moet zodanig zijn vormgegeven, dat lange termijn bewaring en toekomstige toegankelijkheid van de informatie mogelijk is, eventueel in een andere omgeving. • De website moet, indien nodig, “fysiek” ergens anders opgeslagen kunnen worden, geëxporteerd kunnen worden naar een andere beheeromgeving. Zie hiervoor ook proces opslag.
5.3.2
Bestaande implementatiestrategieën: best practices voor ‘bevriezen’
Wereldwijd zijn sinds 1996 initiatieven34 ontplooid om websites te verzamelen en beschikbaar te houden. Deze initiatieven gaan in de meeste gevallen uit van het bevriezen van websites in een separaat archief met websites. De strategieën variëren van geteste strategieën (zoals het maken van snapshots) tot ideeën (printen van de inhoud van de site). Deze paragraaf heeft niet tot doel de verschillende strategieën te bediscussiëren en “de beste” strategie te bepalen of de mogelijkheden van het combineren van strategieën te onderzoeken. Dat hoort niet tot de reikwijdte van het ICTU-project. De verschillende benaderingen zijn daarvoor, ook al zijn zij getest, nog te experimenteel. De achterliggende gedachte is dat een gekozen strategie eisen stelt aan het ontwerp van een website. Een overzicht van deze initiatieven is opgenomen in de bibliografie websitearchivering Eerste Hulp bij website archivering 34
36
De verschillende strategieën zijn als volgt te groeperen: • Het archiveren van de bron • Het archiveren van het eindproduct • Het archiveren van de interactie tussen internetgebruiker en site De eerste twee archiveringsstrategieën (respectievelijk archiveren van de bron en archiveren van het eindproduct) worden ook wel object georiënteerde strategieën genoemd. Deze zijn er op gericht om de ‘objecten’, bijvoorbeeld dat wat op het scherm verschijnt, te bewaren. Bijvoorbeeld door periodiek snapshots te maken, of door bronbestanden te archiveren. Deze strategie is gericht op de inhoud en structuur van een site (het object) op een bepaald moment in tijd. In beide gevallen kan zowel volstaan worden met archivering van de volledige site op een bepaald moment, of alleen het archiveren van de wijzigingen of veranderingen in de site. De derde strategie, gericht op het registreren van de interactie, wordt ook wel ‘event’ georiënteerde strategie genoemd en is geformuleerd door het Australische Nationaal Archief35. 5.3.2.1 Het archiveren van de bron Archiveren van losse data elementen De eerste optie betreft het archiveren van de inhoud van de website, dus de losse inhoudelijke elementen als tekstbestanden of afbeeldingen. Hierbij worden structuur, context en functionaliteiten niet gearchiveerd. Archivering kan digitaal, als losse documentjes, of via een papieren print. Hoewel als voordeel genoemd kan worden dat dit de meest eenvoudige vorm van archiveren lijkt, zijn de nadelen van deze strategie enorm. De inhoudelijke elementen verliezen hun onderlinge samenhang, functionaliteiten, context, etc. De complexiteit van websites, die zoals eerder aangegeven een belangrijk element van websites is, raakt volledig zoek. Mirror van bronbestanden Een andere variant is het maken van een volledige kopie van alle bronbestanden op een webserver. De structuur en de onderlinge relaties, via links, blijven intact. DAVID36 beschrijft dat dit kan door een kopie te maken van alle bestanden of door een FTPprogramma te gebruiken. Deze strategie kan alleen uitgevoerd worden door de eigenaar / beheerder van een website. Archivering door een ander is alleen mogelijk als hij/zij toegang heeft tot de webserver, bestanden die niet op een eigen server staan worden niet adequaat gearchiveerd. Archiveren van de database NAA Archiving Web Resources: Guidelines for Keeping Records of Web-bases Activity in the Commonwealth Government (Maart 2001) via: http://www.naa.gov.au/recordkeeping/er/web_records/intro.html 2802-2005 36 F. Boudrez, S. van den Eynde DAVID, archivering van websites (Antwerpen - Leuven, mei 2002) Via http://www.antwerpen.be/david/website/default.htm 28-02-2005 Verder uitgewerkt in: 35
F. Boudrez Archivering van websites: een kwestie van waardering en ‘capture’ (Antwerpen, 2005) via http://www.antwerpen.be/david 28-02-2005
37
Deze strategie komt voort uit het denken over de archivering van databases37. Kenmerk van deze strategie is dat er één database is, waarin zowel actuele als oude informatie is opgenomen. De inhoud van de website wordt dus gegenereerd vanuit de database. Wijzigingen in de website worden als nieuwe records toegevoegd aan de database. Versiebeheer speelt een grote rol. Van belang is dat op ieder moment door iedere mogelijke bezoeker van de website de “oude pagina’s” opgeroepen kunnen worden. 5.3.2.2 Het archiveren van het eindproduct Snapshots De snapshot strategie is momenteel de meest gebruikte vorm om websites te archiveren38. Het is een object georiënteerde strategie Net als een mirror is een snapshot een kopie van een website. Het verschil met een mirror is, dat een mirror een kopie is van de bronbestanden en een snapshot een kopie is van het zichtbare eindproduct: de website zoals die gepresenteerd wordt via een browser. Mocht een website opgebouwd zijn uit bestanden die afkomstig zijn uit verschillende bronnen, dan worden deze wel allemaal gekopieerd. Voordeel van deze strategie is dat deze het mogelijk maakt om kopieën te maken zonder daadwerkelijk toegang te krijgen tot de webserver. Websites die beschermd zijn tegen het maken van kopieën (robot.txt) vallen buiten het bereik van snapshots. De snapshots worden gemaakt door middel van een programma39 dat een kopie van de website per ingegeven URL volledig automatisch wegschrijft naar een andere server. Een veel gebruikt programma is HTTrack, maar er zijn ook andere programma’s in omloop.40 Film Het DAVID-project heeft als alternatieve methode voor archivering de verfilming van een website met een screenrecorder gedefinieerd. Een screenrecorder registreert de webpagina’s en instructies tijdens een surfsessie. De screenrecorder maakt opname van de bezochte pagina’s en exporteert deze naar een videobestand. Deze aanpak is geschikt voor websites die niet op een platformonafhankelijke wijze archiveerbaar zijn en voor websites die niet via een mirror of snapshot gearchiveerd kunnen worden. De film is in staat de ‘look and feel’ van de website goed vast te leggen. Aangezien deze vorm volledig aan de buitenkant van de website blijft, de screenrecorder maakt immers een afbeelding van wat op het scherm gebeurt, levert deze methode geen eisen aan het ontwerp van een website. Print op papier of in pdf
Zie bijvoorbeeld G.J. van Bussel ‘Archivering van databases: een complex onderwerp’ in Archos Magazine 4 (2003) p. 13 – 15. 38 Bijvoorbeeld door The Internet Archive, Minerva, Archipol, Kulturarw3, etc. Zie hiervoor ook de bibliografie websitearchivering Eerste Hulp bij Websitearchiverivering (versie maart 2005). 39 webcrawlers, off line browser, webharvester genoemd. 40 Voor een overzicht zie bijvoorbeeld: Ir. Hans Verhoeven Archiving web publications (IBM/Koninklijke bibliotheek, Den Haag, december 2002) via: http://www.kb.nl/hrd/dd/dd_onderzoek/summary_ltpstudy6.html 28-02-2005 of Niels Brügger Archiving websites. General Considerations and strategies (Aarhus, The Centre for Internet Research, 2005) 37
38
Voor de archivering van websites wordt in theorie nog wel eens gewezen op de mogelijkheid om het eindproduct in pdf op te slaan of te printen op papier. Printen op papier heeft geen voorkeur, de website verliest daarbij originele eigenschappen en functionaliteiten. DAVID verwijst nog naar het opslaan in pdf. “Een bijzondere capturetechniek voor websites wordt door Adobe’s Acrobatprogramma geboden. Met dit programma is het mogelijk om een website als een PDF-bestand op te slaan, waarbij de hyperlinks in bookmarks worden omgezet. Het spreekt voor zich dat archiveren als hard copy functionaliteits- en vormverlies met zich mee brengt en dat de broncode niet wordt vastgelegd. Deze techniek is wel opmerkelijk sneller dan het off line plaatsen van een website, maar kan eigenlijk enkel worden gebruikt om de informatie op een snelle manier vast te leggen.”41 5.3.2.3 Het archiveren van de interactie Het Australische nationaal archief (NAA) maakt onderscheid in strategieën die objecten archiveren (zoals bijvoorbeeld de hierboven genoemde snapshot strategie) en strategieën die gericht zijn op het archiveren van de interactie tussen gebruiker en informatie. Het NAA stelt voor dat daarbij de volgende gegevens worden geregistreerd: • Datum en tijdstip van de interactie; • IP of domeinadres van de gebruiker; • Gebruikersprofiel (user profile); • De query; • De gepresenteerde informatie met relevante metadata.42 Deze strategie is uitgewerkt door Ken Fitch in pageVault, een tool die iedere interactie in de website registreert en opneemt in een seperaat web-archief. Het ondersteunt dus vragen als “hoe zag deze pagina er op 4 mei 9.30 uur vorig jaar uit?”, “hoe vaak is deze pagina’s gewijzigd in de afgelopen 6 maanden?”, “hoe hebben wij gereageerd op zoekvragen waarin term ‘X’ wat opgenomen?”, “de inhoud van deze URL is veranderd, ik wil de versie van 17 augustus”, etc. 43 5.3.2.4 Dateren van de pagina’s Een nieuwe, voor zover bekend nog niet toegepaste, strategie is gebaseerd op metadata. Door van elke pagina de geschiedenis bij te houden is later de site van een bepaald moment uit het verleden te 'emuleren'. Voorwaarde is dan wel dat al bij de bouw van de webapplicatie software is ingebouwd die automatisch de geschiedenis van elke pagina bijhoudt. Dit rapport F. Boudrez, S. van den Eynde DAVID, archivering van websites (Antwerpen - Leuven, mei 2002) p. 42 en ook noot 42 bij deze pagina. Via http://www.antwerpen.be/david 42 NAA Archiving Web Resources: a policy for Keeping Records of Web-bases Activity in the Commonwealth Government (januari 2001) via: http://www.naa.gov.au/recordkeeping/er/web_records/intro.html 2802-2005 NAA Archiving Web Resources: Guidelines for Keeping Records of Web-bases Activity in the Commonwealth Government (Maart 2001) via: http://www.naa.gov.au/recordkeeping/er/web_records/intro.html 2802-2005 43 Ken Fitch Web site archiving – an approach to recording every materially defferent response produces by a website via: http://ausweb.scu.edu.au/aw03/papers/fitch 11-03-2005 http://www.projectcomputing.com/products/pageVault/index.html 18-04-2005 41
39
stelt al dat een duurzaam toegankelijke website met metadata moet kunnen werken. Door elke pagina te dateren (begin-datum, eind-datum) is al aan een belangrijk deel van de randvoorwaarden voldaan. Vanzelfsprekend moet ook de relatie met (andere pagina’s van) de website in metadata worden vastgelegd. Ontwikkelaars gebruiken in de regel nu al programmatuur die al wijzigingen in software bijhouden. Implementatie lijkt dus zeker niet onmogelijk. 5.3.2.5 Uitvoering Zoals gezegd variëren de best practices van ideeën tot geteste strategieën. De meest gebruikte strategieën op dit moment zijn het maken van snapshots en mirrors. Implementatie44 van een archiveringsstrategieën levert twee vragen op. Allereerst de vraag ‘welke strategie past het best bij de websites in onze organisatie’. Een archiveringsstrategie is afhankelijk van meerdere factoren: het ‘type’ website (structuur, functionaliteiten, gedrag); de inhoud en functie die de website vervult; de risico’s die verbonden zijn aan de website; de verandersnelheid van de website. Afhankelijk van het type website kan de keuze gemaakt worden tussen het archiveren van de bron, het eindresultaat of de interactie. In het DAVIDproject is deze keuze inmiddels uitgewerkt. 45 De snapshot methode is bijvoorbeeld geschikt voor: • statische websites waarvan de interne links door middel van absolute path-aanduidingen zijn vastgelegd. De webharvester kan automatisch de absolute path-aanduidingen omzetten naar relatieve path-aanduidingen; • Dynamische websites: webpagina’s die dynamisch worden samengesteld op basis van serverscripts en ingebedde scripting (bijvoorbeeld asp-, cfm-, jsp-pagina’s; • Interactieve websites: websites waarvan de webpagina’s na interactie tussen gebruiker en ‘deep web’ worden samengesteld. Het verfilmen van een surfsessie is bijvoorbeeld geschikt voor websites die niet op platformonafhankelijke wijze archiveerbaar zijn. De tweede vraag gaat om het ‘wanneer en hoe’ archiveren. Het tijdstip van archiveren is afhankelijk van de verandersnelheid van de website, de risico’s en de functie van de website. Een website die vaak verandert zal vaker ‘bevroren’ moeten worden dan een website waarvan de inhoud constant blijft of waar slechts informatie aan toegevoegd wordt. De verantwoordelijkheid voor archiveren kan belegd worden in het primaire proces (de ‘push’ aanpak) of bij de organisatie die het archief met bevroren websites beheert (de ‘pull’ aanpak). Belangrijk is dat de gekozen archiveringsstrategie, de momenten van archivering en de verantwoordelijkheid voor het bevriezen van de website worden vastgelegd in een archiveringsprotocol.
zie ook het implementatieadvies voor het ministerie van Verkeer en Waterstaat: H.A. Hokke Naar archivering van websites, implementatieadvies bij het onderzoeksrapport “Blijvend Beschikbaar”(Amsterdam, 2003); F. Boudrez, S. van den Eynde DAVID, archivering van websites (Antwerpen - Leuven, mei 2002); René J.J. Voorburg Webontwerp: richtlijnen voor archivering (Amsterdam, Uselab & ministerie van Verkeen en Waterstaat, 2004) 45 Filip Boudrez en Inge Schoups ‘Duurzame en archiveerbare websites’ in Praktijkgids management lokale besturen (juni 2005) 44
40
5.4
Conclusies ten behoeve van het raamwerk
Welke eisen stelt dit nu aan het ontwerp van een website? Belangrijkste eis is dat de website niet zo ontworpen mag zijn, dat zij de archivering ‘tegenwerkt’. Op hoofdlijn betekent dit dat een website: 1. selecteerbaar is: • de informatie website zal in te waarderen eenheden worden aangeboden • de bewaartermijn van de informatie wordt expliciet vermeld • de informatie op de website zal vernietigd moeten kunnen na afloop van de bewaartermijn • de informatie op de website zal overgedragen moeten kunnen worden aan een andere beheerder, bijvoorbeeld een archiefbewaarplaats. 2. opneembaar is • informatie op de website moet berekend zijn op langdurige bewaring en toegankelijkheid • de website is zodanig vormgegeven dat lange termijn bewaring mogelijk is • de website of delen daarvan moeten te exporteren (‘bevriezen’) zijn naar een andere omgeving • de website bevat een verwijzing naar informatie die is geëxporteerd naar een andere omgeving 3. bewaarbaar is • de website is zodanig vormgegeven dat lange termijn bewaring mogelijk is • de website of delen daarvan moeten te exporteren (‘bevriezen’) zijn naar een andere omgeving • de relaties tussen de informatie en bijbehorende metadata moeten behouden blijven, ook na export naar een andere omgeving • de relaties tussen webpagina’s moeten behouden blijven. 4. toegankelijk is • informatie die op het moment van publicatie op de contemporaine website openbaar is voor alle gebruikers, blijft te allen tijde openbaar, tot het moment van vernietiging volgens een selectielijst • de informatie blijft beschikbaar, bereikbaar, begrijpelijke n bruikbaar tot het moment dat de website of delen daarvan op basis van een selectielijst worden vernietigd. • informatie zal beschikbaar, bereikbaar, begrijpelijk en bruikbaar blijven voor alle gebruikers, ook na technologische of inhoudelijke wijzigingen van de website • informatie op de website moet te koppelen zijn aan een binnen de organisatie gebruikt classificatieschema • aan de website of delen van website (pagina’s, subsites) moet beschrijvende metadata toegevoegd kunnen worden. • ook de metadata blijft beschikbaar, bereikbaar, begrijpelijk en bruikbaar voor gebruikers.
41
6
Archiveringseisen geplaatst in het ICTU raamwerk
6.1
Het raamwerk
Om de eisen aan duurzaam toegankelijke websites te formuleren heeft de ICTU een raamwerk ontwikkeld waarin aspecten van websites uitgezet worden tegen criteria van duurzame toegankelijkheid. Schematisch ziet het raamwerk uit de webrichtlijnen 1 er als volgt uit:
Duurzaamheid
Beschikbaarheid Bereikbaarheid Begrijpelijkheid Bruikbaarheid Robuustheid Onderhoudbaarheid
C1 C2 C3 C4 C5 C6
D1 D2 D3 D4 D5 D6
E1 E2 E3 E4 E5 E6
F1 F2 F3 F4 F5 F6
G1 G2 G3 G4 G5 G6
Toegang
Archivering aspect Opslag
Toegang
B1 B2 B3 B4 B5 B6
Publicatie aspect Presentatie
A1 A2 A3 A4 A5 A6
Representa tie Identiteit
Betekenis
Toegankelijkheid
Informatie aspect Structuur
Kwaliteitscriteria voor toegankelijke informatie en websites
H1 H2 H3 H4 H5 H6
Architectuur aspect (systeem-, informatie-, software aspecten) I1 I2 I3 I4 I5 I6
Dit raamwerk combineert de aspecten informatie; publicatie; archivering en architectuur met de belangen toegankelijkheid en duurzaamheid. Wij stellen voor dit raamwerk aan te passen. Allereerst door de kolom archivering te laten vervallen. Archivering is niet zozeer een ‘aspect’ van websites, zoals informatie en publicatie, maar een ‘belangengebied’ van waaruit kwaliteitseisen geformuleerd worden. We onderkennen daar twee verschillende invalshoeken. Allereerst de kwaliteit van de informatie-objecten zelf: integriteit, betrouwbaarheid en authenticiteit. Dit zijn niet direct archiveringseisen, maar algemene eisen vanuit gebruikersperspectief. En dan eisen die voortkomen uit het ‘kunnen archiveren’ van de site, de archiveerbaarheid. Hierbij merken we op dat de daadwerkelijke archivering van de site binnen dit project buiten beschouwing blijft. Schematisch ziet het nieuwe raamwerk voor de webrichtlijnen 2.0 er uit als hieronder in de tabel weergegeven. Kwaliteitscriteria voor toegankelijke informatie en websites
Informatie aspect
Publicatie aspect
Architectuur aspect
Kwaliteit van de informatie
Archiveerbaarheid
Presentatie
Beschikbaarheid Bereikbaarheid Begrijpelijkheid Bruikbaarheid Robuustheid Onderhoudbaarheid Integriteit
A1 A2 A3 A4 A5 A6 A7
B1 B2 B3 B4 B5 B6 B7
C1 C2 C3 C4 C5 C6 C7
D1 D2 D3 D4 D5 D6 D7
E1 E2 E3 E4 E5 E6 E7
F1 F2 F3 F4 F5 F6 F7
I1 I2 I3 I4 I5 I6 I7
Authenticiteit Betrouwbaarheid Selecteerbaarheid
A8 A9 A10
B8 B9 B10
C8 C9 C10
D8 D9 D10
E8 E9 E10
F8 F9 F10
I8 I9 I10
Opneembaarheid Bewaarbaarheid Beschikbaarheid
A11 A12 A13
B11 B12 B13
C11 C12 C13
D11 D12 D13
E11 E12 E13
F11 F12 F13
I11 I12 I13
Toegang
Betekenis
Duurzaam-heid
(systeem-, informatie -, software aspecten)
Structuur Toegankelijkheid
Representa tie Identiteit
42
In de volgende paragrafen gaan we verder in op de eisen die te maken hebben met de kwaliteit van informatie-objectenen de archiveerbaarheid van websites. Daarnaast bekijken we in hoeverre de eisen bij de reeds bestaande criteria vanuit een archivistische invalshoek aan te vullen zijn. Net als in webrichtlijnen 1.0 dienen deze eisen technologie-onafhankelijk en universeel toepasbaar te zijn. 6.2
Begrippen
De webrichtlijnen 1.0 geven werkdefinities van de begrippen die in het raamwerk worden gebruikt. De archivistiek kent voor een belangrijk deel dezelfde begrippen en/of termen, maar geeft er niet altijd dezelfde betekenis aan als de webrichtlijnen. Ons uitgangspunt is de terminologie van de webrichtlijnen zo veel als mogelijk te volgen, gelet ook op de beoogde gebruikers. We herhalen hier de relevante termen uit webrichtlijnen 1.0 en waar nodig plaatsen we enkele kanttekeningen die eventueel zouden kunnen leiden tot aanpassingen en voegen we nieuwe termen toe. Informatie aspect Structuur: Ictu: de structuur van een document specificeert de logische indeling van informatie (…) bedoeld om de informatie op een ordelijke manier aan te bieden en de boodschap duidelijk voor de ontvanger over te brengen. Archivistiek: De archivistiek kent een ruimere betekenis toe aan structuur: ook het verband tussen documenten. Om verwarring tussen interne en externe structuur te voorkomen,
43
volgen we de Ictu terminologie. De externe structuur, het verband tussen de verschillende informatie-objecten (documenten) zullen we ordening noemen . Betekenis. Ictu: “onder ‘informatie’ verstaan we in dit kader een ‘beschrijving’ van de informatie. Hierbij kan gedacht worden aan een tekstuele samenvatting van een multimedia document of een beschrijving van de informatie. Op deze wijze wordt de betekenis van een document duidelijk gemaakt. Archivistiek: dit komt dichtbij wat in bibliografische termen ‘representatie’ genoemd wordt. Voor de invulling van het archiveringsaspect lijkt deze mogelijke begripsverwarring geen rol te spelen. We vatten dat binnen de eis van interpreteerbaarheid, dat wil zeggen dat de gearchiveerde informatie-objecten‘betekenis’ moet hebben. Representatie. Ictu: wanneer informatie als een abstract begrip wordt beschouwd, dan is representatie de wijze waarop de informatie wordt uitgedrukt. [natuurlijke taal, multimedia] Archivistiek: zie opmerking hierboven, sub betekenis. Identiteit. Ictu: identiteit van informatie is de grootheid waarmee een informatiedocument kan worden aangeduid en geadresseerd. M.b.v. een unieke identiteit kan een informatiedocument gedurende het bestaan uniek worden geïdentificeerd en worden geadresseerd. Archivistiek: De archivistiek hanteert hiervoor verschillende termen, o.a. referentiecode. Het is geen probleem de Ictu term te hanteren. Publicatie aspect Presentatie: Ictu: opmaak, weergave van het document. Hoe de structuurelementen van het informatie aspect worden gepresenteerd aan ontvanger van informatie Archivistiek: geen opmerkingen. Toegang. Ictu: toegankelijkheid voor groepen mensen, in welke mate is de informatie op eenduidige manier te benaderen of is zij beveiligd door toegangsmechanismen Archivistiek: De archivistiek kent in wezen dezelfde betekenis toe aan het begrip toegankelijkheid. In engere zin is een toegang ook een inventaris, een index of een vergelijkbaar instrument. Voor website archivering speelt die engere betekenis geen rol. Architectuur aspect Systeem-, informatie- en software aspecten: ICTU: alles wat te maken heeft met de samenhang, de compositie, tussen het informatie- en publicatieaspect en de omgeving (systeem en applicatieomgeving) waarin de website zal functioneren. Archivistiek: geen aanvullingen.
44
Belanggebied Toegankelijkheid Beschikbaarheid. Ictu: alles wat te maken heeft met de samenhang, de compositie ICTU: beschikbaarheid: mate waarin de website en haar informatie ten dienste staan van gebruik (…) Hoe is informatie beschikbaar voor de gebruiker en wat heeft hij/zij nodig om de informatie te verkrijgen. Archivistiek: geen aanvullingen. Bereikbaarheid. Ictu: mate waarin informatie met een minimum aan barrières kan worden geraadpleegd. (…) technisch, financieel, kennisobstakels, maar ook handicaps Archivistiek: geen aanvullingen Begrijpelijkheid. ICTU: begrijpelijkheid is het kwaliteitscriterium dat zorgt dat de boodschap wordt aangepast aan de beoogde ontvanger van informatie. Archivistiek: de mate waarin de oorspronkelijke betekenis van de archiefstukken (gearchiveerde informatie-objecten) door gebruikers kan worden geïnterpreteerd. Bruikbaarheid. ICTU: bruikbaarheid: de mate waarin de website en haar informatie bruikbaar is voor de verschillende gebruikers Archivistiek: de mate waarin de gearchiveerde informatie-objecten door gebruikers kunnen worden geraadpleegd en verwerkt. Belanggebied Duurzaamheid Robuustheid. ICTU: robuustheid: de mate waarin de website en haar informatie bestand is tegen wijzigingen van technologie of inzichten. Archivistiek: geen aanvullingen. Onderhoudbaarheid: ICTU: onderhoudbaarheid is het criterium of websites op een efficiënte en effectieve manier kunnen worden vernieuwd, aangepast of uitgebreid. Archivistiek: geen aanvullingen. Belanggebied Kwaliteit van informatie Integriteit ICTU: Archiefschool: We volgen hier de definitie van ISO-NEN 15489 zoals ook in hoofdstuk 4 van de rapportage is weergegeven: De integriteit van een archiefstuk heeft betrekking op het feit dat het volledig en ongewijzigd is. Authenticiteit ICTU: Archiefschool: We volgen hier de definitie van ISO-NEN 15489, zoals ook in hoofdstuk 4 van de rapportage is weergegeven: Een authentiek archiefstuk is een document (informatieobject), waarvan kan worden bewezen a) dat het is wat het beweert te zijn,
45
b) dat het opgemaakt of verzonden is door de persoon die beweert het te hebben opgemaakt of verzonden, en c) dat het opgemaakt of verzonden is op het tijdstip als aangegeven. Betrouwbaarheid ICTU: Archiefschool: We volgen hier de definitie van ISO-NEN 15489, zoals ook in hoofdstuk 4 van de rapportage is weergegeven: Een betrouwbaar archiefstuk is een archiefstuk, waarvan de inhoud kan worden vertrouwd als een volledige en nauwkeurige weergave van de transacties, activiteiten of feiten waarvan het getuigt en waarop men zich kan verlaten bij de uitvoering van opvolgende transacties of activiteiten. Belanggebied Archiveerbaarheid Selecteerbaarheid ICTU: Archiefschool: De mate waarin vastgestelde selectiecriteria kunnen worden toegepast op de informatie-objecten. Opneembaarheid ICTU: Archiefschool: De mate waarin informatie-objecten op te nemen zijn in een archiveringssysteem. Bewaarbaarheid ICTU: Archiefschool: De mate waarin informatie-objecten voor een langere termijn bewaard kunnen worden, zonder onacceptabel verlies van kwaliteit. Beschikbaarheid ICTU: Archiefschool: De mate waarin het informatie-object na archivering nog beschikbaar voor raadpleging is 6.3
Eisen geplaatst in het raamwerk
De volgende pagina’s bevatten de het raamwerk met daaraan toegevoegd een kolom met de eisen, vanaf Criterium Robuustheid Voor de criteria beschikbaarheid, bereikbaarheid, begrijpelijkheid en bruikbaarheid zijn vanuit archivering geen nieuwe eisen toegevoegd. De eisen zijn steeds uitgesplitst naar eisen aan (1) Inhoud & informatie, (2) functionaliteit & gebruik en (3) beheer & onderhoud. Een overzicht van de eisen is opgenomen in paragraaf 6.4. Aan het raamwerk is een nieuwe kolom ‘voorstel voor richtlijnen” toegevoegd. Naast de bestaande richtlijnen is een aantal specifiek op archivering gerichte richtlijnen toegevoegd. Per eis kunnen ook bestaande richtlijnen van toepassing zijn. We hebben de indruk dat de bestaande richtlijnen niet strijdig zijn met die voor archivering. Een aantal is zonder meer ook aan archiveringseisen toe te voegen. Dat is (nog) niet consequent gebeurd. Evenmin zijn de eisen nog expliciet aan cellen toegewezen. Dat doen we na vaststelling van de set. De richtlijnen zijn uitgewerkt in paragraaf 6. 5
46
De algemene, onderliggende betooglijn is als volgt: • Informatie op de website is archief. • De pagina is de kleinste, logische eenheid, vergelijkbaar met een traditioneel document. Een aantal pagina’s kan een grotere logische eenheid vormen, een aggregatie, een ‘dossier’. Zo nu en dan hanteren we daarvoor de neutrale term: delen van websites. Dat zijn dus steeds groepen van minimaal één pagina. Logische eenheden moeten ook na archivering bijeenblijven. • Pagina’s krijgen een eigen id, ze zijn (ook) afzonderlijk exporteerbaar en verwijderbaar. Bij verwijdering moeten ook de back-ups verwijderd worden. • Volledigheid (ISO eisen: integriteit, authenticiteit, betrouwbaarheid …) – het hele document wordt op een pagina simultaan getoond, dwz alle vormelementen die een goed document bepalen. Deze worden in metadata vastgelegd voor de archiveerbaarheid, maar moeten ook zichtbaar zijn voor de gebruiker. • Voor de bewaarbaarheid geldt wat in het algemeen voor de website geldt: Houd het simpel: flash moeilijk te archiveren, dus niet gebruiken. • Over welke metadata moet worden vastgelegd is nog onduidelijkheid. Er is nog geen Nederlandse standaard. De richtlijnen bevelen die metadata aan die noodzakelijk zijn om aan de onderkende eisen tegemoet te komen.
Raamwerk van eisen
Betekenis
Representatie
Identiteit
Presentatie
Toegang
(systeem-,etc.)
Beschikbaarheid Bereikbaarheid Begrijpelijkheid Bruikbaarheid Robuustheid
Structuur
Voorstel voor eisen aan site
A1 A2 A3 A4 A5
B1 B2 B3 B4 B5
C1 C2 C3 C4 C5
D1 D2 D3 D4 D5
E1 E2 E3 E4 E5
F1 F2 F3 F4 F5
I1 I2 I3 I4 I5
E-ar.1: Het is voor de gebruiker duidelijk welke informatie op de website actueel is, en welke informatie is gearchiveerd
Voorstel voor de richtlijnen
R-ar.1: Maak een afzonderlijke “archief-pagina” waarop informatie over archivering en vernietiging kan worden vermeld. Deze pagina dient om gebruikers snel naar de gearchiveerde informatie te leiden. R-ar.14: Indien de gearchiveerde informatie is overgebracht naar een andere site, plaats dan op de “archiefpagina” (zie R.a1) een link naar de site waarop gearchiveerde informatie is te vinden.
E-ar.2De website is zodanig vormgegeven dat lange termijn bewaring en toekomstige toegankelijkheid van de informatie mogelijk is, eventueel in een andere omgeving.
R-ar.2.1: Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). R-ar.2.2: Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open opslagformaten, of anders formaten die breed worden toegepast.
48 R-ar.3: Geef elke pagina een eigen, vaste, unieke en voor de gebruiker zichtbare identificatie. De gebruiker moet in voorkomende gevallen aan die identificatie kunnen refereren wanneer hij een vraag over de pagina aan de organisatie wil stellen. R-ar.9: Laat de pagina’s naar elkaar verwijzen door middel van de unieke identificaties. (zie R-ar.4) E-ar.3: De website als geheel, of delen van de website moeten te exporteren zijn naar een andere omgeving.
E-ar.4De structuur, betekenis, representatie, identificatie, presentatie en toegang horen intact te blijven, ongeacht technologische of inhoudelijke wijzigingen van de website.
E-ar.5: Informatie op de website zal als hele website of als een gedeelte van de website vernietigd moeten kunnen worden als dit op basis van een selectielijst moet.
R-ar.2.1: Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). R-ar.2.2: Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open opslagformaten, of anders formaten die breed worden toegepast. R-ar.4: Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd. R-ar.6: Leg in metadata de naam van de organisatie, het doel van de pagina, de datum waarop de informatie is vastgelegd, de datum waarop de pagina is gepubliceerd, de functionaris die verantwoordelijk is voor de inhoud van de pagina. R-ar.7: Vermeld op elke pagina welke bewaartermijn voor de pagina geldt. R-ar.8: Leg voor elke pagina de selectiebeslissing vast in de metadata. R-ar.18: Zorg er voor dat bij vernietiging ook de back-ups worden vernietigd.
E-ar.6Informatie op de website zal als hele website of gedeelte van een website overgedragen moeten kunnen worden aan een andere beheerder, bijvoorbeeld een archiefbewaarplaats. Onderhoudbaarheid
A6
B6
C6
D6
E6
F6
I6
49 R-ar.7: Vermeld op elke pagina welke bewaartermijn voor de pagina geldt. R-ar.8: Leg voor elke pagina de selectiebeslissing vast in de metadata.
E-ar.7 Wanneer wijziging, vernietiging of export van de website of delen van de website heeft plaats gevonden wordt dit op de website vermeld.
R-ar.1: Maak een afzonderlijke “archief-pagina” waarop informatie over archivering en vernietiging kan worden vermeld. Deze pagina dient om gebruikers snel naar de gearchiveerde informatie te leiden.
E-ar.3: De website als geheel of delen van de website moeten te exporteren zijn naar een andere omgeving
R-ar.2.1: Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). R-ar.2.2: Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open opslagformaten, of anders formaten die breed worden toegepast.
Integriteit (= volledig, onveranderbaar)
A7
B7
C7
D7
E7
F7
I7
E-ar.8 De informatie op de website wordt gepresenteerd in overeenstemming met de vormeisen die aan een volledig document gesteld worden. .
E-ar.9 Wanneer een geautoriseerde wijziging, vernietiging of export van informatie van de website heeft plaats gevonden wordt dit op de website vermeld en in metadata vastgelegd.
R-ar.4: Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd. R-ar.6: Leg in metadata de naam van de organisatie, het doel van de pagina, de datum waarop de informatie is vastgelegd, de datum waarop de pagina is gepubliceerd, de functionaris die verantwoordelijk is voor de inhoud van de pagina. R-ar.1: Maak een afzonderlijke “archief-pagina” waarop informatie over archivering en vernietiging kan worden vermeld. Deze pagina dient om gebruikers snel naar de gearchiveerde informatie te leiden.
50 R-ar.18: Zorg er voor dat bij vernietiging ook de back-ups worden vernietigd. E-ar. 10De website mag niet ongeautoriseerd worden veranderd.
R-ar.4: Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd. R-ar.16: Leg in procedurebeschrijvingen vast welke functionarissen bevoegdheid hebben tot het aanbrengen van wijzigingen in de structuur, functionaliteit en/of inhoud van de website.
Authenticiteit (identiteit, oorspronkelijkheid, status)
A8
B8
C8
D8
E8
F8
I8
E-ar.8 De informatie op de website wordt gepresenteerd in overeenstemming met de vormeisen die aan een volledig document gesteld worden.
R-ar.4: Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd.
E-ar.11 De website bevat informatie waarmee de gebruiker (mens en machine) in staat is de website of delen daarvan te identificeren, minimaal over doel en functie van de website; auteur of eigenaar van de website; en datum van publicatie.
R-ar.3: Geef elke pagina een eigen, vaste, unieke en voor de gebruiker zichtbare identificatie. De gebruiker moet in voorkomende gevallen aan die identificatie kunnen refereren wanneer hij een vraag over de pagina aan de organisatie wil stellen.
R-ar.6: Leg in metadata de naam van de organisatie, het doel van de pagina, de datum waarop de informatie is vastgelegd, de datum waarop de pagina is gepubliceerd, de functionaris die verantwoordelijk is voor de inhoud van de pagina.
R-ar.4: Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd.
E-ar.12 Elk informatie-object heeft een uniek kenmerk dat zijn oorspronkelijkheid waarborgt.
51 R-ar.3: Geef elke pagina een eigen, vaste, unieke en voor de gebruiker zichtbare identificatie. De gebruiker moet in voorkomende gevallen aan die identificatie kunnen refereren wanneer hij een vraag over de pagina aan de organisatie wil stellen.
E-ar.9 Wanneer een geautoriseerde wijziging, vernietiging of export van informatie van de website heeft plaats gevonden wordt dit op de website vermeld en in metadata vastgelegd.
R-ar.1: Maak een afzonderlijke “archief-pagina” waarop informatie over archivering en vernietiging kan worden vermeld. Deze pagina dient om gebruikers snel naar de gearchiveerde informatie te leiden.
E-ar. 10 De informatie op de website mag niet ongeautoriseerd worden veranderd.
R-ar.4: Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd.
R-ar.18: Zorg er voor dat bij vernietiging ook de back-ups worden vernietigd.
R-ar.16: Leg in procedurebeschrijvingen vast welke functionarissen bevoegdheid hebben tot het aanbrengen van wijzigingen in de structuur, functionaliteit en/of inhoud van de website. Betrouwbaarheid (volledigheid, nauwkeurigheid, juistheid)
A9
B9
C9
D9
E9
F9
I9
E-ar.8 De informatie op de website wordt gepresenteerd in overeenstemming met de vormeisen die aan een volledig document gesteld worden.
R-ar.4: Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd. R-ar.6: Leg in metadata de naam van de organisatie, het doel van de pagina, de datum waarop de informatie is vastgelegd, de datum waarop de pagina is gepubliceerd, de functionaris die verantwoordelijk is voor de inhoud van de pagina.
E-ar.13 Het informatie-object dient de juiste informatie te bevatten, zodat de betekenis voor de gebruiker duidelijk is.
52 R-ar.4: Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd. R-ar.6: Leg in metadata de naam van de organisatie, het doel van de pagina, de datum waarop de informatie is vastgelegd, de datum waarop de pagina is gepubliceerd, de functionaris die verantwoordelijk is voor de inhoud van de pagina.
E-ar.9 Wanneer een geautoriseerde wijziging, vernietiging of export van informatie van de website heeft plaats gevonden wordt dit op de website vermeld en in metadata vastgelegd.
R-ar.1: Maak een afzonderlijke “archief-pagina” waarop informatie over archivering en vernietiging kan worden vermeld. Deze pagina dient om gebruikers snel naar de gearchiveerde informatie te leiden.
E-ar. 10De informatie op de website mag niet ongeautoriseerd worden veranderd.
R-ar.4: Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd.
R-ar.18: Zorg er voor dat bij vernietiging ook de back-ups worden vernietigd.
R-ar.16: Leg in procedurebeschrijvingen vast welke functionarissen bevoegdheid hebben tot het aanbrengen van wijzigingen in de structuur, functionaliteit en/of inhoud van de website. Selecteerbaarheid
A10
B10
C10
D10
E10
F10
I10
E-ar.14 Informatie op de website zal in te waarderen eenheden worden aangeboden.
R-ar.2.1: Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). R-ar.2.2: Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open opslagformaten, of anders formaten die breed worden
53 toegepast. E-ar.15 De bewaartermijn van de informatie op de website wordt expliciet vermeld.
R-ar.7: Vermeld op elke pagina welke bewaartermijn voor de pagina geldt.
E-ar.5 Informatie op de website zal als hele website of als een gedeelte van de website vernietigd moeten kunnen worden als een selectielijst dit voorschrijft
R-ar.7: Vermeld op elke pagina welke bewaartermijn voor de pagina geldt.
E-ar.6Informatie op de website zal als hele website of gedeelte van een website overgedragen moeten kunnen worden aan een andere beheerder, bijvoorbeeld een archiefbewaarplaats. Opneembaarheid
A11
B11
C11
D11
E11
F11
I11
E-ar.16 Informatie op de website, die daarvoor krachtens selectielijsten voor in aanmerking komt, moet berekend zijn op langdurige bewaring en toegankelijkheid
R-ar.8: Leg voor elke pagina de selectiebeslissing vast in de metadata. R-ar.18: Zorg er voor dat bij vernietiging ook de back-ups worden vernietigd. R-ar.7: Vermeld op elke pagina welke bewaartermijn voor de pagina geldt. R-ar.8: Leg voor elke pagina de selectiebeslissing vast in de metadata. R-ar.2.1: Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). R-ar.2.2: Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open opslagformaten, of anders formaten die breed worden toegepast.
E-ar.17 De website bevat een verwijzing naar informatie die geëxporteerd is naar een andere omgeving.
R-ar.14: Indien de gearchiveerde informatie is overgebracht naar een andere site, plaats dan op de “archiefpagina” (zie R.a1) een link naar de site waarop gearchiveerde informatie is te vinden.
E-ar.2 De website is zodanig vormgegeven dat lange termijn bewaring en toekomstige toegankelijkheid van de informatie mogelijk is, eventueel in een andere omgeving.
54 R-ar.2.1: Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). R-ar.2.2: Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open opslagformaten, of anders formaten die breed worden toegepast. R-ar.3: Geef elke pagina een eigen, vaste, unieke en voor de gebruiker zichtbare identificatie. De gebruiker moet in voorkomende gevallen aan die identificatie kunnen refereren wanneer hij een vraag over de pagina aan de organisatie wil stellen. R-ar.9: Laat de pagina’s naar elkaar verwijzen door middel van de unieke identificaties. (zie R-ar.4)
E-ar.3: De website of delen van de website moeten te exporteren zijn naar een andere omgeving.
R-ar.2.1: Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). R-ar.2.2: Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open opslagformaten, of anders formaten die breed worden toegepast.
Bewaarbaarheid
A12
B12
C12
D12
E12
F12
I12
E-ar.2 De website is zodanig vormgegeven dat lange termijn bewaring en toekomstige toegankelijkheid van de informatie mogelijk is, eventueel in een andere omgeving.
R-ar.2.1: Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). R-ar.2.2: Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open opslagformaten, of anders formaten die breed worden toegepast.
55 R-ar.3: Geef elke pagina een eigen, vaste, unieke en voor de gebruiker zichtbare identificatie. De gebruiker moet in voorkomende gevallen aan die identificatie kunnen refereren wanneer hij een vraag over de pagina aan de organisatie wil stellen. R-ar.9: Laat de pagina’s naar elkaar verwijzen door middel van de unieke identificaties. (zie R-ar.4)
Toegankelijkheid
A13
B13
C13
D13
E13
F13
I13
E-ar.18 De relaties tussen de informatie en bijbehorende metadata moeten behouden blijven, ook na export naar een andere omgeving.
R-ar.13: Leg de relatie tussen pagina’s en de oorspronkelijke website in metadata vast.
E-ar.19 De relaties tussen webpagina’s moeten behouden blijven.
R-ar.9: Laat de pagina’s naar elkaar verwijzen door middel van de unieke identificaties. (zie R-ar.4)
E-ar. 20 Informatie die op het moment van publicatie openbaar is voor alle gebruikers blijft te allen tijde openbaar, tot het moment van vernietiging volgens een selectielijst. E-ar. 21 Informatie zal beschikbaar, bereikbaar, begrijpelijk en bruikbaar blijven voor alle gebruikers, ook na technologische of inhoudelijke wijzigingen van de oorspronkelijke website.
R-ar.10: Leg expliciet in de metadata vast dat de informatie op de pagina openbaar is.
R-ar.17: Zorg er voor dat bij archivering de relatie tussen metadata en de pagina’s behouden blijft.
R-ar.1: Maak een afzonderlijke “archief-pagina” waarop informatie over archivering en vernietiging kan worden vermeld. Deze pagina dient om gebruikers snel naar de gearchiveerde informatie te leiden. R-ar.2.1: Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). R-ar.2.2: Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open
56 opslagformaten, of anders formaten die breed worden toegepast. R-ar.12.1: Implementeer beschrijvende metadata volgens voor de overheid geldende standaards. R-ar.12.2: Implementeer beschrijvende metadata voor pagina’s, delen van websites en voor de website als geheel. E-ar. 22 Informatie op de website moet te koppelen zijn aan een binnen de organisatie gebruikt classificatieschema.
R-ar.11: Leg in de metadata vast tot welke rubriek in het classificatiesysteem de pagina behoort en voor welke periode dat gold.
E-ar. 23 Aan de website of delen van de website moet beschrijvende metadata toegevoegd kunnen worden.
R-ar.12.1: Implementeer beschrijvende metadata volgens voor de overheid geldende standaards.
E-ar. 24 De website met haar informatie blijft beschikbaar, bereikbaar, begrijpelijk en bruikbaar tot het moment dat de website of delen daarvan op basis van een selectielijst worden vernietigd.
R-ar.7: Vermeld op elke pagina welke bewaartermijn voor de pagina geldt.
E-ar. 25 Ook metadata blijft beschikbaar, bereikbaar, begrijpelijk en bruikbaar voor gebruikers
R-ar.15: Bij export of archivering moet ook (een kopie van) de bijbehorende cascading stylesheet (CSS) geëxporteerd worden. R-ar.7: Vermeld op elke pagina welke bewaartermijn voor de pagina geldt.
6.4
Het overzicht van de eisen
We hebben de archiveringseisen een voorlopig nummer gegeven: E-ar.1, E-ar.2 enz. Eis E-ar.1
Beschrijving Het is voor de gebruiker duidelijk welke informatie op de website actueel is, en welke informatie is gearchiveerd
Cel E5 F5
Richtlijnen R-ar.1 R-ar.14
E-ar.2
De website is zodanig vormgegeven dat lange termijn bewaring en toekomstige toegankelijkheid van de informatie mogelijk is, eventueel in een andere omgeving.
A5 B5 C5 D5 E5 F5 A11 B11 C11 D11 E11 F11 A12 B12 C12 D12 E12 F12
R-ar.2.1 R-ar.2.2 R-ar.3 R-ar.9
E-ar.3
De website als geheel, of delen van de website moeten te exporteren zijn naar een andere omgeving.
E5 E6 E11
R-ar.2.1 R-ar.2.2
E-ar.4
De structuur, betekenis, representatie, identificatie, presentatie en toegang horen intact te blijven, ongeacht technologische of inhoudelijke wijzigingen van de website.
A5 B5 C5 D5 E5 F5
R-ar.4 R-ar.6
E-ar.5
Informatie op de website zal als hele website of als een gedeelte van de website vernietigd moeten kunnen worden als dit op basis van een selectielijst moet.
E5 E10
R-ar.7 R-ar.8 R-ar.18
58
E-ar.6
Informatie op de website zal als hele website of gedeelte van een website overgedragen moeten kunnen worden aan een andere beheerder, bijvoorbeeld een archiefbewaarplaats.
E5 E10
R-ar.7 R-ar.8
E-ar.7
Wanneer wijziging, vernietiging of export van de website of delen van de website heeft plaats gevonden wordt dit op de website vermeld.
E6 F6
R-ar.1
E-ar.8
De informatie op de website wordt gepresenteerd in overeenstemming met de vormeisen die aan een volledig document gesteld worden.
A7 B7 C7 D7 E7 F7 A8 B8 C8 D8 E8 F8 A9 B9 C9 D9 E9 F9
R-ar.4 R-ar.6
E-ar.9
Wanneer een geautoriseerde wijziging, vernietiging of export van informatie van de website heeft plaats gevonden wordt dit op de website vermelden in metadata vastgelegd.
E7 F7 E8 F8 E9 F9
R-ar.1 R-ar.18
E-ar.10
De website mag niet ongeautoriseerd worden veranderd.
A7 B7 C7 D7 E7 F7 A8 B8 C8 D8
R-ar.4 R-ar.16
59
E8 F8 A9 B9 C9 D9 E9 F9 E-ar.11
De website bevat informatie waarmee de gebruiker (mens en machine) in staat is de website of delen daarvan te identificeren, minimaal over doel en functie van de website; auteur of eigenaar van de website; en datum van publicatie.
E8 F8
R-ar.3 R-ar.4
E-ar.12
Elk informatie-object heeft een uniek kenmerk dat zijn oorspronkelijkheid waarborgt.
E8
R-ar.3
E-ar.13
Het informatie-object dient de juiste informatie te bevatten, zodat de betekenis voor de gebruiker duidelijk is.
A9 B9 C9 E9
R-ar.4 R-ar.6
E-ar.14
Informatie op de website zal in te waarderen eenheden worden aangeboden.
E-ar.15
De bewaartermijn van de informatie op de website wordt expliciet vermeld.
A10 R-ar.2.1 B10 R-ar.2.2 C10 D10 E10 F10 E10 R-ar.7
E-ar.16
Informatie op de website, die daarvoor krachtens selectielijsten voor in aanmerking komt, moet berekend zijn op langdurige bewaring en toegankelijkheid
A11 R-ar.2.1 B11 R-ar.2.2 C11 D11 E11 F11
E-ar.17
De website bevat een verwijzing naar informatie die geëxporteerd is naar een andere omgeving.
E11 F11
R-ar.14
E-ar.18
De relaties tussen de informatie en
A12
R-ar.13
60
bijbehorende metadata moeten behouden blijven, ook na export naar een andere omgeving.
B12 R-ar.17 C12 D12 E12 F12
E-ar.19
De relaties tussen webpagina’s moeten behouden blijven.
A12 R-ar.9 B12 C12 D12 E12 F12
E-ar. 20
Informatie die op het moment van publicatie openbaar is voor alle gebruikers blijft te allen tijde openbaar, tot het moment van vernietiging volgens een selectielijst.
E13 F13
R-ar.10
E-ar. 21
Informatie zal beschikbaar, bereikbaar, begrijpelijk en bruikbaar blijven voor alle gebruikers, ook na technologische of inhoudelijke wijzigingen van de oorspronkelijke website.
A13 B13 C13 D13 E13 F13
R-ar.1 R-ar.2.1 R-ar.2.2 R.-ar.12.1 R-ar.12.2
E-ar. 22
Informatie op de website moet te koppelen zijn aan een binnen de organisatie gebruikt classificatieschema.
E13 F13
R-ar.11
E-ar. 23
Aan de website of delen van de website moet beschrijvende metadata toegevoegd kunnen worden.
E13 F13
R-ar.12.1
E-ar. 24
De website met haar informatie blijft beschikbaar, bereikbaar, begrijpelijk en bruikbaar tot het moment dat de website of delen daarvan op basis van een selectielijst worden vernietigd.
A13 R-ar.7 B13 R-ar.15 C13 D13 E13 F13
E-ar. 25
Ook metadata blijft beschikbaar, bereikbaar, begrijpelijk en bruikbaar voor gebruikers
A13 R-ar.7 B13 C13 D13 E13 F13
61
6.5
Overzicht van de richtlijnen
We hebben de archiveringsrichtlijnen een voorlopig nummer gegeven: R-ar.1, R-ar.2 enz. In het raamwerk en het overzicht van eisen wordt dit nummer vermeld, met een korte aanduiding van de richtlijn. De volledige richtlijnen zijn hierna uitgeschreven. De richtlijnen zijn onderverdeeld in richtlijnen voor het ontwerp en richtlijnen voor het beheer. Richtlijnen voor het ontwerpen Richtlijn R-ar.1
R-ar.2.1
R-ar.2.2
R-ar.3
R-ar.4
R-ar.5 R-ar.6
R-ar.7 R-ar.8 R-ar.9 R-ar.10 R-ar.11
Beschrijving Maak een afzonderlijke “archief-pagina” waarop informatie over archivering en vernietiging kan worden vermeld. Deze pagina dient om gebruikers snel naar de gearchiveerde informatie te leiden. Richt de website zodanig in dat elke pagina een op zichzelf staande logische eenheid is. Pagina’s kunnen naar thema worden samengevoegd (‘dossier’). Gebruik voor teksten, afbeeldingen, geluid en bewegend beeld in de website indien mogelijk open opslagformaten, of anders formaten die breed worden toegepast. Geef elke pagina een eigen, vaste, unieke en voor de gebruiker zichtbare identificatie. De gebruiker moet in voorkomende gevallen aan die identificatie kunnen refereren wanneer hij een vraag over de pagina aan de organisatie wil stellen. Elke pagina bevat, behalve de volledige tekst en eventuele illustraties, tenminste de naam van de organisatie, het doel van de pagina, de datum waarop informatie is vastgesteld, de datum waarop de pagina is gepubliceerd. Implementeer een authorisatiestructuur voor de website. Leg in metadata de naam van de organisatie, het doel van de pagina, de datum waarop de informatie is vastgelegd, de datum waarop de pagina is gepubliceerd, de functionaris die verantwoordelijk is voor de inhoud van de pagina. Vermeld op elke pagina welke bewaartermijn voor de pagina geldt. Leg voor elke pagina de selectiebeslissing vast in de metadata. Laat de pagina’s naar elkaar verwijzen door middel van de unieke identificaties. (zie R-ar.4) Leg expliciet in de metadata vast dat de informatie op de pagina openbaar is. Leg in de metadata vast tot welke rubriek in het classificatiesysteem de pagina behoort en voor welke periode dat gold.
62
R-ar.12.1 R-ar.12.2 R-ar.13
Implementeer beschrijvende metadata volgens voor de overheid geldende standaards. Implementeer beschrijvende metadata voor pagina’s, delen van websites en voor de website als geheel. Leg de relatie tussen pagina’s en de oorspronkelijke website in metadata vast.
Richtlijnen voor het beheer Richtlijn R-ar.14
R-ar.15 R-ar.16
R-ar.17
R-ar.18
Beschrijving Indien de gearchiveerde informatie is overgebracht naar een andere site, plaats dan op de “archiefpagina” (zie R.-a1) een link naar de site waarop gearchiveerde informatie is te vinden. Bij export of archivering moet ook (een kopie van) de bijbehorende cascading stylesheet (CSS) geëxporteerd worden. Leg in procedurebeschrijvingen vast welke functionarissen bevoegdheid hebben tot het aanbrengen van wijzigingen in de structuur, functionaliteit en/of inhoud van de website. Zorg er voor dat bij archivering de relatie tussen metadata en de pagina’s behouden blijft. Leg daarnaast in de metadata vast wanneer een webpagina naar een archief is geëxporteerd. Zorg er voor dat bij vernietiging ook de back-ups worden vernietigd.