Het E-depot van het Stadsarchief Amsterdam Presentatie voor vakgenoten - 7 september 2009
Ellen Fleurbaay
1
Wat is een E-depot? Hierboven ziet u de schematische weergave van het E-depot van het Stadsarchief Amsterdam. Maar wat ís eigenlijk een ‘E-depot’? Uit de tekening blijkt dat het een complex is van Processen en Systemen voor het Ontvangen van Leveranciers van digitale objecten, het Bewaren en het Aanbieden aan Gebruikers. Maar waarom heet dit E-depot? Waarom heet het bijvoorbeeld niet Digitaal Depot? Dat is de term die onze Antwerpse collega’s van het Expertisecentrum David gebruiken. In Wikipedia komt de term E-depot niet voor en in de recent gelanceerde Archiefwiki ook (nog?) niet; maar weer wel in de termenlijst Informatiebeheer van onze collega Rienk Jonker. Het antwoord op de vraag waarom wij gekozen hebben voor de term E-depot is eigenlijk vrij simpel: het is een korte term die gemakkelijk uitspreekt (digitaal depot is toch langer dan e-depot) en onze collega’s hier in de gemeente Amsterdam hebben er wel een beeld bij. Bovendien gebruiken de KB en het Nationaal Archief en Rotterdam, de grote broers die ons voorgingen op het terrein van deze ontwikkelingen, ook de term E-depot. Maar het feit dát we moesten nadenken over hoe we het zouden noemen, zegt wel veel over de fase van ontwikkeling van E-depots. Dat is echt nog de fase van de kinderschoenen. En dat geldt voor ons natuurlijk ook. In zo’n prachtig schema lijkt het heel wat, maar we staan nog helemaal aan het begin. Ons E-depot is beslist nog niet ‘klaar’. Niet alle systemen zijn geïnstalleerd en niet alle processen zijn uitgeschreven, maar met de recente inwijding van het bewaardepot en de afronding van de eerste inname in en uitname uit het bewaardepot hebben we wel weer een belangrijke stap gezet. En daar zijn we trots op, vandaar dat we het u willen laten zien. Over de installatie van het bewaardepot (inclusief veiligheidskopie op co locatie!) en over de pilot inname en uitname van 750.000 scans van Persoonskaarten hoort u straks meer van mijn collega’s. Daaraan voorafgaand wil ik u eerst iets vertellen over onze visie op het E-depot en over de filosofie waaruit het Stadsarchief Amsterdam werkt bij de ontwikkeling van het E-depot. Visie Stadsarchief Amsterdam op E-depot We hopen dat onze visie op E-depot spreekt uit deze tekening. Dat ga ik u aan de hand van 4 aspecten van de tekening toelichten. 1. Archivaris in control Het eerste aspect dat opvalt in de tekening zijn denk ik de poppetjes. Bij schematische tekeningen van een technisch systeem of van een werkproces verwacht je niet zo snel een menselijk figuurtje.
Bij het inleveren van onze eigen schema’s hebben we de vormgever (voor geïnteresseerden: zijn naam is Victor Levie) gevraagd of hij een manier kon bedenken om uit te beelden dat het bij een Edepot weliswaar over techniek en IT gaat, maar dat de bepalende factor de mens is, in dit geval de mens in de functie van archivaris. En daar is hij prima in geslaagd. Hij heeft de archivaris er letterlijk bovenop gezet. De archivaris regelt de systemen en processen en is de contactpersoon tussen leveranciers en gebruikers. Om modern bedrijfsjargon te gebruiken: de archivaris is ‘In Control’. Wij vonden dat menselijk aspect om twee redenen heel belangrijk. In de eerste plaats om onszelf en onze collega’s er op te wijzen dat het e-depot onze verantwoordelijkheid is. En die verantwoordelijkheid moeten wij als archivarissen ook nemen. Dus niet ‘voor de computer moet u bij mijn collega van de IT zijn’ maar ‘voor digitale archieven kunt u bij mij terecht, en ik weet hoe computers werken’. Dat is een cultuuromslag in onze wereld. Eerst wezen de medewerkers van mijn afdeling voor vragen over digitale gegevens inderdaad unaniem naar de afdeling IT. Daarna wezen ze
2
naar één of twee medewerkers op de eigen afdeling die nieuw waren aangesteld, maar langzamerhand is dat nu veranderd. De medewerkers van mijn afdeling die vroeger alleen klanten hielpen bij studiezaaldiensten en informatieverzoeken behandelden, zijn nu ingezet bij de wekelijkse scan-on-demand-procedure en bij digitaliseringsprojecten. Ze behandelen nu niet alleen verzoeken om informatie, maar ze kunnen klanten ook uitleggen hoe je handig met wildcards zoekt naar spellingsvarianten en ook welke browser je het beste bij een Mac kan kiezen. De tweede reden waarom wij dat menselijk aspect in het schema van het E-depot wilden zien, is dat we ook onze opdrachtgever, het bestuur, er op willen wijzen dat het mensen zijn die het E-depot aansturen. Dat is en blijft de belangrijkste en ook duurste factor van ons bedrijf: de handjes die er voor moeten zorgen dat die systemen en die procedures werken. Opmerkingen over ‘de snel voortschrijdende digitalisering van de maatschappij’ roepen bij mij altijd irritatie op. Zo’n opmerking suggereert dat digitalisering een soort autonome ontwikkeling is, het suggereert dat de maatschappij zelfstandig omschakelt van analoog naar digitaal. En dat is niet zo. Nee, het gaat niet vanzelf. Wij moeten iedere verandering organiseren en goed in de gaten houden. En de aanschaf van systemen is duur, maar het organiseren en controleren kost menskracht en dat is altijd nog duurder. 2. Systemen en processen Het tweede dat u vermoedelijk is op gevallen in het schema van ons E-depot is de strikte tweedeling tussen systemen en processen, waarbij de processen bovenaan staan en ook iets meer ruimte in beslag nemen dan de systemen. De Processen
De Systemen
3
De basis voor de inrichting van ons E-depot is het alom aanvaarde model van het Open Archival Information System, oftewel het OAIS-model. De stroom van de objecten van leverancier naar gebruiker is bij OAIS en bij ons E-depot identiek en ook de indeling in drie fasen: OntvangenBewaren-Aanbieden is in beide modellen gelijk. Maar de expliciete splitsing tussen systemen en processen zie je niet in het OAIS model. Ik zal het u laten zien: OAIS-model
In het handboek (het zogenaamde Blue Book, waarin dit model is beschreven) komen de werkprocessen wel uitgebreid aan de orde, maar in de tekening zie je het niet zo. Wij hebben er voor gekozen dat wel te doen en daarmee een extra accent te leggen op het belang van de werkprocessen. Vandaar deze tweedeling tussen Systemen en Processen met voor de processen zelfs wat meer ruimte dan voor de systemen. De systemen van het E-depot voor het ontvangen, bewaren en aanbieden zijn in 3 roze blokken geplaatst, ieder met een eigen veiligheidskopie in een lichtere tint roze, waarbij de kleur van de kopie van de bewaaromgeving een donkerder tint heeft dan die van de ontvangst- en van de bewaaromgeving. Dat heeft te maken met de keuze voor het soort veiligheidskopie. Daar hoort u later meer over. De systemen van de leveranciers en de gebruikers die de objecten en metadata produceren en afnemen staan aan weerszijden van het E-depot. De leveranciers en gebruikers zelf zitten achter hun laptopjes op hun systemen. Zij zijn de producenten en de afnemers van de objecten en de metadata. Er zijn in totaal zeven soorten werkprocessen gedefinieerd: aanleveren, controleren, innemen, beheren, uitnemen, bewerken en service verlenen. De werkprocessen vinden plaats binnen de context van een systeem of tijdens het transport van het ene systeem naar het andere. De relatie tussen de processen en de systemen wordt weergegeven door deze rode pijlen 3. Objecten en metadata Er is nog een punt waar ons schema bewust afwijkt van het OAIS-model. Dat is de consequente scheiding van objecten en metadata. Ik laat u het OAIS-model weer even zien
4
In het hart van de tekening ziet u een scheiding tussen Data Management en Archival Storage. In de Nederlandse weergave van het OAIS-model in het ED3 rapport van Lopai, is Data Management vertaald als toegankelijk maken en Archival Storage als lange termijn opslag. Toegankelijk maken impliceert de productie van de metadata, of in ieder geval de productie van een deel van de metadata. Maar bij Ingest en Access, te vertalen met Opname en Beschikbaar stellen, zie je geen scheiding tussen metadata en objecten. Wij denken dat het goed is die scheiding overal expliciet aan te brengen, zowel in de systemen als in de werkprocessen. Doe je dat niet, dan is er het risico dat het belang van metadata wordt onderschat. Ik ga u een voorbeeld geven. Bij het werkproces Aanleveren bijvoorbeeld gaat het niet alleen om de objecten. We willen de digitale objecten in een goede, geordende en toegankelijke staat ontvangen. Een digitaal bestand is dan misschien ‘automatisch doorzoekbaar’ maar daarmee is het nog niet in goede, geordende en toegankelijke staat gebracht. Bij de digitale objecten willen we dus ook de juiste metadata ontvangen en de metadata die we ontvangen, moeten, net als de digitale objecten, ook zelf worden ingenomen, waarbij een aantal controles op bijvoorbeeld veiligheid en volledigheid worden uitgevoerd. Ook bij andere werkprocessen is het goed je bewust te zijn van het verschil tussen objecten en metadata. Bij het werkproces Aanbieden bijvoorbeeld, zijn we vanouds gewend om te werken met openbaarheidbeperkingen. Conform de wettelijke regeling worden openbaarheidbeperkingen vastgelegd bij overdracht. De termijn gedurende welke de beperking van kracht is, wordt geregistreerd in het archiefbeheersysteem. En dat zorgt er voor dat niets geraadpleegd kan worden waar een beperking op rust. Er is ten slotte een procedure voor opheffing van de beperking op individueel verzoek en op 1 januari worden alle archiefbescheiden waar de termijn in het afgelopen kalenderjaar van verlopen is op raadpleegbaar gesteld. Prima geregeld dus in de analoge wereld en in principe identiek toepasbaar in de digitale wereld. Bij de recent gevormde digitaal geboren archiefbescheiden komen openbaarheidbeperkingen relatief ook vaak voor. Maar nu de metadata. Daar hebben wij in de analoge wereld nooit met openbaarheidbeperkingen gewerkt. Maar we merken nu dat het, uit het oogpunt van privacybescherming, ook nodig kan zijn een beperking op de openbaarheid van metadata aan te brengen. Dat heeft vrij vergaande consequenties voor je beheersysteem en het vergt een principieel goede borging van het onderscheid data – metadata. Wij hebben in onze tekening van het E-depot het onderscheid data – metadata in werkprocessen expliciet aangegeven. In de processen met contacten met leveranciers en de processen Aanleveren en Service verlenen is dat niet gedaan, maar als er voldoende geweest had dat eigenlijk wel gemoeten. Dezelfde splitsing tussen objecten en metadata tekening ook in de systemen. Ik laat het u zien:
de interne gebruikers, ruimte was zie je in de
5
De drie systemen voor Ontvangen, Bewaren en Aanbieden zijn weergegeven door drie afzonderlijke roze blokken en binnen ieder roze blok zijn er twee witte blokken, één voor metadata en één voor objecten. Tussen die witte blokken binnen één roze blok zit een stevige verbinding in dezelfde witte kleur en tussen de roze blokken onderling loopt een dunnere zwarte pijl waarmee de richting wordt aangegeven van de stroom van objecten en metadata van leverancier naar gebruiker. En daarmee zijn we aangekomen bij het vierde aspect van de Stadsarchief visie op E-depot: verschillende systemen voor verschillende functies van het E-depot. 4. Gescheiden systemen We kijken weer even naar het OAIS-model.
Dit blok suggereert één geheel. Vanzelfsprekend bestaand uit allerlei onderdelen, maar conceptueel is het één geheel. Wij hebben ervoor gekozen in onze tekening duidelijker grenzen aan te brengen tussen de systemen. Dat is omdat wij in de praktijk ook werken met verschillende systemen, vaak ook van verschillende leveranciers, voor verschillende functies van ons E-depot. De systemen voor het Bewaren waar we nu mee werken zijn de metadata beheeromgeving Scope Archive, ontwikkeld door het Nationaal Archief van Zwitserland. En voor het bewaren van objecten hebben we nu dus recentelijk HCAP van Hitachi in gebruik genomen. Het beheer van de objecten in HCAP wordt overigens aangestuurd door de metadata in Scope. Vandaar die stevige witte verbinding die in de tekening zichtbaar is.
6
De systemen voor het Aanbieden van objecten en metadata waar we mee werken zijn op dit moment de Beeldbank, geleverd door Pictura BV en de Archiefbank, geleverd door Toutatis BV. Voor het ontvangen hebben we nu geen specifieke leverancier. Daar werken we nu, in een voorbereidende fase, alleen nog met zelf ontwikkelde tools. Dat geeft ons de ervaring om, wanneer we daar straks behoefte aan hebben, als opdrachtgever goed voorbereid een nieuw traject van aanschaf en / of ontwikkeling te starten. En hiermee heb ik eigenlijk ook gelijk de belangrijkste reden genoemd waarom wij werken op deze modulaire manier; waarom we afzonderlijke componenten van de systemen van het E-depot aanschaffen en installeren. Zo blijven we zelf In Control. Zo bouwen we onze eigen kennis op, kunnen we gebruik maken van voortschrijdend inzicht én houden we het overzicht en de sturing op het geheel. Ik zou liegen als ik zou zeggen dat we dit enkele jaren geleden, toen we begonnen met de ontwikkeling van de Beeldbank, al zo hadden bedacht. En ook bij de ontwikkeling van de Archiefbank dachten we nog niet in termen van ‘raadpleegomgeving van het E-depot’. Maar het werkt nu wel zo en hoewel deze modulaire ontwikkeling ook nadelen heeft, vinden we de voordelen hiervan groot en gaan we nu ook bewust verder met deze modulaire ontwikkeling. Behalve het belangrijke voordeel dat ik al noemde, het In Control blijven als archivaris, zijn er namelijk nog andere voordelen. Een eveneens heel belangrijk voordeel is dat deze modulaire opbouw ons dwingt er voor te zorgen dat de gegevens altijd tussen de systemen uitgewisseld kunnen worden. Wij creëren zelf metadata in de metadata beheeromgeving, bijvoorbeeld een inventaris van een archiefbestand, of we laten metadata creëren elders, bijvoorbeeld een index in India, en vervolgens moeten die metadata dan worden geïmporteerd in de raadpleegomgeving, en in het geval van externe vervaardiging moeten ze eerst geïmporteerd worden in de metadata beheeromgeving, in Scope dus. Zo’n transport gaat alleen goed als je gebruik maakt van eenduidige standaarden. Voor de inventarissen konden we gebruik maken van de internationale EAD-standaard; voor indexen hebben we zelf een standaard ontwikkeld omdat er geen vergelijkbare internationaal geaccepteerde indexenstandaard is. We hebben die indexenstandaard ERD genoemd. Ook voor het tussen onze systemen uitwisselen van gegevens die de autorisatie van het raadplegen regelt hebben we een standaard ontwikkeld. Die standaard heet ARD, maar daar zijn we zelf nog niet helemaal tevreden mee. Over de inhoud van deze standaarden willen we binnenkort graag overleggen met jullie, onze vakgenoten. Op dit moment wil ik alleen aangeven dat het feit dat wij binnen onze eigen organisatie werken met verschillende systemen, ons heeft gedwongen te werken met standaarden voor de uitwisseling van gegevens. En dat is natuurlijk ook de basis waarop we straks die gegevens ook kunnen delen met anderen. Dat is dus een voordeel van de modulaire opbouw van ons E-depot. De andere voordelen van deze modulaire opbouw zijn kleinschaliger en praktischer van aard. Zo is voor ons van groot belang dat we op deze manier de financiën beheersbaar houden. Wij zijn niet sterk in het regelen van miljoenen euro’s voor de ontwikkeling van onze systemen. Onze budgetten zijn bescheiden. En deze manier van modulaire opbouw vergt ook slechts ‘modulaire opbouw’ van ons budget, en dat lukt ons wel. Per module kun je ook snel resultaat tonen. De Archiefbank bijvoorbeeld is een succes niet alleen voor de gebruikers maar ook voor ons bestuur, want de Archiefbank toont aan dat digitale ontwikkeling niet alleen geld kost, maar ook geld genereert. Nog zo’n bijkomend voordeel van de gescheiden systemen en modulaire opbouw van het E-depot is het feit dat we onze organisatie ook ‘modulair’ kunnen meenemen in de cultuuromslag. Iedereen in het bedrijf opleiden en enthousiast maken is een taak die ons niet meevalt. We houden plenaire voorlichtingssessies gehouden, we geven workshops, we regelen individuele inwerktrajecten en we zetten verleidingstactieken in zoals een ‘digitaliteitscarrousel’, een ‘midzomerdigitaliteitsfeest’ en geldbedragen te winnen bij ‘digital challenges’. Maar een cultuuromslag blijft een moeizaam proces. En we zijn dus blij dat we de organisatie langzaam mee kunnen nemen ‘per module’.
7
Filosofie Stadsarchief Amsterdam werkwijze E-depot In het begin van deze presentatie heb ik u aangekondigd dat ik behalve onze visie op het E-depot ook iets zou zeggen over de filosofie achter onze manier van aanpak. En daar wil ik dan ook gelijk mee afronden. Die filosofie achter onze werkwijze kan worden samengevat als ‘Learning by doing’ oftewel ‘leren door te doen’. Het ‘leren door te doen-concept’ is ontwikkeld door Nobelprijswinnaar en hoogleraar economie Kenneth Arrow. Het is een economisch concept en het staat in principe voor het vermogen om tijdens repeterende werkzaamheden de productiviteit te verhogen. De productiviteitsverhogingen worden meestal bereikt door het verkrijgen van ervaring en het doorvoeren van kleine verbeteringen na hernieuwde ervaring. Zo hebben we bijvoorbeeld bij de grootschalige digitaliseringsprojecten bij ieder project het werkproces een stapje verder ontwikkeld. De productie is nu optimaal en zeer efficiënt. En de ervaring van deze projecten, met name de tools die bij de projecten zijn ontwikkeld, zijn van groot belang geweest bij het vormgeven van onze ideeën over het controleren voorafgaand aan de inname in de bewaaromgeving. Het ‘learning-by-doing’ mechanisme is, zo zegt Kenneth Arrow, ook de motor voor innovaties en technische veranderingen. En zo werkt het bij ons inderdaad ook. Ik kan nog meer voorbeelden noemen, maar dit lijkt me een mooi moment om deze inleiding over de visie van het Stadsarchief op het E-depot af te sluiten, want ik denk dat u inmiddels zit te popelen om te horen over ons nieuwe bewaardepot. Daarom geef ik nu graag het woord aan mijn collega Sander Ujzanovitch.
8