STMRMI
Opinie: Alles op inte Tussen droom en daad -RXIVRIX LIIJX HI EVGLMIJ[IVIPH SRXWPSXIR IR LSI 2EXYYVPMNO OER LIX EPXMNH FIXIV ^S[IP O[EPMXEXMIJEPWO[ERXMXEXMIJ1SIXEPPIWSTMRXIVRIXIRQSIXHEXKVEXMW#/YRRIR[IEPSR^I EVGLMIZIRHMKMXEEPSRXWPYMXIR# -ZS >ERHLYMW FMNX MR HI^I VIIOW EVXMOIPIR LIX WTMXW EJ IR SRXTSTX ^MGL EPW IIR EVGLMZEVMW ^SRHIV KVIR^IR ,MN FITPIMX IVJKSIHMRJSVQEXMI HMKMXEEP ^SRHIV FEVVMrVIW ^SZIIP QSKIPMNO FIWGLMOFEEVXIWXIPPIR,MN^MIXKIIR[IVOIPMNOIXIGLRMWGLINYVMHMWGLIJMRERGMtPIIRQEEX WGLETTIPMNOIFIPIQQIVMRKIR=SPEHI0YWIRIXZSIVXHMZIVWIWTVEEOQEOIRHIIREGXYIPIZSSV FIIPHIRIRMHIItREER[EEVMRLIXHMPIQQEZSSVLIXZSIXPMGLXOSQX>SEPW^MNWXIPXWXEER XYWWIRHVSSQIRHEEH[IXXIRMRHI[IKIRTVEOXMWGLIFI^[EVIR7ERHVE7EGLIV*PEEXVMGLX LEEVFPMOSTHI[IXKIZIV>MNXSSRXMRLEEVEREP]WIZERHIFIWGLMOFEEVWXIPPMRKZEREGXYIPI SZIVLIMHWMRJSVQEXMI EER HEX ZIVWGLMPPIRHI FIWXYYVWRMZIEYW IR ZIVWGLMPPIRHI OEFMRIXXIR FIPIMHWZSSVRIQIRWZIV[SSVHIRHMIIPOEEVXIKIRWTVIOIR>MNFITPIMXIIR MRXIV REXMSREPI LIPHIVI OIY^I ZSSV SJ[IP LIX TVSJMNXFIKMRWIP SJ[IP LIX TYFPMIO HSQIMRFIKMRWIP )PPIR *PIYVFEE]ZVEEKX^MGLXIVIGLXEJSJ[IHEX[IPOYRRIREPPIWHMKMXEEPFIWGLMOFEEVWXIPPIR IRLSI#+IPYOOMK^MIX^MNSSOIIRSTPSWWMRK,IXTYFPMIOOERIIRFMNHVEKIPIZIVIREERLIX REHIVSRXWPYMXIR MRHI\IVIR ZERSR^IEVGLMIZIRIRGSPPIGXMIW%PPIIR^SFIVIMOIR[IIIR STXMQEPIXSIKEROIPMNOLIMHIRZMRHFEEVLIMHZERSRWQEXIVMEEP)IRQEXIVMtPIFIPSRMRKZSSV LIXTYFPMIOMRHIZSVQZERFMNZSSVFIIPHWGERXIKSIHSJ^IPJWFIXEPMRKWPYMX^MNRMIXYMX)IR WGERXIKSIHZIVXIKIR[SSVHMKXIIR[EEVHI NIQEKKVEXMWIIREERXEPWGERWHS[RPSEHIR [EEVNIRSVQEEPKIWTVSOIRZSSVQSIXFIXEPIR IRHYWKEEX)PPIR*PIYVFEE]MRIPOKIZEP RMIXYMXZERKVEXMWFIWGLMOFEEVWXIPPIRZEREPLIXQEXIVMEEP >IPJ WGLVIIJ MO IIVHIV MR QMNR EVXMOIP %VGLMZEVMW MR IIR [IVIPH ZER QEVOX IR WXVMNH MR HMX^IPJHI FPEH "SDIJFWFOCMBE RYQQIV %VGLMIJMRWXIPPMRKIR ZIVOIVIR MR HI PY\I TSWMXMI HEX ^I FIWGLMOOIR SZIV ZIIP IR YRMIOI GSRXIRX [EEV IGLX ZVEEK REEV MW ^SRHIV EERHIIPLSYHIVWHMI^MGLHVYOQEOIRSZIVHII\TPSMXEXMIZEREPHMIWGLEXXIR;IP¦IRHEX MWRMIY[¦^MNRIVFIWXYYVHIVWIRWYFWMHMtRXIRHMI^MGLMRXSIRIQIRHIQEXIEJZVEKIRSJ IV[EXOER[SVHIRXIVYKZIVHMIRHEEREPHMIMRXIVRIXOPERXIR,IX2IHIVPERHWIQMRMWXIVMI ZER 3RHIV[MNW 'YPXYYV IR ;IXIRWGLETTIR LIIJX HMX ^IPJW EPW ZSSV[EEVHI KIWXIPH FMN HI WYFWMHMIZIVPIRMRK ZSSV LIX WEQIRZSIKIR ZER HI KVSSXWXI KIRIEPSKMWGLI HEXEFEWIW MR 2IHIVPERH+IR0MEWIRHI(MKMXEPI7XEQFSSQ+IHEGLX[SVHXEERFIXEEPHIPMHQEEXWGLET TIRIR^IPJWEERLIXHSSVZIVOSTIRZERHIPMGIRXMISTLIXKIFVYMOZERHIKIRIEPSKMWGLI HEXEFEWIEERIIR%QIVMOEERWIMRXIVRIXSRHIVRIQMRK3THMIQERMIVOVMNKNIMRHIVHEEH[EX XIVYK ZER NI MRZIWXIVMRKIR 1MRWXIRW qqR 2IHIVPERHW KIQIIRXIEVGLMIJ LIIJX HMI PEEXWXI WXETSZIVMKIRWEPIIRTEEVNEEVKIPIHIRKI^IX ;ILIFFIRREEWXIIRMHIEPI[IVIPHIIRQEXIVMtPI[IVIPH[EEVMR7MRXIVOPEEWMIQERHMWHMI EP^MNRGEHIEYXNIW^IPJQSIXFIXEPIRYIRMO3ZIVHMXWTERRMRKWZIPHKEERSRHIVWXEERHI EVXMOIPIRIRMR^SIIRWTERRMRKWZIPHSRXWXEERHIQIIWXFSIMIRHIHMWGYWWMIW/SQQEEV STQIXY[FMNHVEKIR
(SSV-ZS>ERHLYMW Het is mogelijk gedigitaliseerde archiefinformatie zodanig beschikbaar te stellen dat deze door iedereen kan worden gebruikt op een manier die hem of haar zelf het beste lijkt. In de praktijk gebeurt dit in het archiefwezen echter zelden. Waarom niet? Bij het toegankelijk maken of ontsluiten van archiefinformatie worden door een archiefdienst vaak databases ('nadere toegangen' of 'indexen') samengesteld met informatie die wordt overgenomen uit een archiefbron. Doordat de informatie in het archief op deze wijze wordt gestructureerd, kan er geavanceerd in worden gezocht en kan het zoekresultaat netjes in kolommen op de website worden gepresenteerd. De toegankelijkheid van de bron neemt toe. Aan de nadere toegang worden vaak scans van de originele archiefstukken gekoppeld. En dankzij de nadere toegang worden deze dan door de gebruiker teruggevonden. Ook dit verbetert de toegankelijkheid van het archief. Maar meestal blijft het daartoe beperkt: de nadere toegang wordt gebruikt om de archiefstukken te kunnen vinden. Op de website wordt daarvoor een zoekformulier gemaakt – al dan niet voor uitgebreid zoeken. Als ik een andere vraag wil stellen dan met het zoekformulier mogelijk is, kan het niet. Beperkingen Er zijn vele voorbeelden: zij zijn allemaal gemaakt met de beste intenties en het zijn prima producten. Voor de duidelijkheid kiezen we er één. Via www.drenlias.nl zijn de Drentse armenkolonies toegankelijk gemaakt en het zoekformulier is gericht op genealogen: u kunt zoeken op persoonskenmerken, zoals achternaam. Maar wellicht wil een sociaal-historicus een selectie van alle personen afkomstig uit een bepaalde stad, of een overzicht van de herkomst van de bedeelden. Met behulp van de website is dat niet mogelijk. Uit de presentatie van het zoekresultaat blijkt echter dat deze informatie bij het toegankelijk maken wel is opgenomen in de nadere toegang.
6IRq7TSVO 6IHEGXIYVZERLIX"SDIJFWFOCMBE
20 archievenblad
Open erfgoed voor iedereen!
november 2009
STMRMI
ernet? staan wetten in de weg… Waarom zou ik als klant van een archief dit soort beperkingen accepteren? Misschien accepteer ik het wel niet! Maar als ik deze beperkingen niet accepteer, moet ik rechtstreeks contact opnemen met de archiefdienst. De hoeveelheid van dit soort vragen kan verrassend hoog worden, wat de werkdruk van de medewerkers niet ten goede komt. Deze vinden misschien wel dat zij iets beters te doen hebben dan dit soort vragen helpen beantwoorden. Wellicht gaat het zelfs wel zo ver dat zij pas actie ondernemen als er een aanbevelingsbrief van een professor is bijgesloten! Dan zijn we weer terug in de negentiende eeuw, toen het archief ook alleen toegankelijk was als u hoorde bij het intieme kringetje rond de archivaris. En dat terwijl er technische mogelijkheden zijn om de nadere toegang breder toepasbaar aan uw publiek beschikbaar te stellen. Ook The National Archives in Engeland streeft dit na: "Coding our information in a way that machines and developers can interpret might allow audiences to access and re-use our records directly." Er zijn naast technische, ook juridische, economische en maatschappelijke aspecten gemoeid. Maar geen van deze aspecten vormen een belemmering om het erfgoed definitief helemaal open te stellen voor iedereen. Techniek Een archiefdienst kan om te beginnen de nadere toegang als Excel-sheet of Access-bestand op de website zetten, zodat iedereen het gehele bestand kan downloaden. Er zullen meer mensen gebruik van maken dan u denkt. Wie weet wat voor verrassende uitkomsten het oplevert: nieuwe historische artikelen van misschien wel hele goede amateurs – over nieuwe onderwerpen. Een meer geavanceerde techniek is om de database rechtstreeks bevraagbaar te maken. Dit gebeurt bijvoorbeeld bij veel bibliotheekdiensten, zodat een zoekopdracht kan worden verspreid over verschillende bibliotheken. Hiervoor is het bibliotheekprotocol SRU (Search/Retrieve via URL) ontwikkeld. Deze techniek wordt bijvoorbeeld gebruikt op de website www. librarything.com. Via deze website kunt u als particulier een catalogus samenstellen van uw boekencollectie. Hiervoor hoeft u niet alle informatie over een boek in
te voeren. U kunt op zoek naar het juiste boek in de catalogus van bijvoorbeeld de Koninklijke Bibliotheek en de beschrijving overnemen of koppelen. De informatie uit de bibliotheekcatalogus is zonder beperking beschikbaar gesteld om een leuke website mee te maken voor boekenverzamelaars en -enthousiastelingen. SRU is een voorbeeld van wat in het algemeen een webservice wordt genoemd: de bibliotheekcatalogus biedt de dienst aan om op afstand in het systeem te kunnen zoeken op alle mogelijke manieren. Dergelijke webdiensten kunnen ook archiefdiensten ontwikkelen. Er zijn voldoende open standaarden beschikbaar om het mee te realiseren. Dat is geen rocket science meer. Recht Er ligt een grens van wat is toegestaan bij de beperkingen die worden gesteld door de Archiefwet, wetgeving voor privacy-bescherming en auteursrecht. Het
Tekening: Willem Küller.
belang en de veiligheid van anderen mag niet in het geding zijn. Maar bij een groot deel van een archiefcollectie, grofweg alles ouder dan honderd jaar, gelden deze beperkingen niet. Het auteursrecht kan u in dat geval overigens wel helpen om eigen voorwaarden te stellen aan het
november 2009
gebruik door anderen. Want dankzij het auteursrecht mag niet iedereen zomaar uw nadere toegang kopiëren. Maar waarom zou u uw nadere toegang juridisch willen beschermen? Er zou toch geen auteursrechtelijke drempel moeten zijn om de voortgang van de historische wetenschap te belemmeren? In het veld van wetenschappelijke publicaties bestaat in dat kader het initiatief van Open Access. Ook hierin zijn dus al bestaande inzichten en projecten met succes uitgevoerd. Zijn deze niet ook relevant voor informatie die door archiefdiensten beschikbaar wordt gesteld? Ik denk het wel. Het beste is daarom mijns inziens om informatie in het publieke domein beschikbaar te stellen. In dit verband is Creative Commons relevant, het internationale initiatief voor nieuwe auteursrechten in een nieuwe multimediale samenleving. Creative Commons maakt het mogelijk om toch enkele beperkingen op te leggen aan het gebruik.
Zelf publiceer ik mijn werk altijd onder de licentie 'Naamsvermelding-Gelijk delen 3.0'. Dit houdt in dat iemand die mijn werk gebruikt, moet aangeven dat ik het heb gemaakt en dat hij het onder dezelfde voorwaarden weer beschikbaar moet stellen. Dat laatste voorkomt dat iemand plotseling zelf auteursrecht gaat claimen.
archievenblad
21
STMRMI
Geld
De kosten voor digitalisering en vooral het digitaal beschikbaar houden van het materiaal moeten worden gedragen. Voor mijn website betaal ik die zelf. Voor archiefdiensten zijn drie opties denkbaar: de overheid financiert, de gebruiker betaalt of de kosten worden gedragen door activiteiten die inkomsten opleveren. Denk bijvoorbeeld aan advertentieinkomsten. Wellicht is er voor archiefdiensten geen andere mogelijkheid dan om de gebruiker te laten betalen. Realiseert u zich echter dat de drempel voor het gebruik daarmee wordt verhoogd. Voor de gepassioneerde genealoog is betalen voor scans misschien niet erg, en dat geven ze dus in marktonderzoeken ook aan. Maar willen we niet ook minder snel geïnteresseerden naar het archief trekken? Misschien heeft de overheid of een subsidiefonds daar wel geld voor over. In musea duikt om de zoveel tijd een vergelijkbare discussie op. Men vraagt zich af of een museum (voor bepaalde doelgroepen, zoals jongeren) gratis toegankelijk moet zijn. De overheid kan dat dan financieren. Maatschappij Als u er voor kiest om de gebruiker te laten betalen, doe dat dan consequent. Het is niet eerlijk alleen de genealoog te laten betalen en de database gratis beschikbaar te stellen aan een wetenschapper. In een maatschappij waarin amateurs zoveel vrije tijd hebben dat zij zich kunnen ontwikkelen tot semi-professionals, is dat onderscheid vooraf niet te maken. We zullen het onderscheid achteraf wel zien aan de kwaliteit van het onderzoeksresultaat. Omdat de samenleving steeds verder democratiseert, moeten we dus niemand uitsluiten om van archiefmateriaal gebruik te maken, ook niet digitaal. Dat geldt niet alleen voor amateurs (omdat ze geen wetenschapper zijn), maar ook voor jongeren (omdat ze niet bereid zijn te betalen) en ondernemers (omdat ze geen commercieel gebruik mogen maken van het materiaal). Ik heb er bij de beschikbaarstelling van teksten op mijn website met de keuze voor deze specifieke Creative Commonsvariant bewust voor gekozen dat iemand anders wel geld mag verdienen aan mijn werk. Als maar aan de genoemde voor-
waarden is voldaan. Als dat betekent dat mijn werk daardoor extra goed of mooi wordt verspreid, zonder dat ik daar zelf geld, tijd en energie in hoef te steken, ben ik daar alleen maar blij mee. Voor archiefdiensten geldt volgens mij hetzelfde. Het kan wel betekenen dat iemand anders goede sier maakt met uw inspanning en investering. Het kan ook betekenen dat iemand een slecht product maakt op basis van uw inspanning en investering. Maar laat duizend bloemen bloeien. Conclusie Geen van de genoemde aspecten vormt een belemmering om open erfgoed voor iedereen te realiseren. Praktische bezwaren wellicht wel. Maar deze zijn te overwinnen. Met het idee van 'open erfgoed' als uitgangspunt kan worden gezocht naar praktische oplossingen. Het archiefwezen kan dan aansluiten bij de open samenleving waarin we leven, ondersteund met technische, juridische en maatschappelijke ontwikkelingen, die het publieke en openbare archiefwezen op het lijf zijn geschreven. Dus twijfel niet langer en open uw erfgoed nu, voor iedereen! -ZS >ERHLYMW MW ^IPJWXERHMK -'8EHZMWIYV ZSSV EVGLMIJHMIRWXIR IR VIHEGXIYV ZER LIX "SDIJFWFOCMBE 2SXIR 1SPWJEFBOE&OBCMF5IF/BUJPOBM"SDIJWFT 0OMJOF4USBUFHZ [[[REXMSREPEVGLMZIWKSZ YOHSGYQIRXWTVSZMHIIREFPITHJ T :IVKIPMNOHIPI^MRKZER4EYP/IPPIVST() GSRJIVIRXMILXXT[[[HIRRPKIXEW WIXEWT\#MH!GSRJIVIRXMI4EYP /IPPIV THJ EWWIXX]TI!EXXEGLQIRXW
Wetten in de weg, en praktische bezwaren (SSV=SPEHI0YWIRIX Vroeger begon je je scriptie met een woordenboekdefinitie; nu google je even – wat leuker is, want het levert vooral veel context. Zo leidt de term 'open archieven' ons naar berichten over Open Access-bewaarplaatsen
22 archievenblad
november 2009
(voor toegang tot wetenschappelijke artikelen), over openbaarheid van archieven en over de 'open archieven dag', wanneer de deur van het gebouw wijd open staat voor het publiek. Opmerkelijk genoeg verwijst Google niet naar het concept 'open' in verband met de archiefwereld in het digitale tijdperk. Dat is vreemd. 'Open' is in, een vaandel van diverse groeperingen, vaak geboren uit verzet tegen wat ervaren wordt als monopolistische en hebberige uitwassen van de markt: dwingelandij van softwaregiganten, bezitterigheid van uitgeefconcerns. De 'open' beweging wordt soms geassocieerd met wereldvreemde nerds en hips, maar achter dat imago gaat een grote groep kritische activisten en denkers schuil die maar beter serieus genomen kan worden. Hun strijd om het behoud van het publieke domein dat ingeperkt dreigt te worden door maatregelen ten gunste van marktpartijen is, gezien hun verantwoordelijkheid voor de toegang tot het nationale geheugen, bij uitstek een zaak waar archiefinstellingen zich druk over zouden moeten maken. Of ze dat ook echt doen? Voor een recente publieke consultatie van de EU over een Groenboek 'Auteursrecht in de kenniseconomie' brachten Nederlandse erfgoedinstellingen gezamenlijk een uitgebreide reactie in over problemen met de auteursrechtwetgeving. Ondertekend door heel rijtje archiefinstellingen en hun branchevereniging BRAIN. Maar een aantal belangrijke archieven ontbreekt in de lijst. Monopolisme Waarom? Hebben zij geen last van de onzinnige beperkingen op verweesde werken, van verlenging van termijnen en van strakke regelgeving die de complete creatieve en intellectuele productie van de laatste eeuw gegijzeld houdt, omdat een klein deel te gelde gemaakt kan worden? Zijn ze dan niet bezorgd, of boos? Wie dat nog niet is, zou eens een weekeindje op het werk van rechtendeskundigen-meteen-missie als Boyle en Lessig moeten studeren. Ja, die boeken gaan nogal erg over de situatie in de Verenigde Staten. Maar wat leggen ze prachtig en overtuigend uit, met citaten van de grondleggers van de Amerikaanse grondwet en filosofen uit het Frankrijk van Verlichting en
STMRMI
Revolutie, hoe auteursrecht ooit bedoeld was. Als je dat leest, besef je hoe het gouden kalf van markt en bezit ons bestaan domineert. Je geest moet een draai maken om de denkers van toen te kunnen volgen, die meenden dat producten van de geest uiteindelijk behoren aan de gemeen-
.IKIIWXQSIXIIRHVEEMQEOIR SQHIHIROIVWZERXSIRXIOYRRIR ZSPKIRHMIQIIRHIRHEXTVSHYGXIR ZERHIKIIWXYMXIMRHIPMNOFILSVIR EERHIKIQIIRWGLET schap. Dat was geen flower-power of communisme avant la lettre; het waren harde koppen die ervan overtuigd waren dat creatieve en intellectuele werken het meest bijdragen aan kennis en (economische) vooruitgang als ze vrij beschikbaar zijn, omdat auteursrecht het risico van monopolisme in zich bergt. De default was daarom het publieke domein, het auteursrecht niet meer dan een tijdelijke ontheffing voordat het werk vrij viel, om makers de gelegenheid te bieden voldoende vruchten van hun creatieve arbeid te plukken. Kom daar vandaag de dag eens om! Beetje durf Van archiefinstellingen, die de geschiedenis en achtergrond van wet- en regelgeving zelf voor ons bewaren, zou je verwachten dat ze er dwars voor gaan liggen om informatie vrij toegankelijk te maken. Zoals de Australische National Archives die in 2005 aankondigden ook werken waar nog rechten op rusten te
1EEVEVGLMIJMRWXIPPMRKIRLSYHIR RMIXZERVMWMGSWIRHEX^IRMIX QEWWEEP[EVQPSTIRZSSVSTIR LIIJXXIQEOIRQIXLYRLERK REEV^IOIVLIMHIRGSRXVSPI zullen digitaliseren. Rechthebbenden die bezwaren hadden dat materiaal op de website werd geplaatst, werden uitgenodigd dat te laten weten. Twaalf maanden en een miljoen scans verder had zich niemand gemeld. Het mocht niet en toch
gebeurde het, met argumenten van redelijkheid en een beetje durf. Erfgoedinstellingen in Nederland hoor je zelden of nooit verklaren dat ze auteursrechten aan hun laars lappen als de rechten van burgers in het gedrang komen. Misschien doen ze dat wel eens, stilletjes. Beter zou het zijn als ze het hardop deden, om een voorbeeld te stellen. Schat het risico in, maak een potje voor eventuele schikkingen, en kijk wat er gebeurt. In Nederland heb je niet zomaar een miljoenenclaim aan je broek voor het publiceren van andermans ansichtkaart. Maar archiefinstellingen houden niet van risico's en dat ze niet massaal warmlopen voor 'open' heeft te maken met hun hang naar zekerheid en controle. Zo melden veel archiefinstellingen doodleuk dat je toestemming moet vragen om een afbeelding van achttiende-eeuws origineel te reproduceren – alsof het hun eigendom is. Publiek domein, hoezo? Om nog te zwijgen over vergoedingen. Klein en kneuterig Zo konden de partners van Europeana het op 14 september in Den Haag ook niet eens worden over hun aangekondigde Public Domain Charter, dat niet verder zou hebben gereikt dan dat wat nu in het publieke domein is, ook in het publieke domein moet blijven. Dat lijkt niet bepaald een revolutionaire uitspraak voor nationale instellingen die met Europeana burgers toegang willen bieden tot hun erfgoed. Het wordt je droef te moede dat zelfs zo'n uitspraak voor hen een brug te ver is. Ook de voorzitter van de European Digital Library Foundation, Elisabeth Niggeman, had moeite de boodschap te verpakken en verwees naar overheden die erfgoedinstellingen dwingen hun collecties te gelde te maken. Dat soort geluiden hoor je in Nederland ook ter verdediging van de kleine plaatjes op websites en kneuterige regels over reproduceren. Netto kan het voor een gemiddelde instelling in elk geval niet veel opleveren, als je bedenkt wat een administratie het met zich meebrengt. Dus waarom niet royaal het reglement van je site geveegd en hele vluchten plaatjes losgelaten op het wereldwijde web? Ja, dan kunnen mensen zomaar van alles met je spullen gaan doen, inderdaad. Of dat niet juist de bedoeling is!
november 2009
Share Voor archiefinstelingen die huiverig zijn voor 'open' wordt het leven nog ingewikkelder nu ze iets met Web 2.0 moeten gaan aanvangen. Dat hangt immers van delen aan elkaar. Sociale sites zijn gebouwd rond dat knopje 'share'. Instellingen die controle willen houden over wat mensen met hun materiaal doen, hoeven niet eens te proberen mee te spelen. Bezoekers worden immers deelnemers, niet om te doen wat jij voor ze bedacht hebt, maar om te doen wat zij willen. Het zou mooi zijn als erfgoedinstellingen zich ten doel stelden ze daartoe de gelegenheid te geven, en dat is niet zo vanzelfsprekend als het klinkt. De 'open' mentaliteit die verwacht wordt voor samenwerken op het web gaat veel collectiebeheerders niet gemakkelijk af. Maar het zou al schelen als ze minder inzoomden op beperkingen en problemen en onbevangen zouden kijken naar wat het nieuwe web te bieden heeft om je werk beter te doen. Het Australische archief voerde de afstand – in kilometers – tussen de gebruikers en het gebouw aan als argument waarom voor adequate en eerlijke dienstverlening aan burgers het materiaal op het web beschikbaar moest zijn. Vijf jaar later is in Nederland de ervaringsafstand tussen de onderzoeker en de deur van de studiezaal dikwijls zo groot, dat het achterhaald is vol te houden dat aan de eis van vrije toegang is voldaan wanneer een stuk in de studiezaal is in te zien. Het web is de studiezaal van de 21ste eeuw en daar hoort archiefmateriaal dat toegankelijk is in principe ook beschikbaar te komen, om te lezen, te downloaden, te annoteren en te printen. Dat is geen extra dienstverlening, maar de norm in de digitale samenleving. Vrij is vrij 'Open' beschikbaarstelling, die het publieke domein versterkt, bestaat in diverse varianten. Esther Hoorn heeft uitgelegd hoe de Creative Commons licenties, die regelen wat je vrijgeeft, kunnen worden toegepast door de erfgoedsector. Als instellingen dat zouden doen, was er al veel gewonnen. Voor verweesde werken, waarvoor een CC-licentie niet kan, Lees verder op pagina 25
archievenblad
23
STMRMI
Vervolg van pagina 23 zouden erfgoedorganisaties de grenzen moeten opzoeken. Voor de publieke zaak, maar ook uit respect voor de verzamelaars en fotografen die collecties schonken in de verwachting dat ze bewaard en gebruikt zouden worden. Amateurfotografen draaien zich om in hun graf als er weer eens wordt besloten vanwege de rechten hun werk veilig in de kast te laten staan. Vrijgeven is één manier, een andere is om met je gebruikers nieuw, vrij materiaal te maken. In juni vond Wiki loves art NL plaats, waarvoor 46 musea amateurfotografen toelieten om van werken in hun collecties foto's te maken voor de Wikipedia. Daardoor zijn nu goede afbeeldingen van belangrijk erfgoed, zoals
%QEXIYVJSXSKVEJIRHVEEMIR^MGL SQMRLYRKVEJEPWIV[IIVIIRW[SVHX FIWPSXIRZER[IKIHIVIGLXIRLYR[IVO ZIMPMKMRHIOEWXXIPEXIRWXEER schilderijen van Bosch en Van Gogh, vrij beschikbaar onder een CC-licentie. Al is het maar een fractie van wat er in musea staat, het is een enorme stap. Want werk dat in het publieke domein is, kan nu ook werkelijk door iedereen gebruikt worden. En ja, het is mogelijk dat iemand een bizniz begint van T-shirts met een vaag plaatje van De Marskramer erop (wat natuurlijk al lang gebeurd is, met een plaatje gescand uit een boek). Want vrij is vrij, om te gebruiken en hergebruiken en nieuwe dingen van te maken. Het Stadsarchief Amsterdam scant op verzoek en tegen betaling voor gebruikers. Maar omgekeerd, kunnen archieven gebruikers de opnamen die ze met hun digitale camera maken niet terug laten leveren, compleet met tags? Zou het wat zijn bezoekers te vragen om voor elke opname die zij voor zichzelf maken er twee extra te maken: 'use one, scan three' (zoals in Flickr groepen: 'rate three, post one')? Is er een technische opstelling denkbaar, met camera en computer, die elke opname opslaat voor de bezoeker en tegelijkertijd toevoegt aan een gedeelde database? Valt er een 'strooptocht' te organiseren à la Wiki loves art om in archie-
ven zoveel mogelijk opnamen te verzamelen over een specifiek thema? Kunnen instellingen gebruikersgroepen die alles bijeen willen brengen over zeelui, of veemarkten, niet ondersteunen door hun databases open te zetten voor 'federated search' of harvesten of API's beschikbaar te stellen?
Hergebruik van overheidsinformatie Publiek domein of profijtbeginsel (SSV7ERHVE7EGLIV*PEEX
Set it free Ideeën als deze lijken zo wild niet meer als je eenmaal in het open veld staat en ziet wat er zoal gebeurt, bij erfgoedinstellingen en vooral daarbuiten. Boeiend door alle activiteiten van individuen en communities die nieuwe technologie gebruiken voor wat hen bezighoudt. Bedreigend door de slopende titanenstrijd tussen de grote marktspelers met als inzet de macht over informatie en wat wij ermee doen. Google doet na boeken nu ook kranten - en wat volgt? De beste bescherming van wat ons allemaal en niemand in het bijzonder toebehoort is niet er bovenop te gaan zitten maar het vrij beschikbaarstellen: 'If you love something, set it free', zeggen de geeks van de open beweging dan. Anno 2009 is dat meer wijsheid dan ons Hollandse 'Wie wat bewaart, die heeft wat'. =SPE HI 0YWIRIX [EW NEEV PERK YMX ZSIVIRHI WIGVIXEVMW ZER HI )YVSTIER 'SQQMWWMSR SR 4VIWIVZEXMSR ERH %GGIWW IR [IVOX RY EPW ^IPJWXERHMK EHZMWIYV IR SRHIV ^SIOIV -R WGLVIIJ ^MN ZSSV LIX TVSNIGX :MVXYIPI 3RHIV^SIOWVYMQXI (FWFO FO OFNFO "SDIJFGJOTUFMMJOHFO FO IFU TPDJBMF XFC 3T HMX QSQIRX KIIJX ^MN QIX 1EVMI.SWq /PEZIV GYV WYWWIR SZIV ;IF ZSSV IVJKSIHMRWXIPPMR KIR
2SXIR -RIIRVIGIRXIYMXWTVEEOSZIVIIROEEVXNI HEXKIFVYMOX[IVH^SRHIVXSIWXIQQMRKZER HIQEOIVPMIXHIVIGLXIV^[EEV[IKIRHEX HIIMWIVRMIXIGLXLEHKITVSFIIVHHI^EEO SRHIVPMRKXIWGLMOOIR>MILXXTFPSKMYWQIR XMWGSQSRZSPHSIRHIKITVSFIIVH LIXKIWGLMPMRHIVQMRRISTXIPSWWIR >MI7ERHVE*PEEX)FUIFGGFOWBOHFCSVJLTWFS HPFEJOHPQSFQSPEVDUJFTEPPSBSDIJFGJOTUFM MJOHFO %QWXIVHEQ LXXTHEVIYZE RPHSGYQIRX
november 2009
Elders in dit blad houdt Ivo Zandhuis in zijn artikel over beschikbaar stellen van digitale overheidsinformatie een pleidooi voor open erfgoed. De vraag is in hoeverre zijn pleidooi gehoor zal vinden bij de archiefinstellingen. In de huidige situatie wordt namelijk door archiefinstellingen een verschillend beleid gevoerd met betrekking tot hergebruik van archiefinformatie. In dit artikel wordt een beeld geschetst van de dagelijkse praktijk in het archiefwezen, maar wordt ook aandacht besteed aan ontwikkelingen in het beleid binnen de Europese Unie en in Nederland ten aanzien van (commercieel) hergebruik van overheidsinformatie in de dynamische fase. Uiteindelijk komt immers een deel van de documenten, die zich nu nog bij de archiefvormers bevinden, in de toekomst bij de archiefinstellingen terecht. Hopelijk kan dit artikel een aanzet geven tot een discussie binnen het archiefwezen over dit onderwerp. In 2006 hebben 66 Nederlandse archiefinstellingen meegedaan aan een enquête over het heffen van gebruiksvergoeding. Onder gebruiksvergoeding wordt daarbij verstaan: het heffen van een vergoeding op een reproductie, anders dan de kosten van het maken van een reproductie. Uit de antwoorden blijkt dat de helft van de aan de enquête deelnemende instellingen gebruiksvergoeding heft, de andere helft niet. Van de instellingen met een collectie kleiner dan vier kilometer heft de grote meerderheid geen gebruiksvergoeding. Opvallend is dat aan de keuze om niet te heffen meestal pragmatische overwegingen ten grondslag liggen. Slechts negen instellingen voeren louter principiële gronden aan voor het niet heffen en zijn aanhangers van het 'publiek domein'-beginsel: de belastingbetaler heeft al bijgedragen aan het beheer van de archiefbescheiden en hoeft dus niet nogmaals te betalen. Van archiefdiensten die een collectie beheren van vier kilometer of meer, heft de
archievenblad
25
STMRMI
meerderheid wel gebruiksvergoeding. Zestien van hen hebben aangegeven dat zij ten aanzien van alle door hen beheerde archiefbescheiden gebruiksvergoeding heffen. Twaalf instellingen heffen alleen gebruiksvergoeding op reproducties
&MNLIXFITEPIR[EXRYGSQQIVGMIIP KIFVYMOMWIR[EXRMIXWXIIOXIIR^IOIVI [MPPIOIYVHIOSTST
van beeldmateriaal. Vrijwel alle archiefdiensten die gebruiksvergoeding heffen maken onderscheid tussen commerciële publicaties en niet-commerciële publicaties en hanteren daarbij het profijtbeginsel: wie tot doel heeft winst te behalen met publiek bekostigde informatie, moet daarvan iets afstaan. Bij het bepalen wat nu commercieel gebruik is en wat niet, steekt een zekere willekeur de kop op. Gebleken is namelijk dat instellingen vaak, bij papieren publicaties, de oplage als criterium gebruiken. Bij oplagen onder de gehanteerde grens veronderstellen de archiefdiensten geen commercieel gebruik. Geconstateerd is dat de instellingen verschillende grenzen hanteren variërend van 50 tot 1000 exemplaren en het dus per instelling verschilt wat als commerciële publicatie gezien wordt. Ook signaleren enkele respondenten dat juist de 'grote jongens', in ruil voor bijvoorbeeld naamsvermelding, een x aantal exemplaren of een samenwerkingsconstructie, geen gebruiksvergoeding hoeven te betalen. Gevraagd naar de tarifering, geven zes archiefdiensten aan dat de bedragen voor de vergoedingen willekeurig tot stand zijn gekomen of niet te weten waarop de gevraagde vergoedingen gebaseerd zijn. Vijftien melden dat de tarifering bepaald is door benchmarking. Wie naar wie kijkt, is daarbij vaak niet duidelijk. In de enquête is tevens gevraagd naar de rechtsgrond voor het heffen. Zeven instellingen geven als rechtsgrond (mede) het auteursrecht op, zeven andere instellingen baseren zich (mede) op het eigendomsrecht, zeven instellingen noemen de legesverordening als rechtsgrond. Lang niet altijd worden deze rechtsgronden correct geïnterpreteerd en toegepast. Bovendien is gebleken dat eenderde van de instellin-
gen geen rechtsgrond voor het heffen kan aangeven, maar in de praktijk doet men het wel. Het probleem is dat de Archiefwet 1995 hier niet de benodigde duidelijkheid schept. Openbaarheid in de zin van de Archiefwet 1995 betekent recht op gratis inzage en het maken of laten maken van afbeeldingen en afschriften. De artikelen 14 en 19 hebben betrekking op de kosten voor het maken of het laten maken van reproducties, niets meer en niets minder. De gebruiksvergoeding is echter een vergoeding voor het verdere gebruik van de reproductie. De Archiefwet kent geen bepaling die het heffen van gebruiksvergoeding verbiedt. In die zin wordt de eigenaar van archiefbescheiden van de overheid dus
(I%VGLMIJ[IXOIRXKIIR FITEPMRKHMILIXLIJJIRZER KIFVYMOWZIVKSIHMRKZIVFMIHX geen beperking in handelen opgelegd. Aan de andere kant ontbreekt een duidelijke bepaling die gebruiksvergoeding toestaat eveneens. Het is aan de wetgever om hierover duidelijkheid te verschaffen. Europese Unie Als over de schouders van het Nederlandse archiefwezen gekeken wordt, dan blijkt dat de Europese Commissie vanaf eind jaren 1980 in toenemende mate oog voor de economische waarde van overheidsinformatie heeft. In 2000 werd de totale economische waarde van overheidsinformatie in de Europese lidstaten geschat op 68 miljard euro. De Commissie wil commerciële exploitatie van overheidsinformatie door de private sector bevorderen. In haar opdracht zijn vanaf 1989 een aantal studies verricht naar wet- en regelgeving in de lidstaten met betrekking tot beschikbaarstelling en mate van (commerciële) exploitatie van overheidsinformatie. Uit deze studies is gebleken dat er tussen de verschillende lidstaten grote verschillen in toegang tot en (commercieel) hergebruik van overheidsinformatie bestonden. Deze verscheidenheid aan wet- en regelgeving werd als een grote belemmering beschouwd voor de ontwikkeling van een Europese informatiemarkt. Uiteindelijk kwam de Europese Commissie daarom met een Richtlijn her-
26 archievenblad
november 2009
gebruik overheidsinformatie. De Richtlijn heeft als doel het stimuleren van de interne markt voor op overheidsinformatie gebaseerde producten en diensten. De Richtlijn is echter niet van toepassing op documenten waarop intellectuele rechten van derden rusten, noch op documenten in bezit van bibliotheken en archiefinstellingen. Ondanks het feit dat de Europese Commissie voorstander was van het leveren van reproducties van overheidsdocumenten tegen verstrekkingskosten, is het ingevolge de Richtlijn overheidsorganen toegestaan de integrale kostprijs te rekenen verhoogd met een winstopslag. Met name de landen waarin overheidsinstellingen hun informatie verkopen tegen marktprijzen waren fel tegen een bepaling die hun prijssoevereiniteit aan banden zou leggen. Het is verder toegestaan om voor commercieel en niet-commercieel hergebruik een verschillende tarifering te hanteren. In de Richtlijn zijn minimumvoorschriften vastgesteld. Het staat lidstaten vrij om een uitgebreider hergebruik mogelijk te maken. Nederland In Nederland zijn, op het niveau van de Rijksoverheid, vanaf 1997 verschillende nota's en rapporten over exploitatie van overheidsinformatie verschenen. Deze stukken hebben betrekking op nog bij de archiefvormers aanwezige informatie. Eind jaren 1990 onderscheidt de regering drie categorieën overheidsinformatie. De eerste categorie betreft basisinformatie van de democratische rechtsstaat zoals wet- en regelgeving, uitspraken van de rechterlijke macht en parlementaire informatie. Deze informatie is principieel openbaar en dient gratis te worden verstrekt. De tweede categorie heeft betrekking op bestuurlijke informatie die valt onder de Wet openbaarheid van bestuur (Wob). Deze informatie mag maximaal tegen verstrekkingskosten worden aangeboden. Ten aanzien van de derde categorie, de (elektronische) bestanden die niet onder de Wob vallen, hanteert het kabinet het profijtbeginsel. Gebruikers die in het bijzonder profijt trekken van de beschikbaarheid van overheidsinformatie dienen niet door de belastingbetaler te worden gesubsidieerd. In 2000 verkondigt het kabinet in de beleidslijn Naar optimale beschikbaarheid van overheidsinformatie een andere visie. Met betrekking tot bestandsgegevens
STMRMI
die niet onder de Wob vallen wordt nu uitgegaan van het beginsel van het publiek domein. Gesteld wordt dat bedrijven via belasting al hebben meebetaald aan de totstandkoming van de bestanden. Het kabinet is er daarom geen voorstander van om voor gebruik van de bestanden een prijs voor een licentie te vragen. Daarbij komt dat het kabinet oog heeft voor het economische potentieel dat in overheidsinformatie verborgen zit. Overheidsbestanden, ook die niet onder de Wob vallen, dienen op verzoek zo ruim mogelijk beschikbaar te zijn voor extern gebruik. Aan de afnemers zouden alleen de kosten van verstrekking in rekening moeten worden gebracht, eventueel vermeerderd met de extra kosten van bewerkingen die nodig zijn om gegevens te kunnen verstrekken. Een uitzondering hierop vormen de gegevensbestanden waarvan het gebruik en de prijsstelling geregeld is in specifieke wetgeving. Verondersteld wordt dat het welvaartseffect van overheidsinformatie tegen maximaal de verstrekkingskosten groter zal zijn dan de inkomsten die de overheid verkrijgt door de verkoop van licenties op het gebruik van die bestanden. Deze veronderstelling is bevestigd door onderzoek in 2001. Het kabinet is dus voor het creëren van ruime mogelijkheden voor hergebruik van overheidsinformatie, maar signaleert tegelijkertijd dat het voorbehouden van auteursrecht en databankenrecht door overheidsorganen op grote schaal gebeurt en dat de Wob de bestuursorganen geen belemmeringen oplegt als ze die rechten willen voorbehouden. In de beleidslijn wordt daarom een onderzoek naar de mogelijkheid van een Wet hergebruik overheidinformatie aangekondigd. De Wet hergebruik overheidsinformatie is er niet gekomen. Uiteindelijk is de Europese Richtlijn hergebruik overheidsinformatie eind 2005 geïm-
3ZIVLIMHWFIWXERHIRSSOHMIRMIX SRHIVHI;SFZEPPIRHMIRIRSTZIV^SIO ^SVYMQQSKIPMNOFIWGLMOFEEVXI^MNR ZSSVI\XIVRKIFVYMO plementeerd in de Wob. Het nieuwe hoofdstuk Hergebruik in de Wob is daarbij van toepassing verklaard op overheidsorganen in plaats van bestuursorganen. Als gekeken wordt naar het doel van de Richtlijn en de beleidslijn, namelijk dat hergebruik van overheidsinformatie zo veel mogelijk gestimuleerd moet worden teneinde grotere economische groei te bereiken, dan zijn er ten aanzien van de huidige wettelijke bepalingen een paar kritische kanttekeningen te plaatsen. Zo is het
naar huidig recht voor overheidsorganen nog steeds mogelijk om intellectuele eigendomsrechten voor te behouden. Sterker nog, in het nieuwe hoofdstuk Hergebruik is zelfs een bepaling opgenomen waaruit blijkt dat er in principe voorwaarden aan hergebruik mogen worden gesteld én dat er onderscheid gemaakt kan worden per categorie van gebruik. Verder schept de Wob de mogelijkheid om geld terug te verdienen met de vrijgave van overheidsinformatie voor hergebruik. Dit artikel bepaalt namelijk dat de prijs van het verstrekken en het verlenen van toestemming voor hergebruik niet hoger mag zijn dan de integrale kosten, vermeerderd met een redelijk rendement op investeringen. Dit is dus meer dan de verstrekkingskosten die de regering in de beleidslijn voor ogen had. De huidige Wob geeft zo een signaal af dat bij het verstrekken van informatie ten behoeve van hergebruik voorwaarden voor gebruik kunnen worden gesteld en dat bij die verstrekking door overheidsorganen geld kan worden terugverdiend. Open Erfgoed? Gesteld kan worden dat er nog een lange weg te gaan is voordat alle archiefdienstneuzen in de richting van open erfgoed staan. De vraag is allereerst of ze het wel willen. Om te beginnen zou het goed zijn als hierover binnen het archiefwezen een discussie wordt gevoerd. Waar kiezen wij voor: publiek domein of het profijtbeginsel? Daarbij zouden alle voors en tegens moeten worden afgewogen. Helaas is hier niet de ruimte om ze allemaal te behandelen. Hier wordt volstaan met twee aandachtspunten. Ten eerste, áls gekozen wordt voor het profijtbeginsel, is het dan niet beter af te zien van het door veel archiefinstellingen gevoerde beleid met betrekking tot het heffen van gebruiksvergoeding en in plaats daarvan naar de tarifering te kijken? Bezoekers kunnen de stukken kosteloos raadplegen in de studiezaal of via de website. Willen ze een kwalitatief goede afdruk, dan is dat mogelijk tegen betaling. Overigens moet wel opgemerkt worden dat er grenzen zijn aan het doorberekenen van kosten aan klanten. Te verwachten is dat bij hoge prijzen klanten sneller zullen overgaan tot het zelf fotograferen van documenten of zullen afzien van opdrachten, waardoor archiefdiensten weer inkomsten zullen derven. Ten tweede is in de discussie van hergebruik van overheidsinformatie steeds een dikke streep getrokken tussen bij archiefvormers aanwezige overheidsinformatie en overheidsinformatie die door archiefinstellingen beheerd wordt. Gezien het feit dat in de Lees verder op pagina 29
november 2009
archievenblad
27
STMRMI
Vervolg van pagina 27 toekomst steeds meer digital born materiaal door archiefvormers naar archiefdiensten zal worden overgebracht, is het zaak deze discussie te voeren voor alle fasen van het records continuum. 7ERHVE 7EGLIV*PEEX [IVOX FMN HI EJHIPMRK 3RHIV^SIOZERLIX2EXMSREEP%VGLMIJ>MNWXY HIIVHI IIVHIV HMX NEEV EJ EER HI EVGLMIJST PIMHMRK QIX IIR WGVMTXMI KIXMXIPH )FUIFGGFO WBO HFCSVJLTWFSHPFEJOH PQ SFQSPEVDUJFT EPPS BSDIJFGJOTUFMMJOHFO XI ZMRHIR ZME LXXTHEVI YZERPHSGYQIRX
2SXIR >MIZSSVYMXKIFVIMHIFILERHIPMRKZERHMX SRHIV[IVTIRFVSRZIVQIPHMRK%61*PEEX )FUIFGGFOWBOHFCSVJLTWFSHPFEJOHPQSFQSP EVDUJFTEPPSBSDIJFGJOTUFMMJOHFOQEEVX LXXTHEVIYZERPHSGYQIRX
Open archieven door crowdsourcing (SSV)PPIR*PIYVFEE]
ning-on-demand procedure op basis van de archiefinventaris werkt prima voor onderzoekers die vertrouwd zijn met de wijze waarop archieven traditioneel worden ontsloten door middel van inventarissen. Het aanbieden van gescande inventarisnummers is bovendien een ideale manier om te voorkomen dat kwetsbare of diefstalgevoelige stukken naar de studiezaal moeten ter inzage en naarmate er meer is gedigitaliseerd zal het de druk op de (relatief dure) dienstverlening in de studiezaal ontlasten. Maar archiefinventarissen, ook als ze voorzien zijn van scans, zijn geen goede manier om het grote publiek te verleiden tot archiefonderzoek. Ook die bekende 28% potentieel geïnteresseerden haken af als ze de archiefstukken via een inventaris moeten raadplegen. Er is maar één oplossing: behalve volledig scannen ook volledig indexeren. Bij moeilijk leesbare teksten hoort daar ook nog volledig transcriberen bij. En, willen we internationaal publiek bereiken, dan zullen we ten slotte nog volledig moeten vertalen. Bij de beschrijving van digitaal geboren archiefdocumenten gaan we ervan uit dat er veel meer metadata nodig zijn om de stukken te beheren en toegankelijk te maken en te houden. Filip Boudrez schrijft in één van zijn vele prima artikelen dat er voor elk digitaal archiefdocument metadata nodig zijn, terwijl dit voor papieren documenten lang niet altijd het geval is. Hij heeft volkomen gelijk wat betreft de digitale documenten. Om die te beheren en te kunnen terugvinden zijn veel metadata nodig. Maar is dat bij de papieren documenten eigenlijk ook niet het geval? Zo niet voor het beheer, dan toch wel voor de toegankelijkheid. Tot op heden hebben we genoegen genomen met archieven die slechts voor een beperkt publiek toegankelijk zijn. Maar als we willen dat onze papieren documenten echt door een breed publiek gebruikt gaan worden, dan hebben we ook van papieren documenten een veelvoud aan metadata nodig. En van papieren documenten hebben we, net als van digitale documenten, ook verschillende representaties nodig. Om te beginnen digitale reproducties, en daarnaast dus liefst ook nog die transcripties en vertalingen.
Alles online vindbaar en beschikbaar is wat steeds meer mensen doodgewoon vinden. Boeken, films, muziek, waarom dan geen archieven? Maar al krijgen we een veelvoud van de budgetten voor scanning waar we nu over beschikken en al krijgen we een verdubbeling van ons personeelsbestand, het zal nooit genoeg zijn om de vele kilometers archieven in onze depots online voor een groot publiek vindbaar en beschikbaar te maken. Willen we die volledige online toegankelijkheid bereiken, dan zullen we een beroep moeten doen op de bijdrage en inzet van de grote massa internetgebruikers. Max J. Evans schreef twee jaar geleden een krachtig betoog voor brede publieksinzet in 5IF"NFSJDBO "SDIJWJTU, getiteld 'Archives of the People, by the People, for the People. Inmiddels heeft hij bewezen dat hij gelijk heeft. Familysearch. com heeft in een paar jaar tijd 250 miljoen documenten online geïndexeerd.
In Amsterdam zijn we na twee jaar ervaring met de Archiefbank tot een vergelijkbare conclusie gekomen. Onze scan-
november 2009
Klassieke index Met scans van onze documenten online zal het mogelijk zijn grootschalig de metadata te genereren die we nodig hebben om volledige toegang te bieden tot onze archieven. Die metadata moeten op een eenduidige en structurele manier worden verzameld en de kwaliteit van de metadata moet in principe zonder menselijke tussenkomst gecontroleerd kunnen worden. Het heeft niet zo veel zin documenten online te zetten en vrijwilligers te vragen er naar eigen goeddunken een leuke beschrijving bij te maken. Deze werkwijze kan, bijvoorbeeld als het bijzonder beeldmateriaal betreft, via Flickr the Commons een nuttige opbrengst aan metadata genereren, maar voor de meeste archiefdocumenten zou het leiden tot heel ongelijksoortige, ongeordende en overbodige gegevens waar andere onderzoekers maar weinig mee kunnen. Op basis van dat soort gegevens kun je geen zoeksystemen bouwen die een volledige en uniforme opbrengst garanderen. Die gegevens zouden ook niet uitwisselbaar en nauwelijks beheersbaar zijn. De klassieke index biedt uitkomst: metadata in een vooraf bedacht en goed gestructureerd metadataschema, bij voorkeur in de vorm van een open standaard. Duizenden vrijwilligers Willen we vervolgens op basis van dit schema al die metadata genereren, dan hebben we aan tientallen of zelfs honderden vrijwilligers niet genoeg. Het moeten er duizenden zijn. Dat lijkt zo op het eerste gezicht misschien niet haalbaar. Maar als je ziet hoeveel geregistreerde gebruikers de Amsterdamse archiefbank telt, dan moeten dit soort aantallen, ook in een Nederlandstalig gebied, wel haalbaar zijn. Wat we nodig hebben is behalve de scans en de techniek een goed doordacht beleid voor crowdsourcing. Crowdsourcing is een term die in 2006 is geïntroduceerd door Jeff Howe in een spraakmakend artikel in Wired (http:// www.wired.com/wired/archive/14.06/ crowds.html) Crowdsourcing is een samenvoeging van de termen 'outsourcing' en 'crowd'. Crowdsourcing wordt ingezet wanneer organisaties gebruik willen maken van de ideeën of het werk van de Lees verder op pagina 31
archievenblad
29
Vervolg van pagina 29
gemeenschap. Er kan een beloning tegenover staan in materiële of in immateriële vorm. 'De eer van het werk' is een beloning die misschien mager klinkt, maar voor veel mensen wel degelijk betekenis heeft. Zo ook het gevoel een zinvolle bijdrage te leveren aan onze informatiemaatschappij. Echter, crowdsourcing betekent niet per definitie belangeloos werk. Een beloning in
de vorm van scans of scantegoed kan ook heel aantrekkelijk zijn. Dat is een materiële beloning voor de deelnemer aan het project maar kost de archiefdienst niets extra. Zelfs een financiële beloning kan overwogen worden, in de sfeer van de Mechanical Turk van Amazon, the marketplace for work (https://www.mturk.com/mturk/welcome). En zo zijn er meer creatieve manieren te bedenken om deelnemers te motiveren zich in te zetten voor de grootschalige ontsluiting van archieven.
Gratis arbeid Gaan we als archiefdiensten in Nederland onze collecties via crowdsourcing toegankelijk maken, dan zijn we niet de eersten. En behalve de genealogische sites, waar Familysearch, de site van de Latter Day Saints Church, waar ik eerder naar verwees, een van de bekendsten is, zijn er ook andere voorbeelden waar we van kunnen leren. Een prachtig initiatief is de digitalisering van de archieven van
The New York Times. Dat project loopt nu en moet in 2010 gereed zijn. Net als bij de projecten voor krantendigitalisering die we in Nederland kennen worden de scans eerst met OCR (optical character reading) voor het grootste deel leesbaar gemaakt. Daarna worden de gedeelten waar de OCR niet heeft gewerkt omdat de tekst fouten bevatte of simpelweg omdat de krant te vuil of gekreukt was, in de vorm van 'recaptcha' voorgelegd aan het grote publiek dat per
Tekening:Willem Küller.
geval het probleem bekijkt en oplost. Een captcha is een 'Completely Automated Public Turing test to tell Computers and Humans Apart'. Het wordt bijvoorbeeld gebruikt om te voorkomen dat computers die spam verzenden toegang krijgen tot systemen die daar niet op zitten te wachten. Recaptcha is een variant ontwikkeld aan de Carnegie Mellon Universiteit. Het selecteert de termen waar OCR-programma's het niet eens zijn, legt die termen samen met controletermen voor ter interpretatie aan het publiek. Op basis van een puntentoekenning bij gelijke interpretatie wordt vastgesteld welke interpretatie van een probleemgeval de juiste is. Per september 2008 was met deze werkwijze 12.000 manuren per dag aan gratis arbeid gegenereerd.
Intensieve communicatie Willen we de kilometers archieven in onze depots echt voor iedereen toeganke-
november 2009
STMRMI
lijk maken, dan zullen we niet alleen als instellingen beter met elkaar moeten gaan samenwerken, maar we zullen vooral moeten leren samen te werken met de grote hoeveelheid onbenutte maar geïnteresseerde arbeidskracht die via het internet graag ingezet wil worden. Dat samenwerken met de internetgebruikers vergt vooral intensieve communicatie. Daarmee bedoel ik geen dure voorlichtingscampagnes, maar een responsief 24/7 netwerk van professionals, deelnemers en klanten die bereid zijn elkaars vragen te beantwoorden, problemen op te lossen en te luisteren naar elkaars suggesties. Een voorwaarde om het toegankelijk maken van onze archieven met behulp van crowdsourcing succesvol op te zetten is een gebruiksvriendelijk, snel en vlekkeloos werkend systeem met optimale backoffice faciliteiten. Zo moet het mogelijk zijn de ingevoerde metadata met minimale menselijke inspanning grondig te controleren omdat een klant van een overheidsinstelling betrouwbare informatie verwachten mag. Tegelijkertijd moet de productie ook snel online beschikbaar zijn omdat een te traag proces demotiverend bij de deelnemers kan werken. En vanzelfsprekend moet de intensieve communicatie tussen deelnemers, klanten en instellingen efficiënt ondersteund kunnen worden door het systeem. Om een dergelijk te systeem te ontwikkelen is er nóg een nieuwe vorm van samenwerking nodig: met de leverancier. Max Evans opende bovengenoemd artikel met de opmerking: "Archival institutions have to reinvent themselves." Ik denk dat hij gelijk heeft. )PPIR *PIYVFEE] MW EHNYRGXKIQIIRXIEV GLMZEVMW ZER %QWXIVHEQ 7EQIR QIX 1EVG ,SPXQERLMIPH^MNIMRHSOXSFIVIIROI]RSXI WTIIGLSZIVHI%VGLMIJFEROZER7XEHWEVGLMIJ %QWXIVHEQSTIIRVIKMSREPIEVGLMIJGSRJIVIR XMIMRHI:IVIRMKHI7XEXIR 2SXIR 1E\.)ZERW%VGLMZIWSJXLI4ISTPIF] XLI4ISTPIJSVXLI4ISTPI5IF"NFSJDBO "SDIJWJTU (IXMXIPMWIIR ZVMNIZEVMERXSTHIFIVSIQHIWPSX^MRZERLIX +IXX]WFYVK%HVIWWZER%FVELEQ0MRGSPR /SSWZER(MNOIRIR2EXEWLE7XVSIOIV/BBS FFOQVCMJFLTHFSJDIUBSDIJFGCFTUFM >SIXIVQIIV
archievenblad
31