Studiedag over de digitale bewaring & ontsluiting van historische kranten Donderdag 1 februari 2007 - IEPER
VERSLAG
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 2
Inhoudstafel Inleiding
p. 3
I. Geheugen van Ieper. Ontsluiting van lokale krantenarchieven
p. 5
II. Publiek-private samenwerking bij de digitalisering van de Leeuwarder Courant
p. 10
III. De actualiteit van het verleden. Metamorfoze en krantendigitalisering
p. 12
IV. Digitale archivering van kranten en auteursrechten
p. 15
V. Erfgoed of erfzonde? Persoonsgegevens in het krantenarchief
p. 18
VI. De bewaring van Belgische kranten: een gedeelde verantwoordelijkheid?
p. 21
Voetnoten
p. 26
Colofon
p. 27
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 3
Inleiding Oud nieuws Heel wat bibliotheken, archieven en documentatiecentra bewaren kranten. Ze worden er als historische bron door een brede groep van onderzoekers geconsulteerd. Helaas is dit papieren erfgoed erg kwetsbaar en dreigt het op korte termijn door verzuring en beschadiging te verdwijnen.
Nieuw leven De laatste jaren opteren steeds meer bewaarinstellingen voor digitalisering van hun krantencollecties. Zo lanceerde de stad Ieper op 1 december 2005 de website Geheugen van Ieper. Deze erfgoedbank, een project van Erfgoedcel Ieper, bracht voor het eerst duizenden historische kranten op een aantrekkelijke en gebruiksvriendelijke manier online. De stedelijke erfgoedinstellingen namen dit initiatief niet enkel om de kranten te conserveren maar ook om ze voor een ruimer publiek te ontsluiten.
Oud nieuws, nieuw leven? Met de organisatie op 1 februari 2007 van de studiedag ‘Oud Nieuws, Nieuw Leven?’ wilde de stad Ieper in samenwerking met de Vlaamse Vereniging voor Bibliotheek-, Archief- en Documentatiewezen (VVBAD vzw) en Culturele Biografie Vlaanderen vzw de bestaande expertise over de digitale bewaring en ontsluiting van kranten uitwisselen, alsook netwerking en samenwerking in het bredere erfgoedveld stimuleren. Acht sprekers uit Vlaanderen en Nederland onderzochten de mogelijkheden die het digitaliseren van krantenarchieven biedt maar ze hadden ook oog voor een aantal juridische knelpunten. Deze brochure, met een tekst van Eva Wuyts over Geheugen van Ieper en samenvattingen van de overige uiteenzettingen door moderator Iris Steen, vormt de weerslag van een boeiende en vruchtbare dag.
Het stadsbestuur van Ieper
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 5
I. Geheugen van Ieper Digitale ontsluiting van lokale krantenarchieven 1
Op 1 maart 2004 sloot de stad Ieper voor de duur van 10 maanden een experimenteel erfgoedconvenant af met de Vlaamse Gemeenschap en richtte zij een Erfgoedcel op2. De Ieperse aanvraag om een integraal en geïntegreerd lokaal erfgoedbeleid te gaan uitbouwen, werd gehonoreerd op basis van een tiental projectvoorstellen. Het belangrijkste, duurste en meest arbeidsintensieve project uit de lijst behelsde de creatie van een erfgoedbank, getiteld Geheugen van Ieper, naar analogie van Geheugen van Nederland. Dat illustreert meteen dat de ambities erg hoog lagen.
De motieven Ieper volgde de trend die enkele jaren geleden door andere Erfgoedcellen geïnitieerd werd in Vlaanderen. Beeldbank Gent, Beeldbank Brugge en de Regionale Beeldbank Mechelen waren databanken vol historisch beeldmateriaal zoals foto’s en prentbriefkaarten, doorgaans uit openbare collecties, die via een website voor een breed publiek ontsloten werden. Ieper droomde van iets vergelijkbaars, maar wou het accent leggen op de collectie historische kranten. Hiervoor waren er drie motieven: vooreerst was er de onschatbare waarde van de krant voor de Ieperse geschiedschrijving. Want het Stadsarchief, een van de rijkste van Europa, werd tijdens de Eerste Wereldoorlog volledig verwoest. Ook het Stedelijk Museum en een groot deel van zijn verzameling ging in vlammen op. Enkel de Stadsbibliotheek kon tijdig ontruimd worden. Jaren later, na een verblijf in Frankrijk, keerden de boeken- en de krantencollecties terug naar hun plaats van herkomst, waarna generaties van bibliothecarissen ze als schatten zijn gaan koesteren. En terecht: voor de onderzoekers van het 19deeeuwse Ieper vormen zij een unieke bron. Hun berichtgeving – gemeenteraadsverslagen, marktprijzen en advertenties, sportuitslagen, gerechtelijk nieuws, overlijdensberichten… – beslaat bovendien alle facetten van het maatschappelijke leven; ten tweede zijn deze bronnen erg bedreigd. De veelvuldige consultatie door lokale onderzoekers, maar zeker de voortschrijdende verzuring vormen een interne tijdbom.Zonder voorzorgsmaatregelen leidt dit afbraakproces op korte termijn tot de totale de vernietiging van dit erfgoed; ten derde wou de Ieperse Erfgoedcel in de geest van het convenant bewust experimenteel en vernieuwend werken. De zoektocht naar oplossingen voor de specifieke uitdagingen die horen bij het digitaal ontsluiten van kranten – bijvoorbeeld de combinatie van tekst met beeld, het formaat en daarmee samenhangend de grote opslagcapaciteit, de verschillende ontsluitingsniveaus... – ligt in die lijn. De ambities met Geheugen van Ieper uitten zich niet alleen in de voorkeur voor kranten in plaats van het klassiekere beeldmateriaal. Er was ook de intentie om een integraal verhaal te brengen. Ons opzet was een databank te maken met allerlei soorten (tweedimensionaal) erfgoed dat onderling gekoppeld kon worden. De kranten als eerste collectie zouden de ruggengraat vormen omdat via de artikelen heel wat
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 6
inhoudelijke verbindingen konden worden gelegd met andere collecties. Een voorbeeld: een zoekopdracht naar de Ieperse politicus Alphons Vandenpeereboom levert zowel een overlijdensbericht, een foto als een menukaart op. Of nog: wie een artikel leest over het zwembad of de velodroom, kan meteen doorklikken naar foto’s ervan. Hoewel het al mogelijk is om deze theorie om te zetten in de praktijk, is dit om allerlei redenen nog niet gebeurd. De belangrijkste is dat de Erfgoedcel ondertussen samen met de projectvereniging CO7 gestart is met Westhoek Verbeeldt, een regionale beeldbank voor zwerfgoed3.
De partners en hun wensen Met het erfgoedconvenant beschikte Ieper in 2004 over zowel de middelen als een Erfgoedcel om het project te coördineren. De nieuwe stadsdienst vormde samen met de ICT-dienst en de drie aanwezige erfgoedinstellingen – de Stedelijke Openbare Bibliotheek, het Stadsarchief en de Stedelijke Musea – een werkgroep die de krijtlijnen van het project zou bewaken. Elke partner bracht zijn specifieke expertise en zijn eigen wensen mee. Voor alle partijen gold dat digitalisering nooit een doel op zich mocht zijn. Maar over de vraag waartoe het dan een middel kon zijn, bestonden wel uiteenlopende opvattingen. Voor de erfgoedinstellingen die zelf tientallen krantentitels bewaren, waarvan sommige in precaire staat, primeerde de conservering. Voor de Erfgoedcel die volgens het convenant de opdracht had om de maatschappelijke plaats van het culturele erfgoed te versterken, de ontsluitingsmogelijkheden. Deze dualiteit bleef doorheen het hele denkproces bestaan en was bepalend voor de keuzes die gemaakt werden. Het afgelegde traject kan omschreven worden als een continue evenwichtsoefening om ‘the best of the both worlds’ te combineren: maximale ontsluiting met de nodige aandacht voor conservering. De digitale beschikbaarheid van deze collecties op het internet maakt alleszins dat de originelen niet langer geconsulteerd hoeven te worden. Ondanks de digitale back-ups blijft het Stadsarchief zijn microverfilmingsbeleid (vooral van naoorlogse kranten) voortzetten. Dat de huidige technologie nu ook de mogelijkheid biedt om eventueel vanuit de digitale bestanden microfilms te laten maken, opent perspectieven maar deze optie werd voorlopig nog niet genomen. De data zelf worden op meerdere plaatsen en op verschillende dragers bewaard, namelijk op een server en op harde schijven. Het spoor van opslag op optische media werd verlaten omdat dit geen betrouwbare, duurzame archiveringswijze is. Bovendien zijn enkele lopende meters cd’s of dvd’s voor een klein archief een bijkomende belasting en is de jaarlijkse kwaliteitscontrole ervan niet haalbaar.
De inventarisering en selectiecriteria Omdat de middelen niet onbeperkt waren, moest er een doordachte selectie worden gemaakt van de duizenden kranten die naar aanleiding van het project door de Stedelijke Openbare Bibliotheek overgedragen werden aan het Stadsarchief. Archiefmedewerker John Desreumaux zorgde voor de preservatie (door verpakking in zuurvrij materiaal) en een nieuwe, uiterst gedetailleerde inventaris. Het belang van dit document valt niet te onderschatten. Het Stadsarchief heeft nu niet alleen inzicht in zijn collectie – van de aard van de kranten, over de staat op paginaniveau waarin ze zich bevinden tot de lacunes in jaargangen of edities – maar ook een checklist waarmee onvolledige reeksen digitaal aangevuld kunnen worden door ontbrekende exemplaren bij andere bewaarinstellingen op te sporen. Uiteraard is de inventaris een uiterst waardevol instrument bij de selectie van de te digitaliseren kranten. De definitieve keuze van de titels is gemaakt op grond van een aantal wegingsfactoren, de ene al wat objectiever dan de andere. De enige absolute voorwaarde was dat de kranten verschenen waren in het arrondissement Ieper. Kranten met een meer provinciaal of nationaal bereik rekenden we niet tot onze opdracht. Wat betreft de ouderdom werd het belangrijk geacht om een kopie te kunnen maken van de oudste
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 7
exemplaren, ondanks het besef dat jongere uitgaven (jaren 1950-1980) op meer interesse zouden kunnen rekenen van de doorsnee Ieperlingen. De auteurswet bepaalde de keuze om voorlopig alleen titels tot aan de Eerste Wereldoorlog online te brengen. Zelfs die cesuur houdt nog een beperkt risico in. Omdat de uitgeverijen al decennia geleden hun activiteiten stopgezet hebben en het over kranten gaat die vaak anonieme of enkel met initialen ondertekende artikelen bevatten, is de zoektocht naar rechthebbenden zeer lastig tot onmogelijk. En die zijn er nog steeds: bij een reporter die 35 jaar oud was in 1900 en op 70-jarige leeftijd overleed, kunnen de erfgenamen vandaag nog steeds rechten doen gelden. Verder werden de volgende criteria gebruikt: de taal: hoewel het overgrote deel van de kranten Franstalig is, werd voor de publieksvriendelijkheid de voorkeur gegeven aan Nederlandstalige of tweetalige kranten; de interesse van het publiek: vaak geraadpleegde titels kregen voorrang om verdere beschadiging door consultatie te voorkomen; de staat: beschadiging kon een reden zijn om prioritair te digitaliseren, zware schade een reden om het (nog) niet te doen; de politieke kleur: er werd aandacht besteed aan de vertegenwoordiging van alle strekkingen; de verschijningsperiode: er moest voldoende spreiding in tijd zijn en door de auteurswet vormde de Eerste Wereldoorlog het voorlopige eindpunt; de diversiteit van de inhoud: er werd een 19de-eeuws equivalent van zowel Het Laatste Nieuws als De Standaard opgenomen; de omvang en volledigheid van reeksen: titels waarvan slechts enkele exemplaren overgebleven waren, werden niet opgenomen. In mindere mate werd ook rekening gehouden met het bestaan van microfilms of -fiches en de zeldzaamheid. Het ultieme criterium was uiteraard de beschikbaarheid van middelen: van de honderdduizenden pagina’s konden uiteindelijk 44.000 pagina’s verwerkt worden. Die worden sinds 1 december 2005 gefaseerd online gebracht4. Nadat de voorbereidingen en het onderzoek achter de rug waren, kon het project openbaar aanbesteed worden. Hiervoor werd een omvangrijk lastenboek opgemaakt waarop gespecialiseerde bedrijven konden inschrijven voor één tot vier afzonderlijke delen: het digitaliseren van de collecties; de bouw van de database; de bouw van de website; en de hosting. Na een lange onderhandelingsfase werd de opdracht integraal toevertrouwd aan X-Cago uit Roermond (Nederland). Dit bedrijf verzorgt de online edities van heel wat binnen- en buitenlandse kranten en heeft ervaring met het digitaal conserveren, beschrijven en ontsluiten van allerlei soorten (beeld)collecties.
De digitalisering In tegenstelling tot de meeste andere digitaliseringsprojecten van kranten, werden de Ieperse exemplaren niet louter beschouwd als tekstdragers, maar als volwaardig erfgoed. Daarom was, behalve de optimale representatie van de tekstuele informatie, evenzeer het behoud van de originele ‘look and feel’ van belang. De kleur en de textuur van het papier mochten letterlijk gezien worden. We geloofden immers rotsvast in de visuele kracht en de ontwapenende charme van een oude krant. Een lezer die ook de verkleuringen, de vouwen en scheurtjes of in sommige gevallen zelfs de kogelgaten kan zien, zal er meer respect voor opbrengen. Deze ervaring, het ‘archiefgevoel’ genoemd, was de toetssteen bij allerlei beslissingen. Vooreerst impliceerde dit dat de 19de-eeuwse bindingen niet werden losgemaakt omdat zij integraal deel uitmaken van de collectie. Dit ging in bepaalde gevallen weliswaar ten koste van de leesbaarheid omdat soms tekst verdween door een te strakke band. Voorts werd beslist om niet te kiezen voor de goedkopere digitalisering van de microfilms, maar voor scanning vanuit de originele druk én in kleur. Elke pagina werd op locatie apart en handmatig gedigitaliseerd met een videoscanner. De moederbestanden in tiff-formaat werden
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 8
gearchiveerd maar voor de webweergave ook omgezet in jpg. Tot slot werden de kranten altijd in hun huidige staat gescand, wat in het geval van vouwen betekende dat soms een regel tekst verdween. De digitale kopieën werden eveneens zo min mogelijk gemanipuleerd. Omdat het merendeel van de kranten ingebonden was, stond het beeld lichtjes al eens bol of scheef. Dit probleem werd softwarematig verholpen. Maar rafelige randen werden niet recht afgesneden. Kortom: de digitale weergave moest de originele krant zoveel mogelijk benaderen. Voor de conservering garandeerde dit de best mogelijke kopie en voor de ontsluiting hielp dit de archiefbeleving tot in de huiskamer te brengen.
Tekstherkenning Hoewel het opzet was de raadpleging van kranten zoals die in een echte archiefleeszaal gebeurt zoveel mogelijk te evenaren, werd toch de beschikbare technologie optimaal ingezet om onderzoek te vergemakkelijken. Daartoe krijgt de gebruiker een zo diep mogelijk ontsluitingsniveau aangeboden. Bij kranten is dit behoorlijk complex: er zijn titels (die in tijd al eens evolueren of verdwijnen en enkele jaren later opnieuw verschijnen), jaargangen, edities, pagina’s, rubrieken, kolommen, artikelen, alinea’s en woorden. Het handmatig toekennen van trefwoorden aan artikelen is onbegonnen werk: elk woord is een mogelijk trefwoord, meta-informatie impliceert dat elke tekst moet worden gelezen en de relevantie zal verschillen van onderzoeker tot onderzoeker. Daarom werd gekozen voor ‘Optical Character Recognition’ (OCR), meer bepaald voor een door X-Cago getrainde versie van Abby’s Fine Reader. De voordelen van tekstherkenningssoftware zijn dat alle geëxtraheerde woorden automatisch in XML worden toegevoegd aan de metadata, dat de artikelen woordelijk doorzoekbaar zijn en dat zoekresultaten kunnen worden gehighlight in de pdf-versie. Hiermee is er ontsluiting op het hoogste niveau. Hoewel er dankzij de kleurnuances geen verlies van informatie was, verliep de tekstherkenning niet altijd probleemloos. Doordruk van de artikelen op de andere bladzijde, vlekken, beschadigingen, slijtage van de drukletters, de diverse typografie en verschillende schrijfrichtingen op een pagina verlaagden de herkenbaarheid. Dit werd in de mate van het mogelijk geminimaliseerd door het contrast van de beelden te optimaliseren. Daarnaast zijn er enkele vrijwilligers die de artikeltitels manueel opschonen.
De taalproblematiek Wat vaak vergeten wordt is dat de terugvindbaarheid van de informatie ook bepaald wordt door de taal. Eén blik in een oude krant is genoeg om te beseffen dat de spelling en het woordgebruik vroeger anders was. ‘Ieper’ bijvoorbeeld werd gespeld als ‘Yper’ en de 19deeeuwse spoorweg was gekend als de ‘ijzeren weg’. Om het resultaat van zoekopdrachten te verbeteren heeft X-Cago de zogenaamde ‘stemmer’ geïmplementeerd. Via deze applicatie worden Oud-Nederlandse varianten en spellingsvarianten aan de hedendaagse woordenlijst gekoppeld. Zo wordt er naast de ingevoerde zoekterm ‘pasen’ ook gezocht naar de variant ‘paschen’. Op diezelfde manier zorgt de stemmer ervoor dat typische OCR-foutpatronen worden gecorrigeerd. Om de Franstalige kranten te doorzoeken moeten voorlopig nog Franse zoektermen worden ingegeven. Maar koppeling van de stemmer aan (vertaal-)woordenboeken zou ook hier een oplossing kunnen bieden. Voorlopig worden enkel zoektips weergegeven, waaronder truncatie.
De segmentering Een tweede instrument om onderzoek te optimaliseren was de weergave van kranten op artikelniveau. Met behulp van ClipWorX kon X-Cago de artikelen en advertenties digitaal uit de krantenpagina’s extraheren. Net als bij de OCR is deze software niet onfeilbaar, maar is het een uitstekende toepassing die talloze voordelen
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 9
heeft. Vooreerst kan er binnen de contouren van individuele artikelen worden gezocht, wat leidt tot een veel beter zoekresultaat. Het is bijvoorbeeld mogelijk om in één keer alle relevante artikelen over een bepaald onderwerp te zoeken en te vinden. Ten tweede is elk artikel in zwart-witversie afzonderlijk opvraagbaar. Zo hoeven er geen grote bestanden gedownload te worden. In de pdf-versie is elk artikel trouwens afdrukbaar, vergezeld van een disclaimer, de volledige bronvermelding (titel, datum, pagina) en een verkleind beeld van de pagina waaruit het artikel afkomstig is. Gebruikers die toch de oorspronkelijke kleurweergave van het hele artikel willen bekijken, kunnen dat via de zoomfunctie. Een derde voordeel is dat met Editor Assist, een applicatie van X-Cago om de metadata aan te passen, manueel linken gelegd kunnen worden tussen verschillende artikelonderdelen. Dat is bijvoorbeeld bij een tekst die doorloopt op een andere pagina, of bij een roman die in verschillende afleveringen gepubliceerd is, of tussen een artikel en een ander bestand binnen én buiten de eigen databank. Ditzelfde programma biedt de mogelijkheid om bepaalde paginaonderdelen – foto’s of artikelen bijvoorbeeld waarvoor van de auteur geen toelating verkregen is – niet online te tonen. Dankzij de segmentering hoeft dus niet de volledige pagina van het net gehaald te worden. Dit brengt ons bij de laatste fase van het project. Want de selectie, de digitalisering, de tekstherkenning en de segmentering van de kranten waren stuk voor stuk afgestemd op hun publicatie op de speciaal ontwikkelde website www.geheugenvanieper.be.
De website en zijn doelgroepen In tegenstelling tot de instelling waar de papieren kranten bewaard worden, is Geheugen van Ieper altijd en wereldwijd toegankelijk. Deze erfgoedbank mikt op twee belangrijke doelgroepen. Enerzijds de streekbewoners, van wie de meeste nooit eerder met een archief in aanraking kwamen, anderzijds onderzoekers in brede zin: genealogen, heemkundigen, wetenschappers, studenten, leerkrachten…, tot ver buiten Ieper. Voor elke doelgroep zijn er specifieke toepassingen en mogelijkheden. Voor de lokale bevolking werd een aantrekkelijke en gebruiksvriendelijke website ontwikkeld. De pagina’s zijn overzichtelijk opgebouwd en de navigatiebalk met frisse kleuren is eenvoudig te bedienen. Het ‘artikel van de dag’ – een dagelijks veranderende selectie van ludieke berichten – prikkelt tot een herhaalbezoek. De kranten worden dankzij het programma Archive Ex Press in hun authentieke ‘look and feel’ gepresenteerd. Via een navigatiebalk blader je van pagina naar pagina en van editie na editie. Interessante artikelen zijn met een klik opvraagbaar, maar enkel voor geregistreerde gebruikers. Het invullen van een naam en een e-mailadres volstaat om toegang te verkrijgen tot alle functies van deze erfgoedbank. De zoomfunctie op de originele bestanden is niet alleen een hulpmiddel bij slechte of te kleine druk, maar speelt ook in op het archiefgevoel omdat de details van het origineel zichtbaar worden. Dit alles is mogelijk zonder grote bestanden over het netwerk te transporteren en zonder originele beelden voor derden kopieerbaar te maken. Onderzoekers worden bediend door een uitgebreide zoekfunctie (and, or, not) en de mogelijkheid hun zoekresultaten te sorteren (per collectiesoort, op datum of volgens relevantie). Relevante artikelen kunnen niet alleen afgedrukt worden, maar ook via bookmarks met cookies worden bewaard op de eigen computer. De digitale tentoonstelling die in de vorm van een nieuwsbrief verzonden wordt naar alle geregistreerde gebruikers, geeft op thematische wijze duiding bij de collecties. Maar de hoop is er op termijn ook een publicatieforum van te maken dat de resultaten van allerlei krantenonderzoek publiek toegankelijk maakt.
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 10
De resultaten Geheugen van Ieper werd op 1 december 2005 gelanceerd met een uitgebreide communicatiecampagne. Er werden onder meer notablokjes in de vorm van een muismatje verspreid en elke Ieperling kreeg De Toekomst in de bus, een historisch uitziende krant met een selectie van de markantste artikelen, gecombineerd met uitleg over het project. Sindsdien is de erfgoedbank een belangrijke, veelgeraadpleegde bron geworden voor historisch onderzoek. Maar het project heeft ook geleid tot een verhoogd erfgoedbewustzijn bij het beleid en het publiek. Zij herontdekten het 19de-eeuwse Ieper – een periode die nogal in de vergetelheid was geraakt door de grote aandacht voor de Eerste Wereldoorlog en het middeleeuwse Ieper – en daarmee ook hun eigen dorps-, verenigings- of familiegeschiedenis. We zien krantenartikelen opduiken op kermisaffiches, in nieuwsbrieven en publicaties allerhande, maar evengoed als inspiratiebron voor theaterstukjes. Dat het project geresulteerd heeft in een beter behoud en beheer van de kranten zelf, is de kers op de taart. Zo kreeg oud nieuws, alsnog een nieuw leven.
Spreker & verslag: Eva Wuyts Erfgoedcel Ieper Sint-Jacobsstraat 1, 8900 Ieper, België T: +32 (0)57 239 312 E:
[email protected] W: www.erfgoedcelieper.be www.geheugenvanieper.be
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 11
II. Publiek-private samenwerking bij de digitalisering van de Leeuwarder Courant De digitalisering en ontsluiting via internet van de Leeuwarder Courant, het oudste regionale dagblad van Nederland, gebeurt in een publiek-private samenwerking. De partners in het project willen het complete archief van de Leeuwarder Courant vanaf 1752 tot heden digitaliseren en ontsluiten via een webapplicatie. Het gaat om 800.000 pagina’s met ruim 10 miljoen losse artikelen, foto’s en advertenties. De Leeuwarder Courant zal niet per pagina, maar per artikel op trefwoord doorzoekbaar zijn. De kranten zijn gesteld in oud- en modern Nederlands, oud en modern Fries (de tweede officiële taal van Nederland) en Frans. De opzet van de ontsluiting is grotendeels hetzelfde als Geheugen van Ieper. De oplevering staat gepland voor september 2007. Het project wordt uitgevoerd door de Stichting Digitaal Archief Leeuwarder Courant, een samenwerkingsverband van de Leeuwarder Courant en Tresoar. De Leeuwarder Courant is ondergebracht is bij uitgeversconcern NDCVBK (Noordelijke Dagblad Combinatie/ Veen Bosch&Keuning). Tresoar5 is een samenwerkingsverband van het Frysk Letterkundig Museum en Dokumintaasjesintrum, de Provinciale- en Bumabibliotheek en Ryksargyf Fryslân. Het is het Friese historische en letterkundige centrum, 100% gefinancierd door provincie Fryslân. De doelstelling van het project, gezamenlijk geïnitieerd door de Leeuwarder Courant en Tresoar luidt: ‘voor huidige en toekomstige generaties Friezen (en Nederlanders) zeker stellen en toegankelijk maken van een belangrijk deel van het Friese culturele erfgoed’. De Leeuwarder Courant is eigenaar van het volledige krantenarchief en wil dat digitaal beschikbaar stellen. Commercieel is dat geen haalbaar project. Daarom is de Leeuwarder Courant op zoek gegaan naar een partner. Die partner is Tresoar, die graag dit Friese erfgoed wil ontsluiten, maar daar niet voldoende geld voor heeft en geen rechten op de krant heeft. Beide partners hebben de Stichting Digitaal Archief Leeuwarder Courant in het leven geroepen. Deze publiek-private samenwerkingsvorm, krijgt fondsen van beide partners (elk een kwart van de kosten) en werft externe subsidieverstrekkers, alle afkomstig uit de publieke sector en gezamenlijk goed voor de helft van de kosten. In een statuut en een samenwerkingsovereenkomst zijn de verhoudingen tussen beide partners juridisch goed geregeld. Daarin staat onder andere dat de stichting de digitale gebruiksrechten van de Leeuwarder Courant heeft. Er zijn afspraken gemaakt over de organisatiestructuur, de exploitatie en het ontwikkelen van producten en diensten gebaseerd op het digitale archief. De stichting maakt geen winst, wel vloeien opbrengsten terug naar de stichting en niet naar de stichtende partners. Hiermee worden de beheerkosten gedekt en nieuwe initiatieven ontwikkeld.
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 12
Het archief is voor iedereen gratis raadpleegbaar (de nieuwste kranten verschijnen na een week in het archief), abonnees van de Leeuwarder Courant hebben geen voorrang of extra rechten. Naast de heldere afspraken op papier zijn er nog bijkomende, ongeschreven voorwaarden voor het slagen van de samenwerking zoals vertrouwen, respect, flexibiliteit, enthousiasme en een gezamenlijke lange termijnvisie. De voordelen van de samenwerking zijn evident: digitalisering wordt mogelijk, waardoor cultureel erfgoed behouden blijft en ontsloten wordt voor consument en wetenschap. Zowel voor de krant als voor externe gebruikers is er een betere digitale dienstverlening. De stichting bepaalt zijn eigen digitale beleid, maar wil geen eiland zijn. Daarom zoekt ze toenadering tot andere erfgoedinstellingen zoals de Koninklijke Bibliotheek Nederland, Geheugen van Nederland en Digitaal Erfgoed Nederland (DEN)6. Er zijn tal van toekomstplannen, zoals het digitaal ontsluiten van lokale nieuwsbladen, digitaliseren van collecties van Tresoar (print, geluid en beeld) en collecties van derden. Verder gaat de stichting themasites ontwikkelen, bijvoorbeeld over het dagelijkse leven in de Tweede Wereldoorlog (dit initiatief is ingezet in samenwerking met Verzetsmuseum Friesland, oplevering april 2007), de Elfstedentocht of Genealogie. Kortom, de stichting staat aan het begin van een digitaal erfgoedplein Fryslan, dit alles ten behoeve van conservering en ontsluiting van cultureel erfgoed.
Spreker & verslag: Verslag: Iris Steen Spreker: Eddy van der Noord Stichting Digitaal Archief Leeuwarder Courant, Sixmastraat 15, 8932 PA Leeuwarden, Nederland T: + 31 (0)58 284 50 10 E:
[email protected] W: http://demo.x-cago.com/lc250 (demosite 250 jaar Leeuwarder Courant) www.archieflc.nl (vanaf 1 november 2007)
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 13
III. De actualiteit van het verleden Metamorfoze en krantendigitalisering A. Het project Metamorfoze startte in Nederland in 1997. Het is het nationale programma voor het behoud van het papieren erfgoed. Het project bestaat uit massaconservering. Dit houdt in het grootschalig overzetten, aanvankelijk op microfilm en later digitaal, van papieren dragers, die verzuren en ten onder gaan aan inkt- en kopervraat. Ontsluiting en beschikbaarstelling horen hier ook bij. Na grondig onderzoek is er een plan van aanpak gemaakt en heeft de Nederlandse overheid (Ministerie van Onderwijs, Cultuur en Wetenschappen) vanaf 1997 middelen vrijgemaakt hiervoor. De organisatie van het programma is in handen van het Nationaal Archief en de Koninklijke Bibliotheek. Het programmabureau Metamorfoze werkt binnen de Koninklijke Bibliotheek en zorgt voor coördinatie, begeleiding, advies, kwaliteitsmanagement en publiciteit. Een beoordelingscommissie waakt over het toekennen van subsidies aan projecten binnen het programma en evaluatie en advies rond het beleid van het programma. Het project is begonnen met microfilmen en later overgestapt op digitaliseren. Op kleine schaal worden originelen geconserveerd. Collecties Het programma houdt zich bezig met: literaire en cultuurhistorisch of internationaal waardevolle collecties. Het gaat alleen om Nederlands erfgoed, tenzij het internationaal heel waardevolle collecties zijn, zoals Tibetaanse blokboeken, die nergens anders te vinden zijn.; (overheids)archieven. Metamorfoze geeft 70% subsidie aan deze projecten. De erfgoedinstellingen voeren de projecten zelf uit. De coördinatie ligt bij de Koninklijke Bibliotheek en het Nationaal Archief; boeken uit wetenschappelijke bibliotheken; kranten (landelijke, Indische, Surinaamse en regionale dagbladen)7; tijdschriften. Deze projecten ontvangen 100 % financiering door Metamorfoze. De coördinatie ligt bij de Koninklijke Bibliotheek. De resultaten van Metamorfoze Tot nu toe is omzetting gerealiseerd van 65.000 boeken (16%), 300 meter kranten (14%), 1.750 jaargangen tijdschriften ( 7%) en 200 collecties (46%). Meer dan 60 erfgoedinstellingen zijn betrokken bij het programma. Metamorfoze heeft een draagvlak gecreëerd en kennis verspreid bij erfgoedinstellingen op het gebied van massaconservering. Het projectbureau Metamorfoze heeft een infrastructuur opgebouwd van bedrijven die producten leveren. Vanuit het project is expertise ontwikkeld rond projectmatig werken en technische expertise rond microfilmen en digitaliseren. Het project is nu in de derde fase. Daarin is de samenwerking met het Nationaal Archief begonnen en is er structurele financiering voor het programma gekomen (7 miljoen euro per jaar). Het programma kan daarmee versnellen en verbreden, met onder andere nieuwe projecten voor tijdschriften, cultuurhistorische collecties en archieven en een apart krantenproject.
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 14
Metamorfoze wil komen tot ‘preservation scanning’, waarmee microfilmen tot het verleden behoort. Dat wordt dan het grootste digitaliseringsprogramma in Nederland. Vanaf 2008 voorziet Metamorfoze integratie van de resultaten in de digitalisering van de geesteswetenschappen (digitalisering Nederlands erfgoed). In 2016 zou het programma af moeten zijn. Doelstellingen De doelstellingen van Metamorfoze zijn: optimale toegang voor onderzoekers en het brede publiek; ‘preservation scanning’ en zorg voor digitale duurzaamheid, bijvoorbeeld van elektronische publicaties. Belangrijk hierbij zijn de kwaliteitsstandaarden, want de digitale drager moet het origineel vervangen; gebruikmaken van wat al gedaan is, dat wil zeggen microfilms en complete sets van kranten en tijdschriften op microfilm scannen.
B. Metamorfoze en krantendigitalisering Een onderdeel van Metamorfoze is digitalisering van kranten. Krantenpapier is broos en bevat veel lignine, waardoor het snel verzuurt. Door die verzuring zullen kranten in razend tempo vergaan, terwijl ze vanwege hun diversiteit een belangrijke onderzoeks- en informatiebron zijn. Van de noodzaak van krantenconservering zijn alle erfgoedinstellingen doordrongen. Dat het wenselijk zou zijn het materiaal digitaal beschikbaar te stellen ook. Maar de enorme hoeveelheid kranten leidt bij de uitvoering van deze beide doelstellingen tot grote problemen. Regionale dagbladen Eind 2005 is in het kader van Metamorfoze het project Regionale Dagbladen van start gegaan waarin een twintigtal titels geconserveerd wordt. Alleen al in de magazijnen van de Koninklijke Bibliotheek bevinden zich ongeveer 5.000 verschillende krantentitels, die gezamenlijk ruim 5 strekkende kilometer beslaan. Selecteren is daarom noodzakelijk. Het project Regionale Dagbladen focust op dagbladen, kranten die zesmaal per week verschijnen. In totaal bleken dat er 600 te zijn in de periode 1840-1950, de Metamorfoze-periode. Vervolgens is de selectieperiode ingeperkt: van1869, het jaar waarin in Nederland het dagbladzegel werd afgeschaft, tot 1939, omdat de krantenwereld door de oorlog grondig veranderde. Er bleven 278 titels over. Alle eerder verfilmde of gedigitaliseerde titels werden buiten beschouwing gelaten. Uiteindelijk vormden 20 titels de basis voor de uitvoering van het project. Het bleek niet eenvoudig die kranten te verzamelen. Juist de regionale dagbladen liggen zelden volledig in de magazijnen van de Koninklijke Bibliotheek. Ze bevinden zich in regionale centra, archieven, bibliotheken en depots van uitgeverijen. Er is geen goede centrale registratie van de bewaarplaatsen van krantentitels. Als de gewenste titel gelokaliseerd is, is deze vaak niet beschikbaar, omdat instellingen zelf digitaliseringsplannen hebben of omdat het onduidelijk is wie de eigenaar van de krant is en het materiaal daarom de deur niet uit mag. Enig pragmatisme is dus noodzakelijk. Microfilms Metamorfoze heeft een apart team dat het materiaal analyseert, bibliografische gegevens en bijzonderheden als extra edities en drukfouten aan de krant toevoegt. Scheuren en vouwen worden zoveel mogelijk hersteld waardoor de opnamekwaliteit verbetert. De voorbewerking is behoorlijk arbeidsintensief, maar een meerwaarde bij de conversie. Het origineel kan immers over enkele jaren al verloren zijn. Dan vindt de conversie plaats, het overzetten van het beeld op een ander medium. Voor sommige kranten is dat de laatste
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 15
manipulatie die mogelijk is, daarna vallen ze uit elkaar. Metamorfoze gebruikt nog altijd microfilm als intermediair voor de digitalisering. De belangrijkste reden daarvoor is de gegarandeerde duurzame en goedkope opslag. Toch is het geen zwaktebod. De kwaliteit van de microfilm is steeds beter geworden. De huidige laagcontrast films, met veel grijswaarden, geven alle informatie die op het origineel te zien is, behalve de kleur. Er is voldoende informatie voor de software om de letters goed te herkennen bij digitalisering. De microfilms hebben barcodes, zodat ze bij het scannen automatisch ontsloten en geordend kunnen worden. De scans van de microfilm blijken een evengoed OCR-resultaat op te leveren als de scans van het origineel. Soms zelfs beter. Bovendien worden microfilmscanners steeds geavanceerder. Dat is maar goed ook, want in de afgelopen tien jaar Metamorfoze zijn er 20.000 films gemaakt. Databank Digitale Kranten Dit jaar start de Koninklijke Bibliotheek met een gigantisch krantenproject, de Databank Digitale Dagbladen. Het project zal vijf jaar duren, er is twaalf miljoen euro beschikbaar en er zullen acht miljoen krantenpagina’s in de databank worden opgenomen. Waar mogelijk zal van de microfilm gescand worden. Ook in het buitenland hanteert men deze methodiek, zoals in het project British Newspapers 1800-1900 van de British Library en het grote Scandinavische project Tiden. Films hebben dan ook het extra voordeel dat ze sneller en goedkoper - want automatisch - te scannen zijn dan origineel materiaal. Als uit onderzoek nu blijkt dat microfilm zich goed leent voor digitaliseringsdoeleinden, dan zal Metamorfoze wellicht, geheel tegen de tijdsgeest in, de microfilm voor wat betreft zwart/wit massacons erveringsprojecten trouw blijven. Dat is de ‘best of both worlds’, goedkope, duurzame opslag én kwalitatief hoogstaande beschikbaarstelling.
Spreker & verslag: Verslag: Iris Steen Sprekers: Dennis Schouten (programmamanager) Metamorfoze Prins Willem-Alexanderhof 5, Postbus 90407, 2509 LK Den Haag, Nederland T: +31 (0)70 314 03 73 E:
[email protected] W: www.metamorfoze.nl
Sophie Ham (projectleider/coördinator) Metamorfoze T: +31 (0)70 314 04 89 E :
[email protected]
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 16
IV. Digitale archivering van kranten en auteursrechten8 Auteursrecht (of copyright) is enorm gegroeid in toepassingsgebied. Databanken vallen traditioneel onder het auteursrecht maar kunnen zich nu ook beroepen op een eigen beschermingssysteem. Een website als Geheugen van Ieper is een databank; die databank zelf is een creatie en als zodanig beschermd. Twee vragen zijn daarbij van belang: ten eerste: wat zijn de rechten op de databank (is er auteursrecht; is er het bijzondere databankenrecht)? ten tweede: zijn de auteursrechten op gegevens in de databank geregeld (werd toestemming gevraagd)? Om die te beantwoorden, is een korte toelichting bij het auteursrecht noodzakelijk.
Beginselen van auteursrecht Het uitgangspunt is: wat mag je als gebruiker doen met gegevens, bijvoorbeeld uit een databank, en wat zijn de rechten van de auteurs, zowel van een databank als van gegevens die in een databank zitten? Auteursrecht is een immaterieel recht dat rust op bepaalde – originele – creaties. Het toepassingsgebied is groot en omvat onder meer schilderijen, designmeubels, boeken, computerprogramma’s... Eigendom van een voorwerp geeft de bezitter nog geen immaterieel recht erop, bijvoorbeeld het recht om het te kopiëren; dat valt namelijk onder het auteursrecht. Een artikel of tekst mag niet zonder toestemming van de auteur gedrukt of gekopieerd worden. Naburige rechten komen bovenop auteursrechten. Deze komen toe aan uitvoerende kunstenaars, producenten van muziek en film en omroeporganisaties. Het gaat om de bescherming van een uitvoering of van de vastlegging van een lied of film op een cd of in een radioprogramma. Naburige rechten verstrijken na 50 jaar.
Geen ideeën, wel uitdrukkingswijzen Het auteursrecht beschermt geen ideeën, wel concrete, originele uitdrukkingswijzen. Het idee van een krantendata-bank is dus niet beschermd, wel de concrete vormgeving ervan in de mate dat die origineel is. De website Geheugen van Ieper mag dus normaal niet zonder meer gekopieerd worden voor kranten uit een andere stad. Het is soms moeilijk uit te maken of iets een kopie (van de uitwerking) is of een eigen creatie (met loutere overname van een idee). Zoals gezegd kunnen enkel originele creaties de bescherming van het auteursrecht inroepen. Originaliteit heeft hier niets te maken met artistieke waarde; men moet enkel bewijzen dat er een intellectuele inspanning nodig was en dat het werk de stempel van een persoonlijkheid draagt. Concreet wil dat bijvoorbeeld zeggen dat er (niet evidente) keuzes gemaakt moeten zijn en dat het werk niet slechts het resultaat is van technische noodwendigheden. Uit de beslissingen van rechtbanken blijkt de beschermingsdrempel eerder laag te liggen en wordt vrij snel besloten dat een bepaalde creatie onder het auteursrecht valt. Ook foto’s zijn auteursrechtelijk beschermd, mogelijk op twee manieren: auteursrechtelijk beschermde creaties mag je niet zomaar fotograferen en de foto zelf kan eveneens onder het auteursrecht vallen. Auteursrecht ontstaat altijd bij een natuurlijk persoon, niet bij een bedrijf of een instelling. Auteurs verkrijgen
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 17
het auteursrecht zelfs automatisch, zonder dat daartoe enige formaliteit moet worden vervuld. Het is dus niet omdat er geen vermelding van copyright op een werk staat, dat het niet auteursrechtelijk beschermd is! Een auteur kan beslissen om zijn rechten aan iemand anders over te dragen maar dat moet steeds schriftelijk gebeuren en met inachtneming van de regels die de wet oplegt. Auteursrechten gelden tot 70 jaar na het overlijden van de natuurlijke persoon die de rechten bezit. Een artikel van een journalist uit 1887, die in 1938 is overleden, valt dus nog steeds onder het auteursrecht. Journalisten werken of in dienstverband of freelance. In beide gevallen behouden ze het auteursrecht op hun artikelen, tenzij er een schriftelijke bevestiging is van overdracht van de auteursrechten.
Exploitatie- en morele rechten Voor het gebruik van auteursrechtelijk beschermde werken is toestemming nodig. Er is een onderscheid tussen exploitatierechten en morele rechten. Morele rechten zijn in principe niet overdraagbaar. Dat zijn: het vaderschapsrecht: het recht de naam van de auteur wel of niet te vermelden bij een werk; het openbaarmakingsrecht: de auteur moet toestemming geven om zijn werk bekend te maken; het integriteitsrecht: het recht zich te verzetten tegen elke wijziging van het werk. Er wordt in de praktijk wel aanvaard dat een auteur afstand kan doen van bepaalde morele rechten, maar dat moet schriftelijk zijn vastgelegd en kan enkel betrekking hebben op een concreet werk (algemene clausules in contracten volstaan niet). Exploitatierechten kan een auteur vrij overdragen. Ze omvatten het reproductierecht en het mededelingsrecht. Reproducties hebben een heel ruime definitie en omvatten onder andere handelingen als uitgeven in boekvorm, fotokopiëren, scannen, bewaren op een harde schrijf, fotograferen, filmen, digitaliseren, microfilmen, omzetten van tiff in jpg. Het mededelingsrecht anderzijds, omvat uitvoeringen voor een publiek alsook andere vormen van mededeling met behulp van technische middelen (radio, tv, internet, dvd). Bij veel handelingen zal het gaan om een combinatie van reproductierecht (bijvoorbeeld een foto maken) en mededelingsrecht (de foto op internet plaatsen). Er rust geen auteursrecht op akten van de overheid (zoals wetten en rechtbankbeslissingen) en op werken en prestaties in het publieke domein (werken van auteurs die langer dan 70 jaar dood zijn).
Auteurs opsporen Om toestemming te vragen, moet de auteur opgespoord worden. Veel auteurs hebben hun rechten overgedragen aan beheersvennootschappen als SABAM of SOFAM of aan een werkgever of exploitant (bijvoordbeeld een uitgever). Daar moet dan toestemming tot gebruik gevraagd worden. Is er geen overdracht, dan moet toestemming aan de auteur zelf gevraagd worden. De gebruiker moet de nodige moeite doen de auteur te vinden. Dat is niet altijd eenvoudig. Bij anonieme werken of werken onder pseudoniem moet de uitgever aangesproken worden voor toestemming. Men mag er ook van uitgaan dat de naam, initialen of logo’s die bij een werk worden vermeld, verwijzen naar de auteursrechthebbende (ook al is dat maar een vermoeden). Is het werkelijk onmogelijk om de auteurs te traceren, dan ontstaat een probleem. Het auteursrecht blijft hoe dan ook gelden, maar de gebruiker zou het (berekend) risico kunnen nemen om het werk te gebruiken met duidelijke vermelding dat hij de auteur niet kon opsporen en met het aanbod zich in de regel te stellen zodra een rechthebbende zich aanmeldt. Als de auteur gevonden is of een opdracht krijgt, moet een gebruiker toestemming tot een bepaald gebruik verwerven. Dat gebeurt via een contract, waarvan de details wettelijk zijn vastgelegd. Een gebruiksrecht van de auteur zelf kan alleen schriftelijk verkregen worden. In een contract moet verder ook aangegeven worden op welke manier het werk geëxploiteerd wordt (bijvoorbeeld drukken, digitaal), de duur van de rechten moet bepaald zijn en er moet een vergoeding bepaald worden (al is het maar één eurocent).
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 18
Geen toestemming Er zijn wettelijke uitzonderingen voor bepaalde handelingen waarvoor geen toestemming moet worden gevraagd aan auteurs. Bij sommige gebruiken voor doeleinden van onderwijs en onderzoek bijvoorbeeld is geen toestemming nodig. Ook voor het maken van kopieën in de familiekring geldt een uitzondering (bijvoorbeeld afhalen van het internet of het opnemen van een tv-programma op dvd). Er zijn nog andere uitzonderingen, bijvoorbeeld voor actualiteitsverslaggeving en parodie, maar die zijn zeer beperkt. Er is ook een uitzondering voor het maken van reproducties ten behoeve van het patrimonium. Maar die geldt alleen voor materiaal dat tot het eigen patrimonium behoort. Het gaat bovendien alleen om bewaren, niet om ontsluiten en heeft dus geen betrekking op een databank als Geheugen van Ieper. Een andere uitzondering staat toe dat mededelingen worden gedaan van materiaal dat zich in bepaalde instellingen (musea, archieven, bibliotheken) bevindt op voorwaarde dat het via vaste terminals (pc’s) in de betrokken instelling gebeurt en de informatie enkel voor privéstudie of -onderzoek wordt gebruikt.
Conclusie De structuur van de databank kan beschermd worden via het auteursrecht indien ze origineel is; de werken die in de databank opgenomen zijn, vallen vaak onder het auteursrecht. Daarnaast kan de databank genieten van een bijkomende bescherming als ze het resultaat is van een substantiële investering maar dat betreft een zeer gespecialiseerde materie.
Spreker & verslag: Verslag: Iris Steen Spreker: Prof. dr. Marie-Christine Janssens Centrum voor Intellectuele Rechten (CIR) - K.U.Leuven Minderbroedersstraat 5, 3000 Leuven, België T: +32 (0)16 323 732 E:
[email protected] W: www.law.kuleuven.be/cir/cv/mcjanssens.htm
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 19
V. Erfgoed of erfzonde? Persoonsgegevens in het krantenarchief De Wet Verwerking Persoonsgegevens Krantenartikelen bevatten namen van personen. Het op het internet plaatsten van artikelen waarin persoonsgegevens voorkomen kan problemen veroorzaken met de privacywetgeving. Voor privacy van personen die genoemd worden in de media is de Wet Verwerking Persoonsgegevens (WVP) van 8 december 1992 van belang. Volgens die wet is een persoonsgegeven iedere informatie betreffende een geïdentificeerd of identificeerbaar natuurlijk persoon (rechtspersonen vallen daar dus buiten). Het begrip informatie wordt ruim geïnterpreteerd: teksten, foto’s, geluidsopnames, beelden enzovoort. Identificeren kan direct of indirect: aan de hand van een naam, een identificatienummer of van een of meer specifieke kenmerken. In de rechtsleer bestaat discussie of de gegevens over overledenen ook persoonsgegevens zijn, ook de wet zelf geeft hierover geen uitsluitsel. Verwerking duidt op elke activiteit die men met persoonsgegevens verricht en heeft betrekking op de gehele levensloop van persoonsgegevens, vanaf de verzameling tot de vernietiging. Verzamelen, vastleggen, ordenen, bewaren, ter beschikking stellen, … geautomatiseerd of niet geautomatiseerd - zijn allemaal verwerkingen. Het archiveren van persoonsgegevens of het digitaliseren van een krant kan ook als een verwerking van persoonsgegevens worden beschouwd. De verplichtingen van de WVP zijn gericht tot de verantwoordelijke, degene die de persoonsgegevens gebruikt, zoals de persoon die beslist om kranten te digitaliseren en te ontsluiten. Een stelregel van de wet is dat er voldoende band moet zijn tussen de persoonsgegevens die men verzamelt en het doel waarvoor men ze verzamelt. De wet is zeer strikt over het verzamelen en verwerken van persoonsgegevens. In principe moet een betrokkene toestemming verlenen zijn/haar gegevens te verwerken, ook voor verwerking van krantenartikelen waarin hun persoongegevens vermeld staan. Toestemming vragen is juridisch het veiligst, maar dat is in geval van persoonsgegevens in kranten moeilijk te realiseren. Als de verwerking van persoonsgegevens noodzakelijk is voor de behartiging van een gerechtvaardigd belang, zoals archivering en digitalisering van kranten, kan er een belangenafweging daarvan plaatsvinden met dat van de betrokkene (de persoon wiens persoonsgegevens worden verwerkt). Persoonsgegevens moeten eerlijk en rechtmatig worden verwerkt. De betrokkene moet weten wat het gebruiksdoel van de gegevens is, in wiens handen de gegevens zich bevinden. Rechtmatig houdt in dat de verwerking gebeurt volgens wettelijke voorschriften. Dit is een zware eis. Als een wetsbepaling niet wordt nageleefd is de verwerking onrechtmatig. Dit houdt onder meer in dat als iemand kan aantonen dat hij/zij hierdoor schade heeft geleden, hij/zij de verantwoordelijke aansprakelijk kan stellen. Er moet voldoende verband zijn tussen het doel waarvoor persoonsgegevens worden verzameld en de verzamelde gegevens. Als bijvoorbeeld leeftijd geen relevante informatie is voor een bepaald doel, moet die informatie ook niet verzameld worden. Persoonsgegevens moeten voor welbepaalde, uitdrukkelijk omschreven en gerechtvaardigde doeleinden worden verkregen (het finaliteitsbeginsel) en mogen niet verder worden verwerkt op een wijze die onverenigbaar is met die doeleinden. Verdere verwerking is elke verwerking na het verkrijgen van de gegevens, bijvoorbeeld
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 20
digitaal beschikbaar stellen. Om te beoordelen of een verwerking al dan niet verenigbaar is met het oorspronkelijke doel, moet rekening gehouden worden met alle relevante factoren, met name de redelijke verwachting van de betrokkene (zoals de persoon die genoemd wordt in een krantenartikel). Het doel moet vastgesteld zijn voordat de gegevens worden verkregen en zo precies mogelijk omschreven worden. Een algemene of vage omschrijving is niet voldoende. Het doel moet ook gerechtvaardigd zijn. Dit betekent nuttig en noodzakelijk, rekening houdend met het maatschappelijke belang. Het doel mag niet leiden tot een overmatige inmenging in de individuele vrijheden.
Uitzonderingen voor statistisch, historisch en wetenschappelijk onderzoek Een verwerking van persoonsgegevens voor statistische, historische en wetenschappelijke doeleinden valt principieel onder de WVP, maar de wet voorziet wel in enkele afwijkingen. Statistische verwerking slaat op elke handeling met het oog op de verzameling en verwerking van persoonsgegevens die noodzakelijk is om een statistisch resultaat over te leggen. Historisch onderzoek verwijst naar verwerkingen van persoonsgegevens met het oog op een analyse van een vroegere gebeurtenis of om die analyse mogelijk te maken. Wetenschappelijk onderzoek strekt ertoe wetmatigheden, gedragsregels en oorzakelijke verbanden vast te stellen die alle personen op wie ze betrekking hebben, overstijgen. Wetenschappelijk onderzoek beschrijft globale verschijnselen. Op grond van deze definities zou kunnen worden gesteld dat wanneer een archief erfgoed bewaart, dit een verwerking voor historische doeleinden is. Een archief maakt het immers mogelijk om in de toekomst een vroegere gebeurtenis te analyseren. Voor statistisch, historisch en wetenschappelijk onderzoek is er een getrapte regeling: van anonieme over gecodeerde tot niet-gecodeerde persoonsgegevens. Onderzoekers moeten zo mogelijk werken met anonieme gegevens. In het geval van kranten valt dit heel moeilijk te realiseren. Het heeft weinig zin om een krant digitaal te gaan ontsluiten waarin enkel staat dat persoon X op plaats Z, Y heeft gedaan. Zijn anonieme gegevens niet bruikbaar, dan moet worden nagegaan of het onderzoek kan plaatsvinden aan de hand van gecodeerde gegevens. Ook deze regeling lijkt onhaalbaar voor een krantenarchief. De enige optie is dus te werken met niet-gecodeerde persoonsgegevens. Verwerking van niet-gecodeerde persoonsgegevens voor onderzoek is aan strikte regels gebonden. Het komt erop neer dat er ten aanzien van de betrokkene een uitgebreide, voorafgaande informatieplicht is van diegene die niet-gecodeerde persoonsgegevens verwerkt voor historisch onderzoek. De betrokkene moet voorafgaand uitdrukkelijk zijn/haar toestemming geven, een impliciete toestemming is dus niet voldoende. Daarnaast moet er een gemotiveerde aangifte bij de Commissie voor de Bescherming van de Persoonlijke Levenssfeer (CBPL) worden gedaan9. Opmerkelijk is dat er geen extra bescherming wordt voorzien voor het onderzoek van niet-gecodeerde gevoelige, gerechtelijke en gezondheidsgegevens. In twee gevallen kan van het vereiste van ‘informed consent’ van de betrokken persoon afgestapt worden. Ten eerste bij onderzoek van publieke persoonsgegevens. Die zijn kennelijk door de betrokkene zelf publiek gemaakt of staan in nauw verband met het publieke karakter van de betrokkene of van de feiten waarbij deze betrokken is geweest (‘bekende Vlamingen’ of mensen die vanwege de actualiteit in de media komen). Ten tweede bij gevallen waarin het onmogelijk is of onevenredige moeite kost om toestemming van de betrokkene te krijgen. In dit geval moet de aangifte bij de CBPL met een aantal gegevens worden aangevuld, onder andere een uitleg waarom toestemming verkrijgen niet mogelijk is. De CBPL richt binnen een termijn van 45 dagen een aanbeveling aan de verantwoordelijke voor de latere
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 21
verwerking, eventueel met bijkomende voorwaarden. Indien er geen bericht is binnen 45 dagen, wordt het verzoek geacht te zijn aanvaard. De regeling omtrent gebruik van persoonsgegevens voor statistisch, historisch en wetenschappelijk onderzoek is niet zo eenvoudig toe te passen en vrij strikt. Het is wel mogelijk om beroep te doen op de verschillende uitzonderingen, maar voor elk onderzoek moet dus wel goed nagaan worden of dit aan de voorwaarden voldoet. Het is niet zozeer de digitalisering en het toegankelijk maken via het web op zich, maar wel het gebruik in concreto door de individuele internaut die problemen kan doen rijzen ten aanzien van de persoonlijke levenssfeer van de betrokkenen. Er moeten voorzieningen worden getroffen, zodat de persoonsgegevens enkel kunnen worden gebruikt voor deze wetenschappelijke doeleinden. In de analoge wereld kan dat door de bezoeker een verklaring te laten ondertekenen met die strekking. Bij online beschikbaarstelling kan men een hokje laten aanvinken dat de gegevens enkel zullen worden gebruikt voor historisch of wetenschappelijk onderzoek (een disclaimer). Wie weigert het hokje aan te vinken, krijgt geen toegang tot het archief.
Rechten van de betrokkene De hoeksteen van de wet is de transparantie waarmee de gegevens worden verwerkt. De betrokkene heeft recht op kennisgeving, recht van verzet, recht op mededeling en recht op verbetering. Het recht op kennisgeving aan de betrokkenen levert bij archiefmateriaal problemen op; dan kan weer een beroep gedaan worden op de uitzonderingsregel, omdat informeren onmogelijk is of onevenredig veel moeite kost. Recht op verzet moet gesteund zijn op ‘zwaarwegende en gerechtvaardigde redenen die verband houden met de bijzondere situatie van de betrokkene’. Zwaarwegend wijst erop dat de betrokkene moet aantonen dat de verwerking voor hem nadelige effecten kan hebben, terwijl gerechtvaardigd eerder verwijst naar de situatie waarin de verwerking geen wettelijke basis heeft of onrechtmatig is. De wet bepaalt dat de betrokkene die zijn identiteit bewijst, het recht heeft om van de verantwoordelijke voor de verwerking meer uitleg te krijgen in verband met de verwerking van zijn/haar persoonsgegevens. Iedereen mag alle onjuiste gegevens die op hem/haar betrekking hebben kosteloos laten verbeteren of aanvullen. Laten verwijderen kan als persoonsgegevens onrechtmatig worden verwerkt. Algemeen wordt aanvaard dat de betrokkene niet het recht heeft om subjectieve beoordelingen te verbeteren. Als er in de kranten appreciaties voorkomen van een bepaalde persoon, dan zal de betrokkene niet het recht hebben om het originele document te laten aanpassen. De wet legt aan de verantwoordelijke voor de verwerking een aantal verplichtingen op betreffende beveiliging en vertrouwelijkheid van gegevensverwerking. Om de persoonsgegevens te beschermen moet de verantwoordelijke de gepaste technische en organisatorische maatregelen nemen (bijvoorbeeld het personeel van een instelling inlichten over de verplichtingen van de wet). De verantwoordelijke voor de verwerking moet aangifte doen bij de CBPL vooraleer hij begint met de verwerking van persoonsgegevens.
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 22
Conclusie Digitalisering en ontsluiting van oude kranten valt onder de Wet Verwerking Persoonsgegevens, want het gaat om geautomatiseerde verwerking van persoonsgegevens. De wet moet daarom worden nageleefd. De wet kent uitzonderingen voor gebruik van persoonsgegevens voor historisch, statistische en wetenschappelijke doeleinden, die, mits het naleven van een aantal voorwaarden, van toepassing kunnen zijn op het gebruik van gedigitaliseerde kranten. De regelingen daaromtrent blijven strikt en kunnen problemen opleveren, omdat niet eenvoudig kan worden aangetoond dat de kranten op het internet altijd voor wetenschappelijk onderzoek gebruikt worden. Daarom is het belangrijk de doelstellingen en privacybeleid op de website te vermelden.
Spreker & verslag: Verslag: Iris Steen Spreker: Sven Van Damme Interdisciplinary Centre for Law and ICT (ICRI) - K.U.Leuven - IBBT Sint-Michielsstraat 6, 3000 Leuven, België T: +32 (0)16 320 780 E:
[email protected] W: www.law.kuleuven.ac.be/icri www.ibbt.be
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 23
VI. De bewaring van Belgische kranten: een gedeelde verantwoordelijkheid? De krant als bron De krant is één van de fundamenten geweest van de ontwikkeling van de hedendaagse geschiedenis als nieuwe discipline. Van de ‘Blauwe reeks’ van het Interuniversitair Centrum voor Hedendaagse Geschiedenis met werkinstrumenten voor dat vakgebied zijn 44 van de ongeveer 100 titels gewijd aan de pers. In de periode 1945-2002 is 12,5% van de licentiaatsverhandelingen geschiedenis gewijd aan pers en kranten. Ook al is er sinds midden jaren 1980 veel 19de en 20ste-eeuws archiefmateriaal beschikbaar, toch blijft de krant als bron belangrijk: voor de studie van publieke opinie en besluitvormingsprocessen; voor de ontwikkeling van mediageschiedenis, waarin kranten, journalisten en uitgevers worden geanalyseerd in de politieke en maatschappelijke context; omdat binnen de geschiedbeoefening andere benaderingen in zwang gekomen zijn, waarvoor de krant informatie levert, zoals over klimaat, beurs, biografie (familieberichten), consumptie (in advertenties); omdat deze soms de enige bron is over onderwerpen die in archieven niet terug te vinden zijn. De onderzoeksmogelijkheden kunnen in een papieren omgeving niet helemaal benut worden, omdat handmatig raadplegen van jaargangen kranten zeer tijdrovend is. Digitalisering van kranten biedt de mogelijkheid andere onderzoeksvragen te stellen en sneller meer kranten te onderzoeken. Niet alleen de teksten in de krant zijn onderzoeksmaterie, ook de opmaak van een krant biedt interessante informatie. Daarom is weergave van de volledige krant eveneens van belang voor de onderzoeker.
Het project Presse Papier Het bewaren van kranten is een probleem vanwege de papierkwaliteit. Veelvuldige consultatie vergroot dat probleem nog. Vooral in de kranten uit de periode1840-1950 tikt een interne tijdbom. Oplossingen daarvoor zijn bekend: gecontroleerde opslag en beperking van manipulatie, microverfilming als conserverende maatregel en digitalisering als gebruiksvriendelijke toegang. Iedereen is zich bewust van de problematiek, maar de initiatieven zijn versnipperd. Er is wel samenwerking, maar vaak lokaal en bilateraal. Een centrale catalogus van kranten ontbreekt. Daarom is er een nationaal project opgezet: Presse Papier. Initiatiefnemers zijn de Koninklijke Bibliotheek en de Stadsbibliotheek Antwerpen. Zij werken samen met federale, Vlaamse en Waalse partners uit bibliotheken, documentatiecentra en archieven. Er is een nationale stuurgroep met vertegenwoordigers uit de drie gemeenschappen en diverse instellingen. Er zijn voorlopig geen financiële middelen voor het project. Alle investeringen, vooral in werktijd, brengen de instellingen zelf op. De doelstellingen van het project zijn: de Belgische krantencollecties in kaart brengen, waar ze zich ook bevinden; ze systematisch microfilmen en digitaliseren; afspraken maken over verantwoorde opslag van minstens twee papieren exemplaren. De stand van zaken is dat er sinds 2003 een stuurgroep bestaat en dat er sinds 2004 gegevens verzameld worden: alle instellingen zijn bevraagd en meer dan 80 hebben hun bezit doorgegeven. Men schat het aantal krantentitels op 5.000. Het gaat om zeer uiteenlopende collecties wat de omvang betreft en om heel verschillende bewaarinstellingen, van kleine documentatiecentra, gemeentearchieven die één of enkele titels bewaren tot de Koninklijke Bibliotheek, die een zeer grote collectie kranten bezit.
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 24
In 2005/2006 is geëxperimenteerd om deze gegevens in een eerste databank samen te brengen. Deze experimenten leidden niet tot het gewenste resultaat. Daarom zijn er binnen de stuurgroep taakafspraken gemaakt en is men naar financiering gaan zoeken. De taakafspraken houden in dat op federaal niveau de Koninklijke Bibliotheek en SOMA werken aan de digitalisering van een 30-tal Belgische kranten en van de clandestiene en gecensureerde pers uit beide wereldoorlogen. Op het Vlaamse niveau wordt gewerkt aan de verdere ontwikkeling en uitbouw van de databank
De Vlaamse databank De nieuwe Vlaamse databank wordt opgevat als een onderzoeksinstrument en een beleidsinstrument. Deze moet informatie geven over wie wat bezit en in welke vorm, over welke kranten werden gefilmd en welke gedigitaliseerd. Verder vormt de databank ook de basis voor nieuwe samenwerkingsprojecten en fungeert ze ook voor de eigen instelling als beleidsinstrument waarmee men prioriteiten kan stellen. Op basis van de informatie in de databank kunnen instellingen tenslotte collectieafspraken maken. Aan de structuur van de bestaande databank werden verbeteringen aangebracht, er zijn duidelijke afspraken rond catalografie gemaakt en er is een definitie van het begrip ‘krant’ vastgelegd. De beoogde structuur werd voorgelegd aan systeembeheerders van de universiteiten van Leuven, Gent en Antwerpen en de Koninklijke Bibliotheek. Daaruit is het STCV- databankmodel gekomen10, een catalogus die ontwikkeld is voor de ontsluiting van oude drukken en in heel Vlaanderen wordt gebruikt. Daarin vertrekt men van een lege databank, waarin een gecontroleerde (manuele) titelbeschrijving wordt ingevoerd. Daarna komen er bezitsgegevens bij, met links naar lokale catalogi of digitale versies. De bibliografische beschrijving is vrij eenvoudig. Het voordeel van dit model is de kwaliteitsgarantie, het nadeel is de arbeidsintensiviteit, want opvolging blijft noodzakelijk. In de Vlaamse databank worden kranten opgenomen uit de periode 1830-1950. Als referentiebestand wordt gedacht aan bestaande repertoria (de ‘Blauwe reeks’, het repertorium van de clandestiene pers van het SOMA), die natuurlijk moeten worden aangevuld op basis van bibliotheekcatalogi. Daarna pas worden bezitsgegevens toegevoegd. Er werden in het kader van Presse Papier reeds data verzameld voor 49 Vlaamse instellingen. In een later stadium kunnen daar nog de gegevens van federale en Waalse instellingen aan toegevoegd worden. Het project zou gefinancierd moeten worden met een subsidie van Vlaamse Gemeenschap op basis van het Archiefdecreet. De aanvraag is ingediend voor 1 maart 2007, de beoogde opstart, uiteraard mits goedkeuring van het dossier, is gepland op 1 september 2007. De eerste resultaten worden verwacht in 2008, de afronding is voorzien in 2009-2010. De opvolging en controle van databank en website ligt bij de Stadsbibliotheek Antwerpen, in samenwerking met Presse Papier en de Koninklijke Bibliotheek. De partners in het databankproject zijn: Stadsbibliotheek Antwerpen: projectleider; Universiteit Antwerpen (Anet, Brocade): technische partner; Vlaamse leden van de stuurgroep van Presse Papier: Amsab-Instituut voor Sociale Geschiedenis en KU Leuven; Erfgoedcel Ieper. Met de steun van het overlegplatform Erfgoedbibliotheken Vlaanderen en in nauwe samenwerking met Presse Papier. Communicatie rond de databank is belangrijk, om verdere versnippering van initiatieven te voorkomen. Daartoe dient de portaalsite, met informatie over de voortgang van het project, andere initiatieven in binnenen buitenland, ‘best practices’, Presse Papier, een nieuwsbrief en de online databank.
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 25
Het digitaliseringsproject van de federale wetenschappelijke instellingen Er is een federaal digitaliseringsprogramma voor de wetenschappelijke instellingen over 10 jaar, waarvoor 75 miljoen euro beschikbaar is. Er zijn 10 projecten met verschillende instellingen, omdat de collecties zeer uiteenlopend zijn. Een van de projecten focust op krantendigitalisering en wordt uitgevoerd door de Koninklijke Bibliotheek en het SOMA. Voor dit project is in eerste fase 2,3 miljoen euro beschikbaar. Daarmee wil de Koninklijke Bibliotheek 30 nationale titels uit de periode 1830-1950 digitaliseren, omdat het papier uit deze periode het meest bedreigd is. Het gaat om ongeveer 3200 volumes. Die 30 titels zouden een staalkaart moeten bieden van het Belgische perslandschap in deze periode. De digitalisering moet een maximum aan mogelijkheden bieden voor onderzoekers door het online beschikbaar stellen van kranten en het uitwerken van een goede regeling van auteursrechten met uitgevers. De volledige informatie van de krant zal behouden blijven, zoals bij Geheugen van Ieper. SOMA neemt in dit project de clandestiene en gecensureerde pers uit beide wereldoorlogen voor zijn rekening. Er is nood aan volledige collecties van een optimale kwaliteit. De Koninklijke Bibliotheek bezit in een aantal gevallen geen volledige collecties. Er zijn voor sommige periodes en sommige media grote hiaten, zo is uit het voorbereidende werk in het kader van het project gebleken. Om de collecties te vervolledigen is samenwerking met andere instellingen in het land onontbeerlijk. De bewaring en ontsluiting van Belgische kranten overstijgt de individuele instellingen en vergt inspanningen op en samenwerking op diverse niveaus: lokaal, regionaal en federaal. Presse Papier is daartoe een uitstekend bindmiddel.
Spreker & verslag: Verslag: Iris Steen Sprekers: Dirk Luyten Studie- en Documentatiecentrum Oorlog en Hedendaagse Maatschappij (SOMA) Luchtvaartsquare 29, 1070 Brussel, België T: +32 (0)2 556 92 11 E:
[email protected] W: www.cegesoma.be
An Renard Stadsbibliotheek Antwerpen Hendrik Conscienceplein 4, 2000 Antwerpen, België T: +32 (0)3 206 87 28 E:
[email protected] W: http://stadsbibliotheek.antwerpen.be
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 26
Voetnoten 1
Dit artikel verscheen ook in: Bibliotheek- en Archiefgids, 2007/3, pp. 23-28.
2
Een erfgoedconvenant is een contract met resultaatsverbintenis tussen een stad of samenwerkingsverband en de Vlaamse Gemeenschap. Een Erfgoedcel is verantwoordelijke voor de uitvoering ervan. Het Iepers convenant werd eind 2004 verlengd voor de periode 2005-2008.
3
CO7 werd eind 2005 opgericht als een culturele projectvereniging van de volgende steden en gemeenten: Ieper, Poperinge, Zonnebeke, Heuvelland, Langemark-Poelkapelle, Vleteren en Mesen. De regionale beeldbank bes taat uit een koepelsite – www.westhoekverbeeldt.be – en 7 gemeentelijke sites waarvan www.ieperverbeeldt.be er een is.
4
Gazette van Yperen, L’Opinion, Het Weekblad van IJperen, De Kunstbode, De Weergalm, Nieuwsblad van Yperen, De Toekomst en La Lutte/De Strijd uit de periode 1862-1914 zijn al consulteerbaar. De komende maanden worden Journal d’Ypres en Het Ypersche toegevoegd en er zijn ook plannen om de collectie dit jaar nog uit te breiden met titels tot aan het einde van de Tweede Wereldoorlog.
5
www.tresoar.nl
6
www.geheugenvannederland.nl en www.den.nl
7
www.kb.nl/kranten
8
Dit artikel verscheen ook in: Bibliotheek- en Archiefgids, 2007/3, pp. 30-31.
9
www.privacycommission.be
10
www.stcv.be
OUD NIEUWS, NIEUW LEVEN? Studiedag over de digitale bewaring & ontsluiting van historische kranten • Verslag • 27
Colofon Deze brochure is een uitgave van Erfgoedcel Ieper n.a.v. de studiedag ‘Oud Nieuws, Nieuw Leven?’ te Ieper op 1 februari 2007.
Coördinatie Erfgoedcel Ieper (Eva Wuyts)
Teksten Eva Wuyts en Iris Steen
Beelden Stad Ieper, Sophie Ham, Eddy van der Noord
Vormgeving en druk Grafische dienst stad Ieper (Frederik Pattyn)
Wettelijk depot D/2007/10.815/2