DEN Collecties en Open Archives Initiative DEN – Janneke van Kersen Nadrukkelijk is de afgelopen jaren door de overheid en erfgoedinstellingen aandacht gegeven aan de digitalisering van ons cultureel erfgoed. Veelgebruikte begrippen in dit kader zijn beheer, behoud, duurzaamheid en vooral ook toegankelijkheid. Algemeen wordt verondersteld dat de digitalisering van erfgoed bronnen leidt tot een grotere toegankelijkheid van dat erfgoed.
Open Archives Initiative (OAI) - een protocol voor het uitwisselen van metadata - OAI maakt het mogelijk om op eenvoudige wijze, platform- en gegevensonafhankelijk, informatie met betrekking tot in databases beheerd cultureel erfgoed online aan te bieden. DEN bouwt aan een nationale infrastructuur voor het sector- en instellingsoverstijgend toegang bieden tot cultureel erfgoed informatie in Nederland. Het OAI protocol maakt dit mogelijk, met als belangrijk detail dat het initiatief tot deelname en de wijze waarop en welke informatie aangeboden wordt binnen het beheer van de instelling valt en niet aan derden hoeft te worden overgelaten. Presentatie van informatie en samenwerking van erfgoedinstellingen op internet Steeds meer erfgoedinstellingen gaan ertoe over collectieinformatie of toegangen tot archieven op één of andere manier op het internet ter beschikking te stellen. [noot 1] Onafhankelijk van de erfgoedsector waarin men werkzaam is, kunnen hierbij de volgende vragen rijzen: hoe stel ik mijn informatie online beschikbaar, hoe zorg ik dat de gebruiker op een goede manier toegang krijgt tot deze informatie, hoe kan ik samenwerken met andere instellingen, hoe regel ik de rechten. De vragen zijn hiermee dus technisch, organisatorisch en inhoudelijk van aard. De instelling, als specialist binnen haar kennisdomein, moet als informatieleverancier zoveel mogelijk in staat zijn om het beheer en de toegang tot haar gegevensverzamelingen in eigen hand te houden. Zij kan besluiten om zelf diensten te verlenen (zoals bijvoorbeeld het inrichten van een online vraagcentrum, of het toelaten/uitnodigen van derden bij het beschrijven van de door haar beheerde objecten) of om in samenwerking met anderen te komen tot een gemeenschappelijk informatieaanbod waarbij de instellingen zelf, of derden een toegevoegde waarde verlenen aan de informatie door de door hen ontwikkelde diensten. Culturele instellingen als informatieleveranciers en al dan niet in samenwerking met anderen als aanbieders van online diensten, zullen gebaat zijn bij gestandaardiseerde gegevensbeschrijving en toegang van het door hen gegenereerde informatieaanbod. Het Open Archives Initiative is een manier om op het technisch vlak houvast te bieden bij het beschikbaar stellen van gegevensverzamelingen. In feite gaat het om een aantal afspraken die bepalen hoe de data van de instellingen op gestandaardiseerde wijze toegankelijk gemaakt en bevraagd kunnen worden als zij online worden aangeboden. Steeds meer werken instellingen ook samen; hetzij binnen de eigen sector, hetzij sectoroverstijgend, of beide. Deze
1/9
samenwerking krijgt haar beslag vaak doordat de instellingen overgaan tot een geïntegreerd informatie-aanbod, waarbij de informatie afkomstig uit de verschillende databases gelijktijdig doorzoekbaar wordt aangeboden. Er zijn verschillende manieren mogelijk om dit geïntegreerde informatie-aanbod vorm te geven. Er kan bijvoorbeeld sprake zijn van een centrale database waarin alle informatie (of een selectie van gegevens) uit de databases van instellingen is opgenomen. [noot 2] Een alternatief voor deze werkwijze is gebaseerd op het principe van de gedistribueerde omgeving. In dit geval is er geen centrale database, maar bevinden de gegevens zich op verschillende plaatsen op servers op het internet. In beide gevallen moet met duidelijke afspraken worden vastgelegd hoe de verschillende databases zich tot elkaar verhouden. Anders gesteld; welke informatie is in welk veld opgenomen en hoe zorg ik ervoor dat bij het raadplegen van de gezamenlijke gegevensverzamelingen de juiste velden worden aangesproken in de verschillende databases, zodat het antwoord op de door mij gestelde zoekvraag een betrouwbaar resultaat oplevert. Het gaat dus niet alleen om afspraken met betrekking tot het online beschikbaar stellen van data, maar ook om afspraken met betrekking tot het te hanteren uitwisselingsformat of metadataschema, voor de door de instellingen beheerde gegevensverzamelingen. Het Open Archives Initiative regelt beide. Er wordt zowel vastgesteld hoe de data van de instellingen benaderd kunnen worden, als vastgelegd volgens welke regels de metadata met betrekking tot de bronnen beschreven en aangeleverd moeten worden. [noot 3]
KORTE GESCHIEDENIS EN ACHTERGROND Het Open Archives Initiative heeft zijn oorsprong in de wereld van het wetenschappelijk elektronisch publiceren. In 1999 werd in Santa Fe een start gemaakt met dit initiatief gebaseerd op de behoefte van wetenschappers om auteursrechtelijk controle te houden en invloed uit te kunnen oefenen op het publicatieproces. De doelstelling die geformuleerd werd was: het ontwikkelen van een infrastructuur op internet die op eenvoudige manier toegankelijk is voor informatieleveranciers daarmee de gemeenschappelijke toegang tot hun data-aanbod ondersteunend. Vastgesteld werd dat een dergelijke infrastructuur gebaat zou zijn bij een laagdrempelig protocol of gestandaardiseerde set van afspraken, om toegang te verschaffen tot de metadata waarmee de bronnen van de dataleveranciers beschreven zijn. In februari 2000, een jaar na de eerste bijeenkomst, werden te Santa Fe de technische en organisatorische eisen voor een dergelijke infrastructuurvastgesteld, waarmee het mogelijk zou zijn invulling te geven aan de hierboven beschreven behoefte. Versie 1.0 van Open Archives was daarmee een feit: en applicatie-onafhankelijk regelsysteem, bedoeld om op een laagdrempelige manier, het data-aanbod van instellingen en de onderlinge samenwerking te ondersteunen. Het initiatief vond al snel navolging binnen andere informatiebeherende gemeenschappen dan die van het elektronisch publiceren. Dit had gevolgen voor de definitie van het protocol dat oorspronkelijk vooral gericht was op het bieden van toegang tot tekstuele documenten. In de huidige versie 2.0 is ook aandacht voor andere informatiebronnen dan wetenschappelijke publicaties, die door middel van het protocol toegankelijk gemaakt moeten kunnen worden. Het Open Archives Initiative kent in feite twee belangrijke groepen. Aan de ene kant de leveranciers van informatieverzamelingen (voor de erfgoedsector bijvoorbeeld musea, archieven, bibliotheken) en aan de andere kant de leveranciers van diensten. Dit kunnen de erfgoedinstellingen zelf zijn, samenwerkende erfgoedinstellingen, maar ook anderen zoals bijvoorbeeld landelijk of provinciaal samenwerkende erfgoedorganisaties.
2/9
Meer informatie over het protocol en de inmiddels eveneens opgezette organisatiestructuur is te vinden op: www.openarchives.org en www.oaforum.org.
HET EIGENLIJKE PROTOCOL – OAI-PMH Het protocol dat geadopteerd werd, staat bekend onder de naam PMH - Protocol for Metadata Harvesting. De naamgeving van de conventie die gebruikt wordt door het Open Archives Initiative is dan ook voluit: OAI-PMH. Het harvesting of 'oogst' protocol is een laagdrempelig protocol om op gestandaardiseerde wijze gedistribueerde (zich op verschillende plaatsen bevindende) dataverzamelingen te ontsluiten. OAI-PMH is erop gericht toegang te verschaffen tot dataverzamelingen van verschillende informatiesystemen-beherende dataleveranciers, onafhankelijk van de door hen gebruikte software. Die toegang wordt verschaft op metadataniveau: tot de metadata waarmee het bronnenmateriaal (objecten, beeldmateriaal, archiefstukken e.d.) van de dataleveranciers beschreven zijn. De term Archives heeft overigens betrekking op de beheerde data en heeft niets met archieven te maken. Gezien de oorsprong van het initiatief is het ook duidelijk dat de aanduiding 'open' niet betekent dat de metadata verwijzen naar informatiebronnen die auteursrechtelijk vogelvrij zijn. Het gaat om een open toegang tot dataverzamelingen op metadataniveau. Of de inhoud van de eigenlijke bron daarmee ook toegankelijk wordt, is geen zaak van het OAI-protocol, maar van de dataleverancier. Om via een open interface toegangen tot bronmateriaal mogelijk te kunnen maken, dienen er afspraken gemaakt te worden over de wijze waarop de metadata aangeboden worden. Hiervoor werd onder andere gekozen voor unqualified Dublin Core, een standaardbeschrijvingsset voor metadata waarbij de meest algemene kenmerken met betrekking tot een informatiebron in 15 elementen omschreven kunnen worden. [noot 4] Instellingen die hun data volgens het OAIprotocol ter beschikking stellen worden dus geacht de door hen gehanteerde locale beschrijvingswijze te mappen, of te vertalen, naar de velden die voorgeschreven worden in de Dublin Core metadatastandaard (of een ander door OAI geaccepteerd format). Daarnaast is vastgesteld in welke syntax, dus met behulp van welke taal, de metadata beschreven moeten worden. Hiervoor is gekozen voor XML.
HOE ZIET EEN OAI-RECORD ERUIT? Een OAI-record bestaat uit een header waarin een unieke id en een datering wordt vastgelegd. Verder moet aangegeven worden van welk metadataschema gebruik gemaakt is. [noot 5] Bovendien is er een mogelijkheid om informatie op te nemen met betrekking tot de rechten of het gebruik van de metadata (hierbij wordt gebruik gemaakt van van het 'about' argument). Om de structuur van de aangeboden data op geldigheid te controleren werd een XML schema, dat al in 2001 door W3C als recommendation geaccepteerd werd, ontwikkeld. Met andere woorden: met behulp van XML schema wordt gecontroleerd of de metadata zijn aangeboden volgens de afspraken die in het OAI protocol zijn vastgelegd. In samenwerking met het Dublin Core Metadata Initiative werd het beschrijvingsschema dat gebruikt wordt bij de overdracht van de metadata in het verplichte DC format, in XML Schema vastgesteld. Dit schema wordt ook bewaakt door DCMI (Dublin Core Metadata Initiative).
HOE WERKT HET PROTOCOL? Het Open Archives Initiative is gericht op het bevorderen van interoperabiliteit. Dit houdt in, dat naast het gestandaardiseerd beschrijven van de bronnen met behulp van een
3/9
metadatastandaard, de aangeboden dataverzamelingen online toegankelijk moeten zijn om benaderd te kunnen worden door zoekmachines. De methode waarmeede informatie-eenheden met betrekking tot de dataverzamelingen over het net verstuurd kunnen worden, is het bekende HTTP -protocol. Het bevragen van de verschillende dataverzamelingen en de afhandeling van het informatieverzoek, gebeurt met behulp van de GET of POST methode. Ieder, door de gebruiker ingegeven en door de computer uitgevoerd informatieverzoek bestaat uit een URL (namelijk het adres van de HTTP-server waarop de dataverzameling geplaatst is) en een aantal argumenten die iets zeggen over de aard van het informatieverzoek. Het OAIprotocol kent zes van dit soort operaties of kwalificaties waarmee het informatieverzoek nader gespecificeerd kan worden. Het gaat om het verschaffen van duidelijkheid omtrent de wijze waarop de data uit een datadepot kunnen worden opgehaald, geselecteerd en gepresenteerd. Deze operaties worden vastgesteld door degene die het informatieaanbod genereert. [noot 6] Alweer wordt er gebruik gemaakt van een XML schema om te controleren of de resultaten van het informatieverzoek voldoen aan de eisen die het OAI-protocol stelt om het informatieverzoek op juiste wijze af te handelen.
SELECTIE VAN DATA Het is, om verschillende redenen, niet altijd nodig om een gehele dataverzameling te bevragen. Daarom voorziet het protocol in de mogelijkheid door de OAI-zoekmachine een selectie te laten maken in het recordaanbod. Er kan voor voor deze selectie gebruik gemaakt worden van twee eenvoudige principes: een controle op datering en/of de definitie van SETS. Bij het principe van datering worden de resultaten (data) van oogstacties van verschillende momenten (dateringen) met elkaar vergeleken. Alleen die data worden opnieuw geoogst die gewijzigd zijn ten opzichte van de vorige keer. Bij het principe van sets wordt aan een groep data een bepaalde kwaliteit toegekend, bijvoorbeeld behorend tot eenzelfde kennisdomein of afkomstig van een bepaalde groep instellingen. Een bijzondere kwaliteit van SETs is dat de data binnen een SET hiërarchisch gegroepeerd kunnen zijn. Voor de gebruikte syntax kunt u zich oriënteren op de open archives website. OAI biedt slechts het principe aan. De wijze van inhoudelijke beschrijving ligt niet vast en kan dus door de informatiebeherende gemeenschap zelf vastgesteld worden. Als er gebruik gemaakt wordt van SETS dan is het verplicht om vast te leggen dat bepaalde items uit de dataverzameling tot een set behoren. Als een informatieverzoek een grote verzameling data oplevert, dan worden de resultaten gesplitst. Er wordt gebruik gemaakt van een zogenaamde 'resumption token' om ervoor te zorgen dat daadwerkelijk ook alle gevraagde resultaten uiteindelijk aan de gebruiker getoond worden.
INFORMATIELEVERANCIERS EN OAI Het OAI-protocol is geen ingewikkeld programma van eisen. De verwachting is dat het protocol dan ook veel gebruikt zal worden. Er is echter geen voorziening getroffen om duidelijk te maken waar een OAI toegankelijke dataverzameling zich bevindt. Er zijn verschillende manieren voor dataleveranciers om hiermee om te gaan. Men kan zich eenvoudigweg conformeren aan het protocol, maar men kan zich ook registreren als gebruiker
4/9
of besluiten om gebruik te maken van de wijze waarop door de OAI-gemeenschap het beheerde kennisdomein beschreven wordt. Dat gebeurt door middel van de OAI namespace conventie, een gestandaardiseerde manier om de eigenschappen en inhoud van een datadepot te beschrijven. Ten slotte kan ook de OAI toegankelijke repository geregistreerd worden op de website van . De IPR of auteursrechtenkwestie wordt niet geregeld door het OAI protocol, hooguit kan in de beschrijving van de metadata hier een opmerking over meegegeven worden. OAI gaat er vanuit dat de rechten met betrekking tot de aangeboden gegevensverzamelingen door de instelling zelf geregeld worden.
VOORBEELDEN VAN OAI GEBRUIK – ONTWIKKELDE DIENSTEN Hieronder worden een drietal voorbeelden genoemd die duidelijk maken wat bedoeld wordt met aanbieders van diensten:
DARE (Digital Academic Repositories) Een project van de gezamenlijke Nederlandse universiteiten in samenwerking met de Koninklijke Bibliotheek, de Koninklijke Nederlandse Academie van Wetenschappen en de Nederlandse Organisatie voor Wetenschappelijk Onderzoek om via OAI hun onderzoeksresultaten gemeenschappelijk ontsloten aan te bieden, met bijbehorende gebruiker-faciliterende diensten. SURF heeft voor dit project bij OCenW subsidie verworven. [noot 7]
DP9 Met behulp van OAI worden uit een database data geoogst en vervolgens in hard gecodeerde html pagina's op het web ter beschikking gesteld zodat ze door zoekmachines gevonden kunnen worden. [noot 8]
CYCLADES De nieuwste ontwikkeling op dit gebied is 'Cyclades'. [noot 9] Een europees project waarbinnen een virtueel archief wordt opgebouwd. De toegevoegde waarde van de binnen dit project te ontwikkelen dienst bestaat uit een gebruikersomgeving waarbinnen op grond van individuele gebruikersprofielen informatie kan worden gevonden. Gebruikers kennen aan de bronnen waarderingscijfers toe en er bestaat een gemeenschappelijke workbench.
OAI(MHP) OF Z39.50? Behalve het OAI-protocol kunnen dataverzamelingen op verschillende locaties ook doorzoekbaar gemaakt worden via een ander protocol, Z39.50 genaamd.In feite hebben we het hier over twee totaal verschillende principes. Bij OAI gaat het om het verzamelen van metadata die op verschillende servers van verschillende dataleveranciers toegankelijk gemaakt zijn volgens een set van afspraken. Het gaat hier dus om gedistribueerde dataverzamelingen. Bij Z39.50 hebben we te maken met een zoekinterface die het mogelijk maakt om bij iedere gebruikersvraag direct de verschillende dataverzamelingen op gedistribueerde wijze te benaderen. Een ander verschil tussen beide ontsluitingsmechanismen is het verschil in complexheid waarmee de toegang tot de data verleend wordt. OAI is een bijzonder laagdrempelig, makkelijk te implementeren protocol. Z39.50 is dat zeker niet. Voorstanders van Z39.50 zullen wijzen op de controles die uitgevoerd worden om tot een goed data-aanbod te komen. Aanhangers van OAI zullen dat erkennen, maar toch ook wijzen op de voordelen die de pragmatische benadering van OAI deelnemers kenmerkt. Er zou zelfs sprake kunnen zijn van een mengvorm, waarbij van een Z39.50 interface gebruik gemaakt wordt om met behulp van OAI verzamelde data toegankelijk te maken. Met andere woorden Z39.50 zou OAI compliant moeten kunnen worden
5/9
gemaakt. Voor alle duidelijkheid: OAI is niet ontworpen ter vervanging van andere protocollen maar vooral bedoeld om op eenvoudige wijze interoperabiliteit te ondersteunen en metadata uit te kunnen wisselen. Het OAI protocol gaat uit van Dublin Core simple (dus zonder nadere specificaties waardoor bijvoorbeeld collectiebeschrijvingen een probleem op kunnen leveren, zoals in Dublin Core qualified het geval is) waarbij het gebruik van geen enkel element verplicht wordt gesteld. Het gebruik van Dublin Core qualified is vooral ingegeven door de behoefte bij verschillende sectoren aan een format dat meer tegemoet komt aan de sectorspecifieke eisen. [noot 10]
DEN EN OPEN ARCHIVES Het OAI-protocol kan gebruikt worden om op een laagdrempelige manier, sector- en instellingsoverstijgend metadata verzamelingen gemeenschappelijk ontsloten toegankelijk te maken. Een van de doelstellingen van DEN is om via een nationaal platform sector- en instellingsoverstijgend toegang te bieden tot het cultureel erfgoed in Nederland. Een deel van deze toegankelijkheid wordt ingevuld door een geïntegreerde toegang tot de erfgoedcollecties in Nederland. Ten behoeve van deze gemeenschappelijke toegang tot collecties heeft DEN besloten om gebruik te maken van het OAI protocol om een platform-, gegevens- en leveranciersonafhankelijk aanbod van erfgoeddata te kunnen genereren. Bovendien maakt de technische laagdrempeligheid en de adoptie van Dublin Core het protocol toegankelijk en bruikbaar voor het grootste deel van de Nederlandse erfgoedinstellingen. [noot 11]
ERFGOED COLLECTIES ONLINE EN OAI: ONDERDEEL COLLECTIES VAN DE CULTUURWIJZER Bovenstaande tekening biedt een overzicht van de wijze waarop erfgoedcollecties van een verschillend aggregatieniveau via het OAI-protocol raadpleegbaar zijn in de Cultuurwijzer Collecties. Er is hierbij zowel sprake van decentrale (de data bevinden zich op verschillende servers) als centrale gegevensopslag binnen het kennisdomein 'Cultureel Erfgoed'. De basis voor dit gemeenschappelijk raadpleegbare erfgoed zijn de verschillende erfgoedcollecties. Deze kunnen op objectniveau bevraagd worden. Een toegang op hoger aggregatieniveau wordt verkregen door de integratie van bijvoorbeeld MUSIP. Binnen MUSIP wordt museale informatie niet op objectniveau maar op collectieniveau beschreven. [noot 12] Een vergelijkbaar niveau van informatiebeschrijving kan voor archieven gevonden worden in de archiefinventarissen. De beschrijving van de toegang tot archieven waar een gestandaardiseerde beschrijvingswijze voor bestaat in de vorm van de EAD. Deze Electronic Archival Description vindt meer en meer ingang bij het beschrijven van de toegangen tot archieven in Nederland. De bedoeling is dat de collecties zowel direct op objectniveau, direct op collectieniveau of in een combinatie van beiden bevraagd kunnen worden. De relatie tussen het objectniveau en het collectieniveau kan op inhoudelijke gronden (gemeenschappelijke semantiek) als formele (overeenstemmende velden in de recordstructuur en unieke identificatiecodes) gelegd worden. [noot 13] Fysiek bevinden de data van de verschillende gegevensverzamelingen zich op een server die via internet toegankelijk is. De data zijn opgeslagen als XML bestanden en moeten worden
6/9
aangeboden in het gestandaardiseerde Dublin Core format, zoals vereist is in het OAI protocol. Op deze manier zijn de instellingen verantwoordelijk voor het eigen gegevensbeheer en kunnen ze zelf bepalen welke data wanneer en hoe worden aangeboden. De data kunnen meer specifiek ontsloten worden door gebruik te maken van (sector- en instellingsspecifieke) gestandaardiseerde woordenlijsten en thesauri op het niveau van de individuele instellingen. In een centraal, aan het OAI protocol voldoend xml depot worden de bestanden vergaard. Daarna kan er door een dienstenleverancier toegang toe geboden worden. In bovenstaande tekening worden de data bevraagd via een centrale index waarbinnen gebruik gemaakt wordt van een thesaurus of in de toekomst een erfgoedontologie [noot 14] om de data volgens gemeenschappelijke inhoudelijke definities binnen het erfgoed kennisdomein te kunnen bevragen. Het OAI-protocol staat het gebruik van SETs toe waardoor bij het bevragen van de gegevensverzamelingen al duidelijk is welke instellingen bijvoorbeeld samenwerken bij het aanbieden van hun data. Met behulp van deze SET-definitie kan ook op grond van een thematische insteek een aantal verzamelingen tegelijkertijd bevraagd worden. Bijvoorbeeld een collectie keramiek of op grond van een geografisch kenmerk zoals behorend tot een bepaalde provincie. Sets maken dus de selectie en beschrijving van dataverzamelingen maar ook van collecties mogelijk. [noot 15] In de Dublin Core standaard worden digitale afbeeldingen als aparte records beschouwd. Voor de publieksvriendelijke presentatie van het erfgoedmateriaal is een dergelijke beschrijving niet noodzakelijk. Wel moet het voor de data-verzamelende zoekmachine duidelijk zijn waar de afbeeldingen zich bevinden. Dit zal dan ook in de aangeboden dataverzameling opgenomen moeten zijn middels een verwijzing naar naam en plaats van de digitale afbeelding online. Eventueel zou bij deze afbeelding opgenomen kunnen zijn met welk doel deze gemaakt is.
CULTUURWIJZER TOEGANG COLLECTIES De Cultuurwijzer biedt toegang tot een groeiend aantal databases. De tekening laat ook zien dat er sprake is van verschillende niveaus waarop toegang tot dataverzamelingen beschreven worden. Daarnaast kennen sommige projecten een thematische insteek en zal er rekening gehouden moeten worden met geografisch bepaalde toegangen zoals die op provinciaal niveau op dit moment gerealiseerd worden. Een apart probleem is het verschil in grootte tussen de aangeboden data-verzamelingen. Er zal in de interface van de Cultuurwijzer recht gedaan moeten worden aan al deze verschillende aspecten van toegankelijkheid tot de data. Er moet niet alleen een duidelijke matrix voor de toegang tot de gevensverzamelingen ontwikkeld worden. Ook de hiërarchische organisatie van en toegang tot het materiaal is van groot belang. De collectie schoenen van het Schoenenmuseum moet net zo snel gevonden kunnen worden als de collectie van het Museum voor Volkenkunde. Bovendien moet een geïntegreerde benadering evenveel recht doen aan beide dataverzamelingen. De hierboven geduide ontsluitingsproblematiek moet bovendien naar een ergonomisch verantwoorde zoekschil vertaald worden. XML schema en / of RDF - beschrijving van metadata in relatie tot een kennisdomein Gegevensverzamelingen worden binnen het OAI-protocol beschreven door een XML-schema. Gebruik van deze notatiewijze maakt het ook mogelijk aan te geven binnen welke namespace de dataverzamelingen beschreven zijn. Het toepassen van Namespaces heeft belangrijke
7/9
voordelen op het gebied van de validatie van gegevens. Door middel van deze XML conventie kan men aangeven naar welke maatstaven van welke informatiebeherende gemeenschap de aangeboden dataverzamelingen gevalideerd kunnen worden. XML-schema wordt, zoals hierboven omschreven, in het OAI-protocol op twee niveaus gebruikt. In beide gevallen is het doel van het gebruik ervan validatie van de aan te bieden data. Met behulp van RDFs (Resource Description Framework schema) kan een dataverzameling kennisdomein-specifiek geduid worden. Dit kan van belang zijn bij de integratie van verschillende soorten bronnen zoals html pagina's en erfgoedcollecties. Zowel html pagina's als geïndexeerde collecties kunnen met behulp van RDFs op metadata niveau worden beschreven. Hiermee zou een dienst bewezen kunnen worden aan de geïntegreerde ontsluiting van erfgoedcollecties en andere erfgoedbronnen. Naast de gestandaardiseerde beschrijving van de metadata met behulp van Dublin Core voor het op formeel niveau gemeenschappelijk bevragen van data en de afspraken met betrekking tot de inhoudelijke data, moet namelijk ook vastgesteld worden hoe we deze kennis technisch vast gaan leggen.
MEER LEZEN www.openarchives.org (hier staan ook de implementation guidelines) www.oaforum.org
NOTEN
noot 1 dit betekent niet altijd dat er ook gelijk sprake is van een publieksvriendelijke toegang. Veelal is de aangeboden informatie afkomstig uit de database die tot nu toe voor behoud en beheer gebruikt werd. Maar dat is een probleem dat buiten het bestek van dit document valt.
noot 2 de centrale database zal op gezette tijden aangevuld en gecontroleerd moeten worden als er sprake is van een sterk groeiend informatie-aanbod bij de instellingen.
noot 3 In Nederland wordt in het project DARE door universiteitsbibliotheken gebruik gemaakt van dit protocol. De Vereniging Digitaal Erfgoed Nederland streeft ernaar dit bevragingsprotocol te gebruiken om de gedistribueerd culturele databases in Nederland gestandaardiseerd gemeenschappelijk te ontsluiten
noot 4 meer informatie: www.dublincore.org
noot 5 het OAI protocol staat dus een aantal beschrijvingformats voor metadata toe. Naast Dublin Core is bijvoorbeeld ook MARC21 een geaccepteerde beschrijvingsstandaard binnen het protocol. Meer informatie over MARC21: www.ifla.org
noot 6 De verschillende operaties zijn: GetRecord: dit wordt gebruikt om één item uit een depot op te halen. Vereist zijn 'id' en 'metadataformat' Identify: dit is bedoeld om informatie over de dataverzameling in te winnen (met behulp van: naam van het depot, de URL waar de dataverzameling zich bevindt, versie van het OAI protocol dat door de dataleverancier ondersteund wordt, het email adres van de beheerder van de dataverzameling) ListIdentifier: dit verschaft toegang tot identifiers van records die uit een depot opgehaald kunnen worden. Er kan optioneel gekozen worden voor een selectie van het data-aanbod ListMetadatFormats: dit argument wordt gebruikt bij het afhandelen van een informatieverzoek naar welke metadataformats in het specifieke datadepot gebruikt zijn.
8/9
ListRecord: wordt gebruikt om data te oogsten. Deze data kunnen afhankelijk zijn van een dateringsargument of behoren tot een bepaalde set. In de oogstactie kan een dergelijke beperking aan het informatieverzoek zijn toegekend. ListSet: dit wordt gebruikt in een informatieverzoek naar de hiërarchie van de set.
noot 7 www.surf.nl/themas/index2.php?oid=18
noot 8 http://arc.cs.odu.edu:8080/dp9/about.jsp
noot 9 www.ercim.org/cyclades biedt toegang tot dit project
noot 10 Zo bestaat er vaak de wens om tijd en plaats meer specifiek te kunnen beschrijven met het oog op ontsluiting en toegankelijkheid van de data dan het eenvoudige Dublin Core format toestaat.
noot 11 Om het OAI protocol bereikbaar te maken voor instellingen en daadwerkelijk te kunnen bouwen aan een landelijke toegang voor cultureel erfgoed collecties heeft DEN een instrument laten ontwikkelen dat van dienst is bij het aanbieden van collectieen objectinformatie, danwel inventarisinformatie als het archieven betreft. Dit instrument is op dit moment nog in de testfase.
noot 12 Museum Inventarisatie Project. Een totaaloverzicht van museale collecties: de Collectie Utrecht werd als eerste beschreven binnen de provincie die ook de bedenker en aanjager van het project is. MUSIP is uitgevoerd van 1997 tot 2000. Van 44 musea zijn 1175 deelcollecties in een database opgenomen. Momenteel wordt een project uitgevoerd, gecoördineerd door het Landelijk Contact Museumconsulenten, waarbij de MUSIP-methode in alle andere provincies wordt toegepast.
noot 13 Het Nationaal Archief en DIVA spelen een sleutelrol bij de introductie en verspreiding van EAD in Nederland. Het Nationaal Archief stelt de richtlijnen met betrekking tot de toepassing van EAD ter beschikking. Voor het leggen van een inhoudelijke relatie zal nog het nodige werk verricht moeten worden met betrekking tot gemeenschappelijk te hanteren begrippenapparaten zoals bijvoorbeeld de Art and Architecture Thesaurus (meer informatie hierover: www.rkd.nl of www.aat-ned.nl).
noot 14 een ontologie is een verzameling van abstracte concepten waartussen relaties gelegd kunnen worden. Een voorbeeld van een erfgoedontologie is het Cidoc CRM (conceptual reference model). Meer informatie: http://cidoc.ics.forth.gr/
noot 15 Informatiebeherende gemeenschappen kunnen hun eigen XML schema erop nahouden (of gebruik maken van bestaande gestandaardiseerde schema's) om de inhoud van het SET-argument te duiden. Het XML schema wordt dan gebruikt om het setDescription element (of de hierna genoemde description bij Identify) op gestructureerde en controleerbare wijze nader in te vullen. De implementatie guidelines stellen dat als de dataverzameling betrekking heeft op één collectie, dit beter in een ander element opgenomen kan in 'description' waarmee het Identify argument nader gespecificeerd kan worden. Als er slechts een tekstuele beschrijving van de dataverzameling gemaakt wordt, dan kan (alweer volgens de guidelines) beter gebruik gemaakt worden van het element description in de Dublin Core standaard.
COLOFON De informatie uit dit artikel mag overgenomen worden, mits voorzien van juiste bronvermelding.
9/9