Catalogiseren in het digitale tijdperk Erik Oltmans Hoofd Verwerking Publicaties Koninklijke Bibliotheek FOBID Studiedag Van Catalogiseren naar Metadatabeheer 27 september 2007
Goedemiddag. Mijn naam is Erik Oltmans, en ik ben hoofd van de hoofdafdeling Verwerking Publicaties. In deze presentatie zal ik nader ingaan op vooral de praktische consequenties van het motto van deze studiedag: Van Catalogiseren naar Metadatabeheer. Wat betekent dat in de praktijk?
Van Catalogiseren naar Metadatabeheer
Overzicht
•
De invloeden op ons catalogiseerproces: 1. Meer publicaties: hoe blijven we dit doen? 2. Andere verwachtingen bij gebruikers
•
Wat zijn de praktische implicaties?
•
Wat staat ons te doen?
Koninklijke Bibliotheek – National Library of the Netherlands
In deze presentatie wil ik twee belangrijke factoren bespreken die het catalogiseerproces de komende jaren dominant zullen beïnvloeden. De eerste factor is de toename aan publicaties die wij geacht worden te catalogiseren. In het internet-tijdperk is publiceren gemakkelijker dan ooit geworden, en veel nieuwe technieken stellen ons staat om publicaties in allerlei vorm uit te brengen. Hoe gaan de bibliotheken daarmee om? De tweede factor is de veranderende verwachting van de moderne gebruiker van informatiediensten. Daarop zal moeten worden ingespeeld worden, om ervoor te zorgen dat de catalogus een belangrijke en vaak geraadpleegde bron blijft voor wetenschappelijk onderzoek. Of populair gebruik. Ik wil in deze presentatie vooral stilstaan bij enkele praktische implicaties van deze ontwikkelingen: wat kunnen we doen om het hoofd te bieden aan een groeiend aantal publicaties, terwijl gebruikers andersoortige diensten van ons verlangen? Wat moeten wij doen? Ik kan de antwoorden al een beetje weggeven in termen van het onderscheid dat Daniël van Spanje vanmorgen maakte: de toename van publicaties moeten we het hoofd bieden door aanpassing van de werkprocessen. En de rol van de gebruiker impliceert content integratie. In de volgende dia’s zal ik uitleggen wat dat voor ons betekent.
Van Catalogiseren naar Metadatabeheer
Meer publicaties…
Koninklijke Bibliotheek – National Library of the Netherlands
De eerste factor: het groeiende aantal te ontsluiten publicaties.
Van Catalogiseren naar Metadatabeheer
Er is (te) veel om te catalogiseren..
• Groei van het aantal publicaties, zowel gedrukt als digitaal • e-journals, e-books, blogs, wikis etc • Nieuwe formaten: web archivering • Groeiend aantal massadigitaliseringsprojecten
Koninklijke Bibliotheek – National Library of the Netherlands
Zoals gezegd: moderne technieken stellen de mensen in staat om gemakkelijker een publicatie uit te geven. Een uitgever is niet in alle gevallen nodig, want opmaak en distributie is voor bijna iedereen met een computer en toegang tot internet weggelegd. De toename behelst niet alleen digitale publicaties: met een dienst als LuLu, printing on demand, kan zelfs een traditioneel boek eenvoudig worden uitgegeven. Maar het is aan de andere kant wel een feit dat de grootste toename ‘m vooral zit in de omvang van het aantal digitale publicaties: e-journals, e-books, maar ook relatieve nieuwe publicatievormen als blogs, wiki’s en websites vormen de uitdaging voor catalogiseerdiensten om adequaat ontsloten te worden. Als we daar ook het groeiend aantal massadigitaliseringsprojecten bij optellen, dan is de slotsom duidelijk: er komt veel op ons af. Te veel.
Nieuwe items in KB Catalogus (gedrukt) 1992 - 2006
250.000
200.000
150.000
100.000
50.000
0 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
Van Catalogiseren naar Metadatabeheer
Dat kan ook goed geïllustreerd worden aan de hand van de groei van de catalogus van de Koninklijke Bibliotheek. In deze grafiek ziet u de jaarlijkse toename van het aantal records van gedrukte publicaties in de KB-catalogus: in 1992 nog meer dan 200.000 titels, en een gestage daling tot aan iets minder dan 150.000 in 2006. Nu denkt u wellicht dat deze voorstelling mijn eerdere stelling tegenspreekt. Uit dit beeld blijkt immers geen stijging van het aantal publicaties, maar een daling! Daarvoor is een goede verklaring. Sinds 2002 heeft de KB een elektronisch depot in gebruik genomen, waarin alle digitale afleveringen van meer 5.000 tijdschrifttitels worden geladen. Tegelijkertijd hebben we de papieren versies van deze tijdschriften opgezegd, en dat beeld is zichtbaar in deze grafiek. Zouden we dat beleid niet bewust hebben ingezet dan zou deze grafiek, waarin alleen de gedrukte publicaties zijn weergegeven, de stijgende tendens wel hebben laten zien. Dan zou de jaarlijkse aanwas van het aantal records in de catalogus in 2002-2006 beduidend meer dan 200.000 hebben bedragen. Maar goed, we hebben nu eenmaal een e-Depot. En de effecten daarvan zijn goed te zien in de volgende grafiek.
Nieuwe items in KB Catalogus (gedrukt én digitaal) 1992 - 2006
250.000
200.000
150.000
100.000
50.000
0 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
Van Catalogiseren naar Metadatabeheer
Nou ja, dat wil zeggen: niet helemaal. De tendens blijkt misschien wel uit dit plaatje, maar laten we de schaalverdeling maar eens aanpassen aan de corresponderende getallen.
Nieuwe items in KB Catalogus (gedrukt én digitaal) 1992 - 2006
3.000.000
2.000.000
1.000.000
0 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
Van Catalogiseren naar Metadatabeheer
Zo. Met het perspectief op “miljoenen”, blijkt de exponentiële groei van de KB-catalogus sinds 2002, het jaar waarin het e-Depot operationeel werd. Nu is het natuurlijk onjuist om te suggereren dat al deze publicaties door ons gecatalogiseerd zijn. Dat zijn ze niet: We hebben metadata van de uitgevers geconverteerd naar ons eigen formaat, en daarbij is geen menselijke interventie aan te pas gekomen, los van het ontwerp van de conversiescripts. Maar wat ik met dit plaatje vooral wil aantonen is de invloed van digitale publicaties op de catalogus in het algemeen, en op het beheer van die catalogus in het bijzonder. De invloed is onmiskenbaar, en die ontwikkeling is onomkeerbaar.
Van Catalogiseren naar Metadatabeheer
Wat betekent dit praktisch? • More wine, not enough bottlers • We hebben nieuwe methoden nodig om publicaties te ontsluiten • Niet ter vervanging van handmatige werk, maar om meer werk mogelijk te maken • Van regel-gebaseerd naar principe-gebaseerd • Meer individualiteit voor catalogiseerders • Gedifferentieerd metadatabeleid • Hergebruik van metadata Koninklijke Bibliotheek – National Library of the Netherlands
Maar goed, wat zijn nu precies de praktische implicaties van deze ontwikkelingen? Beacher Wiggins, mijn evenknie bij de Library of Congress, presenteerde het op de afgelopen IFLAconferentie als volgt: more wine, not enough bottlers. En niet alleen in de VS, maar ook uit discussies met collega’s uit Canada, Groot-Brittannië, en Duitsland blijkt telkens hetzelfde: we hebben nieuwe methoden nodig om de grote aantallen publicaties blijvend te kunnen ontsluiten. En die nieuwe methoden zullen de handmatige inspanningen niet overbodig maken, integendeel. Het is geen kwestie van het wegautomatiseren van traditioneel bibliotheekwerk. We hebben beiden nodig: én catalogiseerders, én nieuwe methoden. Daarbij zal een verschuiving plaatsvinden van een regel-gebaseerde benadering naar een meer principegebaseerde benadering. De adoptie van RDA als alternatief van AACR2 is daar een goed voorbeeld van. RDA vertelt de catalogiseerder niet hoeveel auteurs opgenomen dienen te worden, of hoeveel ingekort worden tot ‘et al.’. Als de informatie beschikbaar is, dan nemen we die gewoon over. En daarmee komen we tot een 2e belangrijke ontwikkeling: een grotere verantwoording voor de catalogiseerder. Met meer ruimte voor creativiteit en individualiteit. Binnen de principes is er dus meer ruimte voor eigen inzicht. Een beleidsmatig aspect is het opstellen voor verschillende criteria voor verschillende soorten publicaties. De KB is bezig met een traject “Gedifferentieerd metadatabeleid” dat richtlijnen opstelt voor het hanteren van verschillende principes. Halen we bijvoorbeeld metadata binnen via de DARErepositories, dan zouden we kunnen overwegen om het daarbij te laten. Maar andere publicaties zouden we juist willen verrijken. Een uitgekiend metadatabeleid moet ervoor zorgen dat we het op deze manier kunnen blijven behappen. Met het importeren van metadata is een zeer belangrijke ontwikkeling genoemd: ik ga hier op de volgende slide uitgebreid op in.
Van Catalogiseren naar Metadatabeheer
Hergebruik van metadata
• Gemeenschappelijk catalogiseren nieuwe stijl • Import metadata van Centraal Boekhuis, m.b.v. ONIX • Een nieuwe manier van werken: • Aanpassing aan workflow • •
Directe koppeling CB Onix à GGC Direct zichtbaar, daarna pas afcatalogiseren
• Implicaties voor de catalogiseerder: redactie in plaats van creatie • Creëren is wellicht gemakkelijker, maar door de grote hoeveelheden redden we dat niet meer.. • Nieuwe gereedschappen, uitdaging voor de catalogiseerder Koninklijke Bibliotheek – National Library of the Netherlands
Het hergebruiken van metadata is eigenlijk een nieuwe dimensie op het aloude vertrouwde principe van gemeenschappelijk catalogiseren. Dat principe kennen we al een aantal decennia, en is in feite gestoeld op de oude wijsheid: vele handen maken licht werk. Een mooi praktisch voorbeeld vormt de afspraken die de KB momenteel maakt met het Centraal Boekhuis. Het CB zal binnenkort in staat zijn om metadata van publicaties te ontvangen en te distribueren met behulp van het ONIX-formaat. Dit formaat kan vanaf 1 januari gebruikt worden om metadata uit te wisselen, en zo de beschrijving van nieuwe publicaties te vergemakkelijken. Het zou wel een nieuwe manier van werken vereisen. De bestaande workflow is hierop immers niet berekend. Wat we op dit moment nadrukkelijk overwegen, is een directe koppeling van ONIX-data met het GGC. Met PICA onderzoeken we momenteel deze mogelijkheid, en het is goed om te zien dat er meerdere partijen zijn die belang hebben bij een dergelijke ontwikkeling; dat verhoogt de kans op succes. De werkwijze zou kunnen betekenen dat titels voortaan al eerder zichtbaar zijn, zonder specifieke holding-informatie. Pas als de publicatie op het bureau van de catalogiseerder ligt, wordt de beschrijving voorzien van een exemplaarblok, en kunnen aanvullende gegevens -zoals trefwoordenextra worden toegevoegd. De implicaties voor de catalogiseerder zijn duidelijk: men begint niet langer met een leeg beeldscherm, maar de titelbeschrijving is al deels gevuld. Dit vergt een andere blik, een andere benadering. Het is een verschuiving van creatie naar redactie. Voor velen zal dit wennen zijn, en soms lijkt het wenselijker of eenvoudiger om te creëren in plaats van te beheren. Maar met de toenemende hoeveelheden is dit niet langer mogelijk. Nieuwe gereedschappen moeten we in dit kader breed zien: het betreft niet alleen tooling om redactionele werkzaamheden goed uit te voeren (zoals het maken van conversies, of het koppelen van informatie), maar de overweging om sommige taken uit te besteden bij andere partijen moet in dit kader eveneens als een ‘gereedschap’ worden beschouwd.
Van Catalogiseren naar Metadatabeheer
Process Redesign: Ontwikkeling van metadataketens
1. Ergens wordt een basis-record aangemaakt… • de bron is vrijwel altijd de uitgever • of soms de auteur (bijvoorbeeld via METIS)
2. dat wordt aan anderen ter beschikking gesteld… • via ONIX uit het Centraal Boekhuis • met beknopte titel, item direct op de plank/in de catalogus
3. die het weer verrijkt… • onder meer door koppeling met informatie elders • (semi-) automatische toekenning van trefwoorden
4. en het weer aan anderen ter beschikking stelt… • Nederlandse Bibliografie Online, Nationaal titelbestand
Koninklijke Bibliotheek – National Library of the Netherlands
Het beheren en redigeren van metadata vormt in deze optiek een onderdeel van een keten. Business Process Redesign gaat dan leiden tot een hele andere benadering, waarbij het werk van de catalogiseerder niet meer het begin van de keten vormt: het basis-record ontstaat al veel eerder, bij de uitgever, of in sommige gevallen zelfs al bij de auteur. Deze informatie kan vervolgens beschikbaar worden gesteld aan anderen, zoals het Centraal Boekhuis, of de Koninklijke Bibliotheek. Het ONIX-protocol is hierbij van groot belang. Een bibliotheek kan besluiten om de informatie al in beknopte vorm beschikbaar te stellen in de catalogus, natuurlijk met de bijzondere informatie dat de publicatie nog niet meteen kan worden uitgeleend, of dat nadere informatie nog volgt. De publicatie wordt in ieder geval wel zichtbaar, maar de titelbeschrijving hoeft dan nog niet per se af te zijn. Afcatalogisering kan nog volgen, en de titelbeschrijving kan daarbij nog verder verrijkt worden dan we thans gewend zijn, bijvoorbeeld door informatie elders te koppelen aan het record. De KB experimenteert op dit moment ook met de mogelijkheden om trefwoorden automatisch te laten voorstellen door de computer, als er extra elektronische informatie beschikbaar is. Maar ook dan is het proces nog niet af. Henk Ellerman zei het al: Catalogiseren is niet langer “a one shot deal”. De catalogus kan beschikbaar worden gesteld voor downloads door derden. Een uitstekend voorbeeld is de Nederlandse Bibliografie Online, die binnenkort in basale vorm beschikbaar komt. Het zou een prima ontleningssbron zijn voor een uiteindelijk nationaal titelbestand, met alle informatie, over alle publicaties op een rij. Welke gebruiker zou dat niet willen?
Van Catalogiseren naar Metadatabeheer
De nieuwe gebruiker
Koninklijke Bibliotheek – National Library of the Netherlands
Hiermee komen we tot het begrip “nieuwe gebruiker”. De next-generation, de Web 2.0 user, of hoe we hem of haar tegenwoordig ook noemen. Ik zal dit onderwerp wat beknopter bespreken dat het vorige aspect, omdat veel van deze ontwikkelingen al eerder en uitgebreider zijn besproken vandaag.
Van Catalogiseren naar Metadatabeheer
Er komen nieuwe technologieën op . . . • Opkomst van Google – het search-engine model • De mogelijkheid om door te linken naar veel meer digitale content • De mogelijkheid om full text automatisch te indexeren • Web 2.0 verandert de verwachtingen van eindgebruikers • Social tagging, community tagging • Communities werken samen om informatie te creëren en te delen, op nieuwe manieren, en vaak zonder intermediairs
Koninklijke Bibliotheek – National Library of the Netherlands
In het kort komt het neer op een serie ontwikkelingen die de mogelijkheden voor de moderne gebruiker bijna grenzeloos maken. Google heeft school gemaakt, en of we het nu leuk vinden of niet: het is een de facto standaard geworden die moderne gebruikers als vanzelfsprekend beschouwen. Als de presentatie en functionaliteit daar niet goed bij aansluiten, zal het gebruik op den duur tot een onaanvaardbaar niveau afnemen. Aspecten daarbij zijn de mogelijkheden om publicaties met elkaar in verband te brengen (denk aan FRBR) of direct aan elkaar te koppelen. Ook de mogelijkheden om elektronische bestanden automatisch te indexeren hebben grote invloed op de wijze waarop catalogi worden aangeboden. Denk daarbij aan Aquabrowsing. Maar het belangrijkste is dat eindgebruikers gewend zijn geraakt aan een zekere dynamiek, en aan interactie. Men wil meedoen. Dus moeten wij hen ook laten meedoen. Social tagging, of community tagging bieden de mogelijkheid om gebruikers te betrekken bij de informatie die wij over publicaties beschikbaar stellen. Recensies van boeken is daarbij het meest aansprekende voorbeeld. Opmerkelijk daarbij is dat de rol van intermediairs daarbij in veel gevallen niet meer noodzakelijk is.
Van Catalogiseren naar Metadatabeheer
De klant heeft andere verwachtingen . . . Klanten:
• willen integratie van meerdere informatiebronnen • willen grootschalige, geïntegreerde diensten gebruiken • willen verbeteringen in de kwaliteit en consistentie van informatie • willen verbeteringen in de “look and feel” • willen “zoiets als Google”
Karin Calhoun: • On behalf of research communities, libraries should be contributing to bigger scholarly environments through data exchange, collaboration and partnerships to aggregate more of the expanding universe of scholarly content.
Koninklijke Bibliotheek – National Library of the Netherlands
De klanten hebben dus andere verwachtingen, en willen meer functionaliteit. Maar geen ingewikkelde interfaces alsjeblieft. Geen lijst van 27 catalogi die elk een native interface hebben. Geïntegreerd doorzoekbaar, en bij voorkeur één zoekvenstertje: Google will do. Karen Calhoun, vorige week nog op bezoek in Nederland, gaf het al aan: het komt neer op schaalvergroting, integrale zoekmogelijkheden, en door samenwerking beter zichtbaar zijn in Google-rankings. Het commerciële orakel volgens Calhoun heet in die optiek dan “WorldCat”. Die mening kun je wel of niet delen, maar de aannames die zij maakt zijn onbetwistbaar.
Van Catalogiseren naar Metadatabeheer
De klant heeft andere verwachtingen . . . • “Met weglatingen en toevoegingen worden enerzijds een nuttige zuivering van overtollige titelbestanddelen beoogd” • “de titelbeschrijving is anderzijds een aanvulling daarop, met onontbeerlijke, maar door onvolledige titelredactie vaak ontbrekende gegevens” • “Zoo ontstaat een titelbeschrijving die den catalogusgebruiker alle onontbeerlijke gegevens en aangename gemakken biedt” • Praktijk en theorie der titelbeschrijving, Dr. H.E. Greve, 1930 • Het doel blijft hetzelfde maar nieuwe gereedschappen geven er een nieuwe invulling aan: uitbreiding van de titelbeschrijving (met plaatjes, flapteksten, recenties, samenvattingen, etc.). Koninklijke Bibliotheek – National Library of the Netherlands
Is dit nu een revolutie? Nou nee. Bekijk deze quotes eens, die de essentie van het catalogiseren zo prachtig weergeven. Het gaat om weglatingen en toevoegingen, zodat we een nuttige zuivering verkrijgen, maar evengoed een aanvulling met onontbeerlijke gegevens. En waarom? Omdat we zo een titelbeschrijving maken die de catalogusgebruiker alle gegevens en aangename gemakken biedt. Aan de spellingswijze is al te zien dat het hier niet om een Web 2.0 visionair gaat. Of misschien juist wel… In ieder geval zijn deze citaten al in 1930 opgeschreven door de Bibliothecaris van de Openbare Bibliotheek in Den Haag. Hieruit blijkt zonneklaar dat het doel van de catalogiseerder ten principale niet veranderd is. Het doel is hetzelfde gebleven: de gebruiker alle gegevens en aangename gemakken bieden. Maar de methoden veranderen mee met de tijd, en maken gebruik van de verworvenheden van het internettijdperk.
Van Catalogiseren naar Metadatabeheer
De rol van de catalogiseerder: • Metadata genereren, maar vooral manipuleren en beheren • data- en databasebeheer • metadatamanagement wordt ketenmanagement
• Dataverrijking • tagging services • thesaurusontwikkeling, thesaurusbeheer • verbinden van content, groeperen van content (FRBR)
• Ontwikkelen standaarden • Beheren relaties met auteurs, uitgevers, data aggregators • Het vak van catalogiseerder wordt meer, niet minder! Koninklijke Bibliotheek – National Library of the Netherlands
En daarmee verandert ook de rol van de catalogiseerder. Metadata zal altijd wel gegenereerd worden, maar de accenten komen te liggen op het manipuleren en beheren van die cruciale informatie. De focus ligt op databeheer, op databasebeheer, en die werkzaamheden zullen meer dan ooit onderdeel vormen van een grotere keten. Het verrijken van basisinformatie zal een cruciaal taakonderdeel worden van de catalogiseerder van de toekomst, waarbij tagging services, thesaurusbeheer en het verbinden en groeperen van content (bijvoorbeeld door middel van FRBR) standaard werkzaamheden zullen zijn. Het ontwikkelen (of doorontwikkelen) van standaarden wordt eveneens belangrijker voor catalogiseerafdelingen, evenals het beheren van relaties en afspraken met auteurs, uitgevers en intermediairs. Ik kan daarbij niet anders concluderen dat het werk van de catalogiseerder meer wordt, in plaats van minder. Ik denk persoonlijk ook dat het werk daarmee leuker wordt, want afwisselender en creatiever.
Van Catalogiseren naar Metadatabeheer
Key players in addressing challenges… Quote Indiana University: “The need for cataloging expertise … will not be diminished in the coming years. Rather, catalogers of the future will work in the evolving environment of publishing, scholarly communication, and information technology in new expanded roles. Catalogers will need to be key players in addressing the many challenges facing libraries and the overall management and organization of information.” http://www.iub.edu/~libtserv/pub/Future_of_Cataloging_White_Paper.doc
Koninklijke Bibliotheek – National Library of the Netherlands
Voordat ik afsluit wil ik mijn betoog graag onderstrepen met een prachtig citaat uit een paper van de Bibliotheek van Indiana University. Er verschijnen tegenwoordig met grote regelmaat dergelijke white papers over de toekomst van het catalogiseren, en dat is alleen maar een goed teken, nl. dat het vak in ontwikkeling is. Dit citaat stelt onder meer dat […] Catalogers will be key players in addressing the challenges facing the management of information. Ik vraag u opnieuw: wie wil dat nou niet?
Van Catalogiseren naar Metadatabeheer
Ten slotte…
Per 1 oktober 2007 is Johan Stapel hoofd van de afdeling Catalogisering & Metadatabeheer
Koninklijke Bibliotheek – National Library of the Netherlands
Tenslotte -en dit is écht de laatste dia- wil ik graag uw aandacht vestigen op een goede ontwikkeling bij de KB. Ik heb u vandaag de visie van de KB op de toekomst van het catalogiseren mogen presenteren, maar dat deed ik feitelijk ook in de rol van waarnemend hoofd van de afdeling Catalogisering & Metadatabeheer. U heeft het al lang door, ik heb natuurlijk geen klassieke bibliotheekopleiding. Ik gebruik immers veelvuldig het woord “catalogiseerder” in plaats van het juistere “catalograaf”. Maar ik weet er genoeg van om te stellen dat de afdeling C&M een belangrijke afdeling is, waarin veel gebeurt, en nog meer te gebeuren staat. Dat hebben we vandaag allemaal kunnen zien. Bovendien, volgens Indiana University bestaat de afdeling uit 33 fte aan key players. Dat is toch niet gek? Ik ben dan ook verheugd om u te vertellen dat het management van de ontwikkelingen bij C&M vanaf a.s. maandag belegd is in de capabele handen van Johan Stapel. Johan, laat je maar zien. Vanaf 1 oktober is dit het gezicht van de afdeling naar buiten toe, en ik wens Johan heel veel succes in zijn nieuwe functie.
Van Catalogiseren naar Metadatabeheer
Dank voor uw aandacht! en Inge Angevaare voor haar bijdragen Koninklijke Bibliotheek – National Library of the Netherlands
Dat brengt mij bij het einde van deze presentatie. Ik wil Inge Angevaare hartelijk danken voor haar wezenlijke bijdragen aan dit verhaal. En ik wil u danken voor uw aandacht.