BIBLIOTHEEKWEZEN
Uitdagingen voor het bibliotheekwezen in het Google-tijdperk Godwin GHEYSENS
Abstract The steep rise of the Google phenomenon poses a real challenge for libraries. In the present paper, various aspects of this phenomenon are introduced which academic libraries will have to address. Google presents itself as a new knowledge platform for access to and use of information resources. Ample attention is paid to the Google Books Digitization Project. Librarians do not all welcome Google Scholar wholeheartedly: will it chase even more visitors away from their libraries or is it rather an opportunity to emphasize the educational role of libraries? Google Scholar is also treated as a citation index and compared with the traditional library OPAC.
1 Digitale revolutie In de literatuur en op allerlei fora is al meermaals gewezen op het feit dat de digitale revolutie het informatielandschap ingrijpend gewijzigd heeft. Iets dat daarbij bijzonder in het oog springt is het fenomeen Google met zijn populaire zoekrobot. Steeds meer informatiezoekers zeggen de traditionele bibliotheken vaarwel ten voordele van het internet en het zo gemakkelijk hanteerbare Google. Het bedrijf werd pas opgericht in 1998 en is ondertussen een van de meest succesvolle beursgenoteerde internetbedrijven geworden. Hoe komt het dat Google op het vlak van informatievoorziening in zo korte tijd het roer van bibliotheken heeft overgenomen? Dat geldt ook en zelfs in belangrijke mate voor academische bibliotheken. Google blijkt in veel gevallen tegemoet te komen aan de informatiebehoeften van studenten. Het valt op dat daarnaast ook onderzoekers minder en minder via de traditionele kanalen publiceren en hun resultaten daarentegen in community fora en open access fora posten.
1636-08_LiberAmicJans_14_Gheysens.indd 267
22-12-2008 10:37:25
268
GODWIN GHEYSENS
2 Google: een nieuw kennisplatform Meer en meer studenten en wetenschappers laten de bibliotheken voor wat ze zijn als het op hun informatiebehoeften aankomt. Men hoeft maar te kijken naar een van de recente Google-verwezenlijkingen: Google Sites.1 Met dit product wil Google meer zijn dan een gewone zoekmachine en presenteert het zich meer en meer als een platform voor de creatie en consumptie van kennis. Via Google Sites reikt Google zelf de tools, de computerfaciliteiten en het platform aan voor de productie van die kennis (Guistini 2008). Dit soort veranderingen werkt enigszins ontwrichtend voor bibliotheken en voor wat zij tot nu toe altijd betekend hebben. Vanzelfsprekend is dit een grote uitdaging voor de traditionele rol, het doel en de activiteiten van die bibliotheken. Welke strategie moeten zij hanteren om marktaandeel terug te winnen van de zoekgigant? Bij de opkomst van het internet begin jaren ’90 heeft het bibliotheekwezen dit internet wellicht iets te vlug geoutsourcet en teveel de nadruk gelegd op het gebruik van online bibliografische databases, zijn eigen catalogi en tijdschriften. Ross & Sennyey (2008: 146) gaan zelfs zover te beweren dat het blijven negeren van het web als een research tool hypocriet is en bovendien een strategie die het bibliotheekwezen op termijn toch zal verliezen. Ondertussen werken die bibliotheken hoogdravende opdrachtverklaringen en strategische plannen uit, voeren zij gebruikersonderzoeken uit gewoon omdat hun dit gevraagd wordt en verspillen zo kostbare tijd en nodeloze energie. Google gaat intussen gezwind verder met onder meer Google Books, Google Scholar en Google Docs. Zal de bibliotheek in de nabije toekomst nog kunnen concurreren met Google als het over toegang tot en gebruik van informatiebronnen gaat? Misschien wordt Google wel de grootst denkbare virtuele bibliotheek en worden onze bibliotheken gereduceerd tot specialisatie-enclaves waar men nog terecht kan voor arbeidsintensief in-depth onderzoek; en dat bovendien voor een veel kleiner aantal gebruikers die een dergelijke dienstverlening nog op prijs stellen.
3 Google-generatie De sector kan hier mogelijk ook lessen uit trekken en in de tegenaanval gaan. Gorman (2006: 99) van de School of Information Management (Wellington, 1
http://sites.google.com/
1636-08_LiberAmicJans_14_Gheysens.indd 268
22-12-2008 10:37:25
UITDAGINGEN VOOR HET BIBLIOTHEEKWEZEN IN HET GOOGLE-TIJDPERK
269
Nieuw-Zeeland) vindt dat het tijd wordt dat de traditionele informatieprofessionals ophouden met kletsen en de opportuniteiten benutten die Google de sector aanbiedt. Wij moeten de gebruikers terugbrengen naar onze bibliotheken speciaal voor die (informatie)vaardigheden die alleen creatieve informatieprofessionals beheersen. Een troef die bibliotheken inderdaad zeker moeten blijven uitspelen is de expertise die zij hebben op het vlak van informatievaardigheden. Bij academisch onderzoek kunnen bibliothecarissen bijvoorbeeld een belangrijke rol spelen bij het assisteren van studenten in het gebruik van Google. Bij het uitvoeren van goed onderbouwde onderwerpsgerichte zoekopdrachten met Google, is in veel gevallen een doorgedreven kennis van het vocabularium een conditio sine qua non. Dat betekent dat studenten zich eerst moeten bekwamen in het gebruik van gespecialiseerde woordenlijsten en thesauri in bepaalde disciplines. Bibliothecarissen kunnen hen de vereiste kennis van deze basisterminologie bijbrengen om dergelijk onderzoek in een nieuw vakgebied tot een goed einde te brengen (Thelwall 2005). De zogenaamde Google-generatie die is opgegroeid in het internettijdperk, baseert zich enerzijds bijna uitsluitend op digitale bronnen, maar vertoont anderzijds een ontstellend gebrek aan analytische capaciteiten om die bronnen op een degelijke en verantwoorde manier te beoordelen. Uit een onderzoek van het JISC (Joint Information Systems Committee) en de British Library (Google Generation 2008) blijkt dat bij het zoeken naar informatie niet alleen jongeren, maar wel degelijk alle leeftijdsgroepen het gedrag vertonen dat vooral met die jongeren wordt geassocieerd: bij het zoeken is men ongeduldig en vertraging wordt nauwelijks getolereerd; aan de informatiebehoefte moet onmiddellijk voldaan worden. Er wordt geen tijd meer geïnvesteerd in het zich eigen maken van allerlei zoek- en navigatietechnieken en dit geldt zowel voor jeugd, studenten als docenten en hoogleraren. Studenten hebben er blijkbaar een blindelings vertrouwen in dat Google na een zoekopdracht de resultaten wel degelijk volgens hun relevantie rangschikt. Dat is wat een ander onderzoek (Pan et al. 2007) bij bachelorstudenten uitwees: studenten gaan er meestal van uit dat referenties die bovenaan of op de eerste pagina met resultaten gerangschikt staan, ook de meest relevante zijn. Wat uiteraard niet altijd het geval is. Voor de studenten komt de relevantie van de abstract zelf veel minder in aanmerking, althans volgens dit onderzoek. Men kan zich afvragen of zij er zich van bewust zijn waarom Google bepaalde resultaten in de ranking bovenaan plaatst ten nadele van andere. Hier spelen natuurlijk allerlei motieven mee en niet het minst commerciële. Het bewijst in elk geval de enorme invloed die een zoekmachine
1636-08_LiberAmicJans_14_Gheysens.indd 269
22-12-2008 10:37:25
270
GODWIN GHEYSENS
als Google kan hebben op het zoekgedrag en ruimer op onze cultuur en samenleving in het algemeen.2 De Google-generatie, en inmiddels iedereen die geregeld zoekt via internet, is immers gewend aan één zoekveld. Hoe dikwijls zou de geavanceerde zoekfunctie bij Google worden gebruikt? Waarschijnlijk bedroevend weinig. Tijdens de lessen Academische Vaardigheden (2de Bachelor Toegepaste Taalkunde op campus VLEKHO, februari 2008) stelden wij de vraag aan de studenten: niet meer dan 5 % bleek die zoekfunctie inderdaad en dan nog maar af en toe te gebruiken. Websites van bibliotheken en catalogussystemen bieden wellicht te veel mogelijkheden waardoor gebruikers snel afhaken. Bovenvermelde studie van het JISC en de British Library (Google Generation 2008) waarschuwt voor een ontstellend gebrek aan informatievaardigheden bij jongeren, en besluit dat daar dringend iets aan moet worden gedaan. Als ze niet snel outdated willen worden, zouden bibliotheken in dit opzicht een afdoend antwoord moeten bieden op de gewijzigde noden van onderzoekers en andere gebruikers.
4 Digitaliseringsproject Google Books Om bibliothecarissen het leven nog zuurder te maken of integendeel hun een enorme dienst te bewijzen lanceerde Google een aantal jaren geleden zijn Google Books project: de opzet is het volledig digitaal beschikbaar stellen van zoveel mogelijk boeken in full text en dit wereldwijd. In het verleden zijn er al pogingen geweest om de in de wereld voorhanden zijnde kennis op een gelijkaardige wijze te repertoriëren en universeel ter beschikking te stellen, hetzij voor vorsers hetzij voor een breed publiek. Denk maar aan de Bibliotheca Alexandrina in de oudheid of aan de poging van Conrad Gesner om in de 16de eeuw een Bibliotheca Universalis uit te geven. Ook het project van Paul Otlet en Henri La Fontaine was een poging om alle menselijke kennis in een bibliografisch systeem onder te brengen. Lang voor er sprake was van hypertekst ontwierp Otlet in 1934 een zoeksysteem dat op mechanische wijze de lezer wegwijs zou moeten maken in een database van miljoenen fiches. Het project mislukte jammerlijk en jarenlang stond het zogenaamde Mundaneum3 te verkommeren aan het Brusselse Jubelpark. 2
De studie werd uitgevoerd bij undergraduate college students. De onderzoekers wijzen erop dat de toepasbaarheid van het onderzoek naar bredere gebruikersgroepen waarschijnlijk beperkt is. 3 http://www.mundaneum.be/
1636-08_LiberAmicJans_14_Gheysens.indd 270
22-12-2008 10:37:25
UITDAGINGEN VOOR HET BIBLIOTHEEKWEZEN IN HET GOOGLE-TIJDPERK
271
Waar Google met zijn digitaliseringsproject nu mee uitpakt is echter totaal nieuw: hier gaat het om het universeel digitaal beschikbaar stellen van volledige werken in full text. In 2004 kondigde Google aan te willen starten met een gigantisch digitaliseringsproject van boeken uit een aantal wetenschappelijke bibliotheken. Aanvankelijk ging het om vijf top research bibliotheken die onmiddellijk meestapten in het project: Harvard en Stanford University, University of Michigan (Ann Arbor), Oxford University met de Bodleian Library (Milne 2006) en de New York Public Library. Naast enkele grote Amerikaanse bibliotheken werkt Google intussen samen met 27 bibliotheken, collecties uit Duitsland, Spanje, Zwitserland (Baksik 2006: 399-400) en ook België. De bibliotheek van de Gentse universiteit maakte in mei 2007 bekend ook toe te treden tot het Google-consortium om zo’n 300 000 boeken te laten scannen en opnemen in het Googledigitaliseringsproject. UGent wordt daarmee de zesde bibliotheek in Europa en voorlopig de enige in België die een deel van haar collectie via Google Books online zet. Bij het schrijven van dit artikel vernamen we dat K.U.Leuven eveneens aan het onderhandelen is om ook haar collectie te laten opnemen. Met 10 000 uitgevers werden akkoorden gesloten om de elektronische versies van hun recente uitgaven toe te voegen aan het project, al blijven die grotendeels onbereikbaar via het internet wegens de nog geldende auteursrechten. De teksten van de boeken waarop geen auteursrecht meer rust kan men in zijn geheel inzien of downloaden in pdf-formaat. In het andere geval zijn er alleen een of meerdere fragmenten uit het boek zichtbaar. Het revolutionaire zit hem in de mogelijkheid om al die boeken te doorzoeken op elk woord, elke naam; zelfs in de huidige bibliografische en full text databanken is dat nog niet het geval: hier kunnen alleen de abstracts doorzocht worden, de html- of pdf-versie van de full text records nog helemaal niet! Met links naar Google Maps en Google Earth kunnen plaatsnamen gevisualiseerd worden via een klein venster. En Google is er vooral op uit het boekenbestand te integreren in zijn zoekrobot: websites, blogs en Wikis volstaan niet meer. De oude utopie van Conrad Gesner komt heel snel naderbij. Het doel is de creatie van een digital repositery om onderzoekers toe te laten verbanden te leggen tussen de verschillende werken of gewoon boeken te ontdekken die ze via de traditionele methoden nooit zouden hebben gevonden. Ook het onvermijdelijke bezoek aan een bibliotheek kan op die manier worden ontweken: de bibliotheek komt gewoon bij de gebruiker langs (Carlson & Young 2005: A37).
1636-08_LiberAmicJans_14_Gheysens.indd 271
22-12-2008 10:37:25
272
GODWIN GHEYSENS
5 Concurrentie Sommigen bekijken digitaliseringsprojecten zoals dat van Google eerder argwanend, anderen zijn er ronduit tegen (Balas 2007). De Association of American Publishers en de Authors Guild hebben zelfs een proces aangespannen tegen Google. Men verwijt het bedrijf te los om te springen met het auteursrecht: niet alles wat Google wil digitaliseren is vrij van copyright (Prasad, Agarwala & Saxby 2008). De Open Content Alliance (OCA)4 heeft er zich zelfs ronduit tegen verzet en heeft zelf een alternatief project opgezet. Brewster Kahle, de stichter van het Internet Archive, lid van OCA, stelt het als volgt: “They don’t want the books to appear in anyone else’s search engine but their own” (Liedtke 2006). OCA neemt alleen boeken op waarvan de auteursrechten verlopen zijn (“works in the public domain”) en stelt zich duidelijk op in de open access beweging; dit betekent dat het zijn technologie ook aan anderen beschikbaar stelt, iets wat Google niet doet. OCA is ook meer bibliotheekgericht, alhoewel het ook samenwerkt met Adobe en Microsoft (Coyle 2006: 641-642). Een ander project is dat van Microsoft dat collecties uit de British Library digitaliseert. Hier gaat het om 100 000 titels uit hun collectie rond literatuur uit de 19de eeuw waarvan het copyright eveneens verlopen is (Ashling 2007). Gallica5 is een project van de Bibliothèque Nationale de France en daarmee de Franse tegenpool van het Google-project. Het richt zich meer exclusief op de Franse cultuur waarbij het gaat om documenten waarvan het copyright reeds verlopen is. Het zoeksysteem is minder performant dan Google Books. Het Gutenberg-project bestaat natuurlijk al langer en biedt ongeveer 20 000 boeken aan behorende tot het publiek domein, bij uitbreiding via linking 100 000. Gutenberg6 is de eigenlijke pionier van e-books. Het project gaat terug tot 1971. Men gaat er eerder ambachtelijk te werk en het zijn hoofdzakelijk vrijwilligers die eraan meewerken. Hier maakt men onderscheid tussen light literature zoals Alice in Wonderland, heavy literature zoals de werken van Shakespeare, referentiewerken zoals Roget’s Thesaurus, encyclopedieën en woordenboeken.
4 5 6
http://www.opencontentalliance.org/ http://gallica.bnf.fr http://www.gutenberg.org
1636-08_LiberAmicJans_14_Gheysens.indd 272
22-12-2008 10:37:25
UITDAGINGEN VOOR HET BIBLIOTHEEKWEZEN IN HET GOOGLE-TIJDPERK
273
De toegang tot het publieke gedeelte van de World Public Library7 verloopt ook via Gutenberg: men kan hier om en bij de 75 000 e-books vrij doorbladeren. Het grootste deel is afgeschermd en alleen toegankelijk via betalend lidmaatschap; maar dan zijn er wel meer dan 500 000 e-books beschikbaar.
6 Digitale duurzaamheid? Bij al dat gedigitaliseer kan men zich uiteraard vragen stellen. Wat met de duurzaamheid van die digitale dragers? Niet iedereen is ervan overtuigd dat digitale scanning een definitieve oplossing biedt voor de conservatie van digitaal beeldmateriaal. Zal alles in de toekomst nog perfect gelezen kunnen worden zoals thans het geval is? Sommige auteurs zijn daar zeer sceptisch over. In dit verband spreekt men zelfs van een digital dark age: ook al wordt dat materiaal beschikbaar in digitale vorm, in de toekomst kan het ontoegankelijk worden wegens incompatibiliteit van de vereiste hardware en software. De ontwikkeling van een strategie om tegelijk het bewaren en de toegankelijkheid van digitaal materiaal in de toekomst te garanderen zou wel eens de grootste uitdaging kunnen zijn (Connell 2005). Ook Janet Balas is die mening toegedaan. Zij roept bibliothecarissen en archivarissen op om toch maar een argwanend oogje in het zeil te houden en nauwlettend toe te zien hoe de problemen van permanente toegankelijkheid gewaarborgd zullen blijven, zowel vandaag als in de toekomst (Balas 2007). Herring vergelijkt het overdreven enthousiasme voor digitalisering met het binnenloodsen van de verleidelijke Babylonische hoer zoals beschreven in de Apocalyps van Johannes, wat onvermijdelijk tot destructie leidt (Herring 2008: 86).
7 Tekortkomingen Het scannen van de boeken verloopt blijkbaar ook niet altijd vlekkeloos. Google vergeet nogal eens de metadata op te nemen: elementaire gegevens zoals volumeaanduidingen worden soms over het hoofd gezien. De manier van werken van Google suggereert dat veel conventionele methoden – zoals metadata – die in het verleden hun degelijkheid ten overvloede hebben 7
http://worldlibrary.net/
1636-08_LiberAmicJans_14_Gheysens.indd 273
22-12-2008 10:37:25
274
GODWIN GHEYSENS
bewezen, zeer innovatief vervangen kunnen worden door allerlei zoekmethoden en zoekalgoritmen. Het project is uiteraard ook zeer omvangrijk. Des te verwonderlijker is het dat er zelfs geen catalogus voorhanden is. Google zelf omschrijft het project als “een geoptimaliseerde kaartenbak met alle boeken van over heel de wereld” (Google Books 2008). Ook wordt op geen enkele manier meegedeeld hoeveel boeken de database bevat. Daarnaast is de kwaliteit van het scannen zelf ook niet altijd even onberispelijk: soms zijn er aan de linker- of rechterkant van de pagina’s woorden niet meegescand; dit impliceert dat op die woorden dan ook niet gezocht kan worden. Duguid geeft als bewijsmateriaal een aantal voorbeelden uit het gescande exemplaar van de 18de-eeuwse auteur Laurence Sterne, The Life and Opinions of Tristram Shandy (Duguid 2007). Om auteurs toch nog over de streep te trekken, laat Google Books op zijn site er geregeld enkele aan het woord die het project dan de hemel in prijzen. Zo jubelt Cory Doctorow, auteur van Down and Out in the Magic Kingdom: “Thank you, thank you, thank you Google, for providing a way to put books back into the daily round of average people ... If we have hope as authors in the digital age, it’s in projects like Google Book Search” (Google Books Library Project 2008).
8 Europese kritiek Vanuit Europese hoek kwam er vrijwel onmiddellijk reactie en kritiek op de aankondiging van het Google Books project op 14 december 2004. Jeanneney was van 2002 tot 2007 voorzitter van de Bibliothèque Nationale de France. Als gangmaker van het Gallica-project had hij het niet begrepen op het Anglo-Saksische overwicht van Google. In een artikel in Le Monde van 23 januari 2005 waarschuwde hij in bijna apocalyptische termen voor de “domination écrasante de l’Amérique”. Hetzelfde herhaalde hij nog eens in zijn boek dat in april van hetzelfde jaar verscheen (Jeanneney 2005). President Chirac had zich ondertussen achter zijn standpunten geschaard en Frankrijk opgeroepen het voortouw te nemen in een eigen Europees digitaliseringsproject. De kritiek van Jeanneney gaat voornamelijk over de volgende punten. Ten eerste zou Google niet in staat zijn al het gedrukte materiaal te digitaliseren. Ook het Angelsaksische taaloverwicht zou te groot zijn. De Google zoekmachine zou resultaten genereren die inconsistent zijn met de rankings die gelden in de culturele omgeving waaruit wetenschappers komen, en die ze er zelf zouden aan geven. Het stoot Jeanneney ook
1636-08_LiberAmicJans_14_Gheysens.indd 274
22-12-2008 10:37:26
UITDAGINGEN VOOR HET BIBLIOTHEEKWEZEN IN HET GOOGLE-TIJDPERK
275
tegen de borst dat een privéfirma eigenaar zou worden van het digitale werelderfgoed van beelden en gescande teksten (Bearman 2006). Frankrijk is daarnaast een van de voortrekkers van het Europees digitaliseringsproject: de Europese Digitale Bibliotheek. In maart 2006 werd dit project aangekondigd. De infrastructuur hiervoor zou geleverd worden door de European Library,8 zelf de centrale gateway tot de elektronische collecties van de 47 Europese nationale bibliotheken. Het project zit nu nog altijd in zijn uitvoeringsfase. Begin 2008 werd er een demoversie9 van de site op het web gezet. De Europese Digitale Bibliotheek geeft toegang tot digitale informatie uit Europese archieven, musea, audiovisuele collecties en bibliotheken. Op de site wordt in beeld gebracht hoe bezoekers van het nog uit te voeren project in de toekomst op geavanceerde wijze kunnen zoeken naar schilderijen, foto’s, objecten, boeken, kranten, archieven, films en geluidsfragmenten uit deze collecties (IP Flash 2008).
9 Beyond books: Google Maps, Earth, Docs Bibliotheken kunnen bogen op een zeer lange traditie, die teruggaat tot ver in de oudheid. Google is als zoekmachine op het internet pas aanwezig sinds 1998. Maar het is nu al duidelijk dat de technologie nog maar in haar kinderschoenen staat en we kunnen er inderdaad nog veel meer van verwachten. De bibliotheekwereld wordt geconfronteerd met Google Books,10 Google Docs,11 Google Maps12 en Google Scholar,13 om alleen nog maar die te vermelden, en het zal nog veel verder gaan dan dit. Met Google Maps – vroeger Google Local – kan men zoeken naar een geografische locatie. Meestal wordt dit gebruikt om dichtbij een bepaalde locatie te vinden, bijvoorbeeld een bedrijf of zaak in de buurt. Google geeft daarbij dan wat aanvullende informatie zoals website, telefoonnummers en dergelijke. Google Maps kan ook gecombineerd worden met de satellietfoto’s van Google Earth. Het is zelfs mogelijk om via dit systeem gepersonaliseerde kaarten aan te maken.
8
http://www.theeuropeanlibrary.org/portal/index.html http://www.europeana.eu/ 10 http://books.google.com 11 http://docs.google.com 12 http://maps.google.com/ 13 http://scholar.google.com 9
1636-08_LiberAmicJans_14_Gheysens.indd 275
22-12-2008 10:37:26
276
GODWIN GHEYSENS
Met Google Docs kan men documenten (word-, spreadsheet-, powerpointdocumenten) online opslaan en ze vervolgens ook bewerken. Om de dienst te kunnen gebruiken is wel een Google-account vereist. Het voordeel is dat men wereldwijd toegang heeft tot de documenten, ze kan bewerken en dat back-ups niet nodig zijn. Nadelen zijn dat er een internetverbinding vereist is om de documenten te kunnen bewerken en dat ze na het verwijderen toch nog bewaard worden op de server van Google. Hier kunnen veiligheidsproblemen opduiken met name voor het bedrijfsleven. Maar naast dit alles is sedert kort de belangrijkste uitdaging voor bibliotheken en ook voor gereputeerde bibliografische databases zoals de citatieindexen van Web of Knowledge, Google Scholar.
10 Google Scholar Google Scholar laat toe te zoeken naar wetenschappelijke informatie, zowel in boeken, artikels, rapporten en zelfs hoofdstukken uit boeken. Binnen de bibliotheekwereld lopen de meningen over deze zoektool nogal uiteen: sommigen zijn van mening dat het de gebruikers nog verder de bibliotheken zal uitjagen, anderen beschouwen het veeleer als een opportuniteit omdat het terug de rol van bibliotheken in het educatieve proces in de verf zet. In november 2004 lanceerde Google de betaversie van Google Scholar waarvan inmiddels ook een Nederlandstalige versie bestaat, Google Wetenschap. Google concipieerde dit product als een federated search system voor het opsporen van academische literatuur, inclusief peer reviewed papers, thesissen, boeken, preprints, abstracts, technische rapporten en wetenschappelijke webartikels uit alle onderzoeksdomeinen. Dit betekent dat Google Scholar verschillende databanken tegelijkertijd doorzoekt. In een dergelijk systeem wordt een overvloed aan informatie geïncorporeerd in een afzonderlijke repository die aldus kan worden doorzocht. Vanuit het standpunt van de eindgebruiker wordt de informatie in dit systeem reeds gepreprogrammeerd vóór hij zijn zoekopdracht lanceert, het zogenaamde just in case processing. Een dergelijke procedure biedt nieuwe opportuniteiten qua zoekmogelijkheden en de presentatie van de zoekresultaten. Tegenover federated search systems staan de zogenaamde metasearch systems, die werken volgens het principe van just in time processing. In plaats van de data te preprocessen, doet een metasearch zoeksysteem dit alleen wannneer de gebruiker een zoekopdracht lanceert (Sadeh 2006 en Kesselman 2005). Een voorbeeld van een metasearch system is MetaLib van Ex Libris, dat vanaf het
1636-08_LiberAmicJans_14_Gheysens.indd 276
22-12-2008 10:37:26
UITDAGINGEN VOOR HET BIBLIOTHEEKWEZEN IN HET GOOGLE-TIJDPERK
277
academiejaar 2006-2007 werd ingevoerd aan K.U.Leuven. MetaLib is gelinkt aan Libisng en de OPAC (infra) voor het doorzoeken van alle e-bronnen. Het is de bedoeling dat MetaLib binnen afzienbare tijd ook aan de Hogeschool voor Wetenschap & Kunst en de Hogeschool-Universiteit Brussel wordt geïmplementeerd. Voor een diepgaander discussie rond metasearching, zie het artikel van Sadeh (2004). Het doorzoeken van die verschillende databanken gebeurt bij Google Scholar via sfx-linking; men spreekt ook wel van context-sensitive linking of open-url linking (Grogg & Ferguson 2005). Dat betekent dat we vanuit de bibliotheek alle databanken waarover we momenteel beschikken binnen Hogeschool voor Wetenschap & Kunst, hebben gelinkt aan Google Scholar: Academic Search Elite, Business Source Premier, Communication & Mass Media Complete en ERIC van EBSCO, Elsevier ScienceDirect, Emerald Management Xtra, IngentaConnect, SpringerLink, SwetsWise, Wiley InterScience, Erudit, enzovoort. Als een gebruiker nu een zoekopdracht naar bijvoorbeeld “Translation” en “Meaning” loslaat in Google Scholar, zal hij bij de zoekresultaten een sfx-link zien die hem toelaat de full text versie van de artikels op te roepen. Indien die link wordt gepresenteerd als SFX@ WENK: Full Text, dan laat het systeem toe om de full text van het artikel op te roepen. Wordt de link daarentegen voorgesteld als SFX@WENK en dit onderaan de referentie, dan betekent dit dat er geen full text beschikbaar is. Ondanks dit alles werd Google Scholar eerder met gemengde gevoelens onthaald, vooral vanuit de bibliotheken; gewone gebruikers zijn er blijkbaar enthousiaster over. We hebben er bij het implementeren van het product in onze hogeschool bewust voor geopteerd om bij de link niet VLEKHO maar wel WENK op te nemen, omdat we deze service ook ter beschikking stellen van de overige departementsbibliotheken binnen onze hogeschool. Via de vpn-faciliteiten14 werkt dit uiteraard ook off-campus. 11 Google Scholar als citatie-index Een andere mogelijkheid die Google Scholar aanbiedt, bestaat in het zoeken naar documenten die een specifiek artikel citeren. Onderaan de referentie wordt vermeld: “Geciteerd door …” In dit opzicht kan het, net als Scopus15 14 Via het installeren van de vpn-client op een pc buiten de campussen is het mogelijk om de databanken ook thuis te raadplegen (off-campus). Vpn staat voor Virtual Private Network. 15 http://www.scopus.com/scopus/home.url
1636-08_LiberAmicJans_14_Gheysens.indd 277
22-12-2008 10:37:26
278
GODWIN GHEYSENS
van Elsevier, misschien een concurrent worden voor de befaamde citatieindexen van het Institute of Scientific Information: Web of Science16 (met de Arts & Humanites Citation Index, Social Science Citation Index en Science Citation Index) (Jacso 2005 en Roth 2005). Google Scholar is inderdaad vergelijkbaar met Web of Science en Scopus. Tot voor enkele jaren bestond alleen Web of Science als instrument voor het opzoeken van citatiegegevens. In 2004 kwamen daar zowel Scopus als Google Scholar bij, waarbij alleen deze laatste vrij toegankelijk is. Web of Science en Scopus verschaffen duidelijke gegevens over de inhoud en omvang van hun databank en over tot wanneer hun gegevens in de tijd teruggaan. Bij Google Scholar is dat veel minder het geval wat het aantal records en de tijdsspanne betreft. Zij indexeren alleen gegevens als de uitgever bereid is om gratis een abstract van de paper te leveren. De full text kan dan eventueel bekeken worden tegen betaling of via een databank, als de instelling er een abonnement op heeft. De referenties komen niet alleen uit databanken, maar kunnen ook fragmenten uit boeken zijn of komen van persoonlijke websites (Bar-Ilan 2008: 258). Ook de tijdschriften van DOAJ (Directory of Open Access Journals) zijn opgenomen via sfx-linking. Open access betekent dat deze wetenschappelijke tijdschriften gratis worden aangeboden en dit eveneens in full text. Binnen de informatiewereld vindt het fenomeen van open access trouwens meer en meer ingang (Fisher 2006). Kousha en Thelwall (2008) vergeleken de bronnen van Google Scholar citaties buiten Science Citation Index voor vier disciplines: biologie, fysica, scheikunde en informatica. Zij komen daarbij tot het besluit dat Google Scholar veel meer open access aanbiedt dan de ISI citation databases en op die manier een ware impuls kan betekenen voor de open access research en dito beweging. De meerderheid van de unieke Google Scholar citaties kwamen van full text bronnen; dit impliceert dat een breed gamma van non-ISI citing sources, vooral afkomstig van niet-seriële documenten zoals hier hoger vermeld, toegankelijk zijn via Google Scholar. Dat pleit zeker in het voordeel van Google Scholar aangezien hierdoor citation tracking in een ruimere context wordt geplaatst van wetenschappelijke documenten toegankelijk via open access. Anderzijds zijn er ook tekortkomingen. Google Scholar heeft een eenvoudige en een meer geavanceerde zoekinterface. Die geavanceerde module is gebaseerd op de gewone Google-interface en biedt veel minder mogelijkheden dan wat de traditionale databases zoals EBSCO, Elsevier en CSA 16
http://newisiknowledge.com/
1636-08_LiberAmicJans_14_Gheysens.indd 278
22-12-2008 10:37:26
UITDAGINGEN VOOR HET BIBLIOTHEEKWEZEN IN HET GOOGLE-TIJDPERK
279
bieden. Jacso heeft in verschillende artikels een aantal gebreken beschreven. Soms worden er teveel citaties weergegeven, wat onder andere te wijten zou zijn aan de opname van niet-wetenschappelijke bronnen. Bij bepaalde bronnen worden ook nog al eens de verkeerde auteurs weergegeven. Het valt ook voor dat Google Scholar zowel de preprint- en nadien de gewone printversie van een artikel weergeeft. Het feit dat noch de booleaanse operatoren noch de tijdslimietoperatoren foutloos werken, schrijft Bar-Ilan toe aan de “erfenis” van Google. De discussie of Google Scholar een alternatief zou kunnen zijn voor WoS is duidelijk nog niet ten einde. Anderzijds zit het product nog altijd in betatestfase en kan het nog altijd gevoelig verbeteren (Bar-Ilan 2008: 258-261).
12 Google Scholar en de OPAC Als we Google Scholar vergelijken met de traditionele bibliotheekcatalogus, biedt het eerste veel meer mogelijkheden. Vooral wegens de uitgebreide linkingmogelijkheden heeft Google Scholar tegenover de OPAC (Online Public Access Catalogue) heel wat voordelen. Omwille van verschillende redenen, is de OPAC niet mee geëvolueerd en vanuit het standpunt van de hedendaagse gebruiker die verwend is door Yahoo! en Google, maakt hij een eerder oubollige indruk. In veel OPAC’s is het nog moeilijk zoeken, men moet zich aanpassen aan mysterieuze conventies en de technologie is veelal gedateerd. Ondanks de evoluties die de OPAC de laatste decennia heeft doorgemaakt, gaat de technologie die erachter schuilgaat in essentie nog altijd terug op de onderliggende structuren die dateren uit 1970. Spellingcontrole, een contextgevoelige helpfunctie en zoeksuggesties blijven hier meestal achterwege (Ross & Sennyey 2008: 148). Pogingen om de catalogus te verrijken bleven tot nu toe meestal beperkt tot weergave van een boekomslag, inhoudsopgaven en hier en daar een link naar digitale versies. Het basisconcept achter Google en de ISI citatie-indexen dat gebruik maakt van relaties tussen informatieobjecten – via citaties – om de zoekresultaten te verhogen, komt helemaal niet voor in OPAC’s. Als we dit model volgen zou een “verrijkte” OPAC bibliografieën moeten aanbieden die een link leggen naar additionele bronnen, zoals wetenschappelijke reviews, maar daarnaast ook effectieve rankings presenteren. (Ross & Sennyey 2008: 148). Er zijn natuurlijk al OPAC’s die pogingen doen om in die richting te evolueren. In Libis worden al links gelegd naar digitale versies van documenten via LibriLinks, er is een deelcatalogus van e-bronnen met verbinding
1636-08_LiberAmicJans_14_Gheysens.indd 279
22-12-2008 10:37:26
280
GODWIN GHEYSENS
naar de betreffende databanken. Bij Anet17 is dat ook het geval. Maar van ranking is hier uiteraard nog geen sprake. En in de wereld van open access, open source en web 2.0 is dat uiteraard ruim onvoldoende. Het zwaartepunt van de OPAC zal zich verleggen van de bibliotheek naar de gebruikers zelf: zij zelf zullen de OPAC stofferen met externe gegevens à la web 2.0 en het sociale web. De catalogus zal geen geïsoleerd platform meer zijn en zal integendeel tweerichtingsverkeer aanbieden. Enerzijds zal hij zich richten op het internet om gebruik te maken van allerlei externe webdiensten, die altijd maar belangrijker zullen worden; anderzijds zal hij zelf het internet voeden met inhoud via gestructureerde en gevalideerde informatie. XML, allerlei webdiensten en Open Access zullen hier een zeer belangrijke rol spelen. Het gaat daarbij om het openstellen van de catalogus voor hypertekst onder de vorm van bijvoorbeeld blogs en wikis en het opnemen van RSS feeds bij de tijdschrifttitels in de OPAC met bijvoorbeeld een inhoudsopgave van het laatste nummer. RSS biedt daarnaast nog ruimere mogelijkheden: alle artikels uit het tijdschriftenbezit van de bibliotheek kunnen zo automatisch en volgens verschijningsdatum aan de verschillende titels gelinkt worden. Uiteraard zal ook de volledige tekst van boeken gelinkt worden aan de catalogus, net zoals bij Google Books. Net als de tools van het sociale web zoals Wikio, Del.icio.us, Flickr en Connotea zal de gebruiker in de OPAC zelf annotaties, tags en commentaar op boeken kunnen plaatsen. In OPAC’s zoals WorldCat18 is dat trouwens reeds het geval (De Kaenel & Iriarte 2007: 12-13). Ross & Sennyey (2008: 149) stellen dat de OPAC in zijn huidige hoedanigheid zal blijven bestaan zolang de wetenschappelijke monografie in haar analoge vorm blijft bestaan. Maar van zodra zij volledig het digitale tijdperk binnentreedt, is er een groot risico dat de bibliotheekcatalogus irrelevant zal worden. Zal het echt zo’n vaart lopen?
13 Google een alternatief voor bibliotheken? Voor de meeste bibliothecarissen is Google gemeengoed geworden. Voor academische bibliothecarissen ligt het wellicht enigszins anders. Sommigen hebben het al ingebed in de bibliotheekwebsite, meestal gaat het dan om Google Scholar; anderen beschouwen het als een valse verleider onder de 17 18
Bibliotheeknetwerk rond Universiteit Antwerpen http://www.worldcat.org
1636-08_LiberAmicJans_14_Gheysens.indd 280
22-12-2008 10:37:26
UITDAGINGEN VOOR HET BIBLIOTHEEKWEZEN IN HET GOOGLE-TIJDPERK
281
zoekrobots, die onwetende studenten al zwalpend op het verderfelijke pad van de informatieongeletterdheid stuurt. Het internet in zijn geheel vertoont ernstige tekortkomingen als provider van documentaire informatie en als superieure snelweg naar kennis. De dekking is verre van volledig, denken we maar aan het deep web en aan de enorme hoeveelheden informatie die ontsnappen aan de weliswaar krachtige spiders van de zoekrobots. Het is ook genoegzaam bekend dat er geen of nauwelijks kwaliteitscontrole is van alle informatie die op het web geplaatst wordt (Herring 2008: 86). Tegenover de rush om ongeveer alles te digitaliseren, wordt er nog nauwelijks aandacht besteed aan een doorgedreven bewaarbeleid van de klassieke informatiedragers. Heeft het web de klassieke bibliotheken met hun zorgvuldig opgebouwde boekencollecties die jarenlang minutieus werden gecatalogeerd en geïndexeerd door gekwalificeerd bibliotheekpersoneel overbodig gemaakt? Heeft het internet het informatielandschap zodanig veranderd dat bibliotheken nog nauwelijks deel zullen uitmaken van de informatiesnelweg? De vraag blijft ons achtervolgen.
Literatuur ASHLING, J. (2007), Progress report: The British Library and Microsoft digitization partnership, Information Today, 24, 10, pp. 18-19, Business Source Premier Database, 19 december 2007, Online. BAKSIK, C. (2006), Fair use or exploitation? The Google Book search controversy, Portal: Libraries and the Academy, 6, 4, pp. 399-415. BALAS, J. (2007), By Digitizing, are we trading future accessibility for current availability? Computers in Libraries, 27, 3, pp. 30-32, Business Source Premier database, 19 december 2007, Online. BAR-ILAN, J. (2008), Which h-index? A comparison of WoS, Scopus and Google Scholar, Scientometrics, 74, 2, pp. 257-271. BEARMAN, D. (2006), Jean-Noël Jeanneney’s critique of Google: private sector book digitization and digital library policy, D-Lib Magazine, 12, 12, http:// www.dlib.org/dlib/december06/bearman/12bearman.html, 4 december 2007, Online. CARLSON, S & J. YOUNG (2005), Google will digitize and search millions of books from 5 top research libraries. Chronicle of Higher Education, 51, 18, pp. A37A40. CONNELL, M. (2005), The digital dark age, The Sydney Morning Herald, 23 september, http://www.smh.com.au/news/technology/the-digital-dark-age/2005/ 09/22/1126982184206.html, 18 december 2007, Online.
1636-08_LiberAmicJans_14_Gheysens.indd 281
22-12-2008 10:37:26
282
GODWIN GHEYSENS
COYLE, K. (2006), Mass digitization of books, The journal of Academic Librarianship, 32, 6, pp. 641-645. DEMOVERSIE VAN EUROPESE DIGITALE BIBLIOTHEEK (2008), IP-Flash, 19 februari, http://www.informatieprofessional.nl/nieuws/index.php?op=details&id=3120, 3 april 2008, Online. DUGUID, P. (2007), Inheritance and loss? A brief survey of Google Books, First Monday, 12, 8, http://firstmonday.org/issues/issue12_8/duguid/index.html, 14 januari 2008, Online. FISHER, S. (2006), Open technologies and resources for the humanities – and cooperative consequences, Arts and Humanities in Higher Education, 5, 2, pp. 127-145, http://ahh.sagepub.com/cgi/content/abstract/5/2/127, 29 februari 2008, Online. GOOGLE BOOKS LIBRARY PROJECT (2008), http://books.google.com/googlebooks/ library.html, 3 april 2008, Online. GOOGLE EN UNIVERSITEITSBIBLIOTHEEK GENT BRENGEN HONDERDDUIZENDEN NEDERLANDSTALIGE EN FRANSTALIGE WERKEN ONLINE (2007), 23 mei, Persmededeling, http://lib1.ugent.be/cmsites/Default.aspx?alias=BO_www boekentorenbe_google_persbericht, 2 april 2008, Online. ‘GOOGLE GENERATION’ IS A MYTH, SAYS NEW RESEARCH (2008), JISC News, 16 januari, http://www.jisc.ac.uk/news/stories/2008/01/googlegen.aspx, 1 april 2008, Online. GORMAN, G.E. (2006), Giving way to Google, Online Information Review, 30, 2, pp. 97-99. GROGG, J., & C. FERGUSON (2005), OpenURL linking with Google Scholar, Searcher, 13, 9, pp. 39-46. Academic Search Elite database, 18 december 2007, Online. GUISTINI, D. (2008), Libraries can beat Google at its own game, UBS Academic search – Google Scholar blog, http://weblogs.elearning.ubc.ca/googlescholar/ archives/045414.html, 1 april 2008, Online. HERRING, M.Y. (2008), Fool’s gold: Why the internet is no substitute for a library, Journal of Academic Librarianship, 34, 1, pp. 85-86. JACSO, P. (2005), As we may search: comparison of major features of the Web of Science, Scopus and Google Scholar citation-based and citation-enhanced databases, Current Science, 89, 9, pp. 1537-1547. JEANNENEY, J-N. (2005), Quand Google défie l’Europe: plaidoyer pour un sursaut, Paris, Mille et une Nuits. KAENEL, I. DE & P. IRIARTE (2007), Les catalogues des bibliothèques: du web invisible au web social, 1ère partie: ouverture du catalogue à l’intégration des nouveaux contenus, RESSI: Revue électronique suisse de science de l’information, 5, pp. 1-19. KESSELMAN, M. (2005), Google ScholarTM and libraries: point/counterpoint, Reference Services Review, 33, 4, pp. 380-387.
1636-08_LiberAmicJans_14_Gheysens.indd 282
22-12-2008 10:37:26
UITDAGINGEN VOOR HET BIBLIOTHEEKWEZEN IN HET GOOGLE-TIJDPERK
283
KOUSHA, K. & M. THELWALL (2008), Sources of Google Scholar citations outside the Science Citation Index: A comparison between four science disciplines, Scientometrics, 74, 2, pp. 273-294. LIEDTKE, M. (2006), Google book-scanning efforts spark debate, Washington Post, 20 december, http://www.washingtonpost.com/wp-dyn/content/article/2006/ 12/20/AR2006122000213_pf.html, 1 april 2008, Online. MILNE, R. (2006), The Google library project at Oxford, Internet Reference Services Quarterly, 10, 3/4, pp. 23-28. PAN, B., H. HEMBROOKE, T. JOACHIMS, L. LORIGO, G. GAY & L. GRANKA (2007), In Google we trust: User’s decisions on rank, position and relevance, Journal of Computer-mediated Communication, 12, 3, pp. 769-1142. PRASAD, A., A. AGARWALA & S. SAXBY (2008), Copyright, Google and the digitisation of libraries, Armageddon on the superhighway: Will Google’s e-library project weather the storm? Computer Law & Security Report, doi: 10.1016/j. clsr.2008.01.002. ROSS, L. & P. SENNYEY (2008), The library is dead, long live the library! The practice of academic librarianship and the digital revolution, Journal of Academic Librarianship, 34, 2, pp. 145-152. ROTH, D.L. (2005), The emergence of competitors to the Science Citation Index and the Web of Science, Current Science, 89, 9, pp. 1531-1536. SADEH, T. (2004),The challenge of metasearching, New Library World, 105, 1198/ 1199, pp. 104-112. SADEH, T. (2006), Google Scholar versus metasearch systems, High Energy Physics Libraries Webzine, 12, http://library.cern.ch/HEPLW/12/papers/1/, 19 december 2007, Online. THELWALL, M. (2005), Directing students to new information types: A new role for Google in literature searches? Internet Reference Services Quarterly, 10, 3/4, pp. 159-166.
1636-08_LiberAmicJans_14_Gheysens.indd 283
22-12-2008 10:37:26