ESZTERHÁZY KÁROLY FŐISKOLA, EGER
Beszámoló könyvtári szakmai gyakorlatról Digitálisarchívum-fejlesztő szak Humán Informatika Tanszék Média Informatika Intézet Zádori Zsuzsanna Netpun kód: U5AT4N
A szakmai gyakorlatot a Közép Európai Egyetem mellett működő ‘Open Society Archives’ (OSA) Könyvtárában végeztem (1051 Budapest, Arany János utca 32), a könyvtári adatbázis metaadatainak rendezésén dolgoztam. Könyvtár vezető: Dobó Katalin. Gyakorlat ideje: 2015. október 14-től december 4-ig.
Az Open Society Archives a Közép Európai Egyetem mellett működő kutatóintézet, levéltár és könyvtár Budapesten (továbbiakban OSA, alapítási év: 1995). 7 folyó-kilométernyi hidegháború, kommunizmus és emberi jogi állománya a XX. század, de legfőképpen a 2. világháború utáni korszak kutatóinak kincsesbánya. Sajátossága, hogy katalógusai és web oldala angol nyelvű, csakúgy, mint anya intézményéé, a CEU-é (Central Eurpoean University / Közép Európai Egyetem). Ezért a szakmai gyakorlatomat magyar kollegákkal, de angol nyelvi környezetben töltöttem, ezért is használok kétnyelvű szakszavakat. Háttér – Könyvtári adatbázis Az OSA-ban az anyagok 1995 óta használt Microsoft Access alapú, házon belül fejlesztett könyvtári adatbázisát 2010. novemberében felváltotta a KOHA. A rendszer-átállás eredményeképp a mintegy 5000 tétel könyv és ugyanennyi periodika állományt migrálta az OSA a KOHA-ba. (A KOHA egy bevett, sok országban alkalmazott open source, MARC-alapú integrált könyvtári adatbázis rendszer.) A rendszert Dobó Katalin Vezető könyvtáros és Bóné Gábor József Informatikus telepítette és szabta testre az OSAban. A KOHA kiválóan működik. Háttér – Filmtári adatbázis Az OSA Film Library, azaz Filmtár állománya kb. 4000 tételből áll. Egy szintén házon belül, az OSA-ban fejlesztett Microsoft Access adatbázis szolgálja a katalogizálókat és kutatókat. Minthogy az OSA 2015-ben teljes körűen fel akarja számolni MS Access adatbázisait, a Filmtár teljes állományát átviszi a könyvtári adatbázisba, a KOHA-ba, szabványos MARC21 szerinti rekordokat hozva létre. Szakmai gyakorlatom során a Filmtár állományának KOHA-ba való integrálásában, migrálásában vettem részt. A szakmai gyakorlatot a munka tervezési szakaszától a kivitelezésig követtem nyomon, s vettem részt a feladatok kitalálásában és megoldásában. A munka célja, tervezett következmények 1. A sikeres migrálás, minőségi ellenőrzés, hibajavítás és a végső változat tesztelése után a MS Access Film Library adatbázist kivonja a forgalomból az OSA. Az új szerzeményeket a KOHA-ban katalogizálja az OSA. 2. A szabványos MARC21 Film Library rekordokat megosztja az OSA a CEU könyvtárával. Filmtár/FL (MS Access) és KOHA adatmezőinek feltárása, megfeleltetése (mapping) Az MS Access adatbázisban 23 adatmező van. Ezekből 1 önkitöltős (FL azonosító szám) és mindössze 2 kötelező. 7 azon adatmezők száma, ahol a kitöltés/katalogizálás authority listából való választással (legördülő menü) történik. Az első és legfontosabb feladat a MS Access és a MARC21 rendszerű KOHA adatmezőinek kapcsolata, ezek definiálása, illetve annak feltérképezése, hogy mely az Access-ben nem szereplő adatmezőket kell a Kohán belüli Filmtár keretrendszerébe, metaadat sémájába beilleszteni. Ez az ún. mappelés – ezt a munkát a Vezető könyvtáros szakmai felügyelete alatt, ill. vele közösen végeztem.
Filmtár (Film Library) Microsoft Access adatbázis, beviteli felület Könyvtári gyakorlat, Zádori Zsuzsanna Digitális-archívum fejlesztő. Neptun U5AT4N
Page 1
Előkészületek a migráció előtt: a MS ACCESS adatbázis metaadat rendszere versus MARC21
A MS Access és a MARC21 adatsémák illesztése: előfeltétel a migráláshoz Szabványosítani 2 authority listát a MS Access-ben: a. ‘Nyelv’ (leendő ’041 #a’ mező, a szöveg/hang nyelve) és b. ‘Ország’ (leendő ’260 #a’ + ‘651#a’ mezők, a publikálás helyének megjelölésére) listákat, hogy a KOHA-ba már a szabványos, megtisztogatott adatokat vigyük át.
MS Access-ből exportált ‘Ország’ és ‘Nyelv’ lista szabványosítás után Könyvtári gyakorlat, Zádori Zsuzsanna Digitális-archívum fejlesztő. Neptun U5AT4N
Page 2
Az adatséma modell felállítása után a Filmtár KOHA-n belüli keretrendszerének kialakítása következett. A szabványos MARC rekordok részét képezik az ún. kötelező rendszer-mezők, amelyek katalogizáláskor, ill. a ‘Librarian View’-ban (könyvtárosi nézet) láthatók. Pl. 000 – Leader, ez kód formájában írja le a rekordot. Adatbevitelkor a mezőre klikkelést követően önkitöltős rendszerű. 003 - Control Number azonosító, MARC code: hubpceu. 005 – Az utolsó tranzakció dátuma és ideje, a mezőbe való klikkeléskor önkitölt, kitöltetlenség esetén a KOHA nem menti el a rekordot. 007 – Az adathordozó (Physical description fixed field) – v: videó 008 – Egyen-hosszúságú adatelem minden Filmtár rekordban (Fixed-lenght data elements): 121017b xxu||||| |||| 00| 0aeng d A metaadat séma kialakításával párhuzamosan az adattisztogatás volt a fő feladatom. A MS Access adatait Excel nézetben kaptam meg. Meg lett határozva a 9 kötelező adatmező, amelyek hiányában a rekordot nem veszi át a KOHA. Ezek a következők: 1. 2. 3. 4. 5. 6. 7. 8. 9.
100 #a - Main Entry-Personal Name - filmrendező 245 #a – cím, eredeti nyelven, eredeti abc szerint 242 #a – cím angolul (Translation of Title by Cataloging Agency) 260 #a – kiadás/megjelentetés helye (Place of publication, distribution ) 651#a – Geographic name, Subject Added Entry, authority lista 260 #c – kiadás/megjelentetés ideje (Date of publication, distribution) 041 #a – a film nyelve (Language code of text/sound track or separate title) 520 #a – annotáció (summary), tartalmi leírás 655 4 #a – film műfaji besorolása (Index Term-Genre/Form)
Az adattisztogatás, konszolidálás során (excel nézetben) szortíroztam a rekordokat eme 9 adatmező szerint, hogy kiszűrjem a hiányosan felvitt rekordokat. A hiányzó adatmezőket kitöltöttem – olykor on-line keresés, máskor a forrás (videó) elővétele és lejátszása útján. Az adatkonszolidálás, mappelés és a keret kialakítása után következett az első migráció. A több ezer rekord áttöltését a KOHA-ba Bóné Gábor József végezte. Az első migrációt követte az adatellenőrzés: a Vezető könyvtáros Dobó Katalin és én a szisztematikusan ellenőriztünk 30-30 rekordot, a legkisebb és a legnagyobb azonosító számúakat. Összevetettük az Access adatbázisban megjelenő metaadatokat a KOHA-ba áthúzottakkal. Megállapítottuk, hogy az adatátvitel jól sikerült, problémát nem észleltünk. Következett egy mélyebb szintű ellenőrzés: azokat a rekordokat kellett megvizsgálni, ahol többszörös adatfelvitel volt a MS Access-ben: a. forrás többnyelvű (041 #a); b. ahol több a szerző vagy a rendezőn kívül más alkotó/közreműködő is meg volt adva (100#a, c, d); c. amely filmek koprodukcióban készültek (260 #a). Az előkészítés során megfigyeltem, hogy az indiai filmek többsége többnyelvű, a holland nyelvű filmek többsége koprodukcióban készült, ezért azokat a rekordokat ellenőriztem. Megállapítottam, hogy sikeres volt a többszörözött (repeatable) mezőkből való metaadat-import: hibátlanul lettek áthúzva a metaadatok. Könyvtári gyakorlat, Zádori Zsuzsanna Digitális-archívum fejlesztő. Neptun U5AT4N
Page 3
A KOHA keresőjének tesztelése volt a következő lépés: címben, leírásban, ill. az authority listákon szereplő személy- és földrajzi nevekre, műfajokra és nyelvekre kerestem azt vizsgálva, hogy megjelenik-e a találati listán az előre kinézett rekord. A megjelenítés funkció tesztelése, ill. kialakítása következett. A KOHA rendszer az OSAban úgy lett felállítva, hogy a rekordnak 4 nézete lehetséges: Normal, MARC, Címkézett MARC és ISBD. Ezen nézetek – mint neveik is elárulják – ugyanazon rekord bibliográfiai adatait jelenítik meg különböző módokon, különböző felhasználó/célközönség számára. A MARC és Címkézett MARC nézet könyvtárokonak, levéltárosoknak; a Normál és ISBD pedig laikusoknak szól, a metaadat címke megjelölése nélkül prezentálja a leíró adatokat az egyes filmekről.
Ugyanazon rekord 4 nézete: Normal, MARC, Labeled MARC és ISBD nézet, KOHA
Eredetileg a Filmtár/Film Library KOHA adatbeviteli felület vázlatának kidolgozása is a szakmai gyakorlat része lett volna, de erre – idő hiányában – már nem került sor. Meg lett viszont tervezve a Filmtár találatainak megjelenítése, a gyakornokoskodásom ideje alatt. 2015. novemberében elkészült és felállt az OSA Archívum új kereső motorja, amiben meg van jelenítve a Filmtár (Film Library) 4061 rekordja.
Az OSA keresője, 4061 film rekord a KOHA-ban és a 3867-es jelzetű film Könyvtári gyakorlat, Zádori Zsuzsanna Digitális-archívum fejlesztő. Neptun U5AT4N
Page 4
Az Filmtár rekordjainak megjelenítésének teljes, minden adatmezőt megjelenítő nézete hasonló a KOHA MARC nézetéhez. A ‘Librarian View’–ra kattintva megnyílik egy lap, ami dinamikus – csak azokat a mezőket tartalmazza, amelyekre vonatkozóan van érték az adatbázisban.
A 3867-es jelzetű FL (Film Library) rekord könyvtárosi nézete
A 2015. október 14-től december 4-éig tartó szakmai gyakorlatom ideje alatt volt alkalmam beható munka tapasztalatot szerezni a könyvtári adatbázisok működtetéséről, azon belül a MARC21 rendszerű KOHA könyvtári rendszer testreszabásáról. Különösen hasznos és érdekes volt számomra megtapasztalni, hogy a szabványos rendszerbe bevitt szabványos metaadat az egyetlen lehetséges módja a feldolgozásnak: ha ezek szerint rögzítjük az adatokat, van esély a platformok közötti copy-katalogizálásra majd adatmegosztásra. Ha e szabványrendszeren kívül maradunk, rekordjainkkal a saját rendszerünkbe bezárva maradunk, így elzárjuk magunkat a potenciális felhasználóktól. Könyvtári gyakorlat, Zádori Zsuzsanna Digitális-archívum fejlesztő. Neptun U5AT4N
Page 5