Adatbázis-migrálás : tanulságokkal g Koltay Klára DEENK Networkshop, 2009. április 15.
MOKKA „irányváltások” 1996 2009 1996-2009 • A MOKKA szállítójának megváltozása • osztott katalogizálás funkciók – 16 könyvtár – „minden fontos könyvtári rendszer” – Hangsúlyos funkció: jó bibliográfiai rekordok szolgáltatása
• Legyen az ODR lelőhely-nyilvántartás alapadatbázisa – Résztvevők körének jelentős szélesítése – Újj könyvtári y rendszerek,, újj katalogizálási g szokások – Hangsúlyeltolódás: lelőhelyadatok minél szélesebb körből
• TÁMOP – újabb j irányváltás y vagy gy továbbépítkezés p az eddigi tanulságok alapján?
MOKKA – eredmények y Először látható egy adatbázisban hogyan működik együtt: – Több millió bibliográfiai rekord minden dokumentumtípusra p ((kivéve folyóirat) y ) – Több millió besorolási adat rekord – Több millió állományadat – Több mint 30 forrásból – 6 könyvtári rendszer
Tanulságok alapján lehetőség a rendszer jelentős „utóhangolására”, új szolgáltatásokkal, új k kapcsolatrendszerekkel l t d kk l való ló ki kiegészítésre, é íté lehetőséget adva a résztvevő rendszereknek az összehangoló fejlesztésre
Tanulság -- MOKKA által tárolt adatok négy szintje 1. Bibliográfiai leíró információk Î 1 dokumentum d k t =1 1 lleírás; í á csak k egyszer szerepeljen; mindegy ki adja a rekordot Î A leírás elég jó legyen ahhoz, hogy Î A dokumentum azonosítható legyen Î A duplumellenőrzés elvégezhető legyen Î FRBR megjelenítés kialakítható legyen
2. Hozzáadott információ = hozzáadott érték Ä Analitikus információk (tanulmánykötetek, szerzői gyűjtemények stb.) stb ) Ä Együttműködés egy munkaigényes szolgáltatás létrehozásában Ä Adatszolgáltató g nem feltétlenül azonos az alap p leíró adatok szolgáltatóival Ä Analitikus feltárás eltérő mélysége, eltérő formái
Ä Possessorok, dedikált kötetek, bejegyzések Ä Közös adatbázisban egymás mellé kerülve igazán izgalmas adatok Ä Példánymegjelölés Ä Minden könyvtár új adatokkal szolgálhat
Ä Dokumentum elérhető kapcsolatai a weben Ä Munkamegosztás Ä karbantarthatóság
3 Authority információk: nevek 3. nevek, tárgyszavak besorolási rekordjai ÄKevés könyvtár az adatszolgáltató ÄVáltozáskövetés ÄBesorolási rekordok és bibliográfiai rekordok kapcsolataira építő rekordkarbantartás ÄKülönböző forrásból érkező nevek egységesítése (FRBR kö etelmén ek) követelmények)
ÄTárgyszórendszerek, tezauruszok egymástól g kezelése megkülönböztett ÄBesorolási adatok „szolgáltatása”: ÄKereséstámogatás ÄBibliográfiai rekordokban pontos névalakok, azonosítható tárgyszavak y rekordok szolgáltatása g ÄMARC authority
4 Lelőhely és példányinformációk 4. ÎLegszélesebb szolgáltató kör; minden könyvtár lelőhely-információja fontos lehet ÎTárolandó információk vs. aktuálisan lekérdezendő információk ÎEltérő begyűjtési módok: ÎKözvetlen szolgáltatás ÎKözvetítő adatbázisok rekordjaihoz csatlakozva Î ISBN alapú gyűjtés Î…
ÎÁllandó változás Î követés ÎK ÎKapcsolat l t kölcsönzési köl ö é i rendszerekkel d kk l Î ODR szolgáltatások
A MOKKA adatbázis d tbá i átköltö átköltöztetése t té az új szerverre Älehetőség arra, hogy az alapvető struktúrát megtartva egta t a az a a azon o be belüli ü to továbbfejlesztéssel ább ej es tésse kísérletezzen, bizonyítsa a jelenlegi struktúrában rejlő j fejlődési j lehetőségeket g Älehetőség arra, hogy létrehozza azokat az új kapcsolódási pontokat pontokat, amelyekhez a helyi rendszerek illeszkedve könnyebben tudnak a központi rendszer számára információkat küldeni küldeni, és hatékonyabban tudják szolgáltatásaikat felhasználni
Az új MOKKA adatbázis néhány újdonsága • • • • • •
Duplumellenőrzés Analitika Példányspecifikus információk Kötetkezelés Besorolási adatok Lelőhelyek
Duplumellenőrzés Az új duplumellenőrzés a MOKKA adattartalmának vizsgálatán alapult Az utóbbi időben zajló kurrens feltöltések már „tesztelték” ezt a módszert. Most a teljes visszamenőleges állományra megtörtént. Eredmény: • monografikus rekordok száma a korábbi 4,7 millióról 2,9 millióra csökkent • Ha az egyes dokumentumokat vizsgáljuk azt látjuk látjuk, hogy a korábbi hat-nyolc duplum rekord helyett egy-három rekord vált jellemzővé. j • Különösen a könyvek esetében javult jelentősen a korábbi helyzet, kevésbé a hangfelvételek, audiovizuális dokumentumok esetében esetében.
Duplumellenőrzés 000 00622nam 2200193 ir4500 001 MOKKAN0004652238 005 20070521170549.0 008 851209s1985 hu 00000 hun d 020 $a963 05 4021 5 035 $abibJGYx34307 040 $aSZTE 1001 $aBarta János$c(id.)$d(1901-1988) János$c(id )$d(1901-1988) 24512$aA pálya ívei :$bKemény Zsigmond két regényéről /$cBarta János 260 $aBudapest :$bAkad. K.,$c1985 300 $a112 p. p ;$c20 cm 4901 $a(Irodalomtörténeti füzetek,$x0075-0840 ;$v115.) 6001 $aKemény Zsigmond$d(1814-1875) 830 0$aIrodalomtörténeti 0$ I d l tö té ti füzetek fü t k 852 $aSz1$xbibJGYx34307 999 $aMOKK
Azonosított duplumok kezelése Többszintű kezelés: - Leíró adatok - érintetlenek maradnak vagy a - „hiteles könyvtár” adataival lecserélődnek
- Hozzáadott érték - ETO jelzetek beírása, de csak ha új témát jelöl meg - Analitikus A litik adatok d t kh hozzáadása, á dá d de csak kh ha még é nincsen i teljes szintű analitika - Példány-specifikus Példány specifikus információk (possessor stb stb.)) - Csak ha van pontos forrásmegjelölés (legalább könyvtár); - A könyvtár ö y tá a saját mezőit e ő t karbantarthatja a ba ta t atja
Kötetkezelés – eredeti koncepció • MOKKA adatbázisban kapcsolt rekordos kötetkezelés • Tagkönyvtárak eltérő kötetkezelését engedélyezi és alakítja kapcsolt rekordos kezeléssé – a kapcsolt rekordokat alkalmazó kötetkezelés • kizárólag a rekordazonosítók használatán alapul • rekordazonosítókon túl cím és szerzői adatokat is megismételnek
– egy bibliográfiai rekordon belül történik a többkötetes dokumentum összefoglaló leírása és a kötetadatok részletezése.
• a MOKKA – a kapcsoltan érkező kötetadatok esetében a helyi és a MOKKA közötti eltérő rekordazonosítók miatt kell átalakításokat végeznie. • Elvárás: a kötet rekord mindig csak összefoglaló rekorddal együtt érkezzen.
– egy rekordos leírás Æ darabolja összefoglaló és kötetrekordokra – a könyvtáranként konfigurálta, hogy melyik eljárást kell alkalmaznia – elvárta a kapcsolt rekordokat felküldő könyvtártól, hogy kötetrekordokat soha ne küldjön egyedül egyedül, mindig érkezzen vele a hozzátartozó összefoglaló rekord is.
Kötetkezelési újdonságok j g DE: DE – Nem tételezhető fel, hogy egy adatbázis csak egyféleképpen g a felérkező rekordról kezeli a többkötetes műveket. Æ magáról dönti el, mi a teendő vele. – Közös és kötetrekord nem érkezik együtt Æ a MOKKÁ nem az eredeti rekordkapcsolatok p megtartására g törekszik,, hanem eltárolt információk alapján maga építi fel a kapcsolatokat. Azoknak a kötetrekordoknak a betöltését pedig, amelyek kapcsolata nem y számára látható hibaüzenettel építhető fel, a küldő könyvár megszakítja.
• Az új kötetkezelési mechanizmus kiterjeszthető lesz majd egyéb típusú kapcsolatok követésére is is, lehetővé téve például a kapcsolt rekordokban feltárt analitikus tartalmak befogadását.
Besorolási rekordok MOKKA alapkoncepció: • bibliográfiai f és besorolási rekordok p tételezi fel kapcsolatát • Fogadja a beérkező besorolási rekordokat • Ha H nem kkap, automatikusan t tik h hoz lét létre authority rekordokat • Nevek, tárgyszavak, egységesített címek
Besorolási rekordok következetes begyűjtése
Kevés forrás, de következetes begyűjtés: Személy- és testületi név rekordok: • OSZK • FSZEK • DEENK • SZTE A tárgyszórendszerek közül • a Köztaurusz (2008.12.19-i verzió), • a szegedi di tá tárgyszavak k • a MeSH és Library of Congress angol és magyarra f dít tt tárgyszavainak fordított tá i k az a szegmense, amelyet l ta debreceni katalógus használ.
Nevek kezelése • A névalakok formája a forrástól független • Az elsőként bekerülő auth. rekord mögé gyűlik minden bibl bibl. rekord • Névrekordok kiegészíthetősége, változtathatósága ált t th tó á Æ hozzá h á ttartozó t ó bibl bibl. rekordok automatikus módosulása • Továbbra is szükség van automatikus keletkezésű besorolási rekordokra Æ később beküldöttre cserélődhetnek
Tárgyszavak gy kezelése Megkülönböztetett g tárgyszórendszerek gy • indikátorokkal és tárgyszórendszer kódokkal tesz különbséget a MOKKA új adatbázisa • mindig csak egy-egy rendszeren belül kell érvényesíteni azokat a MOKKA adatbázisban is futó ellenőrzéseket ellenőrzéseket, amelyek az egyes alakok egyediségére és az utalórendszerek következetességére g vigyáznak. gy • kiegészíthetőség Meg g nem különböztetett tárgyszavak gy ~ nevekhez hasonló kezelés Automatikus keletkezésű tárgyszórekordok –> ké őbb b később beküldöttre küldött cserélődhetnek élődh t k
Besorolási rekordok használata • Böngésző keresések feldúsítása utalókkal • Utalók beforgatása a kulcsszavas keresésekbe • Hiteles(ebb) név és tárgyszóalakok a bibliográfiai rekordokban Æ nagyobb esély „élvezhető” FRBR megjelenítésre • Rekordot letöltő könyvtár azonosíthatja az általa használt forrásból származó tárgyszavakat • MARC authority rekordok letöltése a MOKKÁ ból MOKKÁ-ból
Lelőhelykezelés • Eredeti koncepció: rekordforrás alapján a MOKKA tölti ki a „lelőhelyet” • Integrációval létrejött összetett intézményi struktúra számára nem megfelelő • A könyvtárak helyi lelőhely-információit is tárolja a MOKKA – a nem szabványos kódok cserélődtek le, – a helyi lelőhelykód nélküli rekordokba visszamenőleg bekerültek a 852 $a tartalma alapján képzett lelőhelyek. – Felküldött lelőhelykódok automatikus kitöltésének mechanizmusa a kurrens feltöltésekre is működni fog azoknak a könyvtáraknak a kedvéért, akik nem küldenek helyi lelőhely-információkat a rekordjaikban.
• a lelőhelyek szerinti keresés ez alapján az index alapján történjen • a helyi állományokban bekövetkezett változások „jelentése” „jelentése a MOKKÁ-nak. – A MOKKÁ-ba ismételten felérkező helyi rekord aktualizálja a MOKKA rekord rá mutató lelőhelyadatait, így a helyi lelőhelyek közötti állománymozgások, esetleges állományból való kivonások miatt helyi lelőhely módosulások is követhetővé válnak a MOKKA számára.
Lelőhelykezelés Æ ODR funkciók A lelőhelykezelés további finomítása, j az ODR funkcionalitásának kiterjesztése fejlesztések részeként várhatóak a továbbiakban. továbbiakban
Összegzés Javult a helyzet a sokszor kárhoztatott MOKKA hiá hiányosságok á k tterén é Új tendencia • bibliográfiai információk módosítások elleni védelme tartományait, • de növeli a MOKKA rekordok azon tartományait – amelyekre a tagkönyvtárak hatással lehetnek, amelyek az egyes tagkönyvtárakhoz mint feltöltőkhöz köthetőek és amelyeket így időről időre aktualizálhatnak mint például a lelőhely-információikat, vagy – amelyekkel kiegészíthetik mások leírásait, mint például a tárgyi vagy tartalmi feltárás illetve a példányspecifikus adatok d t k esetében. téb