Múzeumi könyvtárak a digitális korban
Félcédulás tapasztalatok – avagy retrokonverzió szakkönyvtári környezetben
Dr. Andaházi Szeghy Viktor
[email protected]
MKE 44. Vándorgyűlése 2012. 07. 13. Győr
Retrospektív konverzió 1. Mi is a retrospektív konverzió? 2. Munkafolyamat, eszközök, lehetőségek 3. Egy modell: Hadtörténeti Könyvtár TÁMOP 3.2.4/1/KMR/09 „Múzeumok a digitális korban” 1. Cédula típusok I. - Szabvány 2. Cédula típusok II. – Nem szabvány
4. Feldolgozói tapasztalatok 5. Összegzés 6. Idő - pénz
1. Mi is az a retrospektív konverzió? - Cél és módszer Gyűjtemény nyilvántartás
Rekatalogizálás ‘Újrakatalogizálás’ (autopszia)
Retrokonverzió ‘Visszatekintő átalakítás’ (katalóguscédula)
Könyvtári dokumentumok kereshető adatbázisa
2. Munkafolyamat, eszközök, lehetőségek A retrokonverziós munkafolyamat elvi ábrája Elvárt nagy pontosság •Manuális •Automatizált
Szkennelés
OCR
TIFF
XML
IKR konverzió
Adattisztítás
Betöltés
XML → MARC •Adatok •TIFF •Mutató a képhez
Teszt adatbázis → Éles adatbázis
3. Egy modell: Hadtörténeti Könyvtár TÁMOP 3.2.4/1/KMR/09 „Múzeumok a digitális korban”
Döntés előkészítési szempontok: Adottságok: • Nagyon heterogén állomány (1534-1996, régi könyvek, kevés ISBN és ISSN, sok külföldi anyag, speciális dokumentumok) • Adat-teljes „master” katalógus • Csak helyben használható adatforrás (katalógusok) Lehetőségek: • Szabvány cédulák, részben szabvány leírások – feldolgozás gyorsítása • Cédulakép felhasználása az adatkorrekciónál • Egynemű gyűjteményi részek leválogatása (szabályzat, zárt, stb.) Kockázatok: • Többféle leírási forma • OCR és konverziók hatásfoka (vs. manuális munka)
Egy modell: Hadtörténeti Könyvtár TÁMOP 3.2.4/1/KMR/09 „Múzeumok a digitális korban”
Idő
Költség
Rekat.
Retro.
munkaidőben
0-24 - távmunka
manuális munka
gépesíthetőség
Minőség
gépi feldolgozás
kézi adatbevitel
+ kézi adatbevitel
Fázisok A Hadtörténeti Könyvtár retrokonverziós munkafolyamatának elvi ábrája Manuális: •Rekord import •Cédulakép alapján
Elvárt: 90% fölötti pontosság
Szkennelés
•Alap katalógus •TIFF
OCR
XML
HunTéka konverzió
Korrektúra
Betöltés
Teszt adatbázis → Éles adatbázis •Jelzet, szerző, egyéb szöveg •TIFF •Mutató a képhez
XML → HUNMARC
Cédula típusok I. – Szabvány Raktári jelzet
Elkülöníthető adatok: •Szerzőség •Cím •Kiadás •Terjedelem •Egyéb adatok
Leltározási adatok
Fő jellemzők:
Példány adatok
•Jól elkülönülő információk (MSZ 3424/1 szerint: „. •Könnyen felismertethető szövegrészek
- ”)
Elsődleges MARC rekord: (Eredeti értékek, szkennelés után)
856 (Elektronikus hely és hozzáférés)
6e99c3e8c0cf4d38ac4306b1e65816d1.tif
852 (Elhelyezés)
65161
500 (Általános megjegyzés)
Teleki Sámuel albuma / Kisérő tanulmánnyal közread. Jankrovics. József . — Szeged : JATE Pedagógiai tanszéké,. 1991, - 59 p. : ill, 7948 ; 8 ) Perearinatio Hungarorum, ISSN 0238 Névmutató. - Bibliogr. a jegyzetekben ISBN 963 481 859 5 1 pld. Jankovics József (közread.) Teleki Sámuel
Másodlagos MARC rekord:
(HUNMARC adatcsoportok értékei a konverzió után) 009 005 (A rekorddal végzett utolsó művelet dátuma és időpontja ) 008 (Meghatározott jellemzők és információs adatok) 022 (ISSN)
3709 20110808135231.0
040 a, b (A leírás forrása)
HM, hun
245 a, b, c (Cím és szerzőségi közlés) 260 (Megjelenés) 300 (Terjedelem) 500 (Általános megjegyzés)
599 (Helyi használatú megjegyzés) 852 a, b, i, k, m, s, x (Elhelyezés) 856 (Elektronikus hely és hozzáférés)
110808s 1 ISSN 0238Névmutató Teleki Sámuel albuma, Jankrovics, Kisérő tanulmánnyal közread 1991 991, - 5 Teleki Sámuel albuma / Kisérő tanulmánnyal közread. Jankrovics. József . ? Szeged : JATE Pedagógiai tanszéké,. 1991, - 59 p. : ill, 7948 ; 8 ) Perearinatio Hungarorum, ISSN 0238 Névmutató. - Bibliogr. a jegyzetekben ISBN 963 481 859 5 1 pld. Jankovics József (közread.) Teleki Sámuel hm_1 HM, Retrospekív feldolgozás, 65161, nem_kolcsonozheto , 65161, 65161, feldolgozas_alatt 6e99c3e8c0cf4d38ac4306b1e65816d1.tif
Katalógusba töltve
Korrigálandó adatok
Katalógusba töltve vs. korrektúrázva
Cédula típusok II. – nem szabvány Raktári jelzet
ETO szám
Egyéb besor. cím
Cím és egyéb adatok
Leltározási információk
Fő jellemzők: •Kevés elkülöníthető adatcsoport •Nehezen felismertethető szövegrészek •Nehezen importálható dokumentumok
Példány adatok
Elsődleges MARC rekord: (Eredeti értékek, szkennelés után)
856 (Elektronikus hely és hozzáférés)
afa058c43df64225a4238ecc1f7af57d.tif
852 (Elhelyezés)
sz 3493
500 (Általános megjegyzés)
Fegyverzeti teljességi utasítás a 10.5 cm 40/43 M. roham tarack és a 7.5 cm 43 M. rohamágyú részére. Bp. ny.n. 1944. 13 p. 28 cm.F-23
Másodlagos MARC rekord:
(HUNMARC adatcsoportok értékei a konverzió után) 009 005 (A rekorddal végzett utolsó művelet dátuma és időpontja ) 008 (Meghatározott jellemzők és információs adatok) 040 a, b (A leírás forrása) 245 a, b, c (Cím és szerzőségi közlés) 260 a, b, c (Megjelenés) 300 a, c (Terjedelem) 500 (Általános megjegyzés) 599 (Helyi használatú megjegyzés) 852 a, b, i, k, m, s, x (Elhelyezés) 856 (Elektronikus hely és hozzáférés)
243831 20110808143540.0 110808s 1 HM, hun Fegyverzeti teljességi utasítás a 10
Bp., 5 cm 40/43 M, 1944 13 p., 0.5 cm Fegyverzeti teljességi utasítás a 10.5 cm 40/43 M. roham tarack és a 7.5 cm 43 M. roham-ágyú részére. Bp. ny.n. 1944. 13 p. 28 cm.F23 hm_db HM, Retrospekív feldolgozás, sz 3493 , nem_kolcsonozheto , sz 3493 , sz 3493 , feldolgozas_alatt afa058c43df64225a4238ecc1f7af57d.tif
Betöltve, korrektúrázva
Javított adatok
Manuálisan hozzáadható, egyéb információk: •ETO szám •Leltározási adatok •Példányszám •Tárgyszavak
4. Feldolgozói tapasztalatok Adat típus
Gépi arány
Megjegyzés
245 a, b, c (Cím és szerzőségi közlés)
100%
fő- alcím, egyéb címadat szétválasztása: manuál
260 a, b, c (Megjelenés)
90%
nagyobbak, elterjedtebbek esetében jó arány, egyébként manuális
300 a, c (Terjedelem)
90-100% p-p. esetében a második szám került be
852 a, b, i, k, m, s, x (Elhelyezés)
98-100% „Retrospektív feldolgozás”, „feldolgozás alatt” manuál
856 (Elektronikus hely és hozzáférés)
99%
Feldolgozói tapasztalatok Címadatok karakter egyezése közel 100% (aláhúzás, â, è, ş) A címadatok szétválasztása: fő- alcím, egyéb címadat – manuál Kiadás helye: Budapest, Bp. Wien, Paris, Kolozsvár, stb. 90 %-os megfelelés, ritkábbak manuálban Kiadó: nagyobbak: 90%, többi manuál
Terjedelmi adatok: oldalszám 90%, melléklet megléte közel 100% (értelmezése: manuál), méret (cm esetén) 100% Sorozat adatcsoport: a legproblémásabb - pl. többkötetes könyv közös főcíme került a sorozati adat helyére – manuál
Személynevek segédállománya jól használható (I. V. Stalin legalább 40-féle formában volt megtalálható) egységesítés: manuál Testületi név segédállomány teljesen üres – manuális felvétel egységesítés utólag Rendezvény név szintén, Földrajzi név szintén
Leltári szám: közel 100% , néhol karaktertévesztés,
Kötelező „HURF” összefoglaló nézet a rekord mentése előtt
5. Összegzés:
- Csodák pedig nincsenek… Hátrány (elvárástól való eltérés): Minden rekordhoz „hozzá kell nyúlni” (kb. 0.5 % volt tökéletes)
Előny:
Platform-független megoldás (Java) Szerver-kliens rendszer: 24 órás elérhetőség Mobilitás (szkennelt adatok) Nincs újragépelés (további szövegromlás lehetősége)
Lehetőség:
Alapkatalógus kiegészítő adatai (leltár, ETO, stb.) Rekord import kiterjesztése (pl. 1976-ra szűrés a magyar kiadványoknál) Adatpontosság növelése → költségcsökkentés
Egyebek:
Online hibabejelentő felület – gyors technikai segítség Folyamatos, jól működő kapcsolat alapfeltétel
6. Idő – pénz Munkafázis Szkennelés
Időtartam* 2 nap
Bekerülési költség/db**
OCR
4 hét
25 Ft
Konverzió
2 hét
60 Ft
Korrektúra
5 hónap***
80 Ft
*
Nettó idők: betöltéseken, tesztüzemen, próba szériákon túl
** Nagyságrendi, kerekített összegek *** Heti átlagok: 124-5778 (!) db. között
Partnerek
Képfeldolgozás: pont IT Üzletviteli Tanácsadó és Szolgáltató Kft. Konverzió: Monguz Információtechnológiai Kft. Korrektúra: Katatár Könyvtári és Ügyviteli Adatfeldolgozó Kft.
Köszönöm szíves figyelmüket!
Dr. Andaházi Szeghy Viktor -
[email protected] MKE 44. Vándorgyűlése 2012. 07. 13. Győr