Szegedi Tudományegyetem Juhász Gyula Tanárképző Főiskolai Kar Könyvtártudományi Tanszék
SZAKDOLGOZAT A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása
Konzulens: Dr. Pajor Enikő főiskolai docens
Készítette: Vincze Andrea III. évfolyamos hallgató informatikus könyvtáros szak levelező tagozat
Szeged, 2005.
Tartalomjegyzék Bevezetés 1. A könyvtárak szerepe kulturális kincseink digitalizálásban 1.1. Digitalizálási projektek a világban
3 4 4
1.2. Magyarországi digitalizálási kezdeményezések, projektek
8
2. A Békés Megyei Könyvtár digitalizálási projektjei
9
2.1. A pályázat megírása
11
2.2. A pályázat megvalósítása
13
2.2.1. Előkészületek
13
2.2.2. A digitalizáló műhely kialakítása
14
2.2.2.1. Szerverek beszerzése
14
2.2.2.2. Munkaállomások beszerzése
16
2.2.2.3. Szkennerek beszerzése
18
2.2.2.4. A műhely elhelyezése a könyvtár épületében
20
2.2.3. Digitalizálás
22
2.2.3.1. A dokumentumok digitális formátumának létrehozása
22
2.2.3.1.1. A kötetek digitális formátumának létrehozása
24
2.2.3.1.2. Mikrofilmen lévő dokumentumok digitális formátumának létrehozása
25
2.2.3.2. A dokumentum digitális formátumának feldolgozása
26
2.2.3.2.1. A Haan kötetek szöveges formátumának létrehozása
26
2.2.3.2.2. A Békésmegyei Közlöny szöveges formátumának létrehozása
30
2.2.3.2.3. A dokumentumok publikálásra kerülő kép formátumainak létrehozása
32
2.2.3.3. A digitalizált dokumentumok közzététele
33
2.2.3.4. Fejlesztési lehetőségeink, terveink
47
3. Összegzés Irodalomjegyzék Függelék A Békés Megyei Könyvtár 2003-2007. évi digitalizálási koncepciója (2003) Bevezetés
49 50 53 53 53
1
Előzmények
53
Békés Megyei Könyvtár digitalizálási koncepciója
54
A Békésmegyei Közlöny 3 oldala
58
Website tervezés és megvalósítás lépései (általánosságban)
61
A website alkotóelemeinek listája
61
A website tervezésének lépései
62
Téma átgondolása
62
Megvalósítás
63
Fogalmak
64
JaDoX editor használati útmutatója
65
Bejelentkezés
65
Dokumentum
65
Módosítás
65
Fájl
65
Megnyitás
65
Mentés
66
Kilépés
66
Nézet
66
2
BEVEZETÉS
BEVEZETÉS A szakdolgozati téma választása számomra nem okozott gondot, magától adódott, hogy arról írjak, amin dolgozom, amiben részt veszek. Munkahelyem, a Békés Megyei Könyvtár 2003-ban benyújtott egy digitalizálási pályázatot, melyet meg is nyert. Abba a szerencsés helyzetbe kerültem, hogy ennek a projektnek a megszületésében, megvalósításában bábáskodhattam. Egy ilyen projekt megvalósítása komoly csapatmunkát igényel. A munka során különféle tapasztalatokra, új ismeretekre tettem szert. Úgy gondolom ezeknek a tapasztalatoknak, ismereteknek, a munka során elért sikereknek és elkövetett hibáknak a leírása egy szakdolgozat keretében elsősorban önmagam számára hasznos, hiszen a dolgozat megírása az egész projekt megvalósításának átgondolására késztet. Így könnyebben vonhatom le a tanulságokat, s egyben megoldódik a szakdolgozati téma kérdése is. A dolgozat az én szemszögemből íródott, a saját és munkatársaim tapasztalatait, a munkám és a tanulás során megszerzett ismereteimet jegyeztem le. A teljességre és tárgyilagosságra való törekvésem tehát csak viszonylagos lehet. Talán dolgozatom segítséget nyújthat néhány kíváncsi, érdeklődő embernek is alapvető digitalizálási ismereteik megszerzéséhez, vagy bővítéséhez. A megvalósított projekt munkahelyem történetében jelentős mérföldkőnek számít. Így ez a dolgozat, könyvtárunk történetét (egy lehetséges, jövőbeni) összefoglaló munka egyik forrásául is szolgálhat. Köszönetnyilvánítás Ezúton szeretnék köszönetet mondani konzulensemnek, Dr. Pajor Enikőnek a dolgozat megírásához nyújtott hasznos tanácsaiért, támogatásáért, töretlen bizalmáért. Továbbá köszönettel tartozom a projekt vezetőjének Toldi Klárának és a digitalizálásban, a projekt megvalósításában résztvevő valamennyi munkatársamnak, hogy készséggel megosztották velem tapasztalataikat, valamint az iKron Kft valamennyi munkatársának, (akikkel élmény volt együtt dolgozni) de legfőképpen Kármán Lászlónak és Sóti Róbertnek, akik nagymértékben hozzájárultak ismereteim gyarapításához és a dolgozat megírásához szükséges szakmai információk pontosításához. Utoljára, de nem utolsó sorban férjemnek és gyermekeimnek támogatásukért, belém vetett hitükért.
3
A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN
1. A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSBAN A XIX-XX. század technikai fejlődése magával hozta a számítástechnika létrejöttét és rohamos
fejlődését.
Az
informatika
fejlődése
szorosan
kapcsolódik
ennek
a
tudományterületnek, iparágnak a fejlődéséhez, hisz a számítástechnikai, modern távközlési eszközöknek köszönhetően az információs folyamatok földrajzi határai kitágultak. Az információ átadásának, megszerzésének ideje ugrásszerűen lecsökkent. A könyvtárak szerepe nem változott, csupán az információ hordozó eszközök száma gyarapodott. Valamennyi információ hordozó eszköznek meg van a maga előnye és hátránya, még a legkorszerűbbeknek is. A könyvtáros feladata többek között ezen eszközök előnyeinek lehető legnagyobb mértékű felhasználása - hátrányainak figyelembe vételével - tevékenysége során. A könyvtáros munkája az új technikai eszköznek köszönhetően egyrészt könnyebbé vált, másrészt a könyvtárosnak újabb kihívásokkal, problémákkal kell megbirkóznia. Napjainkban a különféle dokumentumok létrehozásakor egyre nagyobb mértékben kap szerepet a digitális technika. Az így létrejött digitális dokumentumok tárolása, megőrzése, hozzáférhetővé tétele szintén a könyvtárak feladata. Az utóbbi 1-2 évtized új technikai eszközeinek segítségével lehetővé vált a régi, rossz állapotban lévő, illetve a ritkaságnak számító dokumentumok digitalizálása. A digitalizálás (digitization) a számítástechnikai szemszögből analóg adatok átalakítását jelenti
digitális
gyakorlatában dokumentumok
adatokká. ez
az
Az
informatika
eredetileg
konvertálást,
nem
vagyis
a
jelenlegi
fogalomrendszerében
számítástechnikai számítógépes
eszközökkel
tárolásra,
és
készült
feldolgozásra,
visszakeresésre alkalmas digitális formátumának létrehozását jelenti.
1.1. Digitalizálási projektek a világban A XX. század utolsó évtizedeiben szerte a világon számtalan digitalizálási projekt indult el például a Gallica projekt, a Gutenberg projekt, amely az emberi kultúra írott műveinek megőrzését tűzte ki célul. Kialakultak a digitális könyvtárak szinonim néven az elektronikus könyvtárak. Az egyedi kezdeményezéseket követően a digitalizálással foglalkozó intézmények, szakemberek viszonylag hamar rájöttek az összefogás, a közös módszerek, a szabványok kialakításának szükségességére. Az egyik ilyen sikeres 4
A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN
kezdeményezés a sok közül a DLF. Az Egyesült Államokban a Digitális Könyvtári Szövetség megalakulása az 1995. május 1-jén az USA tizennégy legnagyobb kutatói könyvtárának és két másik szervezet vezetői által aláírt egyezménnyel kezdődött. Az aláírók a Digitális Könyvtári Szövetség (Digital Library Fedaration = DLF) létrehozásában állapodtak meg. A DLF hivatalosan 1996-ban alakult meg. Célja, a nemzeten belüli és azon kívüli, Amerika örökségét és kultúráját dokumentáló digitális anyagok összegyűjtése, hozzáférhetővé tétele a hallgatók, az oktatók és a polgárok számára. A szövetség saját website-ja (www.diglib.org) bárki számára hozzáférhető. A szövetség tevékenysége sokrétű (elektronikus folyóirat-archiváló program, tanulmányok kiadása, szabványok és irányelvek kidolgozása, LIBLICENSE modell létrehozása az elektronikus hozzáféréshez, a Nyílt Archívum Kezdeményezése stb.). A DLF azért sikeres, mert a könyvtárosok készek közös erőfeszítéssel, szakértelemmel, elhivatottsággal jobbá tenni nemcsak saját intézményüket, hanem az egész könyvtári digitális világot. A
Bibliotheca
Universalis
ötlete
a
művészetpártolásáról,
könyvszeretetéről
és
műveltségéről híres Francois Mitterand volt francia kormányfőtől származik. 1994. júliusában a G7-ek országainak nápolyi csúcstalálkozójának egyik kiemelt témája a világméretű információs társadalom fejlesztésének támogatása volt. 1995. február 25–26án Brüsszelben rendezett miniszteri konferencián megszülettek a támogatást érdemlő nemzetközi együttműködési projektek, a részvevők meghatározták a megoldandó feladatokat. 11 konkrét kísérleti program született meg, közöttük az egyetemes világkönyvtár, a Bibliotheca Universalis életre hívása, melynek felelőse Franciaország és Japán lett. A Bibliotheca Universalis program legfontosabb célja a világ tudományos és kulturális örökségének hozzáférhetővé tétele közös multimédiás technológiák által. „A világ digitalizálási programjait egyetlen nagy, osztott virtuális ismeretgyűjteménybe, könyvtárba kívánják szervezni...”1 IFLA 1997 szeptemberében Koppenhágában megrendezett Bibliotheca Universalis konferenciáján született döntés a digitalizációs programok információcseréjéről, az európai nemzeti könyvtárak webszerverén, a GABRIEL-en való Bibliotheca Universalis honlap elkészítéséről,
a
virtuális
világkönyvtár
tartalmának
közös
feltöltéséről
olyan
témakörökkel, amelyek minden tagországot egyformán érdekelnek, érintenek.
1
Pajor Enikő: Conrad Gesnertől a virtuális Bibliotheca Universalisig In: Könyvtári Figyelő [online] 48. évf. 2002. 4. szám [2004.12.11.]
5
A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN
„A program eddig elkészült részei 2002 augusztusától országonkénti csoportosításban, látványos virtuális történelmi séták, irodalmi alkotások kíséretében már várják a látogatóikat a világhálón”2, a http://www.bl.uk/gabriel/bibliotheca-universalis URL címen. A másik hasonlóan sikeres kezdeményezés a MINERVA3 projekt. „Az együttműködésnek tagjai az Európai Uniós országok vonatkozó minisztériumai vagy egyéb központi állami intézményei. Célja, hogy elősegítse a közös gondolkodás és módszerek létrejöttét az európai kulturális értékek digitalizálásában. A projekt célja az európai kulturális örökség egyedül álló értékének megőrzése, és annak a stratégiai szerepnek a felismerése, amelyet betölthet a növekvő európai digitális „tartalomiparban”. Fontosnak tartja, és nagyra értékeli a nemzeti kormányok és kulturális szervezetek erőfeszítéseit, amelyek a digitalizálási munkákban való együttműködés minél magasabb szintű megvalósítására irányulnak.”4 A projekt jelentősége abban áll, hogy összefogja és koordinálja a különböző országok digitális projektjeit. A MINERVA project előzménye a 2001 áprilisában Lundban, az európai országok képviselőinek a soros svéd elnökség és az Európai Bizottság égisze alatt megtartott találkozó volt, ahol a résztvevők elkötelezték magukat amellett, hogy őrködni fognak a Lundi alapelvek eszméje felett a kulturális és tudományos tartalom digitalizálása során. Erre a célra létrehozták az országos főhatóságok képviselőinek állandó csoportját (OKCS), továbbá
kialakították
a
digitalizálási
koncepciók
és
programok
koordinációs
mechanizmusainak megvalósítási keretét, a Lundi akciótervet. A Minerva projekt 2002 márciusában az Európai Bizottság támogatásával indult el az Olasz Kulturális Örökség és Tevékenységek Minisztériuma koordinálásával. A projekt a Lundi akcióterv megvalósításának operatív kereteit adja. A projektet az OKCS titkársága működteti. A Pármai charta azoknak a feltételeknek és cikkelyeknek az összessége, melyekben 2003. november 19-én állapodott meg Pármában az Európai Unió országos kulturális főhatóságai által kinevezett országos képviselők csoportja.
2
Pajor i.m.
3
Ministerial Network for Valorising Activities in Digitisation
4
Sikeres digitalizálás lépésről lépésre In: Magyar Elektronikus Könyvtár [online] Bp. : OSZK, 1995. [2005.01.22.]
6
A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN
A tagállamoknak az a felismerése, hogy a rendkívül gazdag európai kulturális és tudományos örökség védelmére és értékének megőrzésére nagy figyelmet kell fordítani, meghatározta a kulturális és tudományos örökséggel kapcsolatos kezdeményezésekre vonatkozó politikáját. Ebben a politikában megmutatkozik az információs társadalom beköszöntének és az új információs és kommunikációs technológiák elterjedésének hatása. A tagállamok fontosnak tartják, hogy Európa közös kulturális örökségének védelméről, és értékeinek megőrzéséről gondoskodjanak, fenntartsák a sokszínűséget, a polgárok számára biztosítsák az ehhez az örökséghez való jobb hozzáférést, fellendítsék az oktatást és idegenforgalmat, és részt vegyenek az új, a digitális tartalommal és a digitális szolgáltatással foglalkozó iparágak fejlesztésében. Ezen célok eléréséhez szükséges, a chartában megfogalmazott feltételek lényege: •
erőteljes igény a koncepcionális és intézményi stratégiák létrehozására és összehangolására;
•
irányelvek és a bevált gyakorlatból vett példák szükségessége a digitalizálási kezdeményezések költséghatékonyságának és minőségének javítása érdekében;
•
a közös működtetést támogató szabványok alkalmazása, ezáltal a hozzáférés javítása a digitális erőforrásokhoz;
•
központ létrehozása a kulturális tartalom országos digitalizálási koncepcióinak európai szintű koordinálására;
•
tapasztalatok megosztása a tagállamok között, a további együttműködésen alapuló fejlesztések, problémamegoldások és kutatási teendők meghatározásának céljából.
A Pármai charta cikkelyei: 1. Az új technológiák intelligens felhasználása 2. Hozzáférhetőség 3. Minőség 4. A szellemi tulajdonjog és a személyes adatok védelme 5. Közös működtetés (interoperabilitás) és szabványok 6. Nyilvántartások és többnyelvűség 7. Benchmarking 7
A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN
8. Országos, európai és nemzetközi együttműködés 9. Bővítés 10. A jövő közös építése: a tudástársadalom élvonalában A 2004 elején beindult Minerva Plus projekt, a Minerva az újonnan csatlakozott országokkal, valamint Olaszországgal és Izraellel 2003 áprilisában benyújtott nyertes pályázata. A projekt célja a Minerva-hálózat kibővítése.
1.2. Magyarországi digitalizálási kezdeményezések, projektek A szegedi egyetemi könyvtár Magyarországon „úttörőként” a 90-es évek első felében az interneten is megjelentette az első magyar nyelvű digitalizált műveket. 1994 tavaszán Drótos László, Kokas Károly és Moldován István a munkáját ajánlotta fel annak érdekében, hogy megalapítsa a Magyar Elektronikus Könyvtárat (a MEK-et). A kulturális kormányzat már az 1997-ben hatályba lépett kulturális törvényben előírta a Neumann János Digitális Könyvtár és Multimédia Központ létrehozását. Az új intézmény küldetése az volt, hogy az audiovizuális dokumentumok nemzeti gyűjtő- és szolgáltató helyévé váljon. 1998 tavaszán a kultuszminiszter megalapította a Digitális Irodalmi Akadémiát (DIA), azzal a mecanatúrai szándékkal, hogy az összes Kossuth-díjjal és babérkoszorúval kitüntetett író és költő teljes életművét fel kell dolgozni és ingyenesen közzé kell tenni az interneten. A Bibliotheca Hungarica Internetiana (BHI) gyűjteményben azok a klasszikus magyar szépirodalmi művek találhatók, amelyeket a Magyar Tudományos Akadémia Textológiai Bizottsága, illetve az Eötvös Loránd Tudományegyetem szakértői javasoltak hálózati közzétételre. Az országos kezdeményezések mellett számos megyei és városi intézmény is folytat digitalizálási tevékenységet (Szolnokon, Hódmezővásárhelyen, Szentendrén stb.)
8
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
2. A Békés Megyei Könyvtár digitalizálási projektjei A Békés Megyei Könyvtár 2002-ben a NKÖM5 digitalizálási pályázat támogatásával kezdte meg digitalizálási tevékenységét. A pályázat révén kapott támogatás csak arra volt elegendő, hogy a könyvtár elkészítesse az OSZK Mikrofilmtárával a Békés c. megyei folyóirat 32 évfolyamának elektronikus változatát, melyet a Mikrofilmtár PDF formátumban nyújtott át a könyvtár részére. Ezzel csak a folyóirat archiválása történt meg, a dokumentum szöveges visszakeresésének biztosítása nélkül. Az IHM6 2003-ban hirdette meg IHM-ITP-8-as kódszámon a „24. óra – Kulturális kincseink digitalizálása” című pályázatát, melyhez a pályázó intézménynek csatolnia kellett digitalizálási koncepcióját. A Békés Megyei Könyvtár ekkor fogalmazta meg és fektette írásba digitalizálási koncepcióját7. A könyvtár koncepciójában az alábbi célokat határozta meg: •
a nemzeti kulturális örökség részét képező helytörténeti és kulturális értékek archiválása,
•
a digitalizált dokumentumok és azok tartalmának visszakereshetősége,
•
új szolgáltatási módszer létrehozása,
•
az
interneten
jó
minőségben
megjelenített
dokumentumok,
információk
hozzáférésének biztosítása a felhasználók számára. A koncepció négy területet határoz meg a dokumentumok tartalmi és formai sajátosságai alapján: •
helyismereti monográfiák: •
Karácsonyi János: Békésvármegye története. Gyula, 1896. (2003-ban folyamatban levő digitalizálás)
•
Haan Lajos: Békés vármegye hajdana. Békéscsaba, 1870.
•
Oláh György: Békésvármegye, 1848-1849. Gyula, 1889-1892.
5
Nemzeti Kulturális Örökség Minisztériuma
6
Igazságügyi és Hírközlési Minisztérium
7
A Békés Megyei Könyvtár koncepciója teljes terjedelemben a függelékben található
9
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
•
helyismereti időszaki kiadványok •
Békés c. társadalmi, politikai hetilap 1904-1910. évfolyamai
•
A Békésvármegyei Régészeti és Művelődéstörténelmi Társulat évkönyvei, 1874-1893.
• •
•
Nemzeti Kultúra pedagógiai folyóirat 1911-1914. évfolyamai
mikrofilmek •
Békésmegyei Közlöny társadalmi hetilap 1874-1914. évfolyamai
•
Csaba és Vidéke városi hetilap 1883-1884. évfolyamai
•
Békéscsaba és Vidéke városi hetilap 1909-1913. évfolyamai
értékes, kuriózumnak számító művek •
Márki Sándor: A Fekete-Körös és vidéke. 1877.
•
Tessedik Sámuel önéletírása. 1873.
•
Békés megye sajtóbibliográfiája, 1855-1973. 1974.
•
Zsilinszky Mihály: Árvízveszély és vízszabályozás Békésmegyében. 1880.
•
Haan Lajos: Békés megye hajdana. Kézirat. 1862.
•
Karácsonyi János: A magyar nemzetségek a XIV. század közepéig. 1900.
•
Karácsonyi János: Magyarország egyháztörténete. 1906.
A felsorolt dokumentumok digitalizálását helytörténeti vonatkozásain kívül keresettségük, körülményes hozzáférésük vagy kevés, illetve egyedi példányszámuk indokolja. Jellemzően szerzői jog hatálya alá már nem eső művek kerültek be a koncepcióba. A könyvtár a digitalizálási koncepciójában célul tűzte ki egy digitalizáló műhely létrehozását, s törekvését, arra hogy az eredeti dokumentummal megegyező minőségi elektronikus dokumentumokat hozzon létre és azokat a szerzői jogok figyelembe vételével az interneten vagy az intraneten elérhetővé tegye. Az IHM-ITP-8-as kódszámú pályázaton elnyerhető vissza nem térítendő támogatás összeg maximuma 10 millió forint volt, melyhez a pályázónak a támogatás összegének legalább 10%-át kitevő önrészt kellett biztosítania. A könyvtár a maximális támogatási összegre nyújtotta be pályázatát. A pályázat eredményhirdetésére 2003 őszén került sor. A Békés 10
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
Megyei Könyvtár által elnyert támogatási összeg 6,6 millió volt. A támogató által 2003. december 12-én aláírt pályázati szerződést azonban csak 2004. januárjában postázták a könyvtár részére. Így az ÁFA törvény változása miatt az eredetileg nettó 10 millió forint helyett 6,6 millió forint bruttó összegű támogatás állt a könyvtár részére. A pályázatban vállalt feladatok megvalósításának határideje a szerződés szerint a szerződés aláírásától számított 6 hónap, vagyis 2004. június 12. A pályázat végső célja a Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása és annak a pályázat során létrehozott digitalizált dokumentumokkal való feltöltése volt.
2.1. A pályázat megírása A pályázat a szokásosnál jóval nagyobb körültekintést, tájékozódást igényelt mivel a könyvtár munkatársai e területen még nem rendelkeztek tapasztalatokkal. Első körben olyan könyvtárak, intézmények megkeresésére került sor, melyekről köztudott volt, hogy e területen már jócskán rendelkeznek tapasztalatokkal. A legkészségesebbnek a Debreceni Egyetemi Könyvtár és Németh László Városi Könyvtár (Hódmezővásárhely) bizonyult. A két intézménynél tett látogatás és azt ott szerzett tapasztalatok egyaránt hatással voltak a pályázat megírására és annak későbbi megvalósításra. Az egyetemi könyvtár nem törekedett a digitalizált dokumentumok teljes szövegű feldolgozására, az NLVK8 viszont igen. A tapasztalatcserék során kipróbálásra kerültek különböző gyártmányú, típusú szkennerek is. Néhány oldalnyi anyag digitalizálásának és feldolgozásának megtekintése, nyomon követése átláthatóbbá tette számunkra a munkafolyamatokat, a munka nagyságát, s megtervezhetőbbé a munka elvégzéséhez szükséges időt. A kötegelt szkennelési módszerrel az egyetemi könyvtárban ismerkedtünk meg (erről a módszerről még a későbbiekben lesz szó, mivel a pályázat megvalósításánál jól tudtuk alkalmazni). Az iKron Kft által kifejlesztett JaDoX XML szerkesztőről és szerverről az NLVK-ban hallottunk. A szerkesztő működését Szepesi Judit (a könyvtár digitalizálással foglalkozó könyvtárosa) be is mutatta. Dr. Ambrus Zoltán, a könyvtár igazgatója a projekt felelősének Toldi Klára feldolgozási osztályvezetőt jelölte ki. A pályázat megírásában az én feladatom a pályázat megvalósításához szükséges számítástechnikai eszközökre, szoftverekre, a megvalósítás
8
Németh László Városi Könyvtár (Hódmezővásárhely)
11
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
során alkalmazandó fájltípusok, szabványok alkalmazására történő javaslat előterjesztése, az árajánlatok bekérése, majd a jóváhagyást követően mindezek írásban történő megfogalmazása volt. A pályázat keretében az alábbi – a digitalizálási koncepcióban szereplő – dokumentumok digitalizálását vállalta a könyvtár: •
A megyei történelmi információk egyik kiemelkedő jelentőségű kézikönyve az 1870-ben Pesten kiadott Haan Lajos monográfiája, Békés vármegye hajdana címmel, két kötetben, 636 oldalon jelent meg. A hiteles történelmi okmányokon alapuló mű első kötete a vármegye általános története mellett a megyei települések létrejöttét, fejlődését, esetleg megszűnését mutatja be. A második kötet a szerzőnek a monográfia megírásához felhasznált hiteles okmányait ismerteti. A gyakran forgatott, egyébként már átkötött könyv védelmét kívántunk megoldani a digitalizálással. A helyismereti információk nagyon fontos elemei a történelmi adatok,
információk.
Az
első,
eredeti
kiadású,
történelmi
monográfia
digitalizálásával a helyismereti általános és magasabb szintű (kutatói) igények kielégítését tűztük ki célul. A második kötetben lévő források többsége 1067-1808 között keletkeztek latin nyelvű dokumentum. Az akkor használt latin nyelv is fejlődésen, változáson ment keresztül, mely az okmányokban jól nyomon követhető. •
A Békésmegyei Közlöny című társadalmi, ismeretterjesztő, gazdasági hetilap 18741939 között jelent meg Békéscsabán. Ebben az időben Gyulán is jelent meg megyei lap, de a közlemények, cikkek eltérőek, így mindkettő a helytörténeti kutatás fontos forrása. Állományunkban mikrofilmen a folyóirat egésze, nyomtatott formában hiányosan található meg (több évfolyam is hiányzik). A papíralapú újság lapjai a lapozgatások következtében beszakadoztak, sok helyen bepiszkolódtak. Bizonyos számok olyan mértékben károsodtak, hogy a másolást sem engedélyezzük belőle. A mikrofilm digitalizálásával a hiányzó évfolyamok, számok elérhetőségét akartuk biztosítani, lehetővé téve a kívánt anyag nyomtatását is, s így az újság mentesül az igénybevételtől. A projekt keretén belül az első három évfolyam digitalizálását vállaltuk.
A feltárást és digitalizálást indokolja, hogy a megye több településének könyvtárában nincs meg ez a monográfia. A folyóirat esetében a Békés Megyei Könyvtáron kívül csak az
12
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
OSZK9 rendelkezik a folyóirat példányaival, így a helyi, regionális érdeklődők számára kizárólag a könyvtárunkban nyílik lehetőség a kutatómunkára.
2.2. A pályázat megvalósítása A pályázat megvalósítását egyaránt nehezítette a lekurtított összeg, a késedelmes postázás miatt lecsökkent határidő és a digitalizálásban való járatlanság. 2.2.1. Előkészületek A megvalósításhoz szükséges legelső lépés a könyvtár munkatársainak képzése volt a digitalizálás és az elektronikus könyvtárak kialakításának témakörében. Ilyen képzéseket a könyvtárosok számára az INKA10 szervez. 2003 novemberében-decemberében szervezett tanfolyamokon könyvtárunk 3 dolgozója vett részt (Toldi Klára, Benyó Barbara és jómagam). A képzések nagyon hasznosak voltak, de az előttünk álló munkához nem elegendőek. A képzéseket nagyrészt általános és elméleti jellegű ismeretátadás / ismeretszerzés jellemezte. Az itt megszerzett ismeretek nélkül azonban nehezebben, lassabban birkóztunk volna meg a ránk váró feladattal. A pályázat eredményének kihirdetése (2003. szeptember) és az aláírt szerződés postázása (2004. január) között több hónap telt el. Az eszközök beszerzését az intézmény csak az aláírt szerződés birtokában kezdheti meg, hiszen csak ekkor realizálódik az anyagi fedezet. Ez alatt az idő alatt csak tájékozódni lehet, hogy hol, milyen áron szerezhetők be a szükséges eszközök. A konkrét árajánlatkérésekre, megrendelésekre csak az aláírt szerződés kézhezvétele után került sor.
9
Országos Széchényi Könyvtár
10
Informatika a Nemzetvédelmi Képzésben Alapítvány
13
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
2.2.2. A digitalizáló műhely kialakítása Az anyagi nehézségek ellenére a könyvtár ragaszkodott a digitalizáló műhely létrehozásához, mivel csak a munka elvégzéséhez szükséges eszközök megléte biztosíthatja azt a folyamatos digitalizáló tevékenységet, melyet a könyvtár a koncepciójában célul tűzött ki. Az OSZK az eszköz beszerzések megkezdésekor még nem tudott pontos tájékoztatást adni arról, hogy mikorra készül el az eleMEK11 moduláris könyvtári rendszer elektronikus dokumentumgyűjteményekhez. Ez a tény, a tapasztalatok hiánya és a rövid határidő indokolta azt, hogy az iKron Kft szakértőit vontuk be a projektbe. A választás nem véletlenül esett rájuk. A hódmezővásárhelyi városi könyvtárban tett tapasztalatcsere alkalmával jó referenciát kaptunk róluk. 2.2.2.1. Szerverek beszerzése Az interneten történő publikáláshoz szükségünk volt egy, a célnak megfelelő webszerverre is. Egy IBM xSeries205 (Pentium4 2.8 GHz FSB 512 Kbyte cache, 1 GB ECC DDR RAM, 2X36 GB SCSI12 HDD) webszerver és egy megvétele mellett döntöttünk. Ez a hosszú távú céljainkat ugyan nem fogja kielégíteni, de mivel kevesebb támogatást nyertünk a pályázaton, mint amennyire szükségünk lett volna, így be kellett érnünk ezzel a konfigurációval. A szerverre a Linux operációs rendszer (Debian disztribúció) került telepítésre. A digitalizált anyag publikálását az iKron Kft-től vásárolt JaDoX dokumentumkezelő rendszerrel, a lekérdezést, a teljes szövegű visszakeresést a Monguz szerverrel kívántuk megoldani. A webszerver üzemeltetésénél a szerver gép sebessége mellett az internet kapcsolat sávszélessége a másik meghatározó tényező. A Békés Megyei Könyvtár a HBONE egyik végpontjaként 34 Mbps sávszélességgel rendelkezik, amely megfelelő sávszélességet biztosít egy webszerver üzemeltetéséhez.
11
Moduláris könyvtári rendszer elektronikus dokumentumgyűjteményekhez részletes információ található a következő URL címen:
12
SCSI (Small Computer System Interface = kisméretű számítógéprendszerek interfésze) A SCSI csatlakozások gyors és megbízható adatátvitelt tesznek lehetővé. SCSI interfész esetén több perifériát és kiszolgáló adaptereszközt is csatlakoztathatunk egyetlen PC porthoz.
14
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
HBONE, a NIIF IP gerinchálózata13
A beszkennelt dokumentumokat tömörítetlen TIFF formátumban kívántuk lementeni és archiválni. Ehhez azonban egy nagy teljesítményű, nagy merevlemez kapacitással rendelkező fájlszerverre volt szükségünk. A hosszabb távú terveinkhez és a fejleszthetőség miatt erre a célra egy nagy teljesítményű, nagy kapacitású eszközt lett volna célszerű beszerezni (pl. Apple Xserve Raid). A szűkös anyagi keretek miatt erről az elképzelésről le kellett mondanunk. Egy IBM xSeries205 (Pentium4 2.66 GHz FSB 512 Kbyte cache, 1 GB ECC DDR RAM, 4X250 GB SATA HDD) fájlszerver beszerzése mellett döntöttünk. A szerverre is a Linux operációs rendszer Debian disztribúcióját telepítettük. A szervereken tárolt állományok mentése az egyik legfontosabb teendő, melyet célszerű egy archiváló szerverrel, vagy a szerverekbe épített szalagos archiváló eszközzel megoldani. A rendelkezésünkre álló összegből ezt nem tudtuk megvalósítani. Az adatbiztonságot jobb híján a winchesterek tükrözése (RAID114) és egy másik gép winchesterére illetve egyes anyagok rendszeres időközönként DVD lemezre történő mentése jelenti. Ez korántsem nevezhető ideális megoldásnak.
13
Nemzeti Információs Infrastruktúra Fejlesztési Program [online] BP. : Nemzeti Információs Infrastruktúra Fejlesztési Iroda, 2001. [2005.03.15.] <program http://www.iif.hu/images/MagyarorszagHBONE-FI-IIInagy.gif 2001>
14
Redundant Array of Independent Disks RAID1 a lemez tükrözése, vagyis az adatokat egyszerre két lemezre visszük fel, s ha az egyiken hiba támad, akkor a másikról még elérhetjük az adatokat. Ez egyszerű módszer, de a hasznos kapacitás csak fele a lemezek összkapacitásának.
15
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
JaDoX szerver A JaDoX rendszer nyílt szabványokon alapuló, platform-független dokumentumkezelő rendszer. A szerver programra az adatkezelési is tárolási munkákhoz szükséges. Monguz, JaDoX plugin-nal A Monguz egy nyílt szabványokon alapuló platform-független keretrendszer amely távoli információforrások közös felületen való lekérdezésére szolgál. 2.2.2.2. Munkaállomások beszerzése A munka elvégzéséhez nem csak jó szerverekre, hanem jó munkaállomásokra is szükség volt. Erre a célra 4 munkaállomást vásároltunk (ASUS A7N8X Deluxe alaplap, AMD XP 2500+ processzor, 512 Mbyte DDR RAM, 80 GB HDD, 17” Samsung Magicbright monitor). Ezek közül kettőbe került DVD író az archiválások elvégzésére. A munkaállomásokhoz a Windows XP Home operációs rendszert vásárolta meg a könyvtár. A feladatok elvégzéséhez Microsoft Office 2003 Basic irodai csomagot, FineReader karakterfelismerő, Paint Shop Pro képszerkesztő, Adobe Acrobat programokat vásároltuk meg. Microsoft Office 2003 Basic irodai csomag A legelterjettebb és legismertebb irodai alkalmazás. Az irodai, szövegszerkesztési munkákhoz szükséges eszköz. E miatt a digitalizáló műhelyben is ugyanolyan szükséges, alapvető szoftvernek számít, mint a Windows operációs rendszer. FineReader legújabb (magyar) 7.0-ás verziója Az IPA technológiának köszönhetően a FineReader egyedülálló felismerési pontossággal rendelkezik a karakterfelismerő programok között. Bár hasonló jellegű szoftverből sok van, a tesztek alapján, a FineReader minden konkurensét megelőzi, beleértve a Magyarországon elterjedt Recognitát is. Nem csak a felismerés minőségében nyújt kimagasló teljesítményt, de formátum megtartásban is. Az új intelligens háttér kiszűrési eljárás segítségével, amely eltávolítja a zavaró háttér színeket és más zavaró tényezőket, a felismerés pontossága most még azoknál a dokumentumoknál is jelentősen megnő, amelyek hagyományosan mindig is nagy kihívást jelentenek az OCR programoknak. A Corporate Edition kiadása a hálózatos munkamegosztást (a kötegelt feldolgozást) is lehetővé teszi. Akárhány gépre telepíthető, de egyidőben csak két gépen használható. 16
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A FineReader előnyei: •
Közvetlen mentés HTML, PDF, Winword, RTF, TXT, Excel, CSV, DBF, XML formátumokba;
•
Könyvnél
az
oldalak
automatikus
szétválasztása
(nem
kell
oldalanként
szkennelni!); •
Háttérszűrési technológia, a színes hátterű vagy gyűrött anyagok jobb felismerése érdekében;
•
Kötegelt módban, egyszerre többen dolgozhatnak ugyanazon az anyagon. Tehát például az egyik PC csak szkennel, a másiknál a szövegfelismerés történik, a harmadik, pedig az eredményt ellenőrzi, véglegesíti;
•
Multiprocesszoros PC-k támogatása. Még nagyobb feldolgozási sebesség;
•
177 felismerési nyelv között választhatunk;
•
34 nyelvhez (köztük a magyarhoz is) tartalmaz beépített helyesírás ellenőrzőt;
•
Képek és/vagy szöveg nyomtatása közvetlenül a FineReader-ből;
•
Megnövelt grafikus konverzió;
•
Latin, görög és cirill karakterek kezelése;
•
Programozási (Java, Basic, stb.) és mesterséges (pl. Eszperantó) nyelvek felismerése;
•
Kémiai képletek felismerése;
•
ODMA-n keresztüli export támogatása.
Paint Shop Pro 8.0 Képszerkesztő program. Bármely felhasználási területen állandó, kiváló minőséget garantál. Számos képformátumot ismer és kezel (többek között a TIFF és a JPG formátumot is). A programmal nem csak a képhibákat javíthatjuk hatékonyan, de más formátumokba történő konvertálást (pl. TIFF-ből JPG), valamint a képek megfelelő méretre történő igazítását is elvégezhetjük. Beszerzését továbbá az is indokolja, hogy a programmal a kialakítandó internetes felületre a szükséges grafikákat is elkészíthetjük.
17
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
JaDoX szerkesztő A beszkennelt, vagy digitális kamerával lefényképezett dokumentumok szöveg felismerési és korrektúrázási eljárások után szöveges dokumentumként állnak rendelkezésre. A JaDoX szerkesztő grafikus felülete segítségével a szöveges dokumentumokat a TEI15 szabványon alapuló strukturált, XML formátumú szöveggé lehet alakítani. Adobe Acrobat 6 Standard A platform független kommunikáció és a hálózati, internetes adattovábbítás elengedhetetlen eszköze. Az Adobe Acrobat segítségével bármely dokumentum PDF 16
(Portable Document Format) formátumba konvertálható, függetlenül attól, hogy milyen
programban íródott. A PDF fájl platformtól és operációs rendszertől függetlenül megőrzi a dokumentumok eredeti arculatát, így azok bárhol eredeti minőségben tekinthetők meg. A digitalizálási munkák során ez fontos szempont. 2.2.2.3. Szkennerek beszerzése A digitalizálás legfontosabb eszköze. A számítógép szeme a szkenner. Segítségével a számítógép rajzokat és fotókat tud olyan kódokká változtatni, melyeket a képszerkesztő, megjelenítő programok vagy kiadványszerkesztő programok képesek megjeleníteni. A szkennerek kifinomultsága azon a képességen alapul, hogy az analóg feszültségszintek korlátlan sávját digitális szintekké tudja alakítani. A szkennereknek három fő típusát különböztetjük meg: •
kézi lapolvasók
•
síkágyas lapolvasók
•
film szkennerek
A digitalizálandó dokumentumok fajtája eleve meghatározta a feladat elvégzéséhez szükséges szkennerek típusát. A könyvek digitalizálásához síkágyas lapolvasóra, a mikrofilm digitalizálásához viszont a filmszkennerek egyik speciális fajtájára a mikrofilm szkennerre volt szükségünk. Ennek az
15
A Text Encoding Initiative hardver-, szoftver- és alkalmazás-független, bármilyen nyelvű és korú szöveg elektronikus rögzítésére alkalmas nemzetközi szabvány.
16
Portable Document Format (hordozható dokumentumformátum), Acrobat Reader-rel olvasható nyomtatható csereformátum formázott dokumentumokhoz
18
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
eszköznek az ára határozta meg a projekt költségvetését. Az előzetes ár- és termékajánlatok 4-6 milló Ft áron forgalmazott mikrofilm szkennereket tartalmaztak. Mivel ez az ár számunkra megfizethetetlen volt a projekt költségvetéséből, így alaposabban utána kellett néznünk a lehetőségeknek, a termék- és árajánlatoknak. Mivel ilyen illetve hasonló eszközből Magyarországon nem sok létezik, sok utánajárással járt a megfelelő eszköz megtalálása. Hosszas kutakodás után, a megszerzett információk alapján a Cannon MS-300 mikrofilm szkennert találtuk megfelelőnek. Ez felelt meg legjobban anyagi
lehetőségeinknek,
és
alkalmasnak
bizonyult
a
35
mm-es
mikrofilm
feldolgozásához. Ilyen típusú szkennerrel addig még nem találkoztunk. Az országban sem sikerült egy ilyen típusú működő szkennert találnunk, viszont tudomásunkra jutott, hogy a szegedi egyetemi könyvtár szintén egy ilyen szkennert rendelt meg, de az eszköz leszállítására akkor még nem került sor. Az OSZK-ban lehetőséget kaptunk arra, hogy megnézzünk, kipróbáljunk egy MINOLTA mikrofilm szkennert. A Cannon magyarországi képviseleténél sikerült kieszközölnünk egy bemutatót (természetesen várni kellett, rá). A szkennerbe a mikrofilm típusától, a mikrofilmen lévő felvételek méretétől függően kell a megfelelő a lencsét kiválasztani. A bemutatón próba szkennelést végeztünk a saját mikrofilmünkkel. Csak a szkennelés minőségét tudtuk leellenőrizni, mert a feldolgozandó mikrofilmünk típusához, a filmkockáink méretéhez szükséges lencsét a Cannon képviseletének nem sikerült a bemutató idejére beszereznie. A szkennelés minősége a munka elvégzéséhez megfelelő volt, viszont kiderült, hogy a digitalizálandó anyag minősége (a felvételek) a legtöbb helyen rossz minőségűek, ami az elvégzendő munka nehézségét előre vetítette. A Cannon MS-300-as mikrofilm szkenner megvétele mellett döntöttünk. A kiszállításra a megrendeléstől számítva kb. 4-5 hetet kellett várnunk. A könyv digitalizálásához egy kötegelt módban is üzemelni képes szkennerre volt szükségünk. A kötegelt feldolgozással a szkennelésre szánt idő nagymértékben lerövidíthető, a művelet könnyen betanítható, komolyabb számítástechnikai szakértelmet nem igényel. A könyvtár már rendelkezett egy korábbi pályázat keretében beszerzett EPSON GT-1000+ A3-as szkennerel, de az kötegelt feldolgozásra nem alkalmas és meglehetősen lassú. Az A4-es HP ScanJet 4400C szkenner szintén alkalmatlan kötegelt feldolgozásra, ráadásul huzamosabb ideig nem is képes működni (a hardveres szakemberek szerint állítólag ez egy „rossz széria” egyik példánya).
19
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A pályázat költségvetéséből A3-as szkennerre már nem futotta. A probléma szerencsére sikeresen megoldódott, a nemrég (más forrásból, eredetileg jó minőségű és színes fénymásolatok készítéséhez) vásárolt Xerox DocuColor 1632 fénymásolóval, hálózati nyomtatóval és szkennerrel.
Xerox Docucolor 1632 fénymásoló és szkenner17
Sok utánajárással sikerült beszereznünk azokat az eszközöket, amelyek ennek a feladatnak a végrehajtásához elegendőek voltak. (Hosszú távú fejlesztési céljainkhoz nagyobb tudású, nagyobb kapacitású, színvonalasabb eszközökre lett volna szükségünk.) 2.2.2.4. A műhely elhelyezése a könyvtár épületében A Megyei Könyvtár nem rendelkezik üres helyiségekkel, az épület bővítéséről pedig anyagi okok miatt le kellett mondani. Az egyetlen járható út az „átszervezés”, költöztetés volt. A műhely az emeleten, az informatikai osztály melletti iroda helyiségében került kialakításra.
A
digitalizálók
a
munkafolyamatok
során
felmerülő
problémák
megoldásához segítségért, tanácsért, a szomszéd helyiségben dolgozó informatikusokhoz fordulhattak. Három számítógépet, a meglévő A3 szkennert (mely meglehetősen lassú egy korábbi projekt során került beszerzésre) és a Cannon MS 300-as mikrofilm szkennert itt helyeztük el. A negyedik gép a helyszűke miatt átkerült az informatikai osztály irodájába. A fájl- és a webszerver a router18 szobában, a földszinten kapott helyett, mivel ez az egyetlen légkondicionált helyiség. A légkondicionálás (a megfelelő hőmérséklet biztosítása) az eszközök zavartalan működéséhez feltétlenül szükséges.
17
A szerző felvétele 2004.
18
útválasztó; hálózati csomópontok közötti forgalmat irányító, az adatcsomagok útját kiválasztó eszköz
20
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
Digitalizáló műhely19
A két IBM (file és web) szerver a router szobában20
19
A szerző felvétele, 2004.
20
A szerző felvétele, 2005.03.18.
21
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
2.2.3. Digitalizálás A jó szervezési munka alapvető feltétele a projekt sikeres lebonyolításának. Toldi Klára a feldolgozó osztály vezetője, a projekt felelőse és irányítója már az eszközbeszerzések ideje alatt hozzá fogott a munka megszervezéséhez. Kolléganőm végig járta a könyvtár valamennyi osztályát és önként jelentkezőket keresett a munkára. A pályázaton elnyert összeget csak az eszközbeszerzésekre és szakértői díjra lehetett fordítani, tehát a munkát munkaidőben, az intézmény osztályainak kooperációjával, jó szervezéssel kellett megvalósítani. A belső átszervezések miatt a digitalizáló műhelynek lett egy félállású állandó munkatársa (aki gépíró). Annak ellenére, hogy szinte kivétel nélkül minden osztályról többen is részt vettek a projektben, a munka jelentős részét a feldolgozó osztály munkatársai végezték. A digitalizálás során az én feladatom a hardver és szoftver eszközök beüzemelése és használatuk betanítása volt. Természetesen a hibaelhárítás és a segítségnyújtás is a feladataim közé tartozott. A digitalizálás három fő lépése: •
a digitális formátum létrehozása,
•
a kép formátumok feldolgozása (képek konvertálása igény szerinti állomány formátumokba, karakterfelismertetés, a karakterfelismertetés során létrejött szöveges állomány korrektúrája stb.)
•
a feldolgozás eredményeképpen létrejött digitális dokumentumok közzététele.
2.2.3.1. A dokumentumok digitális formátumának létrehozása A szkennerek az általuk letapogatott dokumentumokat képként kezelik. A szkenner eszközvezérlő programjával (driver) végezhetjük el a dokumentum letapogatását vagyis digitális képernyőelemekké alakítását. A képernyőn megjelenített képet a mentéshez a szkenner újra letapogatja, majd az általunk kiválasztott / megadott képformátumban elmenti. A szkenner legfontosabb része - amely a készülék minőségét is meghatározza - az adatok beolvasásáért és konvertálásáért felelős a CCD (Charge Coupled Device; töltéscsatolt áramkör), ami egy olyan elektromos egység, ahol több különálló félvezetőt úgy kapcsolnak össze, hogy az egyik kimenete a következő bemenetét képezi. Ez a töltéskapcsolt eszköz parányi érzékelők, vagy fényérzékeny cellák csoportja. A CCD minőségét általában pont/hüvely (dpi) értékkel jellemzik. Ezen kívül szokták még 22
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
jellemezni a pixel/hüvelyk (ppi), színminta/hüvelyk (spi) értékekkel. A felbontás kifejezés arra szolgál, hogy megmondja, hogy az adott optikai eszköz mennyire képes a képrészletek megragadására. Ez egy univerzális szakkifejezés a képminőség jellemzésére. A szkenner esetében alapvetően kétféle felbontást különböztetünk meg: •
optikai felbontás – kifejezi, hogy a szkenner szenzorai (érzékelői) hüvelyenként (inchenként) hány pixel, pont vagy minta detektálására képesek,
•
interpolált felbontás – szoftverrel növelt felbontás – matematikai algoritmust használ ahhoz, hogy további pixeleket adjon a szkenner által mintavételezett képpontokhoz (nagy képméreteket eredményez).
Digitalizálási munkánk során optikai felbontást alkalmaztunk. A projekt technikai-műszaki követelményeinek megfelelően a beszkennelt anyagot tömörítetlen TIFF formátum mentettük, archiváltuk. Ennek a formátumnak ugyan nagy a helyigénye (ami a nagy tárolókapacitású szerver beszerzését indokolta), viszont nincs információvesztés. „TIFF: a Tag Image File Format-ot (TIFF) az Aldus cég definiálta DTP21-terméke, a Page-maker számára. E formátumot használják főleg a szkenerrel bevitt képek tárolására. A TIFF képformátum lehetővé teszi a képet leíró kiegészítők (tag) hozzáfűzését a képfájlhoz. Így leírható a kép mérete, felbontása, tömörítési módja, stb. A formátumnak azonban van különböző gyártók által specifikált változata is, melyek nem teljesen kompatibilisek egymással. A TIFF formátum tetszés szerinti képméreteket és színmélységet támogat 24 bitig. Az eredetileg kompresszió nélkül tárolt képadatokat nagy méretük miatt LZW (Lempel-Ziv-Welch féle tömörítő algoritmus) eljárással tömörítik.”22 A digitalizálás során nem minden esetben szokták tárolni a képformátumot. Előfordulhat, hogy csupán a szöveges formátumra van szükség. Bizonyos esetekben, helyeken csak képformátumot tárolnak, a teljes szövegű feldolgozás igénye nélkül. Esetünkben, mivel régi anyagokról, a mikrofilm esetén elég rossz minőségű anyagról volt szó mind a képformátum, mind a szöveges formátum létrehozása, tárolása indokolt volt.
21
Desktop Publishing / asztali kiadványszerkesztés
22
Máté István: A multimédia alapjai és feltételrendszere PC környezetben. In.: Magyar Elektronikus Könyvtár [online] Budapest : OSZK, 1995. [2005.03.06.]
23
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
2.2.3.1.1. A kötetek digitális formátumának létrehozása A mikrofilm szkenner szállítására várnunk kellett, ezért először a két kötet digitalizálását kezdtük el. A Haan kötetek igen keresettek a helytörténeti kutatásokat végzők körében. Az elhasználódás következtében újra kellett őket köttetni. A könyvek gerince hagyományos lapolvasóval történő szkennelése alkalmával gyakran sérül. Digitalizálás során egyik lehetőség, hogy lapjaira szedik a könyvet - csak akkor, ha a könyv állapota, vagy példányszáma megengedi -, majd a szkennelést követően újrakötik. Jelen esetben mivel újrakötött példányokról volt szó, ezt nem tartottuk jó megoldásnak. A speciális könyvszkenner alkalmazása az anyagi korlátaink miatt nem jöhetett szóba. Lehetőségként merült fel az oldalak fotózása, de a munkához szükséges tükörreflexes, nagy felbontású digitális fényképezőgéppel nem rendelkeztünk. Beszerzésére nem volt anyagi fedezetünk. A munka elvégzéséhez beüzemeltük a Xerox DocuColor 1632 fénymásoló, hálózati nyomtató, szkenner szkenner szolgáltatását. Az eszközt a 10 BASE-T/100 BASE-T Ethernet interfész és a TCP/IP hálózati protokoll segítségével kötöttük be lokális hálózatunkba. Az eszközhöz egyaránt hozzárendelhető dinamikus vagy statikus IP cím. A szkennelés során a letapogatott kép pontjai egy nagykapacitású beépített háttértárolóra kerülnek, melynek révén lehetővé válik a kötegelt feldolgozást. Az eszköz képes 200, 300, 400, 600 DPI felbontásban, max. A3-as méretű dokumentumok szkennelésére tömörítetlen TIFF, vagy JPG formátumban (a következő beállítható színmélységekkel a kezelőpulton: full color, grayscale, black). A próba szkennelések eredményeképpen úgy döntöttünk, hogy a könyvek oldalait párosával (mivel nem szedtük lapjaira a példányokat), 300 DPI felbontásban, szürkeárnyalatos színmélységben szkenneljük be. Így kb. 4-4, 5 méretű állományokkal kellett számolnunk kétoldalanként. A kötegelt feldolgozásnak köszönhetően a két könyv szkennelésével másfél nap alatt végeztek a kolléganőim, annak ellenére, hogy időnként fénymásolások, vagy nyomtatási munkák miatt meg kellett szakítaniuk a munkájukat. A munka egyszerű volt, hiszen miután kikísérleteztük a megfelelő beállítást, a szkennelés megkezdésekor az eszköz konzolján meg kellett adni a szükséges beállításokat. Ezt követően egyszerűen csak a könyvet kellett a szkenner üveglapjára helyezni, majd a „start” gombot megnyomni, az oldal szkennelését követően, lapozni, és ismét pontosan ráhelyezni a könyvet a szkennerre, s újra megnyomni a „start” gombot. Ez így ment egészen addig, míg valami miatt meg nem szakították a munkafolyamatot, vagy amíg nem végeztek a kötettel. 24
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A szkenner háttértárolóján lévő állományokat a hálózat azon gépéről, melyre feltelepítettük az eszköz eszközkezelő és segédprogramjait, letöltöttük a fájlszerverre a tömörítetlen TIFF állományokat. Az állományok letöltése szintén megoldható volt kötegelt módszerrel. A kötegelt letöltés lényege, hogy nem kell minden egyes állományt külön elnevezni, hanem a program automatikusan végzi el az állomány nevek generálását. A letöltést követően az állományokat CD lemezre archiváltuk, de természetesen 1 példányuk a fájlszerveren maradt a munka folytatásához. 2.2.3.1.2. Mikrofilmen lévő dokumentumok digitális formátumának létrehozása Az 1874-ben indult folyóirat első évéből 48 szám, 1875-ben 101 szám és 1876-ban 105 szám került digitalizálásra. A folyóirat sajnos eredetileg sem teljes, de a meglévőket 2 kivételével hiánytalanul digitalizáltuk 1035 A3 méretű oldal, 3410 cikk terjedelemben. A közel harminc éves mikrofilmet az elmúlt évek folyamán gyakran használták, több mikrofilm leolvasót túlélt. A 35 mm-es mikrofilm már kopottá vált az erős igénybe vételtől, és úgy gondoltuk, a digitalizálással állományvédelmét is megoldjuk. A Haan kötetek feldolgozása már javában folyt, amikor leszállították és beüzemelték a mikrofilm szkennert. A szkenner egy SCSI23 kártyán keresztül csatlakozik a számítógéphez. A próba szkennelések során még inkább bebizonyosodott, hogy a mikrofilmen lévő felvételek minősége rossz. Hosszas kísérletezgetések ellenére se sikerült az OCR program számára megfelelő minőségű képállományokat beolvasni. A különböző beállítások (fényerő, kontraszt, méret, igazítás, felbontás – mivel ez mindig a szkennelendő anyag minőségétől függ, ezt nem részletezem, az eszköz használati útmutatója tartalmazza a beállítási lehetőségeket) kipróbálását és a projekt vezetőjével történt konzultációt követően közösen úgy döntöttünk, hogy a mikrofilmen lévő anyagot 600 DPI felbontásban fogjuk beszkennelni. Ezt a nagy optikai felbontást az indokolta, hogy a rossz minőségű felvételeket A3-as méretben kellett kinyomtatnunk az olvashatóság miatt, hogy a korrektúrázási munkát, illetve a gépelést el tudjuk végezni. Már ekkor látszott, hogy a karakterfelismerő program a rosszminőségű felvételek miatt nem tud jó eredményt produkálni és kénytelenek leszünk gépelni. Néhány esetben azonban még ez a felbontás sem biztosította az olvashatóságot.
23
SCSI (Small Computer System Interface = kisméretű számítógéprendszerek interfésze) A SCSI csatlakozások gyors és megbízható adatátvitelt tesznek lehetővé. SCSI interfész esetén több perifériát és kiszolgáló adaptereszközt is csatlakoztathatunk egyetlen PC porthoz.
25
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A képállományok mentése szintén tömörítetlen TIFF formátumban történt. A 600 DPI felbontás miatt 32-33 Mbyte körüli képmérettel kellett számolnunk. A mikrofilm szkennelése lassabban haladt, mint a könyvé. E miatt a mentés, archiválás itt még fontosabb volt, mint a könyvek esetén.
Mikrofilm szkennelése 24 (számítógép + Cannon MS 300-as mikrofilm szkenner)
2.2.3.2. A dokumentum digitális formátumának feldolgozása A szkenneléssel a digitalizálási munka leglátványosabb és leghaladósabb részén túl voltunk. A szkennelési munka az elvégzendő munkánknak kb. 0,5 %-át tette ki, vagyis a munka java, neheze ezután következett. 2.2.3.2.1. A Haan kötetek szöveges formátumának létrehozása A két kötet digitális formátumának létrehozását követően rögtön hozzáfogtunk feldolgozásukhoz, mivel a mikrofilm szkennert akkor még nem szállították le, a munkával viszont haladni kellett. A következő lépés a szöveges formátum létrehozása volt. A TIFF kiterjesztésű állományokból az optikai karakterfelismerő (OCR = Optical Character Recognition) program segítségével hoztunk létre a szöveges (TXT) formátumot. A munkánk
24
során
alkalmazott
FineReader
A szerző felvétele, 2004.
26
karakterfelismerő
program
számos
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
formátumban képes elmenteni a felismertetett szöveget. Mi a TXT25 formátumot választottuk, mert a további feldolgozáshoz erre volt szükségünk. Korábban
már
dolgoztunk,
a
Recognitával
–
amely
egy
magyar
fejlesztésű
karakterfelismerő program -, de a teszteléseket követően a FineReader megvétele és használata mellett döntöttünk, mert a régi dokumentumoknál egyértelműen jobb eredményt produkált, mint a Recognita. Az OCR programok feladatai: •
szövegek képként való beolvasása a szkenner segítségével;
•
képként rögzített karakterek összehasonlítása a program adatbázisában tárolt karakterformákkal a betűk, írásjelek és egyéb szimbólumok azonosításához;
•
szerkeszthető szövegkimenet létrehozása.
Az első feladatot mi nem az OCR programmal hajtattuk végre. Ennek két oka volt: •
TIFF formátumban archiválni kívántuk a könyv illetve újság oldalakat;
•
a kötegelt szkenneléssel és karakterfelismertetéssel időt takarítottunk meg.
A TIFF állományokat a fájlszerveren helyeztük el kötetenként külön mappában (könyvtárban). Biztonsági okok miatt a mappákat átmásoltuk munkamappákba, amelyekben a tényleges munka folyt. A Haan kötetek esetén egy képállomány két könyv oldalt tartalmazott. Mivel az OCR program hatékonysága nem csak a program tudásától, hanem a képminőségtől is függ, ismét tesztelés következett. Meg kellett nézni, hogy milyen retusálásra van szükség, ahhoz hogy az OCR program minél jobb eredményt produkáljon. Az, hogy éppen milyen módszert kell alkalmazni mindig a beszkennelt kép minőségétől függ. Jelen esetben a karakterfelismertetés szempontjából viszonylag jó minőségű anyag állt a rendelkezésünkre. Pusztán egy kis korrekcióra volt szükség (fényerősséget és kontrasztot állítottunk). Ezt követően a FineReaderrel megnyitottuk a TIFF állományainkat és megkezdtük a karakterfelismertetést, a két oldalt tartalmazó képeket a program korrektül kezelte. A kötegelt feldolgozás alkalmazása miatt ezzel a művelettel is viszonylag gyorsan végeztünk.
25
Csak (ASCII – Amerikai Szabványos Információcsere Kódrendszer - kódban szereplő) megjeleníthető jeleket tartalmazó állomány; formázást leíró kódokat nem foglal magában.
27
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
Egy hosszas megbeszélést követően a szakértők javaslatára az XML-ben történő publikálásnál az oldal illetve a folyóirat esetén a cikkalapú feldolgozás mellett döntöttünk. Ennek előnye az, hogy egy weboldalon áttekinthető mennyiségű információ jelenik meg egyszerre. A felhasználó számára a túl hosszú weboldal riasztó, inkább elrettenti, mint sem vonzza annak elolvasásától. Az oldalak képformátumát hozzá kívántuk rendelni az aktuális, a felhasználó által megjelenített szövegrészhez, cikkhez, könyvoldalhoz. A régi dokumentumok esetén e két megjelenítési lehetőség együttes megléte biztosítja a felhasználó számára a kereshetőséget, a könnyed használhatóságot és a dokumentumhűséget. A feldolgozás módját, mikéntjét ezek a döntések határozták meg. A FineReader-rel felismertetett
kötetek
oldalanként
külön
állományba
kerültek
mentésre
TXT
formátumban. A mentés is kötegelt művelettel történt. Az állományok elnevezése a további feldolgozás szempontjából fontos kérdés volt. Az alábbi elnevezési formátum mellett döntöttünk: bmh_.txt (ahol a bmh a Békésvármegye hajdana címre utal) bmh1_0001.txt (Békés vármegye hajdana 1. kötet 1. oldal) A második kötet karakterfelismertetésénél a könyv kétnyelvűsége dilemmát okozott. A kötet zömében latin nyelvű és kevés magyar nyelvű szöveget tartalmaz, így az OCR programban a latin nyelvet állítottuk be a kötegelt feldolgozásnál. Ennek az lett a következménye, hogy a szöveg kisebb hányadát kitevő magyar nyelvű szövegrészek felismertetése rossz minőségű volt. Ez az oldalak eltérő nyelvű szövegrészenkénti karakterfelismertetéssel ugyan jobb lett volna, de sokkal időigényesebb. Úgy láttuk jobbnak, ha inkább a korrektúrázásra fordítunk valamivel több időt. A korrektúrázás számos olyan problémát hozott elő amivel előre nem számoltunk. Ezekből csak a legfontosabbakat említeném meg: •
a szokásosnál nagyobb betűközök alkalmazása – melyet a szöveg kiemelésére használtak;
•
a többféle névalak;
•
a sajtó és szedéshibák;
•
a monográfia nyelvezete, szövegezése nem következetes. 28
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A szokásosnál nagyobb betűközt a karakterfelismerő program szóköznek érzékelte. Az első
korrektúrázáskor
ezek
nem
kerültek
kijavításra,
mert
a
korrektúrázók
gyakorlatlanságuk miatt nem tartották hibának. Ez azt a veszélyt hordozta magában, hogy ezek a szavak, kifejezések a keresések alkalmával nem jelennek meg a találati oldalon, hiszen
a
szó
1
karaktere
két
szóköz
között
van,
ennek
következtében
a
számítástechnikában külön szónak minősül az ilyen szó, kifejezés minden egyes karaktere. A többféle névalak kérdése, a sajtó- és szedéshibák szintén dilemma elé állítottak bennünket. Szakértők tanácsára a szöveghűség megőrzése mellett maradtunk, ami a publikált anyagban történő kereshetőségi és találati problémák felmerülését vetítette előre. Néhány példa az eredeti dokumentumból:
29
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A latin nyelvű szöveg korrektúrázása a latin nyelv ismeretének hiánya miatt lassabban ment, de mivel nagyobb koncentrációt igényelt, az a munka minőségének javára vált. 2.2.3.2.2. A Békésmegyei Közlöny szöveges formátumának létrehozása A szkennelés folyamán döbbentünk rá igazán, hogy a digitalizálás szempontjából milyen rossz minőségűek a felvételek, némely oldal túl sötét, vagy az a probléma, hogy a következő oldal nyomása, illetve a hirdetések kerete átüt, és emiatt nem, vagy alig lehet kiolvasni a szöveget. Problémát jelentett az is, hogy bekötött folyóiratokról készítették a filmet, nem egyenesek a sorok, néhol a gerincnél a szöveg kiolvashatatlan, de van letépett sarok, ahol nem lehet pótolni a szöveget. Ugyanaz a folyóiratszám, illetve a belső oldal akár kétszer is ismétlődik.
Néhány példa a folyóirat oldalainak minőségére (Az oldalak A4-es méretben a függelékben megtalálhatók)
A munka nagysága és a rövid határidő miatt úgy döntöttünk, hogy a reklám oldalak szöveg formátumú digitalizálást nem oldjuk meg, ezek közzétételét csak képformátumban biztosítjuk. Egyértelműnek látszott, hogy a folyóiratot nem érdemes a karakterfelismertető programmal feldolgoztatni, hisz nagyon rossz eredményt ad. Ennek ellenére megpróbáltuk. Az eredmény minden igyekezetünk ellenére rossz volt. Ilyen esetekben célravezetőbb az oldalakat kinyomtatni (amire a szkennelés során már gondoltunk) és begépelni a szöveget. A gépelés csak a jó gépírótudással rendelkező kolléganőkkel volt hatékony. (Napjaink számítógéppel dolgozó emberének alapvető készségévé kellene, hogy váljon a gépírás. Sajnos ennek a készségnek az elsajátítását a mai napig sem az általános iskolák, sem a középiskolás – kivételt képeznek az ilyen szakirányú képzéssel rendelkezők - tantervébe nem építették be, a felnőtt számítástechnikai alapképzésekről nem is beszélve.) A gyenge 30
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
gépírótudással rendelkező kolléganők szívesebben dolgoztak a rossz minőségű feldolgozott szöveggel. Ezen tapasztalatok birtokában a továbbiakban a jó gépírók a rosszabb minőségű oldalakat gépelték. A kinyomatott példányok legrosszabb részeinél nagyítót, vagy a monitoron magát a nagyított beszkennelt képeket használták, sőt bizonyos esetekben konzultációra is szükség volt, mert a kérdéses szövegrész a felismerhetetlenség határát súrolta, vagy érte el. Egy-egy ilyen kritikus szám kb. nyolc órányi munkaórát igényelt. A gyengébb gépírótudással rendelkező kolléganők a jobb minőségű folyóirat számok korrektúrázását végezték. Az ő esetükben a folyóirat oldalszámától és minőségétől függően ez minimum 8 maximum 16 órát vett igénybe számonként. Az elkészült szöveges dokumentumokat még egyszer átnézték, korrektúrázták a kolléganők.
A korrektúrázás során a korszerű technika mellett időnként a nagyítóra is szükség volt
A korrektúrázás nagyfokú koncentrációt igénylő munka, melyet nem célszerű egyfolytában 8 órán keresztül végezni, mert az a munka minőségének a rovására megy. Éppen ezért ezt a tevékenységet kolléganőim 4 órás váltásban végezték el. A korrektúrázási munkánál, mint minden más egyéb tevékenységnél itt is a hibaszázalék emberenként eltérő. A feldolgozott szöveges formátumok korrektúrázása minimum kétszer indokolt, különben a teljes dokumentumhűséget még meg se lehet közelíteni. Ilyen régies nyelvezetű, illetve idegen nyelvű (jelen esetben latin) szövegek esetén általában a kétszeri korrektúrázás elegendő, mivel a szokatlan szöveg miatt a munkát végzők jobban odafigyelnek. Mai nyelvezetű szövegek esetén a korrektúrázó is könnyebben átsiklik a hibákon, ezért ezen dokumentumok esetén a háromszori korrektúra javallott. 31
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A cikk-oldal alapú feldolgozás miatt a TXT állományok elnevezése az alábbi formátum szerint történt: _ _.txt Példa: bmkozl187403_0012_0004.txt (a Békésmegyei Közlöny 1874 évfolyamának 3. számának 12-dik cikke a negyedik oldalon) 2.2.3.2.3. A dokumentumok publikálásra kerülő kép formátumainak létrehozása A teljes dokumentumhűség biztosítása érdekében, a szöveges megjelenítés és a szöveges kereshetőség biztosítása mellett a régi dokumentumok esetén elengedhetetlennek tartjuk azok képformátumban történő közzétételét is. Az interneten való közzétételre a TIFF formátum nagy mérete miatt nem alkalmas, a JPEG formátum viszont erre a célra megfelel. „JPEG: A legáltalánosabb internetes formátum A JPEG formátum fő előnye, hogy lehetővé teszi a képinformációk egy részének elhagyását, amivel csökkenteni tudja a fájlok méretét. Ezt az algoritmust tömörítésnek nevezzük. Ennek legfőbb haszna itt az, hogy a kisebb fájlok gyorsabban haladnak keresztül az interneten. Sajnos a JPEG fájlok túltömörítése jelentős mértékben csökkenti az állományban tárolt kép részletgazdaságát. Ugyanis minél jobban tömörítünk egy fájlt, annál több képadat vész el mindörökre.”26 A TIFF formátumú állományokhoz való hozzáférést a kutatást végző, a téma iránt érdeklődő olvasóink számára könyvtárunkban DVD lemezről biztosítjuk. A TIFF formátumok retusálását, méretezését, forgatását, vágását és konvertálását a Paint Shop Pro képszerkesztő program 8.0 verziójával végeztük. A két Haan kötet szkennelésekor keletkezett egy-egy képállomány a könyv oldalait párosával tartalmazza. E miatt az első teendő – az oldalakra történő bontás, vagyis az oldalak kivágása és önálló képállományként való mentése volt.
26
Jill Gilbert: A sokoldalú szkenner. Bp.: Panem, 2003. 119 p.
32
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A két kötet egyes oldalait tartalmazó képállományok elnevezése az alábbi szabály szerint történt: _.txt Példa: Békés vármegye hajdana I. kötet első oldala bmh1_0001.tiff Az oldalakat tartalmazó képeket olykor (az adott esettől függően) el kellett forgatni néhány fokkal. Ezen a műveleten kívül szükség volt a fényesség, a kontraszt megfelelő beállítására, a jobb láthatóság, olvashatóság eléréséhez, valamint néhány oldalon a foltok eltávolításához (radírozásához). A retusált TIFF formátumú képekből kötegelt feldolgozással konvertáltuk a JPG állományokat. A Békésmegyei Közlöny képállományainak minőségén csak jóval több munkával és jobb eszközrendszerrel tudtunk volna jobb eredményt elérni. Mindez idő és pénz kérdése, melyekben nem bővelkedtünk. A közlöny oldalainak retusálást nehezítette az is, hogy egyegy oldalon belül is nagyon eltérő volt a kép minősége. Meg kellett elégednünk azzal, amit lehetőségeink megengedtek. A konvertálással létrehozott JPG állományok minőségére viszont nagy gondot fordítottunk. Elsődleges szempont az volt, hogy a felhasználó a körülményekhez képest a legjobb minőségű nyomtatható állományt kapja (A4-es méretben történő nyomtatáshoz). Éppen ezért a JPG formátumú állományok esetében megőriztük a 600 DPI felbontást. Az állományok méret 900-1000*1400 pixelben határoztuk meg. Az egyes állományok mérete így 450 Kbyte körül alakult. A jobb minőség érdekében meg kellett alkudnunk a nagyobb állomány mérettel. 2.2.3.3. A digitalizált dokumentumok közzététele A digitális könyvek, dokumentumok archiválása és szolgáltatása során használatos formátumokkal kapcsolatban számos probléma merül fel. Drótos László (a MEK egyik alapító tagja) az „Egy szegény elektronikus könyvtáros panaszai” című cikkében behatóbban foglalkozik ezzel a kérdéssel. Drótos László szerint a számítógépes szövegek tárolási és megjelenési módját leginkább a mindenkori műszaki (főleg hardver) lehetőségek határozták meg, és nem az, hogy mi az 33
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
emberek számára az ideális megoldás. Valószínűleg továbbra is a technikai változások fogják leginkább befolyásolni az elektronikus dokumentumok sorsát. „Hogy a mindenkori „tökéletes megoldás” mennyire függ a műszaki lehetőségektől ezen a téren, azt jól mutatja a Ted Nelson nevéhez kötődő Xanadu projekt, mely több mint 30 év alatt sem hozott gyakorlati eredményt a tökéletes hipertext rendszer megalkotása terén, mert az elképzeléseket és az elkészült szoftvereket állandóan hozzá kellett igazítani az újabb és újabb számítástechnikai lehetőségekhez, míg végül a kilencvenes évek elején a – sokkal tökéletlenebb – Web megjelenésével és gyors elterjedésével az egész Xanadu fejlesztés értelmét vesztette. A napjainkban zajló e-book forradalom is hasonló fordulatot hozhat: hiába írtak össze annyi minden okos dolgot az elmúlt években arról, hogy milyen is az ideális formátum az elektronikus szövegekhez és hiába születtek a bonyolult, mindenre kiterjedő szabványok, indultak be az ezekre épülő különféle kezdeményezések, könnyen lehet, hogy pár év múlva az emberek egyszerű, hordozható kis célgépeken fognak könyveket olvasni, melyek alig tudnak többet, mint a hagyományos nyomtatott könyvek, igaz nem is drágábbak és a használatukhoz sem kell többet tudni. (Analógia: a 70-es és 80as évek csúcstechnikájú, precíziós HiFi lemezjátszói helyett ma a jóval gyengébb hangélményt nyújtó MP327 lejátszók terjednek el, olcsóságuk és egyszerűségük miatt.)”28 A
számítógépes
böngészhetőség,
formátumú átfuthatóság,
dokumentumoktól
jogosan
kereshetőség,
dokumentum
a
elvárhatók
lennének:
átformálhatósága,
konvertálhatósága, módosíthatósága, javíthatósága, jegyzetelhetősége, másolhatósága, idézhetősége, nyomtathatósága, hivatkozhatósága, azonosíthatósága, hitelesíthetősége, hordozhatósága, birtokolhatósága, átadhatósága. Egyelőre nincs olyan ideális szabvány vagy rendszer, amely a fenti kritériumoknak mind maradéktalanul megfelel. A cikk szerzőjét aggasztja, hogy nem alakulnak ki az ideálishoz legközelebb álló megoldások, inkább csak a káosz nő. Nem létezik olyan formátum (DOC, HTML, RTF, PDF, SGML, XML, E-book szabványok stb.), mellyel kapcsolatban ne merülne fel valamilyen probléma.
27
Audio tömörítési eljárás; tömörítési arány 10:1
28
Drótos László: Egy szegény elektronikus könyvtáros panaszai In: Könyvtári Figyelő [online] 47. évf. 2001. 1. szám [2004.12.11.]
34
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A Magyar Elektronikus Könyvtár (MEK) többnyire böngészhető (HTML, XML, PDF) és egy összecsomagolt, letölthető (az előbbiek mellett RFT, Word, TeX, PostScript, Open Ebook, vagy egyéb) verziót is szolgáltat. A MEK dolgozói igyekeznek a legelterjedtebb formátumok optimális „keverékét” megtalálni, hogy legalább ez ne legyen akadálya annak, hogy – „minden elektronikus könyv megtalálja a maga olvasóját” és minden olvasó megtalálja a maga elektronikus könyvét. A formátum megválasztása számunkra is komoly gondot okozott. A projekt és lehetőségeink kapcsán szóba jöhető formátumok: TXT, DOC, RTF, HTML, XML, PDF. A DOC a Microsoft Word fájl formátuma. A Word minden újabb verziója egyre nagyobb inkompatibilitásokat mutat, még a saját korábbi változataival is. A Word előnyei: jók a formázási, másolási, módosítási, keresési lehetőségei. Hátránya az egyes számítógépekre telepített fontkészletek és nyomtatók eltérősége miatti megjelenítési problémák jelentkeznek. A DOC formátum a StarOffice megjelenése óta a Linux világban is jelen van, sajnos a teljes kompatibilitás biztosítása nélkül. Az RTF29 formátumot a grafikus szövegszerkesztő programok ismerik és kezelik, általánosnak tekintett szövegcsere formátum. Ma már ez a szabvány sem megbízható, mert a különböző szoftverek olyan egyéni feltételeket tesznek az RTF állományokba, amiket azután már egy másik alkalmazás nem, vagy csak egészen másként mutat meg. Nincs ingyenes RTF megjelenítő, de az OpenOffice szintén ismeri és kezeli ezt a formátumot, az előbb említett esetek megjelenítési problémák sajnos ennél a szövegszerkesztőnél is előfordulhatnak. Az azonban elmondható, hogy közvetítőeszköznek jó az egyes grafikus szövegszerkesztő programok között. A HTML (Hyper Text Markup Language) hatalmas változásokon ment át az elmúlt évek. A HTML eredeti célja: egy platform független egyszerű hypertext formátum. Sajnos a böngésző programok fejlesztői egyre több speciális, csak arra a böngészőre jellemző lehetőségek építenek bele programjaikba. A HTML jól böngészhető és kereshető, de pl. hiányzik belőle a jegyzetelés lehetősége. A sok darabból álló dokumentumok letöltése és nyomtatása nehézkes.
29
Rich Text Format; A DCA egyik adaptálása, amelyet szövegek alkalmazások közötti átvitelre használnak, akár különböző platformok között is.
35
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
Az XML30 formátum a Word Wide Web Consortium (W3C) XML munkacsoportjának fejlesztése. A HTML-hez hasonlóan a kifejezetten a világháló való információszállításra kifejlesztett jelölőnyelv. „Az XML-nyelv alapja csupán egy gerincszintaxis. XMLdokumentumok létrehozásakor nem előre megadott elemek szűkös halmazából válogatunk, hanem magunk hozzuk létre az elemeket, és magunk adunk nekik nevet is – innen származik a nyelv nevében a kiterjesztő szó. Ezért az XML-lel szinte bármilyen típusú dokumentumot leírhatunk, zenei kottától adatbázisig.”31 „Az XML rugalmasan konvertálható és kereshető elektronikus könyveket ígér, viszont a fő hangsúlyt a dokumentumok szerkezetére és nem a képernyőn és nyomtatón való megjelenítésre helyezi, ami pedig a felhasználók számára legalább ugyanolyan fontos.”32 Az XML dokumentumtípus-deklaráció olyan kiemelt, jól jelzett deklarációkat tartalmaz, vagy olyanokra utal, melyek az egyes dokumentum-osztályok nyelvtanával egyenlők. Ezt a fajta nyelvtant nevezik dokumentumtípus definíciónak (document type definition, DTD). Az XML elemeket leíró DTD-k helyes definiálása komoly szakértelmet igényel, ezért az egyes szakterületekre megpróbálnak kidolgozott és egységesített DTD-ket létrehozni. A PDF (Portable Dokumentum Format, a PostScript-ből fejlesztették ki) elsősorban nyomtatásra szánt szövegek ideális formátuma. A PDF ingyenes megjelenítője az Acrobat Reader. PDF formátumú állományt az olvasó már nem formázhatja át, s csak a megfelelő engedély megadása esetén lehet belőle szöveget másolni. Másik nagy hátránya, hogy a szöveg felolvasó programok nem boldogulnak vele. TXT – az egyetlen formátum, amelyet valamennyi szövegszerkesztő ismer és kezel. Hátránya, hogy a grafikus szövegszerkesztő programoknál megszokott dokumentum formázási lehetőségeket ezen dokumentumoknál nem lehet alkalmazni. Hátrányának köszönhetően tárhely igénye a legkisebb az összes szöveges dokumentumtípus között. A TXT formátumban szinte kizárólag, csak maga a „csupasz” szöveg érvényesül. A szövegfelolvasó programoknak nem jelent problémát. A vakok és a vakos oldalak egyik legkedveltebb formátuma.
30
Kiterjeszthető jelölőnyelv rövidítése, angol megnevezése Extensible Markup Language
31
Young, Michael J.: XML lépésről lépésre. Bp.: SZAK Kiadó, 2002. 7 p.
32
Drótos László: Egy szegény elektronikus könyvtáros panaszai In: Könyvtári Figyelő [online] 47. évf. 2001. 1. szám [2004.12.11.]
36
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A különböző formátumok előnyeinek és hátrányainak egybevetése után az XML, PDF és TXT formátumban történő megjelenítés mellett döntöttünk. Első lépcsőben az XML formátumban való közzétételt céloztuk meg. Azzal ugyanis tisztában voltunk, hogy valamennyi formátumot nem leszünk képesek a megszabott határidőre közzétenni. A dokumentumok közzétételében nagy segítségünkre voltak az iKron Kft szakértői. A digitalizált dokumentumok publikálását az ő szoftvereik és tanácsaik segítségével oldottuk meg. Az adatszerkezet kialakítása is az ő feladatuk volt. A közzététel során az alábbi szoftvereket használtuk: •
PostgreSQL: ingyenesen használható, az egyik legnagyobb tudású adatbáziskezelő, szabad forráskódú szoftver, amely a publikálás során használt Java programozási nyelvből jól használható. Az adatbázisban vannak a szekciók XML-jei, illetve a képek
adatai,
fájlnevek
hozzárendelve
a
szekciókhoz.
Itt
találhatók
a
dokumentumok leírásai is. •
Java: ingyenesen felhasználható, platform független (Windows, Linux, Solaris, stb. alatt is futtatható) programozási nyelv. Alkalmazások és webes rendszerek fejlesztésére is alkalmas.
•
TomCat: Java alapú webserver, jsp-k, servlet-ek futtatására alkalmas, az iKron Kft a JaDoX webes felületét JSP technológiával fejlesztette ki.
•
JaDoX: a rendszernek alapvetően 3 részegysége van: a JaDoX szerver, a JaDoX editor és a webes felület. Ezek közül egyedül a JaDoX szerver áll kapcsolatban az adatbáziskezelő rendszerrel. A másik 2 egységnek (editor, web) nincs kapcsolata csak a JaDoX szerverrel. A JaDoX szerver és a JaDoX editor Java-ban megírt alkalmazások, míg a JaDoX webes felülete egy TomCat alatt futó webes alkalmazás. A szerkesztő és a webes rész parancsokat küld a JaDoX szervernek, az pedig végrehajtja a parancsokat. Ezen parancsok kiszolgálásához az adatbázis szerverhez fordulhat: adatokat kérdezhet le, módosíthat vagy szúrhat be. Az adatbázisban vannak ugyanis a feldolgozott dokumentumok szövegei, XML formátumban. Az editor ezen XML-eket szerkeszti, míg a webes felület ezeket kéri fel, hogy azokat megjeleníthesse. Ez a megjelenítési folyamat pedig egy XSLT
37
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
transzformáció, mely során a tárolt XML-ből HTML keletkezik, amit a böngésző meg tud mutatni. Ez a transzformáció már a TomCat oldaláról valósul meg. •
Monguz: A Monguz egy nyílt szabványokon alapuló platform-független keretrendszer, amely távoli információforrások közös felületen való lekérdezésére szolgál. A különböző adattárak lekérdezését, és az eredmények különféle protokollok szerinti megjelenítését vagy továbbítását könnyen bővíthető plugin rendszer segítségével valósítja meg. Néhány jellemző: •
JAVA programnyelven íródott, ezért platform-független;
•
többféle protokollt ismer (Z39.50, CCL, SQL stb.), melyek segítségével képes heterogén adattárak közös felületének biztosítására;
•
képes
az
adatbázisok
párhuzamos
lekérdezésére,
az
eredmények
(új
protokollok,
összefésülésére, a találati halmaz megtartására stb.; •
plug-in33
rendszere
segítségével
könnyen
bővíthető
adatbázisok) •
példányai többszörösen is összekapcsolhatók, így segítségével akár nagy földrajzi távolságokat áthidaló, robosztus lekérdező rendszer is építhető;
•
belső adatcsere formátuma XML
Alkalmazásával a JaDoX-ban tárolt, XML formátumú digitalizált dokumentumok tartalmi visszakereshetősége, megjelenítése akár böngészőn keresztül (platformfüggetlen34 internetes közzététel), akár a könyvtári világban elterjedt Z39.50-es felületen, de számos egyéb szabvány szerint is megoldható. Emellett kapcsolódási pontot biztosít a nagy múltú rendszerek felé. Messzemenőkig támogatja a különböző, akár helyi, akár távoli adatforrások párhuzamos lekérdezését, így a kisebb helyi gyűjtemények egyszerűen integrálhatók nagyobb, pl. megyei vagy országos gyűjteményekkel. •
Apache: az Apache webszerver használata opcionális, ha már a publikálásra használt szervergépen fut Apache webszerver, akkor a TomCat-es projekteket be lehet tölteni az Apache alá, mintha az alá tartoznának.
33
bedolgozó program, beépülő program
34
alkalmazott számítógép vagy operációs rendszer független
38
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A webes felületen történő megjelenítésnél nem csak a tartalomra, de a design-ra is gondolni kell. A szöveges formátumok létrehozásával egyidőben hozzáfogtunk a design megtervezéséhez. A közlendő hatásossága a tartalom és az image (arculat) függvénye. Egy website megtervezéskor számos dologra kell odafigyelni. (A website tervezésének és megvalósításának lépéseit részletesen lásd a függelékben.) Az eszközök és a formátum használata már eldöntött tény volt, amikor hozzáláttunk az arculat megtervezéséhez. A webhellyel szemben támasztott egyik követelmény az volt, hogy arculata illeszkedjen a könyvtár website-jához, ezért színvilágát ahhoz igazítottuk. A másik szempont, hogy az arculat utaljon a tartalomra, illetve sugallja azt. A könyvek megjelenítésekor ezért igyekeztünk olyan grafikai elemeket használni, amelyek a könyv alakjára utalnak. A kötetek oldalalapú megjelenítése egy nyitott könyv illúzióját keltő grafikán történik. A lapozás grafikai linkjei is ehhez illeszkednek.
A Haan kötetek megjelenítése a web-es felületen
A közlöny esetében a grafikai háttér egy korabeli kézi újságtartóra utal (a mintát a Fiume szálloda újságtartója szolgáltatta).
39
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A közlöny megjelenítése web-es felületen
A mintaként szolgáló újságtartóról készült felvételek35
35
A szerző felvételei 2004.
40
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A TXT állományok importálással kerültek a PostgreSQL adatbázisba. A szerkesztést az importálást követően végezték a kolléganőim a JaDoX editorával, mely egy könnyen kezelhető XML szerkesztő. Használatát munkatársaim rövid idő alatt elsajátították. Az XML szerkesztést végző feladata, hogy az előredefiniált tag-eket hozzárendelje a szövegegységekhez. (JaDoX editor használati útmutatóját lásd a függelékben)
A JaDoX editora
A Haan kötetek formai szerkezete egyszerű, így a formázás néhány tag-gel megoldható volt. A kötetek tartalmaztak néhány bonyolultabb táblázatot, ezek szöveges feldolgozását mellőztük (a feladat megoldható, de időigényesebb, mint a többi szövegrészé), egy-egy utalást tettünk arra, hogy az oldal táblázatot tartalmaz, mely az oldal képformátumának megjelenítésekor tekinthető meg. A folyóirat szerkezete bonyolultabb, összetettebb, ezért az XML-ben történő publikálás során többféle tag-et kellett alkalmaznunk, mint a két kötet esetén.
41
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
Egy cikk szerkesztés közben, előtérben a helyi menü által felkínált tag-ekkel
A TIFF állományok importját a nagyobb felbontás miatt a kötetektől eltérő módon valósítottuk meg. Az átméretezését és konvertálását a Pain Shop Pro 8.0 verziójával végeztük. Az így keletkezett JPG állományokat importáltuk az alábbi paranccsal: sh import.sh -images-complete-nothumb <elérési útvonal>/import_konyvtar_neve Ezzel szemben a kötet képállományainak konvertálása az importtal egyidejűleg zajlott: sh import.sh -images-complete <elérési útvonal>/import_konyvtar_neve Az importálás során a program a TIFF állományokat JPG formátumúvá alakítja és feltölti a megfelelő könyvtárba, majd beállítja a képméret adatokat az adatbázisba. Mint azt az előbb említettem a közlöny esetén ez az a szokásostól eltérően történt. A dokumentumok DC36 formátumú metaadatainak felvitele szintén a JaDoX szerkesztővel történik.
36
Doublin Core szabványról részletes információk: Doublin Core. In.: Magyar Elektronkus könyvtár [online]. Bp. : OSZK, 1995. [2005.03.19.] , Dublin Core Metaadat Initiative [online]. 1995-2005 [2005.03.19.]
42
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A könyvek, illetve a folyóirat számainak tartalomjegyzéke automatikusan képződik a cím, illetve alcím tag-ekkel megjelölt szövegrészekből. A dokumentumok áttekinthetőségét, szerkezetét a csoportok kialakításával biztosítottuk. Összes dokumentum
Könyvek
Békés vármegye hajdana 1. kötet
Folyóiratok
Békés vármegye hajdana II. kötet
Bm. Közlöny 1874 évf.
Bm. Közlöny 1875 évf.
Bm. Közlöny 1876 évf.
1.sz. 2.sz 3.sz. 4.sz. stb 1.sz. 2.sz 3.sz. 4.sz. stb 1.sz. 2.sz 3.sz. 4.sz.stb
Elektronikus könyvtárunk csoport struktúrája
A JaDoX szerkesztő csoport struktúra alakítására, kezelésére használható felülete
A web-es felületen a felhasználó számára lehetőség nyílik az elektronikus könyvtárban történő böngészésre és keresésre. A böngészés során a faszerkezetű csoporthierarchia segítségével tud tájékozódni, az elektronikus könyvtárban.
43
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A felhasználó a csoport hierarchia segítségével böngészhet
A keresési lehetőség a felhasználó által kiválasztott csoporthierarchia szinten történik. Értelemszerűen kereshet az összes dokumentumban, a könyvek, vagy a folyóiratok között, vagy akár csak az általa kiválasztott könyvben, a folyóirat egy évfolyamában, vagy számában. A keresendő kifejezésként megadott szavak között „és” illetve „vagy” logikai kapcsolat adható meg.
A keresés web-es felülete
44
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A találati oldal tízesével listázza ki a találatokat.
Találati oldal
Találati oldal egy találat esetén
Az egyes oldalak, cikkek megjelenítésekor a könyv illetve újság oldal (cikk) felett lévő link lehetőséget biztosít az aktuális oldal képformátumának megtekintésére (letöltésére, nyomtatására).
45
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A web-es felület kialakítása a szakértőkkel együtt történt. A távolság miatt a kommunikációt az interneten elérhető hibabejelentő rendszeren (bugreport-on) keresztül bonyolítottuk le. A felmerült problémák nagyon gyorsan kerültek megoldásra. (Problémától függően néhány perc, illetve óra, komolyabb problémák esetén néhány nap alatt.) Ez az alkalmazott technikán kívül nagyrészt a munkánkat segítő szakértők szaktudásán és hozzáállásán múlott.
A hibabejelentő rendszer (fent bejelentkező képernyő, lent egy lezárt hibabejelentés oldala hozzászólásokkal)
46
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
A digitalizált anyagot a pályázatban meghatározott határidőre XML és JPG formátumban publikáltuk, a formázások, fejlesztések azonban még most is tartanak. A felhasználók számára egy alakuló, de már használható elektronikus könyvtári tartalmat szolgáltatunk. Elektronikus könyvtárunk a http://ek.bmk.hu címen érhető el. 2.2.3.4. Fejlesztési lehetőségeink, terveink A digitalizált anyag jelenleg XML és JPG formátumban került publikálásra. Terveink között szerepel az anyag PDF és TXT formátumban történő közzététele is. PDF: Lehetőség van XML-ből XSLT segítségével egy speciális XML előállítására, amelyből egy Javás eszköz PDF-et tud gyártani. Ennek az eszköznek a neve FOP. Tehát nem kell majd a PDF-eket külön letárolni, hanem az adatbázisban levő XML-ből futásidőben képződik PDF, amit a felhasználó letölthet. Esetünkben a közlöny reklám oldalai miatt valószínűleg más megoldást kell majd keresnünk PDF formátum létrehozásához. A TIFF formátumból a FineReader segítségével PDF állományok is előállíthatóak. A karakterfelismerő program lehetőséget ad arra, hogy a felismertetett szöveget a kép mögé helyezzük a mentésre kerülő PDF állományban. Így a dokumentum szövegesen visszakereshetővé válik. Terveink között szerepel elektronikus könyvtárunk vakos felületének létrehozása is, amelyben lehetővé kívánjuk tenni a vakok és gyengénlátók számára az elektronikus könyvtár dokumentumainak TXT formátumban való elérését, letöltését. Mint azt már korábban említettem ezt a formátumot valamennyi szövegszerkesztő és szövegfelolvasó program kezeli. Csatlakozni kívánunk a Nemzeti Digitális Adattárhoz (NDA). Az első lépéseket már megtettük. Jelenleg a szerződés aláírása van folyamatban. Az NDA •
a kormány Magyar Információs Társadalom Stratégia digitális tartalomfejlesztésre vonatkozó koncepciójának része;
•
egy olyan tartalomfejlesztési keretrendszer, amely infrastruktúrát, egy egységes szabványt és nem utolsó sorban láthatóságot biztosít a kulturális és egyéb közérdeklődésre számot tartó tartalmak számára;
•
online tartalomfejlesztési kezdeményezések decentralizált hálózata.
47
A BÉKÉS MEGYEI KÖNYVTÁR DIGITALIZÁLÁSI PROJEKTJEI
„Az NDA működési modellje a nemzetközi tudományos közösség kooperációjában kiformálódott, újszerű publikálási lehetőséget kínáló, az Open Archive Initiative (OAI) által kidolgozott logikán alapul, melynek lényege az adat- és szolgáltatásgazdai funkciók elválasztása egymástól. Az adatgazdák (archívumok) azok, akik őrzik a digitális tartalmakat, dokumentumokat, illetve a szabványok alapján ők állítják elő és tartják karban a tartalmakat leíró információkat. Az OAI-elv szerint a tartalom az adatgazdák birtokában marad, ám a leíró adatok szintjét meg kell nyitni szabad felhasználásra a szolgáltatásgazdák számára.”37 Az OAI-PMH 2.0 egy protokoll, amely segítségével a különféle rendszerek adatait be lehet szüretelni (harvest). A JaDoXban lehetőség van Dublin Core38 szabványnak megfelelő bibliográfiai leírásokat készíteni a feldolgozott dokumentumokról. Ezeket a bibliográfiai leírásokat a JaDoX rendelkezésére bocsáthatná az OAI harvesterek részére. Tehát pl. egy közös katalógusba be lehetne tölteni a JaDoX-ban feldolgozott dokumentumokat, majd az ott levő OPAC a rekord megjelenítésénél egy linket rakhatna ki, ami a JaDoX webes felületére hivatkozna, hogy az olvasók a bibliográfiai adatok megtekintése után beleolvashassanak a dokumentum teljes szövegébe is. Mindehhez implementálni kell a JaDoXban egy OAI-PHM 2.0 Dataprovidert, ami az OAI kérdésekre válaszolni tud. Az NDA-hoz való csatlakozás így megoldhatóvá válhat. Ezen lehetőségekkel élve, a fentebb leírt terveink alapján kívánjuk folytatni elektronikus könyvtárunk fejlesztését, alakítását.
37
NDA Füzetek I./Nemzeti Digitális Adattár – A jövő kultúrája. Bp.: NDA, 2004. 16 p.
38
Doublin Core i.m.
48
ÖSSZEGZÉS
3. ÖSSZEGZÉS Dolgozatom az IHM-ITP-8-as pályázat megírásának, megvalósításának, lebonyolításának módját, lépéseit taglalja. Egyben bevezet a munkahelyemen, a Békés Megyei Könyvtárban folyó digitalizálási munka rejtelmeibe, lehetőségeibe. Igyekeztem rávilágítani arra, hogy digitalizálási terveink hogy illeszkednek be a világ, Európa államainak valamint hazánknak a kulturális kincsek megőrzése, megismertetése érdekében folytatott törekvéseibe, projektjeibe,
továbbá
döntéseink
okaira,
küzdelmeinkre,
nehézségeinkre,
elért
eredményeinkre, lehetőségeinkre és terveinkre. A jövő nehézségeit abban látom, hogy hazánkban a könyvtárak jelenlegi finanszírozása nem biztosítja a digitalizálási munkák folytonosságát (sajnos más munkákat, terveket sem). Hosszú távon ezen tevékenységek megvalósítása, az eszközpark karbantartása, felújítása, korszerűsítése csak az anyagi fedezet folyamatosan biztosítása mellett lehetséges. Napjainkban a könyvtáraknak komoly pénzügyi, finanszírozási nehézségekkel kell szembe nézniük. A pályázatok esetlegesek, zömében utófinanszírozottak, a pályázati összegek kifizetése (az utóbbi években) késedelmes. Gyakran létük is veszélybe kerül, pedig az információs társadalom egyik kulcsfontosságú intézménye a könyvtár. A társadalom, a települések fejlődése többek között a könyvtárak szolgáltatásainak színvonalától is függ. Az egyes társadalmi rétegek között az információs szakadék mélységének csökkentésében a könyvtárak nagy szerepet játszanak és még nagyobb szerepet játszhatnának a jövőben, mert
az
az
egyetlen
hely
ahol
az
állampolgárok
számára
dokumentumtípusokhoz való hozzáférés lehetősége együttesen biztosított.
49
a
különféle
IRODALOMJEGYZÉK
IRODALOMJEGYZÉK A Békés Megyei Könyvtár (a projekthez tartozó) megrendelései A Békés Megyei Könyvtár digitalizálási koncepciója A Békés Megyei Könyvtár IHM-ITP-8 pályázata (és elszámolása) A szállítócégek termék és árajánlatai Békés Megyei Könyvtár Elektronikus Könyvtára [online] Békéscsaba : Békés Megyei Könyvtár, 2004. [2005.03.23] Toldi Klára - Vincze Andrea: A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása (előadás). Szeged : NETWORSHOP 2005 Konferencia, 2005.03.30.
A Magyar Elektronikus Könyvtár ma és holnap. In: Magyar Elektronikus Könyvtár [online]. Budapest : OSZK, 1995. [2004.12.15.] Birkás Bence: A Digitális Könyvtári Szövetség (USA). In: Tudományos és Műszaki Tájékoztatás 51. évf. 2004. 11.szám 507-510 p. Burmeister Erzsébet: Digitális könyvtár Észak-Rajna-Vesztfáliában és a WebDOC projekt (1995–1997). In.: Neumann-ház [online]. Budapest : Neumann János Digitális Könyvtár és Multimédia Központ, 1997. [2004.12.11.] Butzen, Fred – Hilton, Christopher: Linux hálózatok. Kiskapu Kft. 1999. David Dawson: Közös tartalomkészítés – a digitalizálási programok nemzetközi vonatkozásai. In: Könyvtári Figyelő [online]. 49. évf. 2003. 2. szám [2004.12.11.] Drótos László: Egy szegény elektronikus könyvtáros panaszai. In: Könyvtári Figyelő [online]. 47. évf. 2001. 1. szám [2004.12.11.] Gerbauer Szabolcs: Világkönyvtár otthoni használatra/Klasszikusok gombnyomásra. In.: Magyar Elektronikus Könyvtár [online]. Budapest : OSZK, 1995. [2004.12.15.] Horváth Iván: Bábeli Könyvtár, magyar könyvespolc. In.: Neumann-ház [online]. Budapest : Neumann János Digitális Könyvtár és Multimédia Központ, 1997. [2004.12.11.]
50
IRODALOMJEGYZÉK
Horváth Péter - Koltay Tibor: Digitális könyvtárak és projektek. In.: Magyar Elektronikus Könyvtár [online]. Budapest : OSZK, 1995. [2004.12.11.] Jill Gilbert: A sokoldalú szkenner. Bp.: Penem, 2003, 303 p. Mader Béla: Információs és kommunikációs technológiák kutatási, fejlesztési és innovációs irányai és a könyvtárak. In: Tudományos és Műszaki Tájékoztatás. 48. évf. 2001. 9-10. sz. 364-374. p. Máté István: A multimédia alapjai és feltételrendszere PC környezetben. In.: Magyar Elektronikus Könyvtár [online]. Budapest : OSZK, 1995. [2005.03.06.] NDA Füzetek I./Nemzeti Digitális Adattár – A jövő kultúrája. Bp.: NDA, 2004. 40 p. Nemzeti Digitális Adattár [online]. Bp.: Informatikai és Hírközlési Minisztérium, 2004. [2005. 01. 16.] Pajor Enikő: Conrad Gesnertől a virtuális Bibliotheca Universalisig. In: Könyvtári Figyelő [online] 48. évf. 2002. 4. szám [2004.12.11.] Pajor Enikő: Gallica – digitalizálási program a Francia Nemzeti Könyvtárban. In: Könyvtári Figyelő [online] 48. évf. 2002. 1-2. szám [2004.12.11.] Pál Zsolt: Alapelvek honlapok látássérültek számára is olvasható változatainak elkészítéséhez. In: Magyar Elektronikus Könyvtár [online]. Budapest : OSZK, 1995. [2004.12.09.] Papp József: Teljes szövegű digitális gyűjtemények és adatbázisok kínálata Szlovéniában. Tudományos és Műszaki Tájékoztatás [online]. 51. évf. 2004. 6. szám [2004.12.11.] Pardiné Mórocz Magdolna - Sörény Edina - Szabóné Vörös Györgyi: Állami, intézményes és önszerveződő közmûvelődési projektek. ELTE honlapja [online]. Budapest : ELTE [2004.12.11] Parker, Roger C.: Web design. Bp.: Kossuth Kiadó, 1999. 353 p. Pármai charta. In: Magyar Elektronikus Könyvtár [online]. Budapest : OSZK, 1995. [2005.03.19.]
51
IRODALOMJEGYZÉK
Porkoláb Annamária: Régi nyomtatott dokumentumok digitalizálása. In.: Szegedi Tudományegyetem Egyetemi Könyvtár [online]. Szeged : SZTE Egyetemi Könyvtár, 1996.08.20. [2005.03. 29.] Rockenbauer Zoltán: Könyvtár az információs társadalomban. Neumann-ház [online]. Budapest : Neumann János Digitális Könyvtár és Multimédia Központ 1997. [2004.12.11.] Sikeres digitalizálás lépésről lépésre In: Magyar Elektronikus Könyvtár [online]. Bp. : OSZK, 1995. [2005.01.22.] Sütheő Péter: Elektronikus, digitális, virtuális könyvtárak. 209-240 p. In: Könyvtárosok kézikönyve 3. kötet Szerk.: Horváth Tibor – Papp István. Bp.: Osiris, 2002. 429 p. Tapolcai Ágnes : Nyílt könyvtári gyűjtemények az Interneten. Magyar Elektronikus Könyvtárért Közhasznú Egyesület [online]. Budapest : OSZK, 1995. [2004.12.11.] Tószegi Zsuzsanna: A digitális könyvtárak szerepe a magyar kulturális örökség digitalizálásában és hozzáférhetővé tételében. Neumann-ház [online]. Budapest : Neumann János Digitális Könyvtár és Multimédia Központ 1997. [2004.12.11.] White, Ron: Így működik a számítógép. Computer Books, Bp., 1992. 138-145. Young, Michael J.: XML lépésről lépésre. Bp.: SZAK Kiadó, 2002. 446 p.
52
FÜGGELÉK
FÜGGELÉK A Békés Megyei Könyvtár 2003-2007. évi digitalizálási koncepciója ( 2003) Bevezetés Az
utóbbi
években
az
információs-kommunikációs
technológia
fejlődése
az
információszolgáltatás újabb lehetőségeit teremtette meg. Az új technológia könyvtáriinformatikai alkalmazásával sorra jelentek meg az interneten az elektronikus dokumentumok, virtuális könyvtárak. A nemzetközi könyvtári trendek tartalmazzák a tartalomszolgáltatás iránt megnövekedett igények kielégítésére létrehozott módszereket, szabályozásokat. A Békés Megyei Könyvtár a digitalizálás révén megvalósuló tartalomszolgáltatás kialakításával a hazai könyvtárügyben is meghatározott trendekhez igazodik, és az országos tartalomszolgáltatáshoz járul hozzá. Törekszünk arra, hogy a digitalizálási tevékenységünk során az érintett könyvtárakkal, koordináló szervezetekkel kooperáljunk. Előzmények A Békés Megyei Könyvtár 2002-ben kezdte el a digitalizálással megvalósuló elektronikus tartalomszolgáltatás kialakítását. A választás akkor két megyei időszaki kiadvány digitalizálására esett. A kezdeti tapasztalatok azt mutatják, hogy az információszolgáltatás ilyen módjának létrehozásával a dokumentumok visszakereshetősége felgyorsul, ugyanazt a dokumentumot egy időben többen is tudják használni, a rossz állapotú papíralapú dokumentumok védelme biztosítható. Könyvtárunk a helyismereti gyűjteményében lévő olyan dokumentumok digitalizálását vállalja, melyek a nemzeti kulturális örökség részét képezik, és egyben helyi kulturális értékeket hordoznak, ugyanakkor regionális igényeket elégítenek ki. Az állományunk egészéhez képest nem nagy számban szerepelnek ezeknek a kritériumoknak megfelelő könyvek,
időszaki
kiadványok,
mikrofilmek.
Mégis
nagyon
fontosnak
digitalizálásukat, mert keresettek, és kevés példánnyal rendelkezünk belőlük.
53
ítéljük
FÜGGELÉK
Békés Megyei Könyvtár digitalizálási koncepciója A digitalizálással a könyvtár célja: •
a nemzeti kulturális örökség részét képező helytörténeti és kulturális értékek archiválása, biztosítva a dokumentum, valamint tartalmának visszakereshetőségét,
•
új szolgáltatási módszer létrehozása,
•
az interneten jó minőségben megjelenített dokumentumok, információk hozzá férésének biztosítása mindenki számára.
2003-2007 között a Békés Megyei Könyvtár állományában található, információkban gazdag, értékes, egyedi dokumentumait kívánja digitalizálni. Könyvtárunk egy digitalizáló műhely kialakításával törekszik arra, hogy az eredeti dokumentummal megegyező minőségi elektronikus dokumentumok az intraneten, valamint – mint az ODR könyvtári rendszer tagja – az interneten is elérhetőek legyenek, figyelembe véve az ISO 8879 dokumentumszabvány előírásait. A műhely elsősorban a saját könyvtári állomány digitalizálását végzi, ugyanakkor segítséget kíván nyújtani a társintézmények ilyen jellegű tevékenységéhez, és a határon túli kapcsolatokat a digitalizálás területére is kiterjeszti. A műhely a későbbiekben szakmai gyakorlóhelyként is szolgálhat. Koncepciónk az alábbi területekre terjed ki: 1. Információs-kommunikációs technológia, humán erőforrás 2. A felhasználás, elérhetőség biztosítása 3. A szerzői jogi kérdések 4. A digitalizálandó dokumentumok 5. További fejlesztések 1. Információs-kommunikációs technológia, humán erőforrás A műhely hatékony működéséhez, a digitalizálandó dokumentumok nagyságrendjét figyelembe véve, legalább négy jól felszerelt számítógép szükséges, illetve a digitalizálandó dokumentumok – könyvek, időszaki kiadványok, kéziratok, mikrofilmek – sokfélesége miatt a már meglévő síkágyas szkenner mellett mikrofilm-szkenner beszerzését tervezzük. A szkennelt képtől az adatfeldolgozás egymásra épülő szoftvereinek használata biztosítja az eredetivel megegyező minőségű dokumentum elektronikus 54
FÜGGELÉK
változatának elkészítését.
A képi megjelenítéstől a szöveggé alakított tartalom
megvalósításáig szükséges szoftvereket kell beszereznünk. A feldolgozás során törekszünk arra, hogy egységes technológiát alkalmazzunk. Az adatfeldolgozáshoz önálló szerver- és a szoftverkörnyezet szükséges. A digitális tartalom létrehozását, szerkesztését és szolgáltatását új szakértelemmel bíró kollégák munkacsoportja végzi el. Kiemelten kell kezelni az ilyen irányú képzéseket, mind a technikai, mind a tartalmi ismereteket illetően. Keresni kell a tapasztalatcsere lehetőségeket is. 2. Felhasználás, elérhetőség biztosítása Az
elektronikus
dokumentumok
a
könyvtár
honlapján
kerülnek
elhelyezésre.
(www.bmk.iif.hu) A létrehozott elektronikus dokumentumok interneten elérhetőségét napi 24 órán keresztül biztosítjuk. Felhasználóinknak korlátozás nélkül engedjük az olvasást, kinyomtatást, illetve az adatok letöltését személyes céljaikra történő felhasználásához. 3. Szerzői jogi kérdések A Szerzői jogról szóló törvény 84/D §-a értelmében élünk a sui generis adatbázis oltalommal, a jelentős ráfordítással előállított adatbázisunkat az ARTISJUS Magyar Szerzői Jogvédő Iroda Egyesületnél az elkészülés után bejegyeztetjük. A digitalizálásra állományunkból kiválasztott dokumentum esetén figyelembe vesszük, hogy már nem esik szerzői jogi korlátozás alá, a szerző halála után 70 év már eltelt. 4. Digitalizálandó dokumentumok A dokumentumok kiválasztásánál úgy mérlegeltünk, hogy melyek azok az elsősorban helyismereti gyűjteményünkbe tartozó értékes, információkban gazdag, leggyakrabban használt, szerzői jog szempontjából rendezett könyvek, időszaki kiadványok, mikrofilmek, kéziratok. Bekerülnek tartalomszolgáltatásunkba azok az elektronikus dokumentumok is, melyekhez már digitalizált formában jutunk hozzá. Az olyan dokumentumok, melyek nem tartoznak ugyan állományunkba, és szerzői jog szempontjából rendezettek, valamint a későbbiek állományunkba kerülő dokumentumok rendezett szerzői joggal digitalizálását vállaljuk. 55
FÜGGELÉK
Négy területet határozunk meg a dokumentumok tartalmi és formai sajátosságai alapján, az alábbi felsorolás a fontossági sorrendet tükrözi. a./ helyismereti monográfiák: Karácsonyi János: Békésvármegye története. Gyula, 1896. (folyamatban levő digitalizálásunk) Haan Lajos: Békés vármegye hajdana. Békéscsaba, 1870. Oláh György: Békésvármegye, 1848-1849. Gyula, 1889-1892. b./ helyismereti időszaki kiadványok Békés c. társadalmi, politikai hetilap 1904-1910. évfolyamai A Békésvármegyei Régészeti és Művelődéstörténelmi Társulat évkönyvei, 18741893. Nemzeti Kultúra pedagógiai folyóirat 1911-1914. évfolyamai c./ mikrofilmek Békésmegyei Közlöny társadalmi hetilap 1874-1914. évfolyamai Csaba és Vidéke városi hetilap 1883-1884. évfolyamai Békéscsaba és Vidéke városi hetilap 1909-1913. évfolyamai d./ értékes, kuriózumnak számító művek Márki Sándor: A Fekete-Körös és vidéke. 1877. Tessedik Sámuel önéletírása. 1873. Békés megye sajtóbibliográfiája, 1855-1973. 1974. Zsilinszky Mihály: Árvízveszély és vízszabályozás Békésmegyében. 1880. Haan Lajos: Békés megye hajdana. Kézirat. 1862. Karácsonyi János: A magyar nemzetségek a XIV. század közepéig. 1900. Karácsonyi János: Magyarország egyháztörténete. 1906.
56
FÜGGELÉK
5. További fejlesztések A technológiai fejlődést lehetőségeinkhez mérten vesszük figyelembe, amennyiben szükségessé válik, szolgáltatásunkat is újítjuk. Békéscsaba, 2003. június 10. Dr. Ambrus Zoltán igazgató
57
FÜGGELÉK
A Békésmegyei Közlöny 3 oldala
58
FÜGGELÉK
59
FÜGGELÉK
60
FÜGGELÉK
Website tervezés és megvalósítás lépései (általánosságban) A website alkotóelemeinek listája39 Alkotóelem Téma
Leírás, cél A website témája olyan legyen, a látogatónak oka legyen a webhelyen alaposan szétnézni. El kell gondolkozni azon, hogy ezt mivel érhetjük el? Mi legyen a kezdő oldalon?
Azonosító jegy
Logo (saját és a szponzoroké)
Hogyan állítjuk be a webhely Milyen előnyöket kínál? Miben különbözik más témáját (vagy céget)?
hasonló webhelyektől?
Linkek
Elhelyezésük és strukturálásuk lényeges szempontja a tervezésnek, ezek navigálják a látogatót.
Hírek
Új és érdekes tudnivalók, tájékoztatók (folyamatosan cserélődők)
biztosítják
a
látogatók
ismételt
visszatérését a website-ra. Információk
E-mail linkek, e-mail cím, telefon- és faxszám.
kapcsolatfelvételhez Információk a webhelyről
Szerzői jogi és sokszorosítási információk.
GYIK (FAQ)
Gyakran Ismételt Kérdések rovat – a gyakran előforduló kérdésekre adott válaszok gyűjteménye
39
Parker, Roger C.: Web design. Bp.: Kossuth Kiadó, 1999. 111 p. - táblázat a szerző kiegészítéseivel
61
FÜGGELÉK
Az alábbi két táblázatot ismereteim és tapasztalataim alapján állítottam össze. A website tervezésének lépései 01. Téma átgondolása
Milyen témákat, altémákat kívánunk közzé tenni? Szükség van-e az általunk választott téma közlésére az interneten?
Konkurencia,
hasonló
webhelyek
megtekintése különös figyelemmel a hiányosságaikra. Ha mi olyat tudunk nyújtani a felhasználónak amit más nem, azzal vonzóbbá tehetjük saját site-unkat. 02. Kik férhetnek hozzá?
Bárki, vagy csak regisztrált felhasználó? Esetleg legyen külön rész külön bejárattal (felhasználói név és jelszó) csak a regisztrált felhasználók számára?
03. Kiknek, milyen
Ennek átgondolása azért fontos, mert a design
felhasználói rétegeket
kialakításánál a témán kívül ezt is figyelembe kell
kívánunk megszólítani,
venni.
vagy kiszolgálni? 04. Milyen dinamikus
Fórumok, hírlevelek, vendégkönyv stb.
részeket, elemeket kívánunk beépíteni, üzemeltetni? 05. Anyaggyűjtés
A felhelyezendő információk begyűjtése digitális formátumban, vagy ennek hiányában az anyagok digitalizálása. Kik gyűjtik be az anyagot?
06. Design
A design sugallja a témát, tükrözze a cég, intézmény arculatát, vonzó legyen a felhasználó számára.
62
FÜGGELÉK
Megvalósítás 07. Design megtervezése
Az
arculat
kialakítását
meghatározott megtenni
a
csak
ismereteknek számítógépes
a
az
1-5
pontban
birtokában
grafikával
tudja
foglalkozó
szakember. 08. Programozás
A feladat megoldásához és anyagi lehetőségekhez legoptimálisabb eszközök, programok kiválasztása. A tényleges megvalósítás. HTML programozás.
09. Tesztelés
A webhely tesztelése.
10. Közzététel
Hol, milyen webszerveren, milyen sebességű hálózaton tudjuk közzé tenni. A jó webcím megválasztásán is sok múlik.
Legyen
fülbemászó,
logikus,
könnyen
megjegyezhető. Nagyon fontos, hogy a webcím sugallja a tartalmat. 11. Üzemeltetés
Az új információk folyamatos biztosítása, a munkában részt vevők közötti jó kommunikáció, együttműködés biztosítása. Kijelölni: •
az információk begyűjtőit, szolgáltatóit;
•
azokat a személyeket (munkatársakat) akik meghatározzák,
hogy
milyen
információ
kerüljön fel; •
az
információk
felhelyezőjét,
a
website
karbantartóját (webmestert), a szerver és az adatbiztonságért felelős személyt.
63
FÜGGELÉK
Fogalmak •
website = webhely (pl. egy intézmény információs oldalai)
•
weboldal = a website egy oldala (egy html állomány, méretét tekintve nem azonos a szövegszerkesztőkben megszokott A4-es oldallal, lehet kisebb, vagy nagyobb is)
•
honlap= a website kezdő oldala (a site legelső oldala, vagy nyitó oldal – a webhely rövid bemutatását és célkitűzését tartalmazza, nagy vonalakban ismerteti a cég vagy szervezet tevékenységét és a vebhely különböző helyeire vezető linkeket is tartalmaz (menüpontok) )
64
FÜGGELÉK
JaDoX editor használati útmutatója (Készítette: iKron Kft) Bejelentkezés Az editor használatához be kell jelentkezni. A program induláskor felhasználó nevet és jelszót kér. Ha ezeket a mezőket kitöltöttük, a "Belépés" gombra kell kattintani. A "Mégsem" gomba megnyomása a programból való kilépést eredményezi. Sikeres bejelentkezés után megkezdhető a munka az editorral. Dokumentum Módosítás A "Módosítás" menüpontban már létező dokumentum leírását változtathatjuk meg. Először a "Dokumentum választás" nevű űrlapon kell módosítandó dokumentumot választani (megtehetjük a kurzormozgató billentyűk és a "Kiválaszt" gomb segítségével, vagy egérrel való kattintással). Választás után feljön a "Dokumentum leírás módosítás" űrlap. Ezen a dokumentum leírását adhatjuk illetve változtathatjuk meg. A felvitel menet a következő. Választunk egy beviteli mezőt, ebbe be kell írni a kapcsolódó adatot, majd egy Enter-t kell ütni, hogy a mező tartalma az adott típusú adatok közé kerüljön a listába. Minden egyes leíró mező ismételhető, pl. több címe is lehet a dokumentumnak, egymás után kitöltve a "Cím" beviteli mezőt, majd megnyomva az Enter gombot felvihetők a címek listájába. A listából elemet úgy lehet módosítani, hogy egérrel rákattintunk, ekkor a szerkesztő mezőbe feljön. Enter segítségével visszatehető a listába, ha viszont nem tesszük vissza, akkor tulajdonképpen töröltük. Ha a leírással (minden módosítani kívánt mezővel) végeztünk, adatbázisba menthetjük a "Mentés" gomb segítségével, a "Mégsem" gomb pedig a változtatásokat eldobja. Fájl Megnyitás A "Megnyitás" menüpontban először a már megismert űrlapon dokumentumot kell választani, majd ezután van lehetőségünk az adott dokumentumhoz tartozó szekciók közül kiválasztani azt, amivel dolgozni szeretnénk. A szekció választás a dokumentum választáshoz hasonlóan tehető meg (billentyűzet, egér). A megnyitás után a szekció betöltődik az editorba. Ha a "Nézet" menü XML-fa opció engedélyezett, akkor az editor 65
FÜGGELÉK
bal oldalán a szekció XML struktúrájának fa reprezentációja látható. A fa legalsóbb szintjein találhatók a szöveges elemek, a fa felsőbb szintjein pedig az XML tag-ek. Utóbbiak mellett lenyitott állapotban -, bezárt állapotban + jel szerepel, a fájlkezelőknél megszokott jelölésnek megfelelően. Az editor jobb oldalán a szekció XML-esített változatát láthatjuk. Az XML tag-ek kék színnel szerepelnek, a normál szöveg pedig fekete színnel. Az tag-eken egyetlen műveletet végezhetünk: törölhetjük őket, "Delete" gomb segítségével, vagy az egér jobb gombjával előhívott legördülő menüből a "törlés" menüpont segítségével. A szöveges elemeket módosíthatjuk, illetve ha az őse "block" elem, akkor XML tag alá rendelhetjük. Szöveges elemen állva az "Insert" gomb hatására feljön a "Szöveg szerkesztése" megnevezésű űrlap, amelyen a szöveget módosíthatjuk. A "Ment" gomb hatására az editorban is megjelennek a változtatások, míg a "Mégsem" elveti azokat. Ha a szöveges elem őse "block" elem, azaz az első fölé rendelt XML tag "block" (vagy a fa reprezentációban eggyel feljebb levő szint a "block" szint), akkor a kijelölt szöveges elemhez illetve annak kijelölt részéhez XML tag rendelhető (paragraph, table, title, subtitle). A tag-esíteni kívánt részt kijelöljük, majd jobb egérgomb segítségével a legördülő menüből kiválaszthatjuk a beszúrni kívánt tag nevét. Ezután a kijelölt rész közvetlenül a kiválasztott nevű tag alá lesz rendelve. A változás a fa reprezentációban is azonnal megjelenik. Mentés A "Fájl" menü "Mentés" menüpontja a szekciót jelenlegi állapotában az adatbázisba menti. Kilépés A "Fájl" menü "Kilépés" menüpontja az editor használatának befejezését jelenti. Ha a betöltött szekció változásai nem voltak elmentve, a program jelzi egy figyelmeztető üzenettel: "A dokumentum megváltozott. Kívánja menteni a változásokat?". Válaszul az "Igen" gomb elmenti a változásokat, majd kilépés következik. A "Nem" gomb mentés nélkül kilép. Ekkor az összes változtatás elveszik. A "Mégsem" gomb hatására visszatérünk az editorba, mintha nem is kezdeményeztük volna kilépést. Nézet XMLfa A "Nézet" menü "XMLfa" menüpontja a már ismertetett és az editor bal oldalán elhelyezkedő fa reprezentáció megjelenését engedélyezi, illetve tiltja. 66