1. A program kezelőfelülete
A program kezelőfelületét három részre (keretre) oszthatjuk, melyeket tetszőlegesen átméretezhetünk a keretek közötti csúszka segítségével: 1. 2. 3.
Keresés és index Tartalomjegyzék / Találati lista Találat részletező
1.1 Keresés és index A keresés és az index használatát részletesen az 1.4 fejezetben olvashatjuk
1.2 Tartalomjegyzék / Találati lista A lista alján válthatunk a teljes tartalomjegyzék (Contents) illetve a keresési találatok (Hit Contents) között. A tartalomjegyzékben alapértelmezésben az összes, ADT-be feltöltött folyóirat összes feltöltött lapszámát találhatjuk fastruktúrában elrendezve. Az egyes folyóiratokat a bal oldalon található plusz jellel lenyithatjuk és böngészhetünk az évfolyamok / lapszámok között. A közvetlenül a folyóirat neve melletti jelölőnégyzet segítségével tudunk szűkíteni a keresést adott folyóirat(ok)ra.
1
Ha átváltunk a keresési találatokra, akkor azt láthatjuk, hogy a keresett kifejezés az adott folyóiratban hányszor szerepel összesen (vastagon szedett számmal a folyóirat neve mellett), illetve ezen belül is egy adott évfolyamban hányszor szerepel. A folyóiratra kattintva a találati részletezőben ahhoz a találathoz ugrik, amelyik folyóirat valamely évfolyamát választottuk.
1.3 Találati részletező A találati részletező felső részén láthatjuk találatok közötti navigációt könnyítő információkat: ●
Bal oldalon állíthatjuk be a legördülő menüben, hogy egyszerre hány találatot jelenítsen meg az ablakban (10,15,20,50,100,200)
●
Jobb oldalon láthatjuk, hogy összesen hány találat van a keresőkifejezésre
●
Középen lapozhatunk a találatok között: A legelső/legutolsó találati oldalra ugrik
Az előző/következő találati oldalra ugrik A legördülő menüből választhatjuk ki, mely találatokat jelenítse meg A találati részletező közepén láthatjuk az egyes találatok, a könnyebb olvashatóság érdekében zebracsíkosan megjelenítve (fehér háttér és szürke háttér váltakozása):
Az egyes találatoknál látható információk: ● ● ● ● ●
láthatjuk a találat sorszámát (1.) a keresett kifejezést tartalmazó folyóirat nevét (2.) előnézeti képét (3.) a találatot tartalmazó könyvjelző nevét (4.), mely általában a cikk, tanulmány, rovat címe a találat szövegkörnyezetét (5.)
A találati részletező alján láthatóak ez előző keresések, melyekre kattintva azok között váltani lehet:
2
1.4. Betekintés az indexbe, csonkolás A keresés előtt nagyon fontos, hogy ellenőrizzük a kereshető fogalmakat. A WARCTIS program lehetőséget ad arra, hogy a keresett szó, vagy kifejezés gépelésekor azonnal betekinthessünk az indexbe, megnézhessük, hogy az általunk keresett fogalom szerepel-e magában az adatbázisban, és ha igen, hány alkalommal.
A listán szavakat látunk, melyek előtt az adatbázisban való előfordulásuk darabszáma jelenik meg. Ez az adott szó összes előfordulását megadja (a találatok száma ennél kevesebb is lehet, mivel a keresés során az oldalak darabszámát kapjuk meg eredményképpen, s amennyiben egy oldalon többször fordul elő a szó az csak egy találatot ad. Keresés előtt ellenőrizzük az eltérő írásmódokat, a ragozott alakokat, illetve az OCR hibáit. Lehetőségünk van szó, vagy kifejezések részleteinek keresésére is. Ezt akkor érdemes használni, amikor nem tudjuk, hogy a keresett szó egy összetett szó második tagjaként fordul elő. Például a MOZDONY kifejezésre keresünk, de összetett szavakban is meg akarjuk találni. Ekkor különösen érdemes a CSONKOLÁS jeleit használni:
* : tetszőleges számú karakter helyettesít ! : pontosan 1 karaktert helyettesít ? : 0 vagy 1 karaktert helyettesít A csonkolás jeleit bárhol használhatjuk, a szavak elején vagy végén, vagy a szavak belsejében. Leggyakrabban a * jelet használjuk, jellemzően a ragozott alakok megtalálására, de a ? is jó szolgálatot tesz a bizonytalan írásmódú alakoknál (pl. a régies ASZSZONY vagy az OCR során elválasztott ASZ-SZONY alakból is ASZSZONY lesz), így az AS?SZONY keresés jó néhány plusz találatot eredményezhet. A ! jel használatát leginkább a *!MOZDONY* keresésnél érthetjük meg, ez a MOZDONY utótagú összetett szavakat mutatja meg nekünk (ugyanis amennyiben csak *-ot teszünk a keresőszó elé, akkor az jelenthet 0 karaktert is, amennyiben ! jelet is betesszük elé, akkor biztosan megkapjuk pl. a GŐZMOZDONY találatot). Amennyiben megtaláltuk a keresett szót,azt többféleképpen is beírhatjuk, kombinálhatjuk más keresőszavakkal.
3
1.5 Keresés: csonkolás, operátorok Az index (az adatbázisban szereplő szavak) alapos tanulmányozása után itt az ideje, hogy keressünk. A keresés során a fent már megismert csonkolási jeleket használhatjuk. (*, ?, !), amennyiben nem csonkolunk az eredményként a teljes egyezést fogjuk kapni (MOZDONY illetve MOZDONY*, illetve *MOZDONY* eltérő eredményeket ad). A levéltári kiadványok esetén kereshetünk az összes szóra (SZAVAK index) illetve a könyvjelzőkre (CÍM, SZERZŐ index). A keresőszavakat az alábbi operátorokkal kapcsolhatjuk össze: ● A AND B: azokat az OLDALAKAT adja találatként, amelyekben mindegyik szó előfordul ● A OR B: azokat az OLDALAKAT adja találatként, amelyekben valamely szó előfordul ● A NOT B: azokat az OLDALAKAT adja találatként, amelyekben A szó előfordul, de B nem A fenti logikai (Boole) operátorok MINDIG egy OLDALON belül érvényesek, azaz egyrészt eredményként oldalakat kapunk, másrészt az AND (de a NOT és OR) hatóköre is egy oldal. A keresés finomítása érdekében szükségünk van további operátorokra, elsősorban az AND-nél szorosabban összetartozó, ún. közelségi operátorokra: ●
●
A Nw B: azokat az OLDALAKAT adja találatként, amelyekben A és B szavak között maximum N szó található és A megelőzi B-t. Amennyiben 2 szót operátor nélkül egymás mellé írunk a program A 0w B keresőkérdésként értelmezi. KOVÁCS 2w JÁNOS azokat az oldalakat adja találatként, ahol KOVÁCS és JÁNOS között maximum két szó van, így a KOVÁCS ISTVÁN JÁNOS találatot ad. A Nn B: azokat az OLDALAKAT adja találatként, amelyekben A és B szavak között maximum N szó található, A és B sorrendje tetszőleges, pl. a KOVÁCS 2n JÁNOS találatként adja (az esetleg idegen nyelvű) szövegben szereplő JÁNOS KOVÁCS kifejezést.
Az operátorokat és a csonkolási jeleket szabadon kombinálhatjuk, a program akár 100.000 találatot is néhány másodperc alatt létrehoz. ●
4
A--B: intervallumkeresés az A és B közötti összes szót visszakeresi (FIGYELEM! két kötőjelet kell használni).
1.6 Találatok megjelenítése, egyéb funkciók A PDF_View kezelőfelülete:
A keresés elvégzése után, a találati részletezőben egy találatra kattintva előjön a PDF_View ablak. Alapértelmezésben a megjelenítés a fenti képpel megegyező. A keresett szó/szavak kiemeléssel jelenítődnek meg, hogy könnyebben megtaláljuk. A kezelőfelület az alábbi részekből áll: 1. 2. 3. 4.
5
Oldalak nézet / Könyvjelzők nézet PDF_View navigációs eszköztár Adobe PDF eszköztár Az oldal megjelenítése
1.6.1 Nézetek
A nézetek panelen lehet az oldalak és a könyvjelzők nézet között váltani. Az oldalak nézetben az oldalak miniatűrjeit lehet látni és a hozzájuk tartozó fizikai oldalszámot (PDF-ben elfoglalt helyre vonatkozó); míg a Könyvjelzők nézetben lehet böngészni a tartalomjegyzékek és egyéb könyvjelzők között.
1.6.2 PDF_View eszköztár
A PDF View eszköztárban találhatóak azok a nélkülözhetetlen eszközök, melyek a találatok közötti navigáció és azok megjelenítési beállításait könnyíti meg: Ezekkel a nyilakkal léphetünk az előző / következő keresési találatra Itt lehet beállítani, hogy egyszerre egy oldal jelenjen meg (bal oldali gomb), vagy az oldal amelyik a találatot tartalmazza az azt követő oldallal (középső gomb), vagy az azt megelőző oldallal (jobb oldali gomb) együtt jelenjen meg 3. Itt lehet beállítani, hogy a a dokumentumot hogy igazítsuk az ablakhoz: szélességhez igazítás (bal oldali gomb), legjobb igazítás az ablakhoz (középső gomb), vagy magassághoz igazítás (jobb oldali gomb) 4. Erre a gombra kattintva menthetjük le a dokumentumot; megadhatjuk, hogy hányadik oldaltól hányadikig akarjuk lementeni (maximum 20 oldal); az Adobe eszköztáron levő mentés gombbal mindig csak az épp nézett oldalt (szeletetslice) tudjuk lementeni, ami maximum 2 oldal lehet. 5. Ezekkel a gombokkal navigálhatunk az dokumentum oldalai között; azért ezt a navigációs eszköztárat kell használni az Adobe eszköztárban található navigációs gombok helyett, mert technikai okokból egyszerre csak annyi oldalt jelenít meg az 1. 2.
6
oldal megjelenítése panelben a program, amennyi szükséges (1 vagy 2, elrendezéstől függően). A gombok sorrendben balról jobbra: Legelső oldal, Előző oldal, Következő oldal, Legutolsó oldal 6. A link, amit itt találunk, felhasználható ahhoz, hogy később az oldalt keresés nélkül elő tudjuk hozni; akár e-mailben is meg lehet így osztani oldalakat, avagy saját magunknak feljegyzésként. 7. A bal oldali résznél megadhatjuk, hogy pontosan melyik oldalt szeretnénk megjeleníteni; a jobb oldalon található gomb benyomásával rögzíteni tudjuk az aktuális találati oldalt, azaz a rögzítéssel az érhető el, hogy egy másik találatot ne ugyanebben az ablakban próbáljon megjeleníteni a program, hanem nyisson egy másikat.
1.6.3 Adobe PDF eszköztár Az itt megjelenő Adobe PDF eszköztár megegyezik az Adobe Reader vagy más PDF néző alkalmazás alapvető funkciót biztosító eszköztárával, ami fontos lehet, az a keresőmező: amit ide beírunk, az a megjelenített oldalon keresi meg a szavakat, és találat esetén kiemeli azokat.
1.6.4 Oldal megjelenítése Az oldal megjelenítése panelben a találati részletezőben történt kattintás után a keresett találat kiemelve látszik. A megjelenítést változtatni a PDF_View eszköztárban vagy az Adobe PDF eszköztárban lehet.
7
2. Gyakran Ismételt Kérdések Mi szükséges az ADT megtekintéséhez? Az ADT teljes értékű használatához szükséges az alábbi böngészők egyike: ● Internet Explorer 8 vagy újabb ● Mozilla Firefox 3.0 vagy újabb ● Google Chrome ● Opera ● Safari Szükséges továbbá az Adobe Reader vagy Adobe Acrobat alkalmazás 8-as vagy 9-es változata. A keresett szöveg kiemelése csak ezekben a verziókban működik rendesen, a 10-es verzióban ezt a funkciót kivették (Adobe Reader X – 10-es verzió). Az Adobe Reader 9-es verziójánál pedig alapértelmezésben a keresés utáni kiemelés le van tiltva, de ezt vissza lehet kapcsolni: Indítsuk el az Adobe Reader 9 alkalmazást A Szerkesztés menü Beállítások menüpontját választva eljutunk a beállításokhoz (2.) 3. A bal oldalon levő menüsorban a Keresés menüpontban be kell pipálni a jelölt funkciót: „Külső kiemelési kiszolgálóról származó keresési kiemelések engedélyezése” (3.) , majd az OK gombbal véglegesíteni a változtatást és kilépni az alkalmazásból. 4. Ezután javasolt újraindítani az egész gépet a változtatások érvénybe léptetéséhez. 1. 2.
8
Chrome-on miért nem működik az ADT rendesen? Az ADT megjelenítése a web-böngésző által PDF nézésre használt technológiától függ elsősorban. A Google Chrome a PDF-eket alapértelmezésben a saját motorjával, sandbox-ban (biztonságos környezet) jeleníti meg, amivel nem teljesen kompatibilis sem a kiemelés funkció, sem a 3.6.2-ben részletezett PDF_View eszköztár. Erre megoldás, ha az Adobe Reader 8 vagy 9 van telepítve, ez esetben a Chrome elavultnak érzékeli az Adobe Plugint, és ezt a felső részen levő információs sávban jelzi is. A lehetőségek közül a Futtatás Most-ot kell választani, és működni fog Chrome alatt is a kiemelés és a PDF_View eszköztár is.
Ha nem jön elő ez a választás, akkor le van tiltva az Adobe Reader plugin, és a Chrome beépített PDF-néző plugin aktív. Ezt a következőképp állíthatjuk át: Írjuk be a címsávba, hogy „about:plugins”, és az oldalon
kapcsoljuk ki a „Chrome PDF Viewer”-t (1.) és kapcsoljuk be a „Adobe Acrobat” plugint (2.):
Továbbá ha nem akarjuk, hogy minden egyes oldalnál rá kelljen kattintani a Futtatás Most-ra, hogy megjelenítse az pdf-et, akkor a Chrome-ot az alábbi parancssori argumentummal kell indítani: --allow-outdated-plugins
Ezt a parancsikon tulajdonságainál lehet módosítani, a jobb oldali képen jelölt helyre kell beírni.
9
3. WARCTIS keresőprogram technikai kérdései Jelen dokumentáció az ARCANUM Adatbázis Kft. által fejlesztett WARCTIS általános célú keresőprogram egy speciális alkalmazásának, az ARCANUM Digitális Tudománytár (ADT) felhasználói szintű ismertetését tartalmazza. Az ADT rendszerben ún. kétrétegű PDF-eket találhatunk, amelyek olyan PDF-ek, amelyek felső (látható) rétegét a szkennelt hiteles kép, alsó rétegét pedig az automatikusan felismert (OCR) szöveg alkotja. Ennek köszönhetően a felhasználó minden esetben az eredeti dokumentum hiteles oldalképét látja, és egyúttal lehetősége van az OCR technológiával előállított digitális tartalomhoz történő hozzáféréshez is.
A szolgáltatás teljes szövegű keresést biztosít, ami nagyban hozzájárul ahhoz, hogy a kívánt információhoz kényelmesen, gyorsan és teljes egészében lehessen hozzájutni. E mellett számos hasznos funkció segíti a felhasználót legyen az diák, kutató, vagy „egyszerű” érdeklődő. Alaphelyzetben az adatbázis teljes tartalmában keresünk, de keresésünket szűkíthetjük évkörre, sorozatokra, ill. külön böngészhetjük a tartalomjegyzékeket is. Lehetőségünk van szótávolsági keresésre, több szavas keresésre logikai operátorok használatával. Segítségünkre van továbbá az „Index” betekintési funkció, ami már a keresési kifejezés gépelése közben felkínálja a lehetőségeket nekünk.
Keresésünk eredményét listába rendezve, rövid szövegkörnyezettel együtt látjuk, a találatokat pedig a program kivilágítja a szövegben is. Fontos, hogy a pontos oldalhivatkozások is mindig rendelkezésünkre állnak, így a digitális szöveg minden szempontból kiválthatja a papír alapú változatot.
Az indexekben rövid ékezetes nagy betűket használunk, nincs tehát í, ó, ő, ű, csak i, o, ö, ü – ugyanakkor a keresés során a hosszú ékezettel írt szavakat is megtaláljuk.
10
4. Az ADT adatszerkezete Az ADT rendszer kétrétegű PDF-eket, jelenleg elsősorban folyóiratokat, tartalmaz. Egy PDF fájl adott folyóirat egy évfolyamát tartalmazza. A PDF-eknek címük van (pl. Magyar Nyelv – 1. évfolyam – 1905), néha (tematikus számok esetén) szerzőjük vagy szerkesztőjük. Ezek az adatok a PDF leíró fejlécében találhatók (TITLE illetve AUTHOR). A PDF-ek emellett könyvjelzőket tartalmaznak. A könyvjelzők egyik típusa az OLDALSZÁMOK nevet viseli. Segítségével az adott folyóirat adott évfolyamának adott oldalára ugorhatunk. A folyóiratok számozása nagyon sokféle lehet, jellemzően azonban adott éven belül folyamatos számozásúak. Különösen régi folyóiratok esetén tipikus, hogy a lapszámok fedőlapjai nem kerültek bekötésre, így egy folytonos sort alkotnak, más esetekben (és általában a friss anyagoknál) a lapszámok címlapjai is digitalizálásra kerültek. Ezek, illetve a nem számozott oldalak azonosítása az előtte található utolsó számozott lapszám segítségével történik (pl. 34u_1, 34u_2 a 34. oldal utáni 1. illetve 2. oldal). Előfordulnak olyan folyóiratok, amelyek lapszámonként oldalszámoznak, ezek esetén a könyvjelző a lapszám azonosítóját is tartalmazza. A könyvjelzők másik típusa a TARTALOMJEGYZÉK. Ez az adott folyóiratban található cikkek szerzőit és címeit tartalmazza. A feldolgozásnál két fajta tartalomjegyzéket különböztetünk meg: lehet éves és lapszámos. A régi évfolyamok esetén általában az éves tartalomjegyzék áll rendelkezésre, újabb évfolyamok esetén az egyes lapszámoké. Az éves tartalomjegyzékek szerkesztettek, gyakran cikktípusonként, azon belül a szerzők ABC rendjében követik egymást, a cikksorozatok egymás mellé kerülnek, és csak az oldalszámok utalnak az egyes részekre. Éves tartalomjegyzék esetén sokszor összefoglaló címek (pl. ÉRTEKEZÉSEK, KÖNYVISMERTETÉS) található. Általában a könyvjelzők arra szolgálnak, hogy rákattintva az adott címhez ugorjunk, ezek a köztes címek nem kattinthatók, csak az alattuk lévő valódi cikkek. Ugyanez fordul elő a többrészes cikkeknél, ott is csak az egyes oldalszámokon ugorhatunk a cikk szerzőjén és címén nem. Értelemszerűen a lapszámos tartalomjegyzékek kevésbé szerkesztettek, ekkor a tartalomjegyzékben az egyes lapszámok sorszáma (1. szám, 2. szám) alkotja az első szintet a szerző-cím pedig a következő szintre kerül. Bizonyos esetekben (pl. közlönyök) nincs tartalomjegyzék (csak OLDALSZÁMOK, ill. lapszám, dátum).
A fentiek alapján az ADT adatbázis szerkezete: Rekord: egy oldal Mezők: ●
az oldal szövege
●
az adott oldalhoz tartozó könyvjelzők
Indexek: (mindegyik szavas)
11
●
SZAVAK: minden szó
●
Cím, szerző: a könyvjelzők szavai