5. INDEXELÉS
Összeáll. dr. Pálvölgyi Mihály. BDF KIT, 200607. tanév, 1. félév
TARTALOMJEGYZÉK 5. 1. AZ INDEX FOGALMA, TIPIZÁLÁSA 5.2. AZ INDEXEK RÉSZLETES TIPIZÁLÁSA 5.3. A KULCSSZÓINDEX FOGALMA, TÖRTÉNETE, TÍPUSAI 5.4. SAJÁTOS INDEX-ALKALMAZÁSOK: PRECIS INDEX ÉS HIVATKOZÁSI INDEX 5.5. INTERNETES KERES SZOLGÁLTATÁSOK
5.1. Az index fogalma, tipizálása
5.1.1. Az index fogalma 5.1.2. Az indexek tipizálási szempontjai
5.1.1. Az index fogalma Az index latin eredet szó. Jelentései: egyetemi, f iskolai leckekönyv, járm n irányjelz kar vagy villogó lámpa, tiltott könyvek jegyzéke. A Magyar értelmez kéziszótár a szónak összesen 8 jelentését különbözteti meg. A jelentései közül egyik: név-, tárgy-, és szómutató, azok a mutatók, melyek a könyvek, repertóriumok, bibliográfiák végén találhatók és lehet vé teszik, hogy azokban szerepl /személy, testületi, földrajzi stb./ neveket, tárgyszavakat stb. gyorsan és kényelmesen visszakereshessük.
5.1.1. Indexelési alapfogalmak: a könyvvégi index A könyvvégi index /back of the book index) az angolszász kiadványokban már évtizedek óta a szakkönyvek, tankönyvek szerves tartozéka és gondos indexkészítési, indexelési folyamat eredménye. Magyarországon ez a gyakorlat napjainkban kezd csak általánossá válni. IKNY-jegyzetünkben már ezt alkalmaztuk 1998-ban. Az indexelésnek e jelentése egyedi dokumentumokban rögzített információik feltárásával kapcsolatos.
5.1.1.Indexelési alapfogalmak: indexel nyelv Angolul Indexing language A természetes nyelvb l származó „ellen rzött” fogalmak halmaza, mely a dokumentumok tartalmának tömör kifejezésére, képviseletére szolgál. [ISO 2788:1986; and ISO 5964:1985]A szabvány hozzáteszi: a posztkoordinált rendszerben e kifejezéseket a keresési célt szolgáló „kulcszavaknak” nevezik, melyek esetében általában nem tesznek kísérletet arra, hogy a köztük lev szintaktikai kapcsolatokat jelöljék. NOTE [from ISO 5964:1985]
5.1.1. Indexelési alapfogalmak: indexek Az indexek - különböz osztályozási m veletek végtermékei, a dokumentum tartalmát és egyéb jellemz it leíró szóláncok – indextételek rendezett gy jteményei, (Környei, 1990. 55. p.) melyek funkciója, hogy elvezessenek bennünket a számunkra releváns dokumentumokhoz /kognitivumokhoz.
5.1.2. Az indexek tipizálási szempontjai Az indexeket, különösen, ha önállóan jelennek meg, indexm veknek is szokták nevezni. Mi a továbbiakban az index kifejezést részesítjük el nyben. Az indexeket négy f szempont szerint csoportosítjuk: az alkalmazott nyelv szabályozottsága szerint az indexben kereshet ismérvek szerint az index el állítási módja szerint az indexben feldolgozott és kereshet anyag id korlátai szerint A felosztási szempontok megválasztását információfeldolgozási, információkeresési szempontok egyaránt indokolják
5.2. AZ INDEXEK RÉSZLETES TIPIZÁLÁSA 5.2.1. a keres nyelv szabályozottsága szerint 5.2.2. a kereshet ismérvek szerint 5.2.3. a feldolgozás id spektruma szerint 5.2.4./5. az el állítás és alkalmazás módja szerint
5.2.1. Indextípusok az alkalmazott keres nyelv szabályozottsága szerint 5.2.1.1. Kulcsszóindexek 5.2.1.2. Tárgyi indexek Ld. táblázatosan a következ lapon!
5.2.1. Indextípusok az alkalmazott keres nyelv szabályozottsága szerint … folyt. Típus neve
Szabályozottság mértéke
Példák
Kulcsszóindex ”címindex”
kötetlen szókészlet, nem vagy alig ellen rzött
kulcszszavas KWIC-index, KWOCindex
Tárgyi index /tárgyszóindex/
Kötött szókészlet, szabályozott IKNY-szótár alapján kiválasztva
Permutált tárgyi index, Lánceljárásos tárgyi index PRECIS-index
5.2.2. Indextípusok a kereshet ismérvek szerint 5.2.2.1. A kereshet ismérvek köre Lényegében a forrásokban szerepl bármilyen típusú adatok, ismérvek, információk kereshet : személynevek (mint szerz k, v. mint a forrásban tárgyalt személyek), intézmény-, földrajzi nevek, tárgyi-tematikus megnevezések stb.
5.2.2.2. A hivatkozási index sajátosságai egyaránt kereshet k benne a szerz k, illetve azok a személyek, akikre a munkájukban hivatkoztak, valamitn azok, akik a szerz kre a kés bbiek során hivatkoztak, s természetesen kiegészülve tematikus-tárgyi stb. keresési lehet ségekkel – a tudományos elismertség szempontjából is
5.2.3. Indexek a feldolgozás id spektruma szerint 5.2.3.1. Rövid történeti áttekintés
A múltban általában külön vált az ujdonságokat bemutató – kurrens indexek (melyek bizonyos id közökben – hetente, havonta, stb. jelentek meg), és a hosszabb id szakokra vonatkozó visszamen leges keresést biztosító – retrospektiv indexek köre.
5.2.3.2. A kurrens és retrospektív keresés integrációja Az elektronikus források és szolgáltatások fejl désnek köszönhet en a kétféle keresés – (csak az újdonságok keresése, illetve a teljes forrásbázison alapuló keresés) integrált, azonos felületen jelenik meg, kialakulnak a kurrens anyagra való korlátozott keresés módszerei és eszköze
5.2.4. Indextípusok az el állítás módja szerint 5.2.4.1. Kézi és gépi indexek és jellemz ik 5.2.4.2. Az adatbázisok indexei a készítés és használat módja szerint 5.2.5. Indextípusok az alkalmazás módja szerint
5.2.4.1. Kézi és gépi indexek és f jellemz ik, példáik Index típusa
Jellemzés
Példák
Kézi indexek Manuális munka, nagy id - könyvindexek, pl. és munkaigény szerz i mutató, tárgymutató Gépi indexek Gépi munka, Automatizált Kisebb id igény, Indexek automatizált vagy félig automatizált
címindex, tárgyszóindex, hivatkozási index internetes indexel rendszerek
5.2.4.2 Adatbázisok indexei – készítés módja szerint Készítés Az egyes indexek készítése során az adatbázis-kezel program azokból a szavakból, amelyek az adatbázis formájára, tartalmára és egyéb jegyeire utalnak (pl. a szerz nevek, címek, kulcsszavak, tárgyszavak, nyelvek, kiadási évek stb.) bet rendbe rendezett listákat készít…… minden szó mellé odaírja, hogy hányszor fordul el , hányadik rekordban és azon belül pontosan hol található. Ez az információ teszi lehet vé a gép számára, hogy a program azonnal, sorbaolvasás nélkül ráálljon a kért rekordra.
5.2.4.2 Adatbázisok indexei keresés módja szerint Használat, keresés feltételei, módja: Az index segítségével a program több millió rekord közül is képes rövid id alatt megtalálni a szükségeseket. A keresés alkalmával beírt szerz név, tárgyszó, kulcsszó stb. mellett eredményként el ször az el fordulás száma jelenik meg a képerny n. Ez alapján az megjeleníthet , vagy a találati lista más index kombinált alkalmazásával sz kíthet . Példák: magyar: MANCI, angol: ERIC
5.2.5. Indextípusok az alkalmazás módja szerint Az indexek alkalmazásában korábban az önálló indexm veknek, a nyomtatott indexeknek volt domináns szerepe, ma már inkább a nagy adatbázisok, vagy az OPAC-ok keres rendszerének fontos összetev i, a kialakított komplex indexrendszerekkel (kulcsszó, tárgyszó, deszkriptor, név, kiadás éve, stb.). Ezekben élni lehet mind az egyszer , mind az összetett (haladó) keresés lehet ségeivel, mind pedig gyakran a böngészés lehet ségével. . Legsikeresebb alkalmazásaikban jól ötvöz dnek az intellektuális emberi munka és az automatizálás adta lehet ségek. Példák: Thompson Dialog keretében hozzáférhet indexek http://support.dialog.com/searchaids/essentials.shtml H. W. Wilson Company indexei, http://www.hwwilson.com/ftabsind_alpha.htm A nemzetközi adatbázis-szolgáltatók indexel szolgáltatásai kiegészülnek referátumokkal, recenziókkal, melyeket szakemberek készítik, és ez garancia a jó min ségre. Egyre szélesebb körben nyújtanak lehet séget a teljes szöveg elérésére.
5.3. A KULCSSZÓINDEX FOGALMA, A KWIC-INDEX, ÉS EGYÉB KULCSZAVAS INDEXEK 5.3.1. A kulcsszóindex fogalma 5.3.2. KWIC-index 5.3.3. Egyéb kulcszavas indexek: KWOC-index, permuterm-index
5.3.1. A kulcsszóindex fogalma, története, válfajai 5.3.1.1. A kulcsszóindex fogalma, megjelenése 5.3.1.2. A kulcsszóindex jellegzetességei, válfajai
5.3.1.1. A kulcsszóindex megjelenése, fogalma 1. -
A kulcsszóindex olyan index, melynél az indexelés során közvetlenül a dokumentum címéb l, szövegéb l vagy referátumának szavaiból választjuk ki az osztályozási kifejezéseket /keres nyelvi szavakat – esetünkben a kulcsszavakat/. - Ezeket mellérendel módon kombináljuk, s az indexsor végén megadjuk a vonatkozó forrás lel helyét. - A kulcsszóindex esetében fontos a szövegkörnyezet: a kulcsszavak a bet rendes keresést biztosító indexkiadványokban nem önmagukban, önállóan állnak, hanem együtt, „egy sorban” a kulcsszavas indextétel többi szavával, tehát „szövegkörnyezetben”. Ld. még 5.3.1.2
5.3.1.1. A kulcsszóindex megjelenése, fogalma 2. A kulcsszóindexek megjelenésének két f tényez je: /1/ az a II. világháborút követ en terjed mozgalom, mely jelszavául t zte ki, hogy az indexelés és keresés céljára a kötött nyelv IKNY-ek helyett a kötetlen természetes nyelvet használják, /2/ a technikai feltételeket biztosító számítógép kifejlesztése. Mortiber Taube 1953-ban kifejlesztette uniterm rendszerét, amelynek egyik lényegi jellemz je az volt, hogy indexel kifejezésnek a szerz k által az eredeti dokumentumokban használt szavakat tekintette. /2/ a fenti elveknek megfelel indextípus készítéséhez szükséges számítógépek kifejlesztése.
5.3.1.2. A kulcsszóindex jellegezetességei, válfajai A kulcsszóindexeknek az a közös jellegzetessége, hogy a feltárni kívánt dokumentumok tartalmának leírására (1), a dokumentum eredeti címét, (2), vagy/és részben módosított, kiegészített címét, (3), vagy/és mesterségesen alkotott m címét/ tartalmi cím/ használják fel. A kulcsszóindexek két f formája a KWIC-index és a KWOC-index. A KWIC-indexben a kulcsszavak közvetlenül szövegkörnyezetbe ágyazva találhatók meg a bet rendben, a KWOC-index esetében kiemelten, majd ezt követ en a teljes szövegkörnyezetet biztosító indextételben. Mindkét típus viszonylag olcsón készíthet és gyors keresést, böngészést tesz lehet vé. Jellegzetességeikre, különbségekre a szemináriumokon utalunk.
5.3.2. A KWIC-index lényege, szerkezete, jellemz i 5.3.2.1 A KWIC-index lényege 5.3.2.2. Az indexsor szerkezete
5.3.2.1. A KWIC-indexe jellemzése Módszerét Hans Peter Luhn 1958-ban dolgozta ki és 1960-ban tette közzé az IBM megbízásából. A KWIC bet szó az angol KeyWord-In-Context rövidítése, magyarul Kulcsszó szövegkörnyezetben, szövegkörnyezetes kulcsszó index. Magyarországi alkalmazására jó példa a Tudományos és M szaki Tájékoztatás c. folyóirat éves indexe, melyben tematikusan a KWIC-index alapján lehet keresni. Alkalmazásának fázisai: (1) szellemi el készítés: az indexel a cím, referátum, szöveg alapján megalkotja a kulcsszavas indextételt, a kiegészít adatokkal ( a hivatkozott forrás típusa, helye a folyóiratévfolyam száma, a lapszámok). Mindezt a folyóiratban megjelent összes tanulmányra, referátumra stb. vonatkozóan el kell készíteni. (2) gépi indexgenerálás: a fentiek alapján elkészített kulcsszavas indextételekb l a gép el állítja a KWIC-indexet. Eközben stoplistát is igénybe vesz, melyben azok a szavak szerepelnek, melyek alatt a tételek semmi esetre sem kerülnek beosztásra az indexbe, mert nincs tárgyi-tematikus „keres értékük” (pl. nével k, töltelékszavak stb.) (3) Használat/ keresés – a használó a számára releváns témaköröket/kulcsszavakat a keres oszlopok segítségével a bet rendes indexben megkeresi, a szövegkörnyezetüket megnézi, és eldönti, hogy számára érdekes-e az adott tétel
5.3. Permutáció a KWIC-indexben A permutáció véges számú dolog, tárgy, általában elem valamilyen sorrendben való elrendezését jelenti. Legyenek az indextétel szavai – a permutálandó elemek : a, b, c, d. Ezek a legkülönfélébb sorrendben rendezhet k egymással, pl. abcd, acdb, badc, dcba - az összes permutációk száma 24 lenne. Kapacításokok miatt általában a permutációnak egy, speciális esetét vesszük igénybe, az un. ciklikus permutációt /”rotációt”/ - eszerint a sorrend változatlanul marad, de a rotáció következtében mindig más elem kerül el re: abcd, bcda, cdab, dabc
5.3.3. Egyéb kulcsszavas indexek
5.3.3.1. A KWOC-index lényegi jellemz i 5.3.3.2. A KWOC-index tétel felépítése 5.3.3.3. Permuterm /subject / index
5.3.3.1. A KWOC-index lényegi jellemz i
A címindexek másik, széles körben ismert, de kevésbé elterjedt típusa. A KWOC jelentése: Key-Word-Out of Context, azaz „Kulcsszó a szövegkörnyezetb l kiemelve „. Lényegesen kés bb alakul ki, illetve vált népszer vé, mint a KWIC: Kiküszöböli a KWIC f hátrányait ( a korlátozott sorhosszúságot, illetve azzal összefüggésben a teljes indextétel egyben látásának hiányát. A KWOC-indexben a kulcsszót els lépésben kiemelik a szövegkörnyezetb l, közvetlen az indextétel felett található. Ezt követi a következ sortól a teljes indextétel a teljes szövegkörnyezettel, az eredeti sorrendben
5.3.3.2. A KWOC-index tétel felépítése Kiinduló indextétel: Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés Ahogy a KWOC-indexben megjelenik …… Információkeresés Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés …… Könyvtári katalógusok Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés …… Online könyvtári katalógusok Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés …… Természetes nyelv információkeresés Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés stb.
5.3.3.3. Permuterm /subject/ index Egyesek a kulcsszavak közé sorolják a Permuterm /subject / indexet, mely kulcsszópárokkal operál. Legegyszer bb esetben a kulcsszavak a dokumentum szövegéb l /ritkábban szövegéb l/ származnak. Ez a fajta index ugyanakkor közel áll/hat/ a tárgyi indexekhez, mivel a cím szavait bizonyos szabályozásnak vet/het/ik alá, pl. ragozott alakok helyettesítése, szinonimák egységesítése. A permuterm subject index alkalmazhatja „lásd „ típusú utalókat is.
5.4. SAJÁTOS INDEX-ALKALMAZÁSOK, PRECIS, HIVATKOZÁSI INDEX 5.4.1./3 A PRECIS lényegi jellemz i 5.4.4. A hivatkozási index fogalma, jellemz i
5.4.1./3 A PRECIS-index lényegi jellemz i A PRECIS a tárgyi indexek közé tartozik. A PRECIS bet szó a Preserved Context Indexing System rövidítése, amely „szövegösszefüggést megtartó indexelési rendszer”-t jelent. Az angol Austin dolgozta ki 1971-t l kezd d en. Lényegében grammatikai szabályok összesége, és az indextétel felépítése a természetes nyelv mondat szerkezetére hasonlít. Magyarországon az Országos Pedagógiai Könyvtár és Múzeum /OPKM/ alkalmazta 1986-tól a magyar pedagógiai szakirodalom feltárására az 1990-es évek végéig.
5.4. 5.4.1./3 A PRECIS-index lényegi jellemz i folyt. - A PRECIS szerinti elemzés során rövid tárgyi kijelentéseket kell megfogalmazni a dokumentumokról. Ezeket nyelvi-logikai elemzésnek vetjük alá, sorra megvizsgálva, hogy mi a kijelentés „mondat” állítmánya /cselekvés/, tárgya, alanya, id határozója, helyhatározója... - Az alapvet fogalmakat kijelölésük után a program a rekordokban „megforgatja”, mely során azok vezet , módosító, vagy kiegészít pozicióba kerülhetnek. Az egyes kielemzett „mondatrészek” jelentik az összetev ket, amelyeket a gép kidolgozott szabályrendszerrel kódok, operátorok stb. révén kezel.
5.4. 5.4.1./3 A PRECIS-index lényegi jellemz i folyt. – indexelési példa A dokumentum tárgya: Az informatika tanulása CD-ROM-mal Mi a cselekvés, mi történik? – Tanulás. Mi a cselekvés tárgya? Informatika Mivel tanulnak? - CD-ROM Az indexelés eredménye: (1) informatika (2) tanulás (3) CD-ROM
5.4.4. A hivatkozási index fogalma, jellemz i folyt. A hivatkozási index az az indextípus, mely a dokumentumok tartalmi jellemzésére nem azoknak a címét, vagy szövegét használja fel, hanem – áttételesen – azokat a dokumentumokat, amelyekre az /bibliográfiákban, lábjegyzetekben, vagy másutt / hivatkozik. Ha ismerem egy szerz nevét, aki az engem érdekl témáról írt, és meg tudom nézni, hogy rá kik hivatkoztak, valószín , hogy a hivatkozó szerz k dokumentumai is érdekesek számomra. Természetesen számolni kell azzal, hogy a hivatkozási indexbe csak a szigorú szelekciós követelményeknek megfelel tudományos folyóiratokban megjelent cikkek kerülnek be.
5.4.4. A hivatkozási index fogalma, jellemz i folyt. A hivatkozási index számítógéppel készül, munkafolyamatai nagyrészt automatikusak. Adottak a szerz k, a dokumentumok, a bennük lev hivatkozások, s adottak más dokumentumokban a rájuk való hivatkozások. Mindezt gépbe kell vinni, és sokféle szempont (hivatkozó szerz , hivatkozott szerz , témakör, intézmény stb.) szerint kereshet vé tenni. Az indextípus els képvisel je: a Science Citation Index /természettudományi hivatkozási index/ 1964-t l jelenik meg az ISI /Institute for Scientific Information/ nyomtatott kiadásában. Napjainkban adatbázis / Web of Science (WoS) keretében férhet hozzá sokkal kényelmesebben. A keresés 1975-ig visszamen en a teljes bázison (több mint 25 millió dokumentum) nyugszik. F iskolai hallgatóként regisztráció után használhatja az adatbázist az Oktatási Minisztérium EISZ honlapján: http://www.om.hu/eisz
5.5. INTERNETES KERES SZOLGÁLTATÁSOK 5.5.1. Az internetes keres szolgáltatások kialakulása, fejl dése 5.5.2.Az indexel szolgáltatás fogalma, sajátosságai 5.5.3. Igények, használók, szolgáltatók és típusok 5.5.4. A feltárás dokumentumbázisa 5.5.5. A feltárás stratégiája, módszerei és eszközei, metaadatok 5.5.6. A keresés jellemz i, szintjei, módszerei 5.5.7. Az értékelés, fejlesztés kérdései
5.5. INTERNETES KERES SZOLGÁLTATÁSOK
e témakör tömör feldolgozásához, kérem, egyénileg használják az elektronikus tananyagot.
KÉRDÉSEK Tanulmányozza az elektronikus anyagban szerepl 21 kérdést, és legyen képes azokra választ adni!
Jó felkészülést kíván
A szerz