Online információkeresés Dr. Nyéki Lajos 2016
Dokumentum és információ • A dokumentum az ismeretek lelőhelye, hordozója. • Az információkeresés viszont nem dokumentumokra irányul. • A dokumentumgyűjtemények mellett ezért megjelentek az információgyűjtemények (bibliográfiák, referáló lapok, katalógusok, stb.).
Relevancia és zaj • A relevancia és a zaj az információkereső rendszerek alapvető fogalmai. • Az információkeresés során kapott dokumentumok alkotják a találati halmazt. • Relevánsnak tekintünk egy dokumentumot, ha a felhasználó számára információt hordoz. • Zajnak tekintjük a kapott dokumentumok azon részét, amely nem releváns a felhasználó számára.
Számítógépes információkereső rendszerek • A könyvtári adatbázisban két funkcionális adatállományt hoznak létre: - a bibliográfiai adatállományt, - az invertált adatállományt. • Az adatbázis bibliográfiai adatállományában egy dokumentumot egy rekord reprezentál. • Az ismérvek a rekordon belül különböző adatmezőkben helyezkednek el.
Számítógépes információkereső rendszerek • Az információkeresés a bibliográfiai adatállományban soros jellegű. • A keresés gyorsítását szolgálja az invertált adatállomány kialakítása. Ennek egységei az ismérvek. • A két adatállomány között azonosítók biztosítják a kapcsolatot. • Az invertált adatállomány betűrendes elrendezésű.
A keresés fő lépései • Az adatbázisokban való keresés fő lépései: - A felhasználó információs igényének meghatározása, a keresőkérdés megfogalmazása; - A keresési stratégia kidolgozása, a profilszerkesztés; - A keresés végrehajtása, lefuttatása.
A keresőkérdés megfogalmazása • A felhasználó által keresett téma pontos, szabatos megfogalmazása. • Tisztáznunk kell, hogy kívánjuk-e korlátozni a keresést (nyelv, időszak, dokumentumtípus). • Döntenünk kell, hogy minden releváns rekordot vagy csak a releváns rekordokat szeretnénk megkapni. • Az első esetben zajos, a második esetben hiányos lesz a találati halmaz.
A keresési stratégia kidolgozása • A természetes nyelven megfogalmazott keresőkérdés számítógépes keresésre való átalakítása. • A keresőprofil a keresőkérdés gépi információkeresésre alkalmassá tett változata. • A keresőprofil elemei a keresőszavak, a logikai operátorok és más, a keresést segítő elemek (csonkolás, korlátozás, stb.).
A profilszerkesztés lépései • A keresőszavak kiválasztása (tárgyszójegyzék, tezaurusz, saját kútfő, az adatbázis adatmezői, az invertált adatállomány ismérvei alapján). • A keresőszavak összekapcsolása megfelelő logikai operátorok (az ÉS, a VAGY és a NEM) segítségével. • A keresés korlátozása. • A csonkolás.
A tezaurusz • Az információs tezauruszok - egy-egy szakterület természetes nyelven kifejezett fogalmainak szótárai. • A fogalom magyarázata mellett megadja a kapcsolódó fogalmakat is. • A tezaurusz a fogalmakat betűrendben tartalmazza.
Logikai operátorok A AND B jelentése: a rekordok azon halmaza, amelyben az A és a B fogalom együttesen előfordul.
A OR B jelentése: azon rekordok összessége, amely vagy az A, vagy a B fogalmat, vagy mindkettőt tartalmazza.
A NOT B jelentése: azok a rekordok, amelyekben az A fogalom előfordul, kivéve ebből azokat, amelyekben a B fogalom is jelen van.
A keresés korlátozása • Korlátozhatjuk a keresést oly módon, hogy a megadott keresőszavunk csak akkor vegyen részt a keresésben, ha a rekordok egy általunk megadott adatmezőjében szerepel. • Pl. a szerző adatmezőben legyen a keresett név. • Pl. az évszám mezőben 2011 szerepeljen.
A csonkolás • Lehetőség van arra, hogy a keresőszót csonkoljuk. • Az adatbázisban keresőszavaink egyes és többes számú alakjai is előfordulhatnak: pl. iskola, iskolák iskol* • Csonkolással elérhetjük, hogy egy adott keresőszó összes szóösszetételére kiterjesszük a keresést: pl. iskola* iskolatitkár, stb. • Bizonytalanok vagyunk a keresőszó helyesírásában: b*te
Az ERIC digitális könyvtár • ERIC (Educational Research Information Center), a világ legnagyobb oktatással kapcsolatos digitális könyvtára • Elérhetősége: http://www.eric.ed.gov/
Az egyetemi OPAC • OPAC (Online Public Access Catalog). http://hunteka.sze.hu/monguz/ • Böngészés: A böngészés az adatok betűrendes jegyzékében való tallózást (keresést) jelent. (szerző, cím, tárgyszó, stb.) szerint. • Keresés: A keresés funkció lehetővé teszi rekordok megtalálását az Ön által megadott keresőkérdéssel.