Osztályozási rendszerek, rendszerek információkereső nyelvek y I Darányi Sándor SZTE BTK Könyvtártudományi T Tanszék ék
A tantárgy célja • A tantárgy az információkeresést elösegítö ismeretábrázolás hagyományos és automatizált formáit tekinti át – Az ismeretszervezést elökészítö formai és tartalmi feltárás eszközeire és módszereire összpontosít: • Azokra az értelmezési eljárásokra, amelyekkel a dokumentumokat a könyvtárakban és információs szolgáltatásokban elemezni szokás, illetve • Az így létrejövö osztályozási rendszerekre.
• A megértést segítö áttekintés, szemléleti alapozás a könyvtári y gyakorlathoz gy
I rész: Körkép I. •
A könyvtári osztályozás a rend tudománya –
•
Az emberiség két egyetemes álma: – – –
•
Kozmosz = rend ((a.m. világrend); g ); kozmein = 1. berendezni, rendbehozni, 2. szépíteni (-> kozmetika)
A rendezés egyetemes probléma –
•
Rend R d Közös nyelv, vö. Leibniz (1746-1716) characteristica universalis-a vagy Frege (1848-1925) Begriffschrift-je A 20. sz. sz.-ra ra a kettö összefügg
Rend: Hérakleitosz ún. kozmikus töredékeiben jelenik meg az európai filozófiában elöször –
•
Várkonyi Nándor (1896-1975)
Ilja Prigozsin (kémiai Nobel-díj 1977) szerint i t minden i d emberi b i ttevékenység ék é 30 %-át ez teszi ki
Az elsö részben körkép a könyvtárról
Átalakuló könyvtárak •
•
•
A könyvtárnak kö tá k régen é megõrzési funkciója volt, ma emellett elsõsorban információkat gyûjt gyûjt, tárol és szolgáltat Különbözö irányokból külö bö ö szemléletü különbözö lél tü é és érdekü szakmai közösségek támadják és igyekeznek helyettesíteni a könyvtár helyettesíteni, fogalmát kikezdve, átértelmezve, mással helyettesítve Társadalmi és szellemi kihívások ütközözónája
A nyomtatástól az egyetemes bibliográfiai számbavételig •
Johannes Gutenberg (kb. 14001468), német aranymüves és nyomdász, neki tulajdonítjuk a mozgatható th tó betükészlettel b tüké l tt l való ló nyomtatást Európában (kb. 1450), valamint a nyomdászat gépesítését általában. Fömüve az ún. Gutenberg Biblia. Biblia
•
Konrad Gessner (1516 –1565) svájci természettudós, ”a bibliográfia atyja”. Bibliotheca universalis (1545): az ö koráig valaha élt valamennyi szerzö katalógusa latinul latinul, görögül és héberül héberül, müveik címleírásával, kb. 3000 tétel tematikus elrendezésben.
A szervezés/rendezés kényszere kényszere... • ...mélyen emberi, vszg. ösztön. ”Az emberi gondolkodás alapformája” (Babiczky – B. Hajdu) • A tanulási t lá i ké képesség é elöfeltétele, löf ltét l h hogy elemezni l ié és csoportosítani tudjuk az adatokat, információt, ismereteket tényeket stb. ismereteket, stb • Azért csoportosítjuk öket, mert el kell raknunk, majd megint eg meg eg kell e találnunk. aá u A visszakeresés ss a e esés ((”information o a o retrieval”) hatásfoka a csoportosítás szervezettségétöl függ. Összehányt információt nem, vagy csak nehezen lehet ismét megtalálni.
Az információ természete •
• • • •
A vonatkozó fogalmak ”folyékonyak” folyékonyak . Pl. Pl XY számára a folyamat ez: adat Æ információ Æ tudás (ismeret) Æ megértés Æ bölcsesség. Ezek közül melyekkel foglalkoznak a köz- és magángyüjtemények ((könyvtár, y , levéltár,, múzeum)? ) Lezáratlan vita arról, információt vagy tudást (ismeretet) szervezünk-e nagyobb egységekbe gy elméjében, j , aki tanulmányozta y és Tudás ((ismeret)) = az egyén megértette az anyagot; információ = az ismeret (tudás) átadása és/vagy átvétele Pl. a referensz könyvtáros tudása segít abban, hogy az olvasók ké dé i választ kérdéseire ál t adjon dj A tudásmenedzsment (”knowledge management”) népszerü fogalommá vált az adminisztratív szervezetekben
A rögzített információ természete • Má Más módszerek ód k kellenek k ll k pl. l ab beszélt, élt a h hallott, ll tt a csak k (át-, el-)gondolt információ szervezéséhez • A rögzített információ sokkal több több, mint csak a szöveg szöveg. A szervezési egység az ”információs csomag”, a bibliográfiai tétel, nem egyszerüen a leírás • Ilyen ”információs csomagokat” gyártunk a bibliográfiai számbavétel során
A rögzített információ természete folyt •
A bibliográfiai bibli áfi i számbavétel á b ét l h hatt ffunkciója: k iój 1. 2. 3 3. 4. 4 5. 6 6.
Számon tartja, milyen típusú ”információs csomagok” léteznek gy keletkeznek és/vagy Számon tartja mindazon müveket, amelyek ilyen csomagok részei Rendszerezve gyüjteménnyé szervezi az ”információs információs csomagokat”, akár intézményröl, akár pl Internet állományokról van szó, stb. Listázza a címleírás szabályai szerint készült ”csomagokat” csomagokat Nevet, címet, tárgyat, ill más hasznos hozzáférési pontokat rendel az egyes ”csomagokhoz” Bi t ítj h Biztosítja, hogy minden i d egyes ”i ”információs f á ió csomag”” vagy a másolata megtalálható legyen
Az információ rendezése a könyvtárakban • •
A gyüjteményszervezés legrégebben a könyvtárakban tart A gyüjteményszervezés a következökön alapul: – – – –
• •
A könyvtár rendelései a kiadóktól Ajándékok és adományok A ffenntartóval, t tó l ajándékozóval já dék ó l kö közösen ö kid kidolgozott l tt ffejlesztési jl té i ttervek k új dokumentumállományt érkeztetnek elöre meghatározott gyüjtökör szerint Folyóiratok elöfizetése (ha az e-változat miatt nem mondják le)
A bejövö anyagokat valamilyen elv szerint rendezni kell, pl. betürendben vagy más rendben a.m. rendben, a m osztályozás szerint szerint, polcokra kerül Az osztályozás a katalogizálási folyamat része, amely a következö lépésekböl áll: – – – – – – –
A fizikai tétel leírása Bizonyos nevek, címek stb. hozzárendelése a tételhez hozzáférési pont gyanánt E k k az adatoknak Ezeknek d t k k a normatív, tí hibátlan hibátl ffelvétele l ét l A tétel tartalmi feltárása A tartalmi feltárás eredményét kifejezö jelzetek hozzárendelése Ún. hívószám (call number), pl. a Cutter szám hozzáadása az osztályozási jelzethez, amely egy bizonyos példány fizikai azonosítását azonosítását, lokalizálását végzi el A végeredmény, az ún. rekord elkészítése a MARC (Machine Readable Cataloging) szabvány szerint, majd bevitele egy vagy több integrált könyvtári adatbázisba
Katalogizálás folyt folyt. •
A katalogizálás föbb eredményei: – Kialakított gyüjtemény – Olyan katalógus felépítése és fenntartása, amely a gyüjteményhez a hozzáférés módját megadja
•
• • •
Az online katalógusok elött a könyvtár fö cédulakatalógusa, könyvkatalógusa vagy COM (Computer Output Microform) katalógusa mellett voltak egyéb fajták is (pl. tanszéki könyvtári, folyóirat-, speciális o átu ú [pl. [p kisnyomtatvány-], s yo tat á y ], polcjegyzék, po cjegy é , stb stb.)) formátumú A legtöbb online katalógus mindezeket összevonva kezeli Továbbá a legtöbb online katalógus része az integrált könyvtári rendszernek, emiatt cirkulációs [feldolgozási] információ csatlakozik minden cédulához éd láh ((rekordhoz, k dh ”i ”információs f á ió csomaghoz”) h ”) A helyi online katalogizálást (”mije van a könyvtárnak”) fokozatosan felváltják az ún. union katalógusok (”mije van a hálózatnak”), ami az Internet y ) közelít Gessner egyetemes gy bibliográfiai g által ((”mit ér el a könyvtár”) számbavételéhez (350 év után, de ezt vö. az Internet ”robbanásával”, a deep web problémájával, illetve a Google-jelenséggel)
Online katalógus és tájékoztatási munka •
• • •
Az online katalógusok lehetnek kapcsológépek (gateway) külsö rendszerekhez, pl az OCLC bibliográfiai hálózathoz vagy az RLINhez, ezek megmondják, hol található az olyan ”info csomag”, ami g nekünk nincs meg Bibliográfiai és szöveges adatbázisok is elérhetök a kapcsológépröl (Æ dokumentum másolati szolgáltatások) gy lökés a világháló g ((WWW). ) Sok könyvtár y katalogizálja g j az Nagy Interneten elöforduló dokumentumokat a felhasználói számára (URL hyperlink a katalóguscédulán) A visszakereshetöség élesben a tájékoztatásban (referensz) döl el. H egy tét Ha tétell nem található, t lálh tó új újra kkellll szerveznii az iinfót. fót Mi Mindez d a könyvtárosok és a könyvtári adminisztráció együttmüködését kívánja.
Atlas of Cyberspace WWW képek
Információ szervezése az Interneten • A levéltárakat, l éltá k t múzeumokat ú k t és é müvészeti ü é ti galériákat lé iák t átugrottuk • Internet: ”Mintha Mintha egy könyvtárban a földre borították volna a könyveket, katalógus nélkül” • A változás gy gyorsabb, mint a rendezés ((6-9 hét = 1 WWW év, dotcom-os idökben legalábbis) • OCLC WorldCat – globális katalógus • Keresögépek K ö é k ((search h engines) i ) • Elektronikus/digitalizált dokumentumok automatikus indexelése és osztályozása • A szemantikus világháló (Semantic Web)
Digitális könyvtárak • •
•
• • • •
•
A 90-es 90 es évek elejétöl: egy témához kapcsolódó, kapcsolódó közösen épített link link-gyüjtemények gyüjtemények az intézmények tájékoztatási oldalain A 90-es évek közepén: teljesen vagy részben elektronikus dokumentumok szervezett gyüjteménye, mind a struktúra, mind a visszakeresése egy helyen (egy gépen, egy honlapról stb); nem egyszerüen mutatók (pointer) sorozata; egy bizonyos közösség számára A 21-dik században: információkeresö rendszerek és információs intézmények (a könyvtár csak egy közülük!) ”felturbózott” integrációja; az új tartalom magában foglalja az információ elöállítását és felhasználását is, is nemcsak a keresését (Borgman) A távoktatás meg az élethossziglan tanulás következtében a könyvtár vagy átalakul, vagy eltünik A testreszabott digitális könyvtáraktól a szabványos szabványos, az összes részfolyamatot gépesítö, egyszerü, piacon vagy ingyen is kapható formák felé (vö. Greenstone) Pl. a digitális könyvtár a multimédia adatbáziskezelö csomag távoktatást támogató moduljává válhat (ma egész, holnap rész) A digitális könyvtárak szervezése metaadatokon (pl Dublin Core), Core) XML/RDF sémákon, ontológiákon, taxonómiákon alapul, portálokon keresztül érhetök el (portál = kirakat, itt: jelszavas hozzáférés sok tartalomszolgáltatóhoz, sorban vagy egyszerre [párhuzamosan]) Az osztályozás neve itt már gyakran Knowledge Organization Systems (KOS), (KOS) különösen a világhálón
A könyvtárossal rokon fogalmak •
”Információépítész” Információépítész (information architect): – Tisztázza a honlap ”küldetését” és céljait – Eldönti, milyen információ – tartalom és funckiók – hova kerül a struktúrában megtervezi a hozzáférési pontok fajtáit és megoszlását struktúrában, (mit lehessen keresni/böngészni), vonzó kirakatokat tervez és rendez be, kéz a kézben a honlaptervezövel (website designer) – Megtervezi, idövel hogyan változzon, bövüljön a lap struktúrája
•
Adatmodellezö (data administrator): mindenféle intézményi adatot, adatszerkezetet és folyamatot modellez – Rendszert tervez, amely egymással kapcsolatban álló modellek sorozata – Elkészíti a rekord-menedzsment fogalmi modelljét – Ennek alapján logikai rendszertervet készít – A logikaiból fizikai modell készül készül, amelyet adatbáziskezelö rendszerként (DBMS) munkába állítanak (implementálnak) – Ha az adatmodellt rendszeresen frissítik és a fogalmi modell változásaihoz igazítják, akkor az sokáig kiszolgálja az intézményt
Rokon fogalmak folyt: (Vállalati) tudásmenedzsment • • • •
1. szakasz: ”A 1 A tudás hatalom hatalom”:: tanulj többet, többet légy a hatalmasok egyike a társadalomban 2. szakasz: A vállalatok dolgozóik elbocsátásával ismereteket és know-how-t veszítenek; a müszaki fejlödés ezt nem kompenzálja a várt mértékben 3 szakasz: egy intézmény akkor marad fenn 3. fenn, ha rendelkezik alkalmazottai tudásával; az ismereteknek ez az összessége az ”ereje” A tudásmenedzsment a fejlett technika segítségével ezt a tudást gyüjti, rendezi és használja – –
Kellll h K hozzá á az iismerett meghatározása h tá á Az ismeret az elmében ”lakik”: • • •
– – –
•
Információ, (szöveg)környezet és tapasztalat keveréke Csoportok és közösségek közös tapasztalata, ha egy bizonyos keverék bevált Döntésekhez és válaszlépésekhez vezetö tömény, magas fokon rendezett tényanyag
A tudás/ismeret ”lappang” (tacit), nem nyilvánvaló, de azzá lehet tenni az innováció érdekében Cél: tudásraktárak (knowledge repositories), jobb hozzáféréssel (knowledge access), javítani az ismeretek mint környezet színvonalát a tárolt tudás leírásával, osztályozásával és visszakeresésével Hasonlít a szakértöi tudáshoz a szakértöi rendszerekben
Jelenleg lényegében tartalom-menedzsment, de dolgoznak a tartalom (szöveg)környezetének gépi megértésén és kiaknázásán
II rész: Az osztályozás elmélete II. • • • •
Alapok Iskolák Termékek Gépesítési lehetöségek
Tartalom – szöveg, szöveg kép kép...
Alapok • • •
• •
Az osztályozás és IKNY az információs bázis (könyvgyûjtemény, folyóiratok, kutatási jelentések stb.) gyûjtése, tárolása, nyílvántartása, tartalmi elemzése, majd az információk felhasználása szempontjából perdöntö jelentõségû Az információk tárolásának és a rájuk épülõ tájékoztatásnak a módszerei az évszázadok során változáson mentek keresztül, ám számos olyan jellemzõjük is felismerhetõ, amely az emberi gondolkodás (a fogalomalkotás és a nyelv) maradandó sajátossága Az információkeresés alapja minden korban a rendezettség és a kezelhetõség volt – Elõfeltételei a történelem során jelentõsen változtak változtak. – A legrégibb idõszakokban az irodalomban kialakult tevékenységi formák, mûfajok, oktatási rendszerek, illetve az ezek alapját képezõ tudományfelosztási elvek alakították ki a tájékoztatás célját szolgáló könyvtári és bibliográfiai osztályozási rendszereket (szakrendszereket) – Ezeknek az új korban klasszikus, széles körben elterjedt módszerei fogalmazódtak meg – Az osztályozástörténetében a 19., majd a 20. század fordulópontot jelentett. Kialakult az információkeresést tudományosan megalapozó osztályozáselméleti kutatás és irodalom Filozófiai, logikai, nyelvészeti, tudományrendszerezési és tudományszervezési elvek + a tudomány és technika haladása Részei: – Az osztályozás logikai és matematikai alapelvei, – A könyvtári és bibliográfiai szakrendszerek típusai, az ezekkel kapcsolatos alapfogalmak, – A tudományfelosztáson alapuló osztályozási rendszerek (szakrendszerek) fejlõdéstörténete • A régebbi keletkezésû szakrendszerek, • A 19. század végétõl keletkezett fontosabb, napjainkban is használt, vagy érezhetö hatású jelentõs könyvtári és bibliográfiai szakrendszerek, – A nyelvi y eszközökkel megvalósuló g információkeresés ((tárgyszavas gy osztályozás, y , indexelési eljárások, tezauruszos információtárolás és keresés, szintaktikus nyelvek) kérdései
A tudományok fejlödése és az információ •
•
• •
A tudomány a természet természet, a társadalom és a gondolkodás objektív összefüggéseirõl szerzett, igazolható ismeretek rendszere. Egyik fontos feladata, hogy kialakítsa és rögzítse saját felépítését, a fogalmai között meglévõ belsõ viszony- és szabályrendszert. A tudományok fejlõdése során alapvetõen két felosztási rendszer jött létre: a tárgyi és a megfigyelõi. A megfigyelõi felosztás a megfigyelt jelenség, tudományterület nem minden ismérvét veszi számba, hanem csupán egyet, vagy gy néhányat y emel ki közülük. A megfigyelõi g gy megközelítés g módszerét legteljesebb következetességgel a kibernetika alkalmazza. A kitüntetett szempontok a kibernetikában általában az energia vagy az információ. Információs fogalomrendszerrõl beszélve elsõsorban a dolgok szerkezetét, g j szervezetét,, mûködési mechanizmusát vizsgáljuk. Egyes vélemények szerint a korábbi fizikai felfogással szemben a világ alkotó elemei, az anyag és az energia kiegészülnek az információval. A tudományok és az információ fogalma szorosan összekapcsolódott a h huszadik dik századra, á d é és nem csak k a fil filozófiában ófiáb é és a tudományrendszertanban, hanem szinte valamennyi területen. A könyvtári osztályozásban a feltárandó, kifejezendõ dokumentum tartalmát sokan az információ fogalmával cserélték fel.
Az információk tartalmi megközelítése • A könyvtári kö tá i ffeldolgozó ld l ó munkának ká k két tterületét ül tét különböztethetjük meg : – A dokumentumok formai leírását és azonosítását azonosítását, ez a katalogizálás, illetve a bibliográfiai leírás feladata – A dokumentumok tartalmi vagy tárgyi feltárását, mellyel az osztályozás foglalkozik
• A két rész szorosan összefügg, például némelyik azonosításra szolgáló jegy képes tartalmat is jellemezni, vagy a tárgyi megközelítés során is eljuthatunk a konkrét mûig • A feldolgozás során szurrogátum keletkezik, az eredeti dokumentum helyettese
Mindennek az alapja: feldolgozás és feltárás •
Feldolgozás: a dokumentum formai ismérveinek számbavétele a mü, illetve példányai azonosítása végett – A feldolgozás célja: • Lehetövé teszi a formai jegyek alapján való keresést (vö. (vö böngészés), böngészés) illetve • A tartalmi feltárást
– Müfaja: a bibliográfiai leírás = címleírás, címfelvétel
•
Feltárás: a dokumentum tartalmi ismérveinek számbavétele a benne található információk alapján – A feltárás célja: a dokumentumok • Nyilvántartása • Rend(szer)ezése ( ) • Megtalálásának biztosítása (vö. keresés)
– Müfaja: az osztályozás = szakozás
• •
A kettö nem válik el élesen egymástól egymástól, egymást feltételezi E kettö hatásfokától függ az egész információs rendszer hatásfoka, az olvasó/felhasználó véleménye a könyvtárról, a tájékoztatási szolgáltatásról
Szurrogátum • •
Az egy dokumentumról összegyûjtött formai és tartalmi ismeretek összessége. Egybegyűjti mindazon ismérveket, melyek alapján a felhasználó megtalálja a keresett dokumentumot Funkciói – A dokumentum feltárása, – A dokumentum tárolása és – A visszakeresés biztosítása biztosítása.
•
•
A hagyományos visszakeresõ rendszerben, a katalógusban a szurrogátum fogalmán a bibliográfiai tételt - nem kizárólag a g leírást! -, míg g a számítógépes g p rendszerekben a rekordot bibliográfiai értjük. Általában Á a szurrogátum lényegesen bõvebb, mint az egyszerû bibliográfiai leírás és osztályozási jelzet együttese, tartalmazhat referátumot, kiegészítéseket stb. A eredeti mü eg Az egy példán példánya a és a felhasználó felhas náló között kö ött ez e létesít kapcsolatot
Példa a szurrogátumra: a bibliográfiai tétel •
A leírás l í á tá tárgyát át ké képező ő dokumentum összes feldolgozott ismérve, pl.: – Leíró (bibliográfiai) adatok (szerzöségi/bibl. adatok: pl. cím, [2] kiadás, megjelenési adatok – Besorolási adatok (egységesített cím eg cím, egységesített ségesített szerzöi s er öi névalak, sorozati cím, lelöhely, jelzet [polc]) – ami alapján katalógust építek; a bibliográfiai adatok d t k értelmezése, ét l é ””metaadat” t d t” • Metaadat: pl. egy adatelem értelmezése, meghatározása (ld.MeSH rekord) = adat az adatról
– Tartalmi jellemzők (jelzetek, tárgyszavak, bármi)
A tartalmi feltárás szintjei • •
•
• •
1. szint: Bibliográfiai leírás 1 leírás. A formai azonosításra szolgáló jegyek összességét adja adja, de ezek egy része képviselheti a tartalmat is (esetlegesen) 2. szint: Osztályozás. Bizonyos tartalmi ismereteket állapít meg a dokumentumról, s azt röviden valamilyen fogalmi lánccal kifejezi, ez által az információk átfogó tartalmi csoportosítására alkalmas alkalmas. Az ismérvek összefoglalóan megjelenhetnek táblázatokban, tárgyszójegyzékekben stb. 3. szint: Referálás. Összefüggõ szövegben, tömören és röviden elmondja a dokumentum tartalmi jegyeit és lehetõvé teszi annak eldöntését, hogy célszerû-e tanulmányozni a dokumentumot dokumentumot. A referátum lehet – Indikatív (jeladó): Röviden ismerteti a dokumentum fõ témáját és a fontosabb eredményeket. – Informatív: az eredeti dokumentum tanulmányozásának kisebb mértékû pótlására hivatott hivatott. – Autoreferátum: ha a szerzõ saját mûvérõl készít referátumot. – Annotáció: a dokumentum rövid jellemzése annak tartalma, rendeltetése, formája és nyelvi sajátosságai alapján. 4 szint: 4. i t Tömörítvény. Tö ö ít é Ö Összefüggõ fü õ szövegben, ö b minden i d az eredeti d ti mûben ûb lé lényeges tartalmi jegyet magában foglal (táblázatokat, ábrákat stb. is). Képes pótolni az eredeti mûvet. 5. szint: Szemlék. Analitikus-szintetikus mûfaj, mely egységes vezérelv alapján több hasonló témájú dokumentumot dolgoz fel fel.
Feltártsági mutatók • Cí Címleírási l í á i egység é ffeltártsági ltá t á i mutatója: t tój ”i ”ismérvek é k (besorolási helyek) átlagos száma / dokumentum” • Referátum, Referátum tömörítvény stb. stb feltártsági mutatója (Senko): ”kivonat szavainak száma / eredeti dok szavainak száma” • Másik módszer (Perry & Kent): ”(az eredeti dok releváns mondatai – a kivonat releváns mondatai) / az eredeti releváns mondatai” mondatai (0-1 közötti érték) • Ennek a komplementere: ”Z (zaj) = a kivonat nem releváns mondatainak száma / a kivonat összes mondatának száma” • De mi a releváns?
Szurrogátum relevancia Szurrogátum, relevancia, pertinencia • ”A dokumentum d k t tartalmilag t t l il releváns egy keresökérdésre, ha, elvben, megfelel neki, képes válaszolni rá…(…) A pertinencia az eredeti mü p és a felhasználó eredeti problémája (kérdése, témája, szerepe, feladata) közötti megfelelés …” [Soergel, D.: Indexing and Retrieval Performance: The Logical Evidence]
Természetes és mesterséges nyelvek • •
•
• •
Bármely nyelv jellemzöi: morfológia (alaktan) (alaktan), szintaxis (mondattan), (mondattan) szemantika (jelentéstan) [+ a szemiotikában pragmatika (használat)] Természetes nyelvnek (a mesterséges nyelvekkel szemben) az emberek által használt olyan nyelvet nevezzük, amely egy közösség (törzs vagy nemzet) életében nemzedékről-nemzedékre spontán vagy tudatos folyamatok (pl. (pl nyelvújítás) során szabadon fejlődik, változik. Egyes források szerint ma 5-6000 (mások szerint még több) mindennapos használatban elterjedt természetes nyelvről beszélhetünk. Nyelvészeti szempontból az egymással kisebb-nagyobb kisebb nagyobb hasonlósággal rendelkező természetes nyelveket csoportosítani lehet. A csoportosítás legfelsőbb szintje a nyelvcsaládokba történő szelektálás. Vannak emberek által használt, de nem természetes, hanem mesterséges nyelvek is, melyeket y nyelvelméleti, y , matematikai vagy gy informatikai célból alkottak. A mesterséges nyelvek közül ismertek a programozási nyelvek, amelyeket szokás környezet-független nyelveknek is tekinteni. Környezet-függő (context-sensitive) tulajdonsága ellenére újabban a természetes nyelvek feldolgozása (Natural Language g g Processing, g vagy gy NLP)) óriási fejlődésnek j indult, és a számítástechnika egyik vezető alkalmazási tématerületévé vált. Az említett terület azonban egy még szélesebb ismertekörbe, az emberi nyelv technológia (Human Language Technologies vagy HLT) magyarul csak nyelvtechnológiaként emlegetett témakörbe tartozik.
Nyelv dokumentum, Nyelv, dokumentum ... • A szöveges ö mûvek û k ttartalmának t l á k kif kifejezése j é a nyelv l ált által. l Az IKNY közös vonása, hogy mindegyikük a természetes nyelvbõl y ered vagy gy ezekbõl levezethetõ. A nyelv egy adott, egyezményesen kialakult jelsorozat és a nyelvtani szabályok együttese. • A jeleknek j l k k egy adott d tt nyelvben l b megengedett d tt h halmazát l át ábécének nevezzük. A nyelvi jelsorozatok véges, rögzített ög e halmaza a a a a sszótár. ó á A sszótár ó á legkisebb, eg sebb, ö önálló á ó értelemmel még bíró eleme, lexikai egysége a szó. • A szavak, mondatok információt hordoznak. A kö ölh tõ é é közölhetõség és a ffelhasználás lh álá é érdekében d kéb ezeket k t valamilyen anyagi hordozón rögzítik. A rögzített információk egyik megjelenési formája a dokumentum.
...információ információ •
•
Matematikai információinformáció (kommunikáció-) (kommunikáció ) -elmélet elmélet (Shannon 1948): adó, adó vevö, vevö csatorna, zaj, redundancia. A nyelvvel nem, csak a kód elemeivel, egy eseményalgebra eseményeivel foglalkozik. Az entrópia mint központi fogalom révén köze van a termodinamikához. Az információ a fizikában a határozatlanság mértékét mértékét, az entrópiát érintö (csökkentö, (csökkentö növelö) változás. – –
•
Az információ a nyelvben a jelentés, amelyet egy formai egység (szó, mondat, bekezdés, stb.) hordoz. – –
• •
Egy jel = egy esemény; a bekövetkezés információértéke a valószínüsége reciproka. Minél ritkább, annál ”újabb”, annál nagyobb az információtartalma. Miért annál nagyobb? gy Mert rendszerben meg g kell tippelni pp a következö eseményt. y Ilyenkor y az egy jelre esö átlagos információt az entrópia (= bizonytalanság, rendezetlenség, határozatlanság, ritkaság) méri. Ha biztos, ami következik, nincs információ. Ha teljesen bizonytalan, maximális az info tartalma. Ennek a szemantikához semmi köze: az információ a bizonytalansággal határos, és nem egy üzenetre vonatkozik, hanem üzenetek statisztikai jjellegéböl g számítjuk. j
Jelentéselméletek. Két- és háromkomponensü jel a szemiotikában. Olyan, y , mint egy gy töltéseloszlás a térben. Két absztrakció,, helyy és jelentés, j , találkozik.
A két meghatározást a ritkaság (újdonság – újság) mértéke köti össze. Mivel statisztikai is, szemantikus is, ebben az értelemben az információ univerzális, az anyag és az energia mellett a világegyetem egyik építököve, a strukturálódás nyersanyaga , a változás katalizátora. ”nyersanyaga”,
A szójelentés néhány elmélete • •
Kétkomponensü (Saussure) vs. vs háromkomponensü jel (Peirce) Egy szó vagy egy mondat jelentése nem egy fogalom, egy entitás, vagy a dolgok valamilyen állapota (Lyons 1968:411), hanem ehelyett ezeknek az egyvelege, amely legalább három fö részböl áll: “a szó jelentése a használata módja” j ((Wittgenstein), g ), “a szó jelentése a következménye” (Bloomfield), illetve “a szó azt jelenti, amire utal” (Peirce) – –
•
“A jelentés a használat módja”: a bes édben elöforduló beszédben elöford ló sszövegkörnyezet ö egkörn e et értelmezi a szót (Harris); “A jelentés az utalás”: ‘X = Y Z-n ek, vagy amíg Z tart’
Jelentésrelációk a nyelven belül (két szó viszonya) vs. Utalás a nyelven kívülre (a ”valóságba”) (Lyons 1968)
Három szójelentés-típus szójelentés típus
Katalógusok részletesebben Katalógusok, •
•
•
A könyvtárak történetében az elsõ információs tár a katalógus. katalógus A könyvek elrendezése, csoportosítása, osztályozása a kezdetektöl a könyvek elhelyezési rendjének, a könyvraktáraknak a visszatükrözése. A rokon tartalmú, azonos témakörbe tartozó könyvek egymás mellé helyezésével szakcsoportok jöttek létre. Ez vezetett a könyvtárak szakrendi beosztásához. A könyvgyûjtemények jelentékeny megnövekedése a tartalom alapján való csoportosítás helyett a mechanikus elhelyezéshez (pl.: kurrens számozás) vezetett, és a tartalom szerinti csoportosítás már csak a tételekröl készített tárgyi katalógusban g tükrözõdött. A tájékozódási igények két nagy típusa: – –
•
•
Az olvasó valamely általa ismert mûvet keres, Az olvasó egy általa megjelölt témáról, tárgyról meghatározott típusú irodalmat keres
Az elsõ esetben a formai (leíró) katalógus alapján található meg a keresett dokumentum. A leíró katalógusba a kiválasztott besorolási adatok betûrendjében kerülnek be a bibliográfiai tételek. Ezek a besorolási adatok a következõk: szerzõ(k) vagy testület neve, cím és közremûködõk neve. A betûrendes leíró katalógus arra ad választ, hogy mely szerzõ, mely mûve, milyen kiadásban található meg. A második esetben a tárgyi katalógus nyújt segítséget, mely a katalóguscédulákat úgy rendezi, hogy az azonos témakörbe tartozó dokumentumok katalógustételeit azonos osztályozói kifejezés, jelzet alatt gyûjti össze.
Katalógusok folyt •
A tárgyi katalógusok fontosabb típusai különbözõ megközelítések alapján
•
Nyelvük szerint: –
Tárgyi katalógusok •
Természetes nyelvi alapúak – –
•
Mesterséges nyelvûek –
•
Tiszta (mellérendelõ, klasszikus) tárgyszókatalógus Rendszerezõ (alárendelõ) tárgyszókatalógus Szisztematikus (szakrendi, rendszerezõ, szak-) katalógus
S k Szerkezetük tük szerint: i t –
Tárgyi katalógusok • •
Tiszta (mellérendelõ stb) tárgyszókatalógus Rendszerezõ tárgyi katalógus (szakkatalógus) – –
természetes nyelvû, nyelvû pl.: pl : rendszerezõ tárgyszó mesterséges nyelvû, pl.: ETO
•
A mû tárgyát kifejezõ elnevezések (tárgyszavak) betûrendjében szerkesztett tárgyi katalógus g a tiszta tárgyszókatalógus. gy g
•
A fogalmakat más fogalmakkal kapcsolatuk (hasonlóság és különbség, rokonság, alárendeltség stb.) alapján kialakított rendben tervszerûen felsoroló katalógus a szisztematikus, rendszerezõ, más szóval a szakkatalógus.
Osztályozás részletesebben Osztályozás, •
•
• • •
Az a logikai tevékenység tevékenység, amely során a jelenségeket jelenségeket, tárgyakat hasonlóságuk foka szerint egybegyűjtjük és különbségeik foka alapján elkülönítjük. Az emberi gondolkodás alapvető formája, párhuzamos a fogalomalkotással. Célja tartalmilag összetartozó, olyan kisebb csoportok kép ése ahol lehetőség van képzése, an a az általánostól a specifik specifikusig sig való aló keresésre keresésre. Ha dokumentumokon történik, könyvtári osztályozás. Általánosan: a dolgok egymáshoz való viszonya és logikai kapcsolatai lehetõvé teszik egységes gy g rendszerek létrehozását,, melyekben y a fogalmak g különbségeik és hasonlóságaik alapján az általánostól a specifikus felé haladva meghatározott helyet foglalnak el. Azt az eljárást, amely ilyen rendszert hoz létre, osztályozásnak nevezzük. A filozófiai y két felosztási ((részekre osztási,, taglalási) g ) módot tudományrendszerek ismernek: tárgyit és megfigyelõit. A jelenségek tárgyi felosztása: Arisztotelész (Kr.e. 384-322). A csúcs Linné (1707-1778). A törzsi tö i tá társadalmak d l k ót óta iismeretes t (Cl (Claude d Lé Lévi-Strauss) i St ) A jelenségek megfigyelöi felosztása: kibernetika. Nem minden ismérv, csak vagy az energia, vagy az információ felöl.
Osztályozás folyt •
•
A könyvtári osztályozás elsõdlegesen gyakorlati, gyakorlati a tudományok osztályozásának tükrözése csak másodlagos, eszköz szerepet játszik. A tárgyaknak, jelenségeknek több olyan tulajdonságuk is lehet, melyek a felosztás alapjául kiválaszthatók. Ugyanazon tárgynak, fogalomnak tehát több önmagában hel több, helyes es os osztályozása tál o ása lehetséges lehetséges. Ahhoz, Ahho hogy hog megfelelõen osztályozzuk a dolgokat, helyesen kell elemezni a tartalmat, és jól kell ismerni az adott célt, az osztályozási rendszert, az osztályok közötti kapcsolódási lehetõségeket. Ugyanabban az információkeresõ nyelvben ragaszkodnunk k d k kkellll az iismérvek é k azonos szempontból tból való ló megválasztásához, mert az osztályozás csak így lesz következetes és használható. Az osztályozásnak y Ranganathan g óta három szintjét j különböztetjük j meg. g Az elsõ a fogalmak szintje, amikor az osztályozandó dokumentum tárgyát fogalmakkal határozzuk meg. Második az elnevezések szintje, a nyelvi szint, amikor megfelelõen pontos elnevezéseket választunk a fogalmaknak. A harmadik a jelzetelés szintje, amikor egy adott osztályozási rendszer jelkészletébõl megállapítjuk a dokumentum tartalmát, tárgyát legjobban kifejezõ jelzeteket.
Az osztályozás logikai és matematikai alapelvei 1: A fogalom •
•
• •
A fogalom: – Dolgok, D l k jelenségek j l é k legfõbb l fõbb ismertetõjegyeibõl i t tõj ibõl a tudatban t d tb ki l kít tt gondolati kialakított d l ti forma – A valóság általánosítása és absztrakciója – A megismerés g egyik gy alapformája p j – Mindaz, amit a nyelv megnevezni képes – Az osztályozás mindig fogalmi síkon zajlik Ismertetöjegy: – Jellemzõ vonás, vonás tulajdonság tulajdonság, amelynek alapján valami felismerhetõ, felismerhetõ megkülönböztethetõ – A jelentés elemei, nemcsak a szavak jelentését értelmezik, hanem a bonyolult fogalmakból egyszerûbbet, az egyszerûbõl bonyolultabbat alakíthatnak ki – A különbözõ dolgok közös ismertetõjegyei azokat egy osztályba egyesítik, egyesítik és az egy osztályba tartozó tárgyak, jelenségek fogalmainak hasonlóságát tükrözik Megkülönböztetö jegy (differentia specifica): – A dolgok közötti különbséget tükrözi – Az adott osztályon belül a továbbosztályozás alapjául szolgálhat Nem (genus) és faj (species), mint fölé- és alárendelt osztály (hierarchia): – Nemet tükrözö jegyek: lényeges, közös ismérvek, amelyek a tárgyakat egy fölérendelt,, általánosabb osztályban y egységesítik, gy g , más osztályoktól y pedig p g megkülönböztetik. – Fajt tükrözö ismertetöjegy: az a közös ismérv, amelyik egy adott osztályon belül megkülönbözteti a fogalmak egy csoportját
Alapelvek 1 folyt.: A fogalom tartalma és terjedelme • A fogalom tartalma (intenzió, (intenzió NEM intenció) a benne általánosított dolgok lényeges ismertetõjegyeinek összessége. Pl. virág, tulipán • A fogalom terjedelme (extenzió) mindazon dolgok összessége, amelyre az ismérvei illenek. Pl. virágok, tulipánok p • Egy fogalom tartalma és terjedelme egymással fordított arányban van. Pl. élõlény - ember - nö - író - Szabó Magda • A fogalom tartalmának megragadása, az ismérvek teljessége az osztályozás helyessége szempontjából dö tõ ((milyenség, döntõ il é minöség) i ö é ) • A fogalom terjedelme azt tükrözi, hogy a fogalomba y tárgyak gy tartoznak,, amelyeknek y közös milyen ismertetõjegyeik vannak, mekkora a vonatkozó osztály (mennyiség)
Alapelvek 2: Kategória •
• • • •
Fogalmi kategória: Az ismérvek számának növelésével vagy csökkentésével az általánosítás különbözõ fokaira juthatunk. Végletesen létezik olyan állapot is, amikor a tartalmat mindössze gy ismérv határozza meg. g Ezeket a fogalmakat g fogalmi g egyetlen kategóriáknak hívjuk. Az osztályozásban fontos szerepet kapnak, a szintén elég általánosnak tekinthetõ szakkategóriák A kategóriákból levezethetõ, de még kellõen általános fogalmakat alkategóriáknak hívjuk A facetták a fogalmi kategóriák olyan alkategóriái, amelyek egy-egy szakterület kt ül t ált általános lá ffogalmait, l it a ffelosztás l tá speciális, iáli külö különbözõ, bö õ elõre rögzített szempontjait képviselik egy adott tudományterületen A kategóriák kiindulópontjai lehetnek az egyes osztályozási rendszereknek
Alapelvek 3: Osztály • •
•
•
A fogalom a terjedelmét alkotó dolgok osztályát képviseli. képviseli Az elemek olyan nyílt összesége, melyet közös tulajdonságok, ismertetõjegyek jellemeznek Az osztályok elemei rendelkeznek az osztályra jellemzõ, jellemzõ valamennyi lényeges ismérvvel, a kitüntetett szemantikai jellemzõkkel, de ezen túl más megkülönböztetõ ismérvekkel is. Az osztályon belüli megkülönböztetés ezen eltérõ ismérvek alapján lehetséges Ha egy osztályon belül az elemek egy csoportja a kitüntetett szemantikai jellemzõk mellett más közös tulajdonságokkal is rendelkezik, alosztályt alkot. Pl.: állat (osztály) - emlõs (alosztály): oroszlán kutya, oroszlán, kutya bálna stb. stb A bálna, bálna a kutya és az oroszlán mindegyike rendelkezik az állat szemantikai jellemzõin túl közös ismérvekkel, hogy eleven szülõ, testét szõr fedi, emlõibõl táplálja y stb. Ezzel az állatok osztályán y belül újabb j csoportot p kicsinyeit képeznek: az emlõsök alosztályát Mind az osztály, mind a fogalom meghatározásából következik, hogy rájuk és az õket meghatározó ismérvekre alkalmazhatók a szimbolikus i b lik logika l ik és é a matematikai t tik i halmazelmélet h l l él t megállapításai. áll ítá i
Alapelvek 3 folyt.: Müveletek osztályokkal •
•
•
Logikai müveletek: a fogalmak összekapcsolására az úgynevezett logikai operátorok használhatók. A legegyszerübb kapcsolatok a kö következõk etke õk : ÉS (logikai szorzás, metszet), VAGY (logikai összeadás, unió), NEM (logikai kivonás), nincs kapcsolat (di j k ió) b (diszjunkció), bennefoglalás f l lá (komplementer halmaz) Példák: ”állat ÉS négylábú” = négylábú gy állat;; ”állat VAGY négylábú” = vagy állat, vagy négylábú, pl. asztal; ”állat NEM négylábú” = pl. madarak A logikai müveletek halmazmüveleteknek felelnek meg, amelyeket a Boole-algebra tárgyal és Venn-diagramok szemléltetnek
Alapelvek 4: Meghatározás és relációk • • • •
• •
Meghatározás: valamely fogalom tartalmának értelmezése értelmezése, a fogalmat alkotó lényeges ismérvek (reális ~: tudományos, nominális ~: mit jelöl a szó, verbális ~: mit jelent egy idegen szó) Reláció: halmazok, vagy gy egy gy halmaz elemei között megállapított g p kapcsolat p Fogalmi reláció: a fogalmak vagy ismérvek közötti kapcsolatok A reláció mind a matematikában, mind a logikában az alapfogalmak közé tartozik, de hasonlóan jelentékeny szerepet tölt be az osztályozásban is. Az osztályozás a fogalmi egységek közötti relációk kialakításának módszere módszere. Tehát ilyen értelemben a relációk az osztályozás felépítését, vázát adják Két fogalom közti reláció jelölése: aRb (”a R relációban áll b-vel”) A relációkat csoportosíthatjuk p j a kapcsolatok p iránya y alapján pj irányított y és irányítatlan összefüggésekre: – Irányított összefüggés: a két fogalom közötti kölcsönös (két irányú) kapcsolat nem azonos, hanem más összefüggést képvisel. Tehát nem cserélhetõk fel. – Irányítatlan összefüggés: a két fogalom közötti kapcsolat fordítottja is ugyanazt az összefüggést képviseli.
Alapelvek 4 folyt: Irányított relációk • • •
•
1. Generikus reláció: fölé(F) 1 fölé(F)alárendeltségi(A) reláció 2. Szerkezeti reláció: egész(T) - rész(P) reláció 3. Irányultsága(R) - függõsége (E): okozat - ok eredmény d é - eredet d t termék - elõidézõ rendeltetés - eszköz tárgy - alap kö k következmény é - kiindulás, kii d lá stb. b 4. Irányított jellemzõ (X): tulajdonsága mozgása helye ideje anyaga személyi vonatkozása vonatkozása, stb stb.
• • •
•
rovar – bogár (rovar: fölérendelt fölérendelt, bogár: alárendelt) könyv – címoldal (könyv: egész, címoldal: rész)) forgács – forgácsolás (forgácsolás: elöidézö, forgács: termék); vagy: toll - írás (az írás eszköze a toll toll, a toll rendelterendelte tése az írás)
labda – piros (a labda tulajdonsága, hogy piros); ló - vágta á t ((a ló mozgása á a vágta), á t ) stb.
Alapelvek 4 folyt: Irányítatlan relációk •
•
5. IIrányítatlan 5 á ít tl jellemzõ j ll õ (X) (X): közös fölérendelt hasonlóság ellentét stb. ellentét, stb 6. Ekvivalencia reláció: a közös tulajdonságokkal rendelkezõ d lk õ fogalmakat f l k t gyûjti ûjti össze. Vagyis a szinonímákat (hasonló jelentésû szavak) és kváziszinonímákat (majdnem teljesen hasonló jelentésû szavak) egy helyre rendezi.
•
•
apa – anya Æ szülõ ülõ madzag - kötél világosság - sötétség stb stb. kutya - Hund, kutya – eb: különbözõ nyelvû alakváltozatok, l k ált t k illetve ill t a szinonímák között
Relációtulajdonságok 1 1. 2.
3.
4.
Reflexív (visszaható), (visszaható) ha egy elem egy adott relációban áll önmagával: aRa Például a Szegeden születettek halmaza; reláció: ugyanott született, mint. Irreflexív (nem visszaható) egy reláció, ha az elõzõ azonosság nem áll fent. Szimmetrikus egy reláció, ha a kapcsolatban álló fogalmak sorrendje felcserélhetõ az adott reláció oda-vissza: aRb és bRa felcserélhetõ, Például Sándor és Géza barátok. (Sándor barátja Gézának, és ugyanakkor Géza is barátja Sándornak.) Aszimmetrikus egy reláció, ha a kapcsolatban álló fogalmakat felcserélve más relációt kapunk. p Például minden bogár g rovar,, de nem minden rovar bogár. g Megjegyezzük, hogy asszimetria esetén is fennállhat aRb és bRa, de csak akkor, ha a=b. Egyértékû egy reláció, ha egy fogalom mindig csak egyetlen másik fogalomhoz kapcsolódik az adott relációban. Például Géza anyja Katalin. Többé tékû egy reláció, Többértékû lá ió h ha egy ffogalom l több ffogalomhoz l h iis kkapcsolódhat lódh t ugyanazzal a relációval. Például a kutya fölérendeltje a háziállat és az emlõs is. Tranzitív egy reláció, ha fennáll a következõ azonosság: aRb és bRc Æ aRc. Például az emlõs alárendeltje a háziállat, a háziállat alárendeltje a kutya, t tranzitívitás ití itá esetén té az emlõs lõ alárendeltje lá d ltj a kkutya t iis. A tranzitívitásnak fontos szerepe van az osztályozásban. Segítségével többek között hierarchialáncokat képezhetünk (emlõs - háziállat - kutya - spániel).
Szemantikai relációk • Két szó ó egymással á l a helyettesíthetöségük h l tt íth tö é ük arányában á áb ekvivalens = jelenti ugyanazt (Lyons 1968) • Jelentésrelációk (sense relations) két vagy több szó között: – – – – –
Teljes szinonimia: ENSZ – Egyesült Nemzetek Kváziszinonimia: kutya – eb Összemérhetetlenség: kutya – Egyesült Nemzetek Meronimia / holonimia (része (része-egésze egésze stb.): stb ): ujj – kéz, kéz fa – erdö Hiponimia / hipernimia (nem-faj stb.): bíbor, karmazsin, kármin – vörös – Homonimia (poliszémia): daru1 – daru2 – Antonimia: háború – béke, hosszú – rövid, meleg - hideg
• Jelentöségük g a tezaurusz- és ontológia-építésben g p van
WordNet ontológia szótári jelentéssel kiegészítve
III. rész: Könyvtári osztályozási rendszerek tipológiája • Osztályozáselméleti iskolák – Tudományfelosztáson alapuló osztályozások – Nyelvészeti irányzat – A statisztikai iskola • A könyvtári y osztályozás y célja j • Az osztályozási rendszerek, információkeresõ nyelvek tipológiája p g j
Tudományfelosztáson alapuló osztályozások ál á k • A 19. 19 sz sz. második felében alakultak ki • Filozófiai tudományfelosztás + természetes logika (a klasszikus logika g szabályai y szerint)) • Szerkezetük hierarchikus • Pl. Dewey Tizedes Osztályozása, Cutter Kiterjesztõ Osztályozása az Egyetemes Tizedes Osztályozás Osztályozása, Osztályozás, a Library of Congress rendszere, Ranganathan Kettöspontos Osztályozása stb. • Egy E adott d kkornak kad dokumentumokban k kb megjelenő j l ő ismérveit tükrözik • Korlátaik: – Szigorú logikai elvek határozzák meg – Nem lehet átfedés: !! egy tudományág : egy hely Æ egy könyv : egy helyy !! – Nehézkessé válhatnak /nehezen fejleszthetőek
Nyelvészeti irányzat •
Információkeresõ nyelvek: a 20. század elejétõl. IKNY és osztályozás szinonímák Æ osztályozás = mesterséges nyelv – Szabályrendszer = mondattan, szótár dokumentumból – Milyen szótárai lehetnek az IKNY-nek: nagyon rendszerfüggö. Pl osztályozási táblázat (pl. 943.9 = Mo. története); tárgyszójegyzék; tezaurusz; ontológia – A szócikkek pl. pl tezauruszcikk tezauruszcikk. A szócikkekben a szavak által jelölt fogalmakat összetartó kapcsolatokat értelmi összefüggéseknek nevezzük. Az információkeresõ nyelvek értelmi összefüggései a rendszer szerkezetét képzõ irányított/irányítatlan relációk
• • • • • • •
Szövegszó: g a szövegben g ténylegesen, y g változatlan alakban elõforduló szó Címszó: a címben ténylegesen elõforduló szövegszó Kulcsszó: az információ lényegére jellemzõ, a tartalmi fetárásra alkalmas szövegszó Tárgyszó: a tartalmat röviden, röviden tömören, tömören egyértelmûen kifejezõ, kifejezõ természetes nyelven megfogalmazott szabványosított szó Deszkriptor: a legáltalánosabb információkeresõ nyelvi kifejezés, mely az információk feltárására, tárolására és visszakeresésére közvetlenül felhasználható (ld. tezaurusz) Nemdeszkriptor: az információk feldolgozására és keresésére közvetlenül nem, csak a vele összekapcsolt deszkriptor útján vagy annak figyelembevételével használható kifejezés (pl utalók, ld tezaurusz) Mire jó a nyelvszerüség? Segítségével a dokumentum tartalma Æ dokumentumképpé (szurrogátum 1) alakítható át, a természetes nyelvü felhasználói kérdés Æ keresökérdéssé (szurrogátum 2) alakítható át. Szurrogátum 1 & 2 viszonya alapján rangsoroljuk a válaszokat = információkeresés
Statisztikai irányzat • A matematika szűkebb területeinek felhasználása elméletben és gyakorlatban • Elvei: – Alapja a természetes nyelv – Ennek statisztikai törvényszerűségeit állapítja meg – Ezek alapján hozza létre osztályait
• Számítógépek megjelenése Æ lehetőség szöveges információk nagy tömegének kezelésére Æ automatikus osztályozás
A könyvtári osztályozás célja • • • • •
Az információk és hordozóik hordozóik, a dokumentumok visszakeresésének biztosítása Ennek érdekében az információkeresõ rendszernek képesnek kell lennie egyedi gy információk leírására, osztályok y alkotására és a kialakított halmazok, ismérvek esetenként változó csoportosítására is Azt az eszközt, mely segítségével az osztályozást végezzük, osztályozási rendszernek, vagy mint láttuk, információkeresõ nyelvnek hívjuk Az osztályozási rendszer hármas feladata: az információk tartalmának leírása, tárolása és a lehetõleg többszempontú visszakeresés biztosítása Csoportosíthatók: – – – – – – –
Az alkalmazott nyelv y szerint Az osztályozási módszerek szerint Mélységük szerint Szerkezetük szerint Tartalmuk szerint Az automatizálás mértéke szerint A felhasználás célja szerint
1. szempont: Az alkalmazott nyelv szerint •
Természetes nyelven alapulók: – –
–
–
•
Szövegszavas: osztályozási kifejezések változtatás nélkül a dokumentum címébõl, eredeti szövegébõl, pl. kulcsszó. Osztályozás mélysége = dokumentumok tárgyalásának mélysége. S bál Szabályozott tt nyelvû: l û rögzített ö ít tt szabályrendszerek bál d kh határozzák tá ák meg a szóalakokat és ezek használatát, pl. tárgyszavas, deszkriptoros rendszerek stb. Segítségükkel lehetõség nyílik az eltérõ szóalakok egységesítésére a homonímák és szinonímák megfelelõ kezelésére. Elönyök: mindkettö közvetlen kapcsolatban áll az aktuális szaknyelvvel szaknyelvvel. A betûrendes szerkezet és a szavak függetlensége következtében viszonylag könnyû követni a terminológiák, a tudományos eredmények változását is. Mind egyedi infomációk, mind csoportok leírására alkalmasak. Hátrányuk: az osztályozási rendszer használatán keresztül nem kapunk semmilyen képet a tudományok, adott szakterület egészére, felépítésére stb. vonatkozóan. Az IKNY egy adott nyelvhez, sõt könyvtárhoz kötött.
Mesterséges nyelven alapulók: a dokumentumok tartalmát kódokkal, szimbólumokkal írják le le, pl pl. ETO ETO. – –
Elõnyeik: a rendszerek könnyen áttekinthetõk, a jelzetek egyértelmûek, alkalmasak egyetemes és nemzetközi osztályozásra. Hátrányaik: a tudományok átalakulásait, változásait nehezen képesek követni, a kódokat kód k t é és az adott d tt struktúrát t ktú át meg kkellll ttanulni, l i gépi é i adatfeldolgozásra d tf ld l á nehézkesen használhatók.
Az alkalmazott nyelv természetes nyelvű • Kulcsszó: K l ó – Atmeneti elem a formai feldolgozás és tartalmi feltárás között (pl (pl. címek tartalmilag releváns szavai) – Könyvtári rendszerekben: címekben, szerzőségi közlésben fordul elö – Tágabb értelemben származhat a tartalmi feltárásból is csak a (sok esetben ez az alcímek privilégiuma) – Peter Luhn KWIC (Keyword-In-Context): a jellemző kifejezések előfordulnak /annál többször, minél lényegesebbek
Az alkalmazott nyelv szabályozott •
Természetes T é t nyelvű l ű kulcsszavak k l k szabályozása: – – –
•
Szóalakok összevonása Homonímák megkülönböztetése Szinonímák elemzése
Tárgyszó: egy tárgykört vagy annak részletét
a legrövidebben megfogalmazó kifejezés – – – –
Szabványosított Természetes nyelvű A dokumentum tartalmi jellemzésére felhasználható Lehetővé teszi a tárgyi alapú visszakeresést
Az alkalmazott nyelv szabályozott •
Információs tezaurusz –
–
Az osztályozási y kifejezések j egymás gy közti (nyelvi/logikai) kapcsolatainak szabályozása fogalmi összefüggéseik feltüntetésével Lexikai egysége a deszkriptor: • •
Az információk feltárására és keresésére közvetlenül alkalmazható, Tartalmilag kitüntetett kifejezés
Az alkalmazott nyelv mesterséges •
A dokumentumok tartalmát kódokkal, szimbólumokkal írja le, pl. számokkal: Dewey, ETO
2. szempont: Az osztályozási módszerek szerint •
Hierarchikus (példa: prekoordinált, tezaurusz, ETO): – Az osztályozandó fogalmakat egyetlen egésznek fogják fel, s valamilyen szempont alapján részekre bontják bontják. – A hierarchiát mindig a legáltalánosabb fogalomtól lefelé építik. – Az értelmi összefüggések közül a tranzitív tulajdonságokkal rendelkezõ relációkat (generikus, szerkezeti) használják fel a fogalmi láncok kialakítására – Az A alálá és é fölé fölérendeltséggel d l é l ki kialakított l kí hi hierarchia-szinteket hi i k terminológiailag i ló i il iis megkülönböztetik egymástól. Például az ETO-ban fõosztály, osztály, alosztály, szakcsoport stb. – Lehet monohierarchikus (enumeratív): egy fogalomnak csak egyetlen fölérendelt f fogalma l llehet, h t egy helyen h l szerepel.l E Egyszerü üh használni, ál i merev – Vagy polihierarchikus (analitikus-szintetikus): a fogalomnak több fölérendeltje is lehet, tehát a felosztás több dimenziós, a fogalom többhelyütt.
•
Mellérendelö: fogalmai g önállóak és egymástól gy függetlenek, gg az osztályozási y kifejezéseket semmilyen szabály nem rendeli egymáshoz, azokat mindig az osztályozandó dokumentumok halmaza határozza meg. Gyakran természetes nyelv = IKNY. Példa: posztkoordinált tárgyszó; Ranganathan
Az osztályozás módszere hierarchikus • Újabb szintek beillesztése megoldható • Az egyes gy fogalmak g részletezhetők • A bontások (= pl történelem; magyar történelem stb.) döntési pontok: csak egy felosztást lehet a to ábbi bontás alapjának tekinteni Æ merevek; további mere ek gráf; nem lehet ad hoc bontogatni • A dokumentumok tartalmának differenciált feltárására nem alkalmasak • Nem kedveznek a visszakeresésnek
Az osztályozás módszere mellérendelő Fogalmai: g • Önállóak (kulcsszó, tárgyszó) • Egymástól függetlenek • Természetes nyelvűek • Egy-két szintig bármely kapcsolatot ki tudnak fejezni, de sekély hierarchia; betürendben a tárgyszavak, k pll történelem, ö é l angol; l történelem, ö l magyar (hátravetett jelzö)
3 szempont: Mélységük szerint 3. • Generalizáló: G li áló – Átfogó problémák leírására szolgáló rendszerek, osztályozási fogalmai általánosak – Elsõsorban a nemzetközi információcserében és a p információkeresõ nyelveinek y szakterületek speciális összefogásában van jelentõségük
• Individualizáló: – Mély tartalmi feltárást biztosítanak – Egyedi információkat írnak le – Jelentõségük az ilyen jellegû információk iránti megnövekedett érdeklõdés miatt igen nagy
4 szempont: Szerkezetük szerint 4. •
Prekoordinált: pl. pl ETO – Az osztályok sorrendje, kapcsolatrendszere, az osztályozási fogalom helye eleve meghatározott, így független a dokumentum tartalmától – Az osztályozási folyamat a (numerikus, (numerikus alfanumerikus) jelzethez való besorolással, illetve az osztályozás céljára felhasznált ismérvek koordinálásával, azaz a jelzetelemek meghatározott szabályok szerinti összekapcsolásával, a jelzetalkotással lezárul (szintaxis)
•
Pos tkoordinált pl. Posztkoordinált: pl tárg tárgyszavazás s a a ás – A lexikai egységek a dokumentum tartalmától függõen rendelhetõk egymás mellé – A fogalmak sorrendje elõzetesen nem szabályozott – Az osztályozási munka befejezéseként az ismérvek összekapcsolása elmarad – Az elemzést nem követi jjelzetalkotás. Az elemek összekapcsolása p a keresés szakaszában, a keresõ által meghatározott szempontok szerint jön létre
5 szempont: Tartalmuk szerint 5. • Egyetemes: E t – Felölelik az emberi tudás egészét, az ismeretek teljes körét – Osztályozásukban a különféle szakterületek fogalmait összehangoltan g rendezik el
• Speciális (szakterületi, autonóm): – Egy-egy Egy egy tudományterület, szûkebb szakterület, ágazat ismereteit foglalják magukba – Figyelemmel vannak az adott szakterületen mûködõ szakemberek, k b k kkutatók t tók sajátos ját iigényeire é i é és szokásaira ká i is
6. szempont: Az automatizálás mértéke szerint • H Ha az osztályozásás tál á á munkafolyamataiban k f l t ib nem használnak gépi megoldásokat, akkor a rendszer nem automatikus • Gyakori, hogy a lexikai egységek megállapítása intellektuális úton történik, történik míg a rendezés és a szelektálás számítógéppel. Ez a rendszer félautomatikus • Az automatikus osztályozási rendszerekben mind az osztályozási fogalmak meghatározását meghatározását, mind csoportosításukat géppel végzik
7. szempont: A felhasználás célja szerint • • •
Tudományokat osztályozó (filozófiai, (filozófiai történeti stb.), stb ) Ismeretközvetítõ (könyvtári, bibliográfiai, dokumentációs stb.) Ismeretszervezõ (kutatási, irányítási stb., knowledge organization). – A Az iismeretszervezés t é elmélete, l él t mely l e há három kö közül ül a llegösszetettebb ö t tt bb é és legpraktikusabb is egyben, egészen új területnek számít az információkeresõ nyelvek elméletében – ”A A KO az osztályozás szervezésének (a fogalmi hozzáférés struktúrájának) optimalizálásával foglalkozik az ismereteket tároló intézményeknél vagy szolgáltatatásoknál, hogy megkönnyítse az információ visszakeresését, új ismeretek szintetizálását és megosztását felhasználói csoportok számára (...), ( ) valamint hogy stratégiai jelleggel jelleggel, hosszú távra azonosítson minden ismeretforrást és –áramlást, kihasználásukat és továbbfejlesztésüket, szem elött tartva hozzájárulásukat az intézmény vagy szolgáltatás által termelt üzleti értékhez”, vö. értékhez vö http://www.infoloom.com/gcaconfs/WEB/paris2000/S22-02.HTM#N29
IV rész: Rövid osztályozástörténet IV. • Tudományfelosztáson T d á f l tá alapuló l ló osztályozások tál á k – Hierarchikus osztályozási rendszerek (Dewey, ETO) – Mellérendelö osztályozási rendszerek (Ranganathan)
• Nyelvészeti irányzat – – – –
Tárgyszókatalógusok Indexek Információs tezaurusz Ontológia
• Statisztikai irányzat –A Automatikus t tik osztályozás tál á – Automatikus kategorizálás
Tudományfelosztáson alapuló osztályozások: Hierarchikus rendszerek • •
Az elsö információrobbanás: Gutenberg A második: á dik 19 19. sz. – Az elsö referálólap: Chemisches Zentralblatt [1829] – Gyüjteményszervezési problémák: tematikus rendezés hogyan?
•
Számos S á újk újkorii példa éld a ti tizes ffelosztásra l tá (10 osztály: tál L Leibniz ib i [1691 [169196], Bolyai Farkas [1833], Ampére [1984], Shurtleff [1856], Dewey [1873-76], Otlet & LaFontaine [1894]) – Új a közös alosztások gondolata (Dewey (Dewey, Cutler Cutler, ETO)
•
Hármas rendszer [Harris 1870]: tudomány, müvészet, történelem (Bacon alapján) – Bacon: Instauratio magna (1605) • a tudományos megismerés alapja a tapasztalat • az emberi értelem feladata a tapasztalatok feldolgozása, általánosítása • három forrás (emlékezet Æ történelem; képzelet Æ müvészet; értelem Æ bölcselet)
Hierarchikus rendszerek: Dewey • 1885 Dewey Decimal Classification = DDC (Tizedes Osztályozás) – Sikeres fiatalkori munka alapján (1876) – Alapja: filozófiai tudományfelosztás – Jelzeteit gyakran összekapcsolják a Kongresszusi Könyvtár tárgyszavaival (LCSH) és osztályozási jelzeteivel (LCC) – 30 nyelvre fordították le – 2000 elején j 22 keresőszolgáltatás g használta – 1876-ban ezer jelzet sem, 3 jegyig kidolgozva; 1959 [16. kiad.] 50.000 jelzet – Svédországban pl most vezetik be a SAB nemzeti tárgyszórendszer helyett
Dewey folyt. folyt • Jellemzői: – Gyakorlati y jjellegű g – Jelzetelés: tizedes törtek használata – A tizes számrendszer merev keretei között mechanikus:
tíz főosztály tíz-tíz tíz tíz osztály tíz-tíz alosztály
Dewey folyt. folyt • Kö Közös ö (pl ( l iirodalom d l llehet h t angol; l tö történelem té l iis)) alosztások: formai, nyelvi, földrajzi, irodalmi műfajok (nullával kezdődő számjegyek) • A nyelvek jelölése a nyelvészet és az irodalom osztályaiban megegyező számjegyekkel • A földrajzi helyek jelölésére külön függelék – minden földrajzi helynek egy jelzet jelzet, hátul hátul, kitalálta nekik • A hierarchikus táblázat mellett betűrendes mutató (relatív index - a szakrendszer szerves része) oda oda-vissza vissza (szám-nyelv) (szám nyelv)
Dewey folyt. folyt • •
Formai alosztások: 01 Bibliográfia Bibliográfia, 02 Kézikönyv, Kézikönyv 03 Szótár Szótár, 04 Értekezés Értekezés, 05 Folyóirat, 06 Társasági kiadvány, 07 Oktatási anyag, 08 Gyûjtemény, 09 Történet. Tudományfelosztás és jelzetek: – – – – – – – – – –
•
100 Filozófia és rokontudományok 200 Vallás V llá 300 Társadalomtudományok 400 Nyelvészet 500 Természettudományok 600 Hasznos tudományok 700 Müvészetek 800 Irodalom 900 Történelem (a 0 osztály formai csoportjai nem képeznek tárgyi fõosztályt)
Jelzetelés pl.: – – – –
510 Matematika (általában) 510.9 A matematika története (az 510.09 helyett) 420 Angol A l nyelvészet l é t 820 Angol irodalom
Kettöspontos osztályozás: Ranganathan • • • •
•
Shiyali Ramamrita Ranganathan (1892 (1892-1972) 1972) Felismeri, hogy az osztályozás is nyelv Nem a fogalmakból indul ki, hanem az egyes szakterületek fõ ismérveit elemeit sorolja fel táblázataiban ismérveit, táblázataiban, és a mûvek tartalmának kifejezésére ezeket, illetve ezek jelzeteit egyesíti, szintetizálja Az analitikus-szintetikus osztályozásnak ez az értelmezése mély elemzõ munkát tételez fel fel, amelyet elõször a fogalmak elemzése szintjén kell elvégezni, azután az elnevezések szintjén kell megfogalmazni, és ezt követõen lehet rátérni a jelzetelés szintjén a szakjelzet megalkotására A 108 fõosztály (1972) sorrendje elvi szempontból a következõ: – – – – –
Általános mûvek Bevezetõ tanulmányok Természettudományok és mûszaki tudományok Humán tudományok Társadalomtudományok
Ranganathan: jelzetszerkesztés • •
•
• • • • •
Az osztályokon belül nem nem, vagy csak alig ad meg alosztályokat Kidolgozta az egyes szakterületek speciális kérdéseinek, problémáinak jellemzésére, illetve jelölésére szolgáló ismérvek (karakterisztikák) táblázatait. Ezek egy-egy meghatározott szempont alapján sorolják fel az ismérveket ún. facettákba osztva, és a jelölésükre szolgáló izolátokat (alosztásokat) az egyes facetták táblázatában tizedes számokkal jelölte A tartalomra megadható izolátok jelzeteit különféle írásjelekkel kell összekapcsolni megadott szabályok szerinti sorrendben. Eredetileg az ismérvek kapcsolásának legfontosabb írásjele a kettõspont (colon) volt volt, és innen ered a Kettõspontos Osztályozás (Colon Classification) elnevezés is. A mûvek tartalmának a fogalmak szintjén való analízise alapján a könyvtárosnak kell a szakjelzeteket összekapcsolnia a megadott szabályok szerint. Ezért nevezte Ranganathan g a CC-t az elsõ analitikus-szintetikus osztályozásnak y Valamennyi osztály számára öt alapkategória: PMEST - aspektusok Egyediség (perszonalitás, P); anyag (matéria, M); energia (E); térbeliség, hely (spatium, S); idöbeliség (tempus, T) Betürendes index a föfacettákhoz Noha már alig használják, nagy hatása votl világszerte, és a mellérendelö, többszempontú indexelés gondolatával megalapozta a mai számítógépes szolgáltatásokat
Hierarchikus rendszerek: ETO • •
• •
Mandello Gyula Æ Paul Otlet Otlet, Henry LaFontaine: Dewey hozzájárulásával, de a TO-n nagyot alakítva Formai eltérés: a fogalmak hierarchikus felépítésének jobb felismerhetõsége érdekében a "háromjegyû háromjegyû minimum" minimum elvét elvetették, és a fõosztályokat egy, az osztályokat két, az alosztályokat három számjeggyel jelölték y g a jjelzetekkel kifejezett j fogalmak g összekapcsolását p Lényeges: lehetõvé tették a relációk A komplex fogalmak jelölésére, továbbá a Deweynél még csak csírájukban található alosztásokat külön táblázatokká fejlesztették: – Az ún. segédtáblázatokban a minden osztályban alkalmazható (általánosan közös) alosztások – A fötáblázatban az egyes osztályokban, szakterületeken belül használható speciális (korlátozottan közös) alosztások sorozatait
•
Mindezzel megnövelték az osztályozási rendszer flexibilitását, a TO enumeratív, monohierarchikus struktúráját az analitikus-szintetikus y rendszer irányába y tágították g ki osztályozási
ETO folyt. folyt • • • •
A fogalmak hasonlóságán és különbözőségén alapul Fogalmak alá- és fölérendeltségét fejezi ki Mi di a tá Mindig tágabb bb ffogalom l alá lá rendeli d li a szűkebb űk bb ffogalmakat l k t Magyarországon a legelterjedtebb osztályozási rendszer ((még g mindig g sok könyvtár y használja, j , miközben online is van már, de ebben szakoznak; nem merik kidobni, 40 év; polcrendszer alapja az SZTE könyvtárában) • A természetes nyelvektől független jelzetek: számjegyekből, számjegyekből írásjelekből, betűkből • A tizedes törtek rendszerének szabályai szerint épül fel
ETO folyt. folyt • • • •
Átfogó Átf ó osztályozási tál á i rendszer d 60 000 osztályból és a segédtáblázatokból áll Teljes kiadás négy, rövidített 20 nyelven Típusai: – – – –
Teljes kiadás (kb. 120-200 ezer fogalom) Közepes kiadás (kb. 50-60 ezer fogalom) Rövidített kiadás (kb. 15-25 ezer fogalom) Speciális (szakágazati) kiadások
• Internetes szolgáltatásokban is alkalmazható (2000 elején 11)
ETO jelzetalkotás Fötáblázat osztályai: • 0 Általános tartalmú mûvek • 1 Filozófia, pszichológia • 2 Vallás Vallás, teológia • 3 Társadalomtudományok • 4 (1964 óta betöltetlen fõosztály, eredetileg g Nyelvészet) y ) • 5 Alaptudományok. Matematika. Természettudományok • 6 Alkalmazott tudományok • 7S Szépmûvészetek. é û é k Iparmûvészetek. Szórakozások, játékok, sport • 8 Nyelvészet. Irodalom • 9 Régészet. Földrajz. Életrajz. Történelem
Pl alosztályokra bontás: • 6 Alkalmazott tudományok • 62 Mûszaki tudományok • 621 Általános gépészet • 621.3 Elektrotechnika • 621.39 Híradástechnika • 621.396 621 396 Rádiótechnika • 621.396.6 Rádióberendezések • 621.396.61 Rádióadó berendezések Alosztások rendszere: • Àltalánosan közös alosztások • Korlátozottan közös alosztások
ETO folyt. folyt Kereshetősége: K h tő é • A számformátumú jelzeteknek nincsenek nyelvi k lát ik (nyelvfüggetlen, korlátaik ( l fü tl ffogalmi l i nyelv) l ) • Nem felhasználóbarát osztályozó rendszer: – Fogalmaira F l i az ETO ETO-számok á k ttermészetes é t nyelvű feloldásait ismerve lehet keresni – A központozások kö t á k / mellékjelek llékj l k h használata ál t bonyolult
Nyelvészeti irányzat: Tárgyszavas osztályozás és tárgyszókatalógusok • • • • • • •
Alkalmas leírásra, tárolásra és visszakeresésre Leírásra a természetes nyelv szabályozott szavait szavait, szóösszetételeit használja A rendszerben az osztályozói fogalmak egymástól függetlenek, közöttük értelmi összefüggések nem nem, vagy csak esetlegesen vannak (mellérendelõ) Tárolás a tárgyszókatalógusban Lehetõség van a fogalmak utólagos összekapcsolására, összekapcsolására valamint a keresõképhez igazítására a visszakeresés során (posztkoordináció) Biztosítja a többszempontú visszakeresést Fogalomszervezési szintje sekély sekély, a módszer viszont rugalmas és gépesíthetö
Tárgyszavas osztályozás •
Tárgyszó: – – – –
•
Nyelvtanilag szabványosított formájú Természetes nyelven alapuló kifejezés A dokumentum,, információ lényegének y g leírására alkalmas Rövid, tömör, egyértelmű
Három megoldás ismert: – A tárgyszavakat a szövegbõl emeljük ki, s változatlanul, vagy alaktani változásokkal építjük be az osztályozási rendszerbe rendszerbe. – A szavakat a szövegbõl emeljük ki, de ezeket az osztályozási rendszerben azonos fogalmat jelölõ, ám más megnevezéssel illetett tárgyszavakra cseréljük, ha a kiemelt kifejezés nem esik egybe a rendszerben elfogadott megnevezéssel. – A tartalmat a szövegben nem feltétlenül szereplõ tárgyszóval jellemezzük jellemezzük, s szabályozott alakban a rendszerbe illesztjük
•
Az eredmény: – Szabad tárgyszavas osztályozás: bármely szó felhasználható, nincs elõre kidolgozott szótár, de szabványosított alak kell (normalizálás) – Kötött tárgyszavas osztályozás: már meglevö szótárt, szókészletet = tárgyszójegyzéket használunk
Tárgyszóként gy használhatók • • • • • • • • • • • • • • •
Tudományszakok, diszciplinák nevei, pl. atomfizika, irodalomtörténet stb. Tudományos y elméletek nevei,, pl. p relativitáselmélet,, vezetéselmélet stb. Tudományos iskolák vagy irányzatok nevei, pl. reneszánsz, statisztikai irányzat stb. Tudományos problémák, eljárások, gyakorlati alkalmazások nevei, pl. határozatlansági reláció reláció, gazdálkodás stb stb. Tudományos szakkifejezések, pl. káló, esszé stb. Objektumok, élõlények, dolgok nevei, pl. könyv, kutya, olvasók stb. Folyamatok történések nevei, Folyamatok, nevei pl pl. változás változás, születés stb stb. Tudományos módszerek megnevezései, pl. kísérlet, modellezés stb. Tartalmi és formai tulajdonságok megnevezései, pl. keménység, bibliográfia stb. Intézmények, szervezetek, testületek nevei, pl. Somogyi-könyvtár, Magyar Tudományos Akadémia stb. Események nevei, pl. trianoni békekötés, honfoglalás stb. Föld j i nevek, Földrajzi k pl. l D Duna, Hód Hódmezõvásárhely á á h l stb. b Korszakok, idõpontok és idõtartamok nevei, pl. l984, Kádár-korszak stb. Személynevek, alkotások címei, pl. Németh László, József és testvérei stb. Kö i Közismert t rövidítések, ö idíté k pl. l IFLA IFLA, KFKI stb. tb
A tárgyszóalkotás szabályai •
Tartalmi szabályok: – A lehetö legspecifikusabb kifejezés(eke)t válasszuk – A specifikusság szintje függ a könyvtár típusától (pl Cegléd vs MTA) – Hivatkozások besegítenek • Lásd még: generikus ÅÆ specifikus • Lásd utaló: kerti munka ÅÆ munka, kerti
– A dokumentumok tartalmát a keresönyelven y írjuk j le – Alapvetö a következetesség
•
Formai szabályok: – Morfológiai g szempont: p • Előnyös, ha főnév • Jelzőt csak szerkezetben lehet használni • Lehetőleg g egyes gy számban használjuk j ((kivéve csoportok, p gyűjtőfogalmak neveit és a plurale tantum-okat (aminek csak többes számban van értelme, vagy többesben más a jelentése, mint egyesben – medium/media; vö. tollazat, madarak vs. tollazat, pinty) – Szemantikai szempont: kezelni kell • A szinonimákat (a rokon értelmű fogalmakat) • Homonimákat (azonos alakú, de különböző értelmű szavakat)
Formai szabályok folyt folyt. •
Szerkezete, megjelenése szerint a tárgyszó egyszerü (egytagú) Szerkezete vagy összetett (többtagú) – Az összetett tárgyszó részei: fõtárgyszó, altárgyszó, melléktárgyszó – Az összetett tárgyszavak elsõ tagja a fõtárgyszó, fõtárgyszó pl. pl osztályozás osztályozás. – Az altárgyszó a fõtárgyszó tagolására szolgáló, inverzió útján keletkezett tárgyszó, pl. osztályozás, automatikus. – A melléktárgyszó gy a fõtárgyszó gy p pontosabb értelmezését szolgáló, g , nem inverzióval keletkezett tárgyszó, pl. leltározás (könyvtár). De a homonímák után szükséges tárgyszó is melléktárgyszó, pl. rák (betegség).
•
Összetettnél alkotóelemek sorrendje - próbálkozások: – Elöl mindig a fönév áll (de pl matematikai statisztika) – Tárgyszóláncok permutációja: mindegyik kerül vezetö helyzetbe
•
Általánosságban: minél több tárgyszó sorolható be egynél több kategóriába, az osztályozás egyértelmûségének biztosítása érdekében annál indokoltabb a kategóriák jelölése
A tárgyszókatalógus alapjai folyt folyt. • A feltárás eszköze: a tárgyszavak alapján létrehozott betűrendes katalógus • Cédulák egymást szoros betűrendben követik Æ a formailag alakilag l kil hasonló h ló tárgyszavak tá k (és (é nem fogalmak) f l k) kerülnek k ül k egymás mellé (vö. lexikonok, szótárak, tárgyszavas könyvkatalógusok) • A keresés k é h hatékonyságát ték á át javítják j ítják az utalók: t lók – Szinonima utaló: egyes névvariánsról szabványosra, eb Æ ld kutya – Szintagma S i t utaló: t ló az összetett ö t tt tárgyszó tá ó preferált f ált alakjára, l kjá mellérendelö osztályozás Æ ld osztályozás, mellérendelö – Hivatkozás: egy további helyet is megjelöl a keresésre, vívás Æ ld kardvívás
• Kétféle tárgyszókatalógus van: tiszta és rendszerezö
A tárgyszókatalógus típusai •
Tiszta: a specifikus tárgyszó elvére épül – A tárgyszavak tá k egymással á l mellérendelõ llé d lõ viszonyban i b vannak k – A tárolás és visszakeresés pusztán formai jegyek alapján, mechanikus betûrendben történik – A használó rendszerint az összetett tárgyszavak elsõ tagjára kereshet kereshet, esetenként találkozhat invertált alakokkal is – A tárgyszavak a fogalmak különbözõ hierarchia szintjein vannak, s általában képtelenek fogalmi szintek kifejezésére. – Például: • raktár raktáros rendelés rendelés-keret rendezvény rendezvénynaptár
•
Rendszerezö: – Betûrend + valamilyen struktúra – A tárgyszó kiválasztásakor általánosabb és specifikusabb fogalmakat is használnak – Szerkezetét tekintve két altípusa van: bokrosító és alárendelõ tárgyszókatalógus
Rendszerezö tárgyszókatalógus folyt •
Bokrosító: – A tárgyszavak nagy része mechanikus betûrendben, de ha a használat úgy kívánja, a tárgyszavak egyrészét felbontja részfogalmakra, s ezek fõtárgyszó-altárgyszó gy gy szerkezetûek lesznek – Gyakran invertálással hozzák létre. Az invertálás eredményeként az amúgy szétszóródó fogalmak egy helyre gyûlnek – Egy-két hierarchia szintnél nem képes többet kifejezni – Például: • állam állományalakítás állományellenõrzés bibli áfi bibliográfia - ajánló - bio - nemzeti - - másodfokú - szak bibliográfiai leírás
Rendszerezö tárgyszókatalógus folyt •
Alárendelö: Többnyire egytagú kifejezéseket használ használ, s ezek az általánosítás különbözõ fokain foglalnak helyet – – – –
A tárgyszavak elrendezése az eddigiektõl eltérõen fogalmi szintek figyelembevételével történik A betûrend csak az azonos hierarchia szinteken belüli rendezõ elv A rendszer az áttekinthetõség érdekében 5-6 alárendelési szintnél többet nem alkalmaz Példa: •
•
mechanika - folyadékok - - felszíni jelenségek - - - felületi feszültség - - - kapillaritás - - hidrodinamika - - hidrosztatika - - kinetikus folyadékelmélet - légnemûek - - aerodinamika - - kinetikai gázelmélet - mechanikai rezgések
Mutatók: – – –
Szerkesztéssel karbantartás a bövülés során A betûrendes mutató a katalógusban használt tárgyszavak és altárgyszavak betûrendes jegyzéke, melyet elsõsorban az alárendelõ rendszereknél használunk. A szakrendi mutató - szisztematikus index - szakterületenként csoportosítja az elõforduló gy tárgyszavakat
A tárgyszókatalógus alapjai Rendszerező tárgyszavas rendszer: • Átfogó fogalmak Æ altárgyszavak (vö alosztás; történelem vs angol g történelem)) • Az azonos témakörökkel foglalkozó információk egy helyen találhatók • Rendszerező tárgyszókatalógusok: egy egy-egy egy csoporton belüli bontás – Formai – Földrajzi – Időbeli – Tárgyi Tá i szempontok t k alapján l já alkatalógusokra lk t ló k b bontva t
Nyelvészeti irányzat: Indexek • IIndex: d ált lá általános é értelemben t l b mutató, t tó itt itt: jellemzök rendezett jegyzéke (tárgymutató, névmutató szerzõ névmutató, szerzõ, cím cím, tartalom tartalom, testület testület, kiadó kiadó, ISBN, képlet stb.) • A rendezett ismérvek szerint a dokumentumok visszakereshetök, ergo osztályozási végtermék • Gépi vagy kézi, kézi kurrens vagy retrospektív retrospektív, többnyire egynyelvü
Gépi indexek • Jellemzöi: – Létezõ vagy virtuális dokumentumgyûjteményeket indexelnek – A használt osztályozási kifejezések nem intellektuális t ék tevékenység é eredményei, d é i h hanem féli félig-meddig ddi mechanikusan, h ik a dokumentum címébõl vagy szövegébõl származnak – Az osztályozási kifejezéseket nem kiragadva, hanem valamilyen szövegkörnyezet tárgyszólánc stb szövegkörnyezet, stb. feltüntetésével adja meg – Az osztályozási kifejezések rendezésére ciklikus permutációt használ
• Fajtái: – – – –
Címindex Kulcsszóindex Tárgyi index Hivatkozási index
Gépi indexek folyt • • •
Kulcsszó: az információ lényegére jellemzõ jellemzõ, a tartalmi feltárásra alkalmas szövegszó Kulcsszóindex: ha a kulcsszó kiválasztáshoz nemcsak a címet, hanem az egész szöveget feldolgozzák Címindexek: a dok tartalmának leírására az eredeti címbõl, a módosított vagy kiegészített címbõl, esetleg a mesterségesen alkotott címbõl származó kulcsszavakat használ. Ha jjó a cím... – KWIC (Luhn 1959): ”keyword in context”, normalizálás, permutálás – Példa: • finanszírozásának problémái és a könyvtárügy.+ A kultúra • könyvtárügy.+ A kultúra finanszírozásának problémái és a • kultúra finanszírozásának problémái és a könyvtárügy.+ A
– KWOC: ”keyword out of context”, normalizálás, permutálás – Példa: • Finanszírozás • Könyvtárügy • Kultúra
A kultúra finanszírozásának problémája és a könyvtárügy A kultúra finanszírozásának problémája és a könyvtárügy A kultúra finanszírozásának p problémája j és a könyvtárügy y gy
Gépi indexek folyt •
Tárgyi / tárgyszóindex: – – –
•
Kötött, néha kötetlen szókészletet is képes p kezelni Gyakran nagyon hasonlítanak a címindexekhez, ám a tárgyszóláncok megalkotása komoly intellektuális tevékenység A számítógép kész tárgyszóláncokat kap s ennek alapján állítja elõ a tárgyi indexet. Az elõállításnak különbözõ szabályai vannak.
Pl permutált tált tárgy tá index. i d F Fajtái: jtái –
Sima permutált tárgyszóindex: az indexelö a fontos tárgyszavakat a lánc elemeiként, a.m. egyedként fogja fel; a gép ciklikusan permutálja, majd elsõ tagjuk szerint betûrendbe rakja • •
–
Lánceljárásos permutált tárgyszó index: a tárgyszavakat nem önálló, különálló elemekként kezeli, hanem a specifikustól f ó generikusig rendezve a tárgyszóláncon á óá belül, ü ffogalmi szinteket jelez. Példa: •
•
Eredeti lánc: MAGYAR. LÍRA. ROMANTIKA. HASONLAT. A ciklikus p permutáció és a betûrendezés után: HASONLAT. MAGYAR. LÍRA. ROMANTIKA LÍRA. ROMANTIKA. HASONLAT. MAGYAR MAGYAR. LÍRA. ROMANTIKA. HASONLAT ROMANTIKA. HASONLAT. MAGYAR. LÍRA
HASONLAT. ROMANTIKA. MAGYAR. LÍRA ROMANTIKA. MAGYAR. LÍRA MAGYAR. LÍRA LÍRA
Hivatkozási index (Garfield, Science Citation Index,1964) – – – –
Kizárólag géppel (bibliometria, szcientometria, webometry, informetry) Hivatkozott mü és hivatkozó közötti tartalmi kapcsolatot mér, térképez Indexelés bibliográfiai tételekkel = nincs terminológiai probléma Tudományos teljesítmény mérése, rangsorolás, minösítés eszköze is
Nyelvészeti irányzat: Információkeresö tezaurusz • • • • •
Az osztályozási rendszerek általános problémája a lexikai egységek közötti kapcsolatok feltérképezése ill szervezésük nagyobb egységekké A tipizálás két iskolája a kontextusfüggetlen relációkat, értelmi összefüggéseket használó tezauruszok, ill a szintaktikus IKNY-ek o te tustó függö, üggö, de relációmegörzö e ác ó egö ö ttranszformációi a s o ác ó kontextustól 1960-70-es években ismerték fel a relációk elem-voltát, fontosságát. Thesaurus (görög) = kincsesház, kincstár ) a szintaxist is Paradoxon: ((szó)szemantikával Meghatározás (MSZ 3418-87): "Az információkeresõ tezaurusz természetes nyelven kifejezett fogalmak olyan tartalmilag szabályozott, szükség szerint változtatható szótára, amelyben f ltü t tik a legfontosabb feltüntetik l f t bb fogalmi f l i összefüggéseket. ö fü é k t A ttezaurusz fõ rendeltetése információk feldolgozása és keresése."
Meghatározások •
•
•
•
A tezaurusz egy egy-egy egy szakterület teljesnek mondható mondható, természetes nyelven kifejezett fogalomgyûjteménye, ahol a fogalmak közötti kapcsolatokat is feltüntetik. A fogalmak és a relációk azonos értékûek a rendszerben. A "szükség szerint változtatható szótár" kifejezés rámutat a fogalmi teljesség idõbeli rögzítettségére és a bõvíthetõség biztosításának követelményére is. A tezauruszban a fogalmak lexikai egységek formájában jelennek meg. – A tezaurusz lexikai egységei a deszkriptor és a nemdeszkriptor. – A deszkriptor az információk leírására, és visszakeresésére közvetlenül alkalmazható szó. szó – A nemdeszkriptor a deszkriptor szinonim vagy szinonimnak tekintett kifejezése, mely az információk leírására és visszakeresésére közvetlenül nem, csak a vele összekapcsolt deszkriptor figyelembevételével használható. A tezaurusz segítségével megvalósítható a dokumentumok osztályozása és indexelése. Lehetõség van az azonos tartalmú dokumentumok csoportba sorolására, az egyedi információk leírására és a változó szempontok szerinti rendezésére, s ezek tárolására. A rendszer felhasználható hatékony keresõprofilok szerkesztésére. A tezaurusz elsõdleges feladatain túl fontos szerepet tölthet be a szakmai nyelv és terminológia egységesítésében. A deszkriptorok gyakoriságvizsgálata képet ad a kutatási témák megoszlásáról és fejlõdési irányairól.
A tezauruszkészítés menete • •
Elökészítö munka Induló szóanyag összegyüjtése – [Automatikus] szóstatisztikai elemzés – Az adott területre vonatkozó tájékoztatási segédeszközök elemzése, pl. lexikonok, enciklopédiák, értelmezõ szótárak, név- és tárgymutatók – Gyakorlott G k l tt osztályozási tál á i szakemberek k b k és é a feltárandó f ltá dó tterület ül t ttudományos d á képviselõi közvetlen megbeszéléseken gyûjtik össze a szakkifejezéseket – Meglévõ osztályozási rendszerek és szókészletek felhasználása – A fentiek kombinációi
• • • • • • •
Szókészlet elemzése, a legfontosabb deszkriptorok kiválasztása és a deszkriptorok betûrendes mutatójának elkészítése Deszkriptorok gráfszerû kifejtése Ad deszkriptorok k i t k kö közötti ötti relációszerkezet lá ió k t ki kialakításával l kítá á l a deszkriptorcikkek d k i t ikk k létrehozása. A nemdeszkriptorok kijelölése A tezaurusz fõrészének szerkesztése a kapott deszkriptorcikkekbõl A csúcsdeszkriptorok - legmagasabb szintû szintû, legfontosabb jellemzõk kijelölése. A hierarchikus rész láncszerû szerkesztése a fölé- és alárendelési reláció alapján A kiegészítõ jegyzékek elkészítése A ké kész tezaurusz ellenõrzése, ll é ki kiegészítése, é íé é és a modellkísérletek d llkí é l k végrehajtása
A lexikai egységek formája • Szabályok: – A deszkriptorokra vonatkozó formai szabályok lényegében megegyeznek a tá tárgyszavakéval ké l – A lexikai egységeket szabványos nyelvtani alakban, lehetõleg fõnévként kell megadni – A deszkriptorok általában egyes számú fõnevek, kivéve, ha a kifejezés gyûjtõfogalom, ûj f l vagy csak k többes öbb számban á b h használatos, ál vagy h ha az egyes számú és többes számú változat jelentése között különbség van – A lexikai egység lehet köznév, tulajdonnév, számnév és betûszó is. Ha a rövid alakot választottuk, közölni kell a teljes alakot, zárójelben fel kell oldani és utalni k ll róla kell ól – Szerkezetét tekintve a deszkriptor lehet egytagú vagy többtagú (összetett szó, több szóból álló kifejezés) szó. Többtagú szót akkor használhatunk, ha jelentése nem következik összetevõinek jelentésébõl (pl. királyvíz), összetevõi fontos vagy rendezõ szerepet töltenek be az osztályozásban, osztályozásban illetve túl általánosak stb stb. – A többtagú kifejezéseket természetes sorrendben írjuk le és nem invertálunk, hisz a szerkezetet úgyis a relációk képezik. Utalókat, csak a több szóból álló kifejezések fontos, önálló elemeirõl készítünk, pl.: a természetes és a mesterséges nyelvek esetében célszerû utalni a mesterséges nyelvekrõl
Szemantikai egységesítés Szabályok: •
A szinonimák és kváziszinonimák kitüntetett szerepet töltenek be a rendszerben. A tezauruszban szinonimán a tartalmilag egymást helyettesítõ, kváziszinonimán az adott szakterületen azonosnak tekinthetõ kifejezéseket értjük értjük. A szinonimakapcsolat esetei: – – – – –
•
•
Különbözõ alakú, magyar nyelvû kifejezések, pl. eb - kutya Egy fogalom magyar és idegen nyelvû változata, függetlenül attól, hogy meghonosodott-e mindkettõ pl mindkettõ, pl. szerkezet - struktúra Egy fogalom köznapi és tudományos változata, pl. sósav - hidrogénklorid Egy fogalom rövidített és teljes megnevezése, pl. ETO - Egyetemes Tizedes Osztályozás Egyéb alakváltozatok: szófaji, igekötõs stb. eltérések, pl. információs tezaurusz információkeresõ tezaurusz;; hûlés - kihûlés.
A rendszerben a szinonimákat a legfontosabb fogalmi kapcsolatok közé soroljuk és L (lásd), illetve H (helyettesíti) relációkban tüntetjük fel. Egyes tezauruszok a szinonimák közül gyakran kiemelnek egyet (deszkriptor - nemdeszkriptor) és ezt használják j a leírásban és a keresésben is. Más esetben a névvariánsokat használják, s a megfeleltetést utólagos összekapcsolással oldják meg. A homonímák - többjelentésû szavak - megkülönböztetése a zárójelben utánnuk tett értelmezõ segítségével történik: –
entrópia (információelmélet) entrópia (termodinamika). ( )
A tezauruszcikk szerkezete Szabályok: • A tezauruszcikk a deszkriptorcikk és a nemdeszkriptorcikk közös elnevezése • A tezauruszcikk az élén álló vezérdeszkriptorból és a hozzá fogalmilag közvetlenül kapcsolódó, s e kapcsolatok jellegét is feltüntetõ deszkriptorokból áll kapcsolatok, relációk sorrendje meghatározott meghatározott. Egy • A cikken belüli kapcsolatok adott reláción belül a lexikai egységek betûrendben sorolódnak fel, a közöttük lévõ esetleges kapcsolatok feltüntetése nélkül. Deszkriptorcikként szerepelhet egyedül álló vezérdeszkriptor is • A nemdeszkriptorcikk a nemdeszkriptorból, valamint a leíráskor és kereséskor helyette használt deszkriptorból áll • A rendszerben feltüntetett minden egyes kapcsolat "fordítottjának" is meg kell k ll jjelennie l i a megfelelõ f l lõ ttezauruszcikkben ikkb
Példa •
A tezauruszcikk felépítése néhány kitüntetett, gyakran használt relációval:
•
A tezauruszszabványban felhozott példa:
VEZÉRDESZKRIPTOR
•
FORGÁCSOLÁS
H F A T P R E X
szinonimája fölérendeltje alárendeltje egésze (totum) része (pars) meghatározottja (rezultáns) meghatározója (elõfeltétel) rokonsági kapcsolat
H forgácsoló alakítás F anyagszétválasztás megmunkálás A esztergályozás fúrás köszörülés marás üregelés vésés T gyártástechnológia P forgásvezetés nyíró igénybevétel R forgács forgácsolási felület E forgácsoló szerszámgép forgácsoló szerszám X forgácsolhatóság szerszámelrendezés
A tezaurusz relációi •
Szinonima (L-H) reláció. Irányultságát tekintve két típusa van: – L (lásd a szinonimát) A nemdeszkriptorcikkekben használjuk, a lexikai egység által jelölt fogalom helyett a jelet követõ deszkriptort kell alkalmazni, pl.: • STRUKTÚRA Ú L Szerkezet
– H (nemdeszkriptort helyettesít) A jelet követõ nemdeszkriptor a deszkriptorcikk élén álló vezérdeszkriptort helyettesíti, pl.: • SZERKEZET H Stuktúra
•
Fölé- és alárendeltségi /generikus, nem-faj/ (F-A) reláció. Ha egyik fogalom alárendeltje a másiknak. (A logikában az alárendelt fogalmak ö összessége é ((uniója) iój ) ki kiadja dj a fölé fölérendelt d lt ffogalmat. l t A ttezauruszban b ez nem feltétel) • KÖNYVTÁR A közmûvelõdési könyvtár • KÖZMÛVELÕDÉSI KÖNYVTÁR F könyvtár
•
Egész-rész /szerkezeti/ (T-P, totum-pars) reláció. Fizikai, szerkezeti kapcsolatokat határoznak meg a fogalmak között. A részfogalmak nem rendelkeznek az egész fogalom valamennyi ismérvével = az egész több/más, mint részeinek összessége • CÍMLAP • P verzó
VERZÒ T címlap
A tezaurusz relációi folyt •
Rezultáns és elõfeltétel (R-E) (R E) reláció. reláció A rezultáns (következtetés) reláció több hasonló jellegû tartalmi kapcsolat összefoglaló elnevezése. "A vezérdeszkriptor által jelölt tárgy, folyamat stb. rendeltetése, okozata, eredménye, terméke, célja, tárgya, következménye (együttvéve: meghatáro ottja) a jelet kö rozottja) követõ etõ deszkriptor des kriptor által jelölt fol folyamat, amat tárg tárgy stb stb. (együttvéve: meghatározó)." Például: • CERUZA R írás
Az elõfeltétel A lõf ltét l (kiindulás) (kii d lá ) reláció lá ió iis, iirányított á ít tt reláció lá ió lé lévén, é több h hasonló ló jellegû tartalmi kapcsolat foglal össze. "A vezérdeszkriptor által jelölt folyamat, tárgy stb. létének, létrehozásának, mûködésének, meghatározásának oka, eredete, elõidézõje, eszköze, alapja, kiindulása ( (együttvéve: ü é meghatározója) h á ój ) a jjelet l kö követõ õd deszkriptor ki ál általl jjelölt löl tárgy, á folyamat stb. (együttvéve: meghatározott)." Például: • ÍRÁS E Ceruza
•
Rokonsági (X) reláció. A tezauruszban más módon ki nem fejezhetõ, lényeges kapcsolatok tartoznak ide, pl.: ellentét, hasonlóság stb
A tezaurusz felépítése Bevezetõ rész tartalmazza a címlapot és a bevezetést (cél, szerkezeti felépítés, készítés módja, mennyiségi jellemzõk stb.) A szótári rész a tezauruszban lévõ lexikai egységek különbözõ ismérvek szerint rendezett jegyzékeinek együttese. . A kötelezõ szótári részek: a fõrész, a jelentéskör szerint csoportosított rész és a lexikai egységek betûrendes mutatója. A tezaurusz fõrésze tartalmazza a tezauruszcikkeket vezérdeszkriptoraik betûrendjében. A fõrész egységei deszkriptorcikkek és a nemdeszkriptorcikkek. A jelentéskör szerint csoportosított rész egy helyre gyûjti a tartalmilag összetartozó deszkriptorokat. A csoportosítás történhet szakterületek és ezek alterületei, illetve fogalmi kategóriák (facetták, vetületek) és ezek alkategóriái szerint. A legkisebb csoportokon belül a lexikai egységek betûrendben vannak. A lexikai egységek betûrendes mutatója a vezérdeszkriptorokat és a nemdeszkriptorokat betûrendben sorolja fel. A mutató elmaradhat, ha megegyezik a fõrészben található vezérdeszkriptorok és nemdeszkriptorok sorrendjével. A további lehetséges részek: a hierarchikus rész, a grafikus rész és a kiegészítõ j jegyzékek ék k nem minden i d tezauruszban b találhatók. lálh ók Kid Kidolgozásuk l á k nem kö kötelezõ, l d de gyakran k segítik a tájékozódást. A hierarchikus rész általában a tranzitív relációk (generikus, szerkezeti) alapján kiemeli a tezauruszcikkekbõl a hierarchikus kapcsolatban álló g , s ezeket a legáltalánosabbtól g a legkonkrétabbig g g láncba fûzi. Ez a fogalmakat, fajta elrendezés rendkívül hatékonyan segíti a keresést. A grafikus rész a jelentéskör szerint kiválasztott deszkriptorokat és kapcsolataikat gráfok segítségével ábrázolja. A kiegészítõ jegyzékek azoknak a kifejezéseknek, neveknek (pl.: tulajdonnevek) a betûrendes jegyzékei, jegyzékei melyek az osztályozásban és indexelésben felhasználhatók, de beépítésük indokolatlan a fõrészbe.
OSZK Köztaurusz / Taxaurusz grafikus rész
Tezauruszok • AGROVOC • OSZK • UNESCO
Nyelvészeti irányzat: Ontológiák •
•
A mesterséges intelligenciával kapcsolatban használt ontológia szó nem egyértelmű kifejezés. A filozófiában már régóta használják, ott a létezés témáját jelöli. (Sokan összekeverik az episztemológiával, amely a tudásról szól annak főnévi és igei értelmében, azaz a tudás egyszerre tény, az a cselekvés vagy állapot, hogy valamit tudunk, és a szerzett ismeretek összessége, rendszere, azaz valamilyen reprezentáció.) Az ismeret vagy a tudás megosztása kontextusban az ontológia a fogalomalkotás, fogalom feltérképezés (conceptualization) specifikációját, vagyis konkrét körülírását, megkülönböztetését g jjelenti. Az ontológia g azon fogalmak g és viszonyok y leírásának fajtája, amelyek egy vagy több ágens viselkedésére vonatkjozik. –
•
•
Gyakorlati célból az ontológiai egy formális szerkezetű szótárban szereplő meghatározások csoportját jelenti. Bár nemcsak ez az egyetlen módja van a fogalomalkotás specifikálásának, e módszernek van néhány olyan tulajdonsága, amik miatt az jól használható a tudásmegosztásra a MI-ban MI-ban.
Ontológiákat a MI területén abból a célból készítenek, hogy lehetővé váljon a tudás megosztása és ismételt felhasználása. Ennek eszközei a különbözö funkciójú software robotok. Az ontológiák a robotok között kommunikációt segítik, lényegében egy-egy egy egy kifejezés értelmét kódolják számukra, ami az ismeretek megosztásához vezet közöttük. A MI rendszereknél létrehozott közös szókincs (szótár) a közös tudást képviseli vagy reprezentálja. Egy szakterület fogalmainak specifikációjá, az osztályok, relációk, funkciók ((függvények) gg y ) és egyéb gy objektumok j meghatározásait g nevezik ontológiának. g A definíciókat a kijelentéskalkulus (predicate calculus) szabályai szerint írják le, amit azután lefordítanak speciális reprezentációs nyelvekre.
Ontológiák folyt • G Gyakorlati k l ti szempontból tból egy kö közös ö ontológia t ló i aztt a szótárt adja meg, amelynek segítségével az ágensek egymás között kérdéseket és válaszokat tudnak megfogalmazni. • A szótárt használó ágensnek g nem kell megosztania a tudásbázisát, mert minden ágens tud olyasmit, amit a másik nem, és egy ontológiát használó ágensnek nem kell tudni a közös szótár segítségével összeállítható minden kérdésre válaszolni. • Felhasználási ötlet: a szemantikus világháló (Semantic Web)
Ontológiák – példák • • • • •
Upper ontology Ontológia AGROVOC: tezauruszból ontológia Protégé Protégé csomag