Tóth Máté (Pécsi Tudományegyetem, Felnőttképzési és Emberi Erőforrás Fejlesztési Kar) Hernádi Bettina (Miskolci Egyetem) Kovács Zsigmond (Kovex Kft

Fogalmak identitása a tématérképekben Tóth Máté (Pécsi Tudományegyetem, Felnőttképzési és Emberi Erőforrás Fejlesztési Kar) Hernádi Bettina (Miskolci Egyetem) Kovács Zsigmond (Kovex Kft.)

Abstract A tématérkép (Topic Maps) technológia egy számítógépes információ- és tudásmenedzsmentre vonatkozó ISO szabvány, amely az információs túlterheltség kezelését, a tudásmegosztást és bármilyen forrásból származó, valamint bármilyen típusú információ jelentésen alapuló összekapcsolását szolgálja. A technológia a számítógépes tudásreprezentáció egy formája, amely széles körben alkalmazható web alapú információszolgáltatásra. Kezdetben gyakorlati problémák megoldására (üzleti dokumentumok indexeinek összefésülésére) használták, később vált világossá, hogy – hasonlóan a szemantikus web technológiákhoz – alkalmas lehet egy globális hálózati metaadat-infrastruktúra megvalósítására is. A szemantikus technológiák közös jellemzője az identitásközpontúság, azaz hogy a fogalmak, amelyekről állításokat teszünk, rendelkezik egy számítógép és az ember számára is értelmezhető azonosítóval. Ezen azonosítók többszöri felhasználásával érhető el az alkalmazások közötti interoperabilitás, és ezek miatt hordozzák a szemantikus technológiák a világhálón közzétett tartalmak világméretű együttműködésének ígéretét. A tématérképek szabványa PSI-k (Published Subject Identifier = Publikált tárgyazonosító) használatát írják elő a fogalmak identitásának biztosítására. A Publikált tárgyazonosító egy publikált tárgyindikátorra mutat, amely ember által is olvasható leírást tartalmaz egy adott fogalomról. A szabvány nem ad eligazítást arra vonatkozóan, hogy ezeknek pontosan milyen követelményeknek kell eleget tenni. Erre vonatkozóan egy OASIS ajánlás ad útmutatást. E szerint a PSI-nek URI-nak kell lenni; a publikált tárgyazonosítónak egy humán interpretációra alkalmas publikált tárgyindikátorra kell mutatnia; illetve ki kell fejeznie az egyedi URI-t, amely publikált tárgyazonosítóként használandó. A szemantikus technológiák készen állnak arra, hogy a globális tudáscsere alapjául szolgáljanak, a fogalmak azonosítására azonban nem sikerült megnyugtató megoldást találni. Elszigetelt projektek (pl. Ontopedia, OASIS), gyakran nem nyilvános vállalati PSI-tárak kísérlik meg a fogalmak egyértelmű azonosítását. Mindez nem biztosít alkalmazások határain átnyúló használatot, így ezen PSI-k nem jelenthetik az alapját egy globális hálózati metaadatinfrastruktúrának. A fogalmak identitásának kezelésében a szemantikus technológiák fejlesztői közösségei egy új Bábel tornyát építgetik. A célunk ennek a toronynak a lebontása kell legyen. Bevezetés A Topic Maps (Tématérképek) tudás leírására és a kereshetőség segítésére kifejlesztet szabványos technológia. A Tématérképek adatmodellje az ISO 13250 szabványcsaládban került leírásra, együtt a csereszabványokkal, a formális szemantikai struktúrákkal és egy

grafikus leíró nyelvvel. Egy kiegészítő szabványban definiálták a lekérdező nyelvet, (Topic Maps Query Language). Az első ISO szabvány megjelenését (2000) követően egyre szélesebb körben alkalmazzák web oldalak és portálok készítéséhez ugyanúgy, mint a tudásmenedzsment támogatására. A tématérképek csereszintaxisa az XML alapú XTM nyelv (XML Topic Maps), amely tématérképek webes környezetben való megosztását, együttműködését segíti. A technológiát kezdetben gyakorlati problémák megoldására (üzleti dokumentumok indexeinek összefésülésére) használták, később vált világossá, hogy – hasonlóan a szemantikus web technológiákhoz – alkalmas lehet egy globális hálózati metaadat-infrastruktúra megvalósítására is. (Pepper 2010) A tématérképek adatmodelljének alapját a témák, asszociációk és előfordulások jelentik, ezek határozzák meg a TAO modellt. (Topics, Associaions, Occurences, vö. Pepper 2010, Tóth 2008). Amennyiben valamely valóságban is létező dologról állítani szeretnénk valamit, létre kell hoznunk egy témát, amely azt reprezentálja. Például a NETWORKHOP 2010 témával a konferenciát, a Debrecen-nel a helyszínt adó várost írhatjuk le. A témák között asszociációk hozhatók létre, ezek hordozzák a gazdag szemantikai struktúrát. Hasonlóan az RDF tripletekhez az asszociációk hordozzák az állítások predikátumait. (Pl. A NETWORKHOP 2010 helyszíne Debrecen) A témák szempontjából releváns információk helyeit az előfordulásokkal adhatjuk meg. Pl. A NETWORKSHOP 2010 weboldala https://nws.niif.hu/nws2010/. Az előfordulások az információs tér olyan hivatkozásaira mutatnak, amelyek nem valóságban létező dolgok reprezentációi (így nem témák), hanem csak a releváns információk helyei. Így az előfordulásoktól nem indulhatnak ki újabb asszociációk. A témák, asszociációk és előfordulások típusai az ontológia szintjén reprezentálják azok osztályait. Pl. NETWORKSHOP 2010 (téma) – konferencia (tématípus); Debrecen (téma) – város (tématípus). A témák, asszociációk és előfordulások azok típusainak generikus alárendeltjei. A tématérképek adatmodelljében a téma-, asszociáció- és előfordulás-típusok is témák. Ahhoz hogy létrejöhessen a különböző forrásból származó információk jelentésen alapuló összekapcsolása, biztosítani kell, hogy valamennyi tématérképben szereplő téma rendelkezzen egy egyértelmű azonosítóval, amelynek az alkalmazásokon keresztüli újrafelhasználásával el lehet érni, hogy a számítógép felismerje, hogy adott esetben két oldal ugyanarról a valóságban is létező dologról „beszél”. A jelen tanulmány célja a tématérképek témák egyértelmű azonosítására kidolgozott mechanizmusának ismertetése, a problémák bemutatása és egy lehetséges megoldás felvázolása. A fogalmak identitása szemantikus technológiákban A szemantikus technológiák egyértelműen azonosított tárgyak között definiált kapcsolatokon keresztül hoznak létre egy következtetésekre is alkalmas metaadatinfrastruktúrát a weben. Berners-Lee, Handler és Lassila (2001) a szemantikus webről szóló vízióban az URI-kat határozták meg, mint az intelligens világháló legelemibb egységeit. Az RDF adatmodell alapja, hogy létezzenek a fogalmakat egyértelműen azonosító erőforrások, amelyek azok reprezentánsaiként a tripletek elemeiként funkcionálhatnak. Ezen erőforrásokat URI-k képviselik. A szemantikus web elképzelés alapja, hogy az URI-k alkalmazások során keresztül újrahasznosításra kerüljenek, hiszen csak így lehet biztosítani, hogy a számítógépek felismerjék, hogy két állítás ugyanazon valóságban is létező tárgyra, fogalomra, személyre stb. utal, és ez teszi lehetővé az alkalmazások határain keresztüli tudásreprezentációt.

A szemantikus web szabványokat használó alkalmazások közötti együttműködés legelemibb feltétele szintén az URI-k mint azonosítók konzisztens használata. A szemantikus web technológiákon alapuló globális tudásreprezentáció egyik legfontosabb feltétele lenne az ellenőrzött szótárak, ontológiák tömegeinek közzététele, amelyek a világ létezőinek minél teljesebb körére vonatkozóan tartalmaznak azonosítókat. A tématérkép technológia fejlesztésével eredetileg nem a globális hálózati tudáscsere megvalósítását célozták, de már az üzleti iratok összefésüléséhez is elengedhetetlen volt a témák alkalmazásokon keresztüli egyértelmű azonosítása. Később a technológiával elérendő célok újradefiniálásával az azonosítás kérdésében is határozottabb lépésekre volt szükség. Tárgyközpontú programozás A szemantikus technológiák identitásközpontúsága kapcsán jelent meg az elmúlt években a tárgyközpontú programozás fogalma, amely az Ontopedia PSI szerverének tárgymeghatározása szerint „a számítástudomány elméletének és gyakorlatának egy ága, amely a fogalmak (és azok egymással való viszonyrendszerének) elsőbbségét hangsúlyozza az információ- és tudásmenedzsment, az ember-gép interakció valamint az operációs rendszerek fejlesztésének minden területén. Művelőinek célja Vannevar Bush 1945-ben megjelent „As We May Think” c. víziójának megvalósítása.” (http://psi.ontopedia.net/Subject-centric_computing) A fogalmat Steve Pepper (2007; 2009) vezette be. „1000 évvel ezelőtt az emberek azt hitték, hogy a Nap kering a Föld körül. Nikolausz Kopernikusz Az égi pályák körforgásáról című művében a heliocentrikus elméletével azonban mindent a feje tetejére állított. Ugyanezzel a problémával állunk szemben a számítástudományban és az információmenedzsmentben. A mi számítástudományi univerzumunk az alkalmazásokat és a dokumentumokat helyezi a középpontba. Ez nem jól van így, ugyanis mindez nem reflektál arra a tényre, hogy az ember tárgyakról, dolgokról alkotott fogalmakban gondolkozik. A tárgyakat kell a középpontba helyezni, hiszen az, ami minket igazán érdekel. Ez a tárgyközpontú megközelítés, ami radikálisan különböző módon szervezi az információt és a tudást, és ez a tárgyközpontú programozás, amiről a tématérképek igazán szólnak.” Pepper mondatai – szándéka szerint és szövegszerűen is – a tématérkép technológiára vonatkoznak, ugyanakkor belátható, hogy az idézett szöveg valamennyi szemantikus technológiára értelmezhető. A „tárgy” (subject) a világ létezőit jelenti, amelyeknek reprezentánsok segítségével meg kell határozni az identitását és jellemzőikkel, fogalmi kapcsolataikkal együtt le kell írni a számítógépek számára is értelmezhető módon. A szemantikus technológiák különböző megközelítéseket használnak a tárgyak, fogalmak azonosítására. Ez vezetett a web identitásválságához, amelyben az egyes közösségek – az eltérő preferenciák és megoldások nyomán – lényegében egy új Bábel tornyot építgetnek. (Pepper – Schwab 2003) A publikált tárgyazonosítók A tématérkép technológia PSI-ket (Published Subject Identifier/Indicator – Publikált Tárgyazonosító/Indikátor) használ a fogalmak egyértelmű azonosítására. A PSI elsődleges célja, hogy két tématérkép összeolvasztásakor biztosítsa, hogy a számítógép felismerje azokat a témákat, amelyek a valóság ugyanazon létezőjére utalnak. Az OASIS Topic Maps Published Subject Technical Committee (OASIS Tématérkép Publikált Tárgyak Technikai Bizottság)

azzal a céllal állt fel 2003-ban, hogy tématérképek és egyéb szemantikus technológiák (RDF, OWL) közötti interoperabilitást biztosító ajánlásokat dolgozzon ki. 2003 júniusában jelent meg a PSI-kre vonatkozó ajánlás. (Pepper 2003) A dokumentum részletesen ismerteti a PSI-k legfőbb követelményeit. A PSI rövidítésnek két feloldása is van. A Published Subject Indicator (Publikált tárgyindikátor) egyértelműen azonosítja az adott tárgyat az emberek számára. Ez lehet egy szöveges definíció, egy audio, vagy vizuális reprezentáció. Egy város esetében például állhat a következő: „Debrecen, magyar megyei jogú város, Hajdú-Bihar megye székhelye.” A tárgyindikátorokat rendszerint egy önálló HTML oldalon helyezik el. A Published Subject Identifier (Publikált tárgyazonosító) a címzés, amely a gép számára azonosítja az adott dolgot. Amennyiben két témának azonos a publikált tárgyazonosítója, azt a számítógép összeolvasztáskor azonos témaként fogja kezelni. Az indikátor és az azonosító nem azonos a fogalommal, tárggyal, amelynek az identitását meghatározza. Ezért nem tekinthető PSI-nek, ha egy online elérhető dokumentum a saját URL-jével azonosítja magát. Megkülönböztethetők címezhető és nem címezhető dolgok. Csak a nem címezhetőknek van szükségük tárgyazonosítóra.

A Publikált tárgyi azonosítók működési mechanizmusa (Pepper, Schwab 2003 nyomán)

Különbséget kell tenni a tárgyi azonosító és a publikált tárgyi azonosító között is. Publikált tárgyi azonosító, amelyet a tématérkép alkalmazásunk készítéséhez tettünk közzé, tárgyi azonosító ezzel szemben bármi lehet, ami a reprezentálni kívánt dolog identitását meghatározza (wikipédia oldal, egy adott személy email címe, egy vállalat honlapja).

A PSI-kkel szemben támasztott követelmények a következők: 1. A PSI-nek URI-nak kell lenni. 2. A Publikált tárgyazonosítónak egy humán interpretációra alkalmas publikált tárgyindikátorra kell mutatnia. 3. A Publikált tárgyindikátornak ki kell fejeznie az egyedi URI-t, amely publikált tárgyazonosítóként használandó. (Pepper 2003) Az OASIS bizottsága által a PSI-kre vonatkozóan megfogalmazott ajánlások a következők: 1. A Publikált tárgyindikátor ember által olvasható metaadatokat kell adjon saját magáról. 2. A Publikált tárgyindikátor megadhat géppel olvasható metaadatokat saját magáról. 3. Az első és a második ajánlás metaadatainak következetesnek, de nem feltétlenül azonosnak kell lenni. 4. A Publikált tárgyindikátornak jeleznie kell, hogy PSI-ként használandó. 5. Publikált tárgyindikátornak azonosítania kell a publikálóját. (Pepper 2003) Az ajánlás arra nem ad választ, hogy hogyan kezeljük azt a problémát, amikor egy dolgot több URL is egyértelműen azonosít. A hálózati társadalomban a kérdés sokkal életszerűbb. Egy személyt azonosíthatja az email címe, a róla készült Wikipédia oldal, a saját honlapja, bármelyik profilja közösségi oldalakon (Iwiw, Facebook, LinkedIn). Tárgyak, fogalmak esetében Wikipédia oldal vagy a www.everything2.com definíciói. Online szótárak definíciói ugyanúgy meghatározhatják a dolgokat, amelyekről állításokat kívánunk tenni. A különböző forrásokból származó tématérképek összeolvasztása akkor valósulhat meg, ha egy adott tárgyra vonatkozóan valamennyi alkalmazás ugyanazt a PSI-t alkalmazza, ugyanis a számítógép ebben az esetben lesz csak képes felismerni, hogy ezek ugyanazon valóságban létező dologról tesznek állításokat. A PSI-knek tehát akkor van értelmük, ha alkalmazások során keresztül újrahasznosítják őket. Ez a globális tudáscsere alapvető feltétele. Ehhez létre kellene hozni egy nagy adatbázist, amelyben a PSI-k fellelhetők. Egy nagy közös PSI tár ötlete már az XTM szabvány kidolgozásakor felmerült, de azóta sem valósult meg. A világ valamennyi létezőjének a leírása nem is lehet reálisan kitűzhető cél. Jelenleg a tématérkép alkalmazásokat használó cégek, szervezetek gyakorlata az, hogy készítenek egy PSI tárat a saját maguk által használt azonosítókból. Ilyen például az OASIS PSI tára (http://www.psi.oasis-open.org), és ilyet tervez megvalósítani Magyarországon a Kovex Computer Kft. (http://www.psi.kovex.hu). Ezek az oldalak természetesen meg sem kísérelhetik a világ teljességének leírását, valamennyi entitásának definiálását, így a globális tudáscsere szempontjából is elenyésző a jelentőségük, ugyanakkor nélkülözhetetlenek a vállalaton belüli tudáscsere szempontjából. Az azonosításon túl olyan további funkciókat is betölthetnek, mint a vállalati szakterminológia tára, értelmező szótár, amely segíti a tudásintenzív vállalatok hatékony tudáskezelésre vonatkozó törekvését. (Tóth, Korotij, Kovács, Domokos 2010)

A vállalati PSI tárak több problémát is felvetnek. Egyrészt csak a vállalat érdekeltségi körébe tartozó személyek, jelenségek, fogalmak kerülnek azonosításra, amelyek mások szempontjából irrelevánsak, így kérdéses, hogy bármikor újrahasznosításra kerülnek-e. Másrészt gyakran nem nyilvánosak, így eleve lehetetlen ezen PSI-k újrahasznosítása. Harmadrészt pedig – mivel az esetek túlnyomó többségében nem manuális úton készülnek, hanem szerkesztett adatokból generálják – éppen az hiányzik belőlük, ami a PSI-knek az igazi erejét adják: a humán interpretáció számára készített leírás.

A globális tudáscsere publikált tárgyazonosítói A globális méretű tudáscsere szempontjából az elszigetelt vállalati PSI tárak nem jelentenek hatékony megoldást még akkor sem, ha törekednek az OASIS ajánlásokhoz igazodóan létrehozni és közzétenni az azonosítóikat. A szemantikus kapcsolatokon alapuló világméretű tudásreprezentációhoz valamennyi fél közös érdeke, hogy egy kiemelt eljárásban egyezzenek meg a fogalmak, dolgok egyértelmű azonosítására. Az eddigi kezdeményezések kudarca jórészt arra vezethető vissza, hogy nem építettek az internetező tömegek munkájára, és az általuk generált tartalomra. Az Ontopedia projekt, amelynek ambiciózus jelmondata, hogy „The identity of everything”, azt tűzte ki célul, hogy a világ valamennyi létezőjéről készüljön egy PSI. Ezt úgy képzelték el, hogy a készülő tématérkép alkalmazásokban előforduló új fogalmakhoz szabványos módon rendelnének egy URI-t. Pl. a Debrecen téma azonosítója a következőképpen nézne ki: http://psi.ontopedia.net/Debrecen. Mivel az Ontopedia keretein belül készített tématérkép alkalmazások együtt sem fedik le a világ létezőinek akár csak töredékét is, a kísérlet kudarcra van ítélve. (Az Ontopedia projekt PSI tára a következő oldalon érhető el: http://psi.ontopedia.net.) Egy másik kísérlet nem azt célozta, hogy egyetlen nagy adatbázisban reprezentáljanak minden lehetséges fogalmat, amelyről állítások tehetők, hanem azt, hogy a szemantikus technológiák által azonosításra kifejlesztett technikák között valósítsa meg az átjárást. Pepper (2006) javasolta az URI-k és a PSI-k helyett a PRI-k (Public Resource Identifier) bevezetését ilyen céllal. A javaslat ötlet szintjén maradt. A szemantikus web fejlesztések olyannyira előrehaladott állapotban voltak, hogy nem volt sem lehetőség, sem szándék az alapok átírására csak azért, hogy a tématérképekkel foglalkozó nemzetközi közösség munkája is része legyen az épülő globális metaadat-infrastruktúrának. A tématérkép egy olyan szemantikus technológia, amely – annak ellenére, hogy a nemzetközi szabványosítás elindítását követően nyíltan felvállalta ilyen irányú ambícióit – nem hordozza magában a világméretű tudáscsere megvalósításának lehetőségét. Ennek egyik legfőbb oka, hogy a technológia egyszerre kívánja szolgálni a szemantikailag kódolt tartalom humán és a gépi interpretációját. Maguknak a PSI-knek a szerkezete is ezt az igényt tükrözi. Ez pedig lehetetlenné teszi a világ teljességét reprezentáló nagy PSI tár létrehozását. A probléma másik oldala filozófiai természetű. Lehet-e egyértelműen azonosított tárgyakról beszélni akkor, amikor a természetes nyelven való kommunikáció során sem érthet két ember ugyanazt ugyanazon a szón. Egy-egy szó értelmezése azon kontextusok sorától függ, amelyben azt az ember megismerte a saját életében. (Bahtyin 1976) Ezen kontextusok pedig nem lehetnek fedésben. A szavak szavak hálójában értelmeződnek, így a formális konceptualizálás során alkotott PSI-k hidegen kopogó definíciói csak elnagyolt vázlatai

lehetnek, nem csak a valóság végtelen számú elemének, de még a természetes nyelvek fogalmainak is. Erre a kritikai elemre a tématérképekkel foglalkozó nemzetközi közösség rendszerint azzal érvel, hogy míg a természetes nyelvekben is fennállnak ugyanezek a dilemmák, a természetes nyelven való kommunikáció is létezik. Miért lenne tehát kizárt, hogy nagyobb mértékű általánosításokkal megvalósítható legyen a formalizált ismeretek számítógépek közötti cseréje. (Pepper 2009) Az ismeretek tématérkép-ontológiák szintjén való reprezentációja ugyanezt a filozófiai problémát hordozza. A tématérkép alkalmazások hordozhatóságának és minél teljesebb körű együttműködésének az lenne az előfeltétele, hogy minél több – a valóságban is létező – fogalom rendelkezzen egyértelmű azonosítóval. Ehhez azonban az újabb és újabb javaslatok helyett kellene találni egy olyan projektet, amely a tömegek bölcsességére és együttműködésére épül, egyértelmű leírással lát el világban is létező dolgokat, a témák tekintetében minél átfogóbb (sőt szándéka szerint a teljességre törekszik), nyelveken átnyúlóan értelmez fogalmakat és e mellett egységes formában képzett szabványos URI-kat rendel a tartalmakhoz. Dicheva és Dichev (2006) utal rá, hogy tématérképek szerkesztéséhez alkalmazhatók Wikipédia szócikkek tárgyazonosítóként, azonban erre vonatkozó kezdeményezés még idáig nem született. A Wikipédia – tekintve, hogy valamennyi fent leírt jellemzővel bír – alkalmas lehet a világháló identitáskrízisének megoldására. Ehhez minél szélesebb körben elfogadottá kellene tenni azt a nézetet, hogy egyrészt fel kell adni a PSI-kre vonatkozóan eddig felállított ajánlások egy részét, másrészt, hogy – az egyesek által túlmisztifikált, mások által érdemtelenül lenézett – közösségi online enciklopédia szócikkeit kell használnunk a világméretű tudásreprezentáció céljaira. A Wikipédia megfelel a PSI-kkel szemben támasztott követelményeknek, hiszen ezek témákat azonosító URI-knak is tekinthetők. A Publikált tárgyazonosító egy humán interpretációra alkalmas publikált tárgyindikátorra mutat, az URI mögött van egy leírás, amelyet személyek számára hoztak létre. A Publikált tárgyindikátor kifejezi az egyedi URI-t, amely publikált tárgyazonosítóként használandó. (vö. Pepper 2003) A tárgyazonosítókról szóló első három ajánlás szerint a publikált tárgyindikátornak ember által olvasható metaadatokat kell adjon saját magáról. E mellett megadhat géppel olvasható metaadatokat is. A metaadatoknak következetesnek, de nem feltétlenül azonosnak kell lenniük. Ezeknek az ajánlásoknak a teljesítéséhez a Wikipédia általános szerkesztési elveit elég lenne csekély mértékben módosítani. A negyedik ajánlásról – amely szerint a publikált tárgyindikátornak jeleznie kell, hogy PSI-ként használandó – le kellene mondani, hiszen ez sem a kereshetőség, sem, pedig a használat szempontjából nem nélkülözhetetlen, ugyanakkor a biztosítása indokolatlanul nagy beavatkozást jelentene az online enciklopédia eddigi szerkesztési gyakorlatába. Az ötödik ajánlás szerint a publikált tárgyindikátornak azonosítania kell a publikálóját. Ez az ajánlás szintén összeegyeztethetetlen a Wikipédia általános szerkesztési elveivel. Az ajánlásokról való lemondással együtt a Wikipédia szócikkeinek ilyen célra való kiemelése számos előnyt hordozna. A legfőbb előny, hogy a fogalmak azonosítására a tömegek bölcsességét és az önkéntesek munkáját mozgósítaná egy olyan projekt keretében, amely már széles körben elfogadott.

A PSI-kről szóló ajánlások nem vettek tudomást a nyelvek sokféleségének problémájáról. A Wikipédia kezdetleges szinten képes kezelni ezt a kérdést azzal, hogy egyegy szócikken belül is lehetőséget teremt a nyelvek közötti váltásra. Az angol nyelv dominanciája természetesen meg kellene, hogy maradjon, hiszen az URI-kat reprezentáló karakterláncok tekintetében nem lehet eltérés két azonos dolgot reprezentáló tárgyazonosító között. (Pl. http://en.wikipedia.org/wiki/Debrecen és http://hu.wikipedia.org/wiki/Debrecen), és így célszerű azt a nyelvet kiemeltként kezelni, amelyen a legnagyobb tömegű szócikk érhető el. A Wikipédia szabványos módon képezi a témákat reprezentáló URI-kat. Ez nagyban elősegíti a PSI-ként való használhatóságot. A Wikipédia legnagyobb előnye, hogy nyíltan felvállalja, hogy a teljességre törekszik. Ez természetesen nem jelenti azt, hogy valamennyi tématérképekben potenciálisan előforduló téma, asszociáció és előfordulás megjelenhet benne, hiszen nagyon sok olyan fogalomról, amely a vállalati PSI-tárak érdekeltségi körébe tartozik, nem készül leírás az online enciklopédiában. A Wikipédia nem válthatja ki tehát a vállalati PSI tárakat, de megkíméli azokat attól, hogy olyan dolgokról készítsenek leírást, amelyekről már készült. Összegzés és kitekintés A szemantikus technológiák megteremtették a lehetőségét annak, hogy egyértelműen azonosított fogalmakat szemantikai kapcsolatok mentén összekapcsolva, a háttértudást ontológiákban reprezentálva létrejöjjön a globális hálózati tudáscsere. A fogalmak egyértelmű azonosítására azonban a különböző technológiákat fejlesztő közösségek különböző eljárásokat dolgoztak ki. Ez vezetett a világháló identitásválságához, amelyben az egymástól elszigetelten működő közösségek az azonosítók Bábel tornyát építgették, amelyben nem nyílt lehetőség az azonosítók újrahasznosítására. A tématérképek esetében azonosításra a PSI-k, azaz a publikált tárgyazonosítók használatosak. Míg a lokális szintű tudásreprezentáció céljaira megfelelnek a helyben épített vállalati PSI-tárak, a világméretű tudáscseréhez találni kell egy kiemelt projektet, amely teljességre törekvően próbálja kezelni a fogalmak azonosításának kérdését, és felépítésében nem különbözik túlságosan nagymértékben attól, amit a PSI-re vonatkozó ajánlások meghatároznak. Ez a projekt lehetne a Wikipédia, amellyel valós esélyt teremthetünk arra, hogy nagy mennyiségű azonosító közzétételével megvalósítható legyen a globális hálózati tudáscsere. Irodalom: Bahtyin, M. (1976) A szó a költészetben és a prózában = A szó esztétikája, Budapest, Gondolat kiadó, 1976. 173–216. p. Berners-Lee, T. – Handler, J. – Lassila, O. (2001) The Semantic Web = Scientific American, May 17 http://www.scientificamerican.com/article.cfm?id=the-semantic-web [letöltve: 2010. március 15.]

Dicheva, D. – Dichev, C. (2006) TM4L Creating and Browsing Educational Topic Maps = British Journal of Educational Technology 2006. (37. köt.) 3. sz. 391–404. p. http://compsci.wssu.edu/iis/nsdl/Publications/BJET06-Dicheva-Dichev-Submitted.pdf [letöltve: 2010. március 15.] Pepper, S. – Schwab, S. (2003) Curing the Web’s Identity Crisis. Subject Indicators for RDF. Ontopia AS. May. http://www.ontopia.net/topicmaps/materials/identitycrisis.html [letöltve: 2010. március 13.] Pepper, S. (2006) A Case for Public Resource Identifers A Call for Action = Identity, Reference and te Web Workshop, Edinburgh, May, 2006 http://www.ontopia.net/topicmaps/materials/Public_Resource_Identifiers.ppt [letöltve: 2010. március 13.] Pepper, S. (2007) As We Really May Think = AToMS 2007 Asian Topic Maps Summit, Kyoto, 2007, Dec, 12. www.ontopedia.net/pepper/slides/AToMS2007.ppt [letöltve: 2010. március 15. Pepper, S. (2009) Introduction to Topic Maps and Subject-centric Computing = Topic Maps Workshop, Neumann János Számítástudományi Társaság Mesterséges Intelligencia Szakosztály. Budapest, 2009. július 21. Pepper, S. (2010) Topic Maps = Encyclopedia of Library and Information Sciences. Third edition, Taylor & Francis Group. [megj. előtt] http://www.ontopedia.net/pepper/papers/ELIS-TopicMaps.pdf [letöltve: 2010. március 15.] Tóth M. (2008) Tématérképek a könyvtárosképzésben = Tudományos és műszaki tájékoztatás (55. köt.) 6. sz. 251-269. p. http://tmt.omikk.bme.hu/show_news.html?id=4916&issue_id=494 [letöltve: 2010. március 15.] Tóth M., Korotij Á., Kovács Z., Domokos B. (2010) A Knowledge Sharing Framework Based on Topic Maps Compliant Web Glossaries = Proceedings of the 14th World Multiconference of Systematics, Cybernetics and Informatics, June 29 – July 2, 2010. Orlando, Florida [megj. előtt]

Tóth Máté (Pécsi Tudományegyetem, Felnőttképzési és Emberi Erőforrás Fejlesztési Kar) Hernádi Bettina (Miskolci Egyetem) Kovács Zsigmond (Kovex Kft

Recommend Documents