MEO MAGYAR EGYSÉGES ONTOLÓGIA
http://ontologia.hu/meo 1.0 AZ ONTOCLEAN MÓDSZERTAN ISMERTETÉSE SZŐTS MIKLÓS ALKALMAZOTT LOGIKAI LABORATÓRIUM
TÁMOGATÓ
1
BUDAPEST 2006.05.28. NKFP-2/042/04
tartalom 1.
bevezető.........................................................................................................................3
2.
az OntoClean metodológia ismertetése ..........................................................................4 2.1.
a probléma ...............................................................................................................4
2.2.
az OntoClean filozófia ..............................................................................................5
2.3.
metatulajdonságok ...................................................................................................7 rigiditás (rigidity) .........................................................................................................8 azonossággal kapcsolatos fogalmak...........................................................................9 teljesség (unity) ........................................................................................................11 függés (dependence) ................................................................................................12
2.4.
szabályok ...............................................................................................................13
2.5. a fogalmak osztályozása és az ontológia szerkezete .............................................14 áttekintés ......................................................................................................................14 a fogalomtípusok részletezése .....................................................................................16 gerinc (+R)................................................................................................................16 szerep (∼R, +D) ........................................................................................................17 tulajdonsághordozó ..................................................................................................18 alakváltó (∼R, +I, -D) ................................................................................................19 keverék.....................................................................................................................20 az értékelés összefoglalása..........................................................................................20 3.
a metodológia továbbfejlesztésének irányai..................................................................21
4.
esettenulmányok ..........................................................................................................22 ET1: elmélkedés az anyagról és az anyagöszletről...................................................22 ET2: mi az építőanyag? eledel-e a rántott csirkecomb (P8)? ....................................25 ET3: vajon a „társadalmi egység” (social entity) emberek egy csoportja-e? (P5, P6) 27 ET4: hogyan nemzet az angol (P10)? és hogyan faj az ember (P9)?........................29 ET5: az ember ágens-e, ember-e a tanár és mi a kalapács? ....................................32 ET6: a lepke és a hernyó esete ................................................................................35 ET7: mitől (kitől) függ a férj? .....................................................................................36 ET8: munkanapok és ünnepek, azaz az időfogalmak (P1)........................................38
5.
néhány fogalom OntoClean jellemzése ........................................................................40 kategória (-I, +R).......................................................................................................40 típus, kvázi-típus (+I, +R).........................................................................................40 szerep (~R, +D) ........................................................................................................41 tulajdonsághordozó ..................................................................................................41 alakváltó (tulajdonságváltó) (∼R, +I)..........................................................................41 keverék (¬R, +I) .......................................................................................................41
6.
hivatkozások.................................................................................................................42
2
1. bevezető A jelen dokumentum célja kettős: •
ismertetni az OntoClean módszertant abból a célból, hogy a projekt során felhasználhassuk,
•
a metodológia továbbgondolásával olyan modell (ontológia szerkezet) alapjait kidolgozni, amely fokozottan segít ontológiaszerkesztésben, -kezelésben.
Az OntoClean metodológia a következő összetevőkből áll: •
a fogalmakhoz rendelt metatulajdonságok,
•
generikus (subsumption, is_a) reláció alkalmazásának ellenőrzésére szolgáló szabályok, amelyek a metatulajdonságok definíciójából következnek,
•
a fogalmak osztályozása a metatulajdonságok alapján,
•
a fogalmak osztályozásán alapuló ontológia szerkezet.
Bár az ontológiák „tisztítása” hangsúlyozott célja az OntoClean metodológiának, ugyanakkor a fogalmak osztályozása, az ez által generálható szerkezet az ontológiakészítést ugyanígy segíti (l. Guarino [2001]). Az OntoClean megértésében nélkülönözhetetlen a Guarino által hozott (és más) példák átelmélkedése, és hasznos a Guarino csoport által fejlesztett DOLCE ontológia ismerete. Természetesen a Guarino csoport ontológiai elfogultságai nem köteleznek az OntoClean használatában. A metodológia ill. a modell jobb megértéséhez néhány probléma részletes átgondolására volt szükség, ezeket elkülönítettük „esettanulmányok” címmel, hogy ne akasszák meg a gondolatmenetet. Ezekben egyébként sok olyan kérdésről is elmélkedünk, amely nincs szoros kapcsolatban a metodológiával, de érdekesek az ontológiák szerkezete és értelmezése szempontjából. Az OntoClean módszertant az N. Guarino nevével fémjelezhető csoport munkálta ki. A metodológia ismertetésében elsősorban a N. Guarino és szerzőtársai publikációira támaszkodom. Nagyon sok definíció, állítás, példa ismétlődik, ezek forrásánál nem hivatkozom egy forrásra, hanem a Guarino azonosítót használom, az ilyen utalások megvannak Guarino [2000/b]-ben és/vagy Guarino [2001]-ben.
3
2. az OntoClean metodológia ismertetése 2.1. a probléma A módszertan célja valamilyen, az ontológia céljától és a konkrét ontológiai elkötelezettségektől független kritériumokat adni az ontológia vizsgálatára. Az eddigi munkájukban a taxonómia helyességére koncentráltak, azaz a generikus (subsumption, is_a) reláció használatára. Az OntoClean projektet olyan, a meglévő ontológiákban található hibás, tisztázatlan példák inspirálták mint a következő, amelyet Guarino gyakran idézett. Példa: 1. a physical object is an amount of matter (Pangloss) 2. an amount of matter1 is a physical object (WordNet) Ahhoz, hogy ezt a két állítást elemezzük, tisztában kell lennünk azzal, hogy mit értünk „physical object” és „amount of matter” alatt, valamint mit jelent az „is a” predikátum (azaz a generikus reláció). A következőkben felsorolunk néhány olyan szempontot, amely szerint a fenti két fogalom gyökeresen különbözik: •
Ha a „physical object” ismertetőjelének tartom azt, hogy van formája, az „amount of matter” nem lehet fajtája, mivel ugyanaz a liter tej akármilyen tartályban ugyanaz.
•
Ha egy „amount of matter” előfordulás egy részét kicserélem egy másikra, egy másik „amount of matter” előfordulást kapok. Ugyanakkor, ha egy órának egy alkatrészét kicserélem, az ugyanaz az óra marad. Tehát a „physical object” nem lehet az „amount of matter” fajtája.
•
Míg egy physical object esetén értelmes az, hogy „hiányos” (pl. a milói Vénusz), egy „amount of matter” előfordulás megszűnik (és egy másik születik), ha elveszünk belőle. Tehát a „physical object” és az „amount of matter” nem lehet egymás fajtája.
Az OntoClean metodológiában az első két érv úgy fogalmaztatik meg, hogy az „amount of matter” azonossági feltétele nem fér össze a „physical object” lehetséges azonossági feltételeivel. Az utolsó pedig úgy, hogy míg a „physical object” fogalom hordoz teljességkritériumot, az „amount of matter” viszont anti-teljességet hordoz. Ezek a tulajdonságok kizárják azt, hogy a fogalmakat egymás alá rendeljük a generikus reláció szerint. Természetesen az „amount of matter” és a „physical object” közt fenn kell állnia valamilyen kapcsolatnak: egy physical object előfordulás valamilyen amount of matter előfordulásból áll – erre vezette be Guarino a „constitutes” relációt. Látható, hogy az OntoClean elemzés segítségével nemcsak az osztályozás anomáliái fedhetők fel, hanem ezek okai is. Az egyik ilyen fontos ok az, hogy a természetes nyelvben az „is a” predikátumot nemcsak a generikus relációra használjuk, hanem sokkal tágabb értelemben. Az ET1 esettanulmányban az itteni gondolatmenetet formálisan megismételjük. Példa vége
1
Az „amount of matter” egy anyag tetszőleges részét jelenti (pl. egy adott pohárban lévő tejmennyiség), nem az absztrtakt anyagfogalmat. Lásd ET1. 4
Néhány, az előzőhöz hasonló tipikus problémát sorol fel a következő táblázat. Az utolsó oszlopban azt jelöljük, hogy a problémát Guarino-ból vettük, vagy a MEO munka során merült fel. (Guarino)
P1:
mi a helyes reláció az „időtartam” és az „időintervallum” közt
P2:
a „bernáthegyi” és a „mentőkutya” közti viszony
P3:
a „földrajzi régió” és az „ország” közti viszony
(Guarino)
P4:
lehet-e az „ágens” alá rendelni az „ember” fogalmat?
(Guarino)
P5:
a „social entity” a „group of people” fajtája-e? azaz
(Guarino)
P6:
a rendőr és a rendőrség közt fennállhat-e az „eleme” reláció?
(MEO)
P7:
külön fogalom-e az „ember” és a „személy”, és ha igen, akkor ez mivel jár?
(MEO)
P8:
étel-e az alma és a rántott csirke?
(Guarino)
P9
vajon faj-e az ember?
(Guarino)
P10
vajon nemzet-e az angol?
(Guarino)
P11
az ember ágens-e
(Guarino)
P12
mi a lepke és a hernyó
(Guarino)
(MEO)
Természetesen, ha valaki tisztázza mit ért az egyes fogalmak alatt, a generikus reláció helyes felfogása alapján minden metodológia nélkül el tudja dönteni, hogy a fenti állításokból melyiket tartja helyesnek; de ha a hasonló kérdések özönével kell megbirkóznia (pl. ontológiaszerkesztés közben) kifejezetten segít egy módszertan, amely irányt szab gondolkodásának. Még akkor is, ha a módszertan hiányos, és kérdéses elemeket is tartalmaz. Közösségi munka esetén pedig – és az ontológiaszerkesztés ilyen – elengedhetetlen, hogy közös szempontok szerint döntsenek. Már egymás érvelésének megértése is megkívánja ezt.
2.2. az OntoClean filozófia Az OntoClean metodológia olyan metatulajdonságokat és azokhoz fűződő szabályokat definiál, amelyeket a fogalmakra alkalmazva ontológiai elkötelezettségünket tisztázhatjuk – tehát nem kötődik az ontológiát alkotók ontológiai elkötelezettségéhez. Azonban ez a semlegesség – bár általában fennáll – nem lehet abszolút: a metatulajdonságok meghatározása már feltételezi a világ valamilyen szemléletét. Az OntoClean metodológiáról szóló publikációk ismertetik is azokat az alapvető elkötelezettségeket, amelyeken alapul a metodológia. Az OntoClean metodológiát kifejlesztő csapat alapvetően arisztoteliánus filozófiai szemléletben dolgozik. Számukra a kiindulópont az egyedi létező (particular), erre mi az egyed szót használjuk. A fogalmat mint az egyedekre kimondható egyargumentumú predikátumokat fogják fel, s ezért property-nek nevezik. Az egyes definiált metatulajdonságok másodrendű egyargumentumú relációk, amelyeket fogalmakra alkalmazunk. Definíciójuk azonban visszavezetnek a fogalom előfordulásaira, ahogy azt az egyedekre alkalmazzuk. Példa: azt vizsgáljuk, hogy egy property szükségszerűen jellemzi-e azt az egyedet, amelyre áll. (Az, hogy egy fogalom előfordulása szükségszerűen jellemzi-e az egyedeket, a rigiditás metatulajdonság definíciója lesz.) Ha Szőts Miklós ez az egyed, az „ember” fogalom minden körülmény közt, és amíg létezik, minden időben áll rá. Tehát szükségszerűen jellemzi. Viszont a „férj” property nem: volt, amikor nem volt férj, és elképzelhető, hogy sosem lesz az. 5
Bár Szőts Miklós mind az „ember”, mind a „férj” fogalom előfordulása, de nem ugyanúgy. A különbség a fogalmakban van: az első az egyed olyan tulajdonsága, amelybe természetes módon soroljuk be, szituáció- és időfüggetlenül jellemzi („típus”), a másik olyan, amely külső előfordulásoktól (házasságkötés, feleség) függ, és bizonyos szempontokból jellemzi („szerep”). Példa vége Látható, hogy nem azt nézzük, hogy a fogalom előfordulásának ideje alatt áll-e az előfordulásra, – ez esetben triviálisan minden fogalomelőfordulás szükségszerű lenne (amíg férj, addig férj), hanem az egyed létezéséhez viszonyítjuk. Ha az OntoClean szellemét meg akarjuk érteni, ezt mindig szem előtt kell tartani. Mindennek egyszerű, de fontos logikai vetülete van. Guarino nyomán az S5 modális logikát használjuk a Barcan formulával. A fogalmakat (properties) egyargumentumú predikátumoknak fogjuk fel, ezeket alkalmazhatjuk az egyedekre. Ennek közvetlen következménye, hogy a fogalmak terjedelme (extenziója) az egyes lehetséges világokban egyedek halmaza, jelentése (intenziója) a világokból az extenziókba menő függvény, amely értéke a kérdéses világban való extenzió. Ebben a logikai interpretációban két fogalom megegyezik, ha terjedelme szükségszerűen megegyezik 2. Példa folytatása: a példában szereplő állításokat a következőképp fordíthatjuk 3: „Szőts Miklós ember”
≈
(E(Sz ts Miklós)→ ember(Sz ts Miklós))
azaz „minden esetben, ha Szőts Miklós létezik, ember” „Szőts Miklós férj”
≈
◊férj(Sz ts Miklós)
azaz „van olyan eset, amikor Szőts Miklós férj” A különböző fordítást az határozza meg, hogy az „ember” fogalom rigid, míg a „férj” nem. Példa vége Az OntoClean metafogalmai a filozófiai ontológiában gyökereznek, néhány hasznos filozófiai olvasnivaló: Enc_of_Phil, Simons. Fogalmakat reprezentálhatunk egyargumentumú predikátummal (osztályfogalom), vagy többargutmentumúval (relációfogalom) – a fogalom tartalmától függően4. Általánosan elterjedt az egyargumentumú predikátummal való reprezentálás. A Guarino csapat felfogásában jelentősége annak van, hogy ők ezt komolyan veszik. Az a természetes nekik, hogy a „piros” mint fogalom a piros egyedeket jelenti, hiszen a piros(.) predikátumnak ez a terjedelme. Azonban Guarino is mindig hozzáteszi hogy a piros szín már másképp elemezendő.
2
természetesen a fogalmakhoz fűzhetünk logikánkban ki nem fejezhető tulajdonságokat, amelyek a terjedelemtől függetlenül befolyásolják a fogalmak ekvivalenciáját, de ennek logikai kezelését még tisztázni kellene. 3
a modális kvantorba beleértjük az idő feletti kvantálást is.
4
A MEO projektben kétargumentumú relációkat engedünk meg, a többargumentumúakat binárisokkal fejezzük ki. 6
2.3. metatulajdonságok A metatulajdonságok 5 másodrendű egyargumentumú relációk, amelyeket fogalmakra alkalmazunk. Definíciójuk azonban visszavezetnek a fogalom előfordulásaira; a definíciók a következő sémát követik: „egy fogalomra áll az X tulajdonság, ha a fogalom minden előfordulására áll az, hogy…”. Néhány tulajdonságra bevezettetik a tulajdonság ellentéte, amely azt jelenti, hogy „egy fogalomra áll az antiX tulajdonság, ha a fogalom minden előfordulására nem áll az, hogy…”. Természetesen az állítás minden lehetséges világban és minden időpontban értendő. A metatulajdonság alkalmazására a következő jelölés alkalmaztatik: •
ha egy A tulajdonság áll a fogalomra, +A-val címkézendő,
•
ha egy A tulajdonság nem áll a fogalomra, -A-val címkézendő,
•
néhány tulajdonságra bevezettetik a tulajdonság ellentéte („antiA”: ), amelyet ∼A jelöl,
•
ha a tulajdonság ellentéte bevezettetett, ¬A-val címkézendő azok a fogalmak, amelyekre sem a tulajdonság, sem ellentéte nem áll („semiA”).
+A és -A között a negálás logikai művelete áll fenn, a többi lehetőségnél bonyolultabb a megkülönböztetés logikai leírása. Jelölje ϕ(x) azt a tulajdonságot, amely definiálja az A metatulajdonságot; ekkor azt, hogy az A metatulajdonság áll egy áll egy P fogalomra, a ∀x(P(x)→ϕ(x)) formula fejezi ki. Tehát a fent bevezetett jelölések logikai kifejtése: +A:
∀x(P(x) → ϕ(x))
-A:
¬∀x(P(x) → ϕ(x)) ≡ ∃x(P(x) & ¬ϕ(x))
∼A:
∀x(P(x) → ¬ϕ(x))
¬A:
(∃x(P(x) & ¬ϕ(x)) & ∃x(P(x) & ϕ(x)))
A metatulajdonságokat Guarino logikai formulákkal is definiálja, de a legtöbb esetben a definíció nem jó, – azaz nem a szerző intuíciója szerinti tulajdonságot definiálja, – ahogy azt Kaplan kimutatja. Az olyan általános tulajdonságok, amelyekre néhány metatulajdonság alapul, nem definiálhatóak pontosan, ennek ellenére használhatóak, ha egy közösség megegyezik értelmezésükben. A metatulajdonságok filozófiai logikai elemzését Carrara folytatja, de ez az OntoClean alkalmazásának gyakorlatához nem ad semmit. Amikor egy fogalomra a metatulajdonságot meg akarjuk határozni, a lehetséges előfordulásokat kell megvizsgálni, áll-e rájuk az a tulajdonság, amely a metatulajdonság fennállását meghatározza. Ennek a vizsgálatnak két módja van: •
igyekszünk minden esetet figyelembe venni – nevezzük ezt analitikus módszernek;
•
a prototipikus eseteket vizsgáljuk, nem törődve a kivételekkel – nevezzük ezt prototipikus módszernek 6.
Az első esetben is elképzelhető, hogy eltekintünk kivételektől – ez attól függ, hogy mi a célja az ontológiának, és milyen a felbontási finomsága. Míg az analitikus módszer többé-kevésbé jól meghatározott eredményt ad, a prototipikus eredménye erősen függ attól, mit tekintünk a fogalom tipikus előfordulásának. Ennek ellenére bizonyos esetekben célszerű választani, lásd elsősorban az ET2 és ET7 esettanulmányokat.
5
jelen tanulmányban a metatulajdonság szót az OntoClean metatulajdonságaira érrtjük.
6
l. Sjeder-ben a meronómiai módszert. 7
Vannak esetek, amikor könnyen meghatározhatók egy fogalom metatulajdonságai, de sokszor komoly problémát okozhatnak ezek megválasztása. Jó néhány példát fogunk hozni, az esettanulmányokban találhatók részletes elemzések. Az, hogy melyik módszert választjuk, attól is függ, hogy mire akarjuk használni a metatulajdonságokat. Ha a generikus reláció ellenőrzése a cél, inkább az analitikus módszer ajánlott, viszont a fogalomtípusok meghatározásánál sokszor nagy a kísértés a paradigamatikus módszer alkalmazására. A fontos az, hogy legyen valamilyen általánosan elfogadott és alkalmazott szabály arra, hogy mikor melyiket kell, szabad alkalmazni. A következő metatulajdonságokkal jellemezhetőek a fogalmak:
rigiditás (rigidity) ismertetés Egy tulajdonság egy egyed lényeges tulajdonsága akkor és csak akkor, ha kötelezően áll rá (minden lehetséges világban és időpontban, ahol és amikor az egyed létezik). Egy fogalom rigid (+R) akkor és csak akkor, ha minden előfordulásának a fogalomhoz tartozás lényeges tulajdonsága. Egy fogalom antirigid (∼R) akkor és csak akkor, ha a fogalomhoz tartozás egyik előfordulásának sem lényeges tulajdonsága. Ha egy fogalom se nem rigid, se nem antirigid, szemirigid (¬R) Példa: a SZEMÉLY fogalom rigid, a TANÁR antirigid, hiszen a tanárságot el kell nyerni, és el lehet veszíteni. A PIROS DOLOG fogalom szemirigid, hiszen lehet olyan dolog, ami törvényszerűen piros (példa: az emberi vér7), de a legtöbb nem ilyen. Ugyanakkor, ha a PIROS fogalmat a pirosnak észlelt színek osztályaként értelmezzük, rigid lesz. Példa vége értékelés Kaplan – bár a megfogalmazást kifogásolja – nem cáfolja, hogy a rigiditást valamilyen modális logikában meg lehet fogalmazni. Innen is látszik, hogy a rigiditás az egyik legmegalapozottabb és leghasznosabb metatulajdonság. Természetesen – mint az összes metatulajdonságnál – az ontológia jellegétől, felbontási finomságától függ, vajon egy fogalmat rigidnek ítélünk vagy sem. Három lehetőség miatt lehet valamilyen fogalom anti(semi)rigid: 1.) a fogalom előfordulása csak időlegesen jellemez egy egyedet – a legtöbb példa ilyen (férj, tanár, csecsemő stb.), 2.) a fogalom különböző lehetséges (gondolható) világokban mást jelent: ugyanarra az egyedre (ill. a másik világban elképzelt mására) hol jellemző, hol nem – egyszerű példa erre is van: egy országban lehet valaki férj, tanár, de egy másikban már nem, mivel a jogi szabályozás eltérő. Figyelemreméltó, hogy a második esetre felsorolt példák mind az első ok miatt sem rigidek. Egyetlen olyan példát találtam, amely csak a különböző világok miatt nem rigid – ez a házasság l. ET7. Ezért feltételezhetjük, hogy a rigiditás metatulajdonság általában a fogalmak alkalmazásának időfüggését jelzi. Egy rigid fogalom olyan tulajdonság, amely egy egyedre teljes élettartama alatt áll, ha áll. Egy nem rigid fogalom esetén van olyan egyed, amelyre hol
7
ezt a példát Ungváry Rudolfnak köszönhetem. A példán jól látható, hogy egy metatuljadonság kimondása ontológiai elkötelezettségeken alapul. Azzal, hogy a vér példáját hozzuk itt, kizárjuk mindazt a fantázia világot, amelyben az emberfajtáknak lehet más színű vére is. 8
jellemző a fogalom, hol nem (pl. férj)8. Meggondolandó, hogy – továbbfejlesztésként – jelezzük azt, hogy időfüggés miatt lesz egy fogalom antirigid. Bár a rigiditás talán a legtisztább metatulajdonság, sok problémát okozhat, lásd elsősorban az ET2 és ET7 esettanulmányokat. A „legmegrázóbb” példa a n tlen fogalom: analitikus gondolkodással nyilvánvalóan szemirigid, míg prototipikusan mondható antirigidnek. Hasonló a csecsem is, ezek elemzését lásd ET7-ben. Példa vége.
azonossággal kapcsolatos fogalmak ismertetés Az azonossági feltétel (identity condition, IC) olyan ismérv, amely alapján kimondható két egyed azonossága, ill. különbözőségük. A félreértések elkerülése végett: nem arról van szó, hogy felismerjük-e, valami a fogalomhoz tartozik-e, hanem arról, hogy a fogalomhoz tartozó előfordulásokat a fogalomhoz kötött ismérv alapján azonosítjuk, különböztetjük meg. Guarino kedvenc példájával: nem arról van szó, hogy milyen ismérvek alapján lehet megállapítani egy állatról, hogy kutya, hanem arról, milyen ismérvek alapján lehet megállapítani, hogy az én kutyám, vagy a szomszédé. Azaz az, hogy minek az alapján ismerek fel egy előfordulást. A fogalmak jellemzése szempontjából az érdekel bennünket, hogy egy fogalom előfordulásai rendelkeznek-e közös IC-vel. Egy fogalom hordoz azonossági feltételt (röviden azonosságot) (carries IC), ha van egy azonossági feltétel, amely minden előfordulására alkalmazható. Jelölés: +I, -I. A tulajdonságot a fogalom azonossági feltételének nevezzük. Például konkrét objektumoknál a tér-idő kontínuumban elfoglalt hely, állatoknál a DNS struktúra megegyezése a fogalom azonossági feltétele lehet. Látható, hogy valaminek általában több IC-je van. Az, hogy egy kritérium egy fogalom azonossági feltétele, öröklődik; így az is öröklődik, hogy egy fogalomnak van azonossági feltétele. Természetesen az, hogy egy fogalomnak nincs IC-je, nem azt jelenti, hogy előfordulásai nem ismerhetőek fel, hanem azt, hogy azokat különböző módon ismerjük fel. Mivel a legáltalánosabb fogalmak nem hordoznak azonosságot, ha egy fogalom hordoz egy azonossági feltételt, van nem-fogalma, amely azt az azonossági feltételt még nem hordozza. Azt mondjuk, hogy egy fogalom azonossági feltételt (röviden azonosságot) ad (supplies IC), ha hordoz egy olyan azonossági feltételt, amelyet nem hordoz egyetlen olyan fogalom sem, amely a GENERIKUS reláció szerint fölé van rendelve; jelölése +O, illetve -O. Guarino kiköti, hogy csak rigid fogalom lehet +O tulajdonságú, ebből következik, hogy ha egy fogalom nem rigid, csak akkor hordozhat azonossági feltételt, ha rigid fogalom alá van rendelve a generikus reláció szerint. Példa: az ALMA fogalom ad azonossági feltételt, az alárendelt PIROS ALMA már nem, de a fölé rendelt alma fogalomtól örökli9. Ugyanakkor a PIROS ALMA alá van rendelve a PIROS TÁRGY fogalomnak, amely nem hordoz azonosságot. Viszont ha a PIROS a piros színárnyalatokat jelenti, hordoz IC-t, amelyet a SZÍN fogalomtól örököl (pl. a megfelelő fényhullámhossztartomány). Példa vége.
8
egy levelében Kornai András felvetette a fogalmak extenzív-intenzív voltának jelölését, ha jól értem ez pontosan megfelel a rigid-antirigid kettősségnek. 9
mint általában, most is irodalmi példákat idézünk, a bennük foglalt ontológiai elkötelezettségeket nem bíráljuk. 9
Fontos speciális eset az, amikor az azonossági feltétel az előfordulás részeinek vagy elemeinek megegyezése. Ez az anyagöszletek, illetve csoportok azonossági feltétele (l. ET1, ET3). Fontossága miatt Guarino [2001] kiemeli ezt az esetet, és külön metatulajdonságként veszi fel: „mereológiai azonossági feltételt hordoz”10, jelölése: +ME, ill. –ME. értékelés A „hordoz/ad azonossági feltételt” metatulajdonság már nem annyira egyértelmű, mint a rigiditás. Guarino az azonossági feltétel logikai definíciójából megkísérli kizárni a triviális megoldásokat, de mint Kaplan bemutatja, siker nélkül. Általában igaz, hogy csak egyes triviális eseteket tudunk a logikai megfogalmazásból kizárni, mindig maradnak még ki nem zárt bonyolultabb nem szándékolt jelentések. Ahogy Kaplan fogalmaz: ha kizárunk egy nyilvánvaló trivialitást, a kizártnak végtelen sok módosítása megmarad. Ezt Guarino [2001] úgy védi ki, hogy az azonossági feltételnek „informatívnak” kell lennie – de ezzel a feltétellel a logika nem tud mit kezdeni. Kérdéses az a feltétel is, hogy csak rigid fogalmak adhatnak azonossági feltételt. Az ismertetésben hozott PIROS TÁRGY, PIROS ALMA FOGALOMPÁR MUTATJA ENNEK A FELFOGÁSNAK AZ EREDETÉT: AZ ÁLTALÁBAN VETT NEM RIGID PIROS TÁRGY FAJTÁJA ABBÓL NYER AZONOSSÁGI FELTÉTELT, HOGY A RIGID ALMA FOGALOM ALÁ IS RENDELTETETT. Azonban már Guarino [2001] is mutat ettől eltérő példát, részletesebben kifejtve Guarino [2004]-ben található. A példa érdekes: az agent fogalom („plays casual part in some events”) fajtája a legal agent. Nyilvánvalóan az agent nem hordoz azonossági feltételt, az idézett cikkek szerint a legal agent már ad, hiszen a törvényáltali elismertséghez valamilyen bejegyzés szükséges. Kérdéses viszont, hogy ez a ”bejegyzés” azonos kritériumnak fogható-e fel pl. a természetes és a jogi személy esetében – szerintem nem. Példa vége Bár az idézett példa megingathatja az „ad azonossági feltételt” tulajdonságra kimondott megszorítást (érdekes mód Guarinóékban nem hatott), de a fentiek szerint a példa nem igazán erős. MAJD A FOGALMAK OSZTÁLYOZÁSÁNÁL LESZ NYILVÁNVALÓ, MÉRT ÍGY DEFINIÁLTÁK AZ „AD AZONOSSÁGI FELTÉTELT” TULAJDONSÁGOT. Vannak fogalmak, amelyek azonossági feltétele könnyen meghatározható, pl. a csoport fogalomé elemeinek azonossága (mereológiai azonosságfeltétel). Vegyük észre, hogy ez egyben definiálja is a csoportnak lenni tulajdonságot: egy fogalom akkor fajtája a csoportnak, ha elemei azonossága azonossági feltétel (l. ET3). Általában azonban nehéz pontosan meghatározni, hogy egy fogalomnak mik az azonossági feltételei; de erre általában nincs is szükség: elég az a meggyőződés, hogy nincs; illetve az, hogy van. Guarino sokszor mond olyanokat, hogy egy fajta új azonossági feltételt ad a neméhez képest, amikor is ez – legalább is nekem – nem egyértelmű. Például Guarino [2004] szerint az alma fogalom új azonossági feltételt ad a gyümölcs-höz képest. Valószínű azonban az, hogy ez mellékes – legalább is ahhoz képest, hogy hordoz azonossági feltételt. A bizonytalanságok ellenére a „hordoz/ad azonossági feltételt” metatulajdonság alapvető: a metodológiában: minden egyednek tartoznia kell egy +I tulajdonságú fogalomhoz. Tehát a +I tulajdonságú fogalmak előfordulásai meghatározzák az egyedek (létezők) univerzumát. A többi fogalom csak más szempontok szerint osztályozza az így meghatározott egyedeket.
10
l. és még Simons-ban az extenzionális mereológiai elméleteket és kritikájukat. 10
teljesség (unity) ismertetés A kérdés az, hogy egy előfordulásra rá mondhatjuk-e, hogy egész, vagy teljes, és milyen kritérium alapján. Például egy autó nem „egész” motor, vagy kerék nélkül. Ugyanakkor valamely anyagöszlet (amount of matter) nem alkot egészet. Simons definíciója, amelyre Guarino is alapoz: „Every member of some division of the object stands in a certain relation to every other member, and no member bears this relation to anything other than members of the divisions.” A definíció tehát a rész fogalmára alapoz, azonban nem tetszőleges részre, hanem valamilyen felosztás szerinti részekre. Tehát ha arról van szó, hogy egy gép „egész”-e, akkor célszerű alkatrészeit tekinteni, és azok meglétét (egész voltukban való meglétüket), illetve megfelelő kapcsolataikat megkövetelni. Sajnos minden további „pontosítás” tévútra vezet, ezért nem követjük Guarino [2000/c]11 további gondolatmenetét, amely egy „deep unifying” relációt vezet be kifejezendő a részek egészt alkotó viszonyát: a reláció fennállása karakterizálja az egész (teljes) előfordulásokat. E helyett intuitív megítélésre bízzuk, hogy egy fogalom előfordulásai ugyanazon kritérium szerint tekinthetők-e egésznek (teljesnek). Egy fogalom hordoz teljességkritériumot (carries a unitiy condition (UC)), ha minden előfordulására ugyanazon kritérium alapján mondható, hogy egész, vagy nem; jelölése +U illetve -U. Az teljességkritérium ontológiai jellege szerint három típust különböztettetik meg: •
topológiai, (+UT) amely topológiai, vagy fizikai kapcsolat valósít meg, pl. az alma akkor egész, ha nem vágunk ki belőle egy részét,
•
morfológiai, (+UM) ha a topológiai és alakkritériumok valamilyen kombinációja adja a teljességet, vagy egy konstelláció, példa: luftballon, ill. csillagkép.
•
funkcionális: (+UF) valamilyen működés, cél adja a teljességet: ilyen minden gép (egésznek számít, míg működőképességhez szükséges alkatrészek megfelelően kapcsolódnak), de ilyen a bikini is (mindkét részének meg kell lennie, hogy célját betöltse).
Ha a fogalomnak nincs teljességkritériuma, még érdekes az a kérdés is, hogy olyan egyedekből áll-e, amelyek törvényszerűen nem alkotnak egészet. Ezért bevezették a következő fogalmat is: egy fogalom hordoz anti-teljességet (anti-unity), ha minden előfordulására igaz, hogy szükségszerűen nem alkot egészet; jelölése ~U. Az antiteljességre a prototipikus példa az anyagöszlet (és természetesen minden fajtája). értékelés A teljességkritérium Guarino szerinti definíciója még gyengébb lábakon áll, mint az azonossági feltételé. Kaplan bebizonyítja, hogy a logikai definíció szerint egy fogalom akkor és csak akkor hordoz teljességkritériumot, ha előfordulásai diszjunktak (nincs közös részük). Az már csak hab a tortán, hogy ehhez egy olyan „deep unifying” relációt használ, amely csak a „része” relációból épül fel. Itt megint egy logikailag ki nem zárt trivialitást használ fel. Guarino [2001] már nem tartalmazza a logikai definíciót. Azonban nekem a filozófiai szintű eszmefuttatás is gyanús. Az első gyanús motívum az, hogy Guarino a Simons-féle definíció magyarázatánál megköveteli, hogy a felosztás kimerítő legyen. Szerintem pedig elég, ha csak a lényeges részeket öleli fel. Például, míg kar nélkül az ember nem „egész”, vállalható azonban olyan ontológiai elkötelezettség, amely
11 itt található a legrészletesebb definíció.
11
szerint, ha kihull a haja, még egésznek számít. Nyilvánvaló az, hogy melyik rész lényeges, az az ontológia célja és szempontjai szerint más lehet. Amikor az autót eladják, pontosan meghatározott milyen részeknek kell meglenniük. Akkor azonban, amikor használjuk, eltekinthetünk néhány kelléktől. Az alapvető baj azonban az, hogy Guarino „megszabadul” a Simons-féle definícióban fontos szerepet játszó felosztástól, és tetszőleges részt vesz figyelembe. A filozófiai diskurzusban is elsikkad az, hogy a rész fogalma két különböző dolgot takar: valaminek tetszőleges része, vagy alkotórésze (azaz a fogalomra alkalmazható extenzionális mereológiai elmélet atomos, l. Simons). Például az anyagöszleteknél a tetszőleges rész az adekvát fogalom, a gépeknél pedig az alkat(alkotó)rész. Azaz egy tengely alkatrésze egy gépnek, de a tengelyből kijelölhető kis acéldarab (mondjuk, ami tegnap letört) már nem alkotórésze. Ugyanakkor, ha egyáltalán értelmes a gépre nézve ilyet mondani, annak „része”, ha tetszőleges hozzátartozó anyagrészt annak tekintünk. Ezt a zűrzavart azzal kerülhetjük el, hogy megkülönböztetjük a dolgot és az azt alkotó anyagöszletet 12 (l. ET1), amely megoldás a társadalmi létszintekre is alkalmazható (l. ET3). Ugyanakkor épp a tengely példája mutatja, hogy egyes esetekben a felosztáshoz való ragaszkodás vihet tévútra – mint a tengely esetében. Nyilvánvalóan értelmes arról beszélni, hogy egy tengely egész-e, viszont a nem egész tengelyből tetszőleges anyagdarab hiányozhat, ha az a tengely felhasználását meghiúsítja. Ugyanakkor azt sem mondhatjuk, hogy tetszőleges anyagdarab hiánya már nem egésszé teszi a tengelyt, hisz a hiány lehet olyan kicsi és olyan helyen, amely nem befolyásolja a felhasználást. Tehát csak a funkcionális teljességkritérium alkalmazható értelmesen. Mindez nem azt jelenti, hogy a teljességkritérium létezése elhanyagolható lenne. Igaz, sokszor már elég következményeit megtanulni (pl. a dolog és az azt alkotó anyagöszlet megkülönböztetése: l. ET1). Fontos felhasználási lehetősége lenne az, hogy irányíthat a része reláció értelmezésében: Legyen az A és B fogalom közt értelmezett a része reláció. Ha B teljességkritériumot hordoz, valószínű, hogy a része relációt az alkotórész értelemben kell venni; ha viszont antiteljességet hordoz, akkor tetszőleges részt. Azonban épp az előző tengely példa mutatja, hogy ez nem minden esetben áll. Guarino ad egy kritériumot is arra, hogy mikor hordoz azonossági feltételt és teljességkritériumot egy fogalom. Ez az, hogy előfordulásainak halmazai megszámolhatóak (pl. hány alma van a tálon, hány párt van Magyarországon). Nyilvánvalóan ahhoz, hogy valamiket megszámoljunk, meg kell tudni különböztetni az egyedeket, és tudni kell, melyek teljesek. Azonban nem szükséges, hogy minden egyedet ugyanolyan kritérium alapján azonosítsuk, illetve ismerjük fel egésznek. Egyszerű példa: egy szimfonikus zenekarnak és egy vonós négyesnek más a teljességkritériuma, tehát a zenekarnak, mint olyannak, nincs. Ez nem zárja ki, hogy a zenekarokat megszámoljuk.
függés (dependence) ismertetés Egy A fogalom függ a B fogalomtól, ha A egy előfordulása csak akkor létezhet, ha létezik B egy előfordulása is; a triviális kivételekkel. Ezeket a kivételeket Guarino sem sorolja fel, csak példákat hoz. Az így értelmezett függést Guarino „külső” függésnek nevezi. A külső függés definíciójához azt az elvet kell szem előtt tartani, hogy nem lehet minden függő. Ezért a következőket érdemes szem előtt tartani (ez sem teljes felsorolása a kivételeknek):
12
ezt viszont épp Guarino szorgalmazza. 12
1.) a része reláció nem fejez ki külső függést, tehát sem az egész a részeitől, sem a rész az egésztől nem függ; 2.) valami nem függ a tulajdonságaitól, anyagától, alakjától stb.; 3.) csak a fogalmi függést veszünk figyelembe, olyat nem, amely a világ törvényszerűségeiből ered (pl. a metatulajdonság szempontjából a panda nem függ a bambusztól). Azt mondjuk, hogy egy fogalom függő, ha függ egy másik fogalomtól. Jelölés: +D, ill. –D, ha nem. Példa: az ember nem függő fogalom, de a TANÁR függő (+D) (függ a TANÍTÁStól, a tanított TÁRGYtól és a TANÍTVÁNYtól). értékelés A függés az egyik legértékesebb metatulajdonság, dacára annak, hogy meghatározása nem teljes; elsődleges szerepe a fogalmak osztályozásánál lesz, ahol is a szerepek elkülönítését szolgálja. A szerepek ismertetésénél részletesebben elemezzük.
2.4. szabályok A metatulajdonságok definícióiból, illetve egészen általános ontológiai elkötelezettségekből szabályok szűrhetők le, amelyek segítségével a generikus reláció alkalmazása vizsgálható, különböző hibák felfedhetőek (l. elsősorban Guarino [2002], Guarino [2003]). A szabályokat már több ontológiaszerkesztőben implementálták, köztük a Protege szerkesztőben is (l.: http://protege.stanford.edu/ontologies/ontoClean). ismertetés A definíciókból következik, hogy bizonyos tulajdonságok kizárják egymást: •
+O és –I,
•
+O és ∼R vagy ¬R.
A metatulajdonságok definíciójából következnek olyan összefüggések, amelyeknek állniuk kell az ONTOLÓGIÁkra. Legyen P és Q fogalom, amelyek közt fennáll a GENERIKUS reláció (P Q-nak alosztálya, P Qnak fajtája, P IS_A Q, P IS SUBSUMED BY Q): 1.) ha Q antirigid, P is antirigid, 2.) ha Q hordoz azonosságot, P is hordoz, ha Q hordoz mereológiai azonosságot, P is hordoz, 3.) ha Q hordoz teljességkritériumot, P is hordoz, ha Q hordoz topológiai teljességkritériumot, P is hordoz, ha Q hordoz morfológiai teljességkritériumot, P is hordoz, ha Q hordoz funkcionális teljességkritériumot, P is hordoz, 4.) ha Q hordoz anti-teljességet, P is hordoz, 5.) ha Q függő, P is az, 6.) ha két fogalom IC-je vagy UC-je összeegyezhetetlen, a két fogalom diszjunkt. A következő szabályok egész általános ontológiai elkötelezettségek: 7.) Minden egyed tartozik egy olyan fogalomhoz, amely hordoz IC-t. (Az én pontosításom: …egy olyan rigid fogalomhoz…)
13
8.) Ha két egyed megegyezik, van egy olyan fogalom, amely mindkettő azonossági feltételét hordozza. értékelés Az öröklődésre vonatkozó szabályok nyilvánvalóan következnek a definícióból, a 7.) és 8.) elég nyilvánvalóak; a 7.) alapvető feltétel a fogalmak osztályozásához. Azonban a 6.) szabály értelmetlen, ugyanis nem tudni mit jelent az, hogy két kritérium összeegyezhetetlen (l. Kaplan). Carrara az összeegyeztethetőséget a két azonossági feltétel ekvivalenciájával definiálja. Ez az ekvivalencia azonban logikailag csak akkor látható be, ha a fogalmak részletes axiomatizálása rendelkezésre áll. A különböző azonossági feltételek ekvivalenciának kérdése akkor merül fel, ha teljesen különböző ismertetőjelekre vonatkoznak; pl. az ember DNS struktúrája és a tér-idő kontínuumban elfoglalt helye egyaránt az ember fogalom azonossági feltétele lehet. Azonban nincs is szükség a definícióra. Amire Guarino gondol, az a következő: ha egy A fogalomnak az azonossági feltétele (vagy teljességkritériuma) nem alkalmazható B előfordulásaira, a két fogalom diszjunkt; a 6.) szabályt így kell érteni
2.5. a fogalmak osztályozása és az ontológia szerkezete áttekintés ismertetés Az OntoClean metodológia a metatulajdonságok függvényében osztályozza a fogalmakat. Az osztályozás: +O
+I -O
-I
+R
±D
típus (type)
+R
±D
kvázi-típus (quasi-type)
∼R
+D
materiális szerep (material role)
∼R
-D
alakváltó (phased sortal)
¬R
±D
keverék (mixin)
+R
±D
kategória
∼R
+D
formális szerep (formal role)
∼R
-D
tulajdonsághordozó (attribution)
¬R
±D
„sortal”
I. táblázat A +O és ∼R vagy ¬R kompozíciók azért nem szerepelnek, mert a definíciók szerint összeférhetetlenek. A fenti osztályozás alapján az 1. ábrán látható ontológiaszerkezet állítható fel, az ábrában a nyilak a kötelező öröklődést mutatják:
14
1. ábra: ontológiaszerkezet Az ontológiaszerkezet egyértelműen meghatároz egy ontológiaszerkesztési stratégiát is: a legfontosabb gerinc fogalmainak meghatározása, ill. a nem sortal szint meghatározása. A metodológia legerősebben az egyes fogalmaknak a generikus hierarchiába való elhelyezését támogatja a metatulajdonságok öröklődési szabályain keresztül. Guarino [1999] és (kevésbé részletesen) Guarino [2001] részben a „másodlagos” metatulajdonságokra (ME, UT, UM, UF) építve az ontológia rétegezettségét építi be a metodológiába: az atomi, konfiguráció, mereológiai, fizikai, funkcionális, biológiai, akaratlagos, társadalmi szinteket – és felveti további szintek (biológiai) stb. definiálási lehetőségeit. Az így definiált szintek fogalmai diszjunktak, valószínűleg az alacsonyabb szintek fogalmaival áll bel le, vagy más hasonló relációban (pl. hordozott-hordozó) áll. Olyasfajta szabályokra kell gondolnunk, mint ha van egy +UF (funkcionális teljességű) fogalmunk, akkor vannak az áll bel le relációval képzett láncok, amelyek +ME és +UT tulajdonságú fogalmakban végződnek. Azonban nem áll rendelkezésünkre olyan publikáció, amelyben ezek a szintek, viszonyaik részletesen ki lennének dolgozva. értékelés Az OntoClean metodológiának nemcsak az az, egyébként jelentős, előnye van, hogy egyetlen, amely formalizálja az ontológia struktúráját. Jelentős segítséget adhat ontológiaépítéshez, sőt számos funkciója információrendszerrel támogatható. Azonban mégis beleütköztem olyan részletekbe, amelyek problémát okoznak, illetve hiányokat látok – ezekről a fogalomtípusok részletezése során. Ahogy már említettük, sokszor a metatulajdonságok segítségével egyes esetek tanulmányozása során általános ontológia elveket találhatunk. Ilyen pl. a Guarino által javasolt „constitutes” (nálunk az alkotja, ill. áll bel le) reláció (l.: ET1, ET2, ET3), amely bevezetésével nemcsak a generikus reláció hibás alkalmazásának sok esetét kerülhetjük el, hanem az ontológiaépítést segítő elvet állíthatunk fel. Van a szerkezettel szemben egy esztétikai kifogásom, erről a továbbiakban kiderül, hogy megalapozott. A középen elhelyezett, az egész szerkezetet hordozó gerincről jobboldalon a szerepek függnek: felül a kategóriák alá rendelt formális szerepek, alul, a sortalok sávjában a
15
materiális szerepek, amelyek a formális szerepektől öröklik szerep voltukat, míg a típusoktól azonossági feltételüket. A másik oldalon a tulajdonsághordozó a formális szerep szimmetrikus párja: középen a rigid kategória, jobbra az antirigid formális szerep, balra a szemirigid tulajdonsághordozó. Azonban a sortal sávban felborul a szimmetria, illetve nem érzem megokoltnak, hogy a materiális szerep párja a Guarino által – joggal – feleslegesnek bélyegzett keverék legyen. A következőkben megkíséreljük kinyomozni, mennyire törvényszerű ez az asszimetria.
a fogalomtípusok részletezése Mivel a fogalomtípusok többdimenziós térben helyezhetők el, áttekinthetőségükhez hasznos több különbözően összeállított táblázat, diagram. A továbbiakat egy, elsősorban a rigiditás és a függés függvényében szerkesztett táblázat szolgálja, vállalva azt is, hogy néhány különbséget összemosunk. Tapasztalatunk ugyanis az, hogy az OntoCleanben a legfontosabb, és egyúttal a legsikeresebb eredmény a gerinc és a szerep elkülönítése. +D
-D
GERINC
+R
SZEREP
∼R
alakváltó
+I -I
¬R
tulajdonsághordozó
-I
keverék
+I
II. táblázat
gerinc (+R) ismertetés A gerinc fogalmait egyetlen metatulajdonság meghatározza: ami rigid, az beletartozik a gerince. A további osztályozást az azonossági feltételhez való viszony szabja meg, így kapjuk a következő fogalomtípusokat: -I:
a kategóriák a legáltalánosabb fogalmak mint folyamat, tulajdonság stb.;
+I: a típus és kvázi-típus, ezek adják a domain elsődleges osztályozását; hiszen mint a 7.) szabály kimondja, minden egyednek valamely típusba bele kell tartoznia. Több szerző az OntoClean szerint a gerincbe tartozó fogalmakat a „természetes” (natural) jelzővel látja el (pl. Guarino [1992], Roles3). Vegyük észre, hogy az azonosságot ad (+O) tulajdonság definíciója szerint minden gerincbe nem tartozó fogalomnak, ha az azonossági feltételt hordoz, kell lennie a típusok közé tartozó nemének, amelytől az azonossági feltételt örökli. értékelés A gerinc jól definiált, szerepe érthető – egyetlen problémám, hogy a lepke fogalmat gerincbelinek érzem (persze a hernyót is). Erre visszatérünk az alakváltó tárgyalásánál. Kérdés, hogy a gerincbeli fogalmak függhetnek-e egymástól? Óvatosabb (és őszintébb) megfogalmazással: adható-e a külső függésnek olyan értelmes definíciója, amely mellett rigid fogalmak nem függnek egymástól?
16
szerep (∼R, +D) ismertetés A szerepek azok a fogalmak, amelyek időlegesen jellemzőek egy fogalomra és csak más fogalmakkal való kapcsolatban értelmesek; -I:
a formális szerepek a legáltalánosabb szerepek, amelyek betöltői majdnem bármilyen típusú egyedek lehetnek, pl. aktor;
+I: a materiális szerepeknél már konkretizált az az osztály, amely egyedei betölthetik a szerepet, ilyen pl. minden foglalkozás – ezektől a szerep örököl azonossági feltételt. A szerep fogalmát nem az OntoClean hozta a köztudatba, már régen a tudásreprezentáció (Roles2) és a modellezés (Roles1, Roles3, Roles4) bevett, de nem egyértelmesült fogalma; Roles3 egy alapos összefoglalást ad történetétől és jellemzőiről. Mégis az ontológia világába az OntoClean metodológia hozta be, és definiálta a metatulajdonságok segítségével. értékelés A szerep fogalomtípus használatának első és legfontosabb eredménye volt, hogy a generikus reláció számos helytelen használatát kimutatja: pl. az ágens alá rendelt ember, társadalmi egység stb. (Guarino [2001] és Guarino [2004]) – lásd ET5. Ahogy ott kifejtettük, a tévesen állított generikus relációt helyettesíteni kell más relációval – pl. a tudásreprezentációból importált „role filling”13-gel (vagy „played by”), amely azt fejezi ki, hogy az ágens lehet ember, társadalmi egység stb. (Roles2, Roles3). Azaz valamilyen rigid fogalom előfordulása betöltheti (játszhatja) a szerepet. Valahányszor egy szerepet több típus előfordulásai játszhatják, tilos a generikus reláció használata, amikor azonban csak egy, megoldható generikus relációval is: pl. a tanár felfogható az ember fajtájának. Ha az ontológia része egy következtető motor által feldolgozott tudásbázisnak, akkor ez bonyodalmakat okozhat (l. Roles2, Roles3). Ha feladjuk azt, hogy a szerep fajtája lehet egy típusnak, ellentmondásba kerülünk az OntoClean szemléletével: az ontológia szerkezet szerint a materiális szerepek egy típus fajtái is (emlékezzünk a kötelező generikus relációra: 1. ábra). Ez azért fontos, mert a materiális szerepek a megfelelő típustól öröklik az azonossági feltételüket. Ha célszerűségből, vagy puritán esztétikumból ragaszkodunk ahhoz, hogy szétválasszuk a role filling relációt a generikustól, értelmezni kell a role filling reláció szerinti öröklődést. Azt mondtuk, hogy az OntoClean talán legjelentősebb eredménye a szerep fogalom importálása az ontológia világába, és metatulajdonságokkal való jellemzése. Azonban, ha használni akarjuk a metodológiát, nehézségekbe ütközhetünk. A szerep fogalmával küszködnek az ET2 ET5 és ET7 esettanulmányok 14. Míg Guarino simán kijelenti, hogy pl. az étel szerepfogalom, mert függő (evés fogalmától), és antirigid, mert lehet, hogy nem eszik meg. Ez azonban minket nem elégít ki, mert a meg nem evett ételre is mint ételre gondolunk. ET2-ben elemezzük ezt a példát és néhány hasonlót, de megnyugtató eredményt nem érünk el. A függés viszonylag jól kezelhető – lévén a külső függés definíciója elég „puha”; viszont az antirigiditással vannak bajaink. A probléma oka az, hogy az emberi civilizáció bizonyos szerepekre speciális termékeket állít elő: vasbeton gerendát az építmények födémének kiképzésére, paprikás csirkét ebédre és kalapácsot a szögek beverésére. Ezek a tárgyak és az általuk játszott szerepek összemosódnak tudatunkban – és az ontológiákban.
13
természetesen találó magyar elnevezéssel
14
kérjük a további eszmefuttatáshoz ezeket átelmélkedni. 17
A következők tehetők: 1.) a problémás fogalmakat (pl. étel, építőanyag) nem szerepnek kategorizáljuk, 2.) a prototipikus eseteket alapján határozzuk meg a rigiditási tulajdonságot, 3.) a metatulajdonságok fogalmakhoz rendelésénél nagyvonalúak vagyunk, és amit szerepnek akarunk, azt antirigidnek vesszük, 4.) szigorúan szétválasztjuk a szerepfogalmakat az azokat „betöltő” rigid fogalmaktól (l. ET5). Az első megoldást elutasítanánk, mert így kasztrálnánk a szerep fogalmat, és veszítenénk azokból a lehetőségekből, amelyeket a 3. fejezetben vázolunk. Sokszor a második és a harmadik megoldás nem különül el. A negyedik megoldás pontos, de rendkívül megszaporítja a fogalmakat az ember által előállított tárgyak körében, hiszen ezek egy, vagy több szerep betöltésére hozatnak létre. Itt is, mint más problematikus esetekben, figyelembe kell venni, hogy milyen célra készül az ontológia. Például, ha a cél információkeresés, a „kalapács szerep” fogalom érdektelen, viszont természetesnyelv-feldolgozás esetén kezdeni kell tudni valamit olyan kifejezésekkel is, mint „kalapácsnak használta a cipőjét” (Roles2). Ha a cél elég általános (pl. csúcsontológia készül, ill. a természetes nyelvhez valamilyen módon kapcsolódik), nagyvonalúan kezelhetjük a metatulajdonságok alkalmazását. A függés elbírálása könnyebb: többféle függést (pl. szándék szerinti, cél szerinti) figyelembe vehetünk ugyanabban az ontológiában. A rigiditással már nehezebb a helyzet. Ha nem különböztetjük meg az objektumot és szerepet, alkalmazhatjuk a fenti 2.) szabályt: eldöntjük, milyen fogalomtípusba soroljuk. Elég akkor elkezdeni mélyebben elemezni a helyzetet, ha elfogadhatatlan a fogalomtípus által diktált metatulajdonság. Tehát ontológia építéskor a szereppel kapcsolatosan eldöntendő, hogy •
milyen mértékben engedjük meg a szerepek, és a szerepeket játszó tárgyak fogalmának összeolvasztását,
•
szigorúan szétválasztjuk-e a role filler szerepet játszó relációkat a generikus relációtól.
A példáink jelentős része materiális szerep. Problémaként merül fel az, hogy a materiális szerepekhez van-e mindig olyan formális szerep, amelynek fajtája volna? Ugyanis az ontológiaszerkezet ezt kiköti. Sokszor van természetes formális szerep: például a foglalkozások besorolhatók az ágens formális szerep alá, mind a tanár, mind a tanuló, az egyik a tanítás, a másik a tanulás ágense. Azonban mit tegyünk a férj fogalommal? Milyen formális szerepnek felel meg (l. ET7)? Roles5 részletesen taglalja a szerep fogalomtípus problémáit.
tulajdonsághordozó ismertetés A legkönnyebben tulajdonsághordozót úgy kapunk, hogy valamilyen tulajdonság szerinti kategóriákat veszünk fel15; paradigmatikus példa a piros (piros dolgok jelentésben). Az általam áttekintett irodalomból úgy látszik, hogy Guarino vezette be. Guarino [1992] részben erről szól; akkor is, ha maga az attribution szó és az ez által jelzett fogalomtípus kimondottan nem jelenik meg.
15
legalább is a név erről árulkodik, és nem találtam másmilyen példát. 18
értékelés A definíció alapján a tulajdonsághordozó valamilyen vegyes felvágottnak tűnik. Az I. táblázatban ez az egyetlen fogalomtípus, amely jellemzéséhez több sor kellett. A definíció összegyűjtötte az összes olyan nem-sortalt, amely nem kategória és nem formális szerep. Egyszerűen azért, mert Guarino nem tud más magas szintű (nem-sortal) fogalomtípust elképzelni mint a kategóriát, formális szerepet és a tulajdonsághordozót. Pedig ha a metatulajdonságokat nézzük, nem nyilvánvaló, hogy miért a +R (kategória), <∼R, +D> (formális szerep), valamint <∼R, -D> és ¬R (tulajdonsághordozó) jellemzi a nem-sortal fogalomtípusokat. Mért kerül a <∼R, -D> és ¬ R jellemzés ugyanabba a fogalomtípusba? Nem lehetne-e értelmesen külön fogalomtípusnak tekinteni a nem függő antirigid fogalmakat és a szemirigideket? Kérdés az is, hogy van-e egyáltalán értelmes fogalom az ∼R, -D metatulajdonságokkal (ET6-ban felvetünk egy ilyen lehetőséget). Szívesen egyszerűsíteném a definíciót. Felvetem ugyanazt a kérdést, amit a gerinc fogalmainál: lehet-e egy tulajdonsághordozó függő? Azaz adható-e a külső függésnek olyan értelmes definíciója, amely mellett a tulajdonsághordozók nem függők 16? De felvethetőek azok a kérdések is, hogy a „tulajdonsághordozó” intuitív értelmezését pontosan leírják-e az adott metatulajdonság-értékek, azaz felvethető a kérdés: biztos, hogy egy tulajdonság szerinti osztályozás nem vezethet rigid fogalmakra? A válasz természetesen attól függ, mit tekintünk tulajdonságnak. Pl. ha az élő-élettelen párt egy „tulajdonság” két értékének tekintjük, a rigid él lény fogalmat „tulajdonsághordozó”-nak kellene tekinteni. Arra most nem vállalkozunk, hogy a tulajdonságot definiáljuk, de mindenképpen olyan fogalmat érdemes tulajdonságnak felfogni, amely hordozóinak nem rigid tulajdonsága.
alakváltó (∼R, +I, -D) ismertetés Az alakváltóra Guarino paradigmatikus példája a hernyó és a lepke: ha egy egyednek tekintjük a hernyót és a bábjából kifejlődő lepkét, mindkét fogalom antirigid. Ugyanakkor hordoznak azonossági feltételt, és nem függők. Mivel hordoznak azonossági feltételt, kell egy típus, amelybe besorolhatóak előfordulásaik. A kérdést ET6-ban elemezzük. Azonban gyakoribb példa az alakváltó fogalomra az, amikor egy típus előfordulásait osztályozzuk valamilyen tulajdonságaik szerint: pl. ilyen a csecsem től17 az aggig az összes emberi korosztályfogalom. E két eset közt van valami magas absztrakciós szintű összefüggés: mind a hernyó-lepke párban, mind a csecsemő, gyermek stb. fogalomszekvenciában az történik, hogy egy egyed időben változik (a ∼R metatulajdonság itt az egyed időbeli változását jelzi). Azonban a különbség az, hogy a második esetben meg tudunk nevezni egy tulajdonságot, amely változik (a többi változás ennek következménye), míg az első esetben egy radikális változás zajlik le, amelyhez nem tudunk egy (vagy néhány) tulajdonságot rendelni. értékelés Az áttekintésben felvetettük, hogy a tulajdonsághordozó – formális szerep szimmetriát a sortal sáv nem követi; nem tudni, mi felelne meg a materiális szerepnek. Példa: a paradigmatikus tulajdonsághordozó a piros (piros dolgok jelentésben) – ha ezt konkretizáljuk, vagy alakváltót kapunk (piros alma), vagy típus (pl. vér), attól függően, hogy a gerincbeli fogalom előfordulásainak rigid, vagy antirigid tulajdonsága a piros szín. Példa vége.
16
emlékezzünk: a tulajdonságoktól való függést kizártuk a külső függésből!
17 analitikus elemzés a csecsemőt teheti a keverék fogalomtípusba is.
19
Tehát az alakváltó lehetne a materiális szerep megfelelője. Mi a helyzet azonban a hernyó, és lepke fogalmakkal. Idézzük fel ET6 esettanulmányt, ahol a hernyó, lepke (és kukac, ebihal stb.) fogalmak nemét megtaláltuk (amely szintén alakváltó volt), és megsejtettünk, vagy legalábbis megkívántunk egy tulajdonsághordozót, amely ennek – már nem sortal – neme lehet. Azonban ha a tulajdonság hordozót szétválasztjuk az antirigid és a szemirigid fogalomtípusra, a hernyó stb. nem fog ugyanabba a nem sortal fogalomtípusba esni, mint a piros alma. Úgy látszik tehát, hogy az alakváltó – materiális szerep analógia megengedhető.
keverék ismertetés A keverék elnevezés arra utal, hogy az ilyen típusú fogalomba minden rendező elv nélkül kerülnek előfordulások – Guarino ezért tartja mellőzendőnek a keverék típusú fogalmakat. értékelés Ha azt figyelembe vesszük, hogy egy fogalomnak olyan osztályt kell reprezentálni, amely intenziója megfogalmazható ismertetőjegyekkel (van tartalma) – kérdéses, hogy keverék típusú fogalom egyáltalán lehet adekvát. Egyébként – ahogy a következő példa mutatja – lehet, csak nem a Guarino által adott értelmezésben. A példa az ET7 esettanulmányban elemzett jól meghatározott tartalmú, homogén terjedelmű fogalom: a n tlen (azzal a feltétellel, hogy gyermekre is mondható). Ez nyilvánvalóan szemirigid: van, aki a nőtlen állapotból a nős állapotba kerül át, van, aki egész életében nem; nyilvánvalóan nem függő; és hordoz azonossági feltételt, mert csak emberek az előfordulásai. Viszont ez a példa azt is jelenti, hogy a keverék elnevezés nem fedi intuíciónkat. Vagy ugyanaz az eset áll fenn, mint az alakváltónál: meg kellene kettőzni a fogalomtípust. A csecsem fogalom is tartozhat ide, ha figyelembe vesszük, hogy van, aki csecsemőkorban meghal: neki rigid tulajdonsága a csecsemő korcsoporthoz való tartozás. Viszont ha prototipikus elemzést végzünk, ezt az esetet elhanyagolhatjuk. A nőtlen fogalommal kapcsolatban az is probléma, hogy nincs (szerintem nem is lehet) olyan tulajdonsághordozó, amely neme lenne – márpedig az ontológia szerkezet megköveteli ezt (l. 1. ábra).
az értékelés összefoglalása Ha az eddigi kérdéseket megfontoljuk, a következő osztályozást kapjuk: ¬R
+R
∼R -D
+D
-I
tulajdonsághordozó
kategória
?
formális szerep
+I
keverék (?)
típus, kvázi-típus
alakváltó, tulajdonságváltó
materiális szerep
Nemcsak az kérdéses, hogy a módszertanban adott osztályozás kielégítő-e, hanem az is, hogy kizárólagosan a metatulajdonságok alapján tudjuk-e adekvátan osztályozni a fogalmakat. A legfontosabb fogalomtípusok vitán felül a gerincbeli elemek és a szerepek – ezek jellemzése a metodológia legfontosabb eredménye. További kutatás kérdése a többi típus jellemzése.
20
3. a metodológia továbbfejlesztésének irányai Mint már többször említettük, az OntoClean az egyetlen metodológia, amely formális eszközökkel közelíti meg az ontológiák alapvető problémáit. Azonban alapos elemzése számos problémát vetett fel, és előnyei újabb lehetőségeket kínálnak fel. Ezért célul tűzzük ki továbbfejlesztését. A továbbfejlesztés irányai: •
módszereket segítésére,
és
eszközöket
kidolgozni
•
a fogalmak osztályozásának finomítása és pontosítása (attribution, keverék és phased sortal fogalomtípusok esetén),
•
meg kell vizsgálni, hogyan alkalmazzuk a metodológia fogalmait a relációfogalmakra,
•
ki kell dolgozni, hogy fogalomtípusokként hogyan lehet szabványosított relációk segítségével a fogalmakat alaposabban jellemezni (a szerep esetére ez megkezdődött, l. Roles5).
21
a
metatulajdonságok
megállapításának
4. esettenulmányok Ahhoz, hogy az esettanulmányok során a lényegre figyelhessünk, szükséges néhány egészen általános ontológiai elkötelezettségünket előre bocsátani; mégpedig azt, hogy hogyan értelmezzük a fogalmak előfordulásait. Az egyedek „térben és időben elhatárolt entitások” (Ungváry). Vannak fogalmak, amelyek előfordulásai egyértelműen egyedek (pl. ember, revolveresztergapad stb.). Azonban másoknál, elsősorban pszichikai jelenségek, tulajdonságok, állapotok esetén nehéz így értelmezni, bár Ungváry megmutatja, hogy lehet. Mi azonban inkább úgy mondjuk, hogy az egyedek hordozzák az előfordulásokat. Tehát pl. a piros szín előfordulásait hordozzák a piros színű dolgok, előfordulásaik nem maguk a dolgok, hanem színük. Ha két dolog színe megegyezik, ugyanazt a szín előfordulást hordozzák. Így értelmezhető lesz a színe reláció, és az olyan kifejezések, mint „ugyanolyan színű”.
ET1: elmélkedés az anyagról és az anyagöszletről Fogalmak: anyag: tulajdonságfogalom, az anyaga reláció értékkészlete, – tehát pl. sem az acélból készült tárgyak, sem az acélöszletek (amounts of steel) nem az acél fogalom előfordulásai, csak hordozzák azt. anyagöszlet: az „amount of matter” magyar fordítása18. Tehát az acélöszlet előfordulása minden olyan anyagmennyiség, amely acélból van – de nem maga a tárgy. Például egy acél pengében lévő acélmennyiség, ami akkor is ugyanaz marad, ha a pengét megolvasztjuk – ugyanakkor maga a penge (a fizikai tárgy) eltűnik. fizikai tárgy: határfelülettel, tehát határozott alakkal rendelkező, akár természetes, akár mesterséges eredetű, anyagi makroszkopikus objektum. Az itteni eszmefuttatástól független, hogy az élőlényeket beleértjük-e, vagy nem. Relációk: áll_bel le ∈ fizikai tárgy × anyagöszlet: a Guarino szerinti „constitutes” gyatra fordítása: az az anyagmennyiség, amelyből egy tárgy áll. anyaga ∈ anyagöszlet × anyag: az anyagöszlet anyaga, a tulajdonsága reláció fajtája. anyaga2 ∈ fizikai tárgy × anyag: a tárgy anyaga, megegyezik az áll_bel le és az anyaga kompozíciójával. A 2. ábra illusztrálja a fentieket.
18 köszönöm Ungváry Rudolfnak.
22
2. ábra Az anyagöszlet leszármazottjai generálhatóak a megfelelő anyag fogalomból az anyaga reláció segítségével; pl.: acélöszlet ≡ ∃anyaga.acél, azaz „az, amely anyaga acél”. Itt feltételeztük, hogy az anyaga reláció értelmezési tartománya az anyagöszlet (azaz az anyagöszlet≡∃anyaga.T axiómát). Tehát szigorúan véve csak az anyagöszletnek van anyaga, a tárgyak pedig anyagöszletből állnak. Az egyes felső szintű fogalmak metatulajdonságai: rigiditás
azonosság
teljesség
függés
anyagöszlet
+R
+O
~U
-D
anyag
+R
+O
~U
-D
fizikai tárgy
+R
+O
+U
-D
Mindhárom fogalom nyilvánvalóan rigid: pl. egy anyagöszlet csak úgy szűnhet meg anyagöszletnek lenni, ha megszűnik. Minden alárendeltje is rigid, bár a rigiditás általában nem öröklődik. Mindhárom fogalom előfordulásai a fogalomra jellemző azonossági feltétellel (is) azonosíthatóak: anyagöszlet: mereológiai azonossági feltételt hordoz (+ME) – azaz két anyagöszlet akkor és csak akkor ugyanaz, ha minden része ugyanaz; anyag: az anyag összetétele azonosítja; fizikai tárgy: ez az az eset, amikor nehéz adekvát azonosságkritériumot találni. Nyilvánvalóan a téridőben elfoglalt hely jellemzi – ezt elfogadhatjuk. Egyetlen szépséghibája ennek a megoldásnak az, hogy ez a feltétel nem csak erre a fogalomra alkalmazható, hanem pl. az anyagöszlet-re is. Feltételezzük, hogy ezek a fogalmak olyan magasan vannak a fogalmi hierarchiában, hogy felettük nincs ugyanazon azonossági feltétellel bíró fogalom – ezért feltételeztük, hogy azonossági feltételt adnak. (Ez a feltételezés egyedül a fizikai tárgy fogalomnál lehet kérdéses, ha nem így lenne, a hozzárendelt +O-t +I-re kell változtatni.) Mind az anyagöszlet, mind az anyag esetén előfordulásaikra értelmetlen azt mondani, hogy „egész” – ezért ezek anti-teljességet hordoznak. Viszont a fizikai tárgy topológiai teljességkritériumot hordoz (Guarino [2004]), azaz akkor egész, ha nem hiányzik valamely része.
23
megjegyzés: a fenti kijelentés nagyon pongyola: tudnunk kell, hogy mekkora rész hiánya jár azzal, hogy elveszti teljességét. Nyilvánvalóan az, hogy egy szerszám kopik valamennyit használat közben, nem befolyásolja teljességét. Talán az a legjobb megfogalmazás, hogy észrevehető rész nem hiányzik, ahol az „észrevehető” nem abszolút tulajdonság, hanem függ a tárgy típusától. A három fogalom egyike sem függ egy másik fogalomtól, hiszen az anyagtól való függést nem tekintettük külső függésnek. Megállapíthatjuk tehát, hogy mindhárom fogalom típus. Az 2.1-ben elemzett példára visszatérve megállapíthatjuk, hogy a fizikai tárgy és az anyagöszlet egymással semmiféleképp nem állhat generikus relációban, mivel egyik antiteljességet, a másik teljességet hordoz. Az azonossági feltételeket megfontolva is erre a következtetésre jutunk. Bár a fizikai tárgy azonossági feltétele jellemzi az anyagöszlet-ét is, az anyagöszlet mereológiai feltétele nem áll a fizikai tárgy-ra. Még azt is felhozhatjuk, hogy ez utóbbi sok alárendeltjének azonossági feltétele lehet a forma, amely az anyagöszlet esetén szükségszerűen nem az. Jogosan merül fel az a kérdés: mért kell megduplázni az anyagfogalmat? Mit nyerünk a számtalan új fogalommal, azaz tudjuk-e használni azon kívül, hogy generáljuk az anyaga2 relációt, amelyet nélkülük is bevezethetünk? Nem szükséges felvenni az ontológiába az anyagöszlet leszármazottjait. Elég tudni azt, hogy valahányszor az anyaga2 reláció szerepel, felvehető az anyagöszlet egy leszármazottja a megfelelő áll_bel le és anyaga relációkkal, és az anyaga2 reláció az előzőek kompozíciója. A példánkon:
3. ábra Az áll_bel le reláció haszna pedig az, hogy utalni tudunk egy tárgy anyagöszletére inverze segítségével. Példa: ha jellemezni akarjuk azt az állapotot, amikor a kardokból ekét kovácsoltak, elég valami olyasmit mondani, hogy ∃áll_bel le-1.kard ⊑ ∃áll_bel le-1.eke 19 Az anyagöszlet fogalom bevezetésének van praktikusabb haszna is: egy keverék anyagöszlet, vagy az abból álló tárgy összetételét az áll_bel le reláció segítségével pontosan leírhatjuk, ez a DL eszközeivel végezhető.
19 vigyázat! csalok – az időfüggéstől elttekintettem.
24
Az anyagöszlet fajtáit természetesen fölösleges felvenni az mechanizmusával automatikusan képezhető egy tárgy anyagöszlete.
ontológiába,
a
DL
megjegyzés: látható, hogy az anyagöszlet – anyag kettősség ugyanolyan jellegű, mint a quality – quality range kettősség (Guarino [2003]), mivel az anyaga reláció a tulajdonság reláció fajtája. megjegyzés: Guarino [1999] az ontológia létrendi rétegezésének jellemzéséhez is fel kívánja használni az áll_bel le relációt. A tárgyak és az anyagöszletek más létrendi szinthez tartoznak, és az áll_bel le reláció kapcsolja össze ezeket a szinteket.
ET2: mi az építőanyag? eledel-e a rántott csirkecomb (P8)? Az építőanyag fogalma kétféleképpen érthető: épít anyag1: mindaz, amit építménybe beépítettek; épít anyag2: mindaz, amit azért gyártanak, forgalmaznak, hogy építménybe beépítsék. Első intuícióm szerint materiális szerepnek kellene lennie mindkét értelmezés szerint, nézzük meg metatulajdonságait: rigiditás
azonosság
teljesség
függés
épít anyag1
∼R
-I
¬U
+D
épít anyag2
¬ R (?)
-I
¬U
+D (?)
Magyarázat: rigiditás: épít anyag1 tipikusan antirigid, mivel a beépítés pillanatában lesz „építőanyag”; míg épít anyag2 szemirigid, mivel a gyártott „építőanyag” (tégla stb.) rigid, a természetből kinyert (pl. homok mint építőanyag) nem. azonosság: mindkét értelmezésben nem hordoz azonossági kritériumot, bár minden előfordulásra van. Azonban ezek nem lehetnek azonosak, lévén előfordulás a homok (anyagöszlet fajtája) és a tégla (fizikai tárgy fajtája) egyaránt építőanyag. teljesség: a fenti érveléshez hasonlóan ¬ U. függés: az első értelmezésben az építés-től való függés nyilvánvaló. A másodiknál egy szándékban megnyilvánuló függés van – kérdés, hogy ezt függésnek lehet-e, érdemes-e venni. Az első esetben egy formális szerepet kapunk – ez részben megfelel intuíciónknak, sőt ha összehasonlítjuk az épít anyag1-et az OntoClean paradigmatikus formális szerepével, azaz az aktor-ral, megerősíthetjük az OntoClean osztályozás eredményét: az aktor is azért lesz „formális”, mert a legkülönbözőbb egyedek lehetnek előfordulásai. Visszagondolva arra, amit a szerep fogalomtípus értékelésénél mondtunk, úgy is fogalmazhatunk, hogy azok az előfordulások, amelyek az épít anyag1 szerepet játszhatják, nem foglalhatóak értelmesen egy típusba. A problémát a második értelmezés okozza: a ¬ R, -I metatulajdonságok miatt az épít anyag2 fogalom tulajdonsághordozó (attribution) lenne – ez mindenképp intuíció ellenes: ugyan mi az a tulajdonság, amelyet hordoz? Az igazi kérdés az, hogy melyik értelmezést akarjuk az ontológiában az épít anyag fogalomnak adni. Az első (épít anyag1) minden esetre a jobban kezelhető: nemcsak az OntoClean metodológiában, de DL-ben is: definiálható az építmény fogalom és az áll_bel le reláció segítségével. Mindenképp fennáll az áll_bel le reláció az épít anyag és az építmény fogalmak közt, de a reláció értelmezése különböző: az első esetben az épít anyag1
25
terjedelme pontosan a reláció értelmezési tartománya, az épít anyag2 terjedelme viszont az értelmezési tartományt csak tartalmazza. Viszont építőanyagon az épít anyag2 jelentésű fogalmat értjük. A probléma nem egyedi: vegyük pl. az autóalkatrész fogalmát – hasonló játékot játszhatunk el vele. Az egyetlen különbség, hogy ebben az esetben +I-t feltételezhetünk, hiszen minden autóalkatrész gyártott tárgy. A fenti esetekhez hasonló Guarino kedvenc materiális szerep példája, az élelem20 (food) fogalom is. Ez a példa talán még jobban hasonlít az építőanyagra: hiszen van „gyártott” előfordulása (töltött pulyka) és természetes (alma). Guarino értelmezése szerint az élelem az anyagöszlet fajtája, ezért hordoz azonosságot (mégpedig mereológiai azonossági feltételt), és anti-teljességet hordoz. Guarino szerint az élelem antirigid, érvelése szerint, amit nem esznek meg, az nem élelem, és nyilvánvalóan függ az evés eseményétől. Az eddigiek szerint valóban materiális szerep lesz, bár Guarino azt nem árulja el, melyik formális szerep alárendeltje,– az ontológia szerkezet szerint ilyennek kell lennie. Az elemzés kifogástalan, ha az élelem definíciója az, hogy ténylegesen megeszik. Ugyanakkor ez az értelmezés nem illik az élelem fogalomhoz: mondhatunk olyat például, hogy az „ételt senki sem ette meg”, és ugyanazt a fogalmat fedi itt az étel szó mint az élelem, amelyet jellemezni akarunk. Továbbá ételt főzünk akkor is, ha még nem ette meg senki. Ugyanúgy, mint az épít anyag esetén, itt is az elkészítés szándéka számít inkább, mint a végső felhasználás: élelem az, amit annak készítenek el. Vannak élelemfajták (pl. a töltött pulyka, vagy inkább a paprikás csirke, ha már magyar egységes ontológiát csinálunk), amelyekre a definíció értelemszerűen illik, de mit mondjunk például az almáról? Az én ontológiai ösztönöm szerint az alma akkor lesz „élelemnek elkészítve”, ha ebből a célból szedik. Ugyanakkor ez az értelmezés kizárja az élelmiszer alapanyagokat (tehát a tehén, gabona stb. nem fajtája az élelemnek). Ebben az értelmezésben az élelem szemirigid lesz (a paprikás csirke rigiden élelem, az alma nem, csak akkor lesz élelem, ha ebből a célból leszedik), a szándékosság tekintetében függ az evés eseményétől. A fenti esetekben (és bárki még akárhányat generálhat) van egy fogalmunk, amely intuíciónk szerint szerep, de a metatulajdonságok szerinti osztályozás szerint más fogalomtípusba esik. Két problémába ütközünk: 1.) a függés tulajdonság értelmezése, 2.) a szemirigiditás az építőanyag esetén. A függés kérdése emlékeztet a nem monoton logikák megszületésének szituációjára. Akkor a problémát az okozta, hogy a „madarak repülnek” generikus állítást kellett következtetésekben való használat céljából a logika nyelvére fordítani, ahol is a „minden madár repül” mondat lett belőle. Most is megfogalmazható úgy a probléma, hogy „az élelem az, amit megeszünk” definíciót generikusan értjük, ezért a függést értelmezhetjük generikusan is. Azaz tipikusan megesszük. A két fajta függésfelfogást Sowa megkülönbözteti ontológiájában: az épít anyag2 nála role, lenne, míg az épít anyag1 participant, amely a role alá van rendelve. A szemirigiditás komolyabb probléma. Itt nem használ az a megközelítés, hogy „általában”, vagy „tipikusan” antirigid az élelem – mert épp a tipikus esetekben nem az. A fenti probléma
20 az élelem, étel, ennivaló szavakat most szinonimáknak tekintem.
26
oka az, hogy az emberi civilizáció bizonyos szerepekre speciális termékeket állít elő: vasbeton gerendát az építmények födémének kiképzésére, paprikás csirkét ebédre és kalapácsot a szögek beverésére. Ezek a tárgyak és az általuk játszott szerepek összemosódnak tudatunkban. Ezzel a problémával a tudásreprezentáció és a modellezés már régóta küszködik, és pontos megoldása a szerepek és a szerepet játszó tárgyak elkülönítése (l. pl. Roles2).
ET3: vajon a „társadalmi egység” (social entity) emberek egy csoportja-e? (P5, P6) Fogalmak: csoport: tetszőleges elemekből álló halmaz, csak az jellemzi, hogy milyen elemekből áll. ember emberek csoportja: emberekből álló csoport. társadalmi egység: az emberi társadalom által megteremtett entitás. Ilyen fogalom a nemzet, vállalkozás, vallás de ilyen a család is. Hogy az emberek csoportja és a social entity fogalmak közti viszonyt tisztázzuk, vizsgáljuk meg metatulajdonságaikat. rigiditás
azonosság
teljesség
függés
csoport
+R
+O
~U
-D
emberek csoportja
+R
+I
~U
-D
társadalmi egység
+R
-I
¬U
-D
Nyilvánvaló, hogy mindhárom fogalom rigid, és nem függő. A csoport fogalom ad azonossági feltételt: pontosan elemei határozzák meg, s ezt örökli minden leszármazottja. Ezzel szemben a társadalmi egység előfordulásainak nincs közös azonossági feltétele. A csoport előfordulásaira nem értelmes azt mondani, hogy egész, ezért anti-teljességet hordoz. Ugyanakkor a társadalmi egység fogalomnak lehet olyan előfordulása, amelyre értelmezhető az „egész” ítélet, míg lehet olyan, amelyre nem, ezért ¬ U a jelzet. Mindebből levonhatjuk azt a következtetést, hogy a társadalmi egység és az emberek csoportja fogalmak nem lehetnek egymás alá rendelve. Viszont értelmes azt mondani, hogy egy társadalmi egység előfordulást emberek csoportja alkotja – mi az alkotja inverzét (áll_bel le) jelöltük be az alábbi ábrán, hogy a tárgy-anyagöszlet problémával való hasonlóságot kiemeljük.
27
4. ábra Ugyanúgy, mint az ET1-ben az anyagöszlet leszármazottjai elhagyhatók, az emberek csoportja leszármazottjai is elhagyhatók az ontológiákból, és elég csak a social entity–t az ember-rel összekötő relációt feltüntetni. A céltól függően lehet érdemes feltüntetni azokat az embercsoportokat, amelyek „alkotják” a megfelelő társadalmi egység–et. Az alábbi ábrán két – nagyjából ekvivalens – megoldás látható, a tulajdonosa és az alkalmazottja a tartozik_hozzá reláció konkretizálásai (fajtái).
5. ábra megjegyzés: az alkotja reláció a társadalmi egység és az emberek csoportja között pontosan azt a szerepet játssza, mint a fizikai tárgy és az anyagöszlet között – és absztrakt szinten valóban az emberek csoportja a társadalmi egységeknek megfelelő anyagöszlet. Nem lehet nem Arisztotelész matéria fogalmára gondolnunk – ez a filozófiai fogalom lehet az anyagöszlet és az emberek csoportja közös neme.
28
ET4: hogyan nemzet az angol (P10)? és hogyan faj az ember (P9)? Fogalmak (az ET3-ban bevezetetteken kívül): nemzet: valami olyasmi, hogy: „emberek azon csoportja, amelyet összeköt a (valamilyen mértékben) közös múlt, közös jelrendszer (nyelv stb.) és ennek tudatában vannak”. nép: az az embercsoport, amelyből a nemzet áll. angol1: tulajdonságelőfordulás (érték), a tulajdonságot talán úgy lehetne megnevezni, hogy „néphez tartozó”. angol2: angol ember, tehát olyan ember, akinek tulajdonsága az, hogy az angol néphez tartozik. megjegyzés: az angol, mint emberre jellemző tulajdonság sokat jelenthetne még: angol származású, angol állampolgár, angol nemzetiségű (ha a nemzethez tartozás „választás kérdése”). Ne is beszéljünk arról, hogy van angol gyapjú, angol hidegvér stb. Teljesen általános angol fogalmat nem tartom érdemesnek bevezetni, mivel tartalmát nemigen tudjuk megfogalmazni. Reláció (az ET3-ban bevezetetteken kívül): nemzetiség : ember × néphez tartozó a tulajdonsága reláció fajtája. megjegyzés: az előző esettanulmány utolsó megjegyzését alkalmazva a most bevezetett fogalmakra azt is mondhatjuk, hogy a nép a nemzet matériája. Tehát a nemzet emberek, akik közt különböző kötések vannak, a nép pedig csak az emberek halmaza. Az angol2 az angol1 tulajdonságú emberek osztálya, ezért az ember fogalomtól örököl azonossági feltételt és teljességkritériumot. Antirigid lesz (valaki megszűnhet az angol néphez tartozni, akárhogy is lenne a pontos definíció – egyedül az angol származású fogalom lenne rigid). Nyilvánvalóan nem függ, tehát tulajdonságvektora: ∼R, +I, +U, -D; ez alakváltó típusú (ill. tulajdonságváltó). A fenti fogalmak rendszerét mutatja a 6. ábra, ahol a nemzetisége reláció az eleme és áll bel le1 kompozíciója (az értékkészlet megszorítva a nemzet fogalomra). Az ábrán az angol2 és angol1 között feltüntetett nemzetiség reláció már nem azt jelzi, hogy a reláció értelmezve van, hanem azt, hogy az angol2 előfordulásaira az angol1 tulajdonságérték jellemző. Az ábrán előfordulásokat is feltüntettünk, jelezvén, hogy az angol nép a nép fogalomnak előfordulása, és nem fajtája. Az ábrából hiányzik egy összefüggés, mégpedig az angol nép egyed és az angol2 fogalom extenzionális egyenlősége: mindkettő ugyanazt a halmazt jelenti. Viszont ezt már csak logikai formulákkal mondhatjuk ki. A formulák eléggé bonyolultak ahhoz, hogy itt ne írjuk le.
29
6. ábra Az, hogy egy előfordulás halmazfogalom, itt nem okoz semmi problémát (ha már felismertük a tényt). Analóg a fenti helyzettel Guarino [2002] egyik példája: az a téves kategorizáció, hogy az ember fogalmat a faj21 fogalom fajtájaként tüntetik fel. Az ok nyilvánvaló, hiszen „az ember egy faj” állítás igaz, csak ebben az esetben a „van” („is a”) állítmány előfordulást jelent és nem fajtát. Figyeljük meg, hogy ha az ember fogalmat mint az emberek osztályát leíró fogalomnak fogjuk fel, a hibás kategorizálás az OntoClean metodológiával felfedhető. A faj fogalom nyilvánvalóan antiteljességet hordoz: értelmetlen azt mondani, hogy egy faj teljes, vagy nem. Viszont az ember fogalom hordoz teljességet, tehát nem lehet a faj fajtája. A 7. ábra a probléma két megoldását mutatja be.
21 biológiai faj fogalom
30
7. ábra Az első változat egybemossa az emberfajt és azt a fogalmat, amely terjedelme az emberek osztálya – így a faj fogalom metafogalom lesz. A második megkülönbözteti a faj előfordulását az eml s fajtájától. Ahhoz, hogy a kettő közti kapcsolatot kifejezzük, az eleme relációt alkalmaztuk (egy ember eleme az emberfajnak). Nem gondoljuk, hogy univerzálisan jobb lenne egyik megoldás a másiknál: mindegyiknek vannak hibái és előnyei. A második megoldás fogalmilag tisztább, viszont megkettőzi a kérdéses fogalmakat. Ugyanakkor lehet leíró logikával kezelni, mivel nem tartalmaz metaosztályokat. Az ontológiákra jellemző, hogy a tárgyszintet és a metaszinteket egyszerre kezeljük, egy ontológiában írjuk le a tárgy szintű és a metaszintű fogalmakat. Ilyen zavart okozhat az is, ha pl. ha a Kft fogalmát használjuk mint a Kft gazdasági formában működő szervezetek osztályát kifejező fogalmat, és ugyanakkor mint egy gazdálkodási formát, lásd a következő ábrát:
8. ábra Az utóbbi esetben problémát okoz az, hogy egy, az ontológiában szereplő fogalom (gazdasági forma) egyben egy másik fogalom (gazdasági egység) egy particíonálásának szempontja. Természetesen a fenti problémák fel sem merülnek, ha a fogalmak egy szinten vannak, ha pl. a gazdasági forma mint fogalom nem szerepel az ontológiában. Az igazán elegáns megoldás azonban az lenne, hogy, ha amikor egy fogalmat egy szempont szerint osztályozunk (partícionálunk) 1. az egy partícióba tartozó alárendelt fogalmakat (fajtákat) összefognánk mint partíciót (az OWL szerint ez tehető),
31
2. és a szempontot, – ha az mint fogalom szerepel az ontológiában, – hozzárendelhetnénk a partícióhoz; 3. a szempont előfordulásait pedig a partíció elemeihez (ezt relációk segítségével megtehetjük). A második feltételt – tudomásom szerint – egy bevett ontológia struktúra sem támogatja, hiszen ekkor a partíciót (a generikus reláció előfordulásainak halmazát) fel kellene tüntetni, valahogy úgy, ahogy a következő ábra mutatja:
9. ábra A reláció raszterben szereplő másodrendű relációkat is könnyebb értelmezni az eddigiek tükrében: nem fogalmak, hanem metafogalmak előfordulásai közt állnak fenn, pl. az „evolúciós követés” reláció.
ET5: az ember ágens-e, ember-e a tanár és mi a kalapács? Guarino egyik kedvenc példája az ágens22: Annak az ontológia elkötelezettség alapján, hogy egy állat vagy társadalmi egység lehet ágens, az ágens fogalom fajtáinak vették fel az állatot és a társadalmi egységet. Ez nyilvánvalóan hibás, akár logikailag is kimutathatóan: abból a formulából, hogy ∀x(ágens(x)→(állat(x)∨ társadalmi egység(x))), nem következik, hogy ∀x (állat(x) → ágens(x)) ill. ∀x (társadalmi egység(x) → ágens(x)), amely formulák a generikus reláció jellemzései lehetnek. Az OntoClean metodológiából egyértelműen következik, hogy a generikus reláció idézett használata hibás. Lássuk a fogalmak metatulajdonságait: rigiditás
azonosság
teljesség
függés
ágens
~R
-I
¬U
+D
állat
+R
+O
+U
-D
társadalmi egység
+R
+O
+U
-D
22 a legalaposabb elemzést lásd Guarino [2001]-ben, mi is onnan vettük.
32
Látható, hogy az állat vagy társadalmi egység fogalomnak az ágens alá való rendelése a metodológia több szabályát is megszegi. Természetesen pl. az ágens és a társadalmi egység közt van valamilyen viszony, csak ez nem a generikus reláció. Intuíciónknak megfelelően az ágens formális szerep. A modellezés és tudásreprezentáció már régen foglalkozik a szerep fogalmak adekvát reprezentációjával (l. pl. Roles1, Roles2, Roles3, Roles4), az ott összegyűjtött tapasztalatot az ontológiaépítésben is felhasználhatjuk. Az itt tárgyalt összefüggés azt fejezi ki, hogy állat, vagy társadalmi egység lehet ágens, azaz játszhatja az ágens szerepet – ez a modellezésből és tudásreprezentációból jól ismert „role filling” (vagy played_by) reláció, amelyet mi a játszhatja néven szerepeltetünk. Tehát az ágens helyes (az ontológia elkötelezettségnek megfelelő) jellemzése az, amint a 10. ábra mutatja.
10. ábra Az ágens formális szereppel sok materiális szerep van generikus relációban. Ilyen pl. a tanár: • nyilván valóan ~R, +D, tehát szerep, és • +I, mert az embertől örökli az azonossági feltételt. A dőlten szereplő indoklás a fentiek tükrében félrevezető lehet: szigorúan véve az ember fogalom nem neme a tanárnak, hanem játszhatja relációban van vele. Azonban ebben az esetben ezt az egyetlen típust rendelhetjük a szerephez, így a tanár összes előfordulása lesz az embernek is – a terjedelem szempontjából kielégíti a generikus reláció feltétteleit. Azonban ha a tartalmat nézzük, és abban csak funkcióit és a szerep felvételének feltételeit fogalmazzuk meg, nem tartozik a tanár szerephez szorosan az, hogy csak ember tölti be. Ha a szerep fogalomtípust szigorúan vennénk, nem lenne szabad a generikus relációt használni, viszont a materiális szerepek esetén a játszhatja reláció szerinti tulajdonságöröklődést meg kell engedni.
33
11. ábra Ha a tanár és az ágens előfordulásait vizsgáljuk, a következőket állapíthatjuk meg róluk: •
az ágens előfordulásáról nem lehet automatikusan tudni, melyik típus előfordulása, hiszen több is játszhatja. Ezért csak az ágens tulajdonságait örökli.
•
a tanár előfordulásairól tudni, hogy előfordulásai az embernek is, hiszen egyedül az ember előfordulásai játszhatják a tanár szerepet. Ezért öröklik az ember tulajdonságait is.
A tanár előfordulásairól mondottak ugyanarra a következtetésre vezetnek, ha az ember és tanár közt a generikus reláció áll fenn. Ezért nem jár semmilyen veszéllyel, ha a materiális szerepeknél a játszhatja relációt a generikussal helyettesítjük. Vegyünk egy másik példát: a kalapács fogalmát. Típusnak is vehetjük, ha a terjedelme a kalapácsok halmaza. Neme – közvetlenül, vagy áttéttelesen – az eszköz. Itt azonban már elgondolkozhatunk azon, hogy esetleg formális szereppel van-e dolgunk? Valójában az eszköz szó két fogalmat takar: az eszköz szerepet és az eszköznek készített tárgyakat. A kalapács esetével kapcsolatban Roles2 hozza a „kalapácsnak használta cipőjét” példát. Roles5 felveti azt a lehetőséget, hogy a szerepek függését az ontológiában relációkkal fejezzük ki. Vizsgáljuk meg példáinkat: a tanár függ pl. a tanulótól, a tananyagtól vagy a tanítástól. A fenti függések nem egyformák: a tanuló éppúgy függ a tanártól (és a tanítástól), viszont a tanítás nem függ az előzőktől23, valamint a tanítás eseménye rigid. A tanítás típus lesz, míg a tanuló, tananyag szerep. Hasonlóan minden foglalkozás (tipikus szerepfogalmak) függ valamilyen – egy, vagy több – eseményszerűségtől. Tipikus szerepfogalmak a különböző eszközök, pl. kés24 függ vágástól, fegyver a katonától és a harctól. Ezek is mindig függnek valamilyen eseményszerűségtől. Ez a törvényszerűség megjelenik a formális szerepeknél is: az ágens és az eszköz (mint szerep) az eseményszer ség kategóriától függnek. Sejtés: minden szerep függ egy gerincbeli elemtől. Emlékezzünk: az épít anyag függ az építéstől stb. Erre a sejtésre még ET7-ben visszatérünk. A tanár fogalommal kapcsolatban felmerül a foglalkozás fogalom. A tanár a foglalkozásnak természetesen előfordulása, nem fajtája. A köztük lévő viszony ugyanúgy kezelhető, mint az ET4-ben tárgyalt hasonló esetekben.
23 természetesen az utóbbi állítást a külső függés megfelelő definíciója teszi igazzá. 24 pontosabban: a kés szerep.
34