A bizonytalanságkezelés modelljeinek osztályozása. A Bayes-modell, a Bayeshálók, a Dempster-Shafer-modell és a fuzzy-modell lényege; alkalmazási lehetőségeik, korlátaik. A heurisztikus és a szimbolikus (nem-numerikus) bizonytalanságkezelő modellek sajátosságai.
A bizonytalanságkezelés modelljeinek osztályozása A problémamegoldás és a döntéshozatal során gyakran bizonytalan – részleges, elégtelen vagy közelítő – információval manipulálunk. Ilyen információról akkor beszélünk, amikor vagy nem tudunk valamit, vagy nem pontosan tudjuk azt, vagyis amikor tudásunk − − − −
hiányos (részleges, elégtelen): nem tudunk azzal kapcsolatban minden kérdést megválaszolni, nem teljesen megbízható, pontos lenne, de kifejező eszközünk, a reprezentáló nyelv nem elég precíz, ellentmondásos: van olyan információ, amelyet bizonyos források valószínűsítenek, más források kizárnak (konfliktus helyzet).
Egy esemény kimenetele kétféle értelmezésben lehet bizonytalan: − −
objektív: hosszú időn keresztül megfigyelt relatív gyakorásg alapján (a valószínűségszámítás szerint) kialakított bizonytalansági mérték szerint, szubjektív: az egyén saját tapasztalatai, megfigyelései alapján kialakult ítélet, meggyőződés az esemény kimenetelének bizonyosságának fokát illetően (ez személyenként, egyazon személynél pedig esetenként is eltérő lehet).
A tudásalapú/szakértő rendszerek esetén – a tudásbázisban ábrázolt ismeretanyag jellegéből következően – a szubjektív értelmezésről van szó. A bizonytalan információ közlése hogyan történik a mindennapi életben? Fűzhetünk hozzá informális magyarázatot, leírhatjuk informálisan elmondott példákkal, körülírhatjuk informálisan megfogalmazott kivételekkel. A jelenlegi tudásalapú rendszerekben az ilyen jellegű információt numerikus vagy szimbolikus eszközökkel tudjuk ábrázolni. Azonban minden formalizmus egzakt; hogyan merjük azt részleges, nem-teljesen ismert „világmodell” ábrázolására felhasználni? Úgy, hogy a rendszer tanácsai alapján döntést hozó felhasználóra bízzuk a bizonytalanság értelmezését, amit a felhasználó jellemzően nem egy, hanem (akár egyszerre) több szempont alapján végez. Bizonytalan tudás ábrázolásának ellentmondása abban rejlik, hogy − −
maximális információt nyújt a bizonytalanságról – a bizonytalan ismereteket egzakt, pontos szemantikával rendelkező eszközökkel fejezi ki, ami megtévesztő lehet, mivel így minimális szabadságot hagy a szintaxist értelmező felhasználó számára.
A bizonytalanság megjelenésének változatos formái: Megjelenési formák a. Hiányos adat b. Bizonytalan következtetés
Példa, szituáció Egy kérdőívnek nincs kitöltve minden pontja A megfigyelt tünetekből az adatt betegség csak valószínűsíthető
c.
Bizonytalan fogalom, bizonytalan adat d. Bizonytalan adat e. Ellentmondó adat, ellentmondó következtetés f. Ellentmondó következtetések g. Hiányos adat – így nincs alkalmazható következtetés h. „Még nem következett be” adat i. Bizonytalan adat, bizonytalan következtetés j.
Az adat biztos, csak nem tudjuk közvetlenül megfigyelni
A beteg torka piros. (Ezt mondta az orvos, de én egyáltalan nem látom pirosnak. Egy mérőműszer nem elég megbízható Az adatokból levonható következtetések egymásnak ellentmondanak Két szakértő egymásnak ellentmondó véleményen van Van-e intelligens élet a Földön kívül? Felel-e a gyerek holnap az iskolában? A probléma pontos megfogalmazása nagyon költséges lenne; megelégszünk ezért egy olcsóbb és kevésbé megbízható megoldással Van-e gyulladás a beteg gyomrában?
A bizonytalanságkezelés módszereinek, modelljeinek osztályozásánál numerikus, szimbolikus és heurisztikus módszereket szokás megkülönböztetni: 1. Numerikus modellek: bizonytalan adat, bizonytalan fogalom és hiányos adat kezelésére alkalmas formalizmusok. Tipikus példák: b, c, d, i, j. A numerikus módszerek lényege az, hogy minden egyes rendszerelemhez (adathoz, állításhoz) egy, annak megbízhatóságát jellemző számot rendelnek (mégpedig jellemzően „véletlen kísérletek” során megfigyelt relatív gyakoriság alapján). Emellett az (ÉS, VAGY, NOT kapcsolókkal) összetett rendszerelemekhez megfelelő kombinációs „kiszámító” függvényeket, kalkulust adnak meg – elméletileg megalapozott módon. Az ismertebb numerikus modellek közül megemlítjük a következőket: − A Bayes-szabályon alapuló bizonytalanságkezelési modell, amely a klasszikus valószínűségszámítás modelljei közül a legismertebb, − a Dempster-Shafer-féle megbízhatóság-elmélet, amely a valószínűség fogalmának kiterjesztésével létrejött formalizmusok egyike, végül − a fuzzy-modell, vagyis a fuzzy-mértékeken alapuló formalizmusok, amelyek a bizonytalan elhatárolás mértékein alapuló fuzzy-logikán alapulnak. 2. Szimbolikus (nem-numerikus) modellek: hiányzó adat helyett feltételezés, ill. ellentmondásos adat vagy ellentmondásos következtetés kezelésére alkalmas formalizmusok. Tipikus példák: a, e, f, g, h. A nem-monoton következtető rendszerek a legismertebb szimbolikus bizonytalanságkezelő modellek. Ezek esetében a hiányos tudásból származó űrt feltételezésekkel, hitekkel, hiedelmekkel pótoljuk. Amint pedig a rendszer a végrehajtás során (az addigi feltételezésekkel) ellentmondásra jut, az egymásra építő bizonyítékok körében (ún. függőségvezérelt) visszalépést végez, amíg csak a korábbi feltételezések közül valamely(ek) visszavonásával ki nem tudja küszöbölni az ellentmondást. 3. Heurisztikus módszerek: formailag hasonlítanak a numerikus módszerekhez (elemi rendszerelemekhez számok rendelése, valamint kalkulus megadása), azonban ezek elméletileg nem megalapozott, ad hoc numerikus modellek. Tipikus példák: c, i, j.
Bayes-módszer A bizonytalanság kezelésére legrégebb óta használt és legjobban definiált alaptechnika, amely a valószínűségszámításon alapul. A Bays-szabály a feltételes valószínűség fogalmára épül, amelynek ismertetése előtt bevezetjük a valószínűségi mérték fogalmát. Valószínűségszámítási gyorstalpaló (lsd. Sántáné-Tóth Edit: Tudásalapú technológia, szakértő rendszerek). Sokszor kíváncsiak vagyunk arra, hogy két esemény, mondjuk az A és B, milyen kapcsolatban vannak egymással, például befolyásolja-e az A eseményt a B esemény bekövetkezése, és ha igen, akkor „mennyire”. Ennek mértéke, azaz az A esemény B eseményre vonatkozó feltételes valószínűsége azt fejezi ki, hogy ha tudjuk, hogy a B esemény bekövetkezett, ez mennyire változtatja meg az A esemény bekövetkezésében való bizalmunkat. Ezt P(A|B)-vel jelöljük és értékét a következő képlet szerint számoljuk: P(A|B) = P(AB)/P(B) feltéve, hogy P(B) != 0 Ebből a P(AB) = P(B|A)*P(A), valamint a teljes valószínűség tételének P(B)-re való alkalmazásával levezethető a két eseményre vonatkozó Bayes-szabály:
feltéve, hogy P(B) != 0.
𝑃(𝐴|𝐵) =
𝑃(𝐵|𝐴) ∗ 𝑃(𝐴) 𝑃(𝐵|𝐴) ∗ 𝑃(𝐴) + 𝑃(𝐵|~𝐴) ∗ 𝑃(~𝐴)
A Bayes-szabály segítségével ki tudjuk számítani a P(A|B) ismeretlen feltételes valószínűségének értékét, ha ismerjük a jobboldalon szereplő valószínűségek értékét. Ha már most az 𝐴1 , 𝐴2 , 𝐴3 , … , 𝐴𝑛 (𝑛 > 0) események teljes eseményrendszert alkotnak, B pedig egy tetszőleges további esemény, akkor az 𝐴𝑖 B-re vonatkozó feltételes valószínűségét megadó általános Bayes-szabály:
feltéve, hogy P(B) != 0.
𝑃(𝐴𝑖 |𝐵) =
𝑃(𝐵|𝐴𝑖 ) ∗ 𝑃(𝐴𝑖 )
∑𝑗=1,…,𝑛 𝑃�𝐵�𝐴𝑗 � ∗ 𝑃�𝐴𝑗 �
További általánosítása a Bayes-szabálynak, ha az 𝐴1 , 𝐴2 , 𝐴3 , … , 𝐴𝑛 (𝑛 > 0) események egyszerre több 𝐵1 , 𝐵2 , 𝐵3 , … , 𝐵𝑚 (𝑚 > 0) események együttes hatásától függenek:
ha P(𝐵1 𝐵2 … 𝐵𝑚 ) != 0.
𝑃(𝐴𝑖 |𝐵1 𝐵2 … 𝐵𝑚 ) =
𝑃(𝐵1 𝐵2 … 𝐵𝑚 |𝐴𝑖 ) ∗ 𝑃(𝐴𝑖 )
∑𝑗=1,…,𝑛 𝑃�𝐵1 𝐵2 … 𝐵𝑚 �𝐴𝑗 � ∗ 𝑃�𝐴𝑗 �
E szabály alkalmazásával a 𝐵1 𝐵2 … 𝐵𝑚 eseményekből következtetni tudunk az 𝐴𝑖 esemény fennállásának „a posteriori” (kikövetkeztetett) bizonytalansági mértékére. Ehhez természetesen ismernünk kell a képletek jobboldalán szereplő „a priori” (korábban ismert, eleve adott) −
elsődleges valószínűségeket: P(𝐴𝑗 ) értékeket (j=1,2,...,n), valamint
−
feltételes valószínűségeket: P(B|𝐴𝑗 ), ill. P(𝐵1 𝐵2 … 𝐵𝑚 |𝐴𝑗 ) értékeket (j=1,2,...,n)
A Bayes-szabályt akkor célszerű alkalmazni, ha elegendő információ áll rendelkezésünkre. Azonban heurisztikán alapuló szakértői szituációkban (pl. 𝐴1 𝐴2 … 𝐴𝑁 : diagnózisok, 𝐵1 𝐵2 … 𝐵𝑚 : szimptómák) gyakorlatilag nem alkalmazható. (könnyű átgondolni ugyanis, hogy a diagnózisok és tünetek nem alkotnak egymást páronként kizáró, teljes eseményrendszert!). A Bayes-szabály alkalmazásának előnyei: − −
Szilárd elméleti alapok Jól definiált szemantika
A Bayes-szabály alkalmazásának hátrányai: −
− −
−
Nagyon sok valószínűséget kell megadni. Ráadásul nem kölcsönösen kizáró hipotézisek, és/vagy nem feltételesen független bizonyítékok esetén (tehát a legtöbb gyakorlati esetben) ennél jóval több adat kell. A számoláshoz pedig nem hiányozhat egy valószínűség sem. Nehéz a priori valószínűségeket megadni. Sok munkát jelent a statisztikai mintavétellel történő meghatározás. A tárgyterület megváltozásának követése (pl. új bizonyíték vagy új hipotézis megjelenése) esetén nem elég az új esemény és a vele kapcsolatos feltételes események valószínűségét megadni, hanem minden korábbi valószínűség-kiosztást felül kell bírálni, ami sok munka. Természetesen, ez a teljes tudásbázis módosítását vonja maga után, ami azt jelenti, hogy a rendszer bővítése nem végezhető el inkrementálisan. A Bayes-módszerrel kiszámolt valószínűségek nem magyarázhatók. Ugyanis a hipotézisek és a bizonyítékok közötti kapcsolatok általában összetettek – azokat egyszerű számokkal ábrázolni mindenképpen információvesztést jelent.
Bayes-háló A Bayes-háló egy irányított gráf, amelyben minden csomóponthoz számszerű valószínűségi információk vannak csatolva. A teljes megadás a következő: 1. A háló csomópontjait valószínűségi változók egy halmaza alkotja. A változók lehetnek diszkrétek vagy folytonosak. 2. Irányított élek (nyilak) egy halmaza összeköt bizonyos csomópontpárokat. Ha létezik nyíl az X csomóponttól az Y csomópontig, azt mondjuk, hogy az Xa szülője az Y-nak. 3. Minden Xi csomóponthoz tartozik egy P(Xi∣Szülők(Xi)) feltételes valószínűség-eloszlás, ami számszerűen megadja a szülők hatását a csomóponti változóra. 4. A gráf nem tartalmaz irányított kört (azaz irányított, körmentes gráf – Directed, Acyclic Graph, DAG). Kiegészítés szükséges!
Dempster-Shafer-modell A Dempster-Shafer-féle bizonyíték-elméletet a 60-70-es években fejlesztette ki Dempster és tanítványa, Shafer. Elméletük matematikai alapokon nyugszik; azt, hogy egy tényt egy bizonyíték
mennyire támogat, az alaphalmaz egy részhalmazával reprezentálták, és a támogatás fokát 0 és 1 közötti számmal jellemezték. Elméletük nem az álítások bizonytalanságával foglalkozik, hanem azzal, hogy azok bizonyítékai az adott állításokat milyen bizonyossággal támogatják. Vagyis, az elmélet a bizonytalansággal kapcsolatos bizonytalanságunkkal foglalkozik. A módszer alkalmazásához először is meg kell adni az adott világ leírásához szükséges elemek, pl. állítások alaphalmazát, melyet a megfigyelés keretének nevezünk és Θ-val jelölünk. Feltételezzük, hogy ennek elemei egymást kölcsönösen kizárják, és hogy a Θ a világ leírásához szükséges minden elemet tartalmaz. Jelölje a Θ összes részhalmazának halmazát 2Θ .
Példa: legyen A, B, C, D négy különböző fertőző betegség (Θ = {A, B, C, D}) úgy, hogy az {𝐴, 𝐵} ∈ 2Θ jelentése: vagy az A, vagy a B betegség áll fenn. Legyenek a betegségek közül A és B vírusos, míg C és D pedig a baktérium-okozta betegségek (előbbit {A,B}, utóbbit {C,D} ábrázolja):
A 2Θ elemeit, azok hierarchikus kapcsolatait szemléletesen lehet a fenti módon ábrázolni. Mint látható, az ábrából a hatványhalmaz elemei közül hiányoznak a háromeleműek, és a kételeműek közül is csak a számunkra érdekes kettő szerepel.
A Dempster-Shafer-módszernél a bizalom mértékét 0 és 1 közötti számmal fejezzük ki. Egy valószínűségi alap-hozzárendelést megvalósító M függvénnyel hozzárendelünk a 2Θ minden részhalmazához egy [0,1] közötti értéket úgy, hogy az üres részhalmazhoz hozzárendelt érték 0, míg a maradék 1-et felosztjk a többi részhalmaz között: ∑𝑀(𝑥) = 1 ∀𝑥 ∈ 2Θ é𝑠 𝑀(∅) = 0.
Fontos tulajdonsága ennek az M alap-hozzárendelésnek az, hogy egy elemhez hozzárendelt értékből nem következtethetünk az adott elem részhalmazaihoz hozzárendelt értékekre.
Legyen már most 𝑀1 és 𝑀2 két alap-hozzárendelés. Jelölje együttes, kombinált hatásukat 𝑀1 ⊕ 𝑀2 . A kombinációs Dempster-szabály minden egyes 𝑥 ∈ 2Θ elem esetén annak összes, x-ben közös részhalmaz párjaihoz tartozó 𝑀1 és 𝑀2 értékek szorzatának összegét rendeli, formálisan: 𝑀1 ⊕ 𝑀2 (𝑥) = ∑𝑀1 (𝑢) ∗ 𝑀2 (𝑣), 𝑎ℎ𝑜𝑙 𝑢, 𝑣 ⊆ 2Θ é𝑠 𝑢 ∩ 𝑣 = 𝑥
A Dempster-szabály kommutatív. Amennyiben a szabály az üres halmazhoz nem rendelne nullát (𝑀1 ⊕ 𝑀2 (∅) = 𝑓 ≠ 0), normalizálnunk kell, vagy 1-f értékkel le kell osztanunk az összes többi kiszámított értéket. Bel (total belief): a teljes bizalom mértéke, amelyet úgy számolunk ki, hogy egy 𝑢 ∈ 2Θ részhalmaz M(u) értékéhez hozzávesszük még az u összes részhalmazainak M értékeit: 𝐵𝑒𝑙(𝑢) = ∑𝑀(𝑥) ∀𝑥 ⊆ 𝑢 − 𝑟𝑎
D (doubt): a kétkedés mértéke, vagyis egy részhalmaz ellentettjébe vetett teljes bizalom mértéke 𝐷(𝑢) = 𝐵𝑒𝑙(~𝑢)
Pl (plausibility): az elfogadhatóság mértéke, a bizalom felső határa, a legerősebb bizonyosság függvénye: 𝑃𝑙(𝑢) = 1 − 𝐷(𝑢)
Ha H egy hipotézis, akkor Bel(H) a H teljesmértékű elfogadását, D(H) a H tagadásának teljes mértékű elfogadását jelenti, míg Pl(H) azt fejezi ki, hogy még éppen nem kétkedek a H-ban. Kombinálás esetén e három mértéket a megfelelő alap-hozzárendelésekkel vett Dempster-szabály alkalmazása után kiszámított M értékekből lehet kiszámolni. Egyenlőtlenségek: Pl(A) ≥ Bel(A), Bel(A) + Bel(~A) ≤ 1, Pl(A) + Pl(~A) ≥ 1.
Egy tény bizonyítékának és tagadása bizonyítékának összege nem kell 1-et adjon – az 0 is lehet, amennyiben nincs a tényről semmilyen információnk. A Bel(A) és a Pl(A) közötti intervallumot a bizalom intervallumának nevezzük. Hipotézisek hierarchikus kapcsolatai esetén ez az intervallum egyre csökken, amint új bizonyítékok állnak elő. Vagyis, ha egy intervallum széles, akkor annak szűkítése érdekében a tárgyköri szakértőtől minél több ismeret, bizonyítékot kell beszereznünk, hogy csökkenthessük a „bizonytalanságunkkal kapcsolatos bizonytalanságunkat”. Ha 𝐴 ⊆ 𝐵, akkor Bel(A) ≤ Bel(B), Pl(A) ≤ Pl(B). A Dempster-Shafer-módszer előnyei: −
−
−
Szemben a Bayes-módszerrel, nem elemi eseményekkel foglalkozik, hanem a köznapi szemléletmódhoz hasonlóan összetett hipotézisekkel, ennek révén tulajdonképpen a bizonytalansággal kapcsolatos bizonytalanságunkkal. A szakértőrendszer-alkalmazások esetén azért is előnyösebb ez a Bayes-módszernél, mert itt nincs szükség az a priori valószínűségek megadására, továbbá, mivel formalizmusa hasonlít a logika és az adatbázis-lekérdező nyelvek formalizmusára. Diagnosztizáló rendszerek esetén különösen előnyös, hogy képes hipotézis-halmazok részhalmazainak, mint egyre szűkülő bizonyítékoknak „bizonyító erejét” összegezni.
A Dempster-Shafer-módszer hátrányai: −
Az összes megfigyelhető esetet elő kell állítani
Nagyszámú eset esetén problematikus megadni az összes esetre a valószínűségi alap-hozzárendelést, valamint kiszámolni a Bel és Pl függvényeket. Szintén sok számolást igényel a kombinált esetek kezelése.
A bizonytalanság fuzzy-modellje, jellegzetes alkalmazásai. A bizonytalanság különböző forrásai sok homályt, határozatlanságot jelentenek az egyes események kimenetelének megítélésében. Ha pedig információnk nem precíz, ill. homályos, következtetésünk is ilyen lesz. A 60-as évek közepén Zadeh a fuzzy-halmazelméletet a nyelvi fogalmakban rejlő pontatlanság matematikai kezelésére dolgozta ki. Az olyan gyengén (weakly) definiált halmazokra,
mint pl. a „kövér emberek halmaza”, amely esetében ugyanis bizonytalan az, hogy egy ember elemee a halmaznak. Zadeh bevezette a részleges, vagy parciális tagság fogalmát: bizonyos objektumok „jobban beletartoznak” ebbe a halmazba, mint mások. Ezt [0,1] intervallumbeli számmal jellemezte: az 1 azt jelenti,hogy benne van, a 0 azt, hogy nincs benne, míg egy 0 és 1 közötti szám azt fejezi ki, hogy mennyire vagyunk biztosak benne, hogy az objektum eleme a halmaznak. Formalizálva: Jelölje D az alaphalmazt (pl. emberek). Jelöljük a D részhalmazait nagybetűkkel (pl. A), elemeit kisbetűkkel (pl. a). A fuzzy-halmazelmélet a∈A típusú állításokkal foglalkozik, amely állítás igazságát a 𝜇𝐴 (𝑎) függvény értéke (∈ [0,1]) adja meg.
A fuzzy tagsági függvény formális definíciója:
𝜇𝐴 (𝑎) : D → [0,1] úgy, hogy 𝜇𝐴 (𝑎) = 1 : az a definit módon A-ba tartozik 𝜇𝐴 (𝑎) = 0 :az a definit módon nem tartozik A-ba 𝜇𝐴 (𝑎1 ) > 𝜇𝐴 (𝑎2 ) : az 𝑎1 „jobban beletartozik” A-ba, mint az 𝑎2 A halmazelméleti műveletek Zadeh által javasolt kiterjesztése:
𝜇[𝐴∪𝐵] (𝑥) = max{𝜇𝐴 (𝑥), 𝜇𝐵 (𝑥)} 𝑥 ∈ 𝐷 𝜇[𝐴∩𝐵] (𝑥) = min{𝜇𝐴 (𝑥), 𝜇𝐵 (𝑥)} 𝑥 ∈ 𝐷 𝜇~𝐴 (𝑥) = 1 − 𝜇𝐴 (𝑥) 𝑥 ∈ 𝐷
Az is megengedett, hogy a 𝜇𝐴 (𝑎)ne közvetlenül a [0,1] intervallumba, hanem egy véges, rendezet fuzzy-halmazba képezzen (pl. a {sovány, normálsúlyú, molett, kövér} halmazba). E fuzzy-halmazból kimetszett rész azután egyértelműen megfeleltethető a [0,1] egy részhalmazának. A fuzzy hozzátartozás fokának az a jellegzetessége, hogy egyazon egyednek egyszerre több osztályhoz való tartozásával, ilyen értelemben többértékű bizonytalansággal is képes dolgozni. A fuzzy-halmazokhoz ún. fuzzy-logika adható, amelyben az állításokhoz nem a logikában megszokott 0 vagy 1 értéket, hanem egy folytonos, esetleg diszkrét értékű függvénnyel megadható igazsági fokot rendelünk. A fuzzy-logika állításaiban általában használni szoktak ún. nyelvi változókat is. Ilyen változó pl. a „magasság”, amelynek értékei lehetnek: alacsony, középmagas, magas. Használhatók ezen kívűl még ún. nyelvi módosítók is. Ilyen módosító pl. a „nagyon” („𝜇𝐴 (𝑛𝑎𝑔𝑦𝑜𝑛 𝑎) = ⋯”), amelyhez többnyire a hatványozás műveletét rendelik hozzá. Egy fuzzy-alapú rendszer tudásbázisában ilyen nyelvi kifejezések segítségével leírható fuzzyszabályokat ábrázolunk; e szabályok kiértékelését fuzzy-következtetésnek nevezzük. Egy fuzzymodellre alapozott alkalmazás kidolgozásakor a fuzzy-szabályok megadása mellett természetesen meg kell adni a bemeneten a fuzzy-halmazokra való „lefordítás” módját; ez az ún. fuzzifikálás. Meg kell ezenfelül adni a fuzzy-következtetések eredményeként kapott halmazok „visszafordítását” is; ez a
defuzzifikálás, amely a különböző forrásokból származó következményeket reprezentáló, egyesített fuzzy-halmazokból kiszámítja a kimeneten megjelenítendő eredményt. A fuzzy-modell alkalmazásának előnyei: −
− − − − −
A fuzzy-modell szemlélete közel áll az ember napi valóság-szemléletéhez. Itt nem kell számszerűsíteni a bizonyosság mértékét. Ehelyett használhatjuk a megszokott nyelvi kifejezéseket, ami megkönnyíti a rendszer módosítását. A többi numerikus modellel szemben jelentősen egyszerűbb a rendszerleírás. Nem kell részleteen kidolgozni a feladat modelljét, így nincs szükség a tudásalapú rendszereknél oly sok problémát okozó tudásszerzésre. Egy szabályalapú rendszerben a szabályok érvényességét pontosan meg kell adni – a fuzzyszabályokkal részleges igazságot is ki lehet fejezni. Előnyösen alkalmazható hiányos, valamint bonyolult feladatok esetén. A fuzzy-bizonytalanságokkal könnyű számolni.
A fuzzy-modell alkalmazásának hátrányai: −
− −
A fuzzy tagsági függvény nincs elméletileg úgy megalapozva, mint pl. a valószínűség. Nem mindig nyílvánvaló, hogy hogyan kell megadni az „eleme” függvényt (elég szubjektív). Ez nehézséget okoz az alkalmazásoknál; ennek kidolgozása és finomítása gyakran hosszabb időt vesz igénybe, mint a tárgyterületet leíró ismeretanyag megszerzése Sokan vitatják, hogy a fuzzy fogalmakat lehet-e pontosan reprezentálni A kombinációs függvényeket is sok kritika éri. Pl., ha két halmaznak nincs közös eleme, együttes bizonyosságuk a halmazok bizonyosságának minimuma lesz, holott annak 0-nak kéne lennie.
Jellegzetes alkalmazások Az 1980-as évek közepétől a fuzzy-alkalmazások mind a tudományos, mind a gyakorlati életben egyre több helyen jelentek meg, kiegészítve, vagy kiszorítva a hagyományos technikákat. Az első sikeres alkalmazást Japánban a Hitachi cég készítette. Ez a teljesen automatikus Sendai metróvonat fékberendezését szabályozó rendszer 1989 óta üzemel. 1990-ben már több mint 300 gyakorlati alkalmazásról tudunk a forgalomirányító berendezések (pl. hajók navigációs rendszere), a háztartási és szórakoztatóelektronikai eszközök (pl. porszívók, mosógépek, légkondícionálók, videókamerák) és az ipari automatizálás (diagnosztika, gépkocsi-elektronika, méréstechnika, űrhajózás stb.) egyes területein. 1993-ban Japánban már több mint 1500 szabályozástechnikai alkalmazást tartottak számon. Ezek a fuzzy-szabályozók a vezérlés hagyományos eszközeihez vagy a neurális hálózatos rendszerekhez képest egyszerűbb és olcsóbb megvalósításokat adnak. A szabályozástechnikai alkalmazások mellett a fuzzy-technika legígéretesebb alkalmazási területei az adatanalízis, diagnózis, előrejelzés, információ visszakeresés és döntéshozatal. A rendszerépítést és –futtatást támogató fuzzy-eszközök már 1995-től kezdve jelentős szerepet kaptak az MI piacokon.
Heurisztikus módszerek
Történetileg a tudásalapú rendszereknél alkalmazták először a bizonytalanság heurisztikus módszereit, melyek kevert, vagyis szimbolikus és numerikus formalizmust együttesen használnak. E formalizmusok ún. bizonyossági tényezői (cf: certainty factors) numerikus értékek, amelyeknek a következtetések során történő „kiszámolása” specifikus kalkulus szerint történik. Ezért mondhatjuk, hogy a cf-módszer a következtetés vezérlésének egyik eszköze. M1 modell A) Az M.1 bizonyossági tényezőjének meghatározása és ábrázolása 𝑐𝑓 ∈ [0,100] úgy, hogy: cf = 100: „teljesen bizonyos” vagy „definíció szerint igaz” (alapértelmezés) cf = 20: a bizonyosság, a hihetőség alsó küszöbe (ez alatt az állítást elveti) cf = 0: „teljesen elvetve” vagy „definíció szerint hamis”. B) Kombinációs szabályok AND-OR kombinálás a szabály „𝑒1 AND/OR 𝑒2 ” feltétel-részleténél: 𝑐𝑓(𝑒1 ∧ 𝑒2 ) = min{𝑐𝑓1 , 𝑐𝑓2 } 𝑐𝑓(𝑒1 ∨ 𝑒2 ) = max {𝑐𝑓1 , 𝑐𝑓2 }
C) Bizonytalan információból való következtetések C.1. Szabály-végrehajtás esetén:
A feltételrész végrehajtáskori, eredő bizonyosságát meg kell szorozni a szabály bizonyosságával, majd 100-zal normalizálni kell a „cf érték elem [0,100]” miatt. Tehát, ha 𝑐𝑓(𝑒) = 𝑐𝑓𝑒 , 𝑐𝑓(ℎ, 𝑒) = 𝑐𝑓𝑟 , akkor az eredő:
Példa: bor-tanácsadó rule-6: if fő-étel = hús and van-borjúhús = nincs then legjobb-szín = vörös cf 90.
𝑐𝑓(ℎ) = 𝑐𝑓𝑒 ∗ 𝑐𝑓𝑟 /100
Tegyük fel, hogy a felhasználó 80 bizonyossággal állítja, hogy húst fog enni, és 70 bizonyossággal, hogy nem borjúhúst. Ekkor a szabély feltételrésze teljesül, mégpedig min(80,70)=70 eredő bizonyossággal. Alkalmazható tehát a szabály; eredményeként az ajánlható legjobb szín a vörös lesz, mégpedig cf=70*90/100=63 cf értékkel. C.2. Független forrásokból származó bizonyítások esetén: Ha két szabály vezet ugyanarra a h hipotézisre, mégpedig egyik 𝑐𝑓1 , a másik 𝑐𝑓2 bizonyossággal, akkor a h eredő bizonyosságát a következő képlet adja: (100 ∗ 𝑐𝑓1 + 100 ∗ 𝑐𝑓2 − 𝑐𝑓1 ∗ 𝑐𝑓2 )/100
Példa1: legyen h-ra két, 𝑐𝑓1 = 80 és 𝑐𝑓2 = 60 tényezőjű következtetés; ekkor
𝑐𝑓ℎ =
Az M.1 cf-modelljének értékelése: −
8000 + 6000 − 4800 9200 = = 92. 100 100
Az M.1 cf-modellje még kevésbé rendelkezik jól megalapozott elmélettel, mint a MYCIN CFmodellje.
Az M.1 cf értékeire adott „százalék” megnevezés megtévesztő. Ráadásul, ha egy kérdésre a felhasználó több választ is adhat, az egyes válaszokra adott cf értékek összege meg is haladhatja a 100-at.
A bizonytalanság kezelésének szimbolikus, nem-numerikus módszerei. A nem-numerikus modellekben nem bizonytalansági mértékekkel operálunk, hanem a bizonytalanságot másképpen fogjuk meg: megengedjük magunknak annak beismerését, hogy amennyiben (elegendő információ hiányában) helytelen következtetést vontunk le, azt visszavonhassuk. Ilyen jellegű következtetésekhez a napi életben gyakran hozzá szoktuk tenni, hogy „tudomásom szerint...”, vagy „jelenlegi ismereteim szerint...”. Példa: „A madarak tudnak repülni.” ∧ „A pingvinek madarak.” ∧ „Totyi egy pingvin.” → „Totyi tud repülni.”
Ez a következtetés az állítások alapján helyes, azonban ha később a tudomásunkra jut, hogy a pingvinek nem tudnak repülni, akkor vissza kell vonni az előbbi következtetést. Nem-monoton következtető rendszerek jellemzése A hagyományos következtető rendszerek (ilyen pl. az elsőrendű predikátumkalkulus is) három fontos jellemzője: teljes, konzisztens és monoton. Utóbbi alatt azt értjük, hogy ha egyszer egy állítás bizonyítást nyert a rendszeren belül, az végig érvényes marad. A nem-monoton logikákon belül az ún. modális logikák esetében nyelvi eszköz szolgál annak kifejezésére, hogy egy állítás lehetséges, hogy igaz, vagy hogy szükségszerű, hogy igaz (ill. hamis). Kulcsfogalom a hit vagy feltételezés. E logikákban a következmény fogalma úgy van definiálva, hogy egy feltételezésen alapuló (ilyen értelemben nemmonoton) következtetést egy későbbi lépésben végrehajtott következtetés eredménye, vagy egy újabb, kívülről kapott ismeret érvényteleníthet. A nem-monoton következtető rendszereknél – megengedve, hogy hiányos ismeretanyagon dolgoznak – nem várjuk a hagyományos következtető rendszerek fenti három jellemzője. Sok problémát vet ez fel, például: − − −
Hogyan kell kiterjeszteni egy tudásbázist ahhoz, hogy meglévő és hiányos ismeretek alapján is lehessen következtetéseket levonni? Hogyan módosítsuk a tudásbázist új tény befogadásakor, régiek eltávolításakor? Hogyan használjuk fel a tudásbázisban tárolt ismereteket olyan konfliktushelyzetekben, amikor azoknak ellentmondó következményhez jutunk?
A nem-monoton következtető rendszerek leírására sok formális elmélet született. Ezek jólformált formulák lehetséges világok fölötti interpretációval manipulálnak. Mint ismeretes, jólformált formulák valamely halmazának modellje egy interpretáció, ha abban mindegyik formula igaz értékre
értékelődik ki. Formalizálni kell tudnunk az olyan állításokat is, hogy „egy modellben jobban hiszünk, mint a másikban”. Meg kell adni egy megfelelő nem-monoton kalkulust is. McDermott és Doyle nem-monoton logikája az elsőrendű predikátumkalkulus, kibővítve egy M modális operátorral, amelynek olvasata: (deduktíve) konzisztens. Meg kell jegyezzük, hogy mivel már az elsőrendű predikátumkalkulus konzisztenciája sem eldönthető (formálisan nem igazolható), megtévesztő lehet a „konzisztens” szó használata. Értelmezése itt tágabb, közelítő jellegű: „összeegyeztethetőt”, „kizáró ok híján feltételezhetőt” értünk alatta. Példa: mindenki olyan, hogy azokat a rokonait, akivel az eddigiekben jól kijött, adott esetben védelmébe veszi: ∀𝑥, 𝑦: 𝑟𝑜𝑘𝑜𝑛(𝑥, 𝑦) ∧ 𝑴𝑗ó𝑙𝑘𝑖𝑗ö𝑛(𝑥, 𝑦) → 𝑚𝑒𝑔𝑓𝑜𝑔𝑗𝑎𝑣é𝑑𝑒𝑛𝑖(𝑥, 𝑦)
Nem monoton logikában abból, hogy egy B állítás konzisztens mind az A, mind pedig a ~A állítással, hihetjük, hogy a B állítás igaz, vagyis: 𝐴 ∧ 𝑀𝐵 → 𝐵 é𝑠 ~𝐴 ∧ 𝑀𝐵 → á𝑙𝑙í𝑡á𝑠𝑜𝑘𝑏ó𝑙 𝑘ö𝑣. : 𝑀𝐵 → 𝐵
Az M modális operátor szemantikája azonban nem tiszta. Több kísérlet történt ennek kiküszöbölésére, ilyen pl. az alábbi default logika. Reiter default logikájában a modális operátor jele a „:”. A default következtetés szabálya: 𝐴: 𝐵 → 𝐶
amit úgy olvasunk ki, hogy „ha A bizonyítható, és konzisztens feltennünk, hogy B igaz, akkor ebből következik, hogy a C is igaz”. Példa: ö𝑟ö𝑘ö𝑠(𝑥): ~𝑎𝑙𝑖𝑏𝑖𝑗𝑒𝑣𝑎𝑛(𝑥) → 𝑔𝑦𝑎𝑛ú𝑠í𝑡𝑜𝑡𝑡(𝑥)
Kiolvasva: „ha x az áldozat örököse, és konzisztens feltennünk (azaz kizáró ok híján feltételezhető), hogy nincs alibije, akkor ő gyanúsított. Az IF-THEN szabályokat – a default következtetés igénye szerint – ki szokták egészíteni egy „hacsak nem” vagy „hacsak nem tételezzük fel, hogy” értelmű UNLESS-résszel. A fenti példa átírva: IF örökös(x) UNLESS alibije-van(x) THEN gyanúsított(x) Reiter a tudásbázis plauzibilis kiterjesztésének fogalmát is bevezeti, amelyen a tudásbázisnak egy megfelelő következtetési szabály alkalmazásával történő maximális konzisztens kibővítését érti (amely tehát tartalmazza az összes olyan állítást, amelyeket az adott szabály ismételt alkalmazásával a tudásbázis elemeiből egyáltalán ki lehet következtetni.) Az eddigiekben nem-monoton elméletekről volt szó. Végezetül megemlítjük az alábbi két általánosan alkalmazott nem-monoton következtetést: −
abdukció: a logika dedukciójával ellentétes irányban haladva következtet. Az egyesből következtet az általánosra, ezért – ellentétben a dedukcióval – nem garantálja a
−
következmény érvényességét. Adatok (mint okozatok) ismereteink szerinti „legjobb magyarázatának” (vagyis okának) generálásánál alkalmazzák. Az induló hipotézis felállításánál tipikusan ilyen jellegű következtetéssel dolgozik pl. az orvos. öröklődés (nem-monoton módon): ha egy objektum esetében szüleitől örökölt attribútumértékek ütköznek, akkor a legjobban megszorított, a legkevésbé általános szülőtől örökölt értéket részesíti előnyben.