Úvod do umělé inteligence –
T10: modely a ontologie
Znalostní modelování
Model: účelová abstrakce, která umožňuje snížit složitost zkoumaného předmětu tím, že se soustředí pouze na některé jeho aspekty. (Karbach, 1990)
• 60.-70. léta: expertní systémy založené na symbolických znalostech přímo převzatých od experta (transfer znalostí). Důraz na znuvupoužitelnost implementačních nástrojů (prázdné ES) • 1982: A. Newell „knowledge-level hypothesis“ - znalosti lze abstrahovat od způsobu jejich reprezentace • 1985: W. Clancey – heuristická klasifikace jako abstraktní model řady diagnostických ES
U znalostního modelu spočívá abstrakce v odhlédnutí od implementačních detailů:
• konec 80. let: první verze metodiky KADS (Wielinga, Schreiber, Breuker)
• znalosti zachyceny relativně nezávisle na odvozovacích algoritmech a symbolické reprezentaci
• nositelem znalostí může být existující
• začátek 90. let: „posun paradigmatu“ v získávání znalostí – přechod od transferu k modelování. Vznik knihoven modelů úloh a metod řešení, doménové ontologie • konec 90. let: snaha o adaptaci technik znalostního modelování pro potřeby znalostního managementu v organizacích
znalostní systém, plánovaný znalostní systém i lidský expert
1/23
Úvod do umělé inteligence –
T10: modely a ontologie
Historie znalostního modelování
Podobor znalostního inženýrství, který se zabývá tvorbou znalostních modelů spíše než finální implementací znalostních systémů
P. Berka, 2007
Úvod do umělé inteligence –
T10: modely a ontologie
P. Berka, 2007
Úvod do umělé inteligence –
2/23
T10: modely a ontologie
1. podpora fáze analýzy: • Model procesů, zachycující dekompozici procesů dané úlohy, tok informací mezi nimi, a přiřazení procesů a prvků datové základny (včetně znalostí) jednotlivým agentům (softwarovým i lidským).
Metodika KADS Počátkem 90. let jako výzkumný projekt na universitě v Amsterodamu. Nyní de facto evropský standard pro tvorbu znalostních systémů. Důraz na srozumitelnost a opakovanou využitelnost
• Model kooperace, který se zaměřuje především na komunikaci mezi uživatelem a systémem, případně i mezi jednotlivými moduly systému navzájem. • Model expertizy (tj. expertních znalostí), jehož tvorba je úzce spojena s procesem získávání znalostí.
2. podpora fáze projektování: • Model globální architektury, specifikující subsystémy, rozhraní mezi nimi a globální funkce. • Funkční model, realizující dekompozici funkcí jednotlivých subsystémů. • Behaviorální model, přiřazující funkcím projekční prvky. • Fyzický model, kombinující projekční prvky do detailního návrhu systému. P. Berka, 2007
3/23
P. Berka, 2007
4/23
Úvod do umělé inteligence –
T10: modely a ontologie
KADS – Model expertízy Doménová vrstva (domain layer) zachycuje pojmy, fakta, vztahy atp. relevantní k dané problémové oblasti (doméně). Znalosti jsou zde zachyceny bez ohledu na způsob použití k usuzování - proto se někdy mluví o úrovni statických znalostí.
Úvod do umělé inteligence –
T10: modely a ontologie
Strategická vrstva (strategy layer) zachycuje strategické rozhodování experta, např. výběr z možných hierarchií úloh, jejich dynamické rozvrhování atd. Vyskytuje se zpravidla jen u velmi složitých a rozsáhlých projektů.
Inferenční vrstva (inference layer) zachycuje abstraktní inference, které je MOŽNÉ na doménové znalosti aplikovat, a vazby mezi nimi (deklarativní stránka odvozování). Prostřednictvím tzv. doménových rolí je propojena s doménovou vrstvou. Úlohová vrstva (task layer) specifikuje, které inference se pro danou úlohu SKUTEČNĚ POUŽIJÍ (procedurální stránka odvozování). Každá inference z inferenční vrstvy je chápána jako primitivní úloha; ty jsou pak seskupovány do hierarchií úloh, a spojovány procedurálními operacemi, jako je např. sekvence, selekce nebo iterace. P. Berka, 2007
5/23
Úvod do umělé inteligence –
T10: modely a ontologie
Novější podoba této metodiky, CommonKADS, pracuje pouze se třemi vrstvami: doménovou, inferenční a úlohovou. (Schreiber a kol., 1999)
P. Berka, 2007
6/23
Úvod do umělé inteligence –
Doménové znalosti
T10: modely a ontologie
Inferenční znalosti
1. Doménové schéma obsahuje obecné třídy objektů: objekty, relace, atributy a tzv, typy pravidel
1. Inference vyjadřují elementární odvozovací procesy
2. Báze znalostí obsahuje konkrétní znalosti, tj. instance objektů, jejichž třídy jsou definovány doménovým schématem
2. Znalostní role vyjadřují abstraktní vstupy a výstupy inferencí; mapují se na prvky doménového schématu
Báze znalostí nemusí obsahovat zdaleka všechny znalosti potřebné pro fungování budoucího implementovaného systému, ale jen takové, které byly zjištěny již ve fázi analýzy.
Inferenčná struktura je obdobou diagramu datových toků (DFD), místo doménově závislých datových prvků jsou použity doménově nezávislé, abstraktní role Znalostní role jsou rozděleny na dynamické, které odpovídají znalostem/datům o řešeném případu (transformují se v průběhu odvozování), a statické, které odpovídají „trvalým“ znalostem.
P. Berka, 2007
7/23
P. Berka, 2007
8/23
Úvod do umělé inteligence –
T10: modely a ontologie
Úvod do umělé inteligence –
Úlohové znalosti
T10: modely a ontologie
KADS - GTM Generic Task Model (GTM) je jakýmsi „polotovarem“ modelu expertizy, zahrnujícím inferenční a úlohovou vrstvu, které jsou doménově nezávislé.
1. Úloha popsána pouze na úrovni vstupu a výstupu (co se má řešit, nikoliv jak)
Knihovna GTM má hierarchickou strukturu, která koresponduje s typy úloh pro expertní systémy
2. Metoda řešení úlohy jako procedurální popis řešení úlohy (hierarchický rozklad na podúlohy a procedurální řídící struktura)
Jedné úloze může odpovídat několik metod řešení. Elementárními prvky metody řešení úlohy jsou inference z inferenční vrstvy.
P. Berka, 2007
Úvod do umělé inteligence –
9/23
T10: modely a ontologie
P. Berka, 2007
Úvod do umělé inteligence –
KADS - Heuristická klasifikace
/* Dopředné usuzování */ Heuristická klasifikace (+ Pozorovatelné, - Řešení) :získání dat a jejich vložení do Pozorovatelných abstrahuje (+ Pozorovatelné, - Proměnné) přiřazuje (+ Proměnné, - Abstraktní řešení) specializuje (+ Abstraktní řešení, - Řešení)
10/23
T10: modely a ontologie
Přínosy znalostních modelů •
Urychlení a usnadnění vývoje znalostní aplikace (využití existujících znovupoužitelných modelů)
•
Dokumentace vývoje znalostní aplikace vedoucí k její lepší udržovatelnosti
•
Usnadnění komunikace mezi tvůrci (i navzájem) a uživateli aplikace
•
Zabezpečení interoperability mezi softwarovými komponentami aplikace
/* Zpětné usuzování */ Heuristická klasifikace (+ Pozorovatelné, - Řešení) :specializuje (- Abstraktní řešení, - Řešení) přiřazuje (- Proměnné, - Abstraktní řešení) abstrahuje (- Pozorovatelné, - Proměnné) získání dat a jejich vložení do Pozorovatelných P. Berka, 2007
11/23
P. Berka, 2007
12/23
Úvod do umělé inteligence –
T10: modely a ontologie
Úvod do umělé inteligence –
Znalostní ontologie
Typy ontologií
Ontologie je explicitní dohoda o sdílené konceptualizaci.
Podle předmětu konceptualizace
(T. Gruber, 1993) • Explicitní: zaznamenána pomocí přirozeného nebo formálního jazyka • Konceptualizace: úroveň pojmů (tříd) spíše než objektů (instancí) • Sdílená: není určena jen pro vlastní potřebu
Výhody ontologií: • usnadnění komunikace mezi lidmi a organizacemi díky jasnému vymezení používaných pojmů, • usnadnění spolupráce počítačových systémů – ontologie zde hraje roli výměnného formátu znalostí, • usnadnění vývoje znalostní aplikace – ontologie zde plní roli základní, koceptuální vrstvy báze znalostí. P. Berka, 2007
13/23
Úvod do umělé inteligence –
T10: modely a ontologie
T10: modely a ontologie
• Doménové: pro znalosti z nějaké věcné domény (např. UMLS, Enterprise Ontology) • Úlohové: modely řešení úloh (např. KADS) • Generické: široký, obecný záběr (např. „upperlevel models“ v rámci CyC nebo ON9) • Aplikační: pro konkrétní aplikaci (nejsou přímo reusabilní), obsahují i doménovou a úlohovou složku • Reprezentační: pro reprezentaci znalosti i samotných ontologií (meta-ontologie)
Podle reprezentace • Terminologické: lexikony, tezaury • Informační: databázová konceptuální schémata • Znalostní
Podle míry formalizace: neformální (volný text), semiformální (strukturovaný text), formální P. Berka, 2007
14/23
Úvod do umělé inteligence –
T10: modely a ontologie
Enterprise Ontology
Wordnet Lexikální databáze obsahující • synonymické řady - synsety - tvořené slovy, která mají v určitém kontextu totožný význam • sémantické vazby jako např. o hypero-/hyponymické vztahy (is_a) o vztahy meronymie mezi částí a celkem (part_of)
Doménová neformální ontologie popisující organizační strukturu a činnosti podniku jako celku j i jeho částí LEGAL OWNERSHIP: a Relationship between a LEGAL ENTITY and an Entity whereby the LEGAL ENTITY has certain rights with respekt to the Entity. Note: The Entity in such a Relationship will be said to be „LEGALLY OWNED“.
VENDOR: the Role of the LEGAL ENTITY who • Offers a PRODUCT, FOR SALE for an ASKING PRICE; or • Agrees to exchange a PRODUCT for SALE PRICE in a SALE. Note: From the VENDOR’s perspective, the exchange is reffered to as “selling”. P. Berka, 2007
15/23
P. Berka, 2007
16/23
Úvod do umělé inteligence –
T10: modely a ontologie
Úvod do umělé inteligence –
CyC
T10: modely a ontologie
Open CyC
Project CyC (Encyclopedia) zahájený již v roce 1984 usiluje o shromáždění všeobecných (common sense) znalostí, které by ve znalostních systémech fungovaly komplementárně ke specializovaným znalostem experta.
“Open” verze projektu CyC dostupná na http://www.opencyc.org
Generická, formální ontologie. Použitý jazyk CyCL je založen na predikátovém počtu prvního řádu (#%ist #%LargeCorpInternalsMt #%ForAll x (#%HumanResourcesDepartment #%allInstances (#%actsInCapacity x #%mediatorInProcesses #%EmployeeHiring #%MainFunction)))
P. Berka, 2007
17/23
Úvod do umělé inteligence –
T10: modely a ontologie
Knihovna ON9
Úvod do umělé inteligence –
18/23
T10: modely a ontologie
Foundational Model of Anatomy
Ontologie „Biological functions“ – doménová formální ontologie využívající jazyk Ontolingua
P. Berka, 2007
P. Berka, 2007
19/23
(FMA) je ontologie vyvinutá na Universitě ve Washingtonu v rámci projektu Digital Anatomist. Ontologie obsahuje symbolicky reprezentované (s využitím rámců) deklarativní znalosti o lidské anatonomii.
P. Berka, 2007
20/23
Úvod do umělé inteligence –
T10: modely a ontologie
Gene ontology
Úvod do umělé inteligence –
T10: modely a ontologie
Unified Medical Language System
(GO) je tvořena slovníkem termínů z oblasti molekulární biologie. Ontologie se týká tří základních témat: molekulárních funkcí (7459 termínů), biologických procesů (12122 termínů) a buněčných součástí (1818 termínů). Termíny v ontologii jsou spolu svázány dvěma typy relací: is_a (např. nuclear chromosome is_a chromosome) a part_of (např nucleus part_of cell).
(UMLS) je ontologie zachycující obecné koncepty a znalosti týkající se oblasti medicíny vyvíjená v National Library of Medicine, National Institutes of Health (NLM NIH) ve Spojených státech. 1. Metatezaurus je víceúčelová, vícejazyčná slovníková databáze, která obsahuje informace o biomedicínských a zdravotnických konceptech, jejich různých názvech a relacích mezi nimi. 2. Sémantická síť je tvořena (1) sémantickými typy, které umožňují konzistentní kategorizaci konceptů reprerzentovaných v metatezauru, a (2) množinou relací, které existují mezi sémantickými typy. Hlavní skupiny sémantických typů zahrnují organismus, anatomickou strukturu, biologickou funkci, chemikálie, události, fyzické objekty, koncepty a ideje. 3. SPECIALIST Lexicon byl vytvořen jako obecný anglický lexikon zahrnující mnoho biomedicínských pojmů i běžných anglických slov
P. Berka, 2007
21/23
Úvod do umělé inteligence –
T10: modely a ontologie
Sémantická síť UMLS
P. Berka, 2007
23/23
P. Berka, 2007
22/23