Masarykova univerzita v Brně Filozofická fakulta Ústav české literatury a knihovnictví Kabinet informační studií a knihovnictví
MAGISTERSKÁ DIPLOMOVÁ PRÁCE
2014
KRISTÝNA SVOBODOVÁ
Masarykova univerzita v Brně Filozofická fakulta Ústav české literatury a knihovnictví Kabinet informační studií a knihovnictví
Bc. Kristýna Svobodová
TOPIC MAPS
Magisterská diplomová práce
Vedoucí práce: Mgr. Tomáš Bouda 2014
Prohlášení Prohlašuji, že jsem diplomovou práci vypracovala samostatně s využitím uvedených pramenů a literatury. …………………………………………….. Podpis autora práce
Poděkování Ráda bych poděkovala vedoucímu práce Mgr. Tomášovi Boudovi za podnětné rady, připomínky a ochotu při vedení práce. Vedení společnosti IBA CZ, s.r.o. za svolení využít některé z interních informací v aplikační části práce. Svým blízkým za podporu a trpělivost během mého studia.
Bibliografický záznam SVOBODOVÁ, Kristýna. Topic Maps. Brno, 2014. 98 s. Diplomová práce. Masarykova univerzita, Filozofická fakulta, Kabinet informačních studií a knihovnictví. Vedoucí práce Mgr. Tomáš Bouda.
Anotace Diplomová práce „Topic Maps“ se zabývá stejnojmenným standardem pro reprezentaci znalostí. První část práce je věnována přímo reprezentaci znalostí a pojmům s ní spojeným. Druhá část práce tvoří jádro práce, seznamuje čtenáře se standardem Topic Maps, definuje, jak Topic Maps fungují a kde je možné jich využít. Ve třetí části práce se setkáme s konkrétním příkladem mapy, pro níž jako podklady využijeme informace ohledně organizační struktury a interních systémů využívaných ve společnosti IBA CZ, s.r.o.
Klíčová slova Topic Maps, tématové mapy (mapy témat), námětové mapy (mapy námětů), reprezentace znalostí, organizace znalostí, standardy pro reprezentaci znalostí, témata, znalosti, informace, sémantický web, RDF, XTM.
Annotation Diploma thesis „Topic Maps" is concerned with an eponymous standard for the knowledge representation. The first part of the thesis is devoted just to the knowledge representation and to the terms that are connected with it. The second part of the thesis, which is the core of the thesis, acquaints the reader with the standard Topic Maps , it defines how Topic Maps work and how we can use them. In the thirth part of the thesis ve will work with the concrete example of the map that will be based on information about an organization structure and internal systems that are used in the company IBA CZ, s.r.o.
Keywords Topic Maps, knowledge representation, knowledge organization, knowledge representation standards, topics, knowleges, information, semantic web, RDF, XTM.
Obsah Úvod ......................................................................................................................................... 10 I. Reprezentace znalostí .................................................................................................... 12 1. Co je to „znalost“ ................................................................................................................... 12 2. Co je to „reprezentace znalostí“ a pojmy s ní související ...................................... 14 2.1 Role ................................................................................................................................. 20 2.2 Objekty .......................................................................................................................... 21 3. Způsoby reprezentace znalostí ....................................................................................... 21 3.1 Pojmová indexace ..................................................................................................... 21 3.2 Pojmové mapování ................................................................................................... 22 3.3 Hypertext ..................................................................................................................... 22 3.4 Informační modelování .......................................................................................... 23 3.5 Sémantické sítě .......................................................................................................... 23 4. Formalismy pro reprezentaci znalostí ......................................................................... 25 4.1 Rámce ............................................................................................................................ 25 4.2 Deskriptivní logika ................................................................................................... 26 4.3 Konceptuální grafy ................................................................................................... 27 4.4 Fuzzy logika ................................................................................................................. 28 5. Standardy pro reprezentaci znalostí ............................................................................ 28 5.1 RDF – Resource Description Framework ........................................................ 28 5.2 RDF Schema................................................................................................................. 29 5.3 OWL – Webový ontologický jazyk ...................................................................... 30 5.4 XTM – XML Topic Maps .......................................................................................... 31 II. Topic Maps ........................................................................................................................ 32 6. Definování pojmu Topic Maps ........................................................................................ 32 7. Historie a vývoj standardu Topic Maps ....................................................................... 35 8. Základní prvky modelu Topic Maps.............................................................................. 36 8.1 Témata........................................................................................................................... 36 8.2 Výskyty .......................................................................................................................... 39 8.3 Vztahy ............................................................................................................................ 39 8.4 Typy ................................................................................................................................ 41
8.5 Obory platnosti .......................................................................................................... 41 8.6 Reifikace ....................................................................................................................... 42 9. Jak Topic Maps fungují ....................................................................................................... 43 9.1 Datový model Topic Maps ..................................................................................... 43 9.2 Topic Maps podle ISO 13250 ................................................................................ 44 10. Oblasti užití Topic Maps.................................................................................................. 49 10.1 Využití Topic Maps v e-learningu..................................................................... 49 10.2 Využití Topic Maps v lékařství .......................................................................... 51 11. Sémantický web vs. Topic Maps .................................................................................. 52 11.1 Co je Sémantický web ........................................................................................... 52 11.2 Srovnání technologií RDF a Topic Maps ........................................................ 55 11.3 Shrnutí ........................................................................................................................ 58 12. Výhody a nevýhody spojené s využíváním Topic Maps .................................... 59 12.1 Výhody ........................................................................................................................ 59 12.2 Nevýhody ................................................................................................................... 62 13. Možnosti tvorby Topic Maps......................................................................................... 66 13.1 Slučování Topic Maps ........................................................................................... 66 13.2 Mapování z RDF do Topic Maps........................................................................ 67 13.3 Automatická generace Topic Maps z XML dokumentů ............................ 68 13.4 Vzájemná konstrukce Topic Maps jinými uživateli: Kolaborační přístup .................................................................................................................................. 68 13.5 Topic Maps Learning ............................................................................................. 69 14. Nástroje pro práci s Topic Maps .................................................................................. 70 14.1 Ontopia ....................................................................................................................... 70 14.2 TM4J ............................................................................................................................ 71 14.3 NetworkedPlanet.................................................................................................... 72 14.4 Wandora .................................................................................................................... 73 III. Aplikační část ................................................................................................................. 74 15. Úvod do aplikační části.................................................................................................... 74 16. Metodologie ......................................................................................................................... 74 17. Představení společnosti IBA CZ ................................................................................... 76 18. Organizační struktura a procesy ve společnosti IBA CZ.................................... 76
18.1 Organizační struktura ........................................................................................... 77 18.2 Informační systémy využívané ve společnosti ........................................... 79 19. Aplikace Topic Map na organizační strukturu a interní systémy ve společnosti IBA CZ ........................................................................................................... 80 20. Závěry aplikační části ...................................................................................................... 87 Závěr ........................................................................................................................................ 88 Použité zdroje ....................................................................................................................... 88
Úvod Žijeme v informační době, kdy schopnost efektivní práce s informacemi a znalostmi je pro každého z nás jednou z klíčových vlastností vedoucích k úspěchům. Rozvoj informačních a komunikačních technologií vzrůstá v posledních desetiletích extrémním tempem a přímo úměrně s využívaností těchto technologií vzrůstá také množství informací, které se k nám touto cestou dostávají. Informace a z nich vedoucí poznání měly pro člověka obrovskou cenu již od počátků lidstva. V dnešní době je možnost přístupu k informacím podstatně snazší než kdy dříve, zároveň je však velmi snadné se v rozsáhlé změti informací, z nichž jen malé množství má pro nás skutečný význam, zcela zamotat a ztratit. Informace jsou pro nás velmi důležité především proto, že vedou ke vzniku znalostí. Znalosti pro nás již nejsou pouhá fakta. Znalosti nám dávají povědomí o určité problematice, o jejím kontextu, o způsobech propojení jednotlivých prvků, s nimiž se v této problematice můžeme setkat. Znalosti nám dávají možnost porozumět věcem, o nichž se dozvídáme. Znalosti jsou pro nás zkrátka velice důležité, mají z velké části podíl na naše společenské postavení a celkově na to, jak nás ostatní vnímají a jakým způsobem na nás pohlížejí. Jsou něčím, co je, bylo, a vždy bude velmi ceněné, neboť veškerý pokrok je právě prací lidí, kteří dokáží svých znalostí využít a nechat se tak posunovat dále. Zatímco každý hmotný výrobek bude jednou nahrazen něčím lepším a ztratí tak své kupce, což povede k jeho zániku, schopnost efektivního předávání znalostí je něčím, po čem poptávka nikdy nepoklesne, právě naopak. Každou jednu znalost, kterou člověk má, musí nejdříve nějak získat. Jelikož jedním z dalších výrazných charakteristických prvků pro dnešní moderní dobu je „rychlost“, není divu, že se touha po rychlém získání toho, co chceme, týká také získávání znalostí. Autoři knih slibujících, že čtenáře něco naučí „snadno a rychle“, vydělávají na svých titulech velké množství peněz. Jak to tedy udělat, aby bylo možné předávat znalosti efektivně a zároveň rychle, je to vůbec možné? Pokud se podíváme do knih, spoléhají většinou jejich autoři na to, že čtenáři získají znalosti rychleji díky přehledné struktuře textu s využitím četných tabulek, obrázků, apod. Technologie však nabízí podstatně širší možnosti. Uživatel pak 10
může získávat znalosti z textových, obrázkových či audiovizuálních zdrojů, může se rychle pohybovat mezi různými zdroji za použití linků, a pokud něčemu nerozumí, může si vše rychle dohledat. Zde se však setkáváme s již zmíněným problémem, že informací, s nimiž se tento uživatel setká, je mnoho, jejich souvislosti nejsou vždy jasné a není tudíž možné je všechny správně zpracovat. Přesto nabízí technologie jedinečné možnosti, kterých je žádoucí využít. Tento fakt vedl ke vzniku různých forem reprezentace znalostí prostřednictvím informačních a komunikačních technologií. Topic Maps, o nichž bude pojednávat tato práce, jsou jen jednou z forem pro reprezentaci znalostí. Ačkoli se nejedná o žádnou novinku, u nás se s touto formou reprezentace znalostí prakticky nesetkáme, není tedy možné s jistotou určit, jak moc efektivní by pro rychlé získání znalostí mohly Topic Maps být. Faktem však je, že tvorba a schopnost naučit se orientovat v Topic Maps nevyžaduje žádné náročnější schopnosti, domnívám se tedy, že by bylo dobré dát Topic Maps alespoň šanci – podívat se, jak fungují, co nám mohou nabídnout, kde je možné jich využít apod. Poté se již každý může rozhodnout sám, zda se jedná o formu, která je mu blízká, nebo zda preferuje, když jsou mu znalosti o určité problematice reprezentovány jiným způsobem. Tato práce bude tvořena třemi hlavními částmi. V první části se seznámíme s tématem „Reprezentace znalostí“ obecně. Druhou a nejrozšířenější část práce zasvětíme již tématu „Topic Maps“, uvidíme, co stálo za vznikem tohoto standardu, jakými prvky jsou Topic Maps tvořeny a jak fungují, nebo kde a jak je můžeme využít. Poslední část práce je aplikační – aplikujeme model Topic Maps pro ukázku na konkrétní příklad a to na organizační strukturu a na interní systémy využívané ve společnosti IBA CZ, s.r.o.
11
I. Reprezentace znalostí 1. Co je to „znalost“ Předtím, než začneme mluvit o reprezentaci znalostí, měli bychom si vymezit, co vlastně pojem „znalost“ znamená. Je samozřejmé, že nejde o žádný nový pojem, nicméně dnešní informační doba má na vysvětlování a chápání některých termínů velký vliv, přičemž právě pojem znalost je skloňován velmi často. Proto se tedy nejdříve ze všeho podíváme, jak je vlastně znalost definována v různých zdrojích. V knize „Moderní přístupy k managementu“ je znalost vnímána jako surovina a důležitý pracovní nástroj znalostního pracovníka. Setkáme se zde se dvěma následujícími definicemi: „Znalost je schopnost využít své vzdělání, zkušenosti, hodnoty a odbornost jako rámec pro vyhodnocení dat, informací a jiných zkušeností k výběru odpovědi na danou situaci.“1 „Znalost je proměnlivá směs uspořádaných zkušeností, hodnot, kontextových informací z pohledu odborníka, která stanovuje pravidla pro hodnocení a začleňování nových zkušeností a informací. Znalost vzniká a je využívaná v hlavách znalostních pracovníků. V organizacích je často obsažena nejen v dokumentech nebo databázích, ale také v organizačních pravidlech, procesech, postupech a normách.“2 Kniha „Expertní inženýrství v systémovém pojetí“ zmiňuje, že znalost je obsahově bohatší než pojem „poznatek“. Zde uvedená definice znalosti pak zní následovně: „Znalost je v lidském mozku jedince zpracovaný poznatek o konkrétní entitě v určité oblasti zájmu, doplněný existujícími podstatnými aktuálními skutečnostmi o této entitě, přičemž jedinec má vše natolik osvojené, že to může využívat pro realizaci svých činností.“3 MLÁDKOVÁ, Ludmila. Moderní přístupy k managementu: tacitní znalost a jak ji řídit. Vyd. 1. Praha: C. H. Beck, 2005, s. 8. ISBN 80-7179-310-8. 2 Tamtéž. 3 JANÍČEK, Přemysl a Jiří MAREK. Expertní inženýrství v systémovém pojetí. 1. vyd. Praha: Grada, 2013, s. 52. Expert (Grada). ISBN 978-80-247-4127-7. 1
12
V další knize zabývající se přímo managementem znalostí je pak znalost vnímána jako „proměnlivá směs uspořádaných zkušeností, hodnot, kontextových informací z pohledu odborníka, která stanovuje pravidla pro hodnocení a začleňování nových zkušeností a informací.“4 Abychom se trochu odpoutali od pojetí znalosti z hlediska jejího vztahu k managementu či informačním technologiím, můžeme nakonec zmínit také definici z „České terminologické databáze knihovnictví a informační vědy“, kde je znalost definována jako „schopnost člověka nebo jakéhokoli jiného inteligentního systému uchovávat, komunikovat a zpracovávat informace do systematicky a hierarchicky uspořádaných znalostních struktur. Znalost je charakterizována schopností abstrakce a generalizace dat a informací.“5 Při definování pojmu znalost se často setkáváme s dalším příbuzným pojmem – „informace“. Jaký je tedy přesně vztah mezi znalostí a informací? Možných odpovědí na tuto otázku je více, nejčastěji se však setkáme s odpověďmi podobnými, jako je tato: „Zaznamenáním dat pomocí symbolů, které jim přisoudí určitý význam, vznikají informace. Jejich kontext je již specifičtější a implikují svůj účel. Znalost pak představuje interpretaci informace tak, aby mohla být uvedena do různých souvislostí, tj. použitelná v různých pracovních situacích.“6 Znalosti se tedy vytváří z informací. Toto vytváření se uskutečňuje čtyřmi různými způsoby:7 srovnáváním – srovnáváme přijaté informace s tím, co již známe z podobných či jiných situací hodnocením souvislostí – hodnotíme význam informace pro rozhodování a činnost spojováním – hledáme vztah ke znalostem, které již my nebo jiní lidé mají konverzací – hledáme, co si jiní lidé o informaci myslí Základní jednotkou jsou tedy data – skutečnosti bez konkrétního významu. Z dat se posuneme k informacím, od nichž se některým z výše jmenovaných TRUNEČEK, Jan. Management znalostí. Vyd. 1. Praha: C. H. Beck, 2004, s. 14. ISBN 80-7179-884-3. JONÁK, Zdeněk. Znalost. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2014-10-13]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000000498&local_base=KTD. 6 DVOŘÁKOVÁ, Zuzana. Management lidských zdrojů. Vyd. 1. Praha: C. H. Beck, 2007, s. 312. Beckovy ekonomické učebnice. ISBN 978-80-7179-893-4. 7 MLÁDKOVÁ, Ludmila. Moderní přístupy k managementu: tacitní znalost a jak ji řídit. Vyd. 1. Praha: C. H. Beck, 2005, s. 8. ISBN 80-7179-310-8. 4 5
13
způsobů dostaneme až ke znalostem. Samotné znalosti pak můžeme rozdělit na tři hlavní typy:8 Explicitní znalost – formalizovaná nebo dokumentovaná znalost, většinou je dobře strukturovaná a snadno přenositelná. Zpracovávána je převážně pomocí ICT. Příkladem takové znalosti jsou dokumenty, manuály, počítačové kódy apod. Implicitní znalost – znalost je uložena v hlavách pracovníků, odtud však může být kdykoli převedena do explicitní formy. Jako příklad můžeme zmínit znalost procesu a jeho omezujících podmínek v hlavě vlastníka procesu apod. Tacitní (neformulovaná) znalost – znalost je rovněž uložena v hlavách pracovníků, nelze ji však snadno převést do explicitní formy a formalizovat ji či dokumentovat. Jde o znalosti expertů z určitých oblastí, dále o znalosti získané zkušenostmi apod. Z předchozích odstavců jsme se tedy dozvěděli, co jsou znalosti. Není samozřejmě divu, že jsou znalosti v dnešní době velmi cenné a snaha o zanesení znalostí (včetně tacitních) do informačních systémů a do technologií celkově je veliká. Jakým způsobem však znalosti, které, jak jsme se dozvěděli, vznikají v hlavách jednotlivců, prezentovat prostřednictvím technologií, na to se budeme snažit nalézt odpověď v další části této práce.
2. Co je to „reprezentace znalostí“ a pojmy s ní související Po seznámení se s pojmem znalost se nyní můžeme zaměřit na samotnou „reprezentaci znalostí“. Potřeba reprezentace znalostí byla pociťována již od počátečních ideí ohledně vývoje inteligentních systémů. Tato inteligence požaduje vlastnictví znalostí, a jelikož jsou tyto znalosti získávány různými způsoby od lidí a uloženy v paměti za využití určitých reprezentačních technik, můžeme si odvodit,
BUREŠ, Vladimír. Znalostní management a proces jeho zavádění: průvodce pro praxi. 1. vyd. Praha: Grada, 2007, s. 29. ISBN 978-80-247-1978-8. 8
14
že reprezentace znalostí jednoduše zachycuje kritický aspekt inteligenční aktivity pro využití v počítačích.9 Reprezentaci znalostí tedy lze definovat jako „aplikaci logiky a ontologie pro úlohy vytváření vypočitatelných modelů pro určitou doménu.“10 V předešlé definici se již setkáváme s pojmem „ontologie“, který v definicích reprezentace znalostí figuruje poměrně často. Proto se u něj na okamžik pozastavíme a podíváme se na něj blíže. Samotný pojem ontologie rozhodně není pojmem novým. Setkáme se s ním již v antické filozofii, kdy se stal označením pro nauku o „bytí“ a zkoumání toho, co objektivně existuje. Ve znalostním inženýrství se setkáme samozřejmě s jiným pojetím pojmu, příkladem může být stručná definice ontologie, která byla všeobecně přijata: „Ontologie je explicitní dohoda o sdílené konceptualizaci.“11 V této definici jsou obsaženy tři podstatné znaky ontologie v chápání znalostního inženýrství:12 1. Ontologie tvoří konceptuální popis znalostí – součástí ontologie jsou pojmy a vztahy mezi nimi, nikoli konkrétní doménové znalosti. Příklad: v medicíně máme pojmy jako „diagnóza“, „symptom“, „syndrom“ a znalost, že „symptomy lze sdružovat do symptomů“. Neznáme však konkrétní názvy diagnóz, symptomů a syndromů. 2. Ontologie by měla být sdílitelná – ontologie není vázána na jedinou aplikaci. Dochází k určité standardizaci podoby ontologie, účastníci dohody o této podobě na sebe berou „ontologický závazek“ (ontology commitment), čímž se zavazují ke shodnosti s příslušnou ontologií na syntaktické i sémantické úrovni. KUMAR, Ela. Artificial Intelligence. New Delhi, India: I.K. International Publishing House Pvt. Ltd., 2008, s. 172. ISBN 978-81-906566-6-5. 10 Knowledge representation is „the application of logic and ontology to the task of constructing computable models for some domain." SOWA, John F. Knowledge representation: logical, philosophical, and computational foundations. Pacific Grove: Brooks/Cole, 2000, xii. ISBN 05-349-4965-7. 11 SKLENÁK, Vilém. Data, informace, znalosti a Internet. Vyd. 1. V Praze: C.H. Beck, 2001, s. 142. C.H. Beck pro praxi. ISBN 80-7179-409-0. 12 SKLENÁK, Vilém. Data, informace, znalosti a Internet. Vyd. 1. V Praze: C.H. Beck, 2001, s. 142-143. C.H. Beck pro praxi. ISBN 80-7179-409-0. 9
15
3. Ontologie je definovaná explicitně – nejde tedy o ústní dohodu, nýbrž o informace zachycené v určitém dokumentu pomocí konkrétního jazyka. Z obecných definic si můžeme odvodit, že ontologie je určitým souborem pravidel, která jsou standardizována a v rámci dohod dodržována. Co však znamená ontologie z hlediska reprezentace znalostí? „Ontologie je základní formou reprezentace znalostí o reálném světě. Z hlediska počítačové vědy ontologie definuje soubor reprezentačních prvků, se kterými modelovat oblast znalostí nebo diskursu. Reprezentační prvky ontologie obsahují třídy, atributy (vlastnosti) a vztahy mezi třídami. Jsou využívány pro modelování konkrétních aplikačních domén.“13 Znalosti mohou být reprezentovány mnoha různými způsoby, což znamená, že se můžeme setkat také s mnoha různými podobami ontologií. Jako jednoduchý příklad si můžeme uvést verbální reprezentaci znalostních bází14. Znalostní báze – tak jako jakékoli informace – mohou být samozřejmě reprezentovány verbálně. To vyžaduje určitou terminologii z dané oblasti, která je speciálně určená pro reprezentaci znalostí tak, že verbální reprezentace znalostní báze z určité oblasti využívající tuto terminologii reprezentuje danou znalost adekvátně. Ontologii definující význam této terminologie budeme nazývat znalostní ontologie. Ontologii definující význam termínů pro situační reprezentaci budeme nazývat ontologie reality. V tomto konkrétním případě tedy doménová ontologie sestává ze dvou vzájemně propojených ontologií. Jako příklad bychom si tu mohli uvést právě ontologii medicínských diagnostik.15
„Ontology is a fundamental form of knowledge representation about the real world. In the computer science perspective, ontology defines a set of representational primitives with which to model a domain of knowledge or discourse. The representational primitives of the ontology contain classes, attributes (properties) and relationships between classes. They are used to model knowledge of particular application domains.“ LEE, Raymond S. T., Edward L. Y. LIM a James N. K. LIU. Knowledge seeker ontology modelling for information search and management: a compendium. Berlin: Springer, 2011, s. 7. ISBN 978-3642179-167. 14 Báze znalostí – „množina datových struktur, které představují vědomosti převzaté od experta. Tyto vědomosti jsou vyjádřeny v takové podobě, aby s nimi řídící mechanismus dokázal manipulovat. Charakterizují všeobecné a specifické poznatky o dané oblasti a způsobech řešení problémů. V procesu řešení problému se tato báze nemění.“ JANÍČEK, Přemysl a Jiří MAREK. Expertní inženýrství v systémovém pojetí. 1. vyd. Praha: Grada, 2013, s. 188. Expert (Grada). ISBN 978-80-247-4127-7. 15 Knowledge processing and data analysis: first International Conference, KONT 2007, Novosibirsk, Russia, September 14-16, 2007 and First International Conference, KPP 2007,Darmstadt, Germany, September 28-30, 2007. revised selected papers. 1st ed. New York: Springer, 2011, s. 130. ISBN 3642221394. 13
16
Po osvětlení pojmu ontologie se nyní již vraťme zpět k reprezentaci znalostí. Obecný pohled na reprezentaci znalostí může být shrnut v pěti základních principech:16 1. Reprezentace znalostí jako náhrada – zastupuje samotnou věc (fyzický objekt, událost a vztah) za účelem uvědomění si jejího postavení ve světě. 2. Reprezentace znalostí jako soubor ontologických vazeb – ontologie popisující existence, kategorie nebo klasifikační systémy stran aplikační domény. 3. Reprezentace znalostí jako dílčí teorie inteligentního rozhodování – teorie reprezentace, která podporuje rozhodování o věcech v aplikační doméně. Určitý princip nebo výpočetní logika mohou být definovány pro inteligentní rozhodování. 4. Reprezentace znalostí jako prostředek pro efektivní vypočítávání – jiné než logicky reprezentované znalosti. Ty také musí být zakódovány v určitém formátu, jazyce, který umožňuje počítači jejich efektivní zpracování. 5. Reprezentace znalostí jako prostředek lidského vyjádření – reprezentace znalostí, která může být chápána člověkem. To jest využíváno znalostním inženýrstvím nebo experty na určitou doménu pro studování a ověření znalostí. Vidíme tedy, že na reprezentaci znalostí lze nahlížet více způsoby. Zmíněné definice a pojetí reprezentace osvětlují, jaký je hlavní smysl a co je cílem reprezentace znalostí. Pro získání konkrétnější představy je však třeba nalézt definici podrobnější. Takovou definici nalezneme opět v „České terminologické databázi knihovnictví a informační vědy“, kde je reprezentace znalostí definována jako „aplikační oblast umělé inteligence zaměřená na metody a techniky vyjádření znalostí a jejich vztahů především pro využití v bázích znalostí expertních systémů. Rozlišuje se procedurální vyjádření znalostí ve formě pravidel a neprocedurální či deklarativní vyjádření znalostí ve formě poznatků (ontologie) a LEE, Raymond S. T., Edward L. Y. LIM a James N. K. LIU. Knowledge seeker ontology modelling for information search and management: a compendium. Berlin: Springer, 2011, s. 4. ISBN 978-3642179-167. 16
17
modulární vyjádření v podobě relativně samostatných celků a vyjádření v podobě sémanticky sdružených objektů (např. hierarchií tříd). Nejčastěji používané typy jazyků pro reprezentaci znalostí jsou predikátová logika 1. řádu, produkční systémy, sémantické (asociativní) sítě a rámce.“17 V této definici se setkáváme s dalším velice významným pojmem, u něhož se na okamžik pozastavíme. Pakliže se reprezentace znalostí zaměřuje na využití znalostí v „expertních systémech“, měli bychom si vysvětlit, co vlastně expertní systémy jsou a k čemu slouží. Anglicko-český výkladový slovník softwaru definuje expertní systémy následovně: „Expertní systém je heuristický systém, který umožňuje řešení problému v dané aplikační oblasti vyvozováním závěrů z báze znalostí získané lidskou zkušeností.“18 V knize „Expertní a znalostní systémy v managementu“ pak nalezneme dvě rozsáhlejší definice:19 „Expertní systémy jsou počítačové programy, které slouží na řešení takových úloh, které jsou všeobecně považované za obtížné a jejich uspokojivé řešení může uskutečnit pouze specialista v daném oboru (expert). Využívají vhodně zakódované speciální poznatky převzaté od experta s cílem dosáhnout ve zvolené problémové oblasti kvality rozhodování na úrovni experta.“ „Expertní systém je soustava počítačových programů, díky které je počítač schopný vykonávat činnosti, které obvykle vykonává k tomu speciálně vyškolený a prakticky zkušený člověk – specialista nebo expert – v rámci své profese. Expertní systémy představují jednu z vrcholných informačních technologií, které se podařilo v oblasti informatizačních aktivit druhé poloviny minulého století dosáhnout.“
KUČEROVÁ, Helena. Reprezentace znalostí. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2014-10-14]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000000127&local_base=KTD. 18 VITOVSKÝ, Antonín. Anglicko-český výkladový slovník softwaru. 4. rozš. vyd. Praha: AV SOFTWARE, 1996, s. 160. ISBN 8090142869. 19 OLEJ, Vladimír a Pavel PETR. Expertní a znalostní systémy v managementu. Vyd. 1. Pardubice: Univerzita Pardubice, 2004, s. 19. ISBN 8071946885. 17
18
Expertní systémy se tedy používají při řešení problémů v podmínkách neurčitosti, kdy za využití rozsáhlých a hlubokých znalostí odborníků, specialistů nebo expertů v daném oboru, vyvodí možné řešení problému. Každý tradičně koncipovaný expertní systém sestává ze čtyř základních složek – báze znalostí, inferenčního mechanismu, báze faktů a modulu styku s prostředím.20 1.
Báze znalostí – již dříve zmíněná složka, která je definována jako množina datových struktur, které představují znalosti získané od experta.
2.
Řídící (inferenční) mechanismus – „jádro celého systému. Slouží na vyhodnocování báze znalostí na základě faktů obsažených v bázi údajů. Umožňuje komunikaci se všemi částmi systému a také s uživatelem. Symbolickými výpočty s využitím produktivních postupů používajících produktivních metod se napodobuje expertova způsobilost a schopnost uvažovat.“21
3.
Báze údajů (faktů) – „slouží k uchovávání, doplňování, modifikování a případně i rušení údajů souvisejících s řešeným problémem. Tyto údaje jsou přístupné i ostatním programovým modulům expertního systému. Položky báze faktů jsou konkretizací položek báze znalostí. Báze údajů se časem mění, protože data jsou proměnná.“ 22
4.
Modul styku s prostředím – zajišťuje výměnu informací mezi znalostním systémem a ostatním (softwarovým nebo fyzickým) prostředím. Nejčastější je prostředí ztělesněné uživatelem znalostního systému, jsou však případy, kdy znalostní systémy používají externí zdroje dat či programů, nebo když jsou spojeny s jinými systémy, které např. řídí. Také zde je zajištění kontaktu úlohou modulu styku s prostředím.23
LINDAY, Michal a Jozef KELEMEN. Expertné systémy pre prax. 1. vyd. Bratislava: Sofa, 1996, s. 70. ISBN 8085752328. 21 Tamtéž. 22 JANÍČEK, Přemysl a Jiří MAREK. Expertní inženýrství v systémovém pojetí. 1. vyd. Praha: Grada, 2013, s. 188 - 189. Expert (Grada). ISBN 978-80-247-4127-7. 23 LINDAY, Michal a Jozef KELEMEN. Expertné systémy pre prax. 1. vyd. Bratislava: Sofa, 1996, s. 71. ISBN 8085752328. 20
19
Expertní systémy jsou velmi důležitou podmnožinou umělé inteligence. Dokáží pracovat s neúplnými daty či domněnkami, dokáží zdůvodňovat své závěry, dokáží zajistit, že znalostí určitých expertů může být využito v obrovském množství případů. Jelikož je problematika expertních systémů populární, nalezneme celou řadu jak komerčních, tak nekomerčních nástrojů pro jejich tvorbu a podporu jejich vývoje. Na závěr této kapitoly si zmíníme ještě další významné pojmy, které jsou s reprezentací znalostí spřízněny. S těmito pojmy se setkáme také v dalších částech práce, kde se však bude jejich pojetí z hlediska Topic Maps od pojetí z hlediska reprezentace znalostí lišit.
2.1 Role Role je v reprezentaci znalostí pojmem velmi významným. „Role je technikou reprezentace znalostí a strukturou, která spřízňuje jednu či více premis (podmínek nebo předpokladů) nebo situací s jedním či více závěry (důsledky) nebo činy.“24 O jaké spříznění se jedná, můžeme vyjádřit následujícím způsobem: Pakliže (anglicky „if“) se premisa X a (anglicky „and“) premisa Y ukáží jako pravdivé, poté (anglicky „then“) z nich můžeme vyvozovat určité závěry. Dá se tedy říci, že s pomocí logických operátorů jako IF, AND, THEN zjišťujeme, co je pravda („true“) a co je lež („false“). Potvrdí-li se premisy, pak je závěr z nich plynoucí pravdivý. Pokud se premisy nepotvrdí, pak je závěr z nich plynoucí nepravdou. Znalost určitého praktického inteligentního systému může být reprezentována mnoha rolemi. V takovém případě jsou většinou role seskupeny do hierarchicky uspořádaných „souborů rolí“, kde každý tento soubor obsahuje role spřízněné s jedním a tím samým tématem.25
„A rule is a knowledge representation technique and a structure that relates one or more premises (conditions, or antecedents), or a situation, to one or more conclusions (consequents), or actions.“ GAŠEVIĆ, Dragan, Dragan ĐURIĆ a Vladan DEVEDZIC. Model driven architecture and ontolgy development. Berlin: Springer-Verlag, 2006, s. 17. ISBN 35-403-2180-2. 25 Tamtéž. 24
20
2.2 Objekty Věci nebo položky, které jsou středem našeho zájmu, nazýváme objekty. Tak jako u rolí, i objekty jsou v reprezentaci znalostí velmi významnými prvky. Objekty mohou být klasifikovány do souhrnných tříd podle vlastností, jimiž se obecně vyznačují. Obecné vlastnosti předmětů tvoří atributy celých tříd, zatímco předměty jako jednotlivé prvky skupin mají také své individuální vlastnosti. Porozumíme-li třídám, bude nám umožněno využít těchto znalostí jako obecných znalostí o prvcích v třídách obsažených. Třídy jsou uspořádány hierarchicky. Podtřídy jednotlivých tříd vždy dědí data a procesní vlastnosti po svých rodičovských třídách a dalších třídách, které jsou jim nadřazeny. Hierarchie tříd organizována takovým způsobem, že rodičovské třídy konkrétních podtříd jsou unikátní, proto se setkáváme se stromovou strukturou.26
3. Způsoby reprezentace znalostí Znalosti mohou být reprezentovány pěti základními způsoby – pojmovou indexací, pojmovým mapováním, využitím hypertextu, informačním modelováním a sémantickými sítěmi.27
3.1 Pojmová indexace Pojmová indexace nabízí jednu z možných metod organizace pojmů rozpoznaných v dokumentu. Tato metoda indexuje fráze vzhledem k jejich pojmové struktuře, místo aby se řídila pouze abecedně. Každá pojmová struktura reprezentuje způsob, jak sestavit význam fráze kombinováním jednotlivých atomových prvků – pojmů.28 Po rozebrání fráze do jedné nebo více pojmových struktur klasifikuje indexovací systém frázi vzhledem k obecnosti jejího významu. Této klasifikace je HANGOS, Katalin M., Rozá lia LAKNER a Mikló s GERZSON. Intelligent control systems: an introduction with examples. Boston: Kluwer Academic Publishers, 2001, s. 22 - 23. ISBN 14-0200134-7. 27 COAKES, Elayne, Dianne WILLIS a Steve CLARKE. Knowledge management in the sociotechnical world: the graffiti continues. New York: Springer, c2002, s. 157. ISBN 185233441x. 28 JAKUS, Grega, Veljko MILUTINOVIĆ, Sanida OMEROVIĆ a Sašo TOMAŽIČ. Concepts, ontologies, and knowledge representation. London: Springer, 2013, s. 15 - 16. ISBN 9781461478225. 26
21
dosaženo za využití poznatků o obecnosti vztahů mezi jednotlivými prvky fráze. Pro lepší pochopení uvedeme příklad – využijeme-li poznatek, že osobní vůz je podmnožinou automobilové dopravy, a že mytí je podmnožinou čištění, indexovací systém může odvodit, že fráze „mytí osobního vozu“ reprezentuje typ „čištění automobilové dopravy“.29
3.2 Pojmové mapování Pojmové mapování je pravděpodobně nejvíce zakořeněné ve vzdělávacích technikách pro zdokonalování porozumění. Jde o vyjádření vztahů mezi pojmy grafickou formou, čímž pojmové mapy pak asistují učitelům a studentům při zkoumání poznatků. V pojmové mapě jsou pojmy reprezentovány jako označené prvky grafu a pojmové vztahy jako propojovací linie, které se samy označují.30 Pod pojmové mapování typicky spadají oblíbené „Myšlenkové mapy“, které jsou stále využívanější.
3.3 Hypertext Tento pojem známý především z prostředí Internetu uživateli umožní zcela jednoduše přeskočit z jednoho zdroje informací na jiný. Hypertext, stejně jako schéma reprezentace znalostí nebo přívětivá forma uživatelského rozhraní, byl směřován k podpoře budování mentálních modelů a udržování mentálních modelů umožněním skenování a orientovaného vyhledávání. Další významnou vlastností hypertextu je to, že bere v potaz různé úrovně apriorních znalostí. Nevýhodou hypertextu je, že můžeme snadno přejít k novým informacím, aniž bychom stačili současné informace vstřebat. To se může negativně odrazit na naší motivaci, co se týče přístupu k učené látce. Oproti tomu výhodou je, že s možností hypertextu má student mnohem více flexibility při prohlížení různých zdrojů, navíc je aktivnější v třídění materiálů a informací. V neposlední řadě díky hypertextu můžeme také lépe porozumět kontextu určité konkrétní oblasti, který je nám přiblížen.31
JAKUS, Grega, Veljko MILUTINOVIĆ, Sanida OMEROVIĆ a Sašo TOMAŽIČ. Concepts, ontologies, and knowledge representation. London: Springer, 2013, s. 16. ISBN 9781461478225. 30 MINTZES, Joel J., James H. WANDERSEE a Joseph. D. NOVAK. Assessing science understanding: A Human Constructivist View. Burlington: Elsevier Academic Press, 2007, s. 175. ISBN 0120885344. 31 BRYANT, Antony. Leading issues in business research methods. Reading: Academic Publishing International Ltd, 2011, s. 69. ISBN 9781906638870. 29
22
3.4 Informační modelování Informační modelování odkazuje na model znalostních objektů32 a vztahů mezi nimi. Informační modelování je využíváno předně jako zdroj pro identifikování požadavků a spřízněných specifikací pro rychlé vyřešení problému. „Komplexní informační model razí cestu lepším sémantickým sítím.“33
3.5 Sémantické sítě Sémantické sítě jsou definovány jako „grafické nástroje pro popis sémantických vztahů mezi znalostními položkami ve znalostní bázi. Vlastnosti a vztahy znalostních objektů a tříd jsou popsány orientovaným grafem. Vrcholy grafu odpovídají objektům a jejich přívlastkům nebo vlastnostem: označené rohy znázorňují vztahy mezi vrcholy.“34 Pokud bychom se chtěli zaměřit na architekturu sémantických sítí, „sémantické sítě se skládají z kolekce uzlů pro reprezentaci pojmů, předmětů, událostí, atd.. a odkazů pro připojení uzlů a charakteristiku jejich vzájemných vztahů. Výhodou této reprezentační metody je její flexibilita, což znamená, že nové uzly a odkazy mohou být přidávány kdykoli je to potřeba. Dalším charakteristickým rysem sémantických
Znalostní objekt – „precizní způsob pro popsání obsahu určité tématiky nebo nashromážděných znalostí. Znalostní objekt je rámcem pro identifikaci potřebných prvků. Znalostní objekt je způsob organizace znalostních bází obsahových zdrojů (např. text, zvuk, video, grafika atd.) za účelem vyjádření, jak jsou znalosti shromažďovány. Znalostní objekty by měly sestávat z prvků, které nejsou specifické pro konkrétní oblast tématiky.“ „A knowledge object is a precise way to describe the subject matter content or knowledge that is gathered. A knowledge object is a framework for identifying necessary components. A knowledge object is a way to organize a knowledge base of content resources (e.g., text, audio, video, graphics, etc.) to reflect the knowledge being gathered. Knowledge objects should consist of components that are not specific to a particular subject matter domain.“ RHEM, Anthony J. UML for Developing Knowledge Management Systems. London: Auerbach Publications, 2005, s. 90. ISBN 02-034-9245-5. 33 „A comprehensive information model paves the way for better semantic networks.“ COAKES, Elayne, Dianne WILLIS a Steve CLARKE. Knowledge management in the sociotechnical world: the graffiti continues. New York: Springer, c2002, s. 157. ISBN 185233441x. 34 „Semantic nets are graphic tools for describing semantic relationships between knowledge items in a knowledge base. The properties and relationships of the knowledge objects and classes are described by a directed graph. The vertices of the graph correspond to the objects and their attributes or properties: the labelled edges depict the relationships between the vertices.“ HANGOS, Katalin M., Rozá lia LAKNER a Mikló s GERZSON. Intelligent control systems: an introduction with examples. Boston: Kluwer Academic Publishers, 2001, s. 27. ISBN 1402001347. 32
23
sítí je dědičnost. To znamená, že každý uzel může dědit vlastnosti uzlů k němu připojených.“35 Psychologové ze Stanfordské univerzity rozlišují tři typy sémantických sítí: asociativní sítě, WordNet a Rogetův tezaurus. Asociativní sítě „Asociativní sítě jsou orientované grafy s označenými uzly, oblouky nebo šipkami. Jazyk využitý při konstrukci sítě je založen na vybraných prvcích domény pro objekty a vztahy, stejně jako některé obecné prvky. Asociativní sítě byly uvedeny Quillianem za účelem vytváření sémantik anglických vět a slov. Ten pojmenoval své struktury sémantické sítě, aby popsal jejich zamýšlené využití.“36 WordNet Anglická databáze slov, která slouží jako model pro podobně koncipované sítě slov v některých evropských jazycích. „WordNet je sémantická síť, v níž významy podstatných jmen, sloves, přídavných jmen a příslovcí jsou reprezentovány v termínech jejich propojení s jinými slovy (skupinami slov) skrze koncepčně-sémantické a lexikální vztahy. Každá část řeči je zpracována odlišně odrážejíc rozdílné sémantické vlastnosti.“37 Rogetův tezaurus Abecedně řazený slovník synonym a antonym zpracovaný Dr. Peterem Markem Rogetem, který jej zpracovával a rozšiřoval od svých dvaceti do „Semantic networks consist of a collection of nodes for representation of concepts, objects, events, etc.. and links for connecting the nodes and characterizing their interrelationship. An advantage of this representation method is its flexibility which means new nodes and links may be added whenever needed. Another characteristic of semantic networks is inheritance. That is, each node can inherit the characteristics of its connected nodes.“ FARKAS, Farkas a Karoly JÁRMAI. Analysis and optimum design of metal structures. Rotterdam, Netherlands: A.A. Balkema, 1997, s. 157. ISBN 90-541-0669-7. 36 „Associative networks are directed graphs with labelled nodes and arcs or arrow. The language used in constructing a network is based on selected domain primitivek for objects and relations as well as some general primitives. Associative networks were introduced by Quillian to model the semantics of English sentences and words. He called his structures semantic networks to signify their intended use.“ AKERKAR, Rajendra. Introduction to artificial intelligence. Eastern Economy ed. New Delhi, India: Prentice-Hall of India Private Ltd, 2005, 84 - 85. ISBN 8120328647. 37 „WordNet is a semantic network, in which the meanings of nouns, verbs, adjectives, and adverbs are represented in terms of their links to other (groups of) words via conceptual-semantic and lexical relations. Each part of speech is treated differently reflecting different semantic properties.“ VOSSEN, Piek. EuroWordNet: a multilingual database with lexical semantic networks. Boston: Kluwer Academic, 1998, s. 137. ISBN 0-7923-5295-5. 35
24
devadesáti let. Poté slovník převzal a přepracoval jeho syn John Lewis. Nová vydání pak připravoval také Rogetův vnuk, po jehož smrti (v roce 1952) přešel Rogetův Thesaurus do majetku Longmanova nakladatelství.38
4. Formalismy pro reprezentaci znalostí Nalézt jednotné dělení formalismů pro reprezentaci znalostí v různých zdrojích je kupodivu těžším úkolem, než by se mohlo zdát. V následující kapitole se bude vycházet z dělení podle knihy „Concepts, Ontologies, and Knowledge Representation“39 z roku 2013, kde jsou rozlišovány formalismy následující: „sémantické sítě“, „rámce“, „deskriptivní logika“, „konceptuální grafy“ a „fuzzy logika“. Toto dělení bude chudší o zmíněné sémantické sítě, kterým jsme se již věnovali dostatečně v předchozím textu.
4.1 Rámce Rámce můžeme definovat jednoduše jako „struktury reprezentace znalostí ovlivňované organizací lidské paměti“.40 Blíže pak můžeme říci, že jsou rámce „znalostní struktury se speciálními předdefinovanými znalostními prvky propojenými sémantickými vztahy“.41 Rámce mohou být viděny jako rozšíření záznamů se standardními aktivními prvky, na druhé straně jsou rámce podobné objektům v tom smyslu, že z nich mohou být generovány instance42, a mohou také formovat rámcové hierarchie s
Rogetův tezaurus. Vesmír: přírodovědecký časopis. Praha: Vesmír, s.r.o., 1996/7. ISSN 1214-4029. Dostupné z: http://casopis.vesmir.cz/clanek/rogetuv-thesaurus 39 JAKUS, Grega, Veljko MILUTINOVIĆ, Sanida OMEROVIĆ a Sašo TOMAŽIČ. Concepts, ontologies, and knowledge representation. London: Springer, 2013, 67 p. ISBN 9781461478225. 40 „Frames are knowledge representation structures influenced by the organization of human memory.“ JAKUS, Grega, Veljko MILUTINOVIĆ, Sanida OMEROVIĆ a Sašo TOMAŽIČ. Concepts, ontologies, and knowledge representation. London: Springer, 2013, s. 9. ISBN 9781461478225. 41 „Frames are knowledge structures with special pre-defined knowledge elements connected by semantic relationships.“ HANGOS, Katalin M., Rozá lia LAKNER a Mikló s GERZSON. Intelligent control systems: an introduction with examples. Boston: Kluwer Academic Publishers, 2001, s. 26. ISBN 1402001347. 42 „V objektových systémech, v nichž je třída objektem (ať již plnohodnotným nebo ne), je vhodné mít k dispozici specifický termín pro ty objekty, jež nejsou třídami. Obecně se užívá pro tento účel pojmu instance; často ve vazbě „instance třídy X“ pro objekt, jehož typ je danou třídou určen: instance je objekt, který není třídou (ale sám je od nějaké třídy odvozen).“ 38
25
dědičnostmi. Vlastnosti rámců jasně vysvětlují, proč jsou vhodné pro reprezentaci znalostí.43 Rámce jsou využívány pro popis znalostí typických pro dané situace. Rámce dělíme na tři skupiny:44 Situační rámce – znalosti typu co očekávat od dané situace Akční rámce – znalosti o tom, jak jednat v daných situacích Neurčité znalostní rámce – kombinují situační a akční rámce pro reprezentaci neurčitých znalostí
4.2 Deskriptivní logika Pro definování deskriptivní logiky si můžeme uvést dvě definice: „Deskriptivní logika je formalismus pro reprezentaci na logice založených znalostí skrze koncepty (třídy), role (vztahy) a jednotlivosti (objekty). V deskriptivní logice koncepty označují množiny jednotlivých objektů.“45 „Deskriptivní logiky jsou velmi úspěšnou rodinou formalismů založených na reprezentaci znalostí, které poskytují možnosti pro strukturovanou reprezentaci znalostí a odvozovací procedury pro usuzování ohledně reprezentovaných znalostí.“46 Deskriptivní logika tedy popisuje koncepty, role a jednotlivosti. Jeden z hlavních záměrů deskriptivní logiky je oddělit terminologickou znalostní bázi, ČADA, Ondřej. Objektové programování: naučte se pravidla objektového myšlení. 1. vyd. Praha: Grada, 2009, s. 27. ISBN 978-80-247-2745-5. 43 Tamtéž. 44 BAJAJ, Manas. Knowledge composition methodology for effective analysis problem formulation in simulation-based design. East Eisenhower Parkway: Proquest, Umi Dissertation Publishing, 2011, s. 72. ISBN 1243588624. 45 „Description logic is a formalism for representing logic-based knowledge through concepts (classes), roles (relations) and individuals (objects). In description logic, concepts denote sets of individual objects.“ JAKUS, Grega, Veljko MILUTINOVIĆ, Sanida OMEROVIĆ a Sašo TOMAŽIČ. Concepts, ontologies, and knowledge representation. London: Springer, 2013, s. 8. ISBN 9781461478225. 46 „Description logics are a very successful family of logic-based knowledge representation formalisms, which provide means for the structured rep-resentation of knowledge and inference procedures for reasoning about the represented knowledge.“ KÜ STERS, Ralf. Non-standard inferences in description logics. New York: Springer, 2001, viii. Lecture notes in computer science. ISBN 35-404-2397-4.
26
která popisuje terminologii, a výrokovou znalostní bázi, která popisuje, co je pravdivé v určité oblasti v určitém čase.47 Deskriptivní logika je využívána jako formální teoretický základ pro služby sémantického webu.
4.3 Konceptuální grafy Konceptuální grafy obsahují dva typy uzlů: pojmů a vztahů mezi pojmy. Koncepty jsou prezentovány obdélníky, vztahy jsou prezentovány kruhy. Jak může vypadat konceptuální graf, to jednoduše znázorní následující příklad (viz Obrázek 1). Vezmeme-li si větu „John si čte knihu v obývacím pokoji.“, máme zde pojem „čtení“ („read“), na který se váže pojem „John“, „kniha“ („book“) a „obývací pokoj“ („living room“). Vztahy mezi těmito pojmy jsou vyjádřeny uvnitř kružnic – John je jakýsi „činitel“ („agent“), který činnost vykonává, kniha je určitým „předmětem“ („theme“), jenž je k činnosti využit, a vše se odehrává v „místě“ („place“) obývacího pokoje.
Obrázek 1: Příklad konceptuálního grafu (převzato z 48) Vedle již dříve zmíněných pojmových map a sémantických sítí patří konceptuální grafy mezi tři nejvíce používané prostředky pro znázorňování grafických struktur.49 POOLE, David L a Alan K MACKWORTH. Artificial intelligence: foundations of computational agents. New York: Cambridge University Press, 2010, s. 568. ISBN 978-0-521-51900-7. 48 JAKUS, Grega, Veljko MILUTINOVIĆ, Sanida OMEROVIĆ a Sašo TOMAŽIČ. Concepts, ontologies, and knowledge representation. London: Springer, 2013, s. 14. ISBN 9781461478225. 47
27
4.4 Fuzzy logika Fuzzy logika, která je česky někdy překládána také jako „mlhavá logika“, vznikla jako podpora matematické logiky. „Byla odvozena od ,teorie fuzzy množin‘, v níž se logické výroky ohodnocují mírou pravdivosti. Liší se tak od klasické výrokové logiky, která používá pouze dvě logické hodnoty, a to pravdu a nepravdu, obvykle zapisované jako 1 a 0. Fuzzy logika může operovat se všemi hodnotami z intervalu <0; 1>, kterých je nekonečně mnoho. Fuzzy logika byla zavedena roku 1965 Lotfim Zadehem z Kalifornské univerzity v Berkeley. Lze konstatovat: Teorie fuzzy množin se zabývá formalizací vágních pojmů.“50 Fuzzy logiku využijeme u špatně strukturovaných úloh, kde platí následující:51 data nelze kvalifikovat, mají kvalitativní charakter, metriky neexistují, algoritmy nejsou známy nebo jsou složité (multikriteriální), interpretace není jednoznačná.
5. Standardy pro reprezentaci znalostí Tak jako v jiných oblastech, také u reprezentace znalostí se setkáme s určitými standardy, které byly za účelem efektivnější práce se znalostmi obecně přijaty. V knize „Advanced Java“ jsme seznámeni se třemi základními standardy, které nám jednotlivě představí tato kapitola. Těmito standardy jsou: „RDF Resource Description Framework“, „RDF Schema“ a „XTM XML Topic Maps“.52 Zmínit bychom však měli také webový ontologický jazyk OWL, s nímž se okrajově setkáme také v další části práce.
5.1 RDF – Resource Description Framework Resource Description Framework „představuje rámec pro popis zdrojů, respektive nabízí prostředky, kterými je možné popsat metadata nějakého zdroje tak, JAKUS, Grega, Veljko MILUTINOVIĆ, Sanida OMEROVIĆ a Sašo TOMAŽIČ. Concepts, ontologies, and knowledge representation. London: Springer, 2013, s. 14. ISBN 9781461478225. 50 JANÍČEK, Přemysl a Jiří MAREK. Expertní inženýrství v systémovém pojetí. 1. vyd. Praha: Grada, 2013, s. 67. Expert (Grada). ISBN 978-80-247-4127-7. 51 SMEJKAL, Vladimír a Karel RAIS. Řízení rizik ve firmách a jiných organizacích. 4., aktualiz. a rozš. vyd. Praha: Grada, 2013, s. 240. Expert (Grada). ISBN 978-80-247-4644-9. 52 GUPTA, Gajendra. Advanced Java. New Delhi, India: Laxmi Publications, 2005, s. 143. ISBN 817008-940-9. 49
28
aby je mohly automatizovaně zpracovávat programy, např. katalogizační služby, služby hodnocení obsahu apod. Jde o to, aby stroje nejen dokázaly obsah dokumentu číst (např. XHTML), ale aby obsahu také rozuměly. RDF pak umožňuje vyjádřit jednoduchá tvrzení ,zdroj X nabývá pro vlastnost Y hodnotu Z, tj. trojici subjekt predikát – objekt‘.“53 Co se týče pozadí vzniku, je RDF „výsledkem zapojení konsorcia W3C do úsilí o standardizaci formálních prostředků pro práci s metadaty v prostředí Internetu. RDF vznikl jako obecný prostředek pro zápis metadat tak, aby je bylo možno zpracovat různými aplikacemi, aby je bylo možno mezi těmito aplikacemi přenášet a aby jednou vytvořená metadata bylo možno opakovaně používat.“54 RDF tedy nabízí možnost definovat metadatové elementy podle potřeby, není koncipován tak, aby obsahoval syntaktická pravidla pro vyjádření známých metadatových schémat, která uspokojí potřeby určitých uživatelských komunit. Jazyk XML je využíván ve smyslu syntaxe pro výměnu, přenos a zpracování dat. Obecné výhody XML jako je nezávislost na určité firmě, rozšiřitelnost podle potřeb uživatelů, přehlednost a čitelnost i pro člověka, možnost validování či schopnost reprezentovat komplexní struktury zaručují RDF flexibilitu, která je vzhledem k variabilitě metadatových standardů zcela nezbytná.55 RDF je pravděpodobně nejznámější ve spojení se sémantickým webem. Koncept sémantického webu je totiž postaven právě na RDF, k čemuž se dostaneme ještě později.
5.2 RDF Schema Uživatelé RDF potřebovali kromě základních technik pro popis zdrojů také možnost pro popis dalších termínů, které v záznamech využívali. Bylo potřeba popisovat typy věcí a jejich vlastnosti, podle nichž by se věci mohly určitým způsobem kategorizovat. RDF však neumožňuje nějaké členění do tříd. Tento nedostatek se stal základem pro nový jazyk z RDF vycházející – RDF Vocabulary Description Language (RDF Schema), který je rozšířením RDF.56
GÁLA, Libor, Jan POUR a Zuzana ŠEDIVÁ. Podniková informatika. 2., přeprac. a aktualiz. vyd. Praha: Grada, 2009, s. 83. Expert (Grada). ISBN 978-80-247-2615-1. 54 SKLENÁK, Vilém. Data, informace, znalosti a Internet. Vyd. 1. V Praze: C.H. Beck, 2001, s. 353. C.H. Beck pro praxi. ISBN 80-7179-409-0. 55 Tamtéž. 56 MAIER, Ronald, Thomas HÄ DRICH a René PEINL. Enterprise knowledge infrastructures. 2nd ed. Berlin: Springer, 2009, s. 210. ISBN 978-354-0897-682. 53
29
RDF Schema seskupování podobných věcí do tříd umožňuje. „Třídy“ v RDF Schema odpovídají obecnému konceptu kategorií, mohou reprezentovat jakékoli kategorie věcí – webové stránky, osoby, typy dokumentů, databáze nebo abstraktní pojmy. Třídy jsou popsány za využití RDF Schema zdrojů „rdfs:Class“ a „rdfs:Resource“ a vlastností „rdf:type“ a „rdfs:subClassOf“. V RDF Schema platí, že třída je jakýkoli zdroj mající vlastnost „rdf:type“, jejíž hodnota je zdroj „rdfs:Class“. Jaký je mezi dvěma třídami vztah můžeme určit pomocí „rdfs:subClassOf“.57 „Vlastností“ v RDF Schema rozumíme instanci třídy „rdfs:Property“. „Vlastnost ,rdfs:domain‘ se používá k označení toho, že konkrétní vlastnost se vztahuje k určené třídě, vlastnost ,rdfs:range‘ se pak používá k označení toho, že hodnoty konkrétní vlastnosti jsou instancemi určené třídy, nebo, alternativně, jsou instancemi (tj. literály) datového typu XML Schema.“58
5.3 OWL – Webový ontologický jazyk „OWL Webový ontologický jazyk je vyvinut pro použití aplikacemi, které potřebují zpracovávat obsah informací namísto toho, aby pouze prezentovaly informace lidem. OWL umožňuje větší strojovou interpretovatelnost webového obsahu, než je podporována XML, RDF a RDF Schema (RDF-S) tím, že poskytuje přidaný slovník spolu s formálními sémantikami. OWL má tři stále působivější podjazyky: OWL Lite, OWL DL a OWL Full.“59 OWL lze využít k výslovné reprezentaci významů termínů ve slovnících a vztahů mezi těmito termíny. Právě tato reprezentace pojmů a jejich vzájemných vztahů se nazývá ontologie. Jak již bylo zmíněno, OWL má více možností pro KASHYAP, Vipul. The semantic web: semantics for data and services on the web. 1st ed. New York: Springer, 2008, s. 96. ISBN 978-354-0764-519. 58 „The rdfs:domain property is used to indicate that a particular property applies to a designated class, and the rdfs:range property is used to indicate that the values of a particular property are instances of a designated class or, alternatively, are instances (i.e., literals) of an XML Schema datatype.“ TIZIANA, Margaria a Steffen BERNHARD. Leveraging applications of formal methods, verification and validation: third international symposium, ISOLA 2008, Porto Sani, Greece, October 13-15, 2008. proceedings. 1st ed. New York: Springer, 2008, s. 564. ISBN 35-408-8478-5. 59 „The OWL Web Ontology Language is designed for use by applications that need to process the content of information instead of just presenting information to humans. OWL facilitates greater machine interpretability of Web content than that supported by XML, RDF, and RDF Schema (RDF-S) by providing additional vocabulary along with a formal semantics. OWL has three increasinglyexpressive sublanguages: OWL Lite, OWL DL, and OWL Full.“ OWL Web Ontology Language: Overview. W3C - World Wide Web Consortium [online]. © 2014 [cit. 2014-11-25]. Dostupné z: http://www.w3.org/TR/owl-features/ 57
30
vyjádření významů a sémantiky než XML, RDF a RDF-S, proto OWL přesahuje tyto jazyky ve schopnosti reprezentovat strojům srozumitelný obsah na Webu. OWL je revizí předchozího DAML+OIL webového ontologického jazyka zahrnující poučení se z designu a aplikace DAML+OIL.60
5.4 XTM – XML Topic Maps XTM je syntaxí založenou na jazyce XML. Jak již název napovídá, jedná se o syntaxi pro Topic Maps, jež jsou hlavním tématem této práce. V následující části práce tedy již přejdeme k Topic Maps. Syntaxí XTM se budeme blíže zabývat v kapitole pojednávající o syntaktické vrstvě Topic Maps.
OWL Web Ontology Language: Overview. W3C - World Wide Web Consortium [online]. © 2014 [cit. 2014-11-25]. Dostupné z: http://www.w3.org/TR/owl-features/ 60
31
II. Topic Maps 6. Definování pojmu Topic Maps Ačkoli v Česku bychom mnoho materiálů ohledně Topic Maps prozatím nenalezli, v zahraničí se setkáváme s pojmem Topic Maps stále častěji, ať již v souvislosti s reprezentací znalostí, sémantickým webem nebo v pracích zabývajících se čistě Topic Maps jako takovými. Definic pojmu Topic Maps, které můžeme nalézt, je pak celá řada. Jedna z nejjednodušších a nejčastěji používaných definic, která však neznalému laikovi nejspíše příliš mnoho neřekne, zní následovně: „Topic Maps je mezinárodní průmyslový standard (ISO 13250) pro spravování a výměnu informací.“ 61 Pokud bychom chtěli nalézt konkrétnější, i když stále stručnější definici, je to např. tato: „Topic Maps jsou sofistikované indexy pro dynamické seskupování heterogenních, strukturovaných i nestrukturovaných informačních zdrojů.“62 Lépe srozumitelnou a podrobnější definici můžeme nalézt pod heslem Topic Maps např. ve Slovníku informační vědy a technologií: „Navigační schéma pro vyhledávání informačních zdrojů způsobem tématického řízení. Pokud je k dispozici soubor informačních zdrojů, pak jejich témata, stejně jako asociace mezi tématy, jsou identifikovány a jsou využívány k vytvoření mapy, která provádí uživatele skrze témata. (Yang & Lee, 2005)“ 63 „Topic Maps is an international industry standard (ISO 13250) for information management and interchange.“ Topic Maps [online]. 1991 [cit. 2013-12-21]. Dostupné z: http://www.topicmaps.org/ 62 „Topic Maps are sophisticated indexes for dynamic collections of heterogeneous, structured and unstructured information sources.“ Böhm, K.; Maicher, L.; Witschel, H.-F.; Carradori, A.: Moving Topic Maps to Mainstream - Integration of Topic Map Generation in the User's Working Environment. In: Proceedings of I-KNOW '04, Graz, (2004), p. 241. 63 „A navigation scheme for exploring information resources in a topic-driven manner. When a set of information resources is provided, their topics as well as the associations among topics are identified and are used to form a map that guides the user through the topics. (Yang & Lee, 2005)“ 61
32
Encyklopedie HCI pak definuje Topic Maps pro změnu takto: „Topic Maps jsou využívány k organizaci (pro navigaci koncového uživatele) zdrojů dostupných na Webu, které jsou relevantní k určité oblasti zájmu a/nebo několika tematicky spřízněných oblastí. Topic Map je definována jako model „pro reprezentaci struktur informačních zdrojů využívaných k definování témat a asociací (vztahů) mezi tématy.“ (Pepper & Moore, 2001).“ 64 Zjednodušeně tedy můžeme říci, že se jedná o určitou technologii, jejímž cílem je poskytnutí snadno použitelného systému reprezentace znalostí za účelem organizace online zdrojů, podpory navigace a vyhledávání v rozsáhlých kolekcích dokumentů, využití pro modelaci složitých pravidel, procesů apod.65 Abychom si však mohli lépe představit, co se pod pojmem Topic Maps skrývá, budeme si je muset přiblížit trochu podrobněji, byť složitěji. Následující definice vychází z článku „Topic Maps – An Enabling Technology for Knowledge Management“. 66 Jak již bylo výše zmíněno, Topic Maps jsou standardem. Standardem, který definuje abstraktní model pro významově strukturované, sebepopisovací propojení sítí rozprostírajících se přes řadu adresovatelných informačních objektů, jako základní architekturu v následujícím rozsahu aplikovatelnosti:67
Pro označení obsahu informačních objektů s cílem umožnit navigační nástroje jako jsou indexy, odkazy, citační systémy nebo slovníky.
KHOSROWPOUR, Mehdi. Dictionary of information science and technology. Hershey, PA: Idea Group Reference, c2007, s. 690. ISBN 9781599043869. 64 „Topic maps are used to organize, for end-user navigation, resources available on the Web that are germane to a particular domain of interest and/or multiple topically related domains. A topic map is defined as a model "for representing the structure of information resources used to define topics, and the associations (relationships) between topics" (Pepper & Moore, 2001).“ GHAOUI, Claude. Encyclopedia of human computer interaction. Hershey PA: Idea Group Reference, 2006, s. 102. ISBN 9781591407980. 65 KOSEK, Jiří. Topic Maps: Tutoriál [online]. 2006, s. 2 [cit. 2014-07-16]. Dostupné z: http://www.kosek.cz/xml/tmtut/ 66 STEINER, K., W. ESSMAYR a R. WAGNER. Topic maps - an enabling technology for knowledge management. 12th International Workshop on Database and Expert Systems Applications [online]. IEEE Comput. Soc, 2001, s. 473 [cit. 2013-06-14]. DOI: 10.1109/DEXA.2001.953106. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=953106 67 Tamtéž.
33
Pro propojení informací do sjednoceného celku za účelem umožnění navigace mezi nimi, např. pro vytváření thesaurových – resp. thesauru podobných – hypertextových interakcí pro podnikové informace a znalostní báze.
Pro filtraci zobrazení informací přizpůsobených konkrétním uživatelům a/nebo účelům, např. pro definování dílčích pohledů závisejících na uživatelských profilech a/nebo znalostech domén.
Pro strukturování nestrukturovaných informačních objektů nebo ke kombinování nestrukturovaných informačních bází se strukturovanými takovým způsobem, že libovolná struktura je uložena, aniž by se změnila její původní podoba.
Standard dále specifikuje serializaci syntaxe jako formátu pro výměnu Topic Maps založených na ISO standardu HyTime (jazyk pro hypermediální/časové strukturování, viz kapitola Historie a vývoj standardu Topic Maps) prostřednictvím Definice typu dokumentu (DTD).68 Zamyslíme-li se nad tím, co stálo za zrodem standardu, možnou odpověď se dočteme v knize Formální reprezentace znalostí. Autorka zde vysvětluje, že autoři modelu Topic Maps byli „inspirováni skutečností, že informace/znalosti o předmětech, které se mohou stát aktuálními tématy, se vyskytují v různých datových formátech a přístup k nim je dán vždy příslušným paradigmatem, čímž trpí konkrétní použití pro rozdílné účely. Je proto třeba zavést standardní prostředky mapování rozdílných identifikací do jednoznačného reprezentanta předmětu, neboť konkrétní předmět zachovává svoji podstatu, i když je rozdílně identifikován.“ 69 Dále pak dodává, že Topic Maps „jsou v podstatě pouze jiným konceptuálně odlišným standardem, který se uchází o roli ontologického jazyka.“ 70
DTD - Document Type Definition – Definice typu dokumentu nám „říká, které elementy a atributy můžeme v dokumentu použít. Navíc je zde definováno, v jakých vzájemných vztazích mohou být jednotlivé elementy použity. DTD je tedy užitečný nástroj, který nám umožní hlídat, zda mají naše dokumenty správnou strukturu.“ KOSEK, Jiří. XML pro každého: podrobný průvodce. 1. vyd. Praha: Grada, 2000, s. 37. Průvodce (Grada). ISBN 80-7169-860-1. 69 LUKASOVÁ, Alena. Formální reprezentace znalostí. Vyd. 1. V Ostravě: Ostravská univerzita, 2010, s. 201. Universum (Ostravská univerzita), 13. ISBN 9788073689001. 70 Tamtéž. 68
34
Co oficiálně stojí za vznikem a vývojem Topic Maps, bude zmíněno v následující kapitole.
7. Historie a vývoj standardu Topic Maps Práce na Topic Maps začala od roku 1991, kdy byla založena skupina „Davenport Group“. Skupinu založili dodavatelé systému UNIX (společně s vydavatelstvím O'Reilly & Associates a dalšími), kteří byli pod tlakem ze strany zákazníků, požadujících sjednocení terminologie používané v jejich dokumentaci s terminologií využívanou v odborných pramenech. Systémoví dodavatelé si přáli zahrnutí O'Reillyho nezávisle vytvořené dokumentace na X-Windows do svých manuálů. Problémem však bylo, jak zajistit hlavní index pro nezávisle udržovanou a neustále se měnící technickou dokumentaci, začleněnou dodavateli těchto systémů do souborů systémových manuálů. Prvním pokusem o řešení problému byl standard nazvaný „SOFABED“ (Standard Open Formal Architecture for Browsable Electronic Documents).71 Roku 1993 byla založena nová skupina – „CApH“ (the Conventions for the Application of HyTime) využívající HyTime72 – jazyk pro hypermediální/časové strukturování, jenž je aplikací SGML (Standard Generalized Markup Language) a jenž rozšiřuje SGML o multimediální a hypertextové funkce. Po rozsáhlém přezkoumání možností nabízených rozsáhlou hyperlinkovou navigací přepracovali CApH model SOFABED jako Topic Map.73 Od roku 1995 model dozrával dostatečně na to, aby mohl být akceptován jako základ pro nový mezinárodní standard. Standard Topic Maps byl poprvé vydán Mezinárodní organizací pro normalizaci (anglicky International Organization for Standardization – zkráceně „ISO“) v roce 2000 (ISO/IEC 13250:2000). V českém prostředí byla norma vydána 1. března roku 2001 (pod označením ČSN ISO/IEC 13250), účinnosti pak nabyla o měsíc později (1. dubna 2001). 74 V současnosti se můžeme setkat s platnou druhou verzí normy z roku 2003 (ISO/IEC 13250:2003), HUNTING, Sam. XML topicmaps: creating and usingtopicmaps for the Web. Boston: AddisonWesley, 2003, s. 37 - 38. ISBN 0201749602. 72 VAN HERWIJNEN, Eric. Practical SGML. 2nd ed. Boston: Kluwer Academic Publishers, 1998, 236 237. ISBN 0792394348. 73HUNTING, Sam. XML topicmaps: creating and usingtopicmaps for the Web. Boston: AddisonWesley, 2003, s. 37 - 38. ISBN 0201749602. 74Mapy námětů. ČSN seznam: Vyhledávání v seznamu normativních dokumentů ÚNMZ [online]. 1993 [cit. 2013-12-21]. Dostupné z: http://seznamcsn.unmz.cz/Detailnormy.aspx?k=60721 71
35
která v Česku nabyla platnosti roku 2004 (ČSN ISO/IEC 13250:2003).75 Na tuto verzi navazuje také doplněk z roku 2006 (ISO/IEC 13250-2:2006).
8. Základní prvky modelu Topic Maps Některé ze základních prvků, které tvoří model Topic Maps, jsme již okrajově zmínili. Základní prvky Topic Maps jsou tři: „témata“, „vztahy“ a „výskyty“. Nyní si o těchto, ale také o dalších významných prvcích pro Topic Maps charakteristických, povíme více.
8.1 Témata „Témata“ („topics“) jsou základním stavebním kamenem celého modelu Topic Maps. Slovo „téma“ je odvozeno z řeckého slova „topos“, což můžeme přeložit jako „umístění“, ale také jako „předmět“. Téma reprezentuje předměty reálného světa v prostředí počítačovém a může být orientováno na více míst. Každé takové místo je pak zdrojem, který nazýváme „výskyt tématu“. Všechny výskyty zastupující jedno téma sdílí vlastnosti ohledně existence předmětu reprezentovaného tímto tématem. Předmět tématu je základní charakteristikou tohoto tématu, vedlejší vlastnosti pak nalezneme právě ve výskytech tématu.76 Zatímco jedno téma reprezentuje jen jeden předmět a naopak, jednotlivá témata mohou mít více názvů, přičemž každý z těchto názvů odkazuje právě na toto téma. Autor knihy „Logic and the Organization of Information“ Martin Frické to vysvětluje následovně: „Témata mohou být čímkoli, jsou to prostě témata. Ve skutečnosti teorie Topic Maps vidí témata samotná jako neanalyzované koncepty černých skříněk. Témata jsou černou skříňkou v tom smyslu, že pokud les je téma a les mírného pásma je téma, neexistuje povědomí nebo mechanismus pro zjištění faktu, že tato dvě témata jsou spojená. Každé samotné téma může mít více pojmenování. Tato kontrola jmenných prostorů řeší problém synonym.“ 77
Informační technologie - Aplikace SGML - Mapy námětů. Seznam technických norem ČSN [online]. 2002 [cit. 2014-01-04]. Dostupné z: http://nahledy.normy.biz/nahled.php?i=70751 76 HUNTING, Sam. XML topic maps: creating and using topic maps for the Web. Boston: AddisonWesley, 2003, s. 18 - 19. ISBN 0201749602. 77 „Topics can be ‚anything‘, they are just topics. In effect, the theory of Topic Maps sees Topics themselves as being unanalyzed black box concepts. The Topics are black box in the sense that if Forest is a topic and Temperate Forest is a topic, there is no awareness of, or mechanism for detecting, the fact that these two topics are connected. Each individual topic can have multiple names. This namespace control addresses the problem of synonyms.“ 75
36
Jak již bylo zmíněno, témata tedy reprezentují předměty reálného světa. Může jimi být cokoli – osoba, obrázek, firma, ale také např. významná událost apod. Tématům mohou být přiřazeny explicitní názvy, díky nimž je snadno rozpoznatelné, co přesně dané téma představuje. Ne každému tématu však musí být přiřazen název, např. tématům představujícím určitý vztah názvy přiřadit ani nelze. U témat, k nimž názvy přiřadíme, mohou mít tyto názvy různé formy – formální názvy, symbolické názvy, zdrobněliny, přezdívky atd. Typy názvů můžeme rozdělit následovně:78 Základní názvy (base names) – slouží k jednoznačné identifikaci tématu. Máme-li tedy např. téma „Washington“, jako „base name“ zadáme „Washington, Missouri, USA“. Díky tomu víme, o jaký konkrétní Washington se jedná, přestože měst s názvem Washington by samozřejmě mohlo existovat více. Různé názvy (variant names) – tyto názvy nemusí být unikátní. Budeme-li tedy např. mít téma „Washington, D.C.“, můžeme mu přiřadit název „Washington“ (navzdory tomu, že neurčujeme, o jaký Washington se konkrétně jedná). Předmět může být identifikován také jiným způsobem, než že mu jen přiřadíme další názvy, a to poukázáním na zdroj. Zde se setkáváme se dvěma možnostmi, které označujeme jako identifikátory témat: Lokátor předmětu – tématem je přímo odkazovaný zdroj (zajímá nás konkrétní webová stránka jako taková, nikoli její obsah) Identifikátor předmětu – tématem je předmět (zajímá nás popis nebo definice předmětu, který je na dané stránce obsažen, nikoli stránka jako taková) Aby bylo možné docílit určité interoperability mezi jednotlivými mapami za účelem jejich globálního sdílení či výměn, vznikl systém tzv. zveřejněných FRICKÉ , Martin. Logic and the organization of information. New York: Springer, c2012, s. 273. ISBN 978-1461430872. 78 Topic Maps. Wandora [online]. 2006, 2011 [cit. 2014-07-02]. Dostupné z: http://wandora.org/wiki/Topic_Maps
37
indikátorů předmětu („Published Subject Indicators“ – PSI), jehož účelem je vytvoření jednotných indikátorů. Tyto indikátory jsou zveřejněny na stránkách organizace OASIS, která se jejich správou zabývá.79 V poslední době účelem zveřejnění předmětů není pouze usnadňování sdílení jednotlivých Topic Maps, ale také umožnění interoperability mezi OWL/RDF80 a Topic Maps. Názorný příklad PSI můžeme vidět na následujícím schématu (viz Obrázek 2). Informační zdroj, který popisuje delfína, mořské zvíře spřízněné s velrybou, je indikátorem předmětu „delfín“. Ten vyjadřuje delfína jako koncept předmětu reálného světa v počítači. Pakliže je indikátor předmětu umístěn na „http:www.knowledge-synergy.com/PSI/dolphin“, můžeme tuto adresu využít k vysvětlení konceptu delfína. To nám objasňuje předmět, o němž mluvíme.81
Obrázek 2: Příklad PSI (převzato z 82)
OASIS Published Subjects [online]. 2005 [cit. 2014-01-09]. Dostupné z: http://psi.oasis-open.org/ OWL (Web Ontology Language) – jazyk pro reprezentaci ontologií, jenž je zpravidla používaný ve spojení s RDF (Resource Description Framework) označujícím systém popisu zdrojů. 81 MAICHER, Lutz a Jack PARK. Charting the topic maps research and applications landscape: first International Workshop on Topic Maps Research and Applications, TMRA 2005, Leipzig, Germany, October 6-7, 2005 : revised selected papers. Berlin: Springer, 2006, s. 44. Lecture notes in computer science, 3873. ISBN 9783540325277. 82 MAICHER, Lutz a Jack PARK. Charting the topic maps research and applications landscape: first International Workshop on Topic Maps Research and Applications, TMRA 2005, Leipzig, Germany, 79 80
38
8.2 Výskyty S tímto prvkem jsme se již částečně seznámili. „Výskyty“ („occurences“) představují sadu odkazů na adresovatelné informační zdroje, které jsou nějakým způsobem relevantní k tématu. Výskyty mohou být dvojího typu – interní výskyty a externí výskyty. Interní výskyty – jedná se o zdroje malého rozsahu, které jsou uloženy přímo ve znalostní vrstvě Topic Map a nemusí na ně tudíž být odkazováno externě. Typickým interním výskytem pro téma „osoba“ v Topic Map může být „datum narození“, „výška“, „emailová adresa“ atd.83 Externí výskyty – odkazované zdroje se nachází mimo mapu, ať již vzhledem ke své velikosti, notaci, původu, nebo dalším vlastnostem, a jsou odkazovány pomocí lokátoru (většinou URL – Uniform Resource Locator), který odpovídá počtu stránek v rejstříku (což je sám o sobě lokátor pro každou informaci relevantní k příslušnému předmětu).84
8.3 Vztahy Tento prvek představuje vzájemné „vztahy“ („associations“) mezi jednotlivými tématy. Původně byly vztahy myšleny v tom smyslu, aby představovaly „Viz také“ odkazy, které se objevily v rejstřících knih.85 Vztahy nejsou samy o sobě orientované, orientace je nahrazena rolemi vztahů. Tyto role jsou obousměrné. Vezmeme-li si tedy např. fakt, že Mozart složil operu Don Giovanni, automaticky z toho vyplývá, že opera Don Giovanni byla složena Mozartem.
October 6-7, 2005 : revised selected papers. Berlin: Springer, c2006, s. 44. Lecture notes in computer science, 3873. ISBN 9783540325277. 83 MAICHER, Lutz, Alexander SIGEL a Lars Marius GARSHOL. Leveraging the semantics of topic maps: Second International Conference on Topic Maps Research and Applications, TMRA 2006, Leipzig, Germany, October 11-12, 2006 : revised selected papers. New York: Springer, c2007, s. 28. Lecture notes in computer science, 4438. ISBN 354071944x. 84 ESTRADA, Liliana M. Melgar. Topic Maps from a Knowledge Organization Perspective. Knowledge Organization [online]. 2011, vol. 38, issue 1, s. 47 [cit. 2013-12-16]. Dostupné z: http://web.ebscohost.com.ezproxy.muni.cz/ehost/pdfviewer/pdfviewer?vid=8&sid=1315ba2ab1c3-4980-82ff-e7485b99164c%40sessionmgr115&hid=117 85 ESTRADA, Liliana M. Melgar. Topic Maps from a Knowledge Organization Perspective. Knowledge Organization [online]. 2011, vol. 38, issue 1, s. 47 [cit. 2013-12-16]. Dostupné z: http://web.ebscohost.com.ezproxy.muni.cz/ehost/pdfviewer/pdfviewer?vid=8&sid=1315ba2ab1c3-4980-82ff-e7485b99164c%40sessionmgr115&hid=117
39
Možnosti využití vztahů jsou různé. Vztahy mohou být používány pro reprezentaci běžných vztahů v tezaurech (například užší pojem, širší pojem, související pojem). Mohou také vyjadřovat vztahy používané v tabulkách relačních databází. Vztahy mohou také být využity pro překrytí hierarchické struktury u existujících informačních zdrojů, a proto jsou vazby využívány pro tvorbu virtuálních tabulek obsahů, které slouží k prezentaci informačních objektů v daném pořadí, bez ohledu na způsob, jakým jsou vlastně uloženy.86 Vztahy tedy spřízňují dvě a více témat. Abychom lépe pochopili, jakým způsobem fungují, můžeme si uvést příklad ze stránek „Wandora“, které jsou zasvěceny stejnojmennému nástroji pro tvorbu Topic Maps: Chceme-li říci, že „Wandora je nástroj pro reprezentaci znalostí“, budeme potřebovat ještě role pro představitele tvrzení. Wandora bude instance, protože je instancí kategorie Nástroje pro reprezentaci znalostí. Tento vztah v sobě pak má vlastně pět různých témat: 87 Typ vztahu (association type) „je“ („is a“) Role „Instance“ Player „Wandora“, jež je představitelem (playerem) pro roli „instance“ Role „Kategorie“ (Role „Category“) Player „Nástroj pro reprezentaci znalostí“, jež je představitelem pro roli „kategorie“ Každý vztah má přesně jeden typ vztahu a nějaké členy (members). Každý člen má přesně jednu roli a nejméně jednoho představitele (playera):
Obrázek 3: Ukázka fungování vztahů v Topic Maps (převzato z 88) HUNTING, Sam. XML topic maps: creating and using topic maps for the Web. Boston: AddisonWesley, c2003, s. 19. ISBN 0201749602. 87 Topic Maps. Wandora [online]. 2006, 2011 [cit. 2014-07-02]. Dostupné z: http://wandora.org/wiki/Topic_Maps 88 Tamtéž. 86
40
Na Obrázku 3 můžeme vidět názorně, jak fungují v Topic Maps vztahy. Pro ještě lepší srozumitelnost si uvedeme další příklad. Chceme říci, že „Mary a Jim jsou manželé“. Jako „Playera A“ si dosadíme „Mary“, jejíž „role“ je „manželka“. „Player B“ pak bude „Jim“ a jeho role bude „manžel“. „Association type“ („typ vztahu“), který mezi ně může umístit, bude „manželé“. Vidíme tedy, že fungování vztahů v Topic Maps je v podstatě velmi jasné a jednoduché.
8.4 Typy Základními prvky Topic Maps jsou nám již dobře známá témata, vztahy a výskyty. Po vytvoření těchto základních prvků můžeme ke každému z nich přiřadit určité instance: typy témat, typy vztahů a typy výskytů. Tyto typy jsou rovněž tématy.89 Typy témat jsou většinou založeny na popisu vztahu mezi tématem a jeho typem z hlediska třídního dělení (např. „Shakespeare“ je „Autor“). Typy vztahů specifikují význam vztahu témat. Ke každému typu vztahu se váží dvě role, které zahrnují spřízněná témata (např. „Hamlet byl napsán Shakespearem“ = „Hamlet“ – Role 1, „Shakespeare“ – Role 2, „byl napsán“ – typ vztahu). Pod typy výskytů si pak můžeme představit témata, jež určují, v jakém smyslu jsou relevantní k tématu (odkazujeme-li např. na zdroje o Shakespearovi, určíme, zda je odkazovaný zdroj monografií, obrázkem nebo videem atd. Také zde určujeme role – Role 1 bude Shakespeare jako osoba, Role 2 Shakespeare jakožto kniha o této osobnosti).
8.5 Obory platnosti Informační modely jsou vždy spřízněny s určitým pohledem na ně nebo jsou uzpůsobeny konkrétní skupině uživatelů v závislosti na jazyce, úrovni odborných znalostí, přístupových právech atd. V Topic Maps konkrétní pohledy specifikujeme prostřednictvím „oborů platnosti“ (v angličtině „scopes“). Ty můžeme přiřadit všem prvkům v Topic Maps, díky čemuž zjistíme, v jakém konkrétním kontextu tato daná věc platí. Obory platnosti reprezentují mechanismus pro vylepšení možností filtrování a slučování Topic Maps, jelikož fakt, že mají témata stejné názvy, ještě neznamená, že se jedná o totožná témata.90
ESLAMI, Saeedeh a Eslam NAZAMI. An automatic approach for Topic Maps development using relational databases. In: 2011 3rd International Conference on Computer Research and Development. Piscataway: IEEE, 2011, s. 304-308. ISBN 978-1-61284-839-6. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=5764025 90 HUNTING, Sam. XML topic maps: creating and using topic maps for the Web. Boston: AddisonWesley, 2003, s. 20. ISBN 0201749602. 89
41
Obory platnosti tedy stanovují, v jakém kontextu jsou názvy nebo výskyty připsané určitému tématu a v jakém kontextu jsou konkrétní témata spřízněna vztahy. Můžeme tedy říci, že charakteristika určitého tématu je platná pouze v určitém oboru platnosti. V případě, že k ní žádný obor pravdivosti přidělen není, jde o „neomezený rozsah platnosti“, výrok tedy platí vždy. 91 Jediné charakteristiky, které platí vždy, jsou identifikátory témat (viz výše kapitola Témata).
8.6 Reifikace U Topic Map chceme být schopni zaznamenat, kdo tuto mapu vytvořil, kdy ji vytvořil, jaká je aktuální verze mapy a další informace s ní spojené. U vztahů, výskytů a dalších konkrétních částí mapy chceme být zase schopni zaznamenat, kdo je oprávněn měnit předměty, jaké jsou spřízněné verze, jaké je datum vytvoření atd. V Topic Maps existuje mechanismus, který nám toto umožňuje. Je možné spříznit téma v mapě s jinými druhy předmětů v mapě skrze vztah, který nazýváme „reifikace“.92 Jednoduše můžeme o reifikaci říci, že jde o vytvoření tvrzení o tvrzení. V Topic Maps můžeme tvrzení reifikovat dvěma způsoby. Prvním je, že vytvoříme téma reprezentující vztah reprezentovaný tvrzením. Dále pak vytvoříme jednoduše tvrzení o daném vztahu, nikoli o samotných vztazích, což nazýváme reifikací:93 employed-by(lm : employee , ul : employer) ~ employment-lm {employment-lm , startdate , [[2002-11-01]]} Druhým způsobem je vyjádřit samotný vztah, což nazýváme anotací:94 employed-by(lm : employee , ul : employer) ~ employment-lm created-by(employment-lm : creation, user-x : creator)
LIN, Song a Xiong HUANG. Advances in computer science, environment, ecoinformatics, and education: International Conference, CSEE 2011, Wuhan, China, August 21-22, 2011, Proceedings, Part II. Berlin: Springer, 2011, s. 199. ISBN 978-3-642-23323-4. 92 COLOMB, Robert M. Ontology and the Semantic Web. Washington, DC: IOS Press, 2007, s. 196. ISBN 15-860-3729-3. 93 Scaling topic maps: third international conference on topic maps research and applications, TMRA 2007 Leipzig, Germany, October 11-12, 2007 revised selected papers. 1st ed. New York: Springer, 2008, s. 248. ISBN 3540708731. 94 Tamtéž. 91
42
Reifikací tedy rozumíme vytvoření symbolu, který sám reprezentuje vztah.
9. Jak Topic Maps fungují Následující kapitolu budou tvořit dvě hlavní části. V první z těchto částí budou stručně popsány dvě základní datové úrovně, z nichž se Topic Maps skládají. V druhé části se již setkáme s poněkud hlubším a složitějším dělením tak, jak je nám představeno standardem ISO 13250 (resp. jak je nám představeno autorem Samem Huntingem, který se na ISO ve své knize odkazuje).
9.1 Datový model Topic Maps Datový model je poměrně široký pojem, který zahrnuje velké množství prvků. Topic Maps mají složitý datový model, který umožňuje používat takové funkce, jako jsou reifikace, n-ární vztahy, obory pravdivosti či slučování map. Chceme-li pochopit datový model Topic Maps, musíme být kromě jeho základních stavebních kamenů (témat, výskytů a vztahů), či významných funkcí seznámeni také s datovými vrstvami tohoto modelu. Topic Maps mají dvě datové úrovně. Tyto úrovně mohou být někdy nazývány také vrstvami, kdy jedna z vrstev je spodní a druhá vrchní. Znalostní vrstva (Topic Space) – vrchní vrstva modelu, někdy u nás také označována jako znalostní úroveň, jak již název napovídá, pracuje se znalostmi. Tato vrstva sestává z témat, která reprezentují koncepty z reálného světa (a vztahy mezi nimi).95 Informační vrstva (Resource Space) – spodní vrstva modelu, u nás také někdy označována jako informační úroveň, jak již název napovídá, pracuje s informacemi. Tato vrstva zahrnuje samotný obsah. Sestává z elektronických zdrojových souborů, jako jsou webové stránky, textové dokumenty, multimediální dokumenty apod.96 Zdrojové soubory mohou mít zkrátka
LEE, Raymond S. T., Edward L. Y. LIM a James N. K. LIU. Knowledge seeker ontology modelling for information search and management: a compendium. Berlin: Springer, 2011, s. 42. ISBN 978-3642179-167. 96 Tamtéž. 95
43
jakýkoli formát – od textu přes zvuk, video, graf nebo obrázek. Zmíněná elektronická podoba zdrojů je přitom nejběžnější, není však podmínkou.97 Obě zmíněné vrstvy jsou propojeny výskyty, které zachycují vztahy mezi tématy a souvisejícími informačními zdroji. Názorně je toto propojení velice jasně zachyceno na následujícím obrázku z tutoriálu Ing. Jiřího Koska:
Obrázek 4: Ukázka propojení informační a znalostní vrstvy (převzato z 98)
9.2 Topic Maps podle ISO 13250 Jak již bylo nastíněno, dělení vrstev v Topic Maps nebude tak prosté, jak by se z předchozího textu mohlo zdát. Sam Hunting jde ve své knize „XML Topic Maps: Creating and Using Topic Maps for the Web“ hlouběji, a představuje jiné tři vrstvy Topic Maps, přičemž se odkazuje na normu ISO 13250. Jde o vrstvu modelační, syntaktickou a vrstvu omezení a dotazování.
KOSEK, Jiří. Topic Maps: Tutoriál [online]. 2006, s. 5 [cit. 2014-07-16]. Dostupné z: http://www.kosek.cz/xml/tmtut/ 98 KOSEK, Jiří. Topic Maps: Tutoriál [online]. 2006, s. 7 [cit. 2014-07-16]. Dostupné z: http://www.kosek.cz/xml/tmtut/ 97
44
9.2.1 Modelační vrstva (The modeling layer) Modelační vrstva zahrnuje Referenční Model („Reference Model“ – RM) a Standardní Aplikační Model („Standard Application Model“ – SAM).99 Referenční modely obecně popisují, jaké procesy je třeba zavést, abychom dosáhli konkrétního výsledku. TMRM (Topic Maps Reference Model) popisuje, jak slučovat mezi objekty Topic Maps za účelem vytvoření integrované Topic Map. Slučovací metoda je založena spíše na shodnosti objektů než na jejich podobnosti. Nemohou být slučovány předměty, které mají odlišnou strukturu, byť spolu sémanticky korespondují.100 Referenční model vyžaduje minimální počet ontologických závazků potřebných pro sloučení znalostí o předmětech, bez ohledu na rozdílnost ontologií.101 Oproti Standardnímu aplikačnímu modelu je Referenční model záměrně abstraktnějším modelem Topic Maps a umožňuje tak Topic Maps sémantickou součinnost s jinými formalismy pro reprezentaci znalostí a ontologickými jazyky sémantického webu. Standardní aplikační model definuje formální datový model Topic Maps a jeho sémantiku v přirozeném jazyce.102 „Doplňkové ontologické vazby standardního aplikačního modelu zahrnují známé funkce Topic Maps jako název, výskyt a rozsah platnosti. SAM je definován na základě konvencí stanovených referenčním modelem ve W3C XML InfoSet103 stylu.“104
HUNTING, Sam. XML topic maps: creating and using topic maps for the Web. Boston: AddisonWesley, c2003, s. 56. ISBN 0201749602. 100 CHUNG, Hyun-Sook a Jung-Min KIM. ConflictDetection and Resolution in Mergingof Topic Maps. In: 2007 International Conference on ConvergenceInformation Technology (ICCIT 2007). Gyeongju: IEEE, 2007, s. 907. ISBN 0-7695-3038-9. DOI: 10.1109/ICCIT.2007.328. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=4420375 101 HUNTING, Sam. XML topicmaps: creating and usingtopicmaps for the Web. Boston: AddisonWesley, 2003, s. 56. ISBN 0201749602. 102 DACONTA, Michael C., Leo J. ORBST a Kevin T. SMITH. The Semantic Web a guide to the future of XML, Web services, and knowledge management. Indianapolis, Ind: Wiley, 2003, s. 168. ISBN 9780471481133. 103 XML InfoSet – abstraktní datový model pro všechny XML dokumenty. Jeho účelem je poskytnout konzistentní soubor definic pro užití v jiných specifikacích, které potřebují upozornit na informace ve formátovaném XML dokumentu. XML InfoSet nepožaduje nějaké specifické rozhraní, tato specifikace prezentuje informační soubor skrze stromovitou strukturu. XML Information Set (Second Edition). World Wide Web Consortium - W3C [online]. © 2014 [cit. 2014-09-21]. Dostupné z: http://www.w3.org/TR/xml-infoset/ 104 „The SAM's additional ontological commitments include familiar topic map features like topic names, occurrences, and scopes. The SAM is defined based on the conventions established by the Reference Model, in W3C XML InfoSet style.“ HUNTING, Sam. XML topic maps: creating and using topic maps for the Web. Boston: AddisonWesley, 2003, s. 56 - 57. ISBN 0201749602. 99
45
9.2.2 Syntaktická vrstva (The syntax layer) Pro uložení datového modelu Topic Maps je třeba obsah map serializovat105. Zápis udává syntaxe106. Syntaktická vrstva Topic Maps zahrnuje nám již známou DTD (Definici typu dokumentu, která zajistí správnou strukturu našich dokumentů) a dokumentaci pro HyTM konstrukci (viz dále), konstrukci XTM a konstrukci pro základní syntaxi. Přidané dokumenty normy ukáží, jak serializovat SAM do syntaxe a deserializovat syntaxi do SAM. Dvě instance SAM budou považovány za sémanticky ekvivalentní, pokud produkují instance základní syntaxe, které jsou byte po bytu identické. Vzhledem k tomu, že XTM 1.0 je navržen tak, aby byl užitečný jak pro lidi, tak pro stroje, je tam někdy více značkovacích konstrukcí, které nahrazují stejné znalosti. Pořadí není v některých modelech obsahu podstatné. Základní syntaxe bude optimalizována pro strojové porovnávání identity například při testování shody.107 Nejčastěji využívanou syntaxí pro Topic Maps je již zmíněná XTM, setkat se však můžeme setkat s více možnostmi, které budou zmíněny v dalším textu. XTM (XML Topic Maps) Za vznikem této syntaxe stojí společnost TopicMaps.org, která se, jak již název napovídá, nechala inspirovat jazykem XML (eXtensible Markup Language), jehož největším přínosem je, že v textu můžeme používat vlastní značky (tagy). 108 Další výhodou může být, že XML je jednoduchým otevřeným formátem, který není úzce svázán s nějakou platformou nebo proprietární technologií, díky čemuž se stal standardním formátem pro výměnu a sdílení informací.109 Není divu, že je syntaxe Serializace – „proces, ve kterém je objekt nebo graf objektů převeden na lineární posloupnost bajtů. Výsledný blok paměti lze poté uložit nebo přenést po síti nad určitým protokolem.“ ESPOSITO, Dino. XML: efektivní programování pro .NET. 1. vyd. Praha: Grada, 2004, s. 439. ISBN 80247-0775-6. 106 Syntaxe se zabývá vnitřní strukturou zápisu slouženou z různých znaků, zkoumá uspořádání vztahů mezi znaky. Udává pravidla pro zápis v konkrétním jazyce. GÁLA, Libor. Podniková informatika: počítačové aplikace v podnikové a mezipodnikové praxi, technologie informačních systémů, řízení a rozvoj podnikové informatiky. 1. vyd. Praha: Grada, 2006, s. 20. ISBN 80-247-1278-4. 107 HUNTING, Sam. XML topic maps: creating and using topic maps for the Web. Boston: AddisonWesley, 2003, s. 62. ISBN 0201749602. 108 KOSEK, Jiří. XML pro každého: podrobný průvodce. 1. vyd. Praha: Grada, 2000, s. 11. Průvodce (Grada). ISBN 80-7169-860-1. 109 KOSEK, Jiří. XML pro každého: podrobný průvodce. 1. vyd. Praha: Grada, 2000, s. 14 - 15. Průvodce (Grada). ISBN 80-7169-860-1. 105
46
XTM, která na XML staví, jednoznačně nejrozšířenější a nejvyužívanější syntaxí, která je podporována všemi aplikacemi pro práci s Topic Maps. LTM (Linear Topic Maps) LTM je jednoduchá textová syntaxe definovaná firmou Ontopia, která je vhodná pro „ruční“ zápis Topic Maps. LTM slouží trošku jako shorthand pro psaní Topic Maps v obyčejném textovém editoru. To je užitečné při psaní krátkých Topic Maps pro osobní účely nebo při vyměňování částí Topic Maps skrze emaily. Tento formát může být konvertován do XTM.110 Díky své zmíněné jednoduchosti a kompaktnosti, jež umožňují psaní v jakémkoli textovém editoru, je tato syntaxe spolu s XTM jednoznačně nejvyužívanější a nejpodporovanější. HyTM (HyTime Topic Maps) Tato vůbec první syntaxe byla založena na jazyce HyTime, který využívá syntaxi SGML (Standard Generalized Markup Language)111. Jelikož je SGML obecným prostředkem pro definování jiných markup jazyků, jeho jazykové prostředky jsou příliš komplexní a složité. A tak zatímco jazyk SGML měl za úkol vyhladit nedostatky HTML, reakcí na nedostatky SGML byl vznik jazyka XML.112 Syntaxe založená na XML zastoupila syntaxi SGML také v Topic Maps, proto je syntaxe HyTM již minulostí. AsTMa AsTMa je další jednoduchou textovou syntaxí, která slouží podobným účelům jako LTM. Je-li totiž Topic Map psána manuálně, je mnohem více kompaktní. Stejně
STANESCU, Liana. Creating new medical ontologies for image annotation: a case study. New York: Springer, c2012, s. 54. SpringerBriefs in electrical and computer engineering. ISBN 14-614-1909-3. 111 SGML – „mezinárodní standard ISO 8879 pro definici reprezentace textu v elektronické podobě, která je nezávislá na použitém zařízení. Přesněji řečeno, SGML je metajazykem, který je určen pro formální popis jiných jazyků, v tomto případě jazyků typu markup. (…) Cílem SGML je nejen zachycení struktury textu, ale SGML je současně metajazykem pro popis nového markup jazyka. SGML je prostředkem pro vyjádření, co je v textu. Jak se s textem a jeho vyznačenými částmi bude zacházet, vždy záleží na použité aplikaci.“ SKLENÁK, Vilém. Data, informace, znalosti a Internet. Vyd. 1. V Praze: C.H. Beck, 2001, s. 195. C.H. Beck pro praxi. ISBN 80-7179-409-0. 112 SKLENÁK, Vilém. Data, informace, znalosti a Internet. Vyd. 1. V Praze: C.H. Beck, 2001, s. 197 198. C.H. Beck pro praxi. ISBN 80-7179-409-0. 110
47
jako je tomu u LTM, tak i zde však samozřejmě můžeme mapy konvertovat do XML.113 CTM (Compact Syntax for TM) CTM by měla být novou standardizovanou syntaxí, která čerpá ze svých předchůdců. Na stránkách isotopicmaps.org je prozatím zveřejněna draft verze z roku 2010.114
9.2.3 Vrstva omezení a dotazování (The constraints and queries layer) Vrstva omezení a dotazování podle ISO zahrnuje Topic Map Query Language (TMQL)115 a Topic Map Constraint Language (TMCL)116. Cílem dotazovacího jazyka (TMQL) je, abychom si v mapě mohli vybrat ty informace (témata či vztahy), které nás zajímají. Bez podobné možnosti bychom se v rozsáhlých Topic Maps mohli snadno ztratit. Jazyky pro omezení (např. TMCL) zase využijeme tehdy, když potřebujeme, aby mapa byla konzistentní (např. každý člověk musí mít výskyt datum narození, který obsahuje platné datum)117.
STANESCU, Liana. Creating new medical ontologies for image annotation: a case study. New York: Springer, c2012, s. 54. SpringerBriefs in electrical and computer engineering. ISBN 14-614-1909-3. 114 Information technology — Topic Maps — Part 6: Compact Syntax. ISO Topic Maps [online]. 2008 [cit. 2014-10-02]. Dostupné z: http://www.isotopicmaps.org/ctm/ctm.html 115 Topic Map Query Language (TMQL) – TMQL – dotazovací jazyk vytvořen ISO. TMQL má tři typy příkazů – dotazů, jmenovitě příkazy popisující cestu, selektivní příkazy a FLWOR výrazy. Díky tomuto jazyku využívajícímu tří typů dotazů budeme schopni jednoduše zjistit, co potřebujeme, a udělat různorodé výstupy. MAICHER, Lutz a Jack PARK. Charting the topic maps research and applications landscape: first International Workshop on Topic Maps Research and Applications, TMRA 2005, Leipzig, Germany, October 6-7, 2005 : revised selected papers. Berlin: Springer, c2006, s. 45. Lecture notes in computer science, 3873. ISBN 9783540325277. 116 „ TMCL obohatí topic maps o možnosti databázových schémat, čímž umožňuje nadefinovat různá omezení pro jednotlivé významy.“ „TMCL will give a database schema-like capability to topic maps enabling constraints on the meaning to be defined for topic maps.“ DACONTA, Michael C., Leo J. ORBST a Kevin T. SMITH. The Semantic Web a guide to the future of XML, Web services, and knowledge management. Indianapolis, Ind: Wiley, 2003, s. 168. ISBN 9780471481133. 117 KOSEK, Jiří. Topic Maps: Tutoriál [online]. 2006, s. 26 [cit. 2014-07-16]. Dostupné z: http://www.kosek.cz/xml/tmtut/ 113
48
10. Oblasti užití Topic Maps Jak již bylo řečeno, Topic Maps jsou jednou z forem reprezentace znalostí. Již tento samotný fakt dává tušit, že nejčastější využití Topic Maps nalezneme v oborech jako je informační management, management znalostí a samozřejmě knihovnictví. V informačním managementu Topic Maps nabízejí způsob pro organizaci, získávání a navigaci v informačních zdrojích. V managementu znalostí jsou formalizmem pro reprezentaci znalostí, v knihovnictví jsou pak způsobem, jak zaznamenat znalosti o libovolném předmětu, včetně jeho vztahů k předmětům dalším.118 Topic Maps mohou být využity v podstatě v jakémkoli odvětví, přičemž primární předměty zájmu tohoto odvětví, a ani věci s nimi související, nejsou z hlediska obecného modelu Topic Maps nijak podstatné. To ostatně potvrdí také následující text, kde budou uvedeny konkrétní případy využití Topic Maps.
10.1 Využití Topic Maps v e-learningu Vyučování formou e-learningu je v poslední době stále rozšířenější. Proto se také oblast e-learningu rychle rozvíjí a jeho nevýhody, jako např. často zmiňovaná nemožnost přímého kontaktu s vyučujícím, jsou vyvažovány poskytováním dalších výhod, které tato forma vzdělávání nabízí. Vzhledem ke koncepci Topic Maps zřejmě není s podivem, že v oblasti e-learningu nalezly své uplatnění velmi rychle. Podíváme-li se na konkrétní využití Topic Maps v e-learningu, příkladem může být aplikace BrainBank learning119. Jedná se o pedagogický nástroj pro žáky a studenty každého věku, který umožňuje studentům vytvářet a strukturovat vlastní mapy. „Účelem je pomoci studentům osvojit si lepší učební strategie (hledat klíčové koncepty a jejich vztahy) a pomoci jim zaznamenat a strukturovat, co se naučili. Učitelé mají přístupy k BrainBanks svých studentů a mohou je komentovat a diskutovat o nich se studenty.“120 KOSEK, Jiří. Topic Maps: Tutoriál [online]. 2006, s. 3 [cit. 2014-07-16]. Dostupné z: http://www.kosek.cz/xml/tmtut/ 119 Tomuto nástroji se budeme věnovat více v kapitole Možnosti tvorby Topic Maps. 120 „The purpose is to help students adopt better learning strategies (looking for key concepts and their relations) and to help them record and structure what they have learned. Teachers have access to the students' brainbanks and can comment on them and discuss them with students.“ BrainBank Learning. Ontopia [online]. 2001 [cit. 2014-06-24]. Dostupné z: http://www.ontopia.net/page.jsp?id=brainbank 118
49
Využití nástrojů jako je BrainBank však nepřijde ideální každému, neboť jsou přímo cíleny na podporu rozvoje aplikací pro tvorbu Topic Maps jako např. Ontopia.121 Jak je uvedeno v článku „Visualizing Topic Maps for e-Learning“122, Topic Maps umožňují začlenit vyučovaný obsah do sémanticky bohatých datových modelů. Je tedy výzvou vyvíjet pro e-learning dobrá grafická uživatelská rozhraní v aplikacích založených na Topic Maps modelu. Zde se však setkáváme s problémem, neboť většina Topic Maps editorů a prohlížečů (stejně jako nejznámější Omnigator) nepodporují konkrétní ontologické potřeby a specifické doménové slovníky. Namísto toho mají tendenci využívat právě koncepty jako vztahy, výskyty, atd. Specializované e-learningové aplikace založené na Topic Maps však vyžadují rozhraní, která podporují předměty spřízněné s podporou ontologie pro klasifikaci, navigaci a prohlížení konceptů, instancí, vztahů a zdrojů v posuzovaném předmětu domény. Můžeme si tedy představit další významné prostředí spojené s e-learningem – prostředí pro doplnění existujících Topic Maps editorů a vizualizačních nástrojů pro oblast e-learningu. Toto prostředí se nazývá „TM4L“ („Topic Maps For eLearning“) a slouží k tvorbě, udržování a používání e-learningových repozitářů. TM4L je založeno na myšlence, že přístup ke studijním materiálům v podobě Topic Maps může přemostit propast mezi vyučovaným a cílovými znalostmi. 123 Projekt TM4J kombinuje dvě hlavní aplikace – TM4L Editor a TM4L prohlížeč. Také jazyk TM4L je založen na standardu Topic Maps. TM4L se zaměřuje na dvě cílové uživatelské skupiny – na autory a správce Topic Maps a na vyučované uživatele, kteří hledají informační podporu při řešení svých úkolů. Topic Maps využívají prvků, jako jsou Témata, Výskyty, Vztahy nebo Typy. TM4L prohlížeč tento formát podporuje za použití šesti indexů. Když uživatel zvolí hlavní objekt (Téma, Výskyt, Vztah etc.), zobrazí se v mapě ve více panelech – jednak ve formě stromového diagramu, jednak ve formě grafu/textu. Náhled v každém panelu může být měněn na jakékoli další dva. Uživatel může pokračovat DICHEVA, Darina a Christo DICHEV. TM4L: Creating and browsing educational topic maps. British Journal of Educational Technology. 2006, vol. 37, issue 3, s. 391-404. DOI: 10.1111/j.14678535.2006.00612.x. Dostupné z: http://doi.wiley.com/10.1111/j.1467-8535.2006.00612.x 122 DICHEVA, Darina, Christo DICHEV a Dandan WANG. Visualizing topic maps for e-learning. Fifth IEEE International Conference on Advanced Learning Technologies (ICALT'05). IEEE, 2005, s. 950951. DOI: 10.1109/ICALT.2005.305. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=1508866 123 DICHEVA, Darina a Christo DICHEV. TM4L: Creating and browsing educational topic maps. British Journal of Educational Technology. 2006, vol. 37, issue 3, s. 391-404. DOI: 10.1111/j.14678535.2006.00612.x. Dostupné z: http://doi.wiley.com/10.1111/j.1467-8535.2006.00612.x 121
50
v prohlížení vyučovaného obsahu vybíráním objektů spřízněných s právě předváděným. Uživatel si také může zvolit, ve kterém panelu chce informace o daném objektu prezentovat. Tím je umožněno procházení různých objektů spřízněných s aktuálně prohlíženým objektem, aniž bychom hlavní objekt opustili.124 Díky předchozímu textu můžeme vidět, že v e-learningu se Topic Maps uplatní nejen v podobě aplikace různých prostředí pro jejich tvorbu, ale také v modifikované podobě přiblížené e-learningovému prostředí. Využití Topic Maps v e-learningu tedy může být skutečně bohaté.
10.2 Využití Topic Maps v lékařství Na možnost využití Topic Maps v lékařství odkazuje např. článek „Automatic generation of medical recommendations using topic maps as knowledge source“ 125. Ačkoli je však tento článek zaměřen na oblast lékařství, základní myšlenku, jíž prezentuje, lze vztáhnout na jakoukoli jinou oblast. V příštích odstavcích si stručně shrneme, co je podstatou tohoto článku. Je samozřejmé, že lékařská dokumentace a protokoly mohou být různě upravovány, přeměňovány, aktualizovány atd. Tyto změny jsou dány změnami v lékařských databázích a lékařských předpisech. Chceme-li umožnit rychlejší implementaci nových medicínských poznatků, snadnější udržovatelnost jednotlivých databází apod., nemůžeme se vyhnout implementaci speciálních počítačových programů, jež nám podobné věci umožňují. Se speciálními programy můžeme také dosáhnout dokonalé vizualizace některých lékařských dat (např. krevní tlak), čímž se naše data stávají přehlednějšími. Lékařské informace jsou ukládány na mnoha místech a mohou být více nebo méně strukturované. Standard Topic Maps přináší možnost pracovat jak s těmi strukturovanými, tak s těmi nestrukturovanými daty. Topic Maps mohou být DICHEVA, Darina, Christo DICHEV a Dandan WANG. Visualizing topic maps for e-learning. Fifth IEEE International Conference on Advanced Learning Technologies (ICALT'05). IEEE, 2005, s. 950951. DOI: 10.1109/ICALT.2005.305. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=1508866 125 DRAGU, D., V. GOMOI a V. STOICU-TIVADAR. Automatic generation of medical recommendations using topicmaps as knowledge source. 2011 6th IEEE International Symposium on Applied Computational Intelligence and Informatics (SACI). IEEE, 2011, s. 593-597. DOI: 10.1109/SACI.2011.5873072. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=5873072 124
51
využity pro získání dat obsažených v informačních objektech, k propojení témat způsobem, který umožňuje navigaci mezi nimi, mohou být také využity k filtrování jednotlivých informačních souborů a pro poskytnutí struktury nestrukturovaným informačním objektům. Navíc architektura Topic Maps umožní jejich vzájemné slučování bez nutnosti jejich kopírování nebo přepracování. V dnešní „informační době“ již zkrátka nestačí informace ukládat a třídit, je nutností nalézt možnost, jak se v jejich kvantech dobře zorientovat a Topic Maps takovou možnost nabízí. Umožňují nám virtuálně reprezentovat jakýkoliv druh informační struktury nebo datového modelu a poskytují nám dokonalejší informační správu. Stejně tak nám poskytují lepší dohledatelnost skrze propojení oddělených systémů a porovnávání různých poznatků z různých zdrojů. Díky tomuto standardu má uživatel možnost nejen nalézt informace, ale také objasnit si souvislosti a v neposlední řadě zjistit, jak je která daná informace relevantní ve spojitosti s konkrétním tématem. Z předešlého textu je jasně patrné, že ačkoli je využití Topic Maps v oblasti lékařství nepochybně výborným prostředkem pro reprezentaci znalostí z této oblasti, mohl by být model Topic Maps neméně efektivně vztáhnut na jakoukoli další oblast – od dalších přírodních věd až po vědy humanitní, kde můžeme prostřednictvím modelu Topic Maps prezentovat např. historické panovníky v souvislosti s činy, jimiž se proslavili, místy, kde působili, či dalšími panovníky a jinými osobnostmi, s nimiž byli v jakémkoli vztahu.
11. Sémantický web vs. Topic Maps 11.1 Co je Sémantický web Pojem „Sémantický web“ je v současné době diskutován velice často, oproti Topic Maps jde o termín podstatně rozšířenější a sledovanější. Co tedy Sémantický web je a jaké je jeho spojení s Topic Maps? Nejdříve se zaměříme na první z otázek – co je Sémantický web. Patrně jedna z nejznámějších definic zní následovně: „Sémantický web je rozšířením současného webu; informace v něm mají přidělen dobře definovaný význam lépe umožňující počítačům a lidem spolupracovat. Sémantický web představuje reprezentaci dat na WWW. Je založen na technologii Resource Description Framework (RDF), která 52
integruje širokou škálu aplikací využívajících syntaktický zápis v XML a identifikátory URI pro pojmenování.“126 Předchozí definice již sama napověděla, co stálo za vznikem sémantického webu. Odborník na informační a znalostní inženýrství Vilém Sklenák to vysvětluje následovně: „Dosud se setkáme se dvěma generacemi webových stránek – statických (vytvářených ,ručně‘ nebo pomocí specializovaných editorů) nebo dynamických (generování obsahu na základě dotazu z databáze, přičemž se ve stále větší míře uplatňuje XML). Vyhledávače nerozumí přirozenému jazyku (porovnávají řetězce znaků). Sémantický web neslouží pouze k vyhledávání, ale i pro rozličné aplikace, v nichž je žádoucí podrobně strukturovat informace z hlediska obsahového.“127 V čem se sémantický web a Topic Maps podobají, je zřejmé. Shodný je jejich účel – reprezentace znalostí. Zásadním rozdílem však je, pro koho jsou tyto modely určeny. Sémantický web je určen pro strojové zpracování. Většina RDF dat, která jsou určena strojům, nebude člověku srozumitelná. Oproti tomu Topic Maps jsou určeny právě lidem, které navigují mezi informačními zdroji a uvádějí je do kontextu různých problematik. Jiří Kosek provedl základní srovnání Topic Maps se sémantickým webem formou následující tabulky: TM
SW
Autor
ISO
W3C
Vznik
2000
1999
Základ Reprezentace znalostní určená především Řešený problém
rejstříky, tezaury, … pro lidi
formální logika, teorie grafů pro stroje
zlepšení zpracování informací aplikováním technologií pro reprezentaci znalostí
Tabulka 1: Rozdíly mezi Topic Maps a sémantickým webem (převzato z 128) GÁLA, Libor, Jan POUR a Zuzana ŠEDIVÁ. Podniková informatika. 2., přeprac. a aktualiz. vyd. Praha: Grada, 2009, s. 83. Expert (Grada). ISBN 978-80-247-2615-1. 127 Sémantický web (Vilém Sklenák). Ikaros [online]. 2003, roč. 7, č. 5/2 [cit. 05.11.2014]. Dostupné z: http://www.ikaros.cz/node/1374. urn:nbn:cz:ik‐001374. ISSN 1212-5075. 128 KOSEK, Jiří. Topic Maps: Tutoriál [online]. 2006, s. 40 [cit. 2014-07-16]. Dostupné z: http://www.kosek.cz/xml/tmtut/ 126
53
Nutno podotknout, že v této tabulce nejsou zahrnuty konkrétní problémy jako odlišná technická řešení některých částí modelů, jež rozhodně nejsou triviální záležitostí a tvoří významnou překážku ohledně možného sloučení modelů. Možnosti sloučení sémantického webu a Topic Maps se probírají v podstatě od jejich počátků. Již konference „Extreme Markup Languages 2000“ z roku 2000 obsahovala také jakousi diskuzi mezi zástupci z Topic Maps komunity a RDF komunity. Cílem bylo zjistit, který model je ten lepší. Nakonec se dospělo ke společnému závěru, že jsou si velice podobné. Při závěrečných řečech na této konferenci byly komunity vyzvány, aby bylo určeno, jak budou společně koexistovat, a aby to oficiálně oznámily, jelikož bez oficiálního stanoviska v tom uživatelé měli logicky zmatek.129 Ačkoli byla na zmíněné konferenci vedena různá jednání, k požadovanému ujasnění údajně nedošlo. Na konferenci „Knowledge Technologies 2002“ o dva roky později bylo večerní setkání zaměřené na započetí toho, co by mohlo být RDF schéma pro Topic Maps, což se zdálo být pokrokem. Nicméně na té samé konferenci několik přednášejících hovořilo o „RDF Topic Maps“130, konkrétně ale o velice rozdílných věcech, což vedlo k ještě většímu zmatení.131 Velká část zmatení ohledně vztahu těchto dvou modelů se vyskytuje stále, což nepřidává na popularitě ani jedné z komunit. Např. v článku „RDF, Topic Maps, and the Semantic Web“ se můžeme dočíst, že ačkoli jsou RDF a Topic Maps dva zcela odlišné přístupy vyvíjené odlišnými organizacemi, budou právě tyto dva přístupy nejspíše základními kameny sémantického webu.132 Častějším se však zdá být názor, že sémantický web je postaven na RDF, a díky tomu bývají pojmy „sémantický web“ a „RDF“ využívány skoro až jako synonyma, zatímco Topic Maps jsou považovány za něco odlišného. Základní rozdíly mezi oběma standardy jsme si již zmínili. Nyní se podíváme na (již rovněž zmíněné) technické odlišnosti obou modelů.
FREESE, Eric. So Why Aren’t Topic Maps Ruling the World. In: Extreme Markup Languages 2002 Conference, 4-9 August 2002, Montréal, Quebec, Canada. Montréal, Québec: Mulberry Technologies, Inc., 2002, 6 p. 130 O RDF Topic Maps (RTM) si více řekneme později v této kapitole. 131 Tamtéž 132 LACHER, Martin S. a Stefan DECKER. RDF, Topic Maps, and the Semantic Web. Markup Languages: Theory and Practice. 2001, vol. 3, issue 3, s. 313-331. Dostupné z: http://www.catchword.com/cgi-bin/cgi?body=linker 129
54
11.2 Srovnání technologií RDF a Topic Maps V článku „Living the Topic Maps and RDF“133. Jsou technologie RDF a Topic Maps porovnávány z hlediska následujících prvků: symboly a věci, výroky (názvy, výskyty, vztahy), identity, reifikace, kvalifikace, typy a podtypy a slučování. Stručný výtah ze zmíněného článku nám tedy ukáže základní shody a rozdílnosti mezi zmíněnými technologiemi: Symboly a věci RDF i Topic Maps jsou založeny na „identitách“. To znamená, že v obou případech je klíčovým konceptem „symbol“, který reprezentuje určitou identifikovatelnou věc, s níž můžeme spojit určitá tvrzení. Můžeme tedy například vytvořit symbol, který tvrdí, že „toto reprezentuje osobu“, poté přiřadíme jméno a skrze vztahy propojíme se spřízněnou věcí. Rozdílnost mezi technologiemi pak nacházíme zde: V Topic Maps je termínem pro věc „předmět“ a termínem pro pojem, který byl v mapě použit pro reprezentaci předmětu, je „téma“. V RDF pak bude pojmem pro věc „zdroj“ a termínem pro pojem, který je využit k prezentaci zdroje v RDF, je „uzel“. Výroky Významnější než to, jak se věci označují, je to, co o nich můžeme tvrdit. Zde již najdeme první rozdíl. U Topic Maps můžeme výroky o věcech tvořit třemi různými způsoby – „názvy“, „výskyty“ a „vztahy“. U RDF můžeme tvořit výroky o věcech pouze jedním způsobem – „výrokem“. Ten spřízňuje subjekt (uzel, o kterém se vyjadřujeme) a objekt (uzel, který je hodnotou) skrze vlastnost (uzel, který definuje vztah). Living the Topic Maps and RDF. Ontopia [online]. 2001 [cit. 2014-10-29]. Dostupné z: http://www.ontopia.net/topicmaps/materials/tmrdf.html 133
55
Identity Identity využijeme ke zjištění, že dva symboly reprezentují tu samou věc, dále pak identifikujeme, jak k tomu došlo a jaké jsou následky tohoto zjištění. Velice užitečné je to např. při automatickém slučování dat z různých zdrojů. U Topic Maps mohou být témata jako URI uzly, jež můžeme přiložit k mapě za účelem identifikace předmětů témat. Pokud nejsou uzlům připsány URI, může být téma jako prázdný uzel (prázdné uzly nenesou URI označení vypovídající o tom, který zdroj reprezentují, to je zjištěno prostřednictvím výroků o něm platících). Možnosti RDF jsou širší. Využít můžeme tří možností: - Literály134 - URI uzly – uzly, které nesou URI označení za účelem identifikace zdroje reprezentovaného uzlem. RDF pak usoudí, že uzly se stejným URI identifikují stejný zdroj. - Prázdné uzly Reifikace U Topic Maps je reifikace velmi prostá, vytvoříme téma a poté mu přidělíme identifikátor v podobě názvu, výskytu nebo vztahu, které chceme identifikovat. Poté může být toto téma využito jako jakékoli jiné, Topic Maps software však vědět, co téma reprezentuje, a podle toho bude jednat. RDF funguje odlišně. Nejdříve musíme vytvořit prázdný uzel typu „rdf:Statement“. Poté je využit speciální slovník pro přidání subjektu, vlastnosti a objektu prostřednictvím tvrzení. Takto to funguje, nicméně je to podivné, protože s reifikovaným tvrzením musí být nakládáno jiným způsobem než s ostatními tvrzeními. Při pohybu z jednoho uzlu na druhý skrze tvrzení o hodnotě X jsou
„RDF umožňuje literály (jednoduché datové hodnoty), které se objevují jako předměty tvrzení. Tyto literály mohou být popsány datovým typem, který definuje lexikální prostor (reprezentace), prostor hodnot (aktuální hodnoty), mapování mezi nimi a možné operace na hodnotách.“ „RDF allows literals (simple data values) to appear as object of statements. These literals can by typed with a datatype, which defines a lexical space (representation), a value space (actual values), mappings between these two, and possibly operations on values.“ Multimedia semantics: metadata, analysis, and interaction. 1st ed. Editor Benoit Huet, Simon Schenk, Raphael Troncy. Chichester: John Wiley & Sons Ltd., 2011, xxii, s. 84. ISBN 978-0-470-74700-1. 134
56
reifikovaná tvrzení procházena odlišným způsobem, než jak je tomu u nereifikovaných, což znamená, že je s reifikací obtížné pracovat. Kvantifikace Někdy je třeba kvalifikovat tvrzení o věcech podle toho, jaká autorita označila tvrzení za pravdivé, jaký je zdroj tohoto tvrzení, nebo v jakém kontextu je toto tvrzení pravdivé. U Topic Maps je pro tento účel zabudována vlastnost „obory platnosti“ („scopes“). U RDF pro tento účel žádná vlastnost zabudována není, vyjma faktu, že literály mohou obsahovat identifikátory jazyka, což je určitý způsob kvalifikace. Je možné docílit kvalifikace skrze deifikaci, v praxi však toto řešení příliš populární není. Typy a podtypy Topic Maps standard poskytuje předdefinované typy spříznění typů pro „type-instance“ a „supertype-subtype“ vztahy. Oba tyto prvky jsou součástí Topic Maps standardu. V RDF může být typ zdroje určen za využití tvrzení s vlastností „rdf:type“, která je pro změnu součástí samotného RDF. Podtřídy jsou vyjádřeny vlastností „rdfs:subClassOf“, která je spíše součástí RDF Schema, než samotného RDF. Slučování V Topic Maps jsou sloučena témata, která mají shodný identifikátor předmětu nebo lokátor předmětu. Nové standardy však umožňují slučovat témata také na základě identifikace jim přiřazených charakteristik. V RDF namísto témat slučujeme uzly se shodnými literály nebo uzly, které využívají totožné URI. Slovníky vyšších úrovní jako DAML+OIL a OWL pak poskytují také mechanismy, které umožňují identifikaci uzlů, jež je vyvozena z výroků o nich. 57
11.3 Shrnutí Budoucí vývoj vztahu mezi RDF a Topic Maps lze předpovídat jen stěží. Za určitý pokrok lze považovat pokus o možnou konverzi z jednoho formátu do druhého např. prostřednictvím tzv. XTM2RDF Translatoru. Tento „překladač“ byl představen za účelem jeho využití pro převedení dokumentů vyjádřených v XTM syntaxu do požadovaného RDF syntaxu. Jeho součástí byl také „slovník“ „RTM“ (RDF Topic Maps).135 Takový slovník zahrnuje jak RDF slovníky, tak slovníky Topic Maps. Právě za využití těchto slovníků a následného „překladu“ lze data automaticky konvertovat.136 Nutno podotknout, že kvalita výsledků při převádění z jednoho formátu do druhého rozhodně nebyla příliš uspokojivá, jak ukazuje např. výzkum „A Survey of RDF/Topic Maps Interoperability Proposals“ z roku 2005.137 Možnost provádět konverzi mezi formáty dnes nabízí některé nástroje pro práci s Topic Maps, jako je Ontopia knowledge Suite nebo TM4L, o kterých si něco více povíme později. Z výsledků prezentovaných v bakalářské práci Daniela Kouby z roku 2007, kde se autor práce konverzí zabýval, můžeme zmínit následující závěry: Zatímco TM4L označil autor práce za nástroj, který je pro konverzi z Topic Maps do RDF nepoužitelný, nástroj od Ontopie byl hodnocen velmi kladně. Na druhé straně konverzi z RDF do Topic Maps nástroj od Ontopie neumožňoval, TM4L nástroj byl pak v práci označen za postačující pro práci s jednoduchými výroky, avšak nedostatečný v případě vyšších nároků.138 Možnosti převádět z jednoho formátu do druhého mohou být považovány za základy možného budoucího sloučení obou formátů. Zda však k tomuto sloučení dojde a kdy tomu tak bude, to bude muset ukázat budoucí vývoj obou formátů. Zda tedy RDF a Topic Maps budou fungovat víceméně nezávisle na sobě, zda se budou doplňovat nebo se dokonce sloučí, to jsou otázky, na které v současné době není možné nalézt odpověď.
DOSCH, Walter, R LEE a Chisu WU. Software engineering research, management and applications: second international conference, SERA 2004, Los Angeles, CA, USA, May 5-7, 2004 : selected revised papers. Berlin: Springer, 2005, s. 125. ISBN 978-354-0321-330. 136 The RTM RDF to Topic Maps mapping. Ontopia [online]. 2013 [cit. 2014-10-06]. Dostupné z: http://www.ontopia.net/doc/current/misc/rdf2tm.html#N1002A 137 A Survey of RDF/Topic Maps Interoperability Proposals. WorldWide Web Consortium - W3C [online]. 2005 [cit. 2014-09-21]. Dostupné z: http://www.w3.org/TR/2005/WD-rdftm-survey20050329/ 138 KOUBA, Daniel. Transformace mezi Topic Maps a RDF/OWL. Praha, 2007. 51 s. Diplomová práce. Vysoká škola ekonomická v Praze, Fakulta informatiky a statistiky, Informační a znalostní inženýrství. Vedoucí práce Doc. Ing. Vojtěch Svátek, Dr. 135
58
12. Výhody a nevýhody spojené s využíváním Topic Maps Vše má svá pro i proti a u Topic Maps tomu samozřejmě není jinak. Topic Maps mají spoustu výhod, najdeme však proti nim také negativní ohlasy, jak uvidíme v části shrnující nevýhody standardu.
12.1 Výhody Původní námět pro tvorbu Topic Maps byl rozvinut z myšlenky vylepšených knižních rejstříků139. Dnešní využití však nabízí rozsáhlejší možnosti, z nichž některé lze zcela jistě označit za výhody tohoto standardu. Pokud bychom měli shrnout klíčové přínosy Topic Maps, neměli bychom opomenout intuitivní navigaci na základě témat a vztahů a samozřejmě sémantické dotazování nad znalostním modelem. Jako další klíčové přínosy bychom mohli určit personalizované pohledy na data, či agregované informace z několika zdrojů díky slučování.140 Topic Maps však poskytují celou řadu více či méně významných výhod, které budou pro lepší přehlednost shrnuty v následujících bodech. Sémantická kategorizace znalostí – Jak již bylo víckrát řečeno, největší výhodou Topic Maps je fakt, že jde o sémantickou kategorizaci znalostí. Topic Maps nám nedávají pouze informace, ale informace s významem. Co více, Topic Maps přidávají datům význam, aniž by je měnily. Jediná mapa může popsat několik souborů informací, stejně jako mnoho Topic Maps může být aplikováno na jediný informační soubor, což je např. u personálního a komunitního řízení velmi ceněnou výhodou. Topic Maps pracují na vyšší sémantické úrovni, přímo v mapě je uložená informace, že právě toto je název, tamto je role ve vztahu a ono zase výskyt, což je nesporně velkou výhodou. Sémantické portály – Topic Maps slouží k definování informační architektury webu. Díky organizační struktuře Topic Maps je portál dokonale přehledný – každé stránce odpovídá jedno téma. Topic Maps jsou V originále „back-of-the-book indexes“ – abecedně řazené rejstříky na konci knih KOSEK, Jiří. Topic Maps: Tutoriál [online]. 2006, s. 35 [cit. 2014-07-16]. Dostupné z: http://www.kosek.cz/xml/tmtut/ 139 140
59
také základem pro automatické vkládání navigace na stránky, což umožňuje snadný přechod na související informace. Partnerské portály pak mohou využít Topic Maps pro snadné propojení se pomocí vzájemného sloučení jejich Topic Maps. Takovou možnost poskytuje Topic Maps Remote Access Protocol (TMRAP) – „rozhraní webové služby navržené tak, že si klade za cíl umožnit vzájemnou spolupráci napříč internetem pro aplikace Topic Maps i pro systémy nezaložené na Topic Maps, za účelem připojení k serverům Topic Maps pro přidávání nebo získávání dat.“141 Sloučitelnost map – Další již několikrát probíraná výhoda, která však nesmí v souhrnném výčtu chybět. Topic Maps lze slučovat podle identity, tvoří tedy agregovaný zdroj informací. Flexibilnost modelu – Oproti systémům jako je celosvětově známý „Open Directory Project“142, nebo oproti většině nejvyužívanějších knihovnických systémů, Topic Maps nejsou řazeny hierarchicky. Jednotlivé objekty lze jakkoli provázat, aniž bychom udali pevnou a neměnnou strukturu systému. Mapy jsou tak zcela flexibilní, mohou být jakkoli poupravovány, obměňovány a doplňovány, aniž by došlo k určitému narušení nějaké hlavní systémové struktury. Topic Maps nabízejí mnohem více než taxonomie a mohou být v budoucnu rozšiřovány bez jakéhokoli omezení. Provázanost jednotlivých položek – Oproti nástrojům, které poskytují reprezentaci znalostí např. formou stromových schémat, Topic Maps mohou být propojeny jakýmkoli způsobem, přičemž se setkáváme s možností perfektní vzájemné provázanosti všech možných uzlů v modelu. Integrace knihovních katalogů – Jak již bylo zmíněno, Topic Maps jsou mimo jiné využívané v knihovnách – jakožto způsob, jak zachytit znalosti o libovolném předmětu a jeho vztahů k dalším předmětům. Toto využití Topic „A proposed web service interface that aims to make it possible for Topic Maps applications to interoperate over the network, and for systems not based on TopicMaps to connect to TopicMaps servers to add or retrieve data.“ MAICHER, Lutz a Jack PARK. Charting the topic maps research and applications landscape: first International Workshop on Topic Maps Research and Applications, TMRA 2005, Leipzig, Germany, October 6-7, 2005 : revised selected papers. Berlin: Springer, c2006, s. 53. Lecture notes in computer science, 3873. ISBN 9783540325277. 142 ODP – Open Directory Project – největší lidmi budovaný katalog internetových stránek, který je vlastněn společností AOL (America online) pro poskytování internetových služeb, vytvářený je však dobrovolnými editory z celého světa. DMOZ: Open Directory Project [online]. 2012 [cit. 2014-07-06]. Dostupné z: http://www.dmoz.org 141
60
Maps však není jediné, které může být pro knihovny přínosem. Větší knihovny mají často z historických důvodů více nezávislých katalogů, přičemž tyto katalogy používají rozdílná klasifikační schémata a tezaury. Vyhledávání v katalozích je tak zdlouhavější a složitější. Topic Maps umožňují všechny tyto katalogy jednoduše sloučit. Integrace knihovních katalogů je tedy rovněž nezanedbatelnou výhodou, jak lze Topic Maps v knihovnictví využít.143 Kladení důrazu na intuitivnost u nástrojů pro tvorbu Topic Maps – Jelikož jsou Topic Maps poměrně unikátní, zabere seznámení se s nimi určité množství času. Tvůrci nástrojů pro tvorbu Topic Maps se snaží uživatelům toto seznamování se usnadnit alespoň tím, že při jejich tvorbě kladou důraz na co možno největší intuitivnost pro jejich následné používání.144 Identifikace témat – Různá témata mohou mít více názvů či jiných charakteristik, které se dají filtrovat pomocí oborů pravdivosti. Systém tedy zvolí témata nejvhodnější a zobrazí ty. Topic Maps jsou tak vhodné i pro uchování znalostí v mnohojazyčných verzích. Za zmínku stojí také propracovaný systém identifikace tématu jako zdroje nebo předmětu z reálného světa na základě URI zdroje nebo URI jednoho či více lokátorů předmětu145. Topic Maps pracují na vyšší sémantické úrovni, přímo v mapě je uložená informace, že právě toto je název, tamto je role ve vztahu a ono zase výskyt. Topic Maps mají mnoho dalších výhod. Jmenovat ještě můžeme reifikaci – možnost vytvoření tématu z čehokoli, co se v mapě vyskytuje (např. ze vztahu, názvu, celé mapy témat), dále pak dlouhou životnost informací v Topic Maps zachycených, nebo snadnost vytváření a přehlednost při vizualizaci či procházení informací v mapách. KOSEK, Jiří. Topic Maps: Tutoriál [online]. 2006, s. 31 [cit. 2014-07-16]. Dostupné z: http://www.kosek.cz/xml/tmtut/ 144 KERN, Isabelle. The suitability of topic maps tools for knowledge creation with stakeholders. 1., Aufl. Bern: Haupt, 2009, s. 178. ISBN 3258075158. 145 URI – „zkratka pro uniformní identifikátor zdroje (Uniform Resource Identifier) zavedený původně pro jiné účely, ale pro svou jednoznačnost využitý i k označení jmenných prostorů. (…) Podle W3C může být URI přiřazeno jakémukoliv objektu, abstraktnímu pojmu, osobě apod. Fakticky může jít o URL, ale i o identifikace jako dobře známé ISBN, rodné číslo apod.“ MLÝNKOVÁ, Irena a Jaroslav POKORNÝ. XML technologie: principy a aplikace v praxi. 1. vyd. Praha: Grada, 2008, s. 33. Průvodce (Grada). ISBN 978-80-247-2725-7. 143
61
Topic Maps mají však samozřejmě také četné nevýhody. Ty hlavní a zásadní z nich si představíme nyní.
12.2 Nevýhody Abychom byli objektivní, neměli bychom po výčtu četných výhod opomenout ani zmínění nedostatků. Tak jako vždy, také u Topic Maps se můžeme setkat s nevýhodami, nedostatky nebo omezeními, kterým by měla být věnována pozornost, aby mohly být postupným vývojem vyřešeny. Nevyjasněnost vztahu se sémantickým webem – Jedna z nejčastěji zmiňovaných nevýhod, s níž jsme se již setkali v kapitole pojednávající o sémantickém webu. Potíže při užívání nástrojů pro tvorbu – ačkoli jsou nástroje pro tvorbu Topic Maps intuitivní, poskytují zcela nový způsob vizualizace, na něž si uživatelé musí zvyknout. Dokonce i uživatelé, jež mají zkušenost s jinými internetovými nástroji, potřebují určitý čas, aby se mohli zorientovat. Komplexnost – Nástroje pro tvorbu Topic Maps umožňují konstrukci komplexů map, které se mohou na první pohled jevit jako matoucí. Někteří dotazovaní uživatelé měli zkušenosti s využíváním Mind Manager a byli zmateni, když byli konfrontováni s Topic Maps. Mind Manager prezentuje vztahy formou stromovité struktury. Jak již bylo řečeno ve výhodách, Topic Maps nabízí jiný způsob – mohou být vykresleny jakýmkoli způsobem, jaký si uživatel usmyslí, a všechny jejich uzly mohou být propojeny. To je na jedné straně velká výhoda, na druhé straně právě tato komplexnost může být i nevýhodou. Nicméně nástroje, které obsahují možnosti zoomování a filtrování, umožňují uživateli zredukovat komplexnost na základní stupeň.146 „Váha“ jednotlivých témat a vztahů – Manažeři užívající Topic Maps postrádají možnost vidět důležité položky na první pohled. Představení důležitosti jednotlivých témat by napomohlo zlepšení struktury a
KERN, Isabelle. The suitability of topic maps tools for knowledge creation with stakeholders. 1., Aufl. Bern: Haupt, 2009, s. 179. ISBN 3258075158. 146
62
následnému zjednodušení Topic Maps, tedy redukci zmatku, který je logicky uváděn jako velká slabina.147 Špatná možnost odvozování a nevhodnost pro strojové zpracovávání informací – tento nedostatek je dán zejména určením Topic Maps pro lidský faktor (nikoli pro stroje, jak je tomu u sémantického webu) a jejich vyšší sémantickou úrovní. Časová náročnost pro tvorbu – manuální tvoření Topic Maps vyžaduje velké množství času.148 Nejednotnost pojmů – tato nevýhoda se vztahuje zejména na české prostředí. Někdo Topic Maps označuje jako námětové mapy (mapy námětů), někdo jako tématové mapy (mapy témat). Pokud bychom chtěli výčet deseti hlavních „chyb“ Topic Maps, nalezneme je v článku „So Why Aren’t Topic Maps Ruling the World“149. Jelikož se jedná o článek velmi zajímavý, tak si oněch deset bodů jen stručně představíme: Topic Maps komunita se odpoutala od svých základů – Topic Maps byly původně zamýšleny jako knižní rejstříky. Původním cílem byla výměna informací a poskytnutí modelu, kde by rejstříky mohly být spojeny a bylo by možné se v nich pohybovat určitým inteligentním způsobem. Sekundárním cílem bylo přijít s nějakým široce rozšířeným využitím HyTime. Mnoho z členů Topic Maps komunity se však nechalo vtáhnout do „pobláznění“ okolo „znalostního managementu“ který momentálně hýbe průmyslem. Zdá se, že si myslí, že aby získali nějaké skutečné uznání, musí být Topic Mapy „vtlačeny“ kam to jen jde. Jediným způsobem, jak přitom dosáhnout nějakých úspěchů, je ukázat nějaké úspěchy v původní oblasti svého působení. KERN, Isabelle. The suitability of topic maps tools for knowledge creation with stakeholders. 1., Aufl. Bern: Haupt, 2009, s. 179. ISBN 3258075158. 148 GOLDHAMMER, L. a H.-B. WOYAND. Using topic maps to describe engineering knowledge and geometry of CAD-designed products. In: 2012 IEEE 16th International Conference on Intelligent Engineering Systems (INES). Lisbon: IEEE, 2012, s. 265-270. ISBN 978-1-4673-2695-7. DOI: 10.1109/INES.2012.6249842. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=6249842 149 FREESE, Eric. So Why Aren’t Topic Maps Ruling the World. In: Extreme Markup Languages 2002 Conference, 4-9 August 2002, Montréal, Quebec, Canada. Montréal, Québec: Mulberry Technologies, Inc., 2002, 6 p. 147
63
Zatímco úspěchy byly zdůrazňovány málo, problémy bily do očí – V počátcích Topic Maps byla snaha o jejich propagaci na různých konferencích poměrně velká. Pak ale propagace začala upadat. Zatímco se komunita kolem Topic Maps příliš nesnažila informovat veřejnost o vývoji Topic Maps a o svých úspěších, neúspěchy v podobě nekonzistentních dat u automaticky generovaných Topic Maps, nebo Topic Maps, které nebyly příliš bohaté a uživatelům nijak užitečné, byly výrazné velmi. Neobjevila se žádná skutečně silná a výrazná aplikace pro Topic Maps – RDF má Dublin Core, Open Directories, RSS a DAML+OIL, jejichž účelem je ukázat velký potenciál RDF. Topic Maps postrádají aplikaci, která by s nimi dokázala pracovat tak, aby ohromení uživatelé viděli úžasné možnosti, jež jsou jim nabízeny. Topic Maps podcenily význam PR – Komunita Topic Mapa dává až příliš najevo, že má své kořeny v SGML. Topic Maps trpí stejným osudem, jako SGML – nedostatkem PR. Výrazný odkaz na XTM bylo dobrým začátkem, ale poté PR pomalu upadlo do nicoty. Konceptuální balíčky pro Topic Maps nejsou kompletní – Topic Maps model potřebuje být dokončen vytvořením nějakého společného standardu. To zahrnuje konceptuální model, aplikační model, značkovací jazyk a omezovací jazyk. Různé organizace rovněž sdělily autorovi, že přijetí Topic Maps odkládají na dobu, než bude koncept kompletně definovaný ve standardech. Topic Maps již v ISO standardech jsou, nicméně stále chybí řada XTM specifikací, na nichž si pracují různé organizace potichu samy a různými způsoby, jelikož zcela kompletní a uznávaná standardizace je v nedohlednu. Proces sbližování Topic Maps a RDF požadovaný po XML 2000 se nevydařil – O této nevýhodě jsme již mluvili v kapitole o sémantickém webu. Extreme Markup Languages 2000 obsahovala i souboj mezi zástupci z Topic Maps komunity a RDF komunity. Cílem bylo zjistit, který model je ten lepší. Společné rozhodnutí bylo nakonec takové, že jsou si velice podobné. Při závěrečných řečech na této konferenci byly tyto dvě vyzvány, aby bylo ukončeno toto zmatení a bylo určeno, jak budou společne koexistovat – a dát to vědět světu. K tomu však nedošlo. 64
Existuje jen málo nástrojů (pokud vůbec nějaké), které umožňují s Topic Maps začít od nuly – Při prezentacích možností Topic Maps se najde mnoho lidí, kteří jsou zaujati. Pak však narazí na základní problém – jak začít s Topic Maps od nuly, když si chtějí mapu vyzkoušet, ale jejich znalosti jsou zatím pouze velmi povrchní? Podle článku mnoho možností (nástrojů) pro tyto uživatele není, což je nesporně velkou nevýhodou. Skutečně někdo ví, jak mají „obory platnosti“ fungovat? Pokud ano, proč to ostatním nepoví? – Obory platnosti jsou jednou z věcí, díky nimž jsou RDF a Topic Maps rozdílné. Dokonce i lidé z RDF uznali, že jím něco chybí, pokud se podívají na obory platnosti. Problémem je, že neexistuje určitá shoda ohledně toho, čím by měl obor platnosti být a jak by měl fungovat ve věcech zaměnitelnosti mezi aplikacemi Topic Maps. Někteří lidé budou zastávat teorii, že funkcionalitu oborů platnosti je nejlepší přenechat aplikaci. To však zní děsivě, jelikož to může znamenat, že ona funkcionalita pravděpodobně nebyla dostatečně specifikována. Schopnost vložit XTM syntax je omezená – Jedna z nejlepších věcí na RDF je, že může být zakotveno uvnitř dokumentu, i když jen v malém měřítku. Rozhodnutí XTM komise, aby Topic Maps byly samostatnou datovou sadou, zřejmě omezuje použitelnost na pouhou vyměnitelnost. Byly napsány práce o tom, jak zajímavé možnosti existují pro kombinaci XTM a SVG. Problémem je, že dle XTM definice Topic Map uvnitř SVG grafiky musí být jako celá jednotka, nikoli jako několik malých jednotek, které mohou být zcela promíchané, jako je tomu u RDF. Pojmenování omezení není dobrý nápad – Omezení názvů témat je pravidlo, které říká, že pokud dvě témata mají stejná jména a ten samý obor platnosti, tak musí reprezentovat to samé téma a měly by být tedy sloučeny. Přitom každý, kdo se někdy podíval na jméno Novák v telefonním seznamu, ví, že jména/názvy nejsou unikátní. Proč zatěžovat uživatele tvořící Topic Maps vytvářením jakéhosi problémového oboru platnosti jen za účelem zabránění slučování? Vydané identifikátory předmětu mohou dodat URI, které unikátně identifikují určitý předmět tím, o čem téma vypovídá. To dává mnohem větší smysl, než používání názvů.
65
Jak můžeme vidět, počet nevýhod, jež se k Topic Maps vztahují, není právě nejnižší. Nezbývá tedy než doufat, že jich bude ubývat. To je však opět otázkou budoucího vývoje.
13. Možnosti tvorby Topic Maps Zřejmě nejčastějším a poměrně jednoduchým způsobem, jak si vytvořit vlastní Topic Map, je využití nějakého nástroje přímo určeného pro tvorbu Topic Maps a tvorba mapy prostřednictvím tohoto nástroje. Byť by se však mohlo zdát, že je to jediné řešení, není tomu tak ani zdaleka. Nové mapy mohou vzniknout mnoha dalšími způsoby, jimž se budeme více či méně podrobně věnovat v této kapitole. Základem pro tuto kapitolu se stal článek „Overview of Topic Map Construction Approaches“150.
13.1 Slučování Topic Maps Slučování Topic Maps je jednou z nejvíce opěvovaných funkcí, které Topic Maps umožňují. Nutno podotknouti, že je tomu tak právem, možnost slučování map patří bezesporu k jedné z velkých výhod. Základem pro tuto funkci je fakt, že aplikace Topic Maps může využívat více map. Každá z těchto map může pocházet z odlišných zdrojů, může být generována odlišnými technikami nebo psána v odlišné syntaxi. Slučování se odehrává na základě shodnosti předmětu nebo názvů témat. Když dojde ke sloučení dvou map, měla by být témata, která reprezentují ten samý předmět, sloučena do jediného tématu. Výsledné téma obsahuje sdružené charakteristiky obou témat původních.151 Nejen slučování samotné, ale i jiný přístup k tvorbě Topic Maps je založen na myšlence slučování map. Spočívá v sémantické integraci učebních, na Webu umístěných zdrojů, které využívají standard Topic Maps. Tento přístup sestává ze
ELLOUZE, Nebrasse, Mohamed Ben AHMED a Elisabeth METAIS. Overview of Topic Map Construction Approaches. In: 22nd International Conference on Advanced Information Networking and Applications - Workshops (aina workshops 2008). Okinawa: IEEE, 2008, s. 1642-1647. ISBN 9780-7695-3096-3. DOI: 10.1109/WAINA.2008.158. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=4483156 151 ELLOUZE, Nebrasse, Mohamed Ben AHMED a Elisabeth METAIS. Overview of Topic Map Construction Approaches. In: 22nd International Conference on Advanced Information Networking and Applications - Workshops (aina workshops 2008). Okinawa: IEEE, 2008, s. 1645. ISBN 978-07695-3096-3. DOI: 10.1109/WAINA.2008.158. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=4483156 150
66
tří kroků, konkrétně z reprezentace učebních předmětů152, dále z učebních předmětů obohacených o sémantiku a konečně ze samotné sémantické integrace těchto učebních zdrojů. Učební zdroje v zásadě patří do odlišných repozitářů. Učební zdroje z učebních repozitářů jsou reprezentovány ve znalostním základě Topic Maps. Sémantika učebních zdrojů je začleněna v znalostním základě jako odkaz na koncepty DAML+OIL153 ontologie. Toto je zavedeno pro každý učební repozitář, což ve výsledku znamená jednu Topic Map pro každý repozitář. Sémantická integrace spočívá ve sloučení všech Topic Maps do jediné ucelené mapy.154
13.2 Mapování z RDF do Topic Maps Tato procedura zahrnuje tři kroky, během nichž jsou znalosti extrahovány z odlišných datových zdrojů (databází, webových stránek, informačních systémů atd.) nejprve do formy RDF modelu, nakonec do modelu Topic Maps. První z těchto kroků spočívá v rozpoznání objektů, což znamená nalezení výskytů spřízněných s daným předmětem ve zdrojových datech. Toho může být využito pro vytažení výroků o objektu, což může být užitečné pro znalostní základ. Ve druhém kroku již dochází k vytažení těchto výroků jakožto RDF výroků155. RDF využívá k výrokům o zdrojích tří možností – objektů (o čem daný předmět je), vlastností (co je předmětu Učební předmět (z anglického Learning Object – LO) – „nejmenší úsek aktuálního učebního materiálu, který může v kombinaci s jinými relevantními LO poskytnout smysluplnou informaci potřebnou k získání nových kompetencí. (…) Jeden ze základních principů LO je jeho opětovná využitelnost v kombinaci s různými materiály a jeho nezávislost na celkovém výsledku učebních materiálů.“ SCHULTZ, Rikke aj. Začneme s ODL. Antwerpen: Garant, 2005, s. 21. ISBN 9044119028. 153 DAML+OIL – DAML (DARPA Agent Markup Language) + OIL (the Ontology Inference Layer) je jazyk navržený tak, aby popisoval strukturu určité oblasti. Jazyk staví na přístupu orientovaném na předmět, popisujícím strukturu v termínech tříd a vlastností. Jedná se o sloučení jazyku vyvinutého americkou vojenskou institucí DARPA, jejímž cílem bylo vytvořit sémantický jazyk (DAML) a jazyka založeného na deskriptivní logice, který byl vyvinut skupinou několika evropských výzkumníků (OIL). HORRICK, Ian. DAML+OIL: a Description Logic for the Semantic Web. IEEE Data Engineering Bulletin. 2002, roč. 25, č. 1. 154 ELLOUZE, Nebrasse, Mohamed Ben AHMED a Elisabeth METAIS. Overview of Topic Map Construction Approaches. In: 22nd International Conference on Advanced Information Networking and Applications - Workshops (aina workshops 2008). Okinawa: IEEE, 2008, s. 1645. ISBN 978-07695-3096-3. DOI: 10.1109/WAINA.2008.158. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=4483156 155 RDF (z anglického Resource Description Framework) – infrastruktura, která umožňuje kódování, výměnu a opakované využití strukturovaných metadat. Je aplikací jazyka XML. Blíže řečeno se jedná o „obecný prostředek pro zápis metadat tak, aby je bylo možno zpracovávat různými aplikacemi, aby je bylo možno mezi těmito aplikacemi přenášet a aby jednou vytvořená metadata bylo možno opakovaně používat.“ SKLENÁK, Vilém. Data, informace, znalosti a Internet. Vyd. 1. V Praze: C.H. Beck, 2001, s. 353. C.H. Beck pro praxi. ISBN 80-7179-409-0. 152
67
připsáno) a hodnot (připsaných předmětu). Posledním krokem je mapování RDF výroků do témat a tématových charakteristik. Zde se rozděluje, co jsou názvy, co výskyty, co vztahy a nakonec se vše extrahuje do nové Topic Map.156 Nástroje, které umožňují konverzi z RDF do Topic Maps, budou popsány níže.
13.3 Automatická generace Topic Maps z XML dokumentů Automatická generace Topic Maps z XML může být provedena několika způsoby. Pro získání představy jsem zvolila k rozepsání alespoň jeden z nich – využití jazyka XSLT157 pro konverzi z XML do Topic Maps. Prvním krokem je ruční přepsání (harmonizace) relativně neměnné ontologie Topic Maps. To sestává z nadefinování ontologie typů a vztahů zachycujících datový model pro určitou předmětnou oblast. Druhým krokem je generování dodatečných Topic Maps prostřednictvím algoritmického procesu aplikovaného do instancí XML dokumentu. Třetí krok je ruční přepsání věcí, které nebyly zachyceny v prvních dvou krocích. To sestává ze zachycení informací nepřímo rozpoznatelných z označení, nebo uložených ve zdrojích, jež nejsou ve formátu XML. Výsledné Topic Maps jsou sloučeny, díky čemuž může být mapa tak bohatá, jako kdyby byla kompletně ručně přepsána. Sloučení Topic Maps umožňuje takto vygenerovaným XTMs, aby byly zkombinovány s tématickými informacemi, které nemohou být extrahovány za použití style-sheetu.
13.4 Vzájemná konstrukce Topic Maps jinými uživateli: Kolaborační přístup Tento přístup spočívá v tom, že se na tvorbě Topic Maps podílí mnoho uživatelů. Založen je na již zmíněném e-learningovém prostředí zvaném BrainBank learning, webové aplikaci pro konstrukci jednotlivých Topic Maps za účelem vyučování, kde vyučovaní mohou sestavovat jejich vlastní učební ontologii během ELLOUZE, Nebrasse, Mohamed Ben AHMED a Elisabeth METAIS. Overview of Topic Map Construction Approaches. In: 22nd International Conference on Advanced Information Networking and Applications - Workshops (aina workshops 2008). Okinawa: IEEE, 2008, s. 1643. ISBN 978-07695-3096-3. DOI: 10.1109/WAINA.2008.158. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=4483156 157 XSLT (eXtensible Stylesheet Language Transformation) – „jazyk pro transformaci dokumentů do jiných textových formátů. XSLT zajišťuje transformaci z XML do XML, což ve většině případů představuje transformaci schémat. Aplikace XSLT je obecná sada pravidel transformace, jejímž výstupem může být libovolný textový jazyk, včetně HTML, RTF (Rich Text Format) a WML (Wireless Markup Language).“ ESPOSITO, Dino. XML: efektivní programování pro .NET. 1. vyd. Praha: Grada, 2004, s. 279. ISBN 80247-0775-6. 156
68
kurzu nebo celého studia. Je pracováno se standardními internetovými prohlížeči a uživatelé vstupují do aplikace prostřednictvím vlastních účtů. Témata, s nimiž se studující setkávají během svých vzdělávacích aktivit, jsou zanesena a popsána. Následně mohou být tato témata propojena spojovacími frázemi pro uspořádání výroků nebo vztahů: Vyučovaný vytváří vlastní spřízněné sítě témat, jež reprezentují jeho znalosti. Tento způsob dokumentování učebního procesu nabízí studentovi porozumění studované oblasti umístěním znalostí do kontextu, nabízí také navigaci a přehled později získaných znalostí. Pro další popsání témat a vztahů pak mohou být k tématům přiloženy digitální zdroje jako obrázky či textové, zvukové nebo audiovizuální dokumenty. Tyto zdroje mohou být buď připojeny linky, nebo nahrány a uloženy v BrainBank aplikaci.158
13.5 Topic Maps Learning Záměrem posledního z přístupů je extrahování znalostí z webových stránek za účelem pomoci uživatelům nalézt na Webu relevantní informace. Konstrukční proces začíná definováním profilu Topic Maps (a jeho pozdější aplikací na webové stránky). Tyto profily charakterizují Topic Maps a napomáhají vyhodnotit jejich relevanci vzhledem k informačním potřebám uživatelů. Následně jsou analýzou identifikována témata, o něž není zájem, čímž je umožněno „pročištění“ map. Tato charakteristika Topic Maps nebo webových stránek, filtrování a seskupování jsou odvozeny z výsledků konceptuální klasifikace na algoritmech založeného Galois connections159 (Galoisova spojení) a Formal Concept Analysis160 (Formální konceptuální analýzy). Topic Maps charakteristika je založena na výpočetních ELLOUZE, Nebrasse, Mohamed Ben AHMED a Elisabeth METAIS. Overview of Topic Map Construction Approaches. In: 22nd International Conference on Advanced Information Networking and Applications - Workshops (aina workshops 2008). Okinawa: IEEE, 2008, s. 1644. ISBN 978-07695-3096-3. DOI: 10.1109/WAINA.2008.158. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=4483156 159 Galoisovo spojení – „spojení (s určitými vlastnostmi) mezi dvěma soubory objektů, které jsou většinou odlišných druhů. Toto spojení může poskytnout užitečný nástroj pro studování vlastností určitého druhu objektů na základě vlastností druhého (většinou více poznaného) typu objektů.“ „A Galois-connection is a connection, with certain properties, between two set sof objects, usually of different kinds. Such a connection can provide a useful toll for studying properties of one kind of object, based on the properties of the other (usually more well-known) kind of objects.“ DENECKE, Klaus. Universal algebra and applications in theoretical computer science. Boca Raton: Chapman, c2002, s. 31. ISBN 1-58488-254-9. 160 „Formální konceptuální analýza“ – algebraický model založený na Galoisově spojení. Jedná se o teorii konceptuální datové analýzy a zpracování znalostí. GANTER, Bernhard a Guy W MINEAU. Conceptual structures: logical, linguistic, and computational issues: 8th International Conference on Conceptual Structures, ICCS 2000, Darmstadt, Germany, August 2000 : proceedings. New York: Springer, 2000, s. 357. Lecture notes in computer science, 1867. ISBN 354067859x. 158
69
statistikách pro každý objekt mapy. Je požadováno vypočítat „váhový“ průměr těchto statistik. Každý objekt má určitou váhu, která je připsána vzhledem k jeho důležitosti v mapě. Slučovací algoritmus sestává ze seskupení témat, která sdílí běžné vlastnosti, za účelem poskytnutí jiné úrovně detailů Topic Maps.161
14. Nástroje pro práci s Topic Maps Nástrojů pro práci s Topic Maps existuje nemalé množství. Na stránkách TopicMap.com162 nalezneme seznam čítající bezmála šedesát takových nástrojů. Nutno však podotknout, že ne všechny jsou stále „aktivní“. V následující kapitole budou tedy představeny alespoň některé z těch předních a nejvyužívanějších.
14.1 Ontopia Ontopia poskytuje zcela kompletní balíček nástrojů pro vytváření, podporování a rozvoj aplikací založených na Topic Maps. Zcela právem je hlavním tahounem, co se týče softwaru pro práci s Topic Maps, verze Ontopia 1.0 byla uvedena již v polovině roku 2001 a v současné době je již k dispozici verze 5.3.0, jež vyšla na podzim roku 2013. V současnosti je Ontopia dostupná jako open source, ačkoli komerční podpora samozřejmě možná je. Stále je aktivně udržována a rozvíjena vývojáři, z nichž dva se na jejím rozvoji podílí již více než jedno desetiletí, podporu však nachází také u spolupracovníků v Německu, Nizozemí, Belgii a Norsku.163 Pokud bychom si měli stručně představit alespoň základní komponenty sestavy Ontopia, pak v samotném srdci by byl „The Ontopia Topic Maps Engine“, na němž jsou všechny další komponenty založeny. Jeho účelem je reprezentace, ukládání a zpřístupňování Topic Maps ostatním produktům, jež by bez těchto možností nemohly plnit svou práci.164 ELLOUZE, Nebrasse, Mohamed Ben AHMED a Elisabeth METAIS. Overview of Topic Map Construction Approaches. In: 22nd International Conference on Advanced Information Networking and Applications - Workshops (aina workshops 2008). Okinawa: IEEE, 2008, s. 1645. ISBN 978-07695-3096-3. DOI: 10.1109/WAINA.2008.158. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=4483156 162 Topic Maps - Tools. Www.topicmap.com/ [online]. 2000 [cit. 2014-10-06]. Dostupné z: http://www.topicmap.com/tools/ 163 About Ontopia. Ontopia [online]. 2001 [cit. 2014-10-06]. Dostupné z: http://www.ontopia.net/page.jsp?id=about 164 The Ontopia Topic Maps Engine. Ontopia [online]. 2001 [cit. 2014-10-06]. Dostupné z: http://www.ontopia.net/doc/current/engine/devguide.html#N1002B 161
70
Dalším základním komponentem by pak byl nástroj „Omnigator“. Tento nástroj nám umožňuje mapy prohlížet, vizualizovat, upravovat či slučovat. Omnigator nám umožňuje nahrávat Topic Maps v jakémkoli formátu – XTM, HyTM, LTM – nebo dokonce RDF. Omnigator se však nevyznačuje pouze zmíněnými základními vlastnostmi, dokáže také exportovat do celé řady syntaxí, přizpůsobit odlišné náhledy, produkovat filtrované podmnožiny na základě požadovaného rozsahu, provádět sémantickou kontrolu platnosti, apod.165 Mezi dalšími komponenty pod Ontopii spadajícími jmenujme Schema Tools, Query Engine, Full-text integration, Navigator Framework (navigační rámec) nebo RDBMS Backend Connector.
14.2 TM4J TM4J (Topic Maps For Java) je souborem open-source Java nástrojů, které poskytují rozhraní a standardní implementace pro import, manipulaci a export Topic Maps do XTM. Tento projekt momentálně sestává ze čtyř následujících částí:166 TM4J Engine – poskytuje podporu pro Tolog query language, pro importování XTM a LTM syntaxí, podporu pro exportování XTM syntaxe, či persistenci v Topic Maps zachycených informací v různých databázích. TMNav – desktopová aplikace pro prohlížení Topic Maps. Užívá intuitivní a přívětivé uživatelské rozhraní. Cílem je poskytnout jednak sadu nástrojů pro tvorbu prohlížečů a editorů Topic Maps, jednak referenční implementaci. Panckoucke – knihovna pro tvorbu abstraktních grafických reprezentací z Topic Maps. Tato knihovna poskytuje prostředky pro programátory, aby mohli vyzdvihnout data z Topic Maps do aplikačně specifičtější datové struktury. Datová struktura pak může být reprezentována v různých formátech zahrnujících Java datovou strukturu a XML reprezentaci.
Omnigator. Ontopia [online]. 2001 [cit. 2014-10-06]. Dostupné z: http://www.ontopia.net/omnigator/models/index.jsp 166 TM4J: Topic Maps For Java [online]. 2001 [cit. 2014-10-09]. Dostupné z: http://tm4j.org/ 165
71
TM4Web – poskytuje podpůrný kód a referenční implementace pro integraci TM4J Engine s běžně užívanými webovými aplikačními konstrukcemi jako Apache's Cocoon a Struts projects.
14.3 NetworkedPlanet Společnost Networked Planet se věnuje poskytování nástrojů a produktů organizacím, jež chtějí pomoci s řízením znalostí a obsahu.167 Jedním takovým produktem je komerční řešení „TMCore“, přední sada nástrojů pro vývojáře na .NET168, kteří chtějí ve svých aplikacích využít možností Topic Maps. Engine TMCore Topic Maps používá SQL169 jako svůj značkovací jazyk, založený na množině předdefinovaných zobrazení a funkcí nazývaných TMRQL170. Příkazy jsou tedy vykonávány samotnou databází, pročež TMCore nemůže sám sledovat (téma, typ vztahu) páry. Vývojář tedy musí nadefinovat tuto množinu pro každý příkaz, aby CacheQube171 fungoval.172
NetworkedPlanet [online]. 2005 [cit. 2014-10-06]. Dostupné z: http://www.networkedplanet.com/ 168 „Platforma Windows .NET je kolekcí technologií, která byla uvedena Microsoftem jako alternativní platforma pro tvorbu webových softwarových aplikací.“ „The Windows .NET platform collection of technologies was introduced by Microsoft as an alternative platform for building Web software applications.“ BIDGOLI, Hossein. The Internet encyclopedia. Hoboken, N.J.: John Wiley, 2004, s. 291. ISBN 0471222011. 169 SQL (Structured Query Language) – standardizovaný dotazovací jazyk používaný pro práci s daty v relačních databázích. Tento jazyk je podporován většinou databází, v nichž se podstatné příkazy většinou dají použít stejným nebo podobným způsobem. LEISS, Oliver a Jasmin SCHMIDT. PHP v praxi: pro začátečníky a mírně pokročilé. 1. vyd. Praha: Grada, 2010, s. 104. Průvodce (Grada). ISBN 978-80-247-3060-8. 170 TMQRL (Topic Map Relational Language) – Topic Map relační dotazovací jazyk byl navržen za účelem poskytnutí spolehlivého základu pro dotazování v Topic Maps. Nedefinuje tedy zcela nový jazyk, nicméně prezentuje jádrovou sestavu abstraktního relačního zobrazení. Topic Map Relational Query Language – TMRQL. Topic Maps Lab [online]. 2008 [cit. 2014-10-08]. Dostupné z: http://www.topicmapslab.de/publications/topic_map_relational_query_language?locale=en 171 CacheQube patří mezi Cache servery. Cache Server ukládá často požadované soubory na disk a je zodpovědný za vyřízení všech požadavků na zobrazení souborů. Cache Server kontroluje, zda může naplnit požadavek s uloženou stránkou souborů. Pokud Cache Server najde uloženou stránku, která zobrazuje přesně požadovaná data (s daty, která byla obnovena z databáze), potom Cache Server vrátí tuto uloženou stránku souborů uživateli. Uložením často zobrazovaných souborů na disk ulehčíme zatížení komunikačních linek. FITZGERALD, Neil. Crystal Reports XI: official guide. Indianapolis, Ind.: Sams, c2007, s. 547. ISBN 9780672329173. 172 Scaling topic maps: third international conference on topic maps research and applications, TMRA 2007 Leipzig, Germany, October 11-12, 2007 revised selected papers. 1st ed. New York: Springer, 2008, s. 243. ISBN 3540708731. 167
72
14.4 Wandora Nástroj pro extrahování informací, spravování a publikování aplikací založených na Topic Maps a Java. Wandora je psaná v programovacím jazyce Java a její interní model je založen na Topic Maps. Hodí se pro sestavování a udržování slovníků, ontologií a informačních mashupů. Aplikační oblasti zahrnují propojená data, otevřená data, integraci dat, business intelligence, digitální ochranu a novinářská data. Wandora využívá licence „GNU GPL“173.174 Jedná se o velice aktivní aplikaci, která velice často uvádí nové verze svých produktů. Je také vhodná i pro začátečníky, kterým vše zjednodušeně vysvětlí na svých wiki stránkách.175
GNU GPL (General Public Licence) – licence pro svobodný software, která vyžaduje, aby díla odvozená z původního díla chráněného licencí, byla dostupná opět pod touto licencí. 174 Wandora [online]. 2012 [cit. 2014-10-09]. Dostupné z: http://wandora.org/www/ 175 Wandora. Wandora [online]. 2012 [cit. 2014-10-09]. Dostupné z: http://wandora.org/wiki/Documentation 173
73
III. Aplikační část 15. Úvod do aplikační části V předchozích dvou částech práce jsme se seznámili se základními fakty ohledně témat Reprezentace znalostí a Topic Maps. Nyní pro lepší představu aplikujeme model Topic Maps na konkrétní organizační a znalostní strukturu. Pro ukázku konkrétní mapy jsem zvolila aplikaci Topic Maps na organizační a znalostní strukturu ve společnosti IBA CZ, s.r.o. (dále jen IBA CZ). Tato společnost nebyla zvolena náhodně. Jedná se o společnost, v níž jsem před několika měsíci začala sama pracovat a první týden mého působení ve společnosti byl (stejně jako u každého nově nastoupivšího zaměstnance) zasvěcen prostudování různých důležitých faktů o společnosti a o systémech, které zaměstnanci firmy využívají. První týden dostávají všichni zaměstnanci bez ohledu na jejich budoucí pozici ve firmě stejné úkoly, o nichž si povíme více v následujících kapitolách. Nových informací je během jednoho týdne poměrně mnoho, a člověk tyto informace studující má často problém uvědomit si souvislosti a kontext, do něhož informace zapadají, což platí především pro absolventy či stážisty, kteří ještě nemají s fungováním ve větší společnosti žádné zkušenosti. Právě absolventů a stážistů je přitom ve firmě poměrně velké množství, neboť společnost spolupracuje s několika univerzitami včetně Masarykovy univerzity (konkrétně s Fakultou informatiky MU). Pakliže mají Topic Maps úspěchy v e-learningu, kde pomáhají studentům právě s pochopením souvislostí mezi různými prvky a jejich zasazením do kontextu, mohly by být v něčem prospěšné také člověku, který nastoupí do nové společnosti a musí věnovat první týden samostudiu zadaných úkolů? Mohly by Topic Maps novému zaměstnanci toto samostudium nějakým způsobem usnadnit? V této části práce se pokusíme tuto otázku zodpovědět.
16. Metodologie Cílem této části práce bude ukázat, jakým způsobem by bylo možné vytvořit mapu, která by novým zaměstnancům společnosti IBA CZ napomohla lépe se zorientovat ve znalostech, které mají získat během svého prvního týdne ve 74
společnosti. Nástrojem, který bude pro tuto část práce využit, je již dříve zmíněný nástroj „Wandora“. V aplikační části neukážeme vše, co Topic Maps nabízí, jelikož by se jednalo o velice dlouhý tutoriál. Zaměříme se tedy na hlavní prvky – témata, vztahy, výskyty, jelikož většina dalších prvků by se nám na mapě v grafické podobě ani nezobrazila a vzhledem k tomu, že by se jednalo o interní (neveřejnou) mapu, nebylo by to nejspíše ani příliš potřeba. Samozřejmě však nabízí nástroj Wandora zcela jednoduché způsoby, jak do označených políček vkládat texty a odkazy, uživatel tedy může vytvářet Topic Maps se všemi možnými prvky, jež jsme zmiňovali v teoretické části, navíc bez jakékoli znalosti syntaxe nebo jazyka Topic Maps. Obrázky, které pro ukázky částí mapy využiji, budou samozřejmě vyfiltrovány a zjednodušeny, aby čtenáři, který nemá možnost vidět mapu ve virtuálním prostředí, něco vypověděly. V mapě bude použit anglický jazyk. Využít angličtinu je výhodou pro případ, že by se uživatel např. rozhodl mapu zveřejnit, propojit s mapou jinou, nebo ji alespoň doplnit o prvky s jiné mapy. Většina map, s nimiž se na internetu setkáme, je totiž v angličtině. Názvy systémů v aplikační části však ponecháme v originále (tak, jak se s nimi setkáme v interním systému), některé tedy budou anglické a jiné ne. Topic Map může na první pohled připomínat např. klasickou mentální mapu, kde jsou určitým způsobem propojeny spřízněné prvky. Velkým rozdílem je však skutečnost, že Topic Maps nám neukazuje pouze fakt, že jsou některé dva prvky spřízněny, ale ukazuje nám, jakým způsobem. Pokud bychom viděli kupříkladu v mentální mapě vazbu prvků „ICT“ a „JIRA“, neřekne nám to jako laikům vůbec nic. Vidíme-li však v Topic Map vazbu ukazující nám, že „ICT“ je určité „oddělení“ společnosti a „JIRA“ je „tiketovací systém“, který je tímto oddělením „využíván“, nezískáváme pouze informaci, že se jedná o spřízněné prvky, ale také znalost, jak jsou spřízněny. Vztahy můžeme popsat mezi jakýmikoli prvky, které chceme uživatelům představit. Samozřejmě nesmíme zapomenout na výskyty a další možnosti, které Topic Maps nabízí. Osobně se však domnívám, že největším přínosem jsou právě zmíněné vztahy. Pokud bychom propojili téma s výskytem, uživateli to opět mnoho neřekne, právě vztahy uživatelům ukazují souvislosti, uvádějí je do kontextu, a to je na Topic Maps jedním z největších přínosů.
75
17. Představení společnosti IBA CZ Nyní si již stručně představíme společnost IBA CZ, které se budeme v aplikační části věnovat. Roku 1993 byla jako „joint venture“ společnosti IBM založena společnost IBA Group. Společnost IBA Group se brzy vypracovala na významného poskytovatele IT služeb ve střední a východní Evropě, kde také začaly vznikat další pobočky této společnosti s původním sídlem v běloruském Minsku.176 Vznik české pobočky společnosti IBA Group s názvem IBA CZ se datuje od roku 1999. Na svých internetových stránkách se prezentuje následovně: „IBA CZ je technologická společnost, která se specializuje na poskytování služeb v oblasti software. (…) IBA CZ se sídlem v Praze a Brně má přes 120 kmenových zaměstnanců – IT specialistů, se zaměřením na softwarový vývoj, projektový management a IT konzultace. IBA CZ spolupracuje intenzivně s mnoha kontraktory a partnerskými společnostmi, díky nimž může flexibilně reagovat na široký okruh potřeb svých zákazníků.“177 Společnost IBA CZ pracuje na mnoha zajímavých projektech, nás však bude zajímat více než obchodní záležitosti její vnitřní struktura a systémy, které zaměstnanci společnosti užívají, neboť právě to je předmětem studia během prvního týdne ve společnosti a to je také předmětem mapy, kterou si ukážeme.
18. Organizační struktura a procesy ve společnosti IBA CZ V této kapitole se již dostaneme k tomu, jaká Topic Map by mohla být pro vykreslení určité organizační struktury a procesů v podniku využita. Právě organizační struktura a celkově princip fungování společnosti je totiž první věc, kterou si musí každý nově nastoupivší zaměstnanec prostudovat.
IBA Group. IBA CZ [online]. © 1993–2014 [cit. 2014-11-17]. Dostupné z: https://www.ibacz.eu/o-nas/iba-group 177 IBA CZ – O nás. IBA CZ [online]. © 1993–2014 [cit. 2014-11-17]. Dostupné z: https://www.ibacz.eu/spolecnost 176
76
Po nástupu každého zaměstnance a předání potřebného hardwarového vybavení a základních pokynů, je zaměstnanec seznámen se systémem JIRA, kde jsou pro něj připraveny úkoly, na jejichž splnění má týden. Jedná se primárně o seznámení se právě s organizační strukturou organizace a s interními informačními systémy, které jsou v této společnosti využívány. Poté je již zahájeno samostudium. Náplní tohoto samostudia je zejména seznámení se se společností a se systémy, s nimiž se v ní pracuje.
18.1 Organizační struktura Základní organizační struktura společnosti IBA CZ sestává z pěti základních oddělení tvořících vrcholový management. Jedná se o pět oddělení, která obecně tvoří vrcholový management většiny větších organizací a jejich označení se používá ve zkratkách převzatých z angličtiny. V následujících odstavcích bude shrnuto, čím se které oddělení zabývá. Definování následujících oddělení vychází z informací uvedených na stránkách ManagamentMania178, které jsou upraveny tak, aby byly v souladu s fungováním společnosti IBA CZ. Je třeba podotknout, že oddělení jsou různě velká a vrcholový management části svých odpovědností a pravomocí podle potřeby deleguje na manažery a zaměstnance nižších úrovní. CEO – Generální ředitel (Chief Executive Officer) je nejvýše postavený manažer v organizaci a je odpovědný za celou organizaci, její fungování, strategii a postavení na trhu.
Hlavní pracovní náplní CEO je plánovat, vést, organizovat, rozhodovat a kontrolovat lidi, procesy a informace v celé organizaci. CEO deleguje část svých pravomocí a odpovědností na další vrcholové manažery (či manažery nižších úrovní). CEO také udržuje strategické vztahy s klíčovými zákazníky. CFO – Financial Department (Finanční oddělení) – Finanční ředitel (Chief Financial Officer) je v organizaci odpovědný za řízení financí v celé organizaci. Pod CFO oddělení tedy spadá plánování financí, provádění finančních analýz, řízení finančních toků, provádění nákladových analýz pomocí různých finančních ukazatelů a rozhodování v oblasti financí.
ManagementMania [online]. 2011 [cit. 2014-10-15]. Dostupné z: https://managementmania.com/cs/ 178
77
CIO – ICT department (ICT oddělení) – Ředitel IT oddělení (Chief Information Officer) je v organizaci odpovědný za oblast informatiky. Pod CIO oddělení tedy bude patřit řízení provozu i rozvoje informatiky v organizaci, slaďování cílů organizace a jejich podpory informacemi a informačními a komunikačními technologiemi. Dále sem bude patřit plánování rozvoje informačních a komunikačních technologií, sledování a vyvažování potřeb organizace a ICT trendů, provádění nákladových analýz ICT, řízení bezpečnosti a rizik v oblasti informatiky a celkové vyvažování informačního managementu organizace. COO – Operations Department (Provozní oddělení) – Provozní ředitel (Chief Operating Officer) je odpovědný za každodenní provoz organizace a její fungování. Úkolem COO oddělení je tedy plánovat, vést, organizovat, rozhodovat a kontrolovat lidi, procesy a informace v každodenním provozu organizace. Ve společnosti IBA CZ se nesetkáme s personálním oddělením, povinnosti spojené s funkcí personálního ředitele (CHRO – Chief Human Resources Officer) spadají rovněž pod pozici COO. CSO – Sales Department (Obchodní oddělení) – Obchodní ředitel (Chief Sales Officer) je odpovědný za oblast marketingu a obchodu. Obchodní oddělení tedy odpovídá za marketing, řízení vztahů se zákazníky, za prodej služeb, za rozvoj zaměstnanců a za slaďování cílů organizace s potřebami zákazníků. Jeho hlavní odpovědností je prodej služeb, dále pak plánování prodeje výrobků a služeb. Obchodní ředitel společně s CEO stanovuje produktovou strategii, produktové portfolio, vyvažuje potřeby organizace a jejích zákazníků, rozhoduje o stanovení optimálních prodejních kanálů a udržuje rovněž strategické vztahy s klíčovými zákazníky. CTO – SW Development Department (Technické oddělení) – Technický ředitel (Chief Technology Officer) je odpovědný za koordinaci všech technických záležitostí poskytování služeb, stejně jako výzkum a vývoj (R&D Research & Development). Pod oddělením CTO nalezneme povinnosti jako je plánování poskytování služeb, vytváření a realizace technické strategie a samotných služeb a rozhodování směrů technického rozvoje podniku. Jak již bylo řečeno, primárními službami, které společnost IBA CZ poskytuje, je vytváření portálového řešení na zakázku. Proto je jednou z hlavních náplní CTO 78
oddělení ve společnosti IBA CZ právě rozvoj činností spojených s plánováním a realizací softwarového řešení zákazníkům.
18.2 Informační systémy využívané ve společnosti Interních systémů, které se ve společnosti využívají, je samozřejmě obrovské množství. My se podíváme alespoň na ty, s nimiž se bude nový zaměstnanec seznamovat nejdříve jakožto s těmi základními. Jsou to systémy, které využívají všechna oddělení společnosti bez ohledu na své zaměření. Jejich seznam byl převzat se souhlasem vedení z interního systému společnosti IBA CZ. JIRA – nástroj pro projektové řízení a sledování úkolů a požadavků. V IBA CZ se využívá mimo jiné ke sledování stavu jednotlivých úkolů i projektů, zadávání chyb, sběru požadavků či pro evidenci různých záznamů. Confluence – enterprise wiki používaná v IBA CZ především k řízení projektů, sdílení znalostí a ke kolaborativnímu přidávání obsahu. Interní portál – hlavní komunikační a informační kanál společnosti. Kromě toho, že funguje jako komunikační uzel (jsou zde fóra, ankety, blog atd.), lze ho použít i jako rozhraní pro použití dalších aplikací. IBM Notes – softwarový produkt orientující se do oblasti groupware. V IBA CZ plní IBM Notes primárně funkci e-mailového klienta. Mezi další služby patří adresář, kalendář, plánovač a rezervace zdrojů. Alfresco – systém pro správu dokumentů jako jsou šablony, směrnice, projektové podklady a artefakty. Knihovna – portálová verze fyzické knihovny, jež se nachází na brněnské pobočce. Slouží ke správě výpůjček, rezervacím, k jednotlivým knihám je možné přidávat hodnocení a recenze. Systém Dovednosti a vytvoření TMP (Team Member Profile) – portálová aplikace, která umožňuje zaznamenávání znalostí a dovedností jednotlivých zaměstnanců napříč celou organizací. Na základě těchto informací je možné vytvořit Team Member Profile (TMP), které využívá především obchodní 79
oddělení pro doložení znalostí realizačního týmu v rámci zakázek jak pro veřejnou, tak pro komerční sféru. Systém Docházka a vykazování práce – systém slouží k vykazování práce, žádostem o dovolenou, služební cesty a k celkové správě docházky zaměstnanců. Jabber – instant messaging služba využívaná mezi zaměstnanci z pražské i brněnské pobočky dohromady Helpdesk – tato služba byla zavedena pro zajištění jednotného přístupu k požadavkům na ICT Department, jež má na starosti technické zázemí společnosti – informační strukturu i hardwarové vybavení firmy. Je součástí systému JIRA.
19. Aplikace Topic Map na organizační strukturu a interní systémy ve společnosti IBA CZ Informace, které jsme si nyní uvedli, jsou zlomkem informací, s nimiž se setká nový zaměstnanec po svém nástupu do společnosti. První týden jeho působení ve společnosti je zasvěcen nejen tomu, aby si pročetl nemalé množství zdrojů, ale také aby si „osahal“ zmíněné interní systémy apod. Informace se nachází na různých místech, která na sebe odkazují prostřednictvím linků. Také já jsem po svém nástupu do společnosti během prvního týdne tyto informace studovala a po čase jsem se v jejich množství začala ztrácet. Později mě napadlo, zda by právě pro takovouto formu reprezentaci znalostí mohla být použita nějaká konkrétní Topic Map a dospěla jsem k závěru, že ano. Jak by tedy taková mapa mohla vypadat?
80
Začněme od začátku. Máme společnost IBA CZ, o níž si musíme prostudovat několik zdrojů (historii, současnost, podnikové procesy apod.). Společnost IBA CZ je tedy tématem, u něhož máme různé stránky, které bychom si měli pročíst, vypadat to pak může např. tak, jak je zachyceno na následujícím obrázku:
Obrázek 5: Téma „IBA CZ“ a zdroje k němu přiřazené Na Obrázku 5 vidíme téma IBA CZ, k němuž se vztahují určité zdroje. Ve vazbách mezi tímto tématem a zdroji můžeme také označit, o jaký zdroj se jedná a určitým způsobem o něm něco vypovědět. Kdybychom tedy např. odkazovali na interní portál (na který zde neodkazuji, protože je přístupný pouze zaměstnancům), mohli bychom ho ve vztahu označit jako „most important resource“ (nejdůležitější zdroj k pročtení), odkazujeme-li na facebookovou stránku společnosti, můžeme zase upozornit, že se jedná o „Facebook page“, jako je tomu na Obrázku 5.
81
Půjdeme-li dále, sestává společnost IBA CZ z výše zmíněných oddělení. Pak tedy na téma IBA CZ navážeme jako témata další:
Obrázek 6: Navázání nových témat Vidíme, že mapa nevypadá příliš hierarchicky. Cílem mapy je totiž primárně ukázat uživateli právě vazby mezi jednotlivými tématy, nežli jejich hierarchickou strukturu. Nyní je tedy uživatel již seznámen se společností IBA CZ a dále se dozvídá, že sestává z několika oddělení. U těchto oddělení můžeme opět odkazovat na zdroje, které by nám osvětlily, jaké role konkrétní oddělení zastává. Každé ze zmíněných oddělení poskytuje určité služby. Zde se nabízí otázka, zda udělat velikou konkrétní mapu, která by byla shodná pro všechny nově nastoupivší zaměstnance, nebo zda by každé oddělení mělo v mapě vyfiltrovány pouze ty informace, které jsou pro něj nějakým způsobem důležité. V této práci se přikloníme k druhé možnosti a budeme tedy pracovat s informacemi, které jsou důležité pro člověka nastupujícího na ICT oddělení. ICT oddělení poskytuje základní služby, které se rozpadají na mnoho dalších konkrétnějších služeb. Těmito základními službami jsou communication services (poskytování a správa emailových účtů a telefonních čísel apod.), backoffice services (služby týkající se zázemí zaměstnanců, např. pracovní nástroje, ale také zajištění klimatizace, čipů pro přístupy do místností apod.), network services 82
(služby ohledně síťových prvků jako připojení k VPN, monitoring apod.), content services (služby týkající se správy obsahu společnosti – např. portál, knihovna, DMS, wiki atd.), development services (podpora rozvoje společnosti, práce na projektech a poskytování služeb s tímto spojených), business services (služby spojené např. s prezentací společnosti na veřejném portálu apod.). Pokud bychom tyto služby zanesli do mapy, vypadalo by to následovně:
Obrázek 7: Rozdělení tématu „CIO“ Každé ze zmíněných oddělení by se následně mohlo rozpadat na zmíněné další díly, k nimž by byly poskytnuty další informace, jak jsme si ukázali na začátku.
83
Nyní se vrátíme k systémům, o nichž jsme již mluvili. Tyto systémy by v podstatě mohly tvořit samostatnou mapu. My je však podle toho, kde jsou využívány, připojíme k současné mapě týkající se organizační struktury společnosti. Jelikož se jedná o systémy, které využívá celá společnost, budou propojeny se všemi odděleními a naše mapa tak již bude podstatně komplikovanější. Jak již bylo řečeno, názvy systémů necháme shodné se skutečnými názvy, aby byly jednotné, některé tedy budou anglické, některé české.
Obrázek 8: Provázanost organizační struktury a interních systémů Na Obrázku 8 vidíme složitou pavučinu sestavenou z různých prvků. Podíváme-li se však pozorněji, vidíme, že např. po rozkliknutí vztahu mezi JIROU a Helpdeskem se dozvíme, že Helpdesk je systém, jež je součástí produktu JIRA, který společnost využívá jako systém pro zadávání tiketů179. Stejné vazby bychom V interních zdrojích společnosti nalezneme systémy jako JIRA pod označením „produkty“. Např. konkrétně systémů pro zadávání tiketů je totiž samozřejmě větší množství a společnosti si vybírají mezi systémy konkrétní produkty, které pro svoji společnost zvolí. JIRA je jen jedním z mnoha tiketovacích systémů, je to konkrétní „produkt“ společnosti Atlassian, proto je na interních 179
84
mohli následně doplnit také k systémům jako Knihovna apod., které jsou pro změnu součástí interního portálu. Ačkoli se změť nejrůznějších prvků může zdát zmatečná, velkou pomocí jsou také barvy – systémy využívané společností mají shodné barvy (téma JIRA změní barvu po rozkliknutí, aby byla lépe vyjádřena jeho spojitost s jeho součástí – Helpdeskem). Takto bychom mohli pokračovat i nadále. Mohli bychom tvořit další témata a podtémata, vztahy mezi nimi a určovat výskyty, které by nám o daných tématech řekly více. Celá mapa by tak byla kompletně propletená a viděli bychom tak nejrůznější možná propojení, což můžeme demonstrovat např. na systému ABRA. ABRA je účetní systém, který tedy využívají zaměstnanci z účetního oddělení spadajícího pod COO. Jak již však bylo zmíněno, ICT oddělení má na starosti nákup nového vybavení. Zaměstnanec ICT oddělení tedy po schválení vedením nakupuje hardwarové a softwarové produkty a tyto produkty potřebuje nějakým způsobem evidovat, aby byly k dispozici informace o produktu i o tom, co se s ním momentálně děje (který zaměstnanec jej momentálně využívá, kde konkrétně atd.). K tomuto je rovněž využíván účetní systém. V mapě bychom tak viděli i propojení zdánlivě nezávislých prvků ve společnosti.
Obrázek 9: Propojení COO a CIO oddělení skrze systém ABRA stránkách označována jako „Produkt JIRA“. V mapě jsem tedy ponechala pro její označení pojem „product“ jako produkt jí nadřazených systémů užívaných ve společnosti. Mohli bychom ji však označit také např. jako „ticketing system“ (bez ohledu nad to, že je v podstatě podtřídou tiketovacích systémů), což by mohlo uživatelům napovědět více.
85
Na Obrázku 9 vidíme propojení systému ABRA s účetním oddělením i s oddělením spravujícím pracovní vybavení. U tématu ABRA máme připsanou roli „Product“, neboť jde o produkt účetního systému, s nímž oddělení pracují. Jak jsme však psali dříve, mohli bychom tomuto systému připsat např. roli „accounting system“ (účetní systém). Uprostřed na obrázku vidíme vztah „used by“, neboť ABRA je systémem, který je využíván službou Working tools, jíž je připsána role „service“, neboť poskytování vybavení je služba zaměstnancům. Kdybychom však rozklikli možnosti CIO nebo COO, které jsou na obrázku (označeny v červených kroužcích), mapa by vypadala zcela jinak, neboť by se nám vyrýsovala spousta dalších souvislostí, s nimiž jsme již pracovali, viz Obrázek 10. Kdybychom se pak přesunuli na některý z konkrétních prvků, mohli bychom si rozkliknout jakýkoli vztah s prvky okolními, díky čemuž bychom dostali povědomí o zasazení tohoto prvku do kontextu celé struktury.
Obrázek 10: Zobrazení systému ABRA v kontextu Systém ABRA není systémem, s nímž by se seznamovali nově nastoupivší zaměstnanci, jde o systém, s nímž se osoby, které jej mají využívat, seznamují později. Do mapy byl zahrnut jen jako příklad, aby bylo ukázáno, že provázány různými vztahy mohou být skutečně všemožné prvky, záleží jen na tom, které prvky spojíme a jaké vztahy mezi nimi poté vytvoříme. Prvotní orientace v Topic Maps tak pro uživatele může být obtížnější, nicméně možnost odfiltrovat si uzly, 86
které momentálně vidět nechceme a začít od jednoho, z něhož se dále dostáváme postupným rozklikáváním do uzlů dalších, může být řešením, díky němuž se v mapě neztratíme a postupujeme krok po krůčku. Oproti tomu nevyfiltrovaná mapa nám poté dá, jak již bylo nejednou zmíněno, možnost nahlížet na jednotný celek. Vidíme tedy, že vytvořit jednoduchou Topic Map by bylo velice snadné. Vše, co potřebujeme, je vzít si témata, o nichž studující musí něco znát, propojit je vazbami, kde budou jasně označeny jejich vzájemné vztahy, a přidat k nim odkazy na zdroje, které nám o těchto tématech řeknou něco více (jak bylo řečeno, mohli bychom přidat také identifikátory témat apod., nicméně si myslím, že by to v takovéto mapě ani nebylo potřebné). Člověk, který by mapu studoval, by si pak vybral, zda bude postupně rozklikávat nové uzly, nebo zda chce vidět celou mapu. Osobně vidím v možnosti vidět celou mapu a následně si z ní vytahovat, co nás zajímá (konkrétní vztahy či konkrétní výskyty apod.), veliký přínos. Zda by takový přínos viděli také ostatní nově nastoupivší zaměstnanci, to by muselo být zjištěno nejspíše formou výzkumu.
20. Závěry aplikační části V předešlém textu a na předchozích obrázcích bylo ukázáno, jak by mohly být znalosti, které člověk, který do společnosti IBA CZ nastoupí, musí získat, obsaženy v jedné jediné jednoduché mapě. Příklad, který byl ukázán, by se však mohl vztahovat na jakoukoli jinou společnost nebo určitou organizační či znalostní strukturu. Cílem takové mapy by bylo obsáhnout všechny základní prvky, o nichž se člověk chce něco dozvědět, odkázat na další informace o nich a znázornit jejich vztahy s prvky jinými. Je samozřejmé, že Topic Maps se nebudou líbit každému. Někomu přijdou zmatečné a zamotané a bude preferovat pročíst si raději klasické materiály propojené mezi sebou prostřednictvím různých odkazů a linků. Někomu se však zase může líbit možnost vidět to, co se má „naučit“, jako celek s jednotlivými prvky zasazenými do určitého kontextu. Cílem této práce není vnutit čtenáři přesvědčení, že Topic Maps jsou tím nejlepším možným způsobem pro reprezentaci znalostí, nýbrž ukázat, že jsou jednou z možností, které by se dalo využít.
87
Závěr Cílem této práce bylo představit jednu z forem reprezentace znalostí – technologii Topic Maps. Zatímco Reprezentace znalostí je pojmem velmi populárním, Topic Maps samotné jsou často opomíjeny. Samozřejmě má tato technologie své slabé stránky, na druhé straně ale nabízí jednoduchých, přitom však zajímavých možností reprezentace znalostí, které by mohly být využity v různých oblastech. Zda by toto využití bylo efektivní či nikoli, to by již museli posoudit sami uživatelé. Aby však mohl být přínos Topic Maps objektivně zhodnocen, muselo by se rozšířit povědomí o nich. Poněkud znepokojujícím může být fakt, že většina zdrojů o Topic Maps pojednávajících je poměrně staršího data. Stále však můžeme nalézt komunity, které se Topic Maps a jejich vývoji aktivně věnují. Jako příklad můžeme uvést právě v práci představenou Wandoru, na jejíchž stránkách se s určitými aktualizacemi setkáváme téměř každý měsíc. Zda se těmto komunitám podaří poskytnout Topic Maps dostatečnou propagaci, popř. zda se objeví někdo další, koho Topic Maps zaujmou a rozhodne se věnovat svůj čas jejich zviditelnění, to je otázkou budoucnosti. Pravdou však je, že výhody, které Topic Maps poskytují např. oproti populárním mentálním mapám, za pozornost jistě stojí, byla by tedy velká škoda, kdyby upadly v zapomnění.
88
Použité zdroje AKERKAR, Rajendra. Introduction to artificial intelligence. Eastern Economy ed. New Delhi, India: Prentice-Hall of India Private Ltd, 2005, 364 p. ISBN 8120328647.
BAJAJ, Manas. Knowledge composition methodology for effective analysis problem formulation in simulation-based design. East Eisenhower Parkway: Proquest, Umi Dissertation Publishing, 2011, 384 p. ISBN 1243588624.
BIDGOLI, Hossein. The Internet encyclopedia. Hoboken, N.J.: John Wiley, 2004, 3 v. ISBN 04-712-2201-1.
Böhm, K.; Maicher, L.; Witschel, H.-F.; Carradori, A.: Moving Topic Maps to Mainstream – Integration of Topic Map Generation in the User's Working Environment. In: Proceedings of I-KNOW '04, Graz, (2004), p. 241-251.
BRYANT, Antony. Leading issues in business research methods. Reading: Academic Publishing International Ltd, 2011. ISBN 9781906638870.
BUREŠ, Vladimír. Znalostní management a proces jeho zavádění: průvodce pro praxi. 1. vyd. Praha: Grada, 2007, 212 s. ISBN 978-80-247-1978-8.
COAKES, Elayne, Dianne WILLIS a Steve CLARKE. Knowledge management in the sociotechnical world: the graffiti continues. New York: Springer, c2002, x, 220 p. ISBN 18-523-3441-X.
COLOMB, Robert M. Ontology and the Semantic Web. Washington, DC: IOS Press, 2007, xii, 258 p. ISBN 15-860-3729-3.
ČADA, Ondřej. Objektové programování: naučte se pravidla objektového myšlení. 1. vyd. Praha: Grada, 2009, 200 s. ISBN 978-80-247-2745-5.
DACONTA, Michael C., Leo J. ORBST a Kevin T. SMITH. The Semantic Web a guide to the future of XML, Web services, and knowledge management. Indianapolis, Ind: Wiley, 2003. ISBN 978-047-1481-133. 89
DENECKE, Klaus. Universal algebra and applications in theoretical computer science. Boca Raton: Chapman, c2002, xii, 383 s. ISBN 15-848-8254-9.
DICHEVA, Darina a Christo DICHEV. TM4L: Creating and browsing educational topic maps. British Journal of Educational Technology. 2006, vol. 37, issue 3, s. 391-404. DOI: 10.1111/j.1467-8535.2006.00612.x. Dostupné z: http://doi.wiley.com/10.1111/j.1467-8535.2006.00612.x
DICHEVA, Darina, Christo DICHEV a Dandan WANG. Visualizing topic maps for e-learning. Fifth IEEE International Conference on Advanced Learning Technologies (ICALT'05). IEEE, 2005, s. 950-951. DOI: 10.1109/ICALT.2005.305. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=15088 66
DMOZ: Open Directory Project [online]. 2012 [cit. 2014-07-06]. Dostupné z: http://www.dmoz.org/
DOSCH, Walter, R LEE a Chisu WU. Software engineering research, management and applications: second international conference, SERA 2004, Los Angeles, CA, USA, May 5-7, 2004 : selected revised papers. Berlin: Springer, 2005, xv, 260 p. ISBN 978-354-0321-330.
DRAGU, D., V. GOMOI a V. STOICU-TIVADAR. Automatic generation of medical recommendations using topicmaps as knowledge source. 2011 6th IEEE International Symposium on Applied Computational Intelligence and Informatics (SACI). IEEE, 2011, s. 593-597. DOI: 10.1109/SACI.2011.5873072. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=58730 72
DVOŘÁKOVÁ, Zuzana. Management lidských zdrojů. Vyd. 1. Praha: C. H. Beck, 2007, xxii, 485 s. Beckovy ekonomické učebnice. ISBN 978-80-7179893-4.
ELLOUZE, Nebrasse, Mohamed Ben AHMED a Elisabeth METAIS. Overview of Topic Map Construction Approaches. In: 22nd International Conference on Advanced Information Networking and Applications - Workshops (aina 90
workshops 2008). Okinawa: IEEE, 2008, s. 1642-1647. ISBN 978-0-76953096-3. DOI: 10.1109/WAINA.2008.158. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=44831 56
ESLAMI, Saeedeh a Eslam NAZAMI. An automatic approach for Topic Maps development using relational databases. In: 2011 3rd International Conference on Computer Research and Development. Piscataway: IEEE, 2011, s. 304-308. ISBN 978-1-61284-839-6. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=57640 25
ESPOSITO, Dino. XML: efektivní programování pro .NET. 1. vyd. Překlad Jaroslav Černý. Praha: Grada, 2004, 596 s. ISBN 80-247-0775-6.
ESTRADA, Liliana M. Melgar. Topic Maps from a Knowledge Organization Perspective. Knowledge Organization [online]. 2011, vol. 38, issue 1, s. 43 61 [cit. 2013-12-16]. Dostupné z: http://web.ebscohost.com.ezproxy.muni.cz/ehost/pdfviewer/pdfviewer?vi d=8&sid=1315ba2a-b1c3-4980-82ffe7485b99164c%40sessionmgr115&hid=117
FARKAS, Farkas a Karoly JÁRMAI. Analysis and optimum design of metal structures. Rotterdam, Netherlands: A.A. Balkema, 1997, 350 p. ISBN 90541-0669-7.
FERTSCH, Marek a Paulina GOLINSKA. Information technologies in environmental engineering new trends and challenges. Berlin: Springer, 2011, 820 p. ISBN 978-364-2195-365.
FITZGERALD, Neil. Crystal Reports XI: official guide. Indianapolis, Ind.: Sams, c2007, 932 s. ISBN 978-067-2329-173.
FREESE, Eric. So Why Aren’t Topic Maps Ruling the World. In: Extreme Markup Languages 2002 Conference, 4-9 August 2002, Montréal, Quebec, Canada. Montréal, Québec: Mulberry Technologies, Inc., 2002, 6 p.
91
FRICKÉ , Martin. Logic and theorganizationofinformation. New York: Springer, c2012, xv, 312 p. ISBN 978-1461430872.
GÁLA, Libor, Jan POUR a Zuzana ŠEDIVÁ. Podniková informatika. 2., přeprac. a aktualiz. vyd. Praha: Grada, 2009, 496 s. Expert (Grada). ISBN 978-80247-2615-1.
GÁLA, Libor. Podniková informatika: počítačové aplikace v podnikové a mezipodnikové praxi, technologie informačních systémů, řízení a rozvoj podnikové informatiky. 1. vyd. Praha: Grada, 2006, 482 s. ISBN 80-2471278-4.
GANTER, Bernhard a Guy W MINEAU. Conceptual structures: logical, linguistic, and computational issues: 8th International Conference on Conceptual Structures, ICCS 2000, Darmstadt, Germany, August 2000 : proceedings. New York: Springer, 2000, xi, 568 p. Lecture notes in computer science, 1867. ISBN 35-406-7859-X.
GAŠEVIĆ, Dragan, Dragan ĐURIĆ a Vladan DEVEDZIC. Model driven architecture and ontolgy development. Berlin: Springer-Verlag, 2006, xvii, 311 s. ISBN 35-403-2180-2.
GHAOUI, Claude. Encyclopediaofhumancomputerinteraction. Hershey PA: Idea Group Reference, c2006, xviii, 738, [24] p. ISBN 978-159-1407-980.
GOLDHAMMER, L. a H.-B. WOYAND. Using topic maps to describe engineering knowledge and geometry of CAD-designed products. In: 2012 IEEE 16th International Conference on Intelligent Engineering Systems (INES). Lisbon: IEEE, 2012, s. 265-270. ISBN 978-1-4673-2695-7. DOI: 10.1109/INES.2012.6249842. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=62498 42
GUPTA, Gajendra. Advanced Java. New Delhi, India: Laxmi Publications, 2005, 305 p. ISBN 81-7008-940-9.
92
HANGOS, Katalin M., Rozá lia LAKNER a Mikló s GERZSON. Intelligent control systems: an introduction with examples. Boston: Kluwer Academic Publishers, 2001, xvi, 301 p. ISBN 14-020-0134-7.
HORRICK, Ian. DAML+OIL: a Description Logic for the Semantic Web. IEEE Data Engineering Bulletin. 2002, roč. 25, č. 1.
HUNTING, Sam. XML topicmaps: creating and usingtopicmaps for the Web. Boston: Addison-Wesley, c2003, xxix, 603 p. ISBN 02-017-4960-2.
CHUNG, Hyun-Sook a Jung-Min KIM. ConflictDetection and Resolution in Mergingof Topic Maps. In: 2007 International Conference on ConvergenceInformation Technology (ICCIT 2007). Gyeongju: IEEE, 2007, s. 907-912. ISBN 0-7695-3038-9. DOI: 10.1109/ICCIT.2007.328. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=44203 75
IBA CZ [online]. © https://www.ibacz.eu/
Informační technologie - Aplikace SGML - Mapy námětů. Seznam technických norem ČSN [online]. 2002 [cit. 2014-01-04]. Dostupné z: http://nahledy.normy.biz/nahled.php?i=70751
ISO Topic Maps [online]. 2000 [cit. 2014-10-02]. Dostupné z: http://www.isotopicmaps.org/
JAKUS, Grega, Veljko MILUTINOVIĆ, Sanida OMEROVIĆ a Sašo TOMAŽIČ. Concepts, ontologies, and knowledge representation. London: Springer, 2013, 67 p. ISBN 9781461478225.
JANÍČEK, Přemysl a Jiří MAREK. Expertní inženýrství v systémovém pojetí. 1. vyd. Praha: Grada, 2013, 592 s. Expert (Grada). ISBN 978-80-247-4127-7.
KASHYAP, Vipul. The semantic web: semantics for data and services on the web. 1st ed. New York: Springer, 2008, 414 p. ISBN 978-354-0764-519.
1993–2014
93
[cit.
2014-11-17].
Dostupné
z:
KERN, Isabelle. The suitability of topic maps tools for knowledge creation with stakeholders. 1., Aufl. Bern: Haupt, 2009. ISBN 32-580-7515-8.
KHOSROWPOUR, Mehdi. Dictionary of information science and technology. Hershey, PA: Idea Group Reference, c2007, 2 v. ISBN 978-159-9043-869.
Knowledge processing and data analysis: first International Conference, KONT 2007, Novosibirsk, Russia, September 14-16, 2007 and First International Conference, KPP 2007,Darmstadt, Germany, September 28-30, 2007. revised selected papers. 1st ed. New York: Springer, 2011, p. cm. ISBN 36-422-2139-4.
KOSEK, Jiří. Topic Maps: Tutoriál [online]. 2006 [cit. 2013-11-16]. Dostupné z: http://www.kosek.cz/xml/tmtut/
KOSEK, Jiří. XML pro každého: podrobný průvodce. 1. vyd. Praha: Grada, 2000, 163 s. Průvodce (Grada). ISBN 80-716-9860-1.
KOUBA, Daniel. Transformace mezi Topic Maps a RDF/OWL. Praha, 2007. 51 s. Diplomová práce. Vysoká škola ekonomická v Praze, Fakulta informatiky a statistiky, Informační a znalostní inženýrství. Vedoucí práce Doc. Ing. Vojtěch Svátek, Dr.
KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. 2003 [cit. 2014-10-13]. Dostupné z: http://wwwold.nkp.cz/o_knihovnach/Slovnik/
KUMAR, Ela. Artificial Intelligence. New Delhi, India: I.K. International Publishing House Pvt. Ltd., 2008. ISBN 978-81-906566-6-5.
KÜ STERS, Ralf. Non-standard inferences in description logics. New York: Springer, 2001, 250 p. Lecture notes in computer science. ISBN 35-4042397-4.
LACHER, Martin S. a Stefan DECKER. RDF, Topic Maps, and the Semantic Web. Markup Languages: Theory and Practice. 2001, vol. 3, issue 3, s. 313331. Dostupné z: http://www.catchword.com/cgi-bin/cgi?body=linker 94
LEE, Raymond S. T., Edward L. Y. LIM a James N. K. LIU. Knowledge seeker – ontology modelling for information search and management: a compendium. Berlin: Springer, 2011. ISBN 978-364-2179-167.
LEISS, Oliver a Jasmin SCHMIDT. PHP v praxi: pro začátečníky a mírně pokročilé. 1. vyd. Praha: Grada, 2010, 242 s. Průvodce (Grada). ISBN 978-80247-3060-8.
LIN, Song a Xiong HUANG. Advances in computer science, environment, ecoinformatics, and education: International Conference, CSEE 2011, Wuhan, China, August 21-22, 2011, Proceedings, Part II. Berlin: Springer, 2011. ISBN 978-3-642-23323-4.
LINDAY, Michal a Jozef KELEMEN. Expertné systémy pre prax. 1. vyd. Bratislava: Sofa, 1996, 200 s. ISBN 8085752328.
LUKASOVÁ, Alena. Formální reprezentace znalostí. Vyd. 1. V Ostravě: Ostravská univerzita, 2010, 343 s. Universum (Ostravská univerzita), 13. ISBN 978-807-3689-001.
MAIER, Ronald, Thomas HÄ DRICH a René PEINL. Enterprise knowledge infrastructures. 2nd ed. Berlin: Springer, 2009, xii, 445 p. ISBN 978-3540897-682.
MAICHER, Lutz, Alexander SIGEL a Lars Marius GARSHOL. Leveraging the semantics of topic maps: Second International Conference on Topic Maps Research and Applications, TMRA 2006, Leipzig, Germany, October 11-12, 2006 : revisedselectedpapers. New York: Springer, c2007, x, 255 p. Lecture notes in computer science, 4438. ISBN 35-407-1944-X.
MAICHER, Lutz a Jack PARK. Charting the topic maps research and applications landscape: first International Workshop on Topic Maps Research and Applications, TMRA 2005, Leipzig, Germany, October 6-7, 2005 : revised selected papers. Berlin: Springer, c2006, viii, 280 p. Lecture notes in computer science, 3873. ISBN 978-354-0325-277.
95
ManagementMania [online]. 2011 https://managementmania.com/cs/
Mapy námětů. ČSN seznam: Vyhledávání v seznamu normativních dokumentů ÚNMZ [online]. 1993 [cit. 2013-12-21]. Dostupné z: http://seznamcsn.unmz.cz/Detailnormy.aspx?k=60721
MINTZES, Joel J., James H. WANDERSEE a Joseph. D. NOVAK. Assessing science understanding: A Human Constructivist View. Burlington: Elsevier Academic Press, 2007, 386 p. ISBN 0120885344.
MLÁDKOVÁ, Ludmila. Moderní přístupy k managementu: tacitní znalost a jak ji řídit. Vyd. 1. Praha: C. H. Beck, 2005, xviii, 195 s. ISBN 80-717-9310-8.
MLÝNKOVÁ, Irena a Jaroslav POKORNÝ. XML technologie: principy a aplikace v praxi. 1. vyd. Praha: Grada, 2008, 267 s. Průvodce (Grada). ISBN 978-80-247-2725-7.
Multimedia semantics: metadata, analysis, and interaction. 1st ed. Editor Benoit Huet, Simon Schenk, Raphael Troncy. Chichester: John Wiley & Sons Ltd., 2011, xxii, 305 s. ISBN 978-0-470-74700-1.
OASIS Published Subjects [online]. 2005 [cit. 2014-01-09]. Dostupné z: http://psi.oasis-open.org/
OLEJ, Vladimír a Pavel PETR. Expertní a znalostní systémy v managementu. Vyd. 1. Pardubice: Univerzita Pardubice, 2004, 54 s. ISBN 80-719-4688-5.
Ontopia [online]. 2001 [cit. 2014-06-24]. Dostupné z: http://www.ontopia.net/
POOLE, David L a Alan K MACKWORTH. Artificial intelligence: foundations of computational agents. New York: Cambridge University Press, 2010, 662 p. ISBN 978-0-521-51900-7.
RHEM, Anthony J. UML for Developing Knowledge Management Systems. London: Auerbach Publications, 2005. ISBN 02-034-9245-5. 96
[cit.
2014-10-15].
Dostupné
z:
Scaling topic maps: third international conference on topic maps research and applications, TMRA 2007 Leipzig, Germany, October 11-12, 2007 revised selected papers. 1st ed. New York: Springer, 2008, p. cm. ISBN 35-407-08731.
Sémantický web (Vilém Sklenák). Ikaros [online]. 2003, roč. 7, č. 5/2 [cit. 05.11.2014]. Dostupné z: http://www.ikaros.cz/node/1374. urn:nbn:cz:ik‐001374. ISSN 1212-5075.
SCHULTZ, Rikke aj. Začneme s ODL. Antwerpen: Garant, 2005. ISBN 9044119028.
SKLENÁK, Vilém. Data, informace, znalosti a Internet. Vyd. 1. V Praze: C.H. Beck, 2001, xvii, 507 s. C.H. Beck pro praxi. ISBN 80-717-9409-0.
SMEJKAL, Vladimír a Karel RAIS. Řízení rizik ve firmách a jiných organizacích. 4., aktualiz. a rozš. vyd. Praha: Grada, 2013, 483 s. Expert (Grada). ISBN 978-80-247-4644-9.
SOWA, John F. Knowledge representation: logical, philosophical, and computational foundations. Pacific Grove: Brooks/Cole, c2000, xiv, 594 p. ISBN 05-349-4965-7.
STANESCU, Liana. Creating new medical ontologies for image annotation: a case study. New York: Springer, c2012, viii, 111 p. SpringerBriefs in electrical and computer engineering. ISBN 14-614-1909-3.
STEINER, K., W. ESSMAYR a R. WAGNER. Topic maps – an enanabling technology for knowledge management. 12th International Workshop on Database and Expert Systems Applications [online]. IEEE Comput. Soc, 2001, s. 472-476 [cit. 2013-06-14]. DOI: 10.1109/DEXA.2001.953106. Dostupné z: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=95310 6
TIZIANA, Margaria a Steffen BERNHARD. Leveraging applications of formal methods, verification and validation: third international symposium, ISOLA 2008, Porto Sani, Greece, October 13-15, 2008. proceedings. 1st ed. New York: Springer, 2008, 869 p. ISBN 35-408-8478-5. 97
TM4J: Topic Maps For Java [online]. 2001 [cit. 2014-10-09]. Dostupné z: http://tm4j.org/
Topic Maps [online]. 1991 [cit. 2013-12-21]. Dostupné z: http://www.topicmaps.org/
Topic Maps [online]. 2000 [cit. 2014-10-06]. Dostupné z: http://www.topicmap.com/
Topic Maps Lab [online]. 2008 [cit. 2014-10-08]. Dostupné z: http://www.topicmapslab.de/
TRUNEČEK, Jan. Management znalostí. Vyd. 1. Praha: C. H. Beck, 2004, xii, 131 s. ISBN 80-717-9884-3.
VAN HERWIJNEN, Eric. Practical SGML. 2nd ed. Boston: Kluwer Academic Publishers, 1998, xx, 288 p. ISBN 07-923-9434-8.
Vesmír: přírodovědecký časopis. Praha: Vesmír, s.r.o., 1996/7. ISSN 12144029. Dostupné z: http://casopis.vesmir.cz/
VITOVSKÝ, Antonín. Anglicko-český výkladový slovník softwaru. 4. rozš. vyd. Praha: AV SOFTWARE, 1996, 476 s. ISBN 80-901-4286-9.
VOSSEN, Piek. EuroWordNet: a multilingual database with lexical semantic networks. Boston: Kluwer Academic, 1998, 179 p. ISBN 0-7923-5295-5.
W3C - World Wide Web Consortium [online]. © 2014 [cit. 2014-11-25]. Dostupné z: http://www.w3.org/
Wandora [online]. 2012 [cit. 2014-10-09]. Dostupné z: http://wandora.org/www/
98