Využití korporátního sémantického webu ve společnostech 1
Zdeněk Molnár , Petr Girgal
2
1
Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Katedra informačních technologií nám. W. Churchilla 4, 130 67 Praha 3 e-mail:
[email protected] 1 Katedra inženýrské informatiky ČVUT - Fakulta stavební v Praze Thákurova 7, 166 29, Praha 6 – Dejvice
[email protected] Abstrakt: Cílem článku je seznámit čtenáře s technologií korporátního sémantického webu a možnostmi, které tato technologie nabízí. Jak už z názvu vyplývá, její využití je možné aplikovat především v prostředí organizací jakožto nástroje pro podporu řízení znalostí, a tedy i zvyšování efektivnosti v této oblasti. Obsahem článku je i zhodnocení přínosů metodou BSC z důvodu posouzení efektivnosti a proveditelnosti tohoto řešení. Klíčová slova: řízení znalostí, sémantický web, korporátní sémantický web, ontologie, znalosti, efektivnost. Abstract: This article aims to introduce readers with the technology of Corporate Semantic Web and the possibilities which this technology offers. As the title suggests, its use can be applied especially as an enterprise solution as a tool to support knowledge management, and thus enhancing efficiency in this area. Last part of the article is devoted to evaluation of the benefits on CSW using BSC method in order to assess the effectiveness and feasibility of this solution. Key words: knowledge management, semantic web, Corporate Semantic Web, ontology, knowledge, efficiency.
1. Úvod Myšlenka sémantického webu, tedy webu, jenž se dá považovat za rozšíření webu současného v tom smyslu, že informace v něm uložené mají dobře definovaný význam, jenž je pro webový prohlížeč srozumitelný, již s námi žije více jak deset let. Otázkou je, proč se tato technologie za poměrně dlouhou dobu nerozšířila na tolik, abychom denně mohli využívat jejích možností? Již v roce 2004 byla specifikace technologie poměrně solidně zpracována (dobře definovaná formální sémantika a RDF/XML syntaxe). K dispozici bylo mnoho slovníků v podobě Simple Knowledge Organization System (SKOS), Dublin Core, Friend of a friend (FOAF), Description of a Project (DOAP) a další. O něco pomalejší byl vývoj dotazovacího jazyka pro prostředí jazyka Resource Description Framework (RDF), jazyka SPARQL, avšak s možnostmi dotazování v RDF grafech či jejich konstrukcí, byl velmi schopným nástrojem. Programátoři však byli neustále stavěni před nové výzvy, např. jak automatizovaně tvořit RDF data, zdali je vůbec proveditelné (užitečné) konvertování velkého množství 138
SYSTÉMOVÁ INTEGRACE 1/2012
Využití korporátního sémantického webu ve společnostech
dat, jak využít velkého množství ontologií pro sdílení a dedukci nových vztahů apod. Takto nám vzniklo poměrně mnoho technologií postavených na jazyku RDF (ale i volně ve značkovacím jazyku XHTML v podobě Mikroformátů), které nabízejí a poskytují jisté škálování a strukturován. Vraťme se však zpět k původní otázce, co je příčinou toho, že se technologie sémantického webu zdaleka nepoužívá v takovém rozsahu, jaký byl původně předpokládán? Sémantický web (potažmo systémy pracující se znalostními bázemi postavenými na taxonomii a sémantice) má dle [1] velkou podporu v několika odvětvích: na poli vědy a výzkumu (a školství) v oblasti komunit (digitální knihovny, ministerstva obrany, energetický sektor, finanční služby, lékařství a biomedicína) na poli korporátní sféry – společností orientované podobně jako oblast komunit (Adobe, Oracle, HP, IBM, Sun, Nokia, Siemens, VW, Audi, NASA či Eli Lilly, Pfizer a další pharm. firmy) Jak je vidno, rozvoj sémantického webu je v dnešní době především směrován do komerční sféry v podobě korporátního sémantického webu (CSW) nebo do oblastí (věda a výzkum), kde je jeho použití aplikováno z důvodu explorativního výzkumu. Omezená míra působnosti v podobě strukturálně a pojmově „uzavřeného světa“ (prostor domény dané společnosti či komunity), dává obecně větší prostor pro realizaci sémantického webu, než neomezený prostor internetu, který je mnohem bohatší z technologického, datového, sémantického i taxonomického hlediska (nekonečná síť). Dalším problémem internetu je jeho časová nestálost a neustále se měnící zdroje. Omezenou síť je možné mnohem lépe stavět, hlídat a formovat dle obrazu jazyků a protokolů, což je v případě internetu velmi obtížné. Tato - v uvozovkách - omezení reálného světa internetu, jsou dle mého pohledu největším inhibitorem budoucího vývoje sémantického webu. Prozatímní odpovědí na problémy týkající se sémantického webu mohou být vyřešeny v doménovém prostředí firem, tedy aplikací korporátního sémantického webu. Cílem tohoto článku je seznámit čtenáře s technologií korporátního sémantického webu a možnostmi, které tato technologie nabízí. V následujících kapitolách je popsána základní myšlenka aplikace, vize a cíle týkající se oblastí, jež aplikace sleduje. Následně je stručně popsána struktura aplikace a zhodnocení jejích přínosů parafrázovanou metodou BSC.
2. Corporate Semantic Web Corporate Semantic Web (CSW), česky podnikový sémantický web, můžeme charakterizovat jako aplikaci využívající prvky a metodologie knowledge managementu, postavených na základech sémantického webu aplikovaných v podnikovém prostředí. Vznik CSW je logickým vyústěním myšlenky sémantického webu v podnikovém prostředí a jeho implementace na vlastní náklady, jelikož původní myšlenka „světového“ sémantického webu zůstává stále nenaplněna. Tímto vzniká doménově založená aplikace, orientující se na podnikové prostředí (podniková data, znalosti a aplikace) zajišťují přístup ke znalostem z podnikového klima - domény, maximálně těžící z optimalizace aplikace právě pro tuto danou doménu. Výhodou této omezenosti je maximální kontrola nad podnikovým prostředím, založeném na menším množství informací, podávající však přesnější odpovědi na dotazy – tedy výsledky. SYSTÉMOVÁ INTEGRACE 1/2012
139
Zdeněk Molnár, Petr Girgal
Obrázek 1 - Zjednodušená ilustrace CSW Pro bližší, grafickou ilustraci, zařazení podnikového sémantického webu do prostředí IS/ICT nám poslouží následující velmi zjednodušené schéma, viz obrázek č. 1. Celý diagram můžeme rozdělit do tří skupin, a to: podniková data v jakékoliv formě (zobrazené oranžovou barvou) podnikovými daty rozumíme entity uložené v podobě souborů v souborovém systému, webserveru, či databázi; stávající podnikové IS (zobrazené červenou barvou) obyčejně informační systémy využívající podniková data k dalšímu zpracování; aplikace CSW (zobrazená modrou barvou) obyčejně pracující s metadaty nad podnikovými daty a webovým obsahem. Smyslem CSW není stávající programy či IS nahradit, avšak rozšířit jejich funkčnost o další přidanou hodnotu a povýšit tak součinnost programů, informačních systémů, místních a vzdálených dat či webů o stupeň výše. V případě, že budeme vycházet ze zjednodu-šené ilustrace, viz výše, je nutné poznamenat, že CSW, stejně jako leckterý firemní software, může být zaměřen jak na znalosti interní, tak na znalosti externí pocházející např. ze zákaznické sféry. V případě CSW je možno identifikovat relevantní informace týkající se některé oblasti, přípravku, produktu či zákazníka. Stejně tak je možné orientovat služby pouze směrem dovnitř, a to s cílem pro propojení např. CSW s ES. CSW je schopen dedukovat na základě dat uložených v podnikových wiki znalostních systémech a za pomoci specializovaného ES je rozšiřovat o nové sémantické informace. Smyslem CSW tedy může být usnadnění integrace informací právě z heterogenních zdrojů, jakými mohou být ERP či BI systémy, CRM či systémy založené na praktikách dolování dat (data mining). Jako samozřejmost je nutno brát fakt týkající se zlepšeného vyhledávání informací a tím i sníženého zahlcení nepotřebnými výsledky.
140
SYSTÉMOVÁ INTEGRACE 1/2012
Využití korporátního sémantického webu ve společnostech
3. Vize a cíle CSW Je zřejmé, že každá organizace má naprosto rozdílné požadavky na implementaci aplikace v oblasti jejího primárního zaměření, avšak v oblasti, kde se kryjí základní potřeby všech organizací, se nemusí požadavky na cílový systém příliš lišit, neb základní potřebou je vždy vyhledávání. Otázkami je pouze co vyhledávat a jaký z toho budu mít cílový užitek (co mi to přinese). Dle zkušenosti, praxe i s pomocí nahlédnutí do studií proveditelností a případů užití implementace různých forem CSW [3] se spokojme s tvrzením, že obecná organizace bude primárně řešit otázky potřeb a požadavků zobecněných níže.
Z uvedeného seznamu potřeb v rámci využití v CSW je patrné, že hlavní roli hraje možnost sémantického vyhledávání spolu s propojením aplikace s dalšími prvky IS/ICT infrastruktury. Detailnější popsání a pochopení potřeb budou popsány v následujících odstavcích. Sémantické vyhledávání – potřeba sémantického rozpoznávání za účelem přesnějšího vyhledávání na základě pochopení významu slova či slovního spojení a na základě kontextuálního významu podání odpovídající odpovědi. Poměrně zajímavou myšlenkou je integrace navigačního systému vyhledávání v podobě upřesňování formulace dotazů (tzv. faceted search), či výzkumnému nebo spíše dedukčnímu způsobu vyhledávání, kdy se na základě položeného dotazu systém nejprve snaží dotaz pochopit a v případě že uspěl, podá odpovídající výsledek. Přínosem sémantického vyhledávání je vyhledávání na základě kontextu, ne čistého textu. Několikanásobné omezení významového prostoru a orientace v něm značně zužuje obor pro další vyhledávání a tím šetří čas a zvyšuje procentuální úspěšnost pro nalezení požadovaného dotazu, včetně jeho okolí. Sémantického vyhledávání v kontaktech představuje možnost vyhledávání kontaktů uživatelů vlastních firem, avšak i kontaktů externích firem (které se např. mohou SYSTÉMOVÁ INTEGRACE 1/2012
141
Zdeněk Molnár, Petr Girgal
objevovat dokumentaci k projektům apod.). Každý uživatelský účet může obsahovat krom jména, příjmení, emailu, distribučních skupin a skupin se zabezpečením, také informace ze svého životopisu, zvládnutých znalostí a technologií. K tomuto typu vyhledávání se může dále vztahovat sémantické vyhledávání kolegů dle znalostí, které se může týkat požadavku na volbu správných zaměstnanců na určitý projekt. Cílem je mít u každého zaměstnance seznam technologií, které zvládá a kterým se navíc rád věnuje (může být uloženo v životopise). Ty mohou být následně využity dvojím způsobem. Manažer hledá zaměstnance s konkrétními znalostmi z důvodu využití na projektu, nebo vysoce specializovaný zaměstnanec hledá zaměstnance se stejným zaměřením z důvodu participace na projektu či výměny znalostí. Poměrně zajímavou myšlenkou je nasazení zaměstnanců, kteří se určité technologii rádi věnují, než těch, kteří ji „pouze“ umí, či zvládají. Důsledkem této myšlenky může být efektivnější pojetí projektu především ve smyslu rychlosti zvládnutí projektu, nových, kreativních myšlenek a návrhů, které mohou být během projektu předloženy a realizovány. Přínosem v oblasti sémantického vyhledávání v kontaktech stejně jako sémantické vyhledávání kolegů dle znalostí má smysl pro efektivnější kooperaci mezi vlastními zaměstnanci i zaměstnanci pracujících na různých projektech. Volbu správných zaměstnanců pro odborné účely, což může pro společnost znamenat dodržení časového plánu, rozpočtu, ale také sdílení znalostí a zvyšování nehmotného majetku společnosti. V případě sémantického vyhledávání v projektových dokumentacích může existovat požadavek, aby na základě zvolených podmínek při vyhledávání byly k dispozici údaje, jako je název projektu, fáze projektu (projekt je připravovaný, realizovaný, v podobě studie či ve výstavbě) a jeho zaměření (v případě stavebnictví se může jednat o dopravní stavby, mostní konstrukce, podzemní dráhy, pozemní stavby, podzemní stavby, silniční stavby, městské komunikace, tramvajové tratě, tunelové stavby, vodohospodářské stavby, železniční stavby a mnohé další), kdo je investor, kdo je projektant, kdo je hlavní inženýr projektu, kdo se na projektu dále podílel, kde se projekt nasazoval (myšleno geolokačně), jaké metodiky a techniky byly použity, způsoby a postupy stavby atd. V případě změny společnosti bude zůstávat princip vyhledávání na stejné úrovni, změní se jen požadovaná data pro vyhledávání. Přínos v oblasti vyhledávání v projektových či produktových dokumentacích je zřejmý. V případě potřeby kontroly správnosti postupů, porovnání výstupů, dokumentace, či sestavování týmů pro spolupráci oceníme především přínosy v získání správných informací za velmi krátký čas (hledání napříč organizací). Podobně se můžeme postavit i k sémantickému vyhledávání v produktech společnosti. Každý produkt je z taxonomického a ontologického hlediska zařazen do určité kategorie produktů. Dále obsahuje vazby na projekt, tedy i na všechny zaměstnance, které se na daném projektu podíleli. Z druhého pohledu je produkt složen z velkého množství prvků (sloučenin či dalších prvků např. v podobě součástek), které mají v taxonomické hierarchii také určité postavení (podřadné či nadřazené; vztahy, zdali je možné je kombinovat s jinými či nikoliv). V případech biomedicíny, či automobilového průmyslu, kdy je sloučenina či automobil složen z velkého množství prvků (dílů), které je možné skládat a kombinovat pouze v určitém sledu je význam ontologického zpracování nedocenitelný. Přínosem v oblasti využití v produktech, či produktové dokumentaci může (i nemusí) být popis a úspěšnost reklamní akce spojené s daným produktem a výtěžnost z takového akce. Tímto může být dosažena informace o nevydařené reklamní akci z minulých let, či jiného trhu a 142
SYSTÉMOVÁ INTEGRACE 1/2012
Využití korporátního sémantického webu ve společnostech
provedení analýzy. Přínosů v této oblasti můžeme najít mnohem více, avšak vždy je cílem úspora financí, času, a tedy zvýšení efektivnosti práce. Potřeba po jednodušší orientaci v sociálním webu společnosti je ze sémantického hlediska poměrně úzce spjata s potřebou sémantického vyhledávání v kontaktech, či spíše sémantického vyhledávání kolegů dle znalostí. Cílem sociálního webu společnosti je diskuze o tématech, problémech a jejich řešení, a tedy i sdílení znalostí. K diskuzím, které jsou zaměřeny na určité téma, je možné přistupovat přímo, popř. dle vyhledávané znalosti. Potřebou je tedy jednodušší orientace v síťově rozhlehlém sociálním prostředí. Přínosem je v tomto případě především sdílení znalostí a tedy i zvyšování intelektuálního kapitálu společnosti. Agregovaným sémantickým vyhledáváním se rozumí potřeba vyhledávání z různých zdrojů. Na mysli mám především implementaci pro vyhledávání v metadatech různých informačních systémů. Po zvládnutí vyřešení popisu a struktury metadat a vytvoření aplikačních můstků (otázky např. kde jsou v databázi pro daný dokument odpovídající metadata) je možné zařadit dokumenty, jejich popisy a požadovaná data do rámce pro vyhledávání. V oblasti portálových prostředí, především u nadnárodních velmi košatých firem, jde především o zjednodušení vyhledávání na více portálech najednou. Stejně tak je obecný hlad týkající se vytvoření alespoň nějaké struktury z nestrukturovaných dat (především na základě metadat) u souborů různých typů, která by umožnila jednoduší orientaci a snížila tak entropii nestrukturovaného systému uložení dat. Přínosem agregovaného vyhledávání je především zkrácení času pro nalezení požadované informace. Tím, že se uživateli předloží výsledky z různých systémů, o kterých vyhledavač usoudí, že jsou pro daný dotaz relevantní, se uživateli předá informace v rozsáhlejším kontextu a tím, je možné zvýšit pravděpodobnost odhalení skrytých vazeb, jejich duplikace či nesourodost. Poměrně zajímavou myšlenkou a návrhem, který může souviset se sémantickým vyhledáváním v produktech, je automatizovaná tvorba návodů či postupů. Tato myšlenka není vůbec od věci, pomyslíme-li na fakt, že v případě ontologie postupuje od spodu stromu výše. Podobně jako skládáme součástky (v pohledu ontologie jde o jedince), které mají určité návaznostní vztahy (vlastnosti), je možné na základě hierarchie popsat celou stromovou strukturu, v našem případě např. manuál, návod, či souhrn FAQ. Přínosem v případě automatizovaného zpracování dokumentace je přínosem především úspora nákladů na člověkodny práce a tím i financí. Jako jedna z nejdůležitějších potřeb, může být uvedena orientace v paměti společnosti. Pamětí společností rozumíme všechna data v podobě strukturovaných i nestrukturovaných dat, tedy i dat v informačních systémech a portálech. Z globálního hlediska jde především o pohled do vyřešených projektů, studií, jinými slovy do paměti společnosti. Potřeby jsou především takové, aby znalosti nabyté během určitého projektu nebyly hermetizovány a uzavřeny v archivních složkách, nýbrž aby k nim bylo možné, alespoň ze sémantického hlediska přistupovat. Přínosy jsou v tomto případě stejné jako v předchozím odstavci, cílem je především úspora financí, času a zvýšení efektivnosti práce. S orientací v paměti společnosti dále souvisí sémantické vyhledávání v bázi znalostí, automatizované odvozování a dedukování. Ontologie pomáhají definovat strukturu obsahu, řazení témat, slovní spojení či slov a vztahů mezi nimi. Z globálního
SYSTÉMOVÁ INTEGRACE 1/2012
143
Zdeněk Molnár, Petr Girgal
pohledu by měl být CSW schopen plnit i jakousi roli expertního systému, neboť jazyky, nástroje a odvozování používá velmi podobné. V případě všech zmíněných způsobů pro realizaci sémantického vyhledání se nabízí myšlenka znovupoužití výstupů libovolného typu za účelem doplnění dotazu, či jeho opětovného využití. Přínosem je především úspora času a práce pro tvorbu opětovných dotazů. Poslední myšlenkou je zvýšení efektivity v oblasti vzdělávání lepší dohledatelností požadovaných dat. Tato myšlenka vyplývá z podstaty myšlenek uvedených v předchozích odstavcích, a tedy i přínosy by měly být zcela zřejmé.
4. Struktura aplikace CSW Přestože každé firemní řešení CSW může být řešeno naprosto jedinečným způsobem, vždy by mělo (alespoň z funkčního pojetí) obsahovat tyto tři oblasti důležité pro vývoj [2]: 1. Vývoj ontologií (Ontology Engineering) – zajišťující vývoj metod a metodik pro vytváření nových ontologií, stejně jako rozvoj procesů pro snadnější údržbu a budoucí vývoj dalších nových ontologií. 2. Sémantické aplikace – oblast sémantických aplikaci může být velmi různorodá, avšak vždy se stejným cílem. Vždy je třeba zhodnotit, do jaké míry je možné využít a rozšířit stávající aplikace včetně jimi poskytovaných metadat, aby byly co nejvíce využitelné pro sémanticky založené technologie. 3. Spolupráce prostředí – zahrnuje nástroje a metody pro spolupráci zaměstnanců v oblasti aplikace CSW. Dalším cílem je využití lidského chápání, spolupráce a porozumění, za účelem využití těchto prvků pro další automatizovaný vývoj, dedukování a adaptaci sémantických aplikací a ontologií. Z hlediska architektonického pojetí je možné popsat model aplikace CSW na následujícím vrstveném diagramu (viz obr. 2). Diagram je rozdělen na několik vrstev dle funkčního pojetí (i když v případě tripple store to nebylo úplně možné). 1. Aplikační vrstva zobrazuje vrstvu, se kterou primárně přichází do kontaktu uživatel v podobě softwaru (např. webového prohlížeče) navštívením webového portálu. Součástí aplikační vrstvy je i API pro výměnu dat či požadavků s dalšími aplikacemi. 2. V druhé vrstvě pro příjem požadavku jsou data, či požadavky na vyhledávání přijata (tzv, search endpoint) a předána rámci pro vyhledávání, který zde představuje Query Engine. 3. Třetí vrstva je představována vrstvou logiky či dedukční vrstvou (reasoning layer). Tato vrstva velice úzce spolupracuje s anotační a ontologickou vrstvou. Cílem obou těchto vrstev je zpracování nesémantických dat různých formátů a uložení zpracovaných dat do úložiště. Mezi základní zpracovávané procesy je možné řadit sémantickou anotaci a zpracování dat (a to z intranetu i z internetu), dedukování v ontologiích či extrakci informací z různých datových formátů. Dále jsou obsaženy nástroje pro vyhledávání a fulltextovou indexaci, pro ukládání N-Triples a samozřejmě Reasoner. 4. Datová vrstva představuje veškeré formy dat, zde jsou rozděleny na transakční (SQL Databáze), komunikační (e-mailový obsah) a datové, které představují 144
SYSTÉMOVÁ INTEGRACE 1/2012
Využití korporátního sémantického webu ve společnostech
veškerá data (soubory - obrázky, dokumenty, hudba, video atd.), jež leží na datových nosičích společnosti. Web Portal
Aplikační vrstva (Application layer)
Browser Search
External App Search
Search Endpoint
Příjem požadavku (Retrieval layer) Query Engine
Parser
Vrstva logiky (Reasoning layer)
Triple Store
Ontologická vrstva (Annotating and Ontology layer)
Information Extractor + Annotator
Datová vrstva (Data layer)
Reasoner Crawler
SQL Databases
Communication data
Ontologies Vocabularies
Files, documents, pictures
Web data
Obrázek 2 - Struktura CSW po vrstvách V dalších řádcích se pokusím velmi stručně popsat hlavní komponenty celého systému a postup při vyhledávání. Nechť existuje datová vrstva, jež je zobrazena na předchozím obrázku fialovou barvou. Data v tomto prostoru se vyskytují převážně v nestrukturované formě, avšak téměř vždy jsou uložena v nějakém formátu. Pokud jsme schopni tento formát přečíst, jsme schopni z něj získat i nějaká data (metadata). Nástroje, které se pro tento účel dají použít, jsou tzv. RDFizery [4][5] (na obrázku jsou představeny jako Crawler, tedy automatizovaná služba procházející web či předem dané datové úložiště a Parser, tedy služba mající za úkol analýzu zdroje). V současné době jsou RDFizery schopny přečíst a zpracovat poměrně velké množství formátů (Microformats, Web Services for Googlebase, Amazon, eBay, Flickr, Del.icio.us, Atom, RSS 2.0, Office Docs (Open Office and Microsoft Office), Image formats - EXIF, Audio, Video, PDFs, detailní přehled viz např.[8]). Ve skutečnosti není problém rozparsovat jakýkoliv dokument či službu, problém je spíše ten, že mnoho formátů je uzavřených, nedokumentovaných (případně licencovaných), a nelze je tedy otevřít jinak než softwarem výrobce. Cílem RDFizeru je získání RDF dat z nestrukturovaných, ale i strukturovaných dat. Tato data je možné v dalším kroku ještě rozšířit o další metadata prostřednictvím tzv. Meta SYSTÉMOVÁ INTEGRACE 1/2012
145
Zdeněk Molnár, Petr Girgal
Cartridgí, které obohatí původní data. Pod tímto termínem si můžeme představit službu (i třetí strany), která poskytuje slovníky a ontologie, viz např. [6][7]. Takto obohacená a zpracovaná data je třeba uložit do nějakého úložiště. Ne vždy chceme ukládat pouze záznamy typu SPO (Subjekt-Predikát-Objekt), v některých případech nechceme přijít o metadata či dokonce o RDF graf (i když i ten je pouze sadou RDF trojic). V obecném případě obvykle může stačit úložiště typu SPO, které může nabídnout např. AllegroGraph, Virtuoso Server, 4store, HBase, Cassandra, Bigdata RDF Database, Jena a mnohé další. Další část, jež by měla být součástí vrstvy logiky je krom SPARQL endpointu tzv. Reasoner. Cílem reasoneru je odvozování, tedy odvození vztahu, který je obsažený v ontologii, ale není v ní vysloveně uvedený. Existuje mnoho produktů, které využívají vlastní reasonery, či reasonery externí, mezi které patří např. Pellet, Fact++ a další. Jednou z důležitých součástí CSW je uživatelské rozhraní, které může být představeno v podobě portálu či např. CMS systému (dle požadavku na cílový systém). Samozřejmě, nikdy nelze unifikovat portálové prostředí, v případě CSW je vždy třeba volit jednotlivé výstupy či požadované miniaplikace na základě potřeb společností či uživatelů, kteří si mohou výstupy z těchto entit měnit či personalizovat. V případě sémantického vyhledávání navrhuji volit postup, jenž je určen pro vyhledávání, rozpoznávání, kategorizování, a zobrazení výstupů. 1. Uživatel (aplikace) volí, chce-li vyhledávat standardním způsobem či filtrovat 2. Je zadán požadavek na vyhledávání 3. Je vygenerován SPAQRL dotaz 4. Dotaz je zpracován (zpracování dotazu, vyhledání a analýza dat, předání na výstup) 5. Dle analyzovaného zdroje je vybrána komponenta pro výstup 6. Výstup je předán komponentě, která jej zobrazí na výstupu (text, obrázek, mapa, diagram, graf) Takto zjednodušeně je možné popsat základní princip vyhledávání v sémanticky uložených datech. Jednou z mnoha otázek týkajících se proveditelnosti celého řešení je výtěžnost dat v konfrontaci s oblastí nákladů pro vývoj a tvorbu aplikace CSW. Touto oblastí „měření“ přínosů se zabývá následující kapitola.
5. Zhodnocení přínosů metodou BSC Při hodnocení přínosů, a tedy i efektivnosti je potřeba zjistit, zdali očekávané přínosy byly naplněny. Problémem je, jak proti sobě postavit finanční náklady na zhotovení aplikace, které jsou měřitelné v peněžních jednotkách a přínosy, které jsou dány rozdílnými požadavky, a tedy i jednotkami. Dalším problémem je realita životního cyklu aplikace CSW. Mezi obvyklé metody pro měření aplikací patří např.: měření počtu přístupů uživatelů, měření počtu navrácení uživatelů, vyhodnocení plnění KPI, měření spokojenosti – co se vám líbí, co byste chtěl vylepšit?
146
SYSTÉMOVÁ INTEGRACE 1/2012
Využití korporátního sémantického webu ve společnostech
dotazníková forma pod článek (pomohl vám zobrazený výsledek?) známkování výsledků osobní pohovory Je zřejmé, že mnoho z těchto metod se spíše dá zařadit jistý indikátor výkonosti (samozřejmě krom položky „vyhodnocení plnění KPI“) a podklad pro rozhodování při používání vícekriteriální analýzy. Při implementaci CSW je třeba vždy vycházet z přínosů aplikace a zvolit si předpokládané oblasti přínosů. Dále pak pro tyto oblasti zvolit klíčové ukazatele výkonnosti. Vzhledem k tomu, že v případě sémantického webu je cílem především úspěšné vyhledávání dotazu (či úspěšně vyhodnocená otázka a podaná odpověď), je nutné, aby se do vyhodnocování přínosů (pokud chceme přesná zhodnocení) zapojili všichni uživatelé, kteří s aplikací pracují. Pokud vycházíme z metody BSC, obecně ji můžeme chápat takto: Budou-li zaměstnanci kvalifikovanější a bude-li využito inovovaných a lepších technologií, budou efektivněji probíhat firemní procesy, a tím by měli být lépe uspokojováni zákazníci, což bude mít za následek větší zisk v číslech v podobě finančních ukazatelů. Je-li provedena transformace daného tvrzení do oblasti korporátního sémantického webu, může být parafrázována takto: Bude-li aplikace CSW inovována a vylepšována na základě firemních potřeb, budou efektivněji probíhat procesy spojené s poskytováním informací, což bude představovat spokojenost jak našich uživatelů, tak externích partnerů (zákazníků), což by mělo mít za následek zlepšení finančních ukazatelů. PŘÍNOSY V OBLASTI CSW Co je pro celou firmu přínosem při provozu řešení CSW?
ORIENTACE NA UŽIVATELE/ZÁKAZNÍKA Co nutí uživatele vracet se na CSW a využívat jej každý den?
Mise být pro firmu efektivní, oblíbený při práci a tím nepřímo přispívat k zvyšování profitu
Mise být užitečný při každém vyhledávání či poskytování informací (najít to, co uživatelé hledají)
Cíle
Cíle snižování nákladů vzrůst intelektuálního kapitálu
Strategický plán neustálé vytváření a obohacování plánů pro vývoj aplikace dokončování stávajících plánů / projektů
SYSTÉMOVÁ INTEGRACE 1/2012
spokojenost uživatelů / zákazníků zvyšující se počet uživatelů / zákazníků Spokojenost uživatelů známkování výsledků dotazníková forma měřením spokojenosti množství stížností rozhovor s uživateli
147
Zdeněk Molnár, Petr Girgal
Hodnota aplikace podíl na růstu knowledge managementu zvyšování intelektuálního kapitálu Dodržení rozpočtu snižování nákladů na provoz udržování opodstatněných nákladů na vývoj
Udržení uživatelů udržení poměru uživatelů, kteří používají aplikace CSW procento uživatelů používající aplikaci opětovně
VÝVOJ ŘEŠENÍ CSW
KVALITA PROVOZU APLIKACE CSW
Jakým způsobem bude vyvíjena a vylepšována aplikace CSW tak, aby poskytovala stále větší komfort?
V jakých službách a procesech musí aplikace vynikat, aby uspokojila vedení firmy?
Mise vylepšování aplikace k poskytování lepších výstupů, ne jen formou vyhledávání, ale i dedukce. Vylepšování dotazování a odpovídání.
Mise poskytovat služby v podobě sémantického vyhledávání a automatizace některých procesů
Cíle vylepšování automatizovaných procesů v podobě (dolování dat, odvozování atd.) školení vlastních zaměstnanců jak ze strany IT pro správu a vývoj řešení, tak běžných zaměstnanců z důvodu automatického značkování textů Odborné znalosti zaměstnanců počet školení zaměstnanců Odborné znalosti vývojářů počet školení vývojářů specializace vývojářů orientace na nové technologie Správa lidských zdrojů průměrné pracovní vytížení vývojáře počet hotových případů na vývojáře počet rozdělaných případů na vývojáře časové zpoždění případů
148
Cíle efektivní vyhledávání dostupnost systému Efektivnost vyhledávání CSW průměrný čas strávený nad vyhledáváním počet opakovaných „alternativních“ vyhledávání Dostupnost aplikace CSW průměrná doba provozu aplikace průměrná doba nedostupnosti aplikace maximální doba nedostupnosti aplikace Vylepšování aplikace CSW počet vylepšení na časovou jednotku počet oprav bugů na časovou jednotku průměrná doba upgradu Bezpečnost a spolehlivost nepřítomnost oprav pro kritické podprogramy nepřítomnost připomínek v auditu SYSTÉMOVÁ INTEGRACE 1/2012
Využití korporátního sémantického webu ve společnostech
Při použití metody BSC jsme si ukázali jaké KPI je možné volit při posuzování efektivnosti řešení aplikace korporátního sémantického webu. Jak již bylo v článku uvedeno, investice vložené do IT se dají v některých směrech poměrně snadno monitorovat, pakliže se jedná o nástroje, které se přímo podílejí na profitu firmy, je to mnohem jednoduší. V případě CSW jakožto podpůrného nástroje pro zvyšování hodnoty intelektuálního kapitálu firmy, je nákladová stránka konfrontována se skrytou nepřímou stranou zisku, a z tohoto důvodu je třeba efektivnost projektu hodnotit velmi obezřetně a s citem.
6. Závěr V tomto příspěvku bylo cílem seznámit čtenáře se základními rysy řešení aplikace korporátního sémantického webu a jeho hlavními komponentami. Tyto komponenty se mohou dle složitostí a požadavků tvůrce aplikace lišit, avšak základní myšlenka bude vždy stejná, a to že data je potřeba najít, rozparsovat – zpracovat, uložit a na základě zpracovaných dat dále rozhodovat či dedukovat. Výsledky jsou nadále zpracovány a předány uživateli na výstup. Článek se dále zabýval nastíněním základních myšlenek v podobě potřeb a požadavků pro chování cílového systému a jeho jednotlivých komponent. Součástí příspěvku byl i jednoduchý popis struktury aplikace, jednotlivých vrstev a základní popis principu vyhledávání. Poslední část příspěvku byla věnována zhodnocení přínosů parafrázovanou metodou balanced scorecard, jako jedné z mnoha metod pro měření výkonosti např. v oblasti intelektuálního kapitálu společností. Přestože se článek nevěnuje vysvětlení základních pojmů, principů a metod v oblasti sémantického webu (neboť je tato problematika poměrně velmi složitá), je možné i dle několika předchozích stránek zhodnotit oblasti nasazení aplikace, a to především v podnikové sféře. Její složitost a současný manažerská neznalost tohoto prostředí i technologie je však taková, že její používání v podnikovém prostředí je stále na začátcích, a to především v českém prostředí. V oblasti větších, především nadnárodních, firem má však své hluboké uplatnění a věřím, že do budoucna bude i menším společnostem velmi prospěšná.
7. Použitá literatura [1] [2] [3] [4] [5] [6]
HERMAN, I.: W3C – State of the Semantic Web, 2007 [online]. Dostupné z: http://www.w3.org/2007/Talks/0424-Stavanger-IH/Slides.pdf Corporate Semantic Web – Areas of Research – Freie Universität Berlin [online]. Dostupné z:
W3C: Semantic Web Case Studies and Use Cases [online]. Dostupné z: RDFizers: Massachusetts Institute of Technology [online]. Dostupné z: W3C: ConverterToRdf [online]. Dostupné z OpenCalais Web Service [online]. Dostupné z:
SYSTÉMOVÁ INTEGRACE 1/2012
149
Zdeněk Molnár, Petr Girgal
[7] [8]
UMBEL Web Service [online]. Dostupné z: RDFSizers [online]. Dostupné z:
JEL: M15, D80, L66
150
SYSTÉMOVÁ INTEGRACE 1/2012