I N V E S T I C E
D O
R O Z V O J E
V Z D Ě L Á V Á N Í
Univerzita Karlova v Praze Ústav informační studií a knihovnictví
Modul č. 4 Informační a znalostní management Klára Havlíčková
Určeno pro projekt: Název: Studium informační vědy a znalostního managementu v evropském kontextu Reg. číslo: CZ.1.07/2.2.00/07.0284 Operační program Vzdělávání pro konkurenceschopnost Oblast podpory. 2.2 Vysokoškolské vzdělávání Realizace: Vysoká škola báňská - TU Ostrava, Ekonomická fakulta, pracoviště Obchodní akademie a VOŠ Valašské Meziříčí
1
OSNOVA: PŘEDMLUVA ................................................................................................................................ 3 1
ÚVOD .................................................................................................................................. 4
2
SOUVISLOSTI MEZI POJMY DATA – INFORMACE – ZNALOSTI ................................................ 5
3
INFORMAČNÍ A ZNALOSTNÍ MANAGEMENT ........................................................................ 11
4
INTERPRETACE INFORMACÍ, ZNALOSTÍ A OBSAHU TEXTU .................................................. 15
5
POŘÁDÁNÍ INFORMACÍ A ZNALOSTÍ ................................................................................... 19
6
FOLKSONOMIE - VYBRANÝ TREND V POŘÁDÁNÍ INFORMACÍ A ZNALOSTÍ .......................... 24
7
APLIKACE SYSTÉMŮ ZALOŽENÝCH NA TAGOVÁNÍ ............................................................. 29
ZDROJE PŘÍKLADŮ A OBRAZOVÝCH UKÁZEK ............................................................................. 43
2
PŘEDMLUVA Předkládaný text je určen studentům oboru informační studia a knihovnictví jako doplňkový materiál k výuce předmětů se zaměřením na pořádání informací a znalostí. Klade si za cíl představit studentům životní cyklus informací a znalostí. Vztahy mezi pojmy data – informace – znalosti uvést do souvislostí. Nastínit problematiku analýzy obsahu dokumentu se zaměřením na otázku subjektivní interpretace textu, jakožto nositele informace. Uvést vybrané příklady tradičních systémů organizace znalostí ve srovnání se systémy založenými na možnostech nástrojů Webu 2.0. Cílem textu je také seznámit studenty s možnostmi sdílení informací o obsahu dokumentu i obsahu netextových objektů v prostředí Internetu (se zaměřením na vybrané katalogy a databáze knihoven, muzeí a galerií). Text je doplněn příklady a ukázkami vybraných systémů. Jeho součástí jsou také úkoly a cvičení, která vedou čtenáře k zamyšlení nad danou problematikou a mohou tak být podkladem pro skupinové diskuze či projekty v rámci prezenční výuky.
3
1 ÚVOD Informace a znalosti jsou základem pro činnost a fungování jakékoliv systému, organizace, společnosti a stejně tak pro jednání jednotlivců. Na základě znalostí činíme rozhodnutí. Veškeré naše jednání je založeno na informacích, které dáváme do souvislostí, nahlížíme na ně na základě našich předchozích znalostí a zkušeností, snažíme se je interpretovat. Na základě těchto znalostí se rozhodujeme, vytváříme znalosti nové, které pak mohou být dále předávány. Nástrojem nebo prostředkem pro uchování informací a znalostí mohou být informační a komunikační technologie. Umožňují např. uchování informací a znalostí, jejich pořádání, přenos, sdílení, vyhledávání apod. Aby bylo možné s daty, informacemi i znalostmi pracovat, je nutné je interpretovat, přiřadit jim význam. Tento význam je ovlivněn nejen našimi znalostmi a zkušenostmi, případně kvalitou dané informace, ale také kontextem, tedy souvislostmi, vnějšími i vnitřními vlivy. Informace a znalosti je potřeba nejen přijímat a pracovat s nimi, ale také sdílet s ostatními, v čemž nám velmi pomáhají informační a komunikační technologie. Vhodným prostředím pro sdílení informací a znalostí a práci s informacemi obecně je, kromě jiných také pro práci knihoven a ostatních paměťových institucí, právě prostředí Webu a nástroje a možnosti Webu 2.0, jimž je věnována sedmá, stěžejní kapitola tohoto textu. Knihovny mohou využívat znalostního potenciálu svých uživatelů tím, že jim umožní zapojit se aktivně do procesu indexace v rámci svých vlastních katalogů. Mohou tak využít terminologickou základnu svých uživatelů, informace, které uživatel interpretoval na základě analýzy textu. Vnikají slovníky vycházející z jazyka uživatelů, které je možné srovnávat s řízenými slovníky, analyzovat a hodnotit je. Tomuto tématu je věnována dílčí kapitola. Informační specialisté by proto měli sledovat trendy, požadavky uživatelů, uživatelské chování, tedy způsoby, jak lidé pracují s informacemi; jak sdílejí, předávají a sdělují své poznatky. Pro knihovny je zde na základě sledování trendů možnost projektů, inovací apod. A především: aktuální trendy v dílčích etapách životního cyklu informací a znalostí mohou být předzvěstí trendů budoucích na poli práce s informacemi a znalostmi.
4
2 SOUVISLOSTI MEZI POJMY DATA – INFORMACE – ZNALOSTI Základem pro naše jednání a rozhodování jsou data, informace a znalosti. Jedná se o pojmy spolu související. Tyto souvislosti mohou být vyjádřeny následovně: DATA Æ porozumění vztahům Æ INFORMACE Æ porozumění zákonitostem Æ ZNALOST Æ porozumění principům Æ MOUDROST
Obr. 1: Data – informace – znalosti – moudrost [BELLINGER, 1999]
VYMĚTAL a kol. [2005, s. 12] uvádějí jako příklad souvislosti mezi pojmy data – informace – znalosti následující příklad: data = noty Æ informace = partitura Æ znalost = interpretace skladby konkrétním sólistou nebo dirigentem. 1) DATA Data jsou objektivní fakta o událostech [DAVENPORT, PRUSAK, 1998, s. 2]. Mohou to být např. čísla, písmena, symboly apod., kterým se snažíme přiřadit význam, porozumět jim a interpretovat je. VYMĚTAL a kol. [2005, s. 12] charakterizují data následovně: -
data, představují obvykle něco, co se dá v praxi získat experimentem, měřením, pozorováním nebo šetřením;
-
data tedy objektivně zobrazují stavy nebo vlastnosti objektů nebo probíhající procesy v reálném prostředí kolem nás, a to nezávisle na našem vědomí; 5
-
základem dat jsou znaky, což mohou být zejména číslice, písmena a symboly (tečky, čárky, noty apod.);
-
v širším pojetí se pojmu data používá pro numerické (dnes především), textové, obrazové a zvukové údaje, aniž posuzujeme, co znamenají pro příjemce. Jde nám především o jejich vyjádření a uložení pro perspektivní zpracování;
-
data můžeme považovat za jednoduché reprezentační nástroje faktů s jednorozměrným, jedinečným významem.
2) INFORMACE Informace jsou data s významem, který vyplývá z kontextu. Význam byl získán v procesu interpretace, v procesu porozumění vztahům. Na vstupní data bylo nahlíženo v určitém kontextu. Informace je možné dále interpretovat, třídit, sdělovat. Proces interpretace je však subjektivní, založen na předchozích znalostech a zkušenostech, kterými je proces interpretace ovlivňován. Informace jsou konkrétní fakta, mohou to být určité zprávy, sdělení (nejen v podobě textové, ale i v podobě obrazové, jako např. informace obsažené v reportážní fotografii, informace, které sděluje reklama). V těchto příkladech převládá vizuální složka sdělení nad textovou. VYMĚTAL a kol. [2005, s. 12] charakterizují informace následovně: -
informace jsou data, kterým příjemce přisuzuje určitý význam na základě znalostí, zkušeností a vědomostí, kterými disponuje, a která u příjemce snižují entropii (neurčitost, neuspořádanost) vzhledem k jeho potřebám a požadavkům.
Životní cyklus informace Součástí životního cyklu informace (nebo také informačního procesu) jsou následující etapy: ¾ získávání informací (nebo také tvorba) ¾ zpracování ¾ pořádání ¾ uchování ¾ vyhledávání ¾ zpřístupnění ¾ distribuce
6
¾ používání ¾ vyhodnocování ¾ sdílení ¾ aplikace 3) ZNALOSTI Znalost (angl. knowledge, v češtině pak lze použít slova jako: poznání, poznatek, vědění, ale také dovednost) vyplývá z porozumění zákonitostem. Znalost je informace s přidanou hodnotou. Je uspořádána v lidské mysli tak, že může být záměrně používána. Na základě znalostí je možné se rozhodovat, zahrnovat znalosti do svých jednání. Znalosti jsou založené na zkušenostech, na interpretaci, porozumění, poznávání. Jsou také závislé na inteligenčních schopnostech a na schopnostech umět dát věci do souvislostí. Znalost je širší, hlubší, bohatší než data nebo informace [DAVENPORT, PRUSAC, 1998, s. 5]. Znalosti jsou ovlivněny zkušenostmi, souvisejícími informacemi, určitými hodnotami. Jsou součástí běžných procesů. V souvislosti s pojmem „znalost“ je zmiňován pojem „zkušenost“. Jedná se o to, co si přinášíme z minulosti, tedy to, co jsme se naučili ve škole nebo získali praxí. Zkušenosti je možné předat v podobě modelů chování, pracovních postupů apod. Znalosti se předávají velmi těžko. Jsou totiž založeny právě na našich osobních zkušenostech, je to něco, co máme uvnitř sebe, něco, co se velmi těžko třídí a předává. VYMĚTAL a kol. [2005, s. 209] uvádějí, že: -
znalosti
vznikají
odvozením
z informací
jejich
porovnáváním,
tříděním,
vyhodnocováním, ověřováním a zasazováním do kontextu ostatních informací, znalostí i zkušeností. Kontext je důležitý pro rozlišení různého významu znalosti – teprve zasazením informace do kontextu vznikne znalost. Znalosti vznikají na základě starších znalostí. Již existující znalost má schopnost vytvořit novou znalost. P. GOTTSCHALK [2008, s. 131] definuje znalost jako informaci, která je spojena se zkušeností, souvislostmi, interpretací, poznáním a kreativitou. Dále uvádí, že znalost je znovu použitelný zdroj, který má vysokou hodnotu pro organizaci, pokud je aplikován při výrobě produktů a nabídce služeb. Říká také, že znalosti nemohou být uchovávané v počítači, mohou být uchovávány pouze v lidské mysli. Znalost je to, co člověk zná, ví a umí. Znalost nemůže existovat bez toho, kdo tuto znalost má. 7
DAVENPORT a PRUSAC [1998, s. 5] nahlížejí na znalost jako na směs zkušeností, hodnot, informací vyplývajících ze souvislostí a odborného pohledu, který poskytuje rámec pro hodnocení a zařazování nových zkušeností a informací. Znalosti nám umožňují spolupracovat, díky znalostem můžeme diskutovat, argumentovat. Dokážeme odpovědět na otázku „jak?“. Znalosti je možné vyhledávat, organizovat, aplikovat, rozšiřovat. Hodnotu znalostí zvyšuje lidská zkušenost, souvislosti a interpretace. Životní cyklus znalosti (nebo také tok znalostí) lze podle RIBIERE a ROMAN [2006, s. 336] rozdělit do čtyř základních kategorií: ¾ tvorba, získání, zjištění znalostí (poznatků) ¾ uchování, pořádání ¾ přenos, sdílení, šíření ¾ používání, aplikace Základní typy znalostí: Podle T. D. WISLONA [2002b, s. 3] zahrnuje znalost mentální proces chápání, porozumění a učení, což se děje v mysli a zároveň je v interakci se světem, který je mimo mysl, nicméně vyžaduje interakci se světem vně mysli. Wilson také uvádí, že data a informace mohou být řízeny, ale znalosti (tedy to, co známe, víme), nemůže být nikdy řízeno. Doplňuje to tím, že často nevíme, co víme, a to, že něco víme, se může objevit nebo vynořit ve chvíli, kdy potřebujeme znalost použít proto, abychom mohli něco vykonat nebo učinit. Znalosti lze rozdělit na dva základní typy: -
explicitní znalost (explicit knowledge) o kodifikovaná znalost o znalost, která je schopna přenosu, je možné ji sdílet o znalost, kterou je možné uchovávat, archivovat (např. za pomoci technologií) o jedná se např. o formální znalosti, jako jsou fakta, teorie apod.
-
tacitní znalost (tacit knowledge) o znalost těžko kodifikovatelná o znalost těžko přenositelná o znalost, která je skrytá v mysli člověka
8
o je založena na osobních zkušenostech o je těžké ji formalizovat a předávat ostatním o např. hodnoty, zkušenosti, způsob jednání (možnost předání sdílením zkušeností za pomoci mentálních modelů) 4) MOUDROST Moudrost (angl. wisdom) stojí v rámci souvislostí mezi pojmy na nejvyšší pozici. Moudrost nemůže být sdílená jako znalost, neboť je spojena s procesem individuálního učení, kdy je kontext příliš osobní. Díky procesu porozumění si můžeme odpovědět na otázku „proč?“. VYMĚTAL a kol. [2005, s. 209] charakterizují moudrost jako: -
soubor znalostí, vycházejících z pochopení
podstaty problematiky
v daných
souvislostech, z využití rozumové i emocionální inteligence jednotlivce (znalostní kompetence), jeho hodnotících kritérií a individuálního vztahu k okolnímu prostředí, resp. světu, a vycházející z vysokého stupně lidského poznání.
[?] CVIČENÍ: Na konkrétním příkladu uveďte rozdíl mezi pojmy „data – informace – znalosti“. Uveďte příklad transformace dat v informace a ve znalosti. Zamyslete se nad hledisky ovlivňujícími proces transformace.
Použité zdroje • BELLINGER, Gene; CASTRO, Durval; MILLS, Anthony. Data, information, knowledge and wisdom [online]. Copyright 2004 [cit. 2010-08-30]. Dostupný z www:
. • BUREŠ, Vladimír. Znalostní management a proces jeho zavádění : průvodce pro praxi. 1. vyd. Praha : Grada, 2007. 212 s. Mangement v informační společnosti. ISBN 978-80247-1978-8. • DAVENPORT, Thomas H.; PRUSAK, Laurence. Working knowledge : how organizations manage what they know. Boston : Harvard Business School, 1998. xxiv, 201 s. 0-87584655-6. • GOTTSCHALK, Petter. Knowledge management. In Jennex, Murray E. (ed.). Knowledge management : concepts, methodologies, tools, and applications [online]. Hershey : Information Science Reference, 2008, s. 130-143. Dostupné v databázi Gale Virtual Reference Library: . 9
• RIBIERE, Vincent M.; ROMÁN, Juan A. Knowledge flow. In Schwarz, David G. (ed.). Encyclopedia of knowledge management [online]. Hershey : Idea Group Reference, 2006, s. 336-343. Dostupné v databázi Gale Virtual Reference Library: . • VYMĚTAL, Jan; DIAČIKOVÁ, Anna; VÁCHOVÁ, Miriam. Informační a znalostní management v praxi. Praha : LexisNexis CZ, 2005. 399 s. ISBN 80-86920-01-1.
10
3 INFORMAČNÍ A ZNALOSTNÍ MANAGEMENT Informační management (nebo také řízení informací, angl. information management) využívá manažerských principů k získávání, organizaci, řízení, distribuci a používání informací za účelem efektivního fungování organizací všeho typu [WILSON, 2002a, s. 263]. Pojem je možné také vykládat jako “řízení informačních toků” se zaměřením na využití informací v řídících procesech, v procesech rozhodování. Informační zdroje jsou integrovány do procesů v organizaci a mohou tak zvýšit jejich efektivnost. Informační management využívá informace k zajištění vlastní činnosti organizace. Je založen na kvalitě informací, jejich obsahu, dostupnosti a použitelnosti. Zaměřuje se na nové možnosti práce s informacemi. Podle VYMĚTALA a kol. [2005, s. 46] lze informační management definovat jako: -
transdisciplinárně pojatý soubor poznatků, metod a doporučení systémových přístupů a informatiky, které pomáhají účelně realizovat informační procesy manažerského myšlení a k dosažení podnikatelských cílů organizace.
Z informačního managementu vychází znalostní management. Jak uvádí TRUNEČEK [2004, s. 29]: informační management je v současném chápání podkladem a východiskem pro management znalostí, čerpá z něj, využívá jeho aparát a dále jej rozvíjí, ale je nicméně jeho součástí. Strategie znalostního managementu je založena na vztahu mezi lidmi, na procesech znalostního managementu a na použitých technologiích. Znalosti jednotlivců a jejich efektivní využívání a sdílení (angl. sharing) jsou důležitým zdrojem v organizaci. Dostupnost správných znalostí – těm správným lidem – v tu pravou chvíli. Vychází se z individuálních znalostí jednotlivých pracovníků nebo členů dané organizace. Tyto znalosti mohou být využívány v rozhodovacích a řídících procesech. Znalostní management je strategický proces pro udržení konkurenceschopnosti – využívání nových nápadů a znalostí, důležitý pro rozhodování za účelem zlepšení činností v organizaci. Je založen na předešlých zkušenostech a na potřebě inovací, na přenosu kvalitních znalostí. Pro znalostní management jsou významné webové technologie, které umožňují vyhledávání a přístup k zaznamenaným informacím a poznatkům.
11
Znalostní management (angl. knowledge management) je založen na schopnosti sdílení a využívání informací, především za pomoci informačních a komunikačních technologií. Dílčími procesy znalostního managementu je tvorba, uchování a sdílení informací mezi lidmi a skupinami, které mají podobné zájmy nebo potřeby. Zásadní je znalosti nejen mít, ale být schopný je i využívat. Přenos znalostí mezi lidmi nebo organizacemi v prostoru a čase se nazývá „tok znalostí“ (angl. knowledge flow). Důležité je dobré zacházení se zdroji znalostí. Vhodné je sdílení znalostí mezi lidmi za účelem vytváření nových znalostí. Tedy znalosti nejen nabývat, ale také je umět aplikovat. TRUNEČEK [2004, s. 28] uvádí, že v obecné rovině managementem znalostí rozumíme systematický přístup k tvorbě, získávání, uchování, šíření, sdílení a k aktivnímu využívání znalostí s cílem zvýšit výkon organizace. A doplňuje [s. 29], že v současném pojetí je informační management velmi úzce spojen s rozvojem informačních technologií a z pohledu managementu znalostí rozvíjí zejména explicitní znalosti, ale znalostní management obsahuje ještě řadu dalších komponent.“ VYMĚTAL [2005, s. 207] k tomu dodává, že se v podstatě jedná o systematické získávání, analýzu, syntézu a sdílení znalostí, názorů na podstatu problémů i zkušeností, které ve svém souhrnu umožňují snížit riziko při rozhodování. Dílčí procesy znalostního managementu: ¾ tvorba znalostí nebo objevení znalostí ¾ výběr a jejich vyhledávání ¾ získávání znalostí nebo ¾ jejich odvozování, vytváření nových znalostí ¾ organizace (třídění, pořádání) a reprezentace znalostí ¾ ověřování znalostí ¾ uchovávání ¾ sdílení ¾ používání a distribuce (rozšiřování)
12
[?] CVIČENÍ 1: Uveďte příklady motivace ke sdílení znalostí. [?]
CVIČENÍ 2: Analyzujte jednotlivé vrstvy znalostního managementu dle následující
ilustrace a vyberte ty procesy, které se vztahují k problematice pořádání a vyhledávání informací a znalostí. Vysvětlete vaši volbu.
Obr. 2: Vrstvy znalostního managementu [SCHWARTZ, 2008, s. 26]
Použité zdroje • BUREŠ, Vladimír. Znalostní management a proces jeho zavádění : průvodce pro praxi. 1. vyd. Praha : Grada, 2007. 212 s. Mangement v informační společnosti. ISBN 978-80-247-1978-8. • DAVENPORT, Thomas H.; PRUSAK, Laurence. Working knowledge : how organizations manage what they know. Boston : Harvard Business School, 1998. xxiv, 201 s. 0-87584655-6.
13
• RIBIERE, Vincent M.; ROMÁN, Juan A. Knowledge flow. In Schwarz, David G. (ed.). Encyclopedia of knowledge management [online]. Hershey : Idea Group Reference, 2006, s. 336-343. Dostupné v databázi Gale Virtual Reference Library: . • SCHWARTZ, David G. A birds-eye view of knowledge management : creating a disciplined whole from many interdisciplinary parts. In Jennex, Murray E. Knowledge management in modern organization [online]. Hershey : Idea Group Publishing, 2007, s 18-29. Dostupné v databázi Gale Virtual Reference Library: . • SCHWARTZ, David G. Aristotelian view of knowledge management. In Schwarz, David G. (ed.). Encyclopedia of knowledge management [online]. Hershey : Idea Group Reference, 2006, s. 10-16. Dostupné v databázi Gale Virtual Reference Library: . • TRUNEČEK, Jan. Management znalostí. 1. vyd. Praha: Beck, 2004. 131 s. ISBN 807179-884-3. • VYMĚTAL, Jan; DIAČIKOVÁ, Anna; VÁCHOVÁ, Miriam. Informační a znalostní management v praxi. Praha : LexisNexis CZ, 2005. 399 s. ISBN 80-86920-01-1. • WILSON, T. D. (2002a). Information management. In Feather, J.; Sturges, P. (eds.). International encyclopedia of information and library science. London : Rotledge, s. 263278. • WILSON, T.D. (2002b). The nonsense of knowledge management. Information Research [online]. 2002, vol. 18, no. 1 [cit. 2010-08-30]. Dostupný z www: .
14
4 INTERPRETACE INFORMACÍ, ZNALOSTÍ A OBSAHU TEXTU Jakou roli hraje v životním cyklu informací a znalostí správná analýza a interpretace dané informace či poznatku? Jak je ovlivněn proces sdílení informací a znalostí právě subjektivním pohledem účastníků komunikačního procesu? V předchozí kapitole jsme si uvedli, že práce s informacemi a znalostmi je ovlivněna jejich porozuměním, jejich významem vyplývajícím z kontextu, který tyto informace a znalosti uvádí do souvislostí. Interpretace je spojena s kvalitní analýzou dokumentu, kdy se zaměřujeme na výklad a porozumění textu. Objektivní přístup k vyjadřování tematiky a obsahu dokumentu a informací je základem práce informačního specialisty. Interpretací textu rozumíme porozumění nebo pochopení textu, jeho smyslu. O interpretaci mluvíme jak při tvorbě textu, kdy se snažíme informace a poznatky transformovat do podoby souvislého textu, tak při přijetí textu, při čtení nebo při jeho analýze. Tak jako jsou příjemci textu různí, je i porozumění, tedy interpretace, různá. Porozumění textu ovlivňují naše znalosti, předchozí zkušenosti, náš záměr s textem – tedy zda hledáme nové informace, zda přistupujeme k textu kriticky, či např. z důvodu předání zaznamenaných informací dalším osobám (např. v podobě redukovaných textů vycházejících z obsahové analýzy dokumentu). Příkladem problematické interpretace textu mohou být texty právní, kdy může dojít k individuálnímu porozumění textu na základně vlastních zkušeností, znalostí jazykových nebo také odborných apod. Hlavní úlohu při interpretaci hrají slova a vztahy mezi slovy. Základním nositelem informace je jazyk. I v případě, kdy je informace sdělena např. formou obrázku, je často potřeba dané sdělení vyjádřit za pomoci jazyka. Ať už ve formě textu nebo jen jako myšlenku v podobě vnitřní řeči, která nám ve formulování myšlenek pomáhá. Jazyk hraje významnou úlohu při přenosu informací např. v podobě určitých sdělení. Text je prostředkem určitého sdělení, slouží přenosu informací. Dle PALKA [1989, s. 202] je textem jakýkoliv jazykový projev, ať psaný nebo mluvený. Dle ČERMÁKA [2001, s. 169] můžeme doplnit, že text je libovolný, resp. nespecifikovaný jazykový projev (psaný či mluvený, ukončený či neukončeny aj.), tj. akt parole (mluvy) jako celek nebo jako část; obvykle však bývá větší než věta.
15
Pokud jde o samotný proces interpretace, upozorňuje např. HŘEBÍČEK [2002, s. 84] na to, že se musíme vyrovnat s faktem, že sebepečlivěji připravený text není často různými příjemci chápán totožně. Zamýšlí se také nad problémem, kdy každý recipient textu aplikuje vlastní sémantický systém a aktivuje se tak síť významů, závislá na vzdělání, výchově, životních zkušenostech. ECO [2004, s. 64-66] zmiňuje dvě roviny interpretace, a to interpretaci sémantickou a interpretaci kritickou. Při sémantické interpretaci se dle Eca zaměřuje adresát na význam. Jedná se o čtenářsky orientovaný přístup. Eco také uvádí, že se jedná o první neboli „naivní rovinu“. Při kritické interpretaci jde o ocenění způsobu, jakým to text říká. Kritická interpretace si dle Eca klade za cíl popsat a vysvětlit, z jakých formálních důvodů určitý text produkuje danou reakci. Při analýze textu se snažíme hledat jeho hlubší význam. Může se jednat o jednoduchý rozbor nebo také o hluboké porozumění obsahu a vysvětlení. Tato analýza je spojena se subjektivním pohledem, kdy je tento proces spojen s tím, kdo analýzu provádí. Z toho důvodů dochází k mnoha různým pohledům a interpretacím. Při interpretaci textu se setkáme také s několika bariérami, které pochopení textu ovlivňují. Bariéry při interpretaci textu: ¾ neporozumění obsahu nebo tematice (neznalost odborné terminologie, nedostatečné předchozí znalosti, problém zaměnitelnosti určitých termínů bez adekvátního spojení s kontextem) ¾ bariéra související s redukcí textu, kdy se snažíme zachytit hlavní myšlenky a informace a ty pak následně komprimujeme ¾ překladová bariéra (ale nejen u přirozeného jazyka, tedy při překladu analýze a interpretaci cizojazyčného textu, ale také při překladu z přirozeného jazyka do selekčního) ¾ časová bariéra (nedostatek času pro kvalitní analýzu a interpretaci textu) Při obsahové analýze se zaměřujeme na obsah dokumentu, na jeho význam. Důležitou úlohu zde hraje zkušenost a naše znalosti. Stanovujeme tematiku dokumentu a vyjadřujeme obsah dokumentu buď formou přirozeného jazyka (např. při vytváření redukovaných textů, jako jsou anotace, abstrakty apod.) a nebo transformací přirozeného jazyka do prvků selekčního jazyka.
16
Dle Terminologické databáze knihovnictví a informační vědy [TDKIV] analýza obsahu dokumentu zahrnuje metody a pravidla pro stanovení tematiky dokumentu, příp. časového a prostorového hlediska, čtenářského určení a formy dokumentu. Slovní vyjádření obsahu dokumentu v přirozeném jazyce je transformováno do věcných selekčních údajů v procesu věcného pořádání nebo do vět v procesu sémantické redukce textu dokumentu. POKORNÝ [2006, s. 51] uvádí, že základním cílem obsahové analýzy je rozeznání pragmatiky textu (pragmatika, vlastně „věcný záměr“, je impuls, který text vnáší do lidské zkušenosti). V případě interpretace textu, ale i jakýchkoliv znaků, bychom měli znát jejich význam a smysl. Význam se snažíme osvojit si učením (ať už spontánním, bezprostředním či vědomým a cíleným). Snažíme se pracovat s významem obsahu textu, ale analyzujeme také sdělení, která nám přinášejí další objekty, jako obrazy apod. Zapojujeme také své vlastní představy. TONDL [2006b, s. 23] k tomu říká, že obrazy, sochy, texty jako složky odborné nebo kulturně orientované literatury, filmy, divadelní nebo jiná dramatická díla a dlouhé řady dalších oblastí lidských děl nám něco sdělují, o něčem nás informují… Nauka o významu znaků se nazývá sémantika. TONDL [2006a, s. 10] zmiňuje, že sémantika či semasiologie je považována za legitimní součást vědy o jazyce, která studuje jazyk a hlavně jeho elementy, slova, z hlediska toho, co obvykle označujeme významem slov.
[?] CVIČENÍ: Na základě vlastních zkušeností představte další možné bariéry interpretace textu. Podejte návrh, jak tyto bariéry postupně nebo zcela odstranit.
Použité zdroje • ANDERSON, J, D. ; PEREZ-CARBALLO, J. The nature of indexing : how humans and machines analyze messages and texts for retrieval. Part I: Research, and the nature of human indexing. Information Processing & Management. 2001, vol. 37, no. 2, s. 231-254. • ČERMÁK, František. Jazyk a jazykověda : přehled a slovníky. 3. dopl. vyd. Praha : Karolinum, 2001. 341 s. Učební texty Univerzity Karlovy v Praze. ISBN 80-246-01540.
17
• ECO, Umberto. Meze interpretace. 1. české vyd. Praha : Karolinum, 2004. 330 s. ISBN 80-246-0740-9. • FORD, Nigel. Creativity and convergence in information science research : the roles of objectivity and subjectivity, constraint, and control.. Journal of the American Society for Information Science and Technology [online]. 2004, vol. 55, issue 13, s.1169-1182. Dostupné ve Wiley Online Library (vzdálený přístup): . • FUGMANN, Robert. Subject analysis and indexing : theoretical foundation and practical advice. Frankfurt am Main : Indeks Verlag, 1993. xvi, 250 s. ISBN 3886725006. • HJøRLAND, B. The concept of „subject“ in information science. Journal of Documentation [online]. 1992, vol. 48, issue 2, s.172-200. Volně dostupné z WWW: . • HŘEBÍČEK, Luděk. Vyprávění o lingvistických experimentech s textem. 1. vyd. Praha: Academia, 2002. 196 s. ISBN 80-200-0973-6. • LANGRIDGE, Derek Wilton. Subject analysis : principles and procedures. London: Bowker-Saur, 1989. 96 s. ISBN 978-0408030311. • MORRIS, Jane. Individual differences in the interpretation of text : implications for information science. Journal of the American Society for Information Science and Technology [online]. 2010, vol. 61, issue 1, s. 141-149. Dostupné ve Wiley Online Library (vzdálený přístup): . • PALEK, Bohumil. Základy obecné jazykovědy. 1. vyd. Praha : SPN, 1989. 285 s. Učebnice pro vysoké školy. ISBN 80-04-22937-9. • POKORNÝ, Petr a kol. Hermeneutika jako teorie porozumění : od základních otázek k výkladu bible. 1. vyd. Praha : Vyšehrad, 2006. 508 s. ISBN 80-246-0740-9. • TONDL, Ladislav (2006a). Problémy sémantiky. Praha : Karolinum, 2006. 413 s. Prameny k dějinám českého myšlení, 4. ISBN 80-246-1075-2. • TONDL, Ladislav (2006b). Půl století poté : pohledy na problémy sémantiky a sémiotiky v posledních desetiletích. Vyd. 1. Praha : Karolinum, 2006. 109 s. Prameny k dějinám českého myšlení, 7. ISBN 80-246-1207-0. • WHITE, Layna. Interpretation and representation : the who, why, what, and how of subject access in museums. Art Documentation : Bulletin of the Art Libraries Society of North America [online]. 2002, vol. 21, issue1, s. 21-22. Dostupné v databázi LISTA (přes EBSCOhost): .
18
5 POŘÁDÁNÍ INFORMACÍ A ZNALOSTÍ Jak již bylo zmíněno, je dílčím procesem informačního a znalostního managementu pořádání informací a znalostí (angl. knowledge organization). Informace a znalosti je potřeba třídit a pořádat, aby bylo možné s nimi dále pracovat a usnadnit jejich vyhledávání. Po získání či vytvoření informace nebo znalosti je nutná jejich správná analýza a následné porozumění informaci, která má být dále tříděna, uložena, sdílena a distribuována. K procesům pořádání informací a znalostí patří popis dokumentů, ve kterých jsou informace zachycené; jejich obsahová analýza; indexace, tedy vyjádření obsahu dokumentu např. prvky selekčního jazyka; a klasifikace, neboli třídění. Pořádání informací a znalostí spolu s vyhledáváním a získáváním informací je jednou z jádrových disciplín informačních studií a knihovnictví. Pořádání je založeno na analýze a porozumění tematice nebo předmětu dokumentu, případně obsahu určitého sdělení. Při analýze zjišťujeme, co je předmětem dokumentu a jakým způsobem může být tento předmět reprezentován – např. v podobě termínů s vyjádřením vzájemných vztahů. Většina procesů pořádání informací a znalostí (nebo lépe „poznatků“, jak již bylo zmíněno výše), je v prostředí tradičních knihoven a dalších paměťových institucích založena na intelektuálním přístupu, na sémantické analýze obsahu textů. I tvorba a přidělování prvků selekčního jazyka je ovlivněna znalostmi dané problematiky a zkušenostmi indexátorů. V rámci pořádání informací a znalostí se zabýváme systémy organizace znalostí (angl. knowledge organization systems), jejich návrhem, analýzou a hodnocením. Návrh, analýza a hodnocení systémů organizace znalostí probíhá vždy ve vztahu k procesům uchování a vyhledávání informací. Pokud vyhledáváme informace a znalosti (poznatky), používáme
termíny, které
předpokládáme pro jejich získání, vyhledání. Mohou nám být nápomocny řízené slovníky (např. oborové tezaury apod.). Propojuje se tu tak termín, kterým byla konkrétní informace vyjádřena, s termínem, který využívá informační specialista při vyhledávání, ale také pořádání informací. Pořádání informací a znalostí směřuje zejména k tradiční praxi knihoven, ale již také zohledňuje potřebu organizace netextových zdrojů, organizaci objektů v prostředí webu, nejen tedy pouze v knihovnách a v tradičních paměťových institucích obecně. 19
Jako nutné se jeví propojení tradičních přístupů k pořádání informací a znalostí (systémů a procesů organizace znalostí) s trendy, které sledujeme jak z pohledu profesionálů, informačních specialistů, tak z hlediska uživatelů, jejich potřeb, požadavků a způsobů organizace a vyhledávání informací. Sledujeme uživatelské potřeby, trendy, které se objevují v dynamickém prostředí webu (např. nyní aktuální trend „sdílení“ informací a znalostí, sdílení digitálních objektů jako jsou fotografie, případně informace vyplývající z analýzy jejich obsahu apod.). Z toho plyne, že pořádání informací a znalostí v prostředí webu, který nabízí prostor pro jejich sdílení, je možné uplatnit i např. v personálním informačním managementu. Můžeme využít nástrojů pro pořádání a sdílení webových záložek (př. Delicious, social bookmarking, http://www.delicious.com/), archivaci a sdílení fotografií (Flickr, http://www.flickr.com/), případně sdílení informací o zajímavých knihách (viz např. projekt LibraryThing, http://www.librarything.com/) apod. Při pořádání informací a znalostí se zaměřujeme na procesy organizace znalostí (angl. knowledge organizing processes), jako je popis dokumentů, obsahová analýza, indexace, klasifikace a na systémy organizace znalostí (angl. knowledge organization systems), např.: ¾ bibliografické záznamy, ¾ klasifikační systémy jako např.: o Mezinárodní desetinné tříděny - http://udcc.org/udcsummary/php/index.php, http://aip.nkp.cz/mdt/, o Deweyho desetinné třídění - http://www.oclc.org/dewey/resources/summaries/, o Třídění Kongresové knihovny - http://www.loc.gov/catdir/cpso/lcco/ apod., ¾ tezaury jako např.: o Eurovoc - http://eurovoc.europa.eu/ o Art & Architecture Thesaurus http://www.getty.edu/research/tools/vocabularies/aat/ o Maternal and Child Health Thesaurus - http://www.mchthesaurus.info/ ¾ předmětová hesla jako např.: o Library of Congress Subject Headings - http://www.loc.gov/cds/lcsh.html, ¾ autoritní soubory jako např. o Národní autority ČR - http://autority.nkp.cz/
20
¾ rejstříky a slovníky jako např.: o WordNet - http://wordnet.princeton.edu/ o Synonym Finder - http://www.synonym-finder.com/, ¾ sémantické sítě apod. Tradiční systémy je možné doplnit systémy založenými na možnostech nástrojů Webu 2.0, např. systémy založené na tagování, tzv. folksonomie. Tyto systémy jsou založeny na možnosti pořádání netextových objektů v prostředí webu a na možnosti jejich sdílení (např. fotografií, digitalizovaných objektů muzeí a galerií apod.). Zde je vidět potřeba organizace (a následného zpřístupnění) jak informací obsažených v textu, případně v jiné formě sdělení, tak i pořádání informací o obsahu netextových objektů (např. fotografií, obrázků), nebo přímo konkrétních objektů (např. výše zmíněné digitalizované sbírky muzeí a galerií). Procesy organizace znalostí jsou ovlivňovány metodami a postupy dalších oborů. Nejtěsnější vazby jsou s obory jako lingvistika, sémantika, logika. Je tedy nezbytné se zaměřit na všechny tyto oblasti, které se prolínají všemi procesy od obsahové analýzy dokumentu, přes indexaci, kdy vyjadřujeme obsah dokumentu prvky selekčního jazyka, případně formou redukovaného textu, až po tvorbu jednotlivých prvků selekčního jazyka, začlenění těchto prvků v systémech organizace znalostí, vymezení vztahů mezi jednotlivými pojmy, tématy, členění veškerého univerza poznání do tříd apod.
[?] CVIČENÍ: 1) Zvolte si libovolný systém organizace znalostí (může se jednat o tezaurus, klasifikační systém jako např. MDT, autoritní soubor apod.), který je součástí vybraného katalogu, oborové databáze, informační brány apod. 2) Zaměřte se na vhodnost použití daného systému, logičnost třídění, řazení, vyjádření vztahů apod. 3) Zhodnoťte tento systém z hlediska jazykového (např. problematika jednoznačnosti a víceznačnosti pojmů, zaměření na jednoslovná a víceslovná pojmenování, problematika homonym, synonym apod.); z hlediska vyjádření hierarchických vztahů, vztahů mezi prvky, množinami apod.); z hlediska sémantiky (význam jednotlivých znaků, interpretace znaků).
21
4) Zaměřte se také na typického uživatele daného systému (jak na informačního specialistu, tak na koncového uživatele, který využívá systém při vyhledávání informací). Pokuste se zhodnotit systém také z jeho pohledu. Zvažte klady, nedostatky i další možnosti použití. 5) Výslednou analýzu zpracujte do formy prezentace a o výsledcích diskutujte při prezenční výuce.
Použité zdroje • ANDERSON, J. D. Organization of knowledge. In FEATHER, J. a STURGES, P. (ed.). International Encyclopedia of Information and Library Science. 2nd. London : Routledge, 2003, s. 471-490. ISBN 0-415-09860-2. • DAHLBERG, Ingetraut. Grunlagen universaler Wissensordnung : Probleme und Möglichkeiten eines universalen Klassifikationssystems des Wissens [Základy univerzálního pořádání znalostí ...]. Pullach bei München : Verlag Dokumentation, 1974. 18, 336 s. DGD - Schriftenreihe, Bd. 3. ISBN 3-7940-3623-9. • DAHLBERG, Ingetraut. Knowledge organization : a new science? Knowledge Organization. 2006, vol. 33, no 1, s. 11-19. ISSN 0943-7444. • HJØRLAND, Birger. What is knowledge organization (KO)? Knowledge Organization. 2008, vol. 35, no. 2/3, s. 86-101. ISSN 0943-7444 • KTD : Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online databáze]. Praha : Národní knihovna České republiky, 2003-. Dostupná z WWW:
Další doporučené zdroje • BALÍKOVÁ, Marie. Problematika věcného pořádání informací a jejich zpřístupnění. Národní knihovna : knihovnická revue. 2001, roč. 12, č. 3, s. 175-186. Dostupný také z WWW: nebo . • Encyclopedia of Library and Information Sciences. 3rd. edition. Boca Raton, FL : CRC Press, 2009. ISBN 978-0-8493-9712-7. Elektronická verze přístupná také přes EZProxy: nebo přímý přístup z IP adres UK: • HJØRLAND, Birger. Lifeboat for knowledge organization [online]. Last edited 200816-02 [cit. 2010-09-28] Dostupný z WWW: • ISKO : International society for knowledge organization. Copyright 2004-2010 [cit. 2010-09-27]. Dostupný z WWW: . 22
• Knowledge Organization. Würzburg : Ergon Verlag, 1993-. 4x ročně. Archiv abstraktů dostupný z WWW: ISSN 0943-7444. • LAMBE, Patrick. Organising knowledge: taxonomies, knowledge and organisational effectiveness. Oxford: Chandos, 2007. ISBN 978-1-84334-227-4 • The Indexer : the International Journal of Indexing. Sheffield : The Society of Indexers, 2006- [cit. 2010-09-27]. 4x ročně. Vychází v tištěné formě od roku 1958. ISSN 00194131. Archiv elektronicke verze dostupný z WWW: http://www.theindexer.org/>. ISSN 1756-0632.
23
6
FOLKSONOMIE - VYBRANÝ TREND V POŘÁDÁNÍ INFORMACÍ A ZNALOSTÍ
V procesu indexace jsou na základě obsahové analýzy přiřazovány dokumentům a informacím v nich obsaženým prvky selekčního jazyka (klíčová slova, předmětová hesla apod.). Tento proces je spojován především s činností expertů (informačních specialistů) v souvislosti s věcným pořádáním informací a znalostí v tradičních katalozích a databázích. Do procesu indexace se již díky nástrojům Webu 2.0 zapojují i koncoví uživatelé těchto služeb formou tzv. „taggování“ – přidáváním vlastních klíčových slov, tzv. „tagů. Původní myšlenka je založena na organizaci obsahu digitálních zdrojů (především webových záložek, kolekcí digitálních fotografií) samotnými uživateli webu a na jejich sdílení s dalšími uživateli. Vzhledem k tomu, že se jedná o uživatelsky atraktivní a zajímavý způsob organizace znalostí, využívají některé knihovny (ale např. i muzea) možnosti aplikovat systémy založené na taggování do svých katalogů a zapojit tak své uživatele do procesu indexace vlastních kolekcí. Do odborného jazyka nám tak v souvislosti s novými možnostmi a postupy indexace obsahu pronikají nové termíny. Jak dokazuje soupis literatury k tématu na konci této kapitoly, používají se některé z nich již jako součást terminologie obsahové analýzy a pořádání informací a znalostí. Frekventovanými termíny jsou např.: folksonomie (angl. folksonomy), tagování nebo také sociální tagování (angl. tagging, social tagging, user tagging), tag (nebo také klíčové slovo; termín se však do češtiny nepřekládá, užívá se angl. forma tag), systémy pro kolaborativní tagování (angl. collaborative tagging systems). Tyto a další termíny budou vysvětleny v následujícím textu. Dále budou na základě konkrétních příkladů představeny možnosti aplikace nástrojů Webu 2.0 do tradičních katalogů a databází a dalších online zdrojů. V závěru jsou pak nastíněna témata vhodná k dalším analýzám a průzkumům. Folksonomie, tagy, tagování S množstvím obsahu, který je přístupný v prostředí webu, souvisí otázka, jak tento obsah efektivně uspořádat, jak jej hledat a najít. Efektivita hledání se vždy spojena s dobře uspořádanou kolekcí. Jednou možností organizace je tradiční přístup, který je založen na
24
klasifikačních systémech, tezaurech a dalších řízených slovnících, jak bylo uvedeno v předchozí kapitole. Tyto systémy, které mají určitou formální strukturu, doplňují další přístupy, které zapojují do procesu organizace autory obsahu nebo uživatele konkrétních zdrojů. Jsou založeny na spolupráci (angl. collaboration) v rámci skupin (nebo také komunit). Komunitou může být skupina osob s podobnými zájmy, stejného profesního zaměření nebo také skupina posluchačů vybrané přednášky na vysoké škole. Uživatelé webu vytvářejí, publikují a sdílejí svůj vlastní obsah (např. text, fotografie, videa). Díky softwaru mohou tento obsah nejen ukládat na web, do repositářů a digitálních knihoven, ale sdílet i s dalšími uživateli webu. Aby tento obsah bylo možné vyhledat, přidávají mu svá vlastní klíčová slova, bez použití řízeného slovníku. Tato klíčová slova jsou nazývána „tagy“. Jsou to slova z vlastního slovníku uživatele, kdy je význam tagu dán porozuměním obsahu. Obsahem zde rozumíme nejen obsah mluveného nebo psaného textu, ale také obrázky, zvuky, sdělení, které nám přinášejí. Velmi zajímavým zdrojem pro indexaci jsou obrázky. Indexace obrázků je založena na subjektivitě, na individuálním vnímání objektu, na vlastní interpretaci. Lze souhlasit s myšlenkou, že „obrázek má hodnotu tisíce slov“ [volně podle BAR-ILAN, J. et al., 2006]. Nejlepší metoda, jak popsat obrázek a vyjádřit jeho sdělení, je založena právě na textovém popisu. Popis vychází nejen z toho, co je zobrazeno, z vizuálního obsahu jako je např. barva, tvary apod., ale také z významu obrázku, z interpretace sdělení a hlavní myšlenky. Co nás může při interpretaci obrázku zajímat, mohou být také aspekty emocionální, tedy to, co je slovy velmi těžko popsatelné. Příkladem může být fotografie vybraná z kolekce pro organizaci a sdílení obrázků „Flickr“ (obr. 3). Autor fotografie popisuje klíčovými slovy (tagy) nejen zobrazenou osobu, případně místo, situaci a čas fotografování, ale i takové charakteristiky jako „krása, krásné“ nebo vyjádření vlastních emocí při sledování obrázku: „ohromen krásou“.
25
Obr. 3: Tagy popisující fotografii (Flickr)
Proces, kdy samotní uživatelé webu indexují jeho obsah (např. již zmiňované fotografie), se nazývá tagování nebo sociální tagování (angl. tagging, social tagging)1. Sociální tagování je založeno na metadatech generovaných uživateli nebo autory obsahu bez použití řízeného slovníku. Znamená to, že nejsou použita indexační pravidla, neexistuje kontrola jednotlivých tagů a ani tvůrců tagů. Autoři objektů indexují podle svých vlastních potřeb, podle toho, jak sami vyhodnotí, že jsou klíčová slova relevantní. Dá se předpokládat, že podle klíčových slov, která uživatelé zdrojům přiřazují, budou také další zdroje vyhledávat. Na indexaci dokumentů bez použití řízeného slovníku jsou založeny tzv. folksonomie (angl. folksonomy). Folksonomie je pojem nový, uměle „vytvořený“ Thomasem Vander Walem v r. 2004. Jde o spojení slov „folks“ + „taxonomie“, což může být interpretováno jako: pojmové struktury vytvářené lidmi. 1
Můžeme se však setkat i s pojmy jako kolaborativní tagování, sociální klasifikace, sociální indexace.
26
Sám T. VANDER WAL [2005] definuje folksonomii jako „výsledek individuálního volného tagování informací a objektů (všeho, co obsahuje URL) pro potřeby vlastního vyhledávání. Tagování je založeno na sociálním prostředí (sdílení a přístupu pro ostatní).“ Folksonomii je také možné chápat jako „sociální klasifikaci – uživateli tvořená metadata“ [SPITERI, L.F., 2006] nebo také jako „uživateli vytvářenou (generovanou) taxonomii“ [SMITH, T., 2007 - DALY, E., BALLANTYNE, N., 2009 - NORUZI, A., 2007] či jako „systém, který jako deskriptory využívá tagy vytvořené uživateli kolaborativně“ [KAKALI, C., PAPATHEODOROU, Ch., 2010]. A. NORUZI [2007] uvádí, že jde o „uživateli generovanou taxonomii, která je používaná pro kategorizaci a vyhledávání obsahu (jako jsou webové zdroje, digitální fotografie) za pomocí tagů“. S.A. GOLDER a B.A. HUBERMAN [2005] uvádějí paralelu mezi pojmy folksonomie a kolaborativní tagování, kdy kolaborativní tagování „je proces, kdy uživatelé přidávají metadata ve formě klíčových slov, aby sdíleli obsah“. Folksonomie je založena na vlastní interpretaci objektu samotným uživatelem nebo autorem objektu. Není zde autorita, která by kontrolovala jednotlivé tagy nebo správné užití termínů. To může být jak silnou, tak i slabou stránkou celého systému. Autoři tagů nejsou omezováni žádnými pravidly, normami pro tvorbu tagů a užití slov, jedná se proto o jednoduchý způsob organizace informací. Na druhou stranu se jako problematická z pohledu indexátora jeví otázka užití synonym, struktury jednotlivých tagů apod. Tomuto tématu je věnována samostatná, závěrečná kapitola. Silné a slabé stránky folksonomie zmiňují ve svém článku I. PETERS A W.G. STOCK [2005]. Z nich lze za nejpodstatnější považovat např.: silné stránky ¾ je to jediná cesta, jak indexovat množství informací v prostředí webu ¾ jedná se o levnou metodu indexace ¾ jsou zdrojem pro vývoj ontologií, tezaurů a klasifikačních systémů ¾ umožňují vyhledávání a prohledávání ¾ umožňují identifikovat komunity ¾ zachycují autentické užití jazyka ¾ možnost zaznamenání neologismů (tzv. nových slov) v jazyce ¾ lidé jsou vnímavější k indexaci informací 27
slabé stránky: ¾ absence řízeného slovníku ¾ skryté vztahy mezi tagy ¾ užívání tagů, které nesouvisí s obsahem dokumentu Další silné a slabé stránky folksonomií, jak je vidí E. KROSKI [2005]: silné stránky: ¾ folksonomie jsou aktuální ¾ uživatelé tvoří tagy tak rychle, jak rychle tvoří obsah ¾ možnost rychle reagovat na změny v terminologii ¾ pomocí folksonomií mohou uživatelé objevit nové zdroje ¾ folksonomie jsou demokratické – každý může přispět do celku ¾ folksonomie pronikají do uživatelského chování (můžeme sledovat, jak uživatelé tagují své vlastní zdroje) ¾ Web 2.0 je založen na sdílení a propojení účastníků slabé stránky: ¾ folksonomie nemají kontrolu synonym ¾ nejsou přesné ¾ postrádají hierarchii – nejsou zobrazeny vztahy mezi tagy ¾ každý má jinou představu, jak tagovat (především použití širokých nebo úzkých pojmů)
[!] POZNÁMKA A UPOZORNĚNÍ: Cvičení k této lekci a použité a doporučené zdroje budou z důvodu tematické soudržnosti uvedeny až u následující kapitoly.
28
7
APLIKACE SYSTÉMŮ ZALOŽENÝCH NA TAGOVÁNÍ
Při vyhledávání informací bývá problémem formulace dotazu, tedy to, jak vyjádřit informační potřebu nebo myšlenku tak, aby byla v systému vyhledatelná. Jak převést pojem v uživatelově mysli na pojem, který je možné použít pro vyhledávání. Uživatelé mají potřebu pracovat s přirozeným jazykem, nebýt omezováni termíny řízeného slovníku. Z toho důvodu se jeví možnost použití tagů, tvořených samotnými uživateli, jako jednou z možností přístupu do katalogů, databází a dalších online zdrojů, jako jsou např. digitální kolekce fotografií muzeí a galerií. Příkladem může být aplikace tagovacího systému do katalogu Danbury Library (obr. 4), možnost volného tagování v katalogu disertačních prací Montana State University (obr. 5) nebo také projekt zaměřený na sociální tagování digitálních kolekcí muzeí a galerií s názvem „Steve“ (obr. 6). V tomto projektu jsou zapojeny instituce jako Cleveland Museum of Art, San Francisco Museum of Modern Art ad.
Obr. 4: Předmětový hesla a tagy v katalogizačním záznamu (Danbury Library Catalog)
29
Obr. 5: Předmětová hesla a tagy v bibliografickém záznamu (Montana State University – ETDs)
Obr. 6: Vyjádření obsahu netextového objektu (obrazu) formou tagů (Steve Project)
30
Sociální tagování se tak stává možností, jak indexovat a organizovat zdroje a informace na základě svých vlastních potřeb. V této souvislosti se však můžeme setkat s problémem, kdy různí uživatelé užívají různá slova pro popis stejných věcí. Každý uživatel může na zdroj pohlížet jinak, dochází k rozdílným interpretacím. Tagovat objekt je možno buď objektivně, tedy bez subjektivního pohledu, na základě toho, co plyne z obsahu, nebo subjektivně, kdy je užito hodnotícího hlediska (toto může souviset např. s aktivitami komunity, kdy je formou tagů jako např. „přečíst“, „můj oblíbený autor“ apod. doporučována literatura v rámci skupin. Různá interpretace není jediným problémem, který se může v souvislosti se sociálním tagováním online zdrojů vyskytnout. Pro „jazyk internetu“ je typické používání krátkých slov, slov často vycházejících z hovorového jazyka, s množstvím neologismů a vlivem jazyka mluveného. Příkladem toho je ukázka nejpopulárnějších, tedy nejčastěji používaných tagů a také tagů nejnověji užitých v kolekci fotografií Flickr (obr. 7).
Obr. 7: Tag cloud : nejpopulárnější tagy; nejnověji přidané tagy (Flickr)
31
Struktura tagů Typický tag je jednoslovné substantivum. Může to být však libovolné slovo (nebo fráze), které nemusí mít žádnou strukturu ani být omezeno pravidly pravopisu. Tagy jsou volně vybrané z jazyka uživatele, případně jazyka komunity. Volba tagu závisí na znalostech a osobních zkušenostech uživatele, jeho zájmech nebo preferencích. Na způsob tagování má vliv také komunita, ve které se uživatel pohybuje ať již fyzicky nebo virtuálně. S jazykem komunity pak při tagování uživatel pracuje. Může jím být jak jazyk užívaný pro běžnou komunikaci, tak jazyk odborný, zahrnující terminologii určitého oboru, nebo slova typická pro daný obor. Zajímavým příkladem může být opět ukázka tagů z projektu muzeí Steve, kdy jsou preferována slova a termíny související s uměním, muzeálními sbírkami apod. Např. barvy, použité materiály apod. (obr. 8).
Obr. 8: Vyjádření obsahu netextového objektu (3D objekt) formou tagů (Steve Project)
32
Autoři tagů často porušují základní pravidla gramatiky, ať už jde o syntax nebo psaní velkých a malých písmen. Zajímavou ukázkou možnosti různého zápisu tagů je následující příklad víceslovného pojmenování „music history“ a chronologického údaje „20th century“. Oba příklady jsou vybrány ze systému LibraryThing, který je zaměřen na volné tagování záznamů o knihách. Includes: music history, Music History, history of music, musikhistoria, Musikgeschichte, muziekgeschiedenis, musical history, Music history, History; music, Music - History, music--history, Historia de la música, music history, music-history, Music (history), History/Music, History of Music, History Music, Music - history, Music-History, Muziekgeschiedenis, music (history), historia de la música, history/music, history; music, history music history, history-music, History - Music, music_history, history: music, History: Music, HISTORY-MUSIC, Music History, Historia de la Música, musikgeschichte, Historia de la musica, history - music, 04a Music history, 04a music history, music history., history music, historia de la musica, History - Music History, History: music, MUSIC HISTORY, Musical history, Music history., muziek geschiedenis, Music_history, music History, History of music, History-Music, Music HIstory, Musical History, Musikhistoria
Obr. 8: Tag „music history“ – různé varianty zápisu (LibraryThing)
Obr. 9: Tag „20th century“ – různé varianty zápisu (LibraryThing)
Příklady ukazují, že problémem při tvorbě tagů není jen porušení gramatiky, ale také problém s používáním synonym, zápisu tagů v různých jazycích, současného užití singuláru a plurálu a homonym.
33
Problémy, které souvisí s tvorbou tagů, shrnují např. G. MACGREGOR a E. McCULLOCH, [2006]: ¾ malá přesnost tagů ¾ chybí kolokace ¾ vynechány základní syntaktické vztahy ¾ chytí určení vztahů mezi termíny ¾ chybí hierarchická struktura ¾ chybí sémantické vztahy (synonyma, homonyma) ¾ užití obou forem - singuláru i plurálu ¾ užití gramaticky chybných forem ¾ použití vlastního slovníku uživatele Při volném tagování nejsou dána vůbec žádná omezení, žádné limity. V referátu kol. autorů [BAR-ILAN, J. et al., 2006] je však nastíněna myšlenka strukturovaných tagů, které umožňují mnohem detailnější popis. Jedná se o předdefinovaná metadata jako např.: hlavní téma, popis události, lokace a čas události, typ objektu apod. Přestože mezi jednotlivými tagy nejsou vyjádřeny vztahy, jako je tomu v řízených slovnících, existuje jistá forma vizualizace vztahů, a to v podobě tzv. „shluků tagů“ (angl. tag clouds). Shluk tagů je seznam tagů v abecedním pořádku, kdy jsou tagy s největší frekvencí použití zobrazeny větším typem písma (obr. 10).
Obr. 10: Tag cloud – „nejpopulárnější tagy“ (WorldCat)
34
Shluky tagů jsou orientačním prvkem, umožňují prohledávání online zdrojů. V případě užití tagů v knihovních katalozích nebo kolekcích muzeí a galerií jsou shluky tagů zajímavým nástrojem pro analýzu jazyka uživatelů. Je možné sledovat slovní zásobu uživatelů dané instituce (viz předchozí poznámka k užití tagů v rámci projektu muzeí Steve – obr. 8). Řízený vs. Neřízený („živý“) slovník V procesu indexace je informační specialista, indexátor, limitován informačním jazykem a hranicemi řízeného slovníku. M. BUCKLAND [1999] uvádí, že tvorba slovníku je „stylizací přirozeného jazyka do formy rejstříku, tezauru“. Řízený slovník (angl. controlled vocabulary) je seznam slov a termínů, které se používají při indexaci a také při vyhledávání informací. Ukazuje vztahy mezi termíny a napomáhá uživatelům při efektivním vyhledávání. Řízený slovník je autoritním souborem, který má zajistit konzistenci indexace, tedy mj. jednotné používání termínů v rámci daného systému. Mezi termíny jsou určeny základní sémantické vztahy jako ekvivalence, asociace a hierarchické vztahy. Systémy založené na tagování nepracují s žádným řízeným slovníkem. Každý uživatel pracuje se svým vlastním slovníkem, ze kterého svobodně vybírá jednotlivá slova a termíny pro popis objektu nebo dokumentu. Pro užití slov nejsou předem dána žádná pravidla, ani nejsou při procesu tagování požadovány předchozí znalosti s tvorbou slovníku. Z pohledu indexace můžeme mluvit o neřízeném slovníku (angl. uncontrolled vocabulary). Vzhledem
k chybějícím
vtahům
mezi
jednotlivými
pojmy
můžeme
také
mluvit
o nestrukturovaném slovníku, nebo lépe o „slovníku s volnou strukturou“ (angl. free structure vocabulary) [SMITH, T., 2007]. K. WELLER [2007] jako protiklad k řízenému slovníku užívá pojem „živý“ slovník (angl. active vocabulary), jde o aktivní užití jazyka danou komunitou. Vzhledem k problémům se strukturou a užitím tagů se např. A. NORUZI [2007] zamýšlí nad tím, zda by neměly být součástí systémů založených na folksonomiích tezaury. Např. pro vyloučení singuláru a plurálu, případně pro práci se synonymy. Jak již bylo výše zmíněno, aplikovaly některé knihovny, ale i muzea a galerie do svých katalogů a databází funkce sociálního tagování. Folksonomie jsou přidány jako doplňující technologie k existujícímu klasifikačnímu systému. Rozšiřují tak tradiční věcné zpracování
35
o pohled uživatele. Tagy se užívají souběžně s tradičními prvky selekčního jazyka. Dochází k překrývání volně tvořených tagů a lexikálních jednotek vybraných ze řízeného slovníku. Viz obrazové ukázky z „Danbury Library Catalog“ (obr. 4), katalog „Electronic Theses and Dissertations – Montana State University“ (obr. 5), katalog Panteion Univesity (obr. 11) nebo také světový katalog WorldCat, jak již bylo uvedeno výše (obr. 10).
Obr. 11: Předmětová hesla a tagy součástí katalogu (Panteion University, Atheny)
Tagy pomáhají popisovat zdroje mnohem flexibilněji, dynamicky a otevřeněji směrem k uživatelům. Zároveň mohou být (především ve specializovaných knihovnách a databázích) tagy inspirací pro zařazení nových slov do řízeného slovníku dané instituce pro potřeby indexace. Vznikají lokální autoritní soubory založené na jazyce uživatelů, tzv. „user comunity vocabularies“. Tyto slovníky obsahují neologismy, nebo překlady pojmů do různých jazyků. Mohou být vhodným nástrojem pro sblížení uživatelského přístupu a přístupu expertů k indexaci obsahu.
36
J. FURNER [2007] hodnotí tagování uživateli takto: ¾ orientováno na uživatele, tagy jsou přidávány členy komunity, kteří mají zájem na vyhledávání v kolekcích ¾ uživatelé, kteří mohli dříve vyhledávat pouze pomocí slov přidanými experty, mohou nyní na základě svých znalostí sami přidávat tagy ¾ uživatelé mohou sami tagovat podle svých zájmů a cílů ¾ tagování je levné ¾ tagování je kolaborativní ¾ každý zdroj může být tagován všemi členy dané komunity ¾ tagování je dynamické, tagy se mohou rychle měnit a přidávat ¾ pro členy komunity může být také zajímavé, jak se vyvíjí obor a jeho terminologie podle toho, jaké nové tagy jsou přidávány Tagy se již běžně stávají jedním ze vstupních prvků do knihovních katalogů a digitálních kolekcí muzeí a galerií.
[!] POZNÁMKA K ZÁVĚREČNÝM ÚKOLŮM: Propojení tradičního přístupu k organizaci informací a znalostí s možnostmi, které nabízejí systémy založené na tagování, vedou k množství zajímavých pohledů na další práci v oblasti věcného pořádání informací a znalostí, případně celého procesu indexace. V následujících pěti cvičeních, nebo lépe – skupinových projektech, se studenti mohou zaměřit na vybrané problémy či aktuální témata.
[?] CVIČENÍ, SKUPINOVÉ PROJEKTY: ¾ Porovnejte uživatelské tagy s lexikálními jednotkami vybraných řízených slovníků. Zaměřte se např. na konzistenci indexace, strukturu tagů, frekvenci užití tagů apod. Jako inspirace vám mohou sloužit studie, které se touto problematikou zabývají. Analýzou frekvence užití tagů např. KIPP, M.E., CAMPBELL, D.G., 2006); porovnáním tagů s lexikálními jednotkami vybranými z řízených slovníků z hlediska konzistence indexace např. ROLLA, P.J., 2009 nebo také KAKALI, C., PAPATHEODOROU, Ch., 2010.
37
¾ Pokuste se analyzovat chování uživatelů při volbě tagů (reprezentativní vzorek vybraný např. ze skupiny spolužáků, kolegů v zaměstnání, členů zájmové skupiny apod. ¾ Stanovte si hypotézy, jaká je efektivita využití folksonomií v knihovních katalozích, zda by mohly tagy nahradit řízený slovník, případně zda a jak lze oba slovníky propojit. Pokuste se hypotézy potvrdit nebo vyvrátit na základě rozhovorů s osobnostmi oboru, vašimi kolegy apod. ¾ Analyzujte shodu užití volně přiřazených tagů a termínů vybraných z řízeného slovníku, podobnost tagů a předmětových hesel a především spolehlivost a detailnost věcného popisu pomocí tagů ve vámi zvoleném systému (např. katalogu apod.). ¾ Vytvořte přehled oborů nebo oblastí, které jsou z libovolného hlediska ve vztahu k systémům založeným na tagování, nebo které je možné využít pro analýzu těchto systémů a jejich prvků. Např. lingvistika při tvorbě lexikálních jednotek, využití statistických metod pro stanovení frekvence vybraných tagů, problematika motivace uživatelů k volbě daného tagu, vliv učení apod.
Použité zdroje ke kapitole 6 a 7 Pozn.: Vzhledem k aktuálnosti tématu a šíři problematiky, je seznam zdrojů obsáhlejší, než u předchozích kapitol. •
AGEE, Victoria. Controlling our own vocabulary : a primer for indexers working in the world of taxonomy. Key Words. 2008, vol. 16, no. 1, s. 30-31.
• BAR-ILAN, Judit et al. Structured vs. unstructured tagging – a case study [online]. Edinburgh, 2006 [cit. 2010-09-09]. Paper presented at WWW2006, Collaborative Web Tagging Workshop, Edinburgh. Dostupný z WWW: . • BUCKLAND, Michael. Vocabulary as a central concept in library and information science. In Digital libraries : interdisciplinary concepts, challenges, and opportunities : proceedings of the Third International Conference on Conceptions of Library and Information Science, Dubrovnik, Croatia, 23-26 May 1999 [online]. Zagreb : Lokve, 1999 [cit. 2010-09-09]. Dostupný z WWW: . • DALY, Ellen; BALLANTYNE, Neil. Ensuring the discoverability of digital images for social work education : an online "tagging" survey to test controlled vocabularies. Webology [online]. 2009, vol. 6, nr. 2 [cit. 2010-09-09], s. 1-16. Dostupný z WWW: .
38
• FURNER, Jonathan. User tagging of library resources : toward a framework for system evaluation. In World Library and Information Congress : 73rd IFLA General Conference and Council, 19-23 August 2007, Durban, South Africa [online]. IFLA, 2007 [cit. 2010-09-09]. Dostupný z WWW: . • GOLDER, Scott A.; HUBERMAN, Bernardo A. The structure of collaborative tagging systems [online]. [2005] [cit. 2010-09-09]. Dostupný z WWW: . • GUY, Marieke; TONKIN, Emma. Folksonomies : tidying up tags? D-Lib Magazine [online]. 2006, vol. 12, no. 1 [cit. 2010-09-09]. Dostupný z WWW: . • HEYMANN, Paul; GARCIA-MOLINA, Hector. Can tagging organize human knowledge? : technical report [online]. Stanford InfoLab, 2008 [cit. 2010-09-09]. Dostupný z WWW: . • HEYMANN, Paul; GARCIA-MOLINA, Hector. Contrasting controlled vocabulary and tagging : do experts choose the right names to label the wrong things? In Second ACM International Conference on Web Search and Data Mining (WSDM 2009), Late Breaking Results Session, February 9-13, 2009, Barcelona, Spain [online]. Stanford InfoLab, 2009 [cit. 2010-09-09]. Dostupný z WWW: . • KAKALI, Constantia; PAPATHEODOROU, Christos. Could social tags enrich the library subject index? In Libraries in the digital age 2010, Zadar (HR), May 24-28, 2010 [online]. University of Zadar, 2010 [cit. 2010-09-09]. Dostupný z WWW: . • KIPP, Margaret E. I.; CAMPBELL, D. Grant. Patterns and inconsistencies in collaborative tagging systems : an examination of tagging practices. In Annual General Meeting of the American Society for Information Science and Technology, Austin, Texas (US), 3-8 November 2006 [online]. 2006 [cit. 2010-09-09]. Dostupný z WWW: . • KROSKI, Ellyssa. The Hive Mind : folksonomies and user-based tagging [online]. 2005 [cit. 2010-09-09]. Dostupný z WWW: . • LAWSON, Karen G. Mining social tagging data for enhanced subject access for readers and researchers. The Journal of Academic Librarianship. 2009, vol. 35, no. 6, s. 574582. • LEISE, Fred. Controlled vocabularies : an introduction. The Indexer. 2008, vol. 26, no. 3, s. 121-126. • MACGREGOR, George; McCULLOCH, Emma. Collaborative tagging as a knowledge organization and resource discovery tool. Library Review. 2006. vol. 55, no. 5, s. 291300. Dostupný také z WWW: .
39
• MARSHALL, Julia. Controlled vocabularies : a primer. Key Words. 2005, vol. 13, no. 4, s. 120-124. • MARSHALL, Julia. Controlled vocabularies : implementation and evaluation. Key Words. 2006, vol. 14, no. 2, s. 53-59. • MATHES, Adam. Folksonomies - cooperative classification and communication through shared metadata [online]. 2004 [cit. 2010-09-09]. Report, Graduate School of Library and Information Science, Illinois Urbana-Champaign. Dostupný z WWW: . • McELFRESH, Laura Kane. Folksonomies and the future of subject cataloging. Technicalities. 2008, vol. 28, no. 2, s. 3-6. • MÉNARD, Elaine. Image retrieval : a comparative study on the influence of indexing vocabularies. Knowledge Organization. 2009, vol. 36, no. 4, s. 200-213. • NEAL, Diane. News photographers, librarians, tags, and controlled vocabularies : balancing the forces. Journal of Library Metadata [online]. 2008, vol. 8, no. 3 [cit. 2010-09-09], s. 199-219. Dostupný komerčně z databáze InformaWorld: . • NORUZI, Alizera. Folksonomies : (un)controlled vocabulary? Knowledge Organization. 2006, vol. 33, no. 4, s. 199–203. • NORUZI, Alizera. Folksonomies : why do we need controlled vocabulary? Webology [online]. 2007, vol. 4, no. 2 [cit. 2010-09-09]. Dostupný z WWW: . • PETERS, Isabella; STOCK, Wolfgang G. Folksonomies and information retrieval. In Proceedings of the 70th Annual Meeting of the American Society for Information Science and Technology [online]. 2007 [cit. 2010-09-09]. S. 1510–1542. Dostupný z WWW: . • PETERSON, Elaine. Parallel systems : the coexistence of subject cataloging and folksonomy. Library Philosophy and Practice [online]. 2008, vol. 10, no. 1 [cit. 201009-09], s. 1-5. Dostupný z WWW: . • QUINTARELLI, Emanuelle. Folksonomies : power to the people. In Proceedings of the 1st International Society for Knowledge Organization (Italy), UniMIB Meeting, June 24, Milan, Italy, ISKOI, Italy [online]. 2005 [cit. 2010-09-09]. Dostupný z WWW: . • ROLLA, Peter J. User tags versus subject headings. Library Resources & Technical Services. 2009, vol. 53, no. 3, s. 174-184. • SALABA, Athena. End-user understanding of indexing language information. Cataloging & Classification Quarterly. 2009, vol. 47, s. 23–51. 40
• SCHMIDT, Stefanie; STOCK, Wolfgang G. Collective indexing of emotions in images : a study in Emotional Information Retrieval (EmIR). Journal of the American Society for Information Science and Technology. 2009, vol. 60, no. 5, s. 863-876. • SINHA, R. A cognitive analysis of tagging (or how the lower cognitive cost of tagging makes it popular) [online]. September 27, 2005 [cit. 2010-09-09]. Dostupný z WWW: . • SMITH, Gene. Tagging : people-powered metadata for the social web. Berkeley, Calif. : New Riders, c2008. 208 s. ISBN 978-0-52917-6. • SMITH, Tiffany L. Cataloging and you : measuring the efficacy of a folksonomy for subject analysis. In Proceedings of the 18th Workshop of the American Society for Information Science and Technology Special Interest Group in Classification Research, Milwaukee, Wisconsin, 2007 [online]. 2007 [cit. 2010-09-09]. Dostupný z WWW: . • SOLEDAD PERA, Maria; LUND, William; NG, Yiu-Kai. A sophisticated library search strategy using folksonomies and similarity matching. Journal of the American Society for Information Science and Technology. 2009, vol. 60, no. 7, s. 1392-1406. • SPITERI, Louise F. The structure and form of folksonomy tags : the road to the public library catalog. Information Technology and Libraries. 2007, vol. 26, no. 3, s. 13-25. Dostupný také z WWW: . • SPITERI, Louise F. The use of folksonomies in public library catalogues. Serials Librarian [online]. 2006, vol. 51, no. 2 [cit. 2010-09-09], s. 75-89. Dostupný komerčně z databáze InformaWorld: . • STOCK, Wolfgang G. Folksonomies and science communication. Information Services & Use. 2007, vol. 27, s. 97-103. • TENNIS, Joseph T. Social tagging and the next steps for indexing. In Proceedings of the 17th SIG/CR Classification Research Workshop, November 4, 2006 [online]. 2006 [cit. 2010-09-09]. Dostupný z WWW: . • VANDER WAL, Thomas. Folksonomy definition and Wikipedia [online]. 2005 [cit. 2010-09-09]. Dostupný z WWW: . • VISSER, Marijke A. Tagging : an organization scheme for the Internet. Information Technology and Libraries. 2010, March, s. 34-39. • VOß, Jakob. Tagging, Folksonomy & Co - Renaissance of Manual Indexing? [online]. January 2007 [cit. 2010-09-09]. Dostupný z WWW: . • WARTENA, Christian; BRUSSEE, Rogier. Instanced-based mapping between thesauri and folksonomies. In The Semantic Web – ISWC 2008, 7th International Semantic Web Conference, ISWC 2008, Karlsruhe, Germany, October 26-30, 2008 : proceedings
41
[online]. 2010 [cit. 2010-09-09]. S. 356-370. Dostupný z databáze SpringerLink: . • WELLER, Katrin. Folksonomies and ontologies: two new players in indexing and knowledge representation. In Proceedings of Online information 2007, London [online]. 2007 [cit. 2010-09-09]. S. 108-115. Dostupný z WWW: . • WENZLER, John. LibraryThing and the library catalog [online]. San Francisco State University, 2007 [cit. 2010-09-09]. A Workshop on Next Generation Libraries, 2007. Dostupný z WWW: . • WINBERG, Bella Hass. The NISO Standard for Controlled Vocabularies : A Blueprint for Revision. Bulletin of American Society for Information Science and Technology [online]. 2009, vol. 36, no. 1 [cit. 2010-09-09], s. 42-47. Dostupný z WWW: .
42
ZDROJE PŘÍKLADŮ A OBRAZOVÝCH UKÁZEK • Art & Architecture Thesaurus: http://www.getty.edu/research/tools/vocabularies/aat/ • Danbury Library Catalog, Connecticut: http://cat.danburylibrary.org • Delicious, social bookmarking: http://www.delicious.com/ • Deweyho desetinné třídění: http://www.oclc.org/dewey/resources/summaries/, • Eurovoc: http://eurovoc.europa.eu/ • Flickr: http://flickr.com • Library of Congress Subject Headings: http://www.loc.gov/cds/lcsh.html, • LibraryThing: http://librarything.com • Maternal and Child Health Thesaurus: http://www.mchthesaurus.info/ • Mezinárodní desetinné tříděny: http://udcc.org/udcsummary/php/index.php, http://aip.nkp.cz/mdt/, • Montana State University (Electronic Theses and Dissertations): http://etd.lib.montana.edu/etd/view/index.php • Národní autority ČR: http://autority.nkp.cz/ • Panteion University, Atheny (OPACIAL): http://library.panteion.gr/opacial/ • Steve : the museum social tagging project: http://www.steve.museum, http://tagger.steve.museum • Synonym finder: http://www.synonym-finder.com/ • Třídění Kongresové knihovny: http://www.loc.gov/catdir/cpso/lcco/ • WordNet : a lexical database for English: http://wordnet.princeton.edu/ • WorldCat: http://www.worldcat.org/
43