Úvod Cílem mé práce je celkový popis koloběhu a sběru informací a následné organizace a prezentace informací. V úvodu je nastíněna základní problematika a definice Informační architektury včetně její historie. V další části mé práce jsem se snažil popsat jednotlivé role IA na webovém prostředí, její vazby mezi taxonomií, strukturou webu, propojením jednotlivých stránek, dále pojmenováním a uspořádáním textu na webových stránkách, navigací a metadaty. Dále jsou zde detailněji popsány dostupné navigační metody a systémy navigace na webu včetně systémů vyhledávacích (fulltext, atd.) Má práce by měla být přínosem pro vývojáře webovských aplikací, a měla by jim usnadnit celkovou práci se sběrem a organizací prezentovaných informací.
1
1. Obecný úvod do problematiky Informační architektury Jedná se o obor, k jehož hlavní roli patří třídění informací do kategorií a podkategorií, dále následné seřazení informací a také vhodné pojmenování informací. Informační Architektura se snaží usnadnit uživateli zpětné vyhledávání ověřených informací, vhodně zorganizovaných dle požadavků na danou informační strukturu. Mezi důležité vlastnosti informační architektury také patří správná navigace ke koncovým informacím a také následná reprezentace těchto informací. Historie informační architektury sahá ještě před začátek našeho letopočtu, kde se její prvotní formy využívaly především ve starověkých knihovnách. Již v této době se při psaní textu na hliněné desky nebo psaní knih objevují metody IA jako např. třídění informací známého z mezinárodního desetinného třídění a také vytváření řízených slovníků.
2. Něco z historie IA 2.1 Richard Saul Wurman – zakladatel pojmu Informační Architektura V roce 1976 Richard Saul Wurman, jako předseda konference určil pojem Informační Architektura a také pojem Informační Architekt. Wurman nejdříve působil jako architekt a grafický designér. Začátkem 60. let se však začal zabývat souvislostmi mezi oborem Architektura a shromažďováním, organizací a prezentací informací. Stejně tak jako Architekt navrhuje stavbu dle potřeb zadavatele, tak by měl postupovat tvůrce Informačního systému dle požadavků uživatelů, kteří budou s tímto systémem pracovat. Zde je souvislost mezi Architekturou a Informační Architekturou, v obou oborech je nutné nejdříve zjistit potřeby uživatelů a až po té začít s výstavbou IS nebo budovy. Ať se jedná o organizaci prostoru nebo informací, vždy by měl být zachován tento postup. Informační architekt totiž přetváří skupinu chaoticky uspořádaných dat ve smysluplný, jednoduše pochopitelný celek, v němž se běžný uživatel snadno zorientuje a nalezne potřebné informace. Wurman charakterizuje IA jako vědu ale zároveň také jako umění, jelikož by měla IA vedle správné organizace a prezentace informací také zachovat určité estetické zásady, pro mnohem snadnější orientaci v dané informační struktuře. Jako znázornění použil Wurman abstraktní mapy Tokijského metra (viz. obr. č. 1) ve které jsou znázorněný i jednotlivé Tokijské památky.
2
(http://www.gslis.utexas.edu/~l38613dw/readings/InfoArchitecture.html)
2.2 Peter Morville a Louis Rosenfeld Tato dvojice bývalých knihovníků, vydala v roce 1998 knihu s názvem Information architekture for the world wide web, která pojednává o IA v kontextu webových stránek a intranetu s orientací především na koncového uživatele. Oba autoři působí jako informační architekti a jsou v současné době nejvýraznějšími osobnostmi v oblasti IA, dále pak organizátoři mnoha konferencí, např. Information Architecture Summit, The Institut for IA, Argus Center for IA.
3
2.3 ASIS&T a Information Architecture Summit Oficiálně se však IA jako vědní disciplína uchytila až v roce 2000 na konferenci v Bostonu, kterou svolala organizace American Society for Information Science and Technology. Tato organizace funguje již od roku 1937 a dnes má více než 4000 členů. Jejím cílem je pomáhat a uskutečňovat kooperaci profesionálů z různých oblastí (knihovnictví, technika, právo, medicína, chemie a vzdělávání, počítačová věda), ve prospěch zlepšování přístupu k informacím. První konference v Evropě s hlavním tématem Designing and Organising Digital Information Spaces se konala roku 2004 v Paříži pod záštitou Information Today Ltd.
2.4 Argus Center for Information Architecture Argus Center for Information Architecture byla profesní organizace založená Morvillem a Rosenfeldem. Působila však bohužel jen 2 roky. V době krachu internetových firem, který zavládl v USA na počátku 21. století, se stejně jako stovky jiných firem, orientujících se na internetové služby, rozpadla. Webové stránky Argus Centra, třebaže neaktualizované, stále fungují a je tu zveřejněno mnoho hodnotných článků.
2.5 The Information Architecture Institut Další významnou organizací je dobrovolná, nezisková The Information Architecture Institute, která má více než 1400 členů v 80-ti zemích světa. Toto uskupení se zabývá výzkumem informačních zdrojů, výchovou specialistů v oblasti IA a pořádáním konferencí o problematice IA atp. V dnešní době se Informační Architektura využívá především v celosvětovém informačním médiu – Internetu. Novodobé rozsáhlé webové prezentace vyžadují organizování obsahu do jednotlivých kategorií, pojmenování těchto kategorií, návrh struktury a navigace na webu, v neposlední řadě pak efektivní zpracování informací pro snadné vyhledávání a správné rozložení těchto informací na webu.
4
3. Definice informační architektury Informační architektura je jako mnoho jiných nových informačních oborů hůře definovatelná, její definici má každý kdo se jí zabývá svou. Lze ji obecně rozdělit do tří základních skupin, podle toho, jak široce IA vymezují: 1) Je to vědní obor a zároveň umění, které se zabývá organizací informační struktury. 2) Obor, který se zabývá organizací informací v digitální formě v prostředí webových stránek a intranetů. 3) Použití určitých prvků a metod v prostředí webových stránek, popř. je IA zaměňována s obory podobného typu. 3.1 Je to vědní obor a zároveň umění, které se zabývá organizací informační struktury. IA je chápána jako všeobecná organizace informační struktury. Zde můžeme využít Wurmanovu definici, která říká, že IA je jedno z řešení informační tsunami. Wurman striktně neudává prvky a metody, kterými se IA bude řídit, pouze vymezuje možnosti, jakými jde IA vytvářet. Především klade důraz na vytváření přirozené struktury v datech, tzn. vytváření smysluplného dobře organizovaného celku. K tomu Wurman přirovnává vliv architektury – celá stavba musí být funkční, jinak by se zřítila. Stejný vliv má IA na vytváření webové prezentace. Měla by mít ucelenou myšlenku a tvůrce by měl schopen získat z dat podstatu, vytvořit v ní jasně danou, přehlednou strukturu a výsledek zpřístupnit koncovému uživateli v co nejjednodušší a esteticky přívětivé formě. Na konferenci American Instute Architects v roce 1976, které Wurman předsedal, definoval Informačního architekta takto:
„a) člověk, který v datech hledá základní vzory a vytváří jasné celky, b) ten, kdo vytváří strukturu nebo mapu informací, které umožňují ostatním, aby si našli svoji vlastní cestu ke znalostem,
5
c) IA pak jako nově vznikající zaměstnání 21. století, které řeší současné otázky jednoduchosti a srozumitelnosti a studuje vědu o organizování informací.“
3.2 Obor, který se zabývá organizací informací v digitální formě v prostředí webových stránek a intranetů. Tuto teorii prosazují Rosenfeld a Morville a odmítají Wurmanův koncept, v publikaci Information Architecs z roku 1996 ji označují jako informační design ne IA. Jako knihovníci pak zavádějí do IA znalosti získané ze studia informační vědy a knihovnictví a označují IA spíše jako řemeslo než umění.
Ve své publikaci Information architecture for the World Wide Web definují informační architekturu jako: „kombinaci
organizačního,
pojmenovávacího a
navigačního
schématu
v informačním systému, konstrukční řešení informačního prostoru vedoucí ke zjednodušení přístupu k obsahu, umění a vědu o vytváření struktur a třídění webových stránek a intranetů, jejichž cílem je pomoci lidem najít a řídit informace.“
Oba architekti se spíše než k akademickému pojetí IA přiklánějí k více ekonomickému a praktickému přístupu. Více se zaměřují na schopnost informačního architekta poskytnout uživateli co nejpřirozenější informace.
6
Důležitou součástí práce informačního architekta je studium uživatelského chování a časté provádění uživatelských testů. Role informačního architekta pak vymezují následujícím způsobem: „objasňuje úkol a vizi stránky, vyrovnává se s potřebami jejich uživatelů a sponzory stránek, určuje, jaký obsah a funkce bude stránka obsahovat, určuje, jak se bude uživatel dostávat k informacím s použitím organizačního, navigačního, pojmenovávacího a vyhledávacího systému, načrtává, jak stránka bude umožňovat budoucí změny a rozvoj.“
Obdobné stanovisko zastává i samotný The Information Architecture Institut, jehož hlavními stoupenci jsou Louis Rosenfeld a Peter Morville. „Avšak i autoři v The Information Architecture Institut současně vedle definice uvádějí, že nemůže být chápána absolutně, jelikož hranice jsou velmi rozmazané.
Podle institutu je definice informační architektury následující:“ „konstrukční řešení sdílení informačního prostředí, umění a věda o organizování a pojmenování webových stránek, intranetů, online společenství a softwaru pro podporu použitelnosti a nalezitelnosti, vyvíjející se komunita prakticky zaměřená na nastolení principů řešení digitálního prostoru.“ 3.3 IA je chápaná úzce jako použití určitých metod a prvků na webových stránkách nebo je zaměňována s jinými obory S tímto chápáním se můžeme často setkat v české praxi. Firmy a jednotlivci zabývající se navrhování internetových stránek považují IA často pouze za jednoduchý prostředek řízení obsahu na webu. Mnohdy je IA chápána čistě jako navigace mezi stránkami, tedy jen jako struktura menu. Bývá opomíjen její komplexní charakter nebo je zaměňována s jinými metodami, jako je copywriting, SEO aj. Je to však pochopitelné, jelikož metod, zabývající se obsahem a strukturou stránek je mnoho a jejich funkce spolu splývají, někdy jsou dokonce totožné. V praxi ale není důležité, jak určitý postup nazveme, ale jaký bude výsledek. 7
4. Role Informační Architektury na webu V mé práci jsem se hlavně zaměřil na role Informační architektury při tvorbě webových prezentacích. Tyto role můžeme rozdělit do několika bodů: 1) Návrh celkové hierarchie informací tzv. Taxonomie 2) Rozdělení informací do jednotlivých stránek tzv. Struktura webu 3) Vztahy a vazby stránek mezi sebou tzv. Prolinkování 4) Pojmenování jednotlivých stránek, sekcí i kapitol 5) Uspořádání informací v textovém obsahu jednotlivých stránek 6) Volba vhodných typů navigace a její začlenění 7) Fulltextové vyhledávání a prezentace výsledků 8) Návrh layoutu stránky 9) Vytváření metadat
8
4.1 Návrh celkové hierarchie informací tzv. taxonomie Taxonomie je technický termín, který označuje hlavní zásady organizace informací, je to prakticky klíčová role IA pro vývojáře webových prezentací. Pokud vývojář dokáže dobře pracovat s taxonomií, velmi tím zefektivní a zhodnotí jeho výslednou práci. Taxonomie obsahuje dva klíčové aspekty, tzv. taxonomická struktura a taxonomický přehled. Taxonomická struktura poskytuje klasifikační schéma, pro rozdělení obsahu informací do obsahu a řízení celého procesu. Taxonomický přehled je pouze koncepční model, který navrhuje použití jednotlivých typů informací, myšlenek a požadavků, které má daná prezentace obsahovat. Představuje logické uskupení obsahu, které bude viditelné pro návštěvníka webu a zároveň bude sloužit jako podklad pro tvůrce webové prezentace. Správná hierarchie je jedním z hlavních vodítek pro návratnost investice na danou webovou prezentaci. 4.2 Rozdělení informací do jednotlivých stránek tzv. struktura webu Struktura webové prezentace je velmi důležitou součástí IA, jelikož dobrá struktura webové prezentace poskytuje uživateli snadnější orientaci na webu. Rozsáhlejší weby je dobré strukturovat do větších celků, než jsou jednotlivé stránky. Příslušný web se skládá z několika hlavních sekci, které se pak dále člení na podsekce (oblasti) v několika úrovních. Tyto sekce se dále dělí na jednotlivé stránky. Kompozice webové prezentace obsahuje jednotlivé elementy jako např. Data unit, Index unit atd. ze kterých se mohou skládat i jednotlivé stránky. Stejně jako tyto elementy mohou vytvářet stránku, může být více stránek organizováno do takzvaných oblastí (Areas).
Oblasti (areas) Oblast představuje skupinu logicky souvisejících stránek nebo oblastí včetně vazeb, které jsou mezi stránkami (respektive mezi jednotlivými units) definovány. Jako jednotlivé oblasti si můžeme představit například hlavní sekce webové prezentace . V každé hlavní sekci se pojednává o příslušné problematice na několika souvisejících stránkách. Samozřejmě i příslušná oblast (sekce) může být dále rekurzivně složena z dalších oblastí. Závisí to na tom, z kolika úrovní se skládá systém navigace, který vývojář příslušného webu zvolil. Obvyklá hloubka zanoření bývá dvě až tři úrovně. Více úrovní již může způsobovat nepřehlednost. 9
Hierarchická struktura webové prezentace
(http://interval.cz/clanky/webml-struktura-webove-aplikace/)
4.3 Pojmenování jednotlivých stránek, sekcí i kapitol Systémy pojmenování bývají v češtině někdy označovány též jako označovací systémy. V anglických textech pak labeling systems, přičemž label znamená popisek, štítek, visačka, nálepka, sloveso pak pojmenovat nebo označit. Záleží tedy na vůli překladatele, v českých textech se setkáme s oběma termíny. Systémy pojmenování jednak zpřístupňují, ale hlavně reprezentují, obsah uživateli. Jak už bylo uvedeno, pojmenovací systémy velmi úzce souvisí s organizačními systémy, někdy dokonce není možné určit přesnou hranici, kde končí jeden a začíná druhý. Oba systémy vhodně zvolené podporují dobrou orientaci uživatele a přitom ho navigují tam, kde ho tvůrce stránek chce mít. Organizační systém určuje, jakým způsobem se bude obsah kategorizovat, systém pojmenování stanovuje konkrétní termíny, které budou pojmenovávat různé kategorie a podkategorie. Pokud například použijeme nejednoznačné třídění podle úkolu, projevem systému pojmenování bude volba označení jednotlivých položek. Například v souvislosti s nakupováním můžeme zvolit buď e-shop, online nákup nebo třeba kup online.
10
Popisky jsou jedny z důležitých faktorů při provádění SEO (search engine optimalization), jelikož mají značný vliv na hodnocení stránek vyhledávacími nástroji. Dobře zvolený popisek tedy dobře informuje uživatele ale současně i robota vyhledávacího nástroje. Při vytváření popisků a pojmenování je třeba opět velmi zohlednit uživatelské hledisko. Jedná se totiž o nejužší, nejviditelnější a nejvíce citlivý způsob komunikace s uživatelem. Popisky by měly být obecně jasné, i bez použití vysvětlivek by měl uživatel pochopit, co se pod nimi skrývá. Měly by zabírat co nejméně místa. Pokud jisté popisky zvýrazníme, mělo by být zřejmé proč. Mohou, ale nemusejí, být hypertextovým odkazem.
Rosenfeld a Morville rozdělují typy popisků následujícím způsobem: Kontextové odkazy - vyjadřují smysl okolního textu nebo části dokumentu, ke které směřují. Při vymýšlení kontextového odkazu by si měl informační architekt odpovědět na otázku: „Kam si budou uživatelé myslet, že odkaz vede?“ Tyto odkazy bývají často vytvářeny z okamžitého podnětu a to je jejich velkou slabinou, mohou být totiž značně podceňovány. Druhým důvodem je to, že autor stránky bývá natolik vtažen do tématu, že se na něj nedokáže podívat nezaujatě.
Nadpisy - uvozují text, který následuje bezprostředně po nich. Velmi dobře je známe z knih a časopisů. Narozdíl od kontextových odkazů nadpis nemusí přesně reprezentovat text z okolí, ale pouze na něj poukazují.
Volby navigačního systému - představují položky navigačního menu. Položky stejného obsahu by měly být na všech stránkách pojmenovány stejně.
Položky rejstříku - nemusejí být viditelné přímo ze samotné stránky, ale mohou být součástí meta údajů ve zdrojovém kódu stránky (title, name, content). Tyto údaje se pak zobrazí při vyhledávání stránky v rozhraní vyhledávače. Dalším případem těchto položek jsou rejstříky a slovníky, kterým se budu věnovat níže.
11
Různé druhy popisků lze vyjádřit buď slovně nebo obrazově. S obrazovým vyjádřením by se však mělo nakládat velmi opatrně. Je vhodné používat jen ustálená obrazová vyjádření nebo taková, která jsou naprosto jasně pochopitelná a nemohou mít více významů.
Vytvoření správného popisku pokládají Rosenfeld a Morville za jeden z nejtěžších úkolů informačního architekta. Náš jazyk je natolik bohatý a složitý a myšlení lidí natolik odlišné, že nalezení jednoho pravidla pro dokonalé řešení považují za zhola nemožné. Proto navrhují pouze velmi obecné doporučení: obsah by měl být co nejjednodušeji rozčleněn do užších podsekcí, kterým přidělíme co nejprostší popisky; musíme brát ohled na celý systém, nejen na jednotlivé označení.
4.3.1 Postup pak může být následující: Během obsahové analýzy prochází architekt dostupnými materiály, které budou součástí webových stránek a jednotlivé části označuje klíčovými slovy. Může si vypomoci nadpisy, popiskami obrázků nebo abstrakty. V případě velmi rozsáhlého obsahu může využít k tomuto účelu určené programy, které dokáží částečně tuto extrakci zautomatizovat (více viz kapitola o pomůckách). K této práci si může přizvat na pomoc buď přímo člověka z organizace, pro kterou stránky vytváří, nebo některého z potencionálních uživatelů. Zohlednění názorů více osob může být jenom ku prospěchu věci. Další pomůckou, ze které může vycházet, jsou již používané řízené slovníky a metadata. Inspirovat se může i pohledem na jiné webové stránky. Jednou z oblíbených metod používaných při stanovování popisků a jejich následného seřazování do systému je card sorting (více o card sortingu a ostatních metodách viz kapitola o metodách). Po vytvoření seznamu slov je vhodné všechna slova seřadit abecedně pro vyřazení duplikátů a následně podle různých hledisek, což umožní najít případné mezery mezi tématy nebo naopak nadbytečnosti.
12
4.4 Uspořádání informací v textovém obsahu jednotlivých stránek
Kontext Jedinečnost každé organizace se odráží i při tvorbě kvalitních webových stránek. Je sice možné používat univerzální vzory, ale rozhodně se vyplatí seznámit se s vizí organizace, její strategií, obchodními cíly, budoucími ambicemi a celkovou kulturou podniku. Činnosti podporující poznání kontextu jsou následující: „definice obchodních cílů, řízení projektů, odhad rozsahu projektu a jeho definice, obchodní analýza, systémová analýza, odhad a plnění očekávání klienta, identifikace a překonávání technických omezení.“ Obsah Do obsahu můžeme zahrnout vše, co se na stránkách nachází, ať už se jedná o jednotlivé dokumenty, aplikace, služby, typ metadat, formáty dat. Při vytváření obsahu projdeme některým z následujících kroků: „indexace a katalogizace dat, práce s XML a metadaty, tvorba tezauru, architektura a uspořádání webu, copywriting, správa obsahu, návrh navigace a názvosloví pro označování prvků navigace, objektů, tlačítek apod.“
13
Uživatelé Ne všichni uživatelé dokáží stejně používat internet, každý od stránek očekává něco jiného. Přesto je třeba vytvořit jednu jedinou verzi, která bude respektovat požadavky všech. Druhou možností je přesnou analýzou prostředí poznat své publikum a orientovat se jen na určité typy. Vhodnější je však předpokládat, že stránky budou navštěvovat různí lidé a u uživatele očekávat minimum znalostí a schopností. Činnosti související s poznáním uživatelů jsou následující: „kontextuální analýza uživatelů (pozorování a dotazování uživatelů), práce s fiktivními postavami, etnografie, identifikace a analýza klíčových úkolů, které uživatelé v rámci aplikace plní, uživatelské testování, heuristická analýza použitelnosti, formulace uživatelských potřeb, dokumentace výstupů zkoumání.“
4.4.1 Wurmanův přístup k organizaci informací Wurman navrhuje obdobné metody organizování informací jako Rosenfeld a Morville, používá však jen pět způsobů kategorizace obsahu a to podle akronymu LATCH:
L) location – organizace podle umístění, A) alphabet – abecední členění, T) time – chronologické členění, C) category – organizace podle kategorií, H) hierarchy – hierarchická organizace.
14
Rozhodnutí o způsobu organizování je spjato s otázkou - jak by měly být informace nalezeny? Wurmanův přístup je oproti Rosenfeldovu a Morvilleho poněkud zjednodušený, ale přesto může poskytnout kvalitní možnost organizace informací na webových stránkách. S následujícími složkami IA, které považují Rosenfeld a Morville za stejně důležité jako organizaci, již Wurman nepracuje.
4.5 Fulltextové vyhledávání a prezentace výsledků Pokud selže organizační nebo navigační systém stránek, může ještě celou situaci zachránit funkční vyhledávací systém. Ten prohledává webové stránky pomocí rozhraní implementovaného přímo do nich. Je vhodné ho použít, pokud je na stránkách velké množství obsahu nebo jeho organizace není zcela jasná. Jak bylo uvedeno výše, existují uživatelé, které celou navigační strukturu ignorují a po vstupu na stránky ihned pátrají po vyhledávacím okénku, protože přesně vědí, co na stránkách hledají a orientace v navigaci by je jen zdržovala. Protože každý uživatel je jiný, je třeba se při výběru vyhledávacích nástrojů zamyslet, jaké typy uživatelů budou stránky navštěvovat a podle toho pak rozhodnout, nakolik sofistikovaný vyhledávací systém implementovat.
Lze si vybrat, zda na stránkách použít komerční vyhledávací nástroje nebo využít služeb univerzálních vyhledávačů typu google či českého jyxa. Pro menší weby plně dostačuje vyhledávání veřejných vyhledávačů, je zdarma a je snadno použitelné a účinné. Náročnějším webovým sídlům však nemusejí vyhovovat a bude nutné aplikovat některý z komerčních vyhledávacích nástrojů. Z komerčních služeb lze poukázat například na hojně používaný Atomz, který navíc poskytuje ořezanou verzi zdarma. Pokud je obsah přímo uložen v databázích MySql, lze využít jednoduchých příkazů SQL jazyka nebo přímo fulltextového vyhledávání, které je součástí MySql. Při sestavování profesionálního rozsáhlého webu s velkým množstvím obsahu, je vhodné poohlédnout se po profesionálních nástrojích nebo si vytvořit vlastní vyhledávač.
Programování vlastního vyhledávacího nástroje je velmi náročnou záležitostí a neobejdeme se tu bez znalostní programovacích jazyků. Sestavování vyhledávacích nástrojů 15
tedy pravděpodobně nebude úkolem informačních architektů, nicméně by se měl na jeho návrhu a nastavování aktivně podílet. Problematika vyhledávacích nástrojů je velmi rozsáhlá a jelikož nepředpokládám, že by informační architekti přímo programovali vyhledávací programy, zaměřím se tedy pouze na činnosti, které přímo souvisejí s prací informačních architektů.
Fulltextovým vyhledáváním na WWW stránkách rozumíme funkci umožňující najít hledaná slova (fráze) v celém obsahu internetové prezentace, databáze nebo sady dokumentů. Je to nepostradatelná součást každé internetové prezentace s rozsáhlejším obsahem. Správná implementace fulltextového vyhledávání může výrazně zlepšit orientaci uživatelů na stránkách a rychle zpřístupnit velké množství informací bez složité navigace.
4.5.1 Různé způsoby hledání Existují různé způsoby, jak se návštěvníci vašich stránek mohou dostat k hledané informaci. Obecně lze rozlišit dva krajní modely chování. První typ uživatele používá k nalezení požadovaného obsahu menu a odkazy ve stránkách. Kdežto druhý typ uživatele neztrácí čas a první po čem na neznámém webu pátrá je známé pole pro hledání. Počet uživatelů z druhé skupiny stoupá na serverech s větším množstvím obsahu, archivem článků, novinek, dokumentů a podobně. V takovém případě často stačí několik bezúspěšných kliknutí, návštěvník ztratí trpělivost a z vašich stránek odejde nespokojený. Tomu lze jednoduše zamezit tak, že nabídnete možnost celý váš web prohledat. Pro uživatele to je podobné jako při prohledávání celého internetu pomocí vyhledávače Google nebo Morfeo, až na to, že seznam výsledků bude omezený pouze na vaše stránky a bude mít jednotný vzhled zapadající do celkové grafické podoby vašeho webu. Kromě toho můžete výpis výsledků přizpůsobit vašim individuálním potřebám či zvláštním způsobem prohledávat specifická data, například ceníky.
4.5.2 Jak funguje fulltextové vyhledávání Vše se točí okolo takzvaného fulltextového indexu, který je tvořen databází obsahující informaci o umístění konkrétních slov v jednotlivých stránkách nebo dokumentech. Když 16
uživatel zadá do vyhledávacího pole například slovní spojení "studium na vysoké škole", vyhledávač si najde ve svém indexu stránky, které tato slova obsahují, seřadí je podle relevance a zobrazí seznam výsledků. Je užitečné, pokud výpis výsledků obsahuje nadpisy nalezených stránek a také úryvky z textu, který hledaná slova obsahoval.
4.6 Návrh layoutu stránky
Pojmem layout označují webdesignéři rozmístění základních prvků na stránce. Layout je tedy jakési schéma, jež říká, kde bude umístěn logotyp, hlavní navigace, drobečková navigace, formulář pro fulltextové vyhledávání a další obvyklé součásti stránky.
Dobrý layout je základem použitelnosti každé webové prezentace. Přitom navrhnout layout není nic jednoduchého, zejména u větších webů. Z jedné strany vás omezují pravidla informační architektury, z druhé strany volání grafika po kreativitě vzhledu webu, třetí stranou omezující vytvářený layout je již zmíněná použitelnost – s některými prvky by se na stránce nemělo příliš hýbat, uživatelé jsou zvyklí na jejich přibližné umístění (např. logo v levém horním rohu) a layout, který tato očekávání naruší, nebude zřejmě patřit k úspěšným.
K pojmu layout také patří další dva často používané termíny – tabulkový layout a proti němu stojící beztabulkový layout. Oba se týkají kódu stránek, přesněji způsobu, jakým je layout v rámci kódu stránky realizován. Starší varianta, tabulkový layout, využívá k rozmístění prvků na stránce neviditelné tabulky, často i velké množství tabulek zanořených do sebe. Přestože je tento způsob velmi zastaralý, stále je možné na různých prezentacích na tabulkový layout narazit.
Technologicky modernější varianta, beztabulkový layout, využívá k rozmístění prvků na stránce kaskádové styly. Mezi výhody tohoto řešení, které považujeme za základ současné webové prezentace, patří rychlejší načítání stránky v prohlížeči, celkově menší objem kódu a
17
jeho správnější struktura (viz sémantika). Beztabulkový layout se používá i při optimalizaci pro vyhledávače (SEO), kladem bude také jednodušší a tudíž levnější správa celého webu.
4.7 Metadata Jedním ze způsobů, jak zajistit určitou přesnost a stálost dokumentů na stále se měnícím internetu, je důsledné používání vhodně zvolených metadat. Metadata byla v minulosti doménou převážně knihovníků, ale po boomu digitálních informací se osvědčilo jejich využití i na internetu. Při vytváření webových stránek se s metadaty setkáme nejčastěji ve formě HTML meta tagů, které nezanedbatelných způsobem ovlivňují práci vyhledávacích nástrojů. S jejich pomocí lze identifikovat například autora, popis, klíčová slova a jazyk dokumentu. Nicméně v sofistikovaných a rozsáhlých databázích, které předpokládají propojování více systémů a platforem, je důsledné používání přesných metadat nutností. Příklady těchto služeb jsou pochopitelně knihovnické katalogy a profesionální znalostní databáze, dále pak aplikace umožňující vykonávání e-government a e-bussines. Používání metadat je zatím spíše záležitostí jednotlivých sídel, neexistuje žádný závazný standard, který by stanovoval popis jednotlivých elektronických zdrojů. S rozvíjejícími se službami Webu 2.0 nabývají metadata stále většího významu. Při propojování více sídel nebo při sdílení a výměně souborů (obrázků, hudebních skladeb nebo videí) bychom se bez použití metadat neobešli, a to nejen proto, že u nich není možné použít fulltextového vyhledávání.
18
V publikaci Organizing information from the shelf to the web je uvedeno 8 důvodů pro používání metadat:
„usnadnění identifikace zdrojů, ověření identity zdroje, zajištění stálosti obsahu ve zdroji, péče o strukturu a kontext zdrojů, správa informací o přístupových podmínkách, usnadnění dohledávání a uchování historie zdrojů, pomoc při objevování, hledání a dodání zdrojů, usnadnění interoperability v sítích.“
Dále pak 5 základních funkcí metadat:
„popis zdroje: metadata usnadňují přesný popis a katalogizaci i v el. zdrojích, vyhledávání informací: metadata usnadňují vyhledávání a některé předmětové katalogy používají metadata jako zdroj pro vyhledávání, řízení informačních zdrojů: metadata jsou hlavní stavební blok informační architektury a content management systémů, vyhledávání je snadné a intuitivní, určení vlastnických práv dokumentu a důvěryhodnost el. zdroje, zajištění interoperability a přenosu dat mezi systémy.”
Typy metadat lze rozdělit na klasické standardizované metadatové formáty, z nichž zmíním pouze Dublin Core a víceméně živelně používaná uživatelská medatada, která vytvářejí sami uživatelé webových stránek podle svého vlastního uvážení. Dublin Core je jako jeden z mála metadatových standardů velmi snadno použitelný, a proto se může stát součástí jakékoliv webové stránky. Narozdíl od uživatelských metadat je sice náročněji zpracovatelný, ale jeho používání je jednotné a zajišťuje mnohem větší přesnost. Další jeho výhodou je slučitelnost s jinými formáty metadat a možnost využití XML.
19
„Dublin Core je soubor metadatových prvků, jehož záměrem je usnadnit vyhledávání elektronických zdrojů. Původně byl vytvořen jako popis zdrojů na WWW sestavený přímo autorem, postupně ale zaujal instituce zabývající se formálním zpracováním zdrojů, jako jsou muzea, knihovny, vládní agentury a komerční organizace.“
Prvky Dublin Core jsou rozděleny do tří kategorií, přičemž žádný není povinný a každý je opakovatelný:
obsah
vlastnictví
instanciace
Title
Creator
Identifier
Subject
Contributor
Date
Description
Publisher
Language
Coverage
Rights
Format
Type Source Relation Audience (Provenance, Rights Holder)
Nově vznikající typy metadat jsou uživatelská metadata, která se objevují v souvislosti s Webem 2.0. Narozdíl od klasických metadat jsou uživatelská metadata přiřazována k objektům samotnými uživateli. Jejich použití je velmi podobné jako u folksonomií, proto i jejich výhody a nevýhody jsou téměř totožné.
20
5) Navigace v Informační architektuře
Pro návrh ideální navigace neexistuje žádný recept. Vždy je nutné uvažovat v zájmu uživatele a z pohledu toho, co může web nabídnout. 5.1 Rozdělení navigace Základní navigace - Základní navigace většinou odpovídá základní struktuře webu a často je zobrazena jako kombinace hlavního a lokálního menu.
Hlavní navigace - Snad každý vícestránkový web obsahuje hlavní navigaci. Obvykle se jí říká menu. Vyskytuje se na každé stránce a obvykle obsahuje odkazy na hlavní sekce webu, nebo na podsekce. Hlavní menu bývá realizováno jako horní – vodorovná navigace, nebo postranní menu (svislá navigace) – častěji se objevuje na levé straně, ale zejména u obsahových stránek a blogů je stále častěji můžeme najít v pravém sloupci.
Rozbalovací menu - Čím dál méně populární je dynamicky rozbalovací menu, která se rozbaluje při najetí myši na položky. Nejčastěji se objevuje ve vodorovné formě, která je obvyklá i v počítačových programech. Méně často je k vidění ve svislé podobě. Rozbalovací menu často obsahuje celou základní strukturu. Z pohledu tvůrce webu je nutné říci, že k zajištění funkčnosti rozbalovacího menu se používají technologie, které v některých prohlížečích nefungují (kapesní počítače, čtečky handicapovaných občanů, textové prohlížeče), proto je nutné k dynamické navigaci vytvořit alternativu, která umožní používání webu i těmto uživatelům.
Lokální (místní) navigace - Na podstránkách webu se často objevuje tzv. lokální navigace, která obsahuje odkazy na vnitřní stránky sekce či podsekce, ve které se uživatel právě nachází. Lokální navigace se nejčastěji vyskytuje na levé nebo pravé straně jako součást svislého hlavního menu (rozbalená část menu), nebo doplněk horního menu. Méně často se vyskytujeméně často ve vodorovné podobě pod horním menu.
21
Drobečková navigace (breadcrumb) - Obvykle se vyskytuje nad hlavním nadpisem stránky. Má za úkol vyznačovat polohu aktuální stránky v hlavní navigační struktuře a zároveň umožnit rychlý přesun na stránky umístěné výše ve struktuře.
Navigační stránky (rozcestníky) - O rozcestnících už byla řeč v souvislosti se strukturou. Jedná se o stránky, které samy nemají žádný vlastní obsah a představují tedy pouze cestu k detailu (obsahu na stránkách). Typickou navigační stránkou je úvodní stránka zpravodajského serveru, úvodní stránky jeho rubrik či přehled článků podle autorů. Navigačními stránkami jsou i výpisy zboží v elektronických obchodech či výsledky vyhledávání vyhledavače. V povídání o struktuře byly nazvány jako rozcestníky.
Kontextová navigace - Pouze se základní navigací si vystačíte pouze u malých webů a i tam bude uživateli mnohdy chybět nějaký ten kontextový odkaz – odkaz, který v souvislosti s obsahem konkrétní stránky odkazuje na jiné místo na stránkách (či na jiný web). Kontextová navigace tedy spojuje související stránky, které nemusí být ve struktuře vedle sebe a pomáhá uživateli najít detailnější nebo příbuzné informace, o kterých se píše jinde na webu. Kontextová navigace se tedy vyskytuje jako odkazy přímo v textu obsahu, nebo jako samostatný blok odkazů na „související stránky“. Kontextová navigace je velmi vítaná a velmi pomáhá nejen uživateli v orientaci na webu, ale je prospěšná při optimalizaci pro vyhledávače a často se za tímto účelem používá cíleně.
22
Alternativní a fasetová navigace - Je-li obsah webu velmi rozsáhlý a lze-li na něj pohlížet z různých úhlů, nemusí jedna základní struktura k jeho přehlednému uspořádání stačit. V takovém případě může být vytvořeno více tzv. klasifikačních schémat, které obsah utřiďují podle různých kritérií.
Zmiňovaný autobazar může tedy třídit auta podle značek (základní struktura), ale také podle alternativních struktur: pobočky, na kterých se auta nacházejí, podle roku výroby a mnoha dalších kritérií. Každé z nich může být pro uživatele přínosné. Podle méně důležitých kritérií lze vyhledávat nebo třídit v seznamech, ta důležitější kritéria mají své vlastní ovládací prvky.
Doplňkové typy navigací Index – abecedně řazený seznam odkazů. Návody – lineární navigace uzpůsobená specifickému úkolu, uživateli nebo tématu. Navigační možnosti prohlížeče
Při navrhování navigačního systému je třeba brát v úvahu, v jakém prostředí bude systém existovat. Jedním z těchto prostředí je prohlížeč. Prohlížeče mají zabudované svoje navigační možnosti, které jsou víceméně u všech stejné.
Základní možnosti tlačítka “Dopředu” a “Zpět” historie záložky obarvení navštívených odkazů
23
5.2 Navigační stres test Tento test lze provést jednoduchým způsobem, pokud si uživatel najde libovolnou stránku, zobrazí si ji bez všech odkazů, reklam apod., stačí si následně odpovědět na následující dotazy:
O čem je tato stránka? Jak se jmenuje tato stránka? Jaké jsou hlavní sekce? V jaké hlavní sekci je tato stránka? Co je o jedenu úroveň výš? Jak se dostanu na hlavní stránku? Jak se dostanu na vrchol (začátek) této sekce (v níž se právě nacházím)? http://keith.instone.org/navstress/.
5.3 Rozšíření flexibility Oproti Gopheru, který umožňoval pohyb jen v rámci hierarchie, umožňuje hypertext přeskočení z kterékoli úrovně kamkoli a tím obejití průchodu po hierarchii. Neposkytnutí těchto pomůcek (jako je postranní a svislá navigace) může být u velkých webů limitující. Jejich přemíra naproti tomu pohřbívá hierarchii.
Nástroje - Zajímavé služby, které lze uplatnit téměř na celém webu, nespadají do klasických prvků navigace, ale je dobré na ně odkazovat. Obvykle jsou to např. tisk stránky, doporučení známému, přidání do oblíbených položek, odeslání dotazu k produktu.
Mezi nástroje se ale také dá zařadit fulltextové vyhledávání umístěné na každé stránce, nebo různé parametrické vyhledávání typické pro cestovní agentury, elektronické obchody, apod. U uživatelů jsou tyto prvky oblíbené, ale musí být opravdu dobře zpracované, aby z nich lidé měli odpovídající zážitek. Pozornost by se měla věnovat nejen samotnému vyhledávacímu formuláři, ale ještě více stránce, která zobrazuje samotné výsledky.
24
Pomocná navigace - Velmi často se na webech vyskytují důležité odkazy v zápatí stránky – kontakty, právní doložka, mapa stránek apod.
Mapa webu - Již zmíněná mapa stránek je poměrně často používaným navigačním prvkem. Je to jedna či více stránek, které přehledně shrnují obsah celého webu s odkazy na všechny jeho stránky či alespoň sekce.
5.4 Řízené slovníky a tezaury Řízený slovník je podmnožina jazyka, je to seznam ekvivalentních výrazů ve formě synonymické řady (synonym ring) nebo seznam preferovaných výrazů, ve formě autoritativního seznamu (authority file). Definujte vztahy (širší a užší) a dostanete klasifikační schéma, modelujte asociativní vztahy mezi koncepty a máte tezaurus. Protože tezaurus spojuje všechny tyto slovníky v jeden, vysvětlíme si je postupně.
Synonymní kruhy Synonymní kruhy (synonym ring) slouží pro definování výrazů, které jsou ekvivalentní pro potřeby získávání informací, například hanheld, PDA, PocketPC a Pocket PC. Bývají zde uvedeny také známé překlepy a výrobci daných zařízeních. Není důvod určovat, který výraz je preferovaný, místo toho se ve vyhledávání použijí všechny. Synonymní kruhy zvyšují úplnost (recall) výsledků proti přesnosti.
25
Autoritativní seznam Autoritativní seznam má formu seznamu preferovaných výrazů, neobsahuje varianty a synonyma. Klasickým autoritativním seznamem je slovník spisovné češtiny.
Autoritativní seznam je užitečným nástrojem pro autory obsahu. Z pohledu správy řízených slovníku může být preferovaný výraz uveden u synonymního kruhu. Mohou například pomáhat opravit uživateli překlepy nebo ho poučit o námi používané terminologii.
Klasifikační schémata Klasifikační schémata jsou používána pro hierarchické uspořádání výrazů.
Tezaury Tezaurus – sémantická síť konceptů spojující slova s jejich synonymy, hononymy, antonymy, bližšími a vzdálenějšími výrazy a souvisejícími výrazy.
Tezaurus (dle ANSI a pro naše potřeby) – kontrolovaný slovník, ve kterém jsou definovány vztahy ekvivalence, hierarchie a asociace pro potřeby zlepšeného získávání dat.
Vztahy mezi termíny tezauru Preferovaný výraz – preferred term – PT Takzvaný akceptovaný výraz, akceptovaná hodnota, deskriptor. Všechny závislosti jsou definovány vzhledem k preferovanému výrazu. Variantní výraz – variant term – VT Nepreferovaný výraz, ekvivalent k preferovanému výrazu, jeho volné synonymum. Vzdálenější výraz – broader term – BT 26
Rodič preferovaného výrazu v hierarchii. Je o úroveň výš v hierarchii. Bližší výraz – narrower term – NT Potomek preferovaného výrazy, o úroveň níže v hierarchii. Související výraz – Related term – RT Spojen s preferovaným výrazem pomocí asociativního vztahu. Bývá uvozován jako “See Also” – “Viz také”. Použij – Use – U Tradiční tezaury používají tento výraz ve formě: “Variantní výraz -> použij preferovaný výraz(y)”. Používá se pro uvedení všech variant preferovaného výrazu. Užíváno pro – Used for – UF Používán jako opak předchozího. Preferovaný výraz užíván pro variantní výrazy. Poznámka k rozsahu – Scope note – SN Definice omezující význam preferovaného významu.
Tezaurus – vztahy mezi termíny (plná velikost, cca 10 kB)
27
Typy tezaurů Klasický – používán pro indexování a prohledávání, pomáhá mapovat variantní výrazy na preferované při indexování dokumentů, při prohledávání jsou dotazy srovnávány se širokým slovníkem tezauru povolujícím synonyma, hierarchické procházení a asociativní odkazy. Indexové – ne vždy je nutno vytvářet klasický tezaurus. Představte si scénář, kde vybudujete řízený slovník a indexujete dokumenty, ale nemáte možnost zabudovat synonymní kruh do vyhledávání. V tomto případě nenajde-li uživatel, co hledá, a zkusí-li to přes idnex, konzistentním indexem a jeho namapováním na dokumenty vyučujete uživatele k používání vašich výrazů. Navíc je to dobrý krok k plnému tezauru a jeho implementaci. Vyhledávací – v případě, že nejste schopni použít indexaci na úrovni dokumentů (dodáváte obsah třetích stran jako novinky). V tomto případě použijete tezaurus při vyhledávání, nikoli při indexování (ruční by bylo velmi nákladné). Můžete nechat uživatel prohlížet tezaurus a nalezené výrazy použít jako předdefinované dotazy.
28
(Schéma internetového obchodu www.alza.cz)
Ukázka klasifikačního schématu Třetím typem řízeného slovníku, majícím rysy velmi podobné tezauru, jsou ontologie, velmi často zmiňované v souvislosti s problematikou sémantického webu. Ontologie by měly obsahovat slovník určitého oboru, nadřazené a podřazené termíny a měly by řešit synonymii i homonymii i další jevy znesnadňující jednoznačné zařazení. Do budoucna se odhaduje, že by mohl být vytvořen univerzální slovník obsahující všechny pojmy jednoho jazyka s možností propojení na další jazyky. Ontologie už příliš nesouvisejí s vytvářením jednotných webových stránek, přesto považuji za vhodné se o nich zmínit. Jelikož nelze vyloučit, že v budoucnosti budou všechny stránky jejich součástí.
29
6) Vyhledávací systémy Vyhledávání je další formou získávání informací. Tato oblast je velmi náročná, drahá a rozsáhlá. I tento informační základ může pomoci podstatně zkvalitnit tuto součást webů, která bývá v současnosti nejvíce zanedbávaná.
Ne všichni uživatelé chtějí stránky prohledávat, někteří je chtějí jen procházet. Důležité je, zda uživatelé chodí na stránky informace hledat. Častěji například vyhledávají uživatelé na stránkách technické podpory než uživatelé bankovního systému. Je-li web víc knihovna než softwarová aplikace, má implementace vyhledávání určitě smysl. Mnoho vývojářů vidí vyhledávací systémy jako řešení problémů uživatelů s hledáním informací na jejich webech. Stávají se tak náhradou chybných navigačních systémů a jiných navigačních slabostí. Nejdříve je nutné vyřešit problémy navigačního systému a až poté má smysl využívat jeho zdroje, jako je například řízený slovník použitý k označování obsahu. Vyhledávací systémy je snadné nastavit a rozběhnout, ale je těžké to provést korektně. Často se tak uživatel může setkat s nepochopitelným vyhledávacím rozhraním a nesmyslnými výsledky. Levnější a méně časově náročnou variantou může je např. index. Jak index, tak vyhledávání pomáhají uživatelům, kteří vědí, co hledají. Vytvořit ručně webový index je sice spousta práce, ale může být spravován kýmkoli se znalostí XHTML. „Budou se uživatelé obtěžovat s hledáním? Například u webu s pohlednicemi si raději prohlédnou náhledy obrázků. Máte příliš mnoho informací k procházení?“
I při dobré hierarchii může počet kategorií tak narůst, že jejich procházení se stane více než obtížným, to je typický příklad portálů. Při takto velkém množství informací se hierarchie stává doplňkovou navigací a je také zobrazena ve výsledcích vyhledávání.
30
6.2 Základní anatomie vyhledávání Existují dvě běžné varianty vyhledávacích systémů. Jednodušší varianta poskytuje uživateli primitivní rozhraní pro zadání dotazu. Může použít běžný jazyk nebo speciální vyhledávací výrazy, jakou jsou booleovské operátory (AND, OR, NOT), popřípadě nástroj pro vytvoření dotazu. Tento dotaz je “porovnán” s indexem výrazů, které mohou obsahovat jak všechny výrazy z textu, tak jenom výrazy z vybraných polí (názvy dokumentů, jména autorů nebo kategorie). Výsledky jsou pak zobrazeny v ideálním případě setříděné podle relevantnosti.
Složitější varianta je čím dál běžnější. V systému jsou vytvořeny záznamy obsahující metadata reprezentující dokumenty. Jak metadata, tak dokumenty jsou většinou uloženy v databázi. Dotazy jsou porovnávány s indexy vytvořenými nad těmito metadaty. Výsledky pak bývají mnohem přesnější. Pro prohledávání části obsahu je vhodné stanovit vyhledávací zóny, aby nedocházelo k záměnám informací (např. novinky ze světa HW za ceník zboží).
6.3 Vyhledávací zóny Vyhledávací zóny jsou části webu, které jsou indexovány odděleně od zbytku obsahu. Hledá-li uživatel v nějaké zóně, identifikuje se tak jako zájemce o tuto část informací. V ideálním případě vyhovuje toto rozdělení jeho potřebám a eliminací prohledávání obsahu, který ho nezajímá, získá relevantnější informace.Vyhledávací zóny lze sestavit několika způsoby, například podle: typu obsahu uživatelů role předmětu či tématu geografických informací autorů data vydání oddělení firmy
31
6.4 Navigace versus destinace – většina webů obsahuje dva typy stránek: Navigační – obsahují odkazy pro další procházení, může to být hlavní stránka, index, atd. Destinační – obsahují obsah, vedou na ně odkazy z navigačních stránek.
Velmi vhodné je neindexovat navigační stránky, jelikož můžeme předpokládat, že uživatele zajímá hlavně obsah.
Indexace pro specifické publikum – rozhodneme-li se vytvořit zóny pro specifické skupiny uživatelů, je vhodné zkusit, k jak velké redukci při vyhledávání v jednotlivých zónách dojde oproti vyhledávání na celém webu. Při redukci v řádech 10 až 20 procent není zřejmě obsah pro jednotlivé skupiny dostatečně odlišný a není třeba toto rozdělení realizovat.
Indexace podle předmětu – jestliže váš web používá silně předmětově orientované organizační schéma (například katalog odkazů na portálu), mohli byste najít spoustu vyhledávacích zón. Proto při procházení kategorií v organizačním schématu je dobré umožnit vyhledat pouze v dané kategorii.
Indexace posledního obsahu – chronologicky organizovaný obsah může být skvělým příkladem pro vytvoření vyhledávacích zón. Protože informace závislé na datu nejsou nejednoznačné, je dobré vytvořit vyhledávácí zóny právě podle data. Uživatel, který se vrací na stránku, si tak může zkontrolovat, co je nového v posledním dni, týdnu nebo měsíci. Nebo je možné nechat uživatele vytvořit jeho vlastní zónu zadáním počátečního a koncového data.
6.5 Výběr obsahu k prohledávání Tak jako poskytujeme pomocí zón možnost vyhledat jen v určité části webu, můžeme poskytnout výběr, v jakých částech obsahu vyhledat. Obsah může sestávat z mnoha komponent, a to jak viditelných (text, obrázky, odkazy, autor, titulek) tak skrytých (metadata
32
obsahující klíčová slova). Dobrým důvodem pro rozpitvání dokumentu při prohledávání je možnost prezentace jeho částí při zobrazení výsledků. Třeba popis, nadpis, kategorii a URL.
Zda ale toto vyhledávání uživatel nakonec použije, zjistíme často až z logu serveru.
6.6 Vyhledávací algoritmy Existuje velmi mnoho vyhledávacích algoritmů, zmíníme jich tedy jen několik. Tomuto tématu se věnujeme proto, že tak jako specifické nástroje řeší specifické problémy, je tomu stejně i u vyhledávacích algoritmů. Nejspíš neexistuje algoritmus, který by splnil všechny vaše požadavky.
6.7 Shoda podle šablony (pattern matching) Algoritmus je založen na porovnávání uživatelova dotazu s plným textem dokumentu a hledáním shody textu.
6.8 Úplnost (recall) a přesnost (precision) Algoritmy mohou být zaměřeny více na úplnost nebo více na přesnost. Použijeme-li pro vyhledávání kořen hledaného slova, dostaneme více výsledků, tedy větší úplnost, ale menší přesnost. Stejně tak hledáme-li autora dokumentu a omezíme vyhledávání jen na pole autor, přesnost bude velká, budeme-li hledat jeho jméno i v textu, zmenší se přesnost a stoupne úplnost.
úplnost (recall) = poměr množství vrácených relevantních dokumentů ku počtu relevantních dokumentů v systému (kolik z dokumentů, které jsou v systému, dostanu, protože jsou to ty, které chci) přesnost (precision) = poměr množství vrácených relevantních dokumentů ku celkovému počtu vrácených dokumentů (kolik z dokumentů, které dostanu, je těch, které chci) 33
6.9 Další možnosti algoritmů Některé algoritmy zkoumají podobnost dokumentů, odstraňují stop slova (a, jako, je, on), jiné při malém počtu výsledků rozšiřují hledání třeba o: citování (kdo na dokument odkazuje) kam odkazuje vyhledaný dokument kolaborativní filtrování (uživatelé prohlížející tento dokument se dále podívali na…, kupující koupili…) podobnost založenou na textu
6.10 Tvorba dotazů Nástroje pro tvorbu dotazů bývají uživateli často neviditelné. Mohou provádět například následující činnosti: kontrola pravopisu fonetická podobnost skloňování a časování algoritmické ohýbání použití řízených slovníků
6.11 Prezentace výsledků Prezentace výsledků je stejně důležitá, jako vyhledávání samo. Libovolně kvalitní výsledky vyhledávání mohou přijít vniveč, nejsou-li správně prezentovány – předány uživateli.
34
6.12 Jaké výsledky a kolik toho zobrazit? Jednoduché pravidlo zní: “Zobrazte méně informací uživateli, který ví co hledá (například hledá jen v poli autor) a více uživateli, který to neví.” Další možností je nechat uživatele ovlivnit co chce vidět (například tlačítkem “Skrýt popis”). Jaké množství informací zobrazit u jednoho záznamu, závisí i na tom, jak velké bývají sady výsledků. Je-li web malý nebo výsledky vyhledávání hodně specifické, je možno zobrazit uživateli více informací. Ale mějte na paměti, že ať dáte uživateli jakkoli najevo, že je výsledků více, málokterý se podívá na další stránku výpisu. To, jaké informace zobrazit, závisí také na tom, jaké informace jsou dostupné pro vyhledávání a jak je obsah používán. Hledáte-li osobu v telefonním seznamu, chcete ve většině případů znát její telefonní číslo a je proto zbytečné uživatele nutit kliknout na záznam pro jeho zobrazení. Tato informace může být zobrazena už ve výsledcích vyhledávání. Množství výsledků zobrazovaných na stránce závisí na předchozích faktorech. Zobrazujete-li k jednomu nalezenému dokumentu hodně informací, měl by být počet zobrazených nalezených dokumentů na stránce menší a naopak. Ale je lépe zobrazit méně dokumentů a nechat tuto možnost uživatele ovlivnit (limitující může být třeba rychlost připojení). Je doporučeno zobrazit uživateli celkový počet dokumentů, aby měl představu při procházení výsledků, kolik dokumentů ještě zbývá. Nutností bývá použití navigačního systému pro procházení výsledků.
6.13 Prohlížení výsledků Způsob zobrazení výsledků závisí na tom, jaké výsledky chce mít uživatel zobrazeny první. Existují dvě běžné metody – sorting a ranking. Sorting (třídění či řazení) je vhodnější pro uživatele, kteří se chystají provést nějaké rozhodnutí, například vybrat a koupit nejlevnější výrobek.
35
Nejčastější možnosti třídění: podle abecedy – u anglických názvů bývá vhodné vynechat členy (the, a) podle data podle ceny
Ranking (hodnocení) je vhodný pro uživatele, kteří se snaží něco nového naučit, často probíhá podle relevantnosti dokumentu. Nejčastější možnosti hodnocení: podle relevance podle popularity podle uživatelského hodnocení pay-for-placement (platba za umístění)
Další možnosti Mezi další možnosti práce s výsledky vyhledávání patří: seskupování výsledků – skrytí podobných export – tisk, poslání e-mailem uložení výsledků – na serveru, třeba pro pozdější porovnání uložení dotazu onačení dokumentů – pozdější prohlížení (něco jako košík pro dokumenty)
36
6.14 Vyhledávací interface Návrh vyhledávacího rozhraní ovlivňuje několik faktorů: Zkušenosti uživatelů: Umí používat booleovské výrazy? Použít nápovědu? Typ výsledků: Chtějí uživatelé vyhledávání jen zkusit nebo provádí komplexní pátrání? Jaký typ komponent umožní uživateli lépe se rozhodnout a kliknout na vyhledaný dokument? Mají být výsledky jednoduché a nebo poskytovat detailní informace o každém nalezeném dokumentu? Typ prohledávaných informací: Jedná se o strukturovaná pole nebo o čistý text? Je obsah v XHTML nebo i v dalších, třeba netextových dokumentech? Množství prohledávaných informací: Bude uživatel zahlcen počtem výsledků? Jaké je to správné číslo? Jak se na internetu rozšiřuje počet uživatelů a klesají jejich průměrné zkušenosti s vyhledáváním, klesá i trpělivost s používáním rozšířených možností vyhledávacích strojů. Často jen napíšou text, zmáčknou tlačítko a čekají, co se stane. Na to zareagovali vývojáři vyhledávačů integrací rozšířené funkcionality do základního hledání. Například Google seřadí výsledky podle klasifikace relevantnosti.
6.15 Vyhledávací box Všudypřítomný a jednoduchý, vhodný pro uživatele, kteří se nechtějí učit rozšířené možnosti vyhledávání. Ty je můžete naučit při vhodné příležitosti, jako je třeba zobrazení příliš velkého množství výsledků. Pozor, vyhledávací box není vhodno umísťovat v blízkosti jiných boxů. Uživatele to může mást a pravděpodobně místo přečtení si nápisu vedle boxu napíše vyhledávací dotaz do pole pro přihlašovací jméno nebo heslo. Lepší je umístit vyhledávací box v blízkosti hlavní navigace a přejmenovat tlačítko z “Odeslat” na “Hledat”.
37
6.16 Pokročilé vyhledávání Rozšířené vyhledávání je ta část systému, kde je uživateli odhalena větší část funkcionality vyhledávacího stroje. Zde mají uživatelé možnost ovlivnit chování vyhledávače. Těmito uživateli jsou jednak pokročilí vyhledávači a jednak vyhledávači frustrovaní, kteří chtějí zrevidovat svoje hledání, když zjistí, že základní vyhledávací box nestačí.
38
Závěr: V mé práci jsem se snažil popsat význam Informační architektury v oblasti organizace informací na webových prezentacích. V úvodu jsem popsal historii vývoje Informační architektury, dále definici IA rozdělenou dle různých teorií. Richard Wurman, jakožto průkopník obecné teorie oboru IA prosazuje pojetí vědy a umění , v kontextu organizace informací. Naproti této teorii se staví Louis Rosenfeld a Peter Morville, kteří berou IA modernější formou a to jako organizaci digitálních informací v oblasti webovských prezentací a intranetu. Touto teorií jsem se nejvíce zabýval v obsahu mé práce a snažil jsem se jí tak co nejlépe nastínit. Zde se nabízí využití tohoto modernějšího pojetí IA v oblasti vývoje a tvorby webovských prezentací, popsal jsem zde metody aplikace IA z různých úhlů pohledu a to i v oblasti praktického využití. Popsal jsem také osobu Informačního architekta, jakými metodami by se měl řídit při vytváření webových stránek a také jsem popsal funkci jednotlivých vzdělávacích institucí oboru IA, kterých je dle mého názoru stále málo a tudíž vzdělávání Informačních architektů není v dnešní době na moc vysoké úrovni. Rosenfeldova a Morvillova teorie se zaměřuje výhradně na koncového uživatele, snaží se mu maximálně zjednodušit cestu k požadovaným informacím a také se ho snaží zprostit veškerých složitých postupů vyhledávání a organizace požadovaných informací. Ke konci práce jsem se zaměřil na význam navigace na webových prezentacích a popis druhů navigace. Dále jsem popsal význam vyhledávání informací, vyhledávací metody a algoritmus vyhledávání. Práce pro mě byla přínosem, jelikož jsem získal spoustu nových poznatků z oblasti sběru, organizace a prezentace informací koncovým uživatelům. Celkově hodnotím tuto práci jako zdařilou a byla pro mne velmi zajímavá.
39
Seznam Použité literatury:
http://interval.cz/clanky/artefakty-informacni-architektury-navigacni-systemy/ http://www.adaptic.cz/znalosti/informacni-architektura.htm http://www.symbio.cz/clanky/co-neni-informacni-architektura.html http://www.audiv8.cz/clanky_read.php?clanek-nazev=Informacni-architektura-a-digitalniknihovny&id=142&rubrika=2 http://blog.actum.cz/informacni-architektura-pro-web-design-po-10-letech/ http://is.muni.cz/th/108801/ff_m/ http://www.webdesign1.cz/pravidla-webdesignu/ http://www.usask.ca/education/coursework/skaalid/ http://www.pravidla-pristupnosti.cz/ http://www.vkol.cz/data/soubory/import/web_grafika.pdf http://interval.cz/clanky/webml-struktura-webove-aplikace/ http://www.gslis.utexas.edu/~l38613dw/readings/InfoArchitecture.html http://www.symbio.cz/clanky/dokonalejsi-vyhledavani-pro-vasweb.html http://www.atomz.com/ http://php.vrana.cz/fulltextove-vyhledavani-v-mysql.php http://www.root.cz/clanky/php-pro-experty-inteligentni-vyhledavani http://www.ics.muni.cz/dublin_core/ http://www.ics.muni.cz/mba/dl-fi07/dlfi07-5-6.pdf
40