Publikováno na Inflow.cz (http://www.inflow.cz/systemy-vyhledavani-obrazovych-informaci-cast-iproblematika-vyhledavani)
Systémy vyhledávání obrazových informací. Část II.: Problematika vyhledávání 3. 3. 2010 Blažek Jakub
Článek je výtahem z magisterské diplomové práce „Systémy vyhledávání obrazových informací“. Autor se v něm pokouší nahlédnout do problematiky obrazových informačních objektů, snaží se definovat jejich základní charakteristiky a vlastnosti, popisuje metody a možnosti jejich zpracování, indexace i vyhledávání, stejně jako představuje rozmanité modely jejich využití. Kromě toho se věnuje i popisu vyhledávacích systémů a možnostem jejich fungování a v neposlední řadě zde představuje a hodnotí konkrétní projekty, jež v současném internetovém prostředí procházejí značně progresivním vývojem. Jedná se o druhou část výtahu. Poznámka redakce: druhá část výtahu pochází z diplomové práce: BLAŽEK, Jakub. Systémy vyhledávání obrazových informací. Brno: Masarykova univerzita, Filozofická fakulta, Ústav české literatury a knihovnictví, Kabinet knihovnictví, 2008. 102 s. + 9 s. příloh. Vedoucí diplomové práce Mgr. Petra Šedinová.
3. Vyhledávání obrazových informací Jakmile uživatel zadá dotaz, systém prohledá databázi a snaží se vyhledat obrazové objekty, jež položenému dotazu nejvíce odpovídají. Přitom vždy záleží na skutečnosti, zda je u systémů užito metody shody (matching) či podobnosti (similarity). V tradičních databázích je shoda chápána jako binární operace zahrnující porovnání objektu s dotazem a rozhodnutí, zda daný objekt podmínkám dotazu plně vyhovuje.[1] U „podobnostního" vyhledávání jsou oproti tomu jednotlivé objekty při zobrazení výsledků uspořádány podle jejich podobnosti vzhledem k položenému dotazu, přičemž kritéria podobnosti jsou pevně nastavena.[2] V oblasti vyhledávácích systémů na internetu je pak možno zmínit následující jev. Jestliže se jedná o textový dotaz, dochází k porovnání vstupních klíčových slov s obsahem databáze. Pokud se jedná o vizuální dotaz, jsou porovnávány s obsahem databáze charakteristické rysy objektu. Rozhodování, zda bude užito metody shody či metody podobnosti, se jako obvykle odvíjí od skutečnosti, k jakým účelům byl systém sestaven, a jaké jsou
záměry uživatele při sestavování dotazu. V případě užití metody shody však můžeme identifikovat problém, pokud příliš lpíme na stoprocentní shodě vstupního objektu s obsahem databáze. V takových případech mohou být některé výsledně vyhledané objekty vyřazeny z množiny vyhovujících obrazových prvků, protože nevykazují stoprocentní shodu, ačkoliv shodné patrně jsou (důvodem může být např. minimální nepřesnost způsobená špatnou kompresí obrazového objektu či jeho kazem, apod.). Proto se Kherfi, Ziou a Bernardi domnívají[3], že by měla být u metody shody doporučena alespoň minimální tolerance vůči určitým chybám mezi vstupním objektem a objektem nalezeným v databázi. V případě užití metody podobnosti se zase vyskytuje jiný typ problému - badatelé si kladou otázku, jak je možno podobnost definovat. Tímto problémem si nejsou jisti ani psychologové zkoumající kognitivní procesy v lidském mozku, pročež je i návrh podobně zaměřených počítačových systémů problematický. Kromě výjimečných případů (např. specializované systémy vyhledávání ochranných známek) jsou přesto vyhledávací systémy založeny právě na metodě podobnosti. 3.1 Konkrétní připomínky k oblasti vyhledávání John Eakins a Margaret Grahamová ve své výzkumné zprávě Content-based Image Retrieval: A report to the JISC Technology Applications Programme rozlišují tři základní účely, pro něž uživatelé využívají obrazových informací.[4] Jedná se o: ilustraci článků, příp. sdělení informace či emoce obtížně popsatelné slovy zobrazení podrobných dat pro analýzu (např. radiologické obrázky) záznam uživatelem navržených dat pro pozdější použití (např. architektonické plány) Je tedy evidentní, že se jedinci snaží při vyhledávání zvolit specifické typy objektů nebo výjevů, obrázky vyvolávající určité emoce či pouze obrázky obsahující specifickou texturu nebo vzor. V této souvislosti autoři popisují několik prvků, jež je možno při vyhledávání užít: [5] určitá kombinace barvy, textury či tvaru (např. zelená hvězda) uspořádání specifických typů objektů (např. židle okolo stolu) zobrazení určitého typu události (např. fotbalový zápas) výskyt konkrétních jedinců, míst či událostí (např. královna zdravící dav lidí) subjektivní emoce, které si jedinec s obrázkem spojuje (např. štěstí) metadata, jenž popisují kým, kdy a kde byl obrázek vytvořen Každý z uvedených příkladů (až na poslední zmíněný) přitom představuje vyšší úroveň abstrakce než ten předešlý, s čímž souvisí také vyšší obtížnost jeho vyhledání. Yuksel Alp Aslandogan a Clement T. Yu pak popisují[6] následující metody vyhledávání obrázků: vyhledávání prostřednictvím jednoduchých vizuálních rysů (simple visual feature query) uživatel při vyhledávání specifikuje určité hodnoty, příp. i s jejich percentuálním zastoupením (např. obrázky obsahující 25 % červené barvy, 50 % barvy modré a 25 % barvy žluté) vyhledávání prostřednictvím kombinace charakteristických rysů (feature combination query) - uživatel kombinuje různé typy charakteristických znaků a specifikuje jejich hodnotu a důležitost (např. obrázky obsahující zelenou barvu a stromovou texturu, kde má barva váhu 75 % a textura 25 %)
vyhledávání prostřednictvím lokace charakteristických rysů (localized feature query) uživatel specifikuje jednotlivé hodnoty a jejich umístění na ploše (např. obrázky s nebeskou modří v horní polovině obrázku a zelenou barvou v dolní polovině obrázku) vyhledávání příkladem (query by example) - uživatel vybere obrázek ze sady, jež mu byla nabídnuta systémem a systém následně vyhledá obrázky podobné obrázku zvolenému, přičemž podobnost může být určena i na základě předem definovaných znaků (např. obrázky obsahující texturu podobnou danému typu), příp. uživatel přímo načrtne přibližnou podobu obrázku, dle níž systém následně vyhledává; tuto metodu je vhodné užít v situacích, kde je obtížné nebo zcela nemožné popsat obrázek slovy objekt x obrázek (object versus image) - uživatel popíše znaky objektu uvnitř obrázku (např. obrázky obsahující červené auto blízko středu obrázku) vyhledávání prostřednictvím specifikace atributů obrázku (user defined attribute query) uživatel specifikuje hodnoty definovaných atributů obrázku (např. obrázky s rozlišením alespoň 300 dpi, na nichž je zachycen Washington dne 4. července) vyhledávání prostřednictvím vztahů mezi objekty v obrázku (object relationship query) uživatel specifikuje objekty, jejich atributy a vztahy mezi nimi (např. obrázky, na nichž je zachycen stařec s dítětem v rukou) vyhledávání prostřednictvím stanovení konceptu (concept queries) - některé systémy umožňují uživateli definovat jednoduché koncepty založené na systémem extrahovaných znacích (např. uživatel může definovat koncept pláže jako „malý žlutý kruh v horní části obrázku + velká modrá oblast uprostřed + písečná žlutá barva ve spodní části obrázku" Arnold Smeulders[7] ve výzkumné zprávě Content-Based Image Retrieval at the End of the Early Years popisuje tři obecné metody vyhledávání obrázků. Jedná se o situace, kdy: uživatel nemá žádný specifický požadavek, pouze touží nalézt zajímavý objekt (metoda zvaná vyhledávání asociací neboli search by association). To ve většině případů znamená nutnost opakovaného vyhledávání či následného vyhledávání dle podobnosti. Systémy spadající do této kategorie jsou vesměs velmi interaktivní (k vyhledávání obrázku je např. možno načrtnout jeho podobu) a pracují se zpětnou vazbou. uživatel hledá specifický objekt (cílené vyhledávání neboli target search), přičemž se jedná buď o obrázek, který zcela odpovídá představám uživatele (např. konkrétní umělecké dílo), příp. obrázek podobný této představě či danému obrázku (vyhledávání příkladem neboli search by example). Tato oblast je typická zejména pro systémy vyhledávání uměleckých objektů, známek, průmyslových komponentů, apod. (obecně se dá hovořit o katalozích zaměřených na určité téma). uživatel hledá libovolného zástupce určité kategorie (kategoriální vyhledávání neboli category search) - jedná se např. o případy, kdy uživatel vlastní obrázek, jenž lze zařadit do určité kategorie (např. obrázek myši) a hledá další zástupce obrázků do této kategorie spadajících (tzn. obrázky dalších hlodavců). Susanne Ornagerová navrhuje širší schéma a popisuje, jak vyhledávají fotografie žurnalisté, avšak domnívám se, že tuto klasifikaci lze užít na široké spektrum uživatelů. Jedná se o několik základních kategorií, jimiž jsou[8]: uživatel se specifickou představou (klade velmi specifický dotaz, jelikož má konkrétní představu o obrazové informaci, již použije) uživatel s nepříliš jasnou představou (klade poměrně široký dotaz, protože si chce sám
vybrat z větší skupiny obrázků) „story-teller" (píše o určitém problému, přičemž nemá konkrétní představu o vhodném obrázku; je otevřen libovolným návrhům, z nichž některé užije pro ilustraci svého článku) „story-giver" (sepsaný text předává dalším kolegům, kteří mají za úkol vybrat vhodný obrázek) uživatel, pro nějž je jediným kritériem velikost obrázku (obsah jej prakticky nezajímá, potřebuje jen zaplnit místo na stránce) Ritendra Datta[9] pak uvádí, že existují tři typy uživatelů vyhledávajících obrazové informace. Jsou jimi: browser („brouzdající uživatel") - uživatel prohlížející si obrázky bez konkrétního cíle; vyhledává způsobem, kdy pokládá několik různorodých dotazů a obvykle přeskakuje z tématu do tématu. U vyhledávacích systémů oceňuje zejména jejich jednoduchost a uživatelsky přívětivé prostředí. Obvykle má na vyhledávání dostatek času a nebrání se při něm překvapivým výsledkům či náhodně zobrazeným obrázkům jako případným tipům (tzv. random hints). surfer („surfující uživatel") - uživatel s průměrnou představou o konkrétním cíli; v počáteční fázi provádí průzkumnou sondu a s následující fázi vyhledávání svůj požadavek postupně upřesňuje. Při vyhledávání oceňuje zejména uživatelské prostředí, jenž mu může napomoci v ujasnění požadovaného cíle (např. v situacích, kdy uživatel vyhledává podle fotografií místo, kde by mohl strávit dovolenou, pomohla by mu nabídka obrázků nejpopulárnějších lokalit). searcher („vyhledávající uživatel") - uživatel se zcela jasnou představou o vyhledávaném objektu; snaží se co nejkratší a nejrychlejší cestou dosáhnout požadovaného výsledku, přičemž používá přísně logických metod. Vyhledávací systémy posuzuje z čistě pragmatického hlediska - vyžaduje zejména přesnost a úplnost výsledků. Rozdílné požadavky na vyhledávácí systémy jsou však způsobeny nejen různorodými potřebami uživatelů, ale také rozličnými typy elektronických databází. Tvůrci systémů pak musí tyto požadavky reflektovat a vyhledávací systém samotný musí být stanoveným podmínkám zcela přizpůsoben. Datta[10] rozlišuje následujících pět kolekcí (databází) obrazových objektů: osobní kolekce - většinou se jedná o homogenní kolekci malé velikosti, která bývá obvykle přístupna jen vlastníkovi a ukládána je nejčastěji na lokálních médiích. U těchto typů kolekcí je kladen důraz na personalizaci, flexibilitu prohledávání a metodologii zobrazení obrazových objektů (např. chronologické zobrazení objektů dle data). doménově zaměřená kolekce - homogenní kolekce zaměřená na určitou oblast, do níž má často přístup jen omezená skupina uživatelů (jedná se např. o databázi radiologických objektů z oblasti medicíny); většinou bývá velmi rozsáhlá a skladována na distribuovaných typech médií (počítačové sítě). podniková kolekce - heterogenní kolekce obrázků, jež je dostupná jen uživatelům s možností přístupu na firemní či podnikovou síť. Obrázky mohou být skladovány na různých místech a přístup k nim může být pro všechny stejný či naopak pro některé uživatele omezený. archiv - obsahuje vesměs objekty historického či jiného důležitého významu; tyto jsou plně (či alespoň částečně) strukturovány a tvoří homogenní kolekci zaměřenou na specifické téma. Tento typ kolekcí je často přístupný přes internet a data bývají uskladněna a zálohována na mnoha diskových médiích. web - obrovská, značně heterogenní kolekce přístupná komukoliv s připojením na internet.
Na následujících řádcích jsou popsány tři úrovně vyhledávání v oblasti obrazových informací tak, jak je popisují Eakins a Grahamová.[11] Jsou založeny na koncepci prvotních, sekundárních (logických) a abstraktních znaků, o nichž jsem se již zmínil. Autoři vycházejí z tvorby dvojice Venkat N. Gudivada + Vijay V. Raghavan, která v práci Content-Based Image Retrieval Systems nastínila[12] rozdělení na dvě skupiny znaků - prvotní a logické (sémantické). Eakins a Grahamová pak toto rozdělení rozšiřují ještě o úroveň třetí - abstraktní. Úroveň jedna zahrnuje vyhledávání pomocí prvotních (primitivních) znaků, jimiž jsou barva, textura, tvar či prostorové rozmístění prvků v obrázku. Příkladem dotazu položeného při vyhledávání pak může být např. „najdi obrázky s dlouhými, úzkými, tmavými objekty umístěné v rohu vlevo nahoře", „najdi obrázky obsahující žluté hvězdy uspořádané v kruhu" či nejobvyklejší „najdi více obrázků podobných tomuto". Při této úrovni je při vyhledávání užito objektivně vnímatelných znaků, které lze snadno odvodit ze samotného obrázku, aniž by přitom bylo nutno odkázat do externí znalostní databáze. Na této úrovni jsou vyhledávací systémy schopny pracovat poměrně efektivně, čehož lze využít zejména při registraci ochranných známek nebo u identifikace nákresů v designérských archivech. Úroveň dva zahrnuje vyhledávání prostřednictvím odvozených (sekundárních / logických) znaků, jež se vyznačují nutností identifikovat objekt vykreslený v konkrétním obrázku. Přitom můžeme vyhledávat objekt určitého typu (např. autobus) či specifický objekt nebo osobu (např. Eiffelova věž). Oproti první úrovni vyhledávání je na této úrovni nutno při položení dotazu odkázat do přidružené databáze. Využiji-li uvedených příkladů - systém musí při vyhledávání rozpoznat, že se jedná o autobus a nikoliv o nákladní vůz, příp. musí rozeznat, jak vypadá objekt pojmenovaný „Eiffelova věž". Při této úrovni vyhledávání je také většinou užito objektivně vnímatelných znaků. Systémů využívajících druhou úroveň vyhledávání je možno užít např. v oblasti žurnalistiky. Příkladem dotazu položeného při vyhledávání pak může být např. „najdi obrázky osobního vlaku jedoucího přes most". Úroveň tři zahrnuje vyhledávání pomocí abstraktních znaků, což vyžaduje značnou schopnost porozumění významu nebo smyslu objektu či události vykreslené v obrázku. Na této úrovni můžeme vyhledávat obrázky konkrétně pojmenované (např. skotský lidový tanec) či naopak blíže nespecifikované, přitom však emocionálně nebo nábožensky významné (např. utrpení). Využití lze nalézt opět v oblasti žurnalistiky, příp. u knihoven specializovaných na umění. Příkladem dotazu pak může být „najdi obrázky zobrazující okázalost". Systémy pracující na první úrovni vyhledávání jsou jednoduché a poměrně spolehlivé. Systémy operující na druhé a především pak na třetí úrovni jsou podstatně složitější, avšak jejich funkčnost je menší (což platí zejména o třetí úrovni; tyto systémy jsou obecně velmi málo rozšířené). Bohužel však jen velmi malé procento uživatelů požaduje vyhledávání na úrovni číslo jedna, což celou problematiku značně komplikuje. 3.2 Metody vyhledávání obrazových informací Systémy vyhledávání obrazových informací je možno rozdělit do dvou základních skupin: content-based image retrieval (CBIR) neboli vyhledávání obrazových informací podle obsahu description-based image retrieval neboli vyhledávání obrazových informací podle popisu 3.2.1 Vyhledávání podle obsahu CBIR neboli content-based image retrieval (poprvé tohoto termínu užil Toshikazu Kato v r. 1992
v článku Database architecture for content-based image retrieval) můžeme popsat jako techniku indexování a vyhledávání obrázků vystavěnou na principu automatického (strojového) zpracování charakteristických znaků, jimiž jsou především barva, textura a tvar.[13] Někdy je v souvislosti s touto problematikou užito i termínů Query By Image Content (QBIC) či image processing (zpracování obrazu). Klíčovým znakem systémů CBIR je pak automatická extrakce prvků z daného obrazového objektu. Zmíněným charakteristickým znakům (výše popsané nejsou jediné, můžeme zde přiřadit např. i orientaci obrázku, prostorové rozmístění objektů uvnitř obrázku, apod.) jsou přiřazeny numerické deskriptory ve formě matematických vektorů. Při následném vyhledávání obrázku systém pracuje tím způsobem, že porovnává zadané vstupní veličiny s automaticky extrahovanými znaky obrázků uloženými v databázi. Jak již bylo uvedeno, jedná se především o matematické vyjádření barvy, textury a tvaru (v této souvislosti je nutno zmínit skutečnost, že systémy vesměs nemívají problémy s rozpoznáním barvy ani textury, složitější je to však v případě rozlišení tvaru, jelikož je mnohdy problémem již rozlišení jednotlivých objektů v obrázku - to se týká zejména případů, kdy jsou tyto objekty nevýrazné a splývají; mnohdy je také problematická i definice tvaru samotného). Proto většina CBIR systémů operuje na první úrovni vyhledávání (úroveň prvotních znaků). Při vyhledávání je nutno brát v potaz i dvě následující metody - metodu shody a metodu podobnosti (matching x similarity). V některých případech (např. systémy prohledávající databáze otisků prstů či systémy pro registraci ochranných známek) kladou uživatelé důraz na přesnou shodu vstupního dotazu s vyhledaným obrazovým objektem. Jindy je zase pro uživatele nezbytná filtrace obrázků totožných a klíčovým problémem je pro něj vyhledání obrázků podobných. Proto jsou systémoví návrháři i v těchto případech nuceni přihlížet k potřebám jednotlivých skupin uživatelů. Pro většinu webových aplikací se širokým polem působnosti je však výhodnější užití metody vyhledávání založené na podobnosti. Databáze objektů obrazových se tedy podstatně liší od databází objektů textových, u nichž je obsah (jednotlivé znaky skladované jako ASCII řetězec znaků) již předem strukturován autorem, což umožňuje jeho snadné vyhledání. Obraz se oproti tomu skládá z různorodě uspořádaných pixelů rozdílné barvy, sytosti i jasu, což jeho vyhledávání naopak značně problematizuje. Současná situace v oblasti CBIR je následující - systémy vyhledávání efektivně pracují pouze na první (nejnižší) úrovni rozpoznávání, přičemž většina uživatelů požaduje úroveň nejvyšší, což práci s těmito vyhledávacími systémy značně limituje. Problém je však možno řešit kombinací vlastností CBIR systémů s textovým vyhledáváním, čímž vznikají hybridní systémy. Systémů typu CBIR se využívá především v medicíně (např. diagnostika radiologických problémů) a kriminalistice (identifikace hledaných či pohřešovaných osob), kdy dochází ke komparaci výchozího obrazového objektu s obsahem databáze. Základními metodami, jichž jednotlivé systémy užívají, jsou tedy vyhledávání na úrovni jednotlivých pixelů a aplikace postupu vyhledávání příkladem, avšak v současnosti jsou již běžně užívány i objektově orientované techniky. Tyto umožňují extrahování jednotlivých obrazových objektů (či jejich částí) a zachycení vlastností těchto objektů z první úrovně do velkých datových celků (tzv. BLOBy[14]). Následuje komplexní přeměna a zformování nových vlastností těchto objektů, což má za následek efektivnější způsoby vyhledávání. Na poli systémů vyhledávání obrazových informací se však objevují i další techniky, mj. data mining obrazových informací (neboli image mining). Jedná se o metodu, která využívá poznatky
z oblasti vytěžování dat (data mining) a zpracování obrazu (image processing). Tyto metody operují s extrakcí podobných znaků z celé databáze obrazových informací - zatímco dříve se uživatel musel spokojit s extrahováním jednotlivých znaků z konkrétních obrazových objektů, image mining extrahuje podobné znaky z velkých objemů dat. Cílem tohoto způsobu je generování charakteristických rysů obrázků bez předchozí znalosti, přičemž na základě tohoto postupu následně dochází k automatické extrakci sémanticky významné informace. 3.2.2 Vyhledávání podle popisu Vyhledávání podle popisu je druhou z metod vyhledávání obrazových informací. Ve valné většině je využívají běžné internetové vyhledávače (resp. jejich nadstavby pro vyhledávání obrázků), stejně jako internetové vyhledávače na vyhledávání obrázků specializované. Vyhledávání podle popisu označované jako context-based, description-based, concept-based či annotation-based image retrieval (ABIR) sahá již do 70. let 20. století a je založeno na manuálním zpracování indexátorem, v čemž lze také spatřovat jeho největší nevýhodu - je dosti namáhavé a časově nesmírně náročné (vzhledem ke zmíněnému problému byly na počátku 90. let 20. století poprvé navrhnuty systémy CBIR jako řešení). Eakins a Grahamová v této souvislosti uvádějí,[15] že indexace jednoho obrázku se pohybuje v časovém rozpětí mezi cca sedmi minutami (u Getty Images, jež užívají svůj vlastní, interní systém) a cca čtyřiceti minutami (u Rensselaerova polytechnického institutu, užívajícího Art & Architecture Thesaurus), což je v případě rozsáhlých kolekcí obrázků značně nevyhovující. Manuální indexace videa je pak pochopitelně ještě zdlouhavější. Systémy využívající manuální indexování mají tedy svá podstatná negativa, avšak disponují jednou nespornou výhodou - při dobře provedené indexaci obdržíme na výstupu sémantický obsah obrazu, tudíž efektivita vyhledávání je u těchto typů systémů neporovnatelně vyšší než efektivita vyhledávání systémů založených na automatických metodách zpracování charakteristických znaků. Výhoda užití těchto typů systému je zřejmá: indexátor-člověk je schopen zachytit sémantický význam obrázku. Přesto však musíme počítat se všemi typickými rysy, jež intelektuální indexaci provázejí - počínaje již zmíněnou časovou (ale i finanční) nákladností a konče u problémů subjektivity, které tento typ indexace bezesporu provázejí. V této souvislosti je možno zmínit následující citát Rameshe Jaina: Více než o obrázku samotném nám klíčová slova často řeknou spíš něco o osobě, jež tato slova obrázku přidělila.[16] Pro ilustraci tohoto příkladu lze uvést např. tvrzení dvojice James D. Anderson a José PerézCarballo: Index vystavený na intelektuální indexaci se nemusí mezi jednotlivými kulturami shodovat. Bojovník za svobodu v kultuře jedné může být považován za teroristu v kultuře druhé. [17] Tuto obtížnou otázku lze sice do jisté míry řešit tezaury či řízenými slovníky, jež upravují hierarchické vztahy mezi objekty v obrázku, avšak nelze předpokládat, že by tyto přispěly ke komplexnímu řešení celé situace. Určitou pomocnou nadstavbou je v tomto případě interakce mezi systémem a uživatelem, konkrétně relevantní zpětná vazba mezi popisem obrázku a uživatelem (čímž se dostávám k problematice Webu 2.0), ale ani to neřeší problém časové a finanční náročnosti intelektuální indexace obrazových objektů. Jako další východisko z těchto problémů
bývá zmiňována možnost automatické indexace provedené na základě podobnosti obrázku indexovaného uživatelem s dalšími obrázky nacházejícími se v databázi. V této situaci dochází k porovnání výchozího obrázku s dalšími (či novými) obrázky z databáze. Obrázkům vykazujícím shodu s obrazovým objektem výchozím jsou přiřazena metadata, resp. klíčová slova, jež daný obrazový objekt nejlépe vystihují. Další možností je přiřazení klíčových slov obrázku dle doprovodného textu či popisných metadat, čehož bývá hojně využíváno v případě internetových vyhledávačů (search engines či image search engines). Většina zmíněných metod však není zcela spolehlivá. Výše byly popsány výhody i nevýhody obou základních systémů vyhledávání obrazových informací. Při vyhledávání na úrovni jedna se zdají být schopnější systémy CBIR (týká se to např. oblasti vyhledávání ochranných známek - jelikož člověk mnohdy nedokáže adekvátně popsat podobu konkrétní ochranné známky, stroj má v tomto značně navrch díky schopnosti matematicky vyjádřit její rysy). Při vyhledávání na úrovni dva, příp. tři je pak vhodnější vyhledávání podle klíčových slov, a tedy užití systémů založených na popisném vyhledávání (jedná se např. o situace, kdy uživatel vyhledává objekt k ilustraci novinového článku). Z těchto skutečností pak vyplývají značné výhody systémů hybridních, kombinujících popisné i obsahové vyhledávání (o těchto systémech se zmiňuji níže). 3.2.3 Hybridní systémy V oblasti vyhledávání obrazových informací je možno narazit také na systémy kombinující obě metody, jež byly popsány v předešlých kapitolách. Jedná se o systémy hybridní užívající obsahové i popisné techniky vyhledávání obrazových objektů, díky čemuž je při hledání konkrétních obrázků nabyto poměrně relevantních výsledků. Kombinace textového popisu (resp. indexace pomocí klíčových slov) vytvořeného intelektuální indexací a následné doplnění indexací automatickou, která umožňuje efektivně popsat některé rysy obrázku, jež člověk dokáže definovat jen s obtížemi (především tvar a textura některých objektů), se zdají být nejvhodnější metodou v oblasti vyhledávání obrazových objektů. Podobně zaměřené systémy nejčastěji užívají kombinace vyhledávání pomocí klíčových slov (+ booleovských operátorů, příp. dalších rozšiřujících možností) s vyhledáváním prostřednictvím vizuálního dotazu, což může napomoci v upřesnění charakteristik, pomocí nichž uživatel požadovaný objekt definuje. Hybridní systémy díky tomu vykazují vyšší přesnost i úplnost vyhledávání, což je bezesporu jejich největším pozitivem (zázemí tohoto problému na teoretické úrovni zaštiťuje Ingwersenův kognitivní model vyhledávání informací, kde autor popisuje, že vyhledávání prostřednictvím kombinace metod užívajících rozdílné kognitivní struktury je efektivnější než vyhledávání prostřednictvím metod jednotlivých[18]). 3.2.4 Vyhledávání obrazových informací a Web 2.0 V souvislosti s vyhledávacími technikami a metodami je možno zmínit také výhody, které v sobě skýtá Web 2.0 neboli personalizace webového prostředí a jeho aktivní tvorba a správa jednotlivými uživateli. Kromě jiného lze pozitivní stránky tohoto přístupu k webovým službám ocenit právě u vyhledávacích systémů. Jedná se zejména o hodnocení jednotlivých (obrazových) objektů a jejich deskripci samotnými uživateli - tzv. folksonomie (přidělování tagů neboli popisků internetovému obsahu) - díky čemuž lze prohledávání webu učinit efektivnějším.
Seznam použitých zdrojů KHERFI, Mohammed L. - ZIOU, Djemel - BERNARDI, Alan. Image Retrieval from the World Wide Web: Issues, Techniques and Systems. ACM Computing Surveys. March 2004, Vol. 36, Is. 1, s. 3567. ISSN 0360-0300. EAKINS, John - GRAHAM, Margaret. Content-based Image Retrieval: A report to the JISC Technology Applications Programme. Newcastle upon Tyne: University of Northumbria, 1999 [online]. [cit. 2008-03-09]. Dostupný z WWW:
. ALP ASLANDOGAN, Yuksel - YU, Clement T. Techniques and Systems for Image and Video Retrieval. IEEE Transactions on Knowledge and Data Engineering. January 1999, Vol. 11, Is. 1, s. 56-63. ISSN 1041-4347. SMEULDERS, Arnold W. M., et al. Content-Based Image Retrieval at the End of the Early Years. IEEE Transactions on Pattern Analysis and Machine Intelligence. December 2000, Vol. 22, Is. 12, s. 1349-1380. ISSN 0162-8828. DATTA, Ritendra - LI, Jia - WANG, James Z. Content-Based Image Retrieval - Approaches and Trends of the New Age. In Proceedings of the 7th ACM SIGMM international workshop on Multimedia Information Retrieval. Singapore, 2005. S. 253-262. ISBN 1-59593-244-5. GUDIVADA, Venkat N. - RAGHAVAN, Vijay V. Content-Based Image Retrieval Systems. Computer. September 1995, Vol. 28, Is. 9, s. 18-22. ISSN 0018-9162. [1] KHERFI, Mohammed L. - ZIOU, Djemel - BERNARDI, Alan. Op. cit., s 52. [2] Tamtéž. [3] Tamtéž., s 53. [4] EAKINS, John - GRAHAM, Margaret. Op. cit., s. 7. [5] Tamtéž. [6] ALP ASLANDOGAN, Yuksel - YU, Clement T. Techniques and Systems for Image and Video Retrieval. IEEE Transactions on Knowledge and Data Engineering. January 1999, Vol. 11, Is.1. ISSN 1041-4347. S. 56-63. [7] SMEULDERS, Arnold W. M., et al. Content-Based Image Retrieval at the End of the Early Years. IEEE Transactions on Pattern Analysis and Machine Inteligence. December 2000, Vol. 22, Is. 12. ISSN 0162-8828. S. 1351. [8] EAKINS, John - GRAHAM, Margaret. Op. cit., s. 13. [9] DATTA, Ritendra, et al. Image Retrieval: Ideas, Influences, and Trends of the New Age. ACM Computing Surveys. 2008, to appear. ISSN 0360-0300. S. 10.
[10] DATTA, Ritendra, et al. Op. cit., s. 10-11. [11] EAKINS, John - GRAHAM, Margaret. Op. cit., s. 7-8. [12] GUDIVADA, Venkat N. - RAGHAVAN, Vijay V. Content-Based Image Retrieval Systems. Computer. September 1995, Vol. 28, Is. 9. ISSN 0018-9162. S. 19. [13] EAKINS, John - GRAHAM, Margaret. Op. cit., s. 1. [14] BLOB = Binary Large OBject [15] EAKINS, John - GRAHAM, Margaret. Op. cit., s. 20-21. [16] „Keywords tell more about the person who assigned keywords to an image than they do about the image." Citováno dle: JAIN, Ramesh. World-Wide Maze. IEEE MultiMedia. June 1995, Is. 2, No. 2. ISSN 1070-986X. S. 3. [17] „An index based on human indexing may not travel well between cultures. A freedom fighter in one culture may be a terrorist in another." Citováno dle: ANDERSON, James D. - PÉREZCARBALLO, José. The Nature Of Indexing: how humans and machines analyze messages and texts for retrieval: part I: research, and the nature of human indexing. Information Processing and Management: an International Journal. March 2001, Vol. 37, No. 2. ISSN 0306-4573. S. 237. [18] EAKINS, John - GRAHAM, Margaret. Op. cit., s. 39. Štítky: vyhledávání informací, informační systémy, vyhledávání obrazových informací, obrazové informace, vyhledávací systémy