VYHLEDÁVÁNÍ INFORMACÍ obecné a specifické otázky Mgr. Věra Pilecká
Rešeršní strategie a vyspělé metody inf. podpory vědy konzultace kombinovaného studia 10.11.2006
Mgr. Věra Pilecká doktorandské studium na ÚISK FF UK zaměření: vyhledávání informací, kognitivní aspekty informační vědy, komunikace člověk-počítač (HCI) kontakty: tel.: +420 251 080 380, +420 605 733 813 e-mail:
[email protected]
10.11.2006
Rešeršní strategie
2
Témata • Obecná charakteristika procesu vyhledávání – anglická terminologie, důležité otázky IR, přístupy k problematice, chování uživatele
• Specifické otázky IR – analytické vyhledávání x browsing, komerční vyhledávací prostředky x vyhledávání na internetu, koncový a konečný uživatel, vyhledávací strategie 10.11.2006
Rešeršní strategie
3
Vyhledávání informací – definice VAŠE NÁVRHY? „činnost, jejímž cílem je identifikace relevantních dokumentů nebo informací v informačních zdrojích (např. plnotextové nebo bibliografické databáze); vyhledávání informací probíhá obvykle na základě konkrétního požadavku uživatele za pomoci dotazovacích a selekčních jazyků“ [TDKIV] procesy, metody a postupy, používané k selektivnímu [ODLIS] vyhledání informací ze souboru dat
10.11.2006
Rešeršní strategie
4
Fáze vyhledávacího procesu Informační zájem Informační potřeba Informační požadavek Informační dotaz Hodnocení výsledků 10.11.2006
Rešeršní strategie
5
Obecné schéma vyhledávání informací [Sklenák, 2001, s. 9]
10.11.2006
Rešeršní strategie
6
Požadavky na ideální informační systém • minimalizace doby odezvy mezi zadáním dotazu uživatele a odpovědí systému • uchovávání užitečných údajů • účelné uživatelské rozhraní • souběžná práce více uživatelů s týmiž daty (resp. dokumenty) • trvalost uchovávání a minimalizace redundance dat • dotazovací jazyk blízký přirozenému jazyku • možnost zabezpečeného přístupu • co nejjednodušší vyhledávání s minimálními nároky na učení uživatele • efektivní přidávání, rušení a aktualizace dat (resp. dokumentů) • trvalá dostupnost bez jakýchkoliv časových omezení [Sklenák, 2001] 10.11.2006
Rešeršní strategie
7
Požadavky uživatelů na vyhledávání informací • • • • • • • •
zpětná vazba relevance extrahování informací multimediální vyhledávání efektivní vyhledávání filtrování informací „jazyková magie“ flexibilní a efektivní indexování distribuované vyhledávání
10.11.2006
Rešeršní strategie
[Sklenák, 2001] 8
Faktory, ovlivňující IR • jedinec, který informace hledá (information seeker)
• • • • •
úloha (task) vyhledávací systém obor (domain) nastavení/uspořádání (setting) výsledky vyhledávání (search outcomes) [Marchionini, 1998]
10.11.2006
Rešeršní strategie
9
Složky vyhledávacího systému [Marchionini, 1998, s. 39]
10.11.2006
Rešeršní strategie
10
Anglická terminologie • information seeking = hledání informací; zahrnuje analytické vyhledávání (analytical strategy) a intuitivní vyhledávání (browsing strategy)
• information searching = hledání informací; ekvivalent předchozího termínu
• information retrieval = vyhledávání informací; je součástí hledání informací • online retrieval, online searching, online hunting, information gathering, browsing • information seeking and information retrieval (zkr. IS&R) [Ingwersen, Järvelin, 2004] [Papík, 2000] 10.11.2006
Rešeršní strategie
11
Vztahy mezi klíčovými procesy vyhledávání
10.11.2006
Rešeršní strategie
[Marchionini, 1998]
12
Důležité otázky IR • pojem potenciální informace – informace potenciální hodnoty pro příjemce
• relevance a pertinence – relevance = vlastnost vztahu mezi dotazem uživatele a jednotlivým dok. jako prvkem množiny všech nalezených dok.; systémová relevance – pertinence = subjektivní kategorie
• přesnost a úplnost – přesnost = jak velká část nalezených dok. je relevantní – úplnost = jak velká část relevantních dok. byla vyhledána – Jsou navzájem protichůdné 10.11.2006
Rešeršní strategie
13
Přesnost a úplnost
ideální poměr mezi P a R
reálný funkční vztah mezi P a R
[Kowalski, 1997 , cit. dle Papík, 2001] 10.11.2006
Rešeršní strategie
14
Chování uživatele při vyhledávání informací • informační chování – lidské chování ve vztahu ke zdrojům a kanálům informací
• chování při hledání informací – účelné hledání informací, vzniká jako následek potřeby splnit určitý úkol
• chování při vyhledávání informací – mikroúroveň chování zapojená U při interakci s inf. systémy všech druhů
• chování při využití informací – začleňování nalezené informace do poznatkového fondu (znalostní báze) [Wilson, 2000] 10.11.2006
Rešeršní strategie
15
Hierarchie způsobů chování při inf. aktivitách dle Wilsona
[Škrna, 2002] 10.11.2006
Rešeršní strategie
16
SPECIFICKÉ OTÁZKY IR • základní strategie vyhledávání [Marchionini, 1998] – analytické vyhledávání – browsing
• použité vyhledávací prostředky – komerční služby – vyhledávací služby na internetu • generace vyhledávání (dávkové, interaktivní dialogové, dynamické) • dostupnost inf. zdroje (přímo – veřejný charakter, zprostředkovaně – internet jako metoda přístupu, komerční) 10.11.2006
Rešeršní strategie
17
Analytické strategie • systematické strategie, zaměřené na cíl • strategie a taktiky profesionálních zprostředkovatelů • smyslem maximalizovat efektivitu vyhl. a minimalizovat náklady na online vyhledávání • důkladné poznání systému a jeho možností (dotazovacího jazyka, ceny za jednotl. služby, ovládání pokročilých možností) 10.11.2006
Rešeršní strategie
18
Browsing (intuitivní vyhledávání) • neformální strategie • přizpůsobivá, závislá na inf. prostředí • přirozený a efektivní přístup (koordinuje fyzické, emocionální, a kognitivní zdroje člověka) • zahrnuje prohlížení, pozorování, navigování a monitorování
10.11.2006
Rešeršní strategie
19
Komerční vyhledávací služby • práce s profesionálními informačními zdroji • DBC – práce se zdroji shromážděnými do jednoho místa (el. prostoru) – nutné navázat smluvní vztahy, platby za služby (předplatné, pay-as-you-go) – nyní i pro neprofesionály (web rozhraní), bez znalosti dotaz. jazyka – základní, pokročilé vyhledávání
• různé druhy DB – dle druhu dokumentu – dle druhu obsažených údajů 10.11.2006
Rešeršní strategie
20
Koncový x konečný uživatel • koncový uživatel – pracuje se systémem samostatně, bez zprostředkovatele – získané informace dále zpracovává a využívá pro své výzkumy nebo jiné činnosti – inf. specialista, který pracuje se systémem za účelem obsluhy konečného U
• konečný (finální) uživatel – formuluje informační požadavek – nezatěžuje se problematikou inf. systému a způsobu vedení dialogu – zpracování požadavku provádí inf. pracovník samostatně (konečný U může a nemusí být přítomen) 10.11.2006
Rešeršní strategie
21
Vyhledávání na internetu • vyhledávací služby – startovní body pro většinu U – patří mezi nejnavštěvovanější servery internetu
• kategorie vyhledávání – browsing (listování stránkami www) – starting points (startovní body) – search engines (vyhledávací nástroje)
• základní skupiny – vyhledávací stroje – předmětové katalogy
• pracovní cyklus – formulace dotazu; realizace vyhledávání; obdržení seznamu výsledků; prohlédnutí výsledků, výběr dokumentu pro download; download dokumentu; hodnocení dokumentu [Sklenák a kol.,2001] 10.11.2006
Rešeršní strategie
22
Vyhledávací služby • vyhledávací stroje (search engines) např. Altavista – indexují slova nebo termíny, které se vyskytují v dokumentech na www – problém: velké množství vrácených výsledků
• předmětové katalogy např. Yahoo – klasifikují dokumenty i celé servery podle předem dané taxonomie nebo předmětové klasifikace – vhodné použít při vyhl. dobře klasifikovatelných inf. – problémy: zda je kategorie vytvořena, malá úroveň pokrytí • rozdíly mizí – vytváření portálů -> integrace, usnadnění přístupu U k základním informačním službám internetu 10.11.2006
Rešeršní strategie
23
Vyhledávací strategie • obecné vyhledávání - pokud ví uživatel o tématu velmi málo • specifické vyhledávání – uživatel naopak zná téma velmi dobře
• inkrementální vyhledávání – vyhledávání po krocích • řetězcové vyhledávání – spočívá v nalezení více klíčových slov najednou
• vyhledej-a-skoč – rychlá dvoukroková vyhledávací technika • kategoriální vyhledávání – konvenční prohlížení (browsing) k tematické oblasti
• vyhledej-a-seřaď – metoda nalezení nejvhodnějšího nejdříve • kombinace různých metod vyhledávání 10.11.2006
Rešeršní strategie
[Sklenák a kol., 2001]
24
Srovnání vyhledávacích strategií
10.11.2006
Rešeršní strategie
25
[Sklenák a kol., 2001, s. 314]
Doporučená literatura k prostudování • MAKULOVÁ, Soňa. Vyhĺadávanie informácií v internete : Problémy, východiská, postupy. 1. vyd. Bratislava : EL&T, 2002.376 s. ISBN 80-88812-16-X. • PAPÍK, Richard. Vyhledávání informací I. Umění či věda? Národní knihovna. 2001, roč. 12, č. 1, s. 18-25. ISSN 1214-0678. • PAPÍK, Richard. Vyhledávání informací II. Uživatelské rozhraní a vlivy oboru „human-computer interaction“. Národní knihovna. 2001, roč. 12, č. 2, s. 81-90. ISSN 1214-0678. • PAPÍK, Richard. Vyhledávání informací III. Dialogové služby světových databázových center. Národní knihovna. 2002, roč. 13, č. 1, s. 20-30. ISSN 1214-0678. 10.11.2006
Rešeršní strategie
26
Doporučená literatura k prostudování • PILECKÁ, Věra. Kognitivní aspekty procesu vyhledávání informací. Ikaros [online]. 2006, roč. 10, č. 9 [cit. 200611-08]. Dostupný na World Wide Web:
. URN-NBN:cz-ik3592. ISSN 1212-5075. (popř. diplomová práce uložená v ISDP) • SKLENÁK, Vilém a kol. Data, informace, znalosti a Internet. Vyd. 1. V Praze : C.H. Beck, 2001. xvii, 507 s. (C.H. Beck pro praxi). ISBN 80-7179-409-0.
10.11.2006
Rešeršní strategie
27
Použité zdroje (1) • INGWERSEN, Peter. Information Retrieval Interaction. London : Taylor Graham, 1992. x, 246 s. ISBN 0-947568-54-9. Dostupné také z WWW: . • INGWERSEN, Peter; JÄRVELIN, Kalervo. Information Retrieval in Context. In Information Retrieval in Context, SIGIR 2004 IRiX Workshop, 29th July 2004, Sheffield, UK [online]. c2004 [cit. 2005-1018]. Dostupné z www: . • MAKULOVÁ, Soňa. Vyhĺadávanie informácií v internete : Problémy, východiská, postupy. 1. vyd. Bratislava : EL&T, 2002.376 s. ISBN 8088812-16-X. • MARCHIONINI, Gary. Information seeking in electronic environments. New York, Cambridge : University Press. 1998, xi, 224 s. ISBN 0-521-58674-7.
10.11.2006
Rešeršní strategie
28
Použité zdroje (2) • PAPÍK, Richard. Dialogové vyhledávání a služby v kontextu člověk – počítač. Praha, 2000. 117 s. + 2 příl. Dizertační práce. Univerzita Karlova v Praze, Filozofická fakulta, Ústav informačních studií a knihovnictví 2000. Školitel Marie Königová, oponenti Vladimír Smetáček, Rudolf Vlasák. • PAPÍK, Richard. Vyhledávání informací I. Umění či věda? Národní knihovna. 2001, roč. 12, č. 1, s. 18-25. ISSN 1214-0678. • REITZ, Joan M. ODLIS : Online Dictionary of Library and Information Science. Westport (CT) : Libraries Unlimited, 2004-04-30 [cit. 2005-11-06]. 800 s. Dostupný také online z WWW: . ISBN 1591580757. • SKLENÁK, Vilém. Vyhledávání informací v internetu. In Informační studia a knihovnictví v elektronických textech I. : Interaktivní modulární výukový systém na podporu informačního a knihovnického vzdělávání [CD-ROM]. 1. vyd. Praha : Ústav informačních studií a knihovnictví FF UK, 2001 [cit. 2006-03-12]. 10.11.2006
Rešeršní strategie
29
Použité zdroje (3) • SKLENÁK, Vilém a kol. Data, informace, znalosti a Internet. Vyd. 1. V Praze : C.H. Beck, 2001. xvii, 507 s. (C.H. Beck pro praxi). ISBN 80-7179-409-0. • ŠKRNA, Jindřich. Interaktivní vyhledávání informací. Národní knihovna, 2002, roč. 13, č. 1, s. 7–19. ISSN 1214-0678. • TDKIV - Česká terminologická databáze z oblasti knihovnictví a informační vědy (báze KTD) [online]. Praha : Národní knihovna České republiky, Odbor knihovnictví, c2002- [cit. 2005-11-06]. Dostupné z WWW: . • WILSON, T. D. Human information behavior. Informing science, 2000, vol. 3, no. 2, s. 49-55. Special Issue on Information Science Research. Dostupný také z WWW: . ISSN 1547-9684.
10.11.2006
Rešeršní strategie
30