TÝDEN ČTVRTÝ Tento týden se v rámci tématu vyhledávání informací ve stručnosti zaměříme na možnosti, jak vyhledávat na internetu. Na závěr se můžete těšit na informace o tzv. neviditelném webu. Dříve než začnete vyhledávat informace, je třeba si ujasnit následující body.
1. Proč informaci chcete? Než začnete informaci vyhledávat, měli byste vědět, k čemu ji potřebujete. Zvažte, za jakým účelem informaci získáváte – potřebujete ji ke zkoušce, k přípravě seminární práce nebo je snad vašim motivem hlubší zájem o daný obor? To, za jakým účelem informaci vyhledáváte, určí zaměření a rozsah potřebných informací. 2. Co potřebujete vědět? Je dobré přesně definovat tematickou oblast a všechna příbuzná témata. Čeho se téma týká? Jaké jsou nosné pojmy a pojetí? Pomůžou vám poznámky z přednášek či sylaby k předmětu. Zde najdete seznam literatury k tématu – což je výborný klíč ke zdrojům, které i váš vyučující považuje za relevantní k danému tématu. 3. Jakými klíčovými slovy lze téma definovat? Určete si hlavní okruhy, klíčová slova a slovní spojení související s tématem. Příliš obecné pojmy vás povedou k velkému objemu informací a ty příliš specifické je neúměrně omezí. 4. Kdy budete informaci potřebovat? Víte, kdy budete konkrétní informaci potřebovat? Sbírání informací může být velmi časově náročnou činností, proto je důležité si vše dobře naplánovat…
Studenti si často myslí, že při psaní práce do školy si vystačí s prvními odkazy, které se zobrazí při zadání jednoduchých klíčových slov do Google.
INTERNET JAKO ZDROJ INFORMACÍ Pro vyhledávání na internetu neexistuje žádný univerzální návod a někdy k uspokojení vašeho informačního požadavku stačí místo pečlivé přípravy a složitě naformulovaného dotazu tzv. „nástřel od boku“. Proto je dobré vždy zvážit, jaký druh informací hledáte, a tomu přizpůsobit volbu vhodného vyhledávacího nástroje (každý vyhledávač se v technice dotazování poněkud liší) a nakonec zadat adekvátní dotaz. Špatně naformulovaný dotaz může mít za následek vyhledání velkého množství dokumentů či naopak není nalezeno nic. Problém ale nemusí být vždy na straně zadavatele dotazu, mnohdy je příčinou též samotná vyhledávací služba – nedostatečné databázové pokrytí či způsob indexace. Jak již bylo dříve řečeno, základem vyhledávání je vědět co vlastně hledáme. Nejen k tomu, ale i k následnému sestavení vyhledávacího dotazu nám poslouží klíčová slova. Podívejme se, jak se k nim správně dopracovat.
Definice klíčových slov K formulaci rešeršního požadavku musíte nejprve vytvořit skupinu klíčových slov. Snažte se přitom dodržovat následující pravidla:
vynechejte STOP slova = předložky, spojky - pro spojení klíčových slov je nepotřebujete
vynechejte přísudky, přídavná jména, slovesa - netýká se pojmů, které zlepšují identifikaci dotazu: Hilbertův prostor)
snažte se používat výhradně podstatná jména, která jsou důležitá pro úspěšné vyhledávání
Při vytváření skupiny klíčových slov berte v úvahu i synonyma pro vyhledávání důležitých pojmů a nadřazené/podřazené termíny. Ty využijete zejména při následném rozšiřování popř. zužování výsledku. Nebojte se při definování Nadřazený pojem klíčových slov použít slovník synonym nebo slovníky odborných databází, které vám s podobnými pojmy poradí. Information retrieval
Základní pojem
Searching
Synonyma - Search Strategy - Searching Methods -
Podřazené pojmy Zkuste si sami vytvořit podobnou sadu klíčových slov. Zvolte si jakékoliv vlastní téma a k němu minimálně 3 nadřazené, podřazené pojmy a synonyma.
Browsing Search Engine Online Searching Offline Searching
INTERNET – ZADÁVÁNÍ DOTAZU Dotaz, kterým budete chtít potřebné informace vyhledat, se bude lišit podle výběru vyhledávacího nástroje. Zatímco ve fulltextových vyhledávačích můžete zadávat dotazy v podobě přirozené řeči, databáze odborných informací tuto funkci stále nenabízí.
Spojování jednotlivých klíčových slov Když máte správně zvolená klíčová slova a znáte prostředí konkrétního vyhledávače, můžete začít formulovat dotaz. Jediným způsobem, jak při vyhledávání spojovat klíčová slova, je použití tzv. operátorů. Ty vám umožní nejen pojmy spojit, ale také vyjádřit mezi nimi vztahy nebo některá slova z vyhledávání vyloučit. Ne vždy jsou však tyto operátory podporovány a je důležité seznámit se s možnostmi, které daný zdroj nabízí.
Booleovské operátory Vyjadřují vztah mezi dvěma vyhledávanými prvky.
AND
• vyhledají se všechny pojmy • vhodné pro spojení významově odlišných slov • využívá se pro zúžení výsledků vyhledávání
Microsoft AND Windows
OR
• vyhledá se alespoň jeden z uvedených pojmů • vhodné pro spojení synonym • využívá se pro rozšíření výsledků vyhledávání
Microsoft OR Windows
Microsoft NOT Windows
NOT
• pojem uvedený za operátorem bude z výsledků vyhledávání vyloučen • využívá se pro zúžení výsledků vyhledávání
Proximitní operátory Mimo booleovské operátory existují ještě tzv. proximitní operátory. Zatímco booleovské vyjadřují vztahy mezi jednotlivými pojmy, proximitní operátory vyjadřují jejich vzájemnou vzdálenost.
NEAR - uvádí požadovanou vzdálenost, v jaké od sebe mají být jednotlivé pojmy uvedeny. Např. systém NEAR spolehlivost, systém N2 spolehlivost
WITHIN - určuje, v jaké vzdálenosti od sebe mohou jednotlivé pojmy být, pojmy budou vyhledány v tom pořadí, jak byly zapsány Např. spolehlivost WITHIN2 systém
ADJACENT – vyhledané výrazy spolu budou sousedit bez ohledu na pořadí, v jakém byly zadány Např. Havel ADJ Ivan
FOLLOWED BY – užívá se pro spojení sousedících slov, záleží na pořadí, v jakém byla zadána. Např. Evropská FOLLOW BY banka
FRÁZE – vyhledává výrazy v přesném pořadí, jako jsou zadány Např. „spolehlivost systému“
SENTENCE – zadané výrazy se budou vyskytovat ve stejné větě Např. European S economic recesion
PARAGRAPH – zadané výrazy se budou vyskytovat ve stejném odstavci
Pozor! Ne všechny vyhledávací systémy používání operátorů podporují, příp. mohou mít operátory v různých vyhledávačích různé formy (např. jeden vyhledávač používá formu NEAR, jiný tvar N). Je proto dobré si u každého vyhledavače problematiku operátorů nastudovat zvlášť. Operátory můžete použít i pro vyhledávání v databázích (odborným databázím se budeme věnovat další týden).
Zástupné znaky Pokud si nejste jisti pravopisem slova nebo se nechcete omezit pouze na jeden z jeho tvarů, můžete použít zástupné znaky.
Pro nahrazení jednoho písmene se používá znak „?“ Např. filo?ofie – nalezne pojem ve verzi filosofie i filozofie pro libovolný počet znaků i celé slovo se uplatňuje znak „*“ Např. ekonom* - vyhledá různé tvary slova ekonomie, ekonomický, ekonomka, ekonomem, … Nemůžete si vzpomenout, který z bratrů Saudkových je tvůrcem komiksů? Pokud zadáte * Saudek, vyhledávač vám najde oba a u popisu jednoho z vyhledaných odkazů si můžete přečíst, že Kája Saudek je „nejvýznamnější český komiksový tvůrce,…“1
Když si nejste jistí, jakým přesným pojmem je to, co hledáte, označováno, při vyhledávání na Google můžete použít znak „~” a budou vyhledána i synonyma (zatím funguje pouze v angličtině).
1
Kája Saudek. In: KOMIKS aneb kreslený seriál... [online]. 2010 [cit. 2013-07-16]. Dostupné z: http://komix.kvalitne.cz/saudek.htm
INTERNET – POSTUP PŘI VYHLEDÁVÁNÍ Pro vyhledání informací můžete využít následující metody. Každá je vhodná pro jiný typ vyhledávání. Využijete je také v různých fázích vyhledávání. Strategie stavebních kamenů Identifikujete skupinu klíčových pojmů, které následně spojujeme pomocí operátorů. Dotaz se skládá z více samostatných dotazů. Dílčí dotazy formulujete pomocí předem určených klíčových slov. Ke spojení dílčích dotazů použijete operátor AND.
DOTAZ 1 - Searching OR Browsing OR Information Retrieval DOTAZ 2 - Internet OR Network OR World Wide Web OR WWW
VÝSLEDNÝ DOTAZ spojení obou předcházejících do jednoho pomocí operátorů
Strategie rostoucí perly
Strategie osekávání
Vyberete nejužší pojem, kterým začnete vyhledávat informace. Tento pojem při malém počtu výsledků zobecňujete.
Pro vyhledání formulujete obecnou, širší kategorii. Po prvním zobrazení a prohlédnutí nalezených výsledků použijete taktiky pro zúžení výsledků.
Prakticky to lze použít třeba takto: najdu si na internetu článek na téma, které mě zajímá. Pak se podívám, kdo je spoluautorem a zkusím si vyhledat, co napsal on.
Tohle používám velice často. Například když něco vyhledávám na internetu a následně se snažím některé stránky odfiltrovat pomocí operátoru NOT.
I když se na první pohled zdá, že dotaz přesně vystihuje vaši informační potřebu, může se stát, že množina výsledků bude příliš velká, nebo že požadovaná informace nebude nalezena. V tom případě využijte následujících tipů pro úpravu dotazu. Taktiky pro zúžení výsledků = našli jsme moc záznamů
zkombinujte více klíčových slov najednou používejte proximitní operátory operátorem NOT vylučte některé dokumenty dotaz vymezte na pole, ve kterém se má vyhledávat (název dokumentu, abstrakt) omezte typ dokumentu, který má být vyhledán dotaz omezte jazykově nebo časově
Taktiky pro rozšíření výsledků = našli jsme málo záznamů
použijte synonyma, jiné tvary slov použijte operátor OR pro vyhledání více výrazů najednou použijte zástupné znaky, krácení podle kořene slova, automatické vyhledávání příbuzných pojmů (stemming) využívá i Google použijte nadřazené nebo obecnější pojmy vynechejte předběžné omezení
CO JEŠTĚ VĚDĚT O VYHLEDÁVÁNÍ INFORMACÍ Nejdůležitější je uvědomit si, že každá služba má odlišné vyhledávací prostředí a nabízí jiné možnosti. Nejprve se s daným systémem seznamte a teprve poté jej využijte k vyhledávání. Nyní se podívejte ještě na pár rad, které je dobré mít na paměti.
Co je třeba si ještě uvědomit
Ne všechny WWW dokumenty je možné vyhledat pomocí vyhledávacích strojů, mnohé nejsou vůbec indexovány a nejsou ani součástí žádného předmětového katalogu.
Ani jeden vyhledávač nepokrývá víc než polovinu indexovaných dokumentů (používat proto pouze jeden vyhledávací stroj k úspěšnému vyhledávání nevede). Stroje kombinujte, popř. použijte metavyhledávače (např. Ask, Dogpile nebo Metacrawler) či tzv. souhrnné vyhledávací služby – na jedné webové stránce máte možnost zadat dotaz vybraným vyhledávacím službám.
Na specializované informace použijte specializované vyhledávače a informační zdroje.
Nebojte se rozšiřovat spektrum vyhledávacích služeb, které používáte. Čím větší spektrum služeb použijete, tím větší pravděpodobnost, že naleznete přesně to, co hledáte.
I když to vypadá, že máte správně naformulovaný dotaz, nezapomínejte ani na gramatiku, která může výrazně ovlivnit výsledky vyhledávání. Některé vyhledávací stroje dokážou sice chyby či překlepy odhalit – nelze na to však spoléhat.
První výsledek vyhledávání není zárukou kvality. Nebojte se vyhledávací dotaz upravovat podle výsledků vyhledávání. K tomu určitě využijete jednu z metod vyhledávání.
Kvalitou informací se budeme zabývat už příští týden. Autorsko-právní aspekty nás čekají až za týdny dva.
Mýty ohledně možností Internetu
„Na Internetu můžeme najít vše“ - všechny informace tímto způsobem dostupné nejsou!
„Vše, co najdeme na Internetu, můžeme jakkoli použít“ – určitě není pravda otázkám ochrany autorských práv se budeme věnovat v dalších týdnech. Pro začátek je třeba si uvědomit, že existují určitá etická pravidla a také Autorský zákon!
„Všechny informace na Internetu jsou pravdivé“ - v této síti může každý zveřejnit cokoliv, je třeba ověřit kvalitu zdroje, ze kterého čerpáme. O hodnocení zdrojů informací se dozvíte více v příštím týdnu. V tomto smyslu jsou věrohodnější tištěné dokumenty, jejichž obsah prochází před publikací vydavatelským procesem.
SOCIÁLNÍ SÍTĚ JAKO ZDROJ INFORMACÍ Protože internetové sociální sítě jsou široce využívanými službami a počet jejich uživatelů neustále roste, neměly by být opomenuty také jako zdroj informací. Internetové sociální sítě umožňují vytvářet svým uživatelům profily, sdílet informace, komunikovat spolu a spoustu dalších věcí. Mezi jejich uživateli můžete najít nejen své přátele, ale také spoustu odborníků či organizací věnujících se tématu, co vás zajímá a které se tedy vyplatí sledovat. Sociální sítě vám umožní najít a sdružovat se s lidmi, kteří se zajímají o podobná témata jako vy. Aktuální informace se mnohdy objeví rychleji na sociálních sítích, než v tradičních zdrojích. Zároveň se dosud pasivní příjemci informací mohou snadno zapojit do jejich tvorby, doplňovat je, aktualizovat, sdílet apod., a to vše v takřka reálném čase. Proti tradičním médiím mají sociální sítě nevýhodu v tom, že zveřejněná informace neprošla redakčním „filtrem“ a snadno se může stát, že je nesprávná, zavádějící či záměrně matoucí. Mnoho informací zveřejněných na sociálních sítích se pohybuje na hranici vkusu (např. brutální záběry obětí). Je proto potřeba informace umět zhodnotit např. z hlediska jejich relevantnosti a objektivity (toto se ovšem netýká pouze sociálních sítí. O hodnocení informací z různých zdrojů se dozvíte více v 8. týdnu). Pojďme se nyní podívat podrobněji na nejpopulárnější sociální sítě:
Facebook Facebook je momentálně nejpopulárnější online sociální sítí. Profil si u Facebooku nezřizují pouze osoby, ale také různé organizace. Zkuste se podívat, kdo všechno je na Facebooku z vašeho oboru! Určitě najdete množství stránek a skupin, k nimž se můžete přidat a sdílet své zkušenosti či diskutovat s lidmi, které zajímá stejné téma jako vás. Velice užitečná funkce pro vás může být vytváření seznamů zájmů, příp. odebírání příspěvků ze seznamů dalších uživatelů. Do seznamu zájmů můžete zařadit jak profily osob, tak facebookové stránky. Není nutné, abyste se stali fanoušky stránky nebo přítelem nějaké osoby, chcete-li si je přidat na svůj seznam. Na vaší zdi se vám zobrazí pouze vybrané příspěvky, ale pokud si rozkliknete příslušný seznam, objeví se vám všechno.2 Facebook také předvedl novou vyhledávací službu, umožňující uživatelům prohledávat obsah sdílený jejich přáteli. Zatím je služba dostupná pouze pro anglicky mluvící uživatele v omezené zkušební verzi.3 https://www.facebook.com Kdo ví, jestli na Facebooku najdu kromě knihoven VUT i nějaké hezké knihovnice …
2
Seznamy zájmů. In: Facebook [online]. © 2013 [cit. 2013-07-18]. Dostupné z: https://www.facebook.com/help/www/440058336033758/ 3 http://www.lidovky.cz/facebook-chce-konkurovat-google-ve-vyhledavani-na-siti-p1a-/media.aspx?c=A130115_191514_lnmedia_kim
Twitter Twitter je sociální síť zaměřená na službu tzv. mikroblogování. Publikované příspěvky, tzv. tweety, jsou omezené na 140 znaků. Informace tak dostáváte v zhuštěné podobě. Po registraci můžete snadno sledovat vybrané profily a jejich příspěvky se vám budou zobrazovat na vaší domovské stránce. Určitě zde naleznete nejen své známé, ale také spoustu odborníků z vašeho oboru! Pokud chcete vyhledávat tweety k určitým tématům, využijete přitom tzv. hashtagy. Jedná se o pojem spojený s dvojkřížkem # (např. #gramotnost), který Twitter označí jako odkaz, díky kterému můžete např. sledovat aktuální trendy a témata. Populární hashtagy na českém a slovenském Twitteru, stejně jako vyhledávání v archivu příspěvků, vám nabízí server www.klaboseni.cz. V archivu všech příspěvků můžete vyhledávat i bez nutnosti registrace na adrese http://search.twitter.com/. Služba nabízí i možnosti pokročilého vyhledávání či kombinaci vyhledávacích výrazů pomocí operátorů. Přímo na Twitteru vyhledáváte pomocí políčka Search. Začátečníci mohou najít přehledný návod k používání Twitteru na http://www.zdrojak.cz/redakce/jakzacit-pouzivat-twitter/ https://twitter.com/
Google + Internetová sociální síť provozovaná společností Google se za pouhé dva roky své existence stala počtem uživatelů momentálně druhou největší online sociální sítí. Účet na Google + můžete propojit se svým účtem na YouTube a s dalšími službami od firmy Google. V sociální síti Google + si své kontakty přidáváte a třídíte do tzv. kruhů. Kruhy představují skupinu osob, které mají něco společného a s nimiž chcete sdílet stejné informace (nutno upozornit, že také na Facebooku a Twitteru si můžete vytvářet seznamy přátel). Stejně tak si podle kruhů filtrujete informace, které chcete zobrazovat. Na Google + naleznete také komunity, k nimž se můžete přidat a stránky, které můžete sledovat. Pomocí tlačítka +1 můžete doporučovat webový obsah. Doporučování má vliv i na výsledky vyhledávání Google. Na Google plus můžete stejně jako na Twitteru používat hashtagy. Manuál nového uživatele: http://www.zive.cz/clanky/google-plus-v-kostce-manual-novehouzivatele/sc-3-a-157777/default.aspx https://plus.google.com
LinkedIn LinkedIn je profesní sociální síť. Najdete zde odborníky z celého světa a můžete si zde snadno vytvořit síť profesionálních kontaktů, kterou můžete využít nejen při snaze získat nějakou informaci či řešení určitého problému, ale také při hledání práce. Také zde existuje možnost skrze své kontakty oslovit odborníky, k nimž byste se jinak nedostali. Na LinkedIn nalezete i množství diskusních fór (LinkedIn Groups), v nichž nad odbornými i praktickými problémy diskutují profesionálové z celého světa. LinkedIn Groups se tak pro vás mohou stát dalším z užitečných zdrojů relevantních informací. Diskusní fóra, která by vás mohla zajímat, najdete v adresáři Groups Directory. Systém vám také navrhuje diskuse sám na základě informací, které jste vyplnili ve svém profilu. Diskusní fóra k určitému tématu můžete vytvářet i sami a zvát ostatní, aby se do nich zapojili.4 http://www.linkedin.com
YouTube YouTube je sociální síť zaměřená na sdílení videa. Můžete si zde vytvořit vlastní profil, videa nahrávat, sdílet a sledovat profily, jejichž videa vás zajímají. Kromě klipů svých oblíbených skupin, ukázek z filmů apod. zde můžete najít také nejrůznější návody, ukázky atd. Server spustil i službu EDU (http://www.youtube.com/education) zaměřenou na vzdělávání. Můžete zde shlédnout přednášky a lekce od odborníků z celého světa. Své účty tu má například Massachusetts Institute of Technology a Harvard. Videa jsou roztřízena nejen podle stupně vzdělání, ale také podle oborů.5 http://www.youtube.com
4
Na YouTube se dají najít i některé přednášky z VUT. Ale když tam zrovna přednášku, kterou jsem nestihla, nenajdu, můžu se podívat, jak to učí třeba na MIT.
Groups - Getting Started. In: LinkedIn [online]. © 2013 [cit. 2013-07-18]. Dostupné z: http://help.linkedin.com/app/answers/detail/a_id/1164 5 Začněte si vzdělávání užívat. In: YouTube pro vzdělávání [online]. © 2013 [cit. 2013-07-18]. Dostupné z: http://www.youtube.com/t/education
Quora Zajímavým zdrojem informací pro vás bezesporu může být Quora, což je web vyloženě zaměřený na kladení a zodpovídání otázek. A ptát se můžete prakticky na cokoli. Mezi množstvím uživatelů se pravděpodobně nalezne někdo, kdo bude schopen vaši otázku zodpovědět. Po registraci a přihlášení si vyberete témata, která vás zajímají (např. Mathematic, Science, …) a poté na svém profilu můžete sledovat nekončící proud konverzací plných zajímavých informací. Otázky jsou kategorizovány podle témat, klíčových slov a kvality, jakou jim přisoudili uživatelé (otázky, ale především odpovědi jsou ostatními uživateli hodnoceny). Quora podporuje Facebook i Twitter, otázky i odpovědi můžete publikovat i v těchto sociálních sítích.6
Příspěvky a komentáře se sociálních sítí lze vyhledat už i s pomocí Google.
Pro vyhledávání obsahu sociálních sítí se dá dále použít vyhledávač Qwant, který vyhledává v sociálních sítích, na webu, ve zprávách i v obchodech a ve výsledku zobrazí několik domén současně
6
BEDNÁŘ, Vojtěch. Quora – nová cesta k otázkám a odpovědím?. In: Lupa.cz [online]. 2011 [cit. 2013-07-19]. Dostupné z: http://www.lupa.cz/clanky/quora-nova-cesta-k-otazkam-a-odpovedim/
INTERNET – NEVIDITELNÝ WEB Vyhledávání pomocí vyhledávacích strojů, popř. předmětových katalogů, má své meze. Jejich nevýhodou je to, že jsou schopny zachytit jen tu část webu, která je tzv. na povrchu – „povrchový web“, tu část, kterou lze oindexovat. Celkový web ovšem představuje daleko větší prostor, který je robotům běžných vyhledávacích strojů skryt. Některé zdroje uvádí, že velikost neviditelného webu je asi 500x větší než toho běžně dostupného. Důležité je také zmínit fakt, že informace získané z neviditelného webu bývají kvalitnější a hodnotnější než z webu „viditelného“. Které informace najdeme v prostředí neviditelného webu?
dokumenty vyžadující k přístupu heslo - jen pro registrované uživatele dokumenty vyloučeny správcem serveru k identifikaci robotem dokumenty zabezpečeny Firewally – slouží k ochraně počítače před „zásahy“ zvenčí dokumenty v jiných formátech – ne všechny vyhledávače zvládají indexovat všechny typy souborů vygenerované stránky na základě dotazu (např. stránka z katalogu knihovny)
Co se týče těch knihovních katalogů tak věřte, že to není pravda na 100%. Přijdete na to, která česká knihovna má katalog indexovaný v Google? Nebo je jich víc? Podělte se s kolegy na diskuzním fóru.
Výše uvedené dokumenty a webové stránky představují vesměs veřejné neplacené zdroje. Mezi další zdroje, které v sobě ukrývá neviditelný web, řadíme databáze (univerzitní, knihovní, firemní, vládní apod. - hodnotné zdroje). Mnohé z nich jsou předmětem prodeje a za jejich použití se musí výrobci platit (obvykle jsou nakoupeny institucí formou licence – např. univerzitou – a bezplatně přístupné svým členům – pracovníkům a studentům).
Problematika „neviditelného webu“ je zde popsána velice stručně. Pokud vás toto téma zajímá, podívejte se na odkazy, které naleznete v Moodle.
Kromě přímých cest lze prostor Neviditelného Webu zkoumat prostřednictvím specializovaných vyhledávacích služeb - brán: Complete Planet http://aip.completeplanet.com Scirus http://www.scirus.com