T1 Vybrané kapitoly počítačových sítí
C3 Vyhled ávání na Internetu Vyhledávání 1. 2. 3. 4.
Vyhledávače Katalogy Vyhledávací centrály Metavyhledávače
2
C3 Vyhledávání na Internetu
Cíle cvičení 1. Vysvětlit princip a podstatu fungování jednotlivých způsobů vyhledávání na Internetu. 2. Charakterizovat internetové vyhledávače. 3. Zdůraznit zvyšující se význam vyhledávačů při hledání odpovídajících informací na Internetu.
3
Vyhledávače
Vyhledávače Využívají metodu plného textu
(fulltext). Technologie vyhledávače zahrnuje tři stupně: 1. Vyhledávací robot prochází sítí po hypertextových odkazech a navštěvuje webové stránky. Na dříve navštívené stránky se vrací v určitých intervalech, nebo pracuje nepřetržitě.
Vyhledávače
4
2. Všechno, co robot najde, je uloženo v databázi (indexu). Index obsahuje každé slovo z navštívených stránek a informace o jeho výskytu na stránce (frekvence, umístění a další údaje). Při změně webové stránky je index po další návštěvě robota na stránce aktualizován.
Vyhledávače
5
3. Vyhledávač (vyhledávací program) po zadání dotazu prochází index, aby našel slova shodná s klíčovými slovy uvedenými v dotazu. Po jejich nalezení předloží uživateli soupis webových stránek obsahujících požadovaná klíčová slova.
6
Vyhledávače
Vyhledávací robot Program opakovaně vykonávající nějakou
rutinní činnost na Internetu. Obvykle sbírá data, odesílá a zpracovává požadavky na služby. Každý vyhledávač má vlastního robota. Usnadňuje orientaci v množství informací nacházejících se na Internetu. Umožňuje velmi podstatné zkrácení doby vyhledání odpovědi na dotaz. Označuje se také spider, crawler nebo bot.
7
Vyhledávače
Vyhledávače Všechny hlavní vyhledávače pracují na stejném principu (rozdíly jsou v jednotlivostech a jejich vyladění). Zpravidla pracují s jedním indexem. Poskytují dva způsoby prohlížení indexu: základní vyhledávání (využívá některé zautomatizované postupy), pokročilé vyhledávání (postupy jsou plně pod kontrolou uživatele). Nejznámější vyhledávače Atlas, Centrum, Jyxo, Morfeo, Seznam, … Alta Vista, Bing, Google, Yahoo!, …
8
Vyhledávače
Princip vyhledávání uživatel
dotazovaný server
WWW
dotaz
vyhledávač
odpověď
databáze vyhledávací robot
9
Katalogy
Katalogy Adresy webových dokumentů jsou uspořádány
do kategorií. Tematicky setříděné seznamy s hierarchickou strukturou. Nejvyšší úroveň představují obecné kategorie
(Kultura, Internetové obchody, Počítače, Zdraví, …).
Podkategorie druhé úrovně jsou méně obecné a vedou
od nich odkazy na další nižší úrovně.
Hledání ¨ průchod kategoriemi od nejvyšší
úrovně, dokud neobjevíme stránku vyhovující naší informační potřebě. Kvalita katalogů ¨ rozhodují administrátoři (vytvářejí strukturu katalogu, zařazují do nich webové stránky přihlašované jejich původci).
10
Katalogy
Výhody a nevýhody Výhody Díky hierarchické struktuře se může uživatel, který přesně neví, co chce nalézt, poměrně snadno dopracovat k výsledku. Nevýhody Kvůli značnému podílu ruční práce je velikost značně omezena. Každý katalog má jinak strukturované skupiny odkazů. Časová náročnost. Platnost/neplatnost odkazů (lze zčásti odstranit jejich automatizovanou kontrolou).
11
Katalogy
Nejznámější katalogy Zahraniční Galaxy, Google adresář, Open Directory Project, Yahoo! Directory, … České Seznam, Centrum, Atlas, caramba!, …
12
Vyhledávací centrály
Vyhledávací centrála Umožňují použití
konkrétní vyhledávací služby podle výběru uživatele. Samostatná služba, nebo součást jiné služby. Příklady
Alenka
Odskok
(www.alenka.cz), (www.odskok.cz/sluzby/robot.php).
13
Metavyhledávače
Metavyhledávače Využívají většího počtu vyhledávačů a katalogů
zapojených do synchronního vyhledávání. Podstata činnosti Uživatelův dotaz převedou do podoby, které vybrané
nástroje rozumějí. Přeložený dotaz odešlou předem vybraným nástrojům, ty porovnají své databáze s dotazem a výsledky hledání odešlou zpět metavyhledávači. Metavyhledávač vyřadí duplicity a zbývající záznamy uspořádá do soupisu podle volitelných kritérií, zpravidla podle relevance nebo podle jednotlivých použitých vyhledávacích nástrojů.
14
Metavyhledávače
Princip vyhledávání uživatel
metavyhledávač
WWW
rozesílací agent rozhraní mechanismus vyhledávače
dotaz A
B
C
…
Z výsledky
výsledky
agent rozhraní zobrazovací mechanismus
verifikace výsledků
15
Metavyhledávače
Příklady www.metacrawler.com
www.mamma.com
www.webcrawler.com
info.com
16
C3 Vyhledávání na Internetu
Úkoly do samostudia 1. Objasněte princip vyhledávání informací na Internetu. 2. Charakterizujte vyhledávače. 3. Vysvětlete rozdíl mezi katalogovým a fulltextovým vyhledáváním informací. 4. Charakterizujte metavyhledávače.