WEBOVÉ VYHĽADÁVAČE
ICSED3 – informatika Gymnázium Kráľovnej pokoja, Žilina
Mgr. Miroslav Malacha
Komunikácia prostredníctvom IKT
webové vyhľadávače Vyhľadávače sú servery, na ktorých vyhľadáva obrovské množstvo ľudí. Obsahujú veľkú databázu stránok, avšak nielen ich adries (ako je to pri katalógoch), ale aj celkový obsah stránok a preto umožňujú vyhľadávanie v celom texte webových stránok, nielen v ich adrese a popise. Sú to automatizovane systémy, ktoré fungujú na základe určitých pravidiel a vzorcov. Ani jeden vyhľadávač neprehľadáva po zadaní kľúčového slova celý internet v reálnom čase. Ak by to robil, trvalo by to veľmi dlho, a nie zlomok sekundy, za ktorý sa zobrazia výsledky.
základná činnosť vyhľadávačov Pri práci fulltextových vyhľadávačov môžeme hovoriť o štyroch základných činnostiach: 1. Crawling - prechádzanie po jednotlivých stránkach, pomocou automatizovaných programov, nazývaných tiež "spider", alebo "bot". 2. Indexácia - ako „spider“ prechádza po web stránkach, ukladá získané informácie do databázy. Ak sa stránka nachádza vo výsledkoch vyhľadávania, znamená to, že sa nachádza v databáze niektorého vyhľadávača a hovoríme tomu, že web stránka je zaindexovaná. 3. Spracovanie vyhľadávania - keď užívateľ zadá do vyhľadávača slovo alebo frázu, program "vytiahne" z databázy zoznam webov, na ktorých sa hľadaný výraz alebo slovo nachádza. 4. Zoradenie výsledkov vyhľadávania - vyhľadávače priradzujú web stránkam dôležitosť, na základe množstva faktorov. Medzi základné faktory patria - obsah, počet spätných odkazov, sémantika dokumentu a najnovšie aj rýchlosť načítania stránky. Algoritmus, ktorý zabezpečuje zoradenie výsledkov, nepozná žiadny web designer, takže nik vám nemôže 100%-ne garantovať prvé miesta vo výsledkoch vyhľadávania.
základné rozdelenie vyhľadávačov
Fulltextové vyhľadávače Katalógové vyhľadávače Hybridné vyhľadávanie Meta vyhľadávače
Fulltextové vyhľadávače Fulltextové vyhľadávače fungujú nezávisle ako napr. Google alebo v rámci katalógových vyhľadávačov. Fulltexty vytvárajú svoj index (databázu stránok, v ktorej hľadajú odpoveď hľadania) automaticky. Ich programy, zvané aj boty (bot - skratka robot) automaticky prehľadávajú web, kopírujú prejdené stránky do svojho indexu a na základe prehľadania tejto databázy prezentujú výsledky. Výsledky vyhľadávania na fulltextových vyhľadávačoch preto nikdy neodrážajú aktuálny stav stránky, ale taký aký bol v čase posledného kopírovania webstránky do indexu. Rôzne vyhľadávače aktualizujú svoj index v rôznych časových intervaloch. Niektoré slovenské a české fulltexty ako napr. Jyxo ( u nás implementovaný napr. v čoraz obľúbenejšom Zoohoo ) tvrdia, že aktualizujú svoj index každý deň príp. do 48 hodín. Google potrebuje na zaradenie nových informácií aj niekoľko týždňov a pri Altaviste nie je výnimočné čakať aj tri mesiace, kým zaradí Vašu stránku do svojho indexu. Z tohto dôvodu si je treba uvedomiť, že optimalizácia webstránok je dlhodobá záležitosť a trvá istý čas, kým sa zmeny urobené na stránke prejavia vo výsledkoch vyhľadávania.
Katalógové vyhľadávače (Katalógy) Na rozdiel od fulltextov, v katalógoch zahrnuté výsledky závisia iba od vloženého popisu stránky. Do katalógu vložíte krátky popis opisujúci celú vašu webstránku alebo to za vás urobia redaktori daného katalógu. Následne, vyhľadávač hľadajúci v katalógu zobrazí výsledky z výsledkov stránok nachádzajúcich sa v katalógu. Zmena Vašej skutočnej webstránky teda neovplyvní výsledky vyhľadávania na katalógovom vyhľadávači.
Správne vloženie webstránky do katalógov je veľmi dôležité, a môže rozhodnúť o Vašom úspechu pri tomto druhu vyhľadávania.
Hybridné vyhľadávanie - súčasná prax portálov V začiatkoch internetu bývalo fulltextové a katalógové vyhľadávanie striktne oddelené. V súčasnosti je bežnou praxou veľkých vyhľadávacích portálov kombinovanie oboch druhov vyhľadávania. Bežným postupom býva základné prioritné zobrazenie výsledkov vyhľadávania z katalógu nasledované výsledkami z fulltextu. Užívateľ má však možnosť voľby a čoraz väčšej obľube sa tešia čisto fulltextové vyhľadávače, čoho dôkazom je aj celosvetový úspech Google.
Meta vyhľadávače Na rozdiel od fulltextových či katalógových vyhľadávačov, meta vyhľadávače sami neprehľadávajú ani nekatalogizujú web. Výsledky vyhľadávania sú zväčša kombináciou hľadania pomocou viacerých vyhľadávacích služieb naraz. Zaujímavou pridanou hodnotou býva i automatické výsledné clustrovanie (tematické zatriedenie odkazov). Výborným príkladom na tento inovatívny prístup môžu byť napr. meta-vyhľadávače: Vivisimo alebo grafickým spracovaním výsledkov unikátny Kartoo.
Indexovanie - spracovanie dát do databázy Každý vyhľadávač si spracúva nazbierané informácie po svojom. Najčastejšie si vypisuje všetky slová, počíta ich váhu a dáva ich do relácie s adresou stránky. Váha - dôležitosť Pri hľadaní slova zaradí vyhľadávač ako prvé adresy stánok, na ktorých má hľadané slovo veľkú váhu. Ako sa váha počíta? Alebo ako sa pozná, či je slovo pre stránku charakteristické? Predovšetkým tak, že sa dané slovo vyskytuje v titulku stránky, v kľúčových slovách , v popise a v nadpisoch. Je nutné poznamenať, že každý vyhľadávač to počíta inak. Page Rank (PR) Vyjadruje niečo ako vierohodnosť alebo dôležitosť stránky. V google sa počíta podľa toho, koľko stránok danú stránku odkazuje - čím viac, tým lepšie PR. Navyše odkazy zo stránok s vyšším PR majú väčšiu váhu. Google PR (GPR) sa počíta postupným prepočítavaním. Existuje na to vzorec.
Niektoré vyhľadávače Google Yahoo Altavista Jyxo Zoznam Visivimo Kartoo MSN Lycos Webcrawler Vsevedko Azet Best
Niektoré vyhľadávacie príkazy pre Google podpora znaku "*" (hviezdička), ktorý zastupuje ľubovoľný počet znakov a umožňuje nájsť aj to, čo neviete ako sa volá, "výraz v úvodzovkách" - nájde presnú frázu tak ako je v úvodzovkách napísaná, site: napr. nieco site:www.stranka.sk vyhľadá "nieco" iba na stránkach v rámci domény www.stranka.sk, písať bez medzery, filetype: napr. nieco filetype:pdf vyhľadá "niečo" iba v súboroch s príponou pdf. K dispozícii sú momentálne tieto typy súborov: pdf, xps, doc, xls, ppt, rtf, Kalkulačka – do vyhľadávacieho boxu vložíme matematický výraz a stlačíme „enter“, funkcia define: niečo - do vyhľadávacieho boxu vložíme hľadaný výraz, ktorého definíciu vyhľadávač napíše po stlačení „enter“
Úlohy na samostatnú prácu: vyhľadajte minimálne 5 svetových a 5 slovenských vyhľadávačov, okrem tých o ktorých sme hovorili a napíšte ich do dokumentu, pomocou úvodzoviek napíšte do google „vaše priezvisko“ a dajte tento výraz vyhľadať, urobte snímku obrazovky a tento obrázok vložte do dokumentu, pomocou funkcie define: vyhľadajte definíciu výrazov informatika, data, údaj a IP adresa – porovnajte si ich so susedom, tieto definície skopírujte do dokumentu v textovej forme, napíšte rozdiel medzi Vašim vyhľadaním a vyhľadaním suseda, vyhľadajte pomocou vhodného nástroja ľubovoľný výraz nachádzajúci sa iba na jednej ľubovoľnej stránke, urobte snímku obrazovky a tento obrázok vložte do dokumentu, ľubovoľný výraz dajte vyhľadať do dvoch rôznych vyhľadávačov a porovnajte jeho umiestnenie v jednom a druhom vyhľadávači, urobte snímku obrazoviek a obrázky vložte do dokumentu, vytvorený dokument uložte vo Vašom počítača do priečinka „Moje dokumenty“, vložte ho ako prílohu do emailu a odošlite na moju emailovú adresu.
ĎAKUJEM ZA POZORNOSŤ