TESTY A RECENZE Zahraniční vyhledávače a Seznam
Google versus zbytek světa Synonymem pro vyhledávání je pro většinu uživatelů „googlování“. Jenže ani Google není stoprocentně úspěšný. Náš test vám ukáže, že v mnoha případech prokázala jeho konkurence při vyhledávání lepší výsledky. A jak si mezi ostatními vyhledávači stojí „náš“ Seznam? Andreas Hentschel, Petr Kratochvíl
V tomto článku najdete Šest vyhledávčů pod drobnohledem Vyhledávací technologie zítřka Tipy pro lepší výsledky ve vyhledávání Seznam versus Google nternet roste hodinu od hodiny. Průzkum britské internetové společnosti Netcraft, provedený v červnu tohoto roku, ukázal, že internet je tvořen 122 miliony webových serverů – to představuje v porovnání s předchozím měsícem přírůstek o další čtyři miliony. Reálná „velikost“ internetu je však zřetelnější, podíváme-li se na počet webových stránek: podle odhadů jich existuje 500 bilionů! Je tedy logické, že nic nemůže fungovat bez dobrého vyhledávacího nástroje, především pokud si uvědomíte, že obsah se čas od času mění. Nejen blogy a videoportály se ze statického média proměnily v médium dynamické, které bombarduje vyhledávací technologie novými „výzvami“. Vyhledávače musí analyzovat stále se zvyšující množství typů dat.
I
Povolání: Hledač Od vyhledávacích nástrojů se očekává, že budou pracovat spolehlivě, protože 78
vyhledávání je pro většinu uživatelů nejdůležitější internetovou „aplikací“. Pro ilustraci: 80 procent surfařů pátrá na internetu pomocí vyhledávacích nástrojů, místo aby se pokusili napsat do okna browseru přímo URL. A protože naprostá většina surfařů vyhledává pomocí Googlu, chtěli jsme zjistit, zda jejich neotřesitelná důvěra v něj je oprávněná. Proto jsme Google porovnali s dalšími pěti vyhledávači. Kromě Googlu byly do testu zahrnuty další dva velké vyhledávače, Yahoo a Microsoft‘s Live Search, a dále vyhledávače Ask.com a Seekport. Pro částečné srovnání jsme přidali i český Seznam. VÝSLEDKY VYHLEDÁVÁNÍ
Google nastavuje standard, Microsoft je daleko za ním To nejdůležitější můžeme prozradit hned v úvodu: Google je světovou jedničkou právem. Žádný jiný z testovaných vyhledávačů totiž nenabízel kvalitativně srovnatelné výsledky. To ale neznamená, že by jeho konkurence byla tak špatná, jak naznačují tržní čísla: v oblasti vyhledávání videí a novinek dopadl například Ask.com lépe
než Google. Naprostým zklamáním je pak Microsoft‘s Live Search. V rámci testování jsme každý vyhledávač „nakrmili“ množstvím anglických dotazů. Desetkrát jsme vždy napsali obecné vyhledávací dotazy a pětkrát po sobě jsme vyhledávali zprávy, obrázky a videa.
Neodhalená včelka Mája V oblasti obecných termínů je Google neporazitelný. Abychom uvedli pár příkladů: chcete-li vyhledat „weather in Merching“, objeví se v Googlu předpověď počasí mezi prvními výsledky! Dotaz na „download Firmware Plextor PX-716“ je odměněn přímým linkem na webové stránky Plextoru, „15.66 dolarů v eurech“ zobrazí současný výměnný kurz. V rozporu s tímto „dokonalým výsledkem“ Googlu nás někteří jiní účastníci testu zavedli na scestí: místo počasí v Merchingu jsme například přistáli na stránkách dobrovolných hasičů (Ask.com), místo firmwaru jsme obdrželi spam, místo výměnného kurzu nám byly nabídnuty finanční zprávy. Google trochu klopýtal v případě výrazů týkajících se akcií a energetických tarifů (v tomto případě nabídl lepší výsledky server Yahoo). Žádný z vyhledávačů však neuspěl při vyhledávání odpovědi na naši k | CHIP.CZ | ŘÍJEN 2007
Kde hledají Češi k důležitou otázku: „Jak se jmenuje voják ve Včelce Máje?”
Obrázky s překvapením Google na nás zapůsobil i v případě vyhledávání obrázků – nabídl dostatečně uspokojivé výsledky u každého z našich pěti termínů. Zato ostatní „hráči“ předvedli pěkné faux pas: například Ask nedokázal vyhledat ani „iPhone“ od Applu, ani CD obal „Soundso“. Yahoo a Live Search nedodaly žádný výsledek při hledání uměleckého díla od dvojice Gilbert & George „Are You Angry or Are You Boring“. Seekport nám ušetřil spoustu námahy – vyhledávání obrázků nenabízí vůbec! Seekport ignoruje také videa. Naproti tomu Ask, Live Search a Google se v této oblasti od sebe liší pouze nepatrně. Google očividně poskytuje přednostní péči svému videoportálu YouTube, kvůli čemuž jsme mu srazili pár bodů. V ostatních ohledech však kvalita výsledků kolísá v závislosti na vyhledávaném výrazu. Všechny tři výše jmenované vyhledávače nás při napsání „White Stripes Icky Thump“ nasměrovaly na nové album americké rockové skupiny. Dokonce ani reklama „Apple 1984 Superbowl“ nebyla pro toto trio problémem; pouze u posledního hledání byly výsledkové seznamy téměř prázdné. Obrovským zklamáním pro nás byly prázdné seznamy při vyhledávání videa na Yahoo – zde očividně extrémně častý jev. V ostatních oblastech byl server Yahoo rychlý a zapůsobil na nás například svým vyhledáváním v novinkách. Za Googlem zaostává pouhých pár kroků. Při vyhledávání „novinek“ dodává nejlep-
Česká republika patří mezi úzkou skupinu „vyvolených zemí“, ve kterých Google není jedničkou na trhu. O důvodech by se dalo zdlouhavě spekulovat, ale jednoznačně mezi ně patří špatná „jazyková vybavenost“ českých surfařů a také dobrý start Seznamu. Není to tak dávno, co pro většinu českých „surfařů začátečníků“ platilo pravidlo: Seznam = internet. Obecně lze říci, že za poslední tři roky se situace na českém „koláči vyhledávačů“ příliš nezměnila. Seznam si stále drží téměř dvoutřetinový podíl, mírně roste podíl Googlu a k nule klesá podíl ostatních portálů. Jak se zdá, jedinou nadějí Atlasu, Centrumu nebo Jyxa je spolupráce, a je nutné podotknout, že se jí nebrání ani Seznam. Zprávou letošního léta bylo ohlášení spolupráce Atlasu a Seznamu. Právě posledně jmenovaný dodá svůj vyhledávací engine Atlasu (http://seznam.pr.sblog.cz/2007/ 08/01/314). Bude zajímavé sledovat, zda Seznam alespoň částečně eliminuje technický náskok Googlu a nabídne zkušenějším uživatelům něco zajímavého. Podíl vyhledávačů na českém internetu 5%
7 % Ostatní
Centrum
25 % Google
63 % Seznam Zdroj: Navrcholu.cz
ší výsledky Ask.com. Vyhledávač je sice zákeřně ukryt v záložce pod blog search, nicméně jakmile ho objevíte, rychle najdete hledanou zprávu. Live Search
Seznam vs Google Zatímco Google je světovou jedničkou, u nás vládne „pevnou rukou“ Seznam. Ze zvědavosti jsme tedy do přehledu zařadili i jeho „schopnosti“. Už na první pohled je vidět, že z hlediska vyhledávání (především z hlediska rozsahu) a nabízených funkcí je Seznam světelné roky vzadu. To je ale pochopitelné – konec dominance Seznamu u nás (v oblasti komplexního vyhledávání) je pouze otázkou času. Seznam sází spíše na další služby a weby (Lidé, Novinky, Práce, Bazar…), které mají do budoucna lepší šance. Jak tedy obstojí Seznam v přímém srovnání s Googlem? Pro celou řadu uživatelů je Seznam symbolem hledání na českém internetu a jeho vyhledávání pro ně nemá konkurenci. Bohužel, naše výsledky tuto teorii nepotvrdily. Oběma vyhledávačům jsme položili 10 českých „dotazů“ a výsledky ŘÍJEN 2007 | CHIP.CZ |
obou byly minimálně srovnatelné. V několika případech byl Google dokonce mnohem lepší. Například při zadání „dáda patrasová“ Seznam překvapivě nenašel „dádiny“ oficiální stránky, o chloupek horší výsledky měl i v několika dalších případech. Pokud ale hodláte smazat Seznam ze svých záložek a vrhnout svou zvědavost na Google, děláte chybu. Síla Seznamu je v napojení na své další (lokální) služby. Ideální ukázkou je zadání hesla „riegrovy sady“. Na Seznamu nenajdete jen informaci o parku v Praze, ale také přímý link na vyhledání službou Mapy.cz. Když k tomu přidáte praktické náhledy vyhledaných stránek, neexistuje prozatím závažný důvod přecházet u „českého hledání“ na Google. Možností, kterými by Seznam mohl „okořenit“ své vyhledávání je celá řada, otázkou pouze zůstává, zda na to bude mít čas a sílu…
k nám ani v této oblasti prakticky nenabídl žádné použitelné výsledky pro vyhledávané výrazy. FUNKCE
Příliš mnoho nátlaku, příliš málo voleb Každý z vyhledávačů nabízí ohromné množství vyhledaných stránek. To může být na přijatelnou úroveň omezeno pouze pomocí filtrů či použitím komplikovanějších dotazů. Obecnými standardy vyhledávacích nástrojů jsou logické operátory (AND, OR, NOT). U většiny testovaných kandidátů je také nabízeno vyhledávání zúžené na jednotlivé jazyky či na časové období (viz tabulka). U vyhledávačů Live Search a Seekport jsme postrádali volbu pro vyhledávání rozdílných typů dokumentů. U Googlu a Yahoo může být totiž hledání omezeno například na soubory ve Wordu, Excelu či PDF. Je s podivem, že pouze malé vyhledávače nabízejí velice příjemnou funkci náhledu webových stránek. Ask a Seekport zobrazí výsledek přímo na stránce vyhledávače – pomocí jednoho kliknutí, takže si člověk může vytvořit rychlý dojem, zda stránka bude prospěšná, či nikoliv. Řešení v „Asku“ je výjimečné: jakmile uživatel přemístí ukazatel myši na link, je zde náhled zobrazen jako malý pop-up. Na tomto webu nás také potěšil „videopřehled“. Jako jediný totiž tento vyhledávač zobrazí (na pár sekund) náhled klipu, jakmile na obrázek náhledu najedete k ukazatelem myši.
o PLACENÁ INZERCE
Videa & clustering: Vyhledávací mantra budoucnosti Tradiční vyhledávače se brzy ocitnou v důchodu, pokud se web bude rozrůstat v tomto měřítku. Vyhledávání videí a obrázků a také získávání co možná nejpřesnějších výsledků nabývá stále více na důležitosti. A právě co nejpřesnější výsledky chtějí nabízet i vyhledávače další generace. Clusty.com je metavyhledávač, který vyhledává v Yahoo, Asku a dalších vyhledávačích a výsledky předtřídí do skupin (klastrů). Neurčitý anglický dotaz například na „Paris“ se může stát přesnějším po kliknutím na klastr (skupinu), který roztřídí výsledky na město, módu, restaurace či hotely. Deset tisíc vyhledaných položek je tedy zobrazeno ve skupinách s jasnými seznamy přesných výsledků. Po zadání pojmu „riegerova stezka“ můžete najít jak textové informace, tak i přímo obrázky či fotogalerii této perly Pojizeří. Blinkx je specializovaný videovyhledávač, jehož tvůrci tvrdí, že již zaindexoval 12 milionů klipů. Vyhledávač analyzuje nejen jméno a adresu souboru, ale také samotná videa včetně označení (tagů) videa. Blinkx analyzuje i titulky, zvuk a také skrytá metadata. Mister Wong je virtuální, „umělý“ vyhledávač. Původní myšlenkou jeho zakladatelů bylo ukládat záložky na internetu (místo lokálně na PC), a to včetně popisů a hodnocení. Nyní tuto službu využívají tisíce lidí (jejichž záložky jsou ukládány veřejně), což vytváří poměrně zajímavý základ pro specifický vyhledávač. V současné době katalog obsahuje dva miliony záložek.
| CHIP.CZ | ŘÍJEN 2007
k
BEZPEČNOST
Cookies: Dobré pro obchod, špatné pro uživatele Je velice jednoduché dostat se na pochybné webové stránky. Proto je lepší, když vás sám vyhledávací nástroj upozorní na nebezpečné weby nebo odstraní pornografii ze seznamu výsledků. Vyhledávač Googlu je v tomto ohledu nejbezpečnější. Vítěz testu vás například varuje před stránkami v seznamu, které jsou podezřelé z šíření malwaru, což nenabízí žádný jiný vyhledávač. U většiny vyhledávačů (tedy kromě Live Search a Seekportu) můžete maximálně nastavit tříúrovňový filtr, který dokáže z výsledků odfiltrovat erotický obsah. Rozhodující bod: tyto rozšířené bezpečnostní funkce můžete používat pouze v případě, že akceptujete cookies – ačkoliv to lze technicky vyřešit i jiným způsobem. Důvodem je zde především zájem o přesné uživatelské profily. Protože my však zastáváme spíše rozumnější, účelnější přístup k datům, musíme za toto řešení body odečíst.
UŽITEČNÉ VAROVÁNÍ: Google upozorňuje na weby, které jsou známé šířením malwaru…
OVLÁDÁNÍ
Dobře maskováno: Pozor na placené odkazy Vyhledávače jako Google a Ask nemohou být v žádném případě překonány z hlediska jednoduchosti. Jejich webová stránka je prázdná – kromě vyhle-
dávacího pole a záložek pro vyhledávání obrázků, novinek a zboží. Kritickým okem posuzujeme především označování inzerátů. Většina vyhledávačů označuje placené odkazy nenápadnými barvami. Čas od času jsou však tyto barvy tak světlé, že jsou na špatně kalibrovaných monitorech nezřetelné. Seekport je jiný (nikoliv však lepší) – reklamu od ostatního obsahu odlišuje grafikou, což ovšem sponzorované odkazy spíše skryje… Další funkce jsou u většiny vyhledávačů snadno použitelné, snad kromě jediné výjimky: Live Search slibuje nápovědu k funkcím, ta ale chybí… Na druhé straně Google a Yahoo mají mimořádně rozsáhlou dokumentaci. Ti, kteří zde stráví hodně času, mohou získat lepší výsledky. Například na Yahoo jsme našli tip na pomoc u služby „Answers“, kde další uživatelé zodpovídají otázky. Zde jsme se také zeptali na již zmiňované jméno mravenčího vojáka ze seriálu Včelka Mája a do tří minut jsme dostali odpověď: jeho jméno je Paul Emsig.
TESTY A RECENZE Zahraniční vyhledávače a Seznam VÍTĚZ TESTU 10/2007
1.
Pořadí Vyhledávač URL Jazyk Celkové hodnocení
MÍSTO
2. MÍSTO
3. MÍSTO
4. MÍSTO
5. MÍSTO
Google
Yahoo
Ask
Live Search
Seekport
Seznam
www.google.com
search.yahoo.com
www.ask.com
www.live.com
www.seekport.co.uk
www.seznam.cz
čeština
angličtina
angličtina
angličtina
angličtina
čeština
80
64
64
53
35
■
Hodnocení
■
Vyhledávání (50 %)
73
57
56
50
19
Služby (25 %)
83
73
82
63
39
■
Bezpečnost (15 %)
90
55
50
40
55
■
Ovládání (10 %)
90
90
80
60
80
■
■
Vyhledávání Celkové
75%
65%
38%
38%
20%
■
Obrázky
76%
36%
48%
66%
0%
■
Novinky (News)
80%
78%
94%
48%
50%
■
Video
50%
35%
63%
63%
0%
■
Funkce (vyhledávání) V novinkách/obrázcích/videu
●/●/●
●/●/●
● /● /●
● /● /●
●/■/■
■
V blozích/RSS/zboží
●/●/●
● /● /●
■
/●/
●/■/■
■ ■
V typech dokumentů
10 typů (PDF, Excel, Word, RTF, Flash…)
/ /● 6 typů (PDF, Excel, Word, PPT, XML TXT…)
„jen pro video (avi, mpg, wmv)“
■
■
■
42 jazyků
38 jazyků
6 jazyků
42 jazyků
■
■
S využitím logických operátorů
●
●
●
●
●
■
V zadané doméně
●
●
●
●
■
●
ano (podle času, obrázky podle velikosti a barvy)
ano (podle času, obrázky podle velikosti a barvy)
jen videa (podle délky)
Celá řada možností (podle data, relevance…)
■
■
Náhledy výsledků vyhledávání
■
■
●
●
●
●
Cache
●
●
●
●
■
●
Překlady
mnoho kombinací
„anglicky/německy/ francouzsky“
„jen německy/ anglicky“
■
■
■
Nástroje
obrovské množství
nic zajímavého
náhledy výsledků
hledání webů odkazující na zadanou adresu
vyhledávání v encyklopediích
hledání v encyklopediích, náhledy vyhledaných webů
iGoogle s historií hledání a s personalizovaným hledáním…
My Yahoo (mimo jiné s ukládáním záložek…)
My Ask (mimo jiné s ukládáním hlední a záložek…)
Windows Live Favorites pro ukládání záložek
■
Pouze po vytvoření uživatelského účtu
■
weby s erotickým obsahem oddělené…
filtr pro citlivý obsah (jen zapnuto/vypnuto)
■ ■
■
/●/
■
/ /●
Podle stáří dokumentu V jiných jazycích
Další funkce Třídění výsledků
Personalizování vyhledávání
Bezpečnost Filtr pro nevhodný obsah Varování před malwarem Nutnost cookies
3 úrovně filtru Safe Search
Family Filter (jen zapnuto/ zobrazuje varování, výsledky vypnuto) lze třídit
●
■
■
■
■
■
pro personalizované vyhledávání a filtr obsahu
pro personalizované vyhledávání a filtr obsahu
pro personalizované vyhledávání a filtr obsahu
pro personalizované vyhledávání
■
■
velmi rozsáhlá, detailní informace bez videa, jinak dobré…
velmi rozsáhlá, detailní informace dobré
přehledné, ale příliš stručné… bez videa, jinak dobré…
přehledné, nápověda pro neeexistující funkce velmi dobré
stručná, ale kompletní
poněkud komplikovaná,
reklama označená pochybně
velmi dobré
Ovládání Nápověda Přehledné zobrazení výsledků
Špičková třída (100-90) Vyšší třída (89-75) Všechna hodnocení v bodech (max. 100)
Střední třída (74-41)
Nelze doporučit (40-0)
● ano
■
ne
Šéf Googlu Eric Schmidt: Nejlepší vyhledávač je ten, který se konfiguruje sám Jak se udržet na vrcholu? Neustálým zlepšováním kvality nabízených služeb. Každý internetový uživatel má v každém okamžiku možnost svobodné volby a může se velmi rychle rozhodovat… Frekvence Googlu z hlediska inovací je velmi vysoká – je to vaše priorita? Klíčový pojem je personalizované vyhledávání: nejlepší vyhledávač by se měl „konfigurovat“ sám a to je přesně to, čeho chceme prostřednictvím iGooglu dosáhnout. Důležitá je také univerzálnost: Google chce místo specifického oddělování jednotlivých vyhledávačů
82
výsledky kombinovat. Například na dotaz „I have a dream“ nabídne Google odkaz na Wikipedii (kde je tento citát vysvětlen) spolu s textem řeči Martina Luthera Kinga a pochopitelně i s odkazem na původní videozáznam z roku 1963. „Google Apps“ je praktická kancelář na webu. Chcete jít cestou Microsoftu? Ne. Google Apps (ve spojení s Google Calendar) je zaměřen především na praktické sdílení – a to nejen dokumentů. Uživatelé tak mohou – ať jsou kdekoliv na světě – pracovat na jednom dokumentu současně.
Kdy očekáváte, že se vám vrátí investice 1,65 miliardy USD do YouTube? Nebojíte se, že vám v blízké budoucnosti uživatele „ukradne“ IP TV? Až doposud jsme se soustřeďovali na blaho uživatelů, což je základ našeho finančního úspěchu a také nového obchodního modelu. Pokud jde o IP TV, my silně věříme především v komunitní přístup. A právě YouTube je největší videoserver na webu, s trvale rostoucí návštěvností, tudíž se neobávám, že fascinace serverem YouTube by měla v blízké době opadnout. Ptali jsme se CEO Googlu Erika Schmidta
| CHIP.CZ | ŘÍJEN 2007
SHRNUTÍ: Zahraniční vyhledávače Vyhledávací tipy ✔ Typy dokumentů Pokud hledáte konkrétní informaci, může vám vyhledávání usnadnit volba typu souboru. Například volba xls, pdf nebo doc může podstatně zmenšit objem výsledků a zrychlit nalezení hledaných údajů…
✔ Blokování malwaru a erotiky Nejen při vyhledávání informací o celebritách a programech můžete ve výsledcích najít spoustu odkazů na porno, nebo weby s malwarem. Většina z vyhledávačů ale nabízí filtry, které dokáží tyto výsledky odfiltrovat, nebo vás alespoň varovat před nebezpečnými stránkami. ✔ Hledání videa V současné době je vyhledávání videa hitem číslo 1. Bohužel, indexace videosouborů je mnohem obtížnější než indexace webů – především proto, že u velkého množství souborů se kromě názvu nemůžete dozvědět nic o obsahu videa. Proto lze v této oblasti doporučit použití specializovaných služeb.
ŘÍJEN 2007 | CHIP.CZ |
JAK JSME TESTOVALI Prověřili jsme 5 internetových vyhledávačů, vždy v anglické verzi. Při testování jsme pochopitelně kladli největší váhu na schopnost vyhledávání. Analyzovali jsme výsledky 25 anglických dotazů (obecné, video, obrázky a hledání novinek) položených každému portálu. Druhým nejdůležitějším kritériem byly nabízené služby – více schopností znamenalo lepší bodové hodnocení. V oblasti bezpečnosti jsme přihlédli k schopnostem filtrů nebo varování před nebezpečným obsahem. Hodnotili jsme také, k jakým funkcím musíte mít zapnuty cookies. Nápověda a přehlednost vyhledávání pak byly posledním bodem hodnocení. 10 % Ovládaní
Tři nejlepší
VÍTĚZ TESTU 10/2007
1 Google Jednička světového trhu je jednoznačným vítězem testu. Výborné výsledky vyhledávání spolu s širokou škálou funkcí mu zajistily snadné vítězství. www.google.com
2 Yahoo Horší výsledky při hledání obrázků a videa mírně narušily celkově kladný dojem z dobrého hledání ve všech ostatních oblastech. http://search.yahoo.com
50 % Vyhledávání
3 Ask
15 % Bezpečnost
Ask.com je poněkud nespravedlivě ve stínu větších vyhledávačů. Existuje mnoho věcí, ve kterých by se Yahoo a Google mohly od tohoto webu učit – především u vyhledávání videa a prohledávání blogů. www.ask.com 25 % Služby
83