Bankovní institut vysoká škola Praha a.s. Katedra matematiky, statistiky a informačních technologií
Optimalizace webových stránek pro fulltextové vyhledávače Diplomová práce
Autor:
Bc. Aleksandar Antonovič Informační technologie a management
Vedoucí práce:
Praha
Ing. Vladimír Beneš
Duben, 2011
Prohlášení: Prohlašuji, že jsem diplomovou práci zpracoval samostatně a v seznamu uvedl veškerou použitou literaturu. Svým podpisem stvrzuji, že odevzdaná elektronická podoba práce je identická s její tištěnou verzí, a jsem seznámen se skutečností, že se práce bude archivovat v knihovně BIVŠ a dále bude zpřístupněna třetím osobám prostřednictvím interní databáze elektronických vysokoškolských prací.
V Praze, dne 18. dubna 2011
Bc. Aleksandar Antonovič
Poděkování: Rád bych tímto poděkoval svému vedoucímu diplomové práce Ing. Vladimíru Benešovi za podporu, konzultace a cenné rady, které mi s velikou ochotou poskytl. Dále bych chtěl poděkovat celé katedře matematiky, statistiky a informatiky, stejně tak jako svým kolegům ve společnosti BIVŠ, a.s. za cenné informace a dlouhodobou spolupráci v budování dobrých výsledků v oblasti internetového marketingu. Děkuji také své rodině za jejich neustálou podporu, pochopení a zájem o mé studium na Bankovním institutu vysoké škole.
V Praze, dne 18. dubna 2011
Bc. Aleksandar Antonovič
Anotace: Cílem diplomové práce je popsat problematiku vyhledávání webových stránek, jejich hodnocení fulltextovými vyhledávači a představit čtenářům moderní metody optimalizace webových stránek vedoucí k dosažení prvních pozic ve výsledcích vyhledávání. Důraz je kladen jak na přirozené procesy budování zpětných odkazů, tak i na různé možnosti placených reklam na internetu. V diplomové práci je věnován prostor podrobné analýze současného stavu webu společnosti BIVŠ. Výsledkem jsou konkrétní návrhy jak dosáhnout lepších výsledků při vyhledávání a zvýšit tak návštěvnost webu této soukromé vysoké školy.
Annotation: The aim of this thesis is to describe the problematic of the websites, their underlying ranking by the Search Engines and to provide readers with modern methods of Search Engine Optimization for achieving the first positions in Search Engine Result Pages. The emphasis is placed on core processes of linkbuilding as well as the use of wide range of options in paid advertisement on the internet. A part of this thesis is devoted to a detailed analysis of the BIVŠ current website status. The results of the analysis provide concrete suggestions on how to achieve better ranking results on the Search Engine Results Pages as well as the increase in visitor traffic on this private college website.
Obsah 1
Úvod .............................................................................................................................. 8
2
SEO – Search Engine Optimization ........................................................................... 9 2.1
SEO vs. SEM ........................................................................................................ 10
2.2
Vyhledávače.......................................................................................................... 11
2.3
Katalogový vyhledávač......................................................................................... 12
2.4
Fulltextové vyhledávače ....................................................................................... 14
2.5
Pavouci a roboti .................................................................................................... 15
2.6
Historický vývoj katalogů a vyhledávačů ve světě ............................................... 17
2.7
Historický vývoj katalogů a vyhledávačů v ČR ................................................... 20
2.8
Historický vývoj SEO v období od 1994 do 2010 ................................................ 22
2.9
Hodnocení webových stránek vyhledávači ........................................................... 23
2.9.1
Anchor text..................................................................................................... 23
2.9.2
Zpětné odkazy ................................................................................................ 24
2.9.3
PageRank ....................................................................................................... 25
2.9.4
S-Rank............................................................................................................ 27
2.9.5
JyxoRank........................................................................................................ 27
2.9.6
Tematičnost.................................................................................................... 27
2.9.7
Důvěryhodnost ............................................................................................... 28
2.10 Tržní podíly vyhledávačů v České republice ........................................................ 28 2.11 Tržní podíly vyhledávačů ve světě ....................................................................... 31 3
Zdrojový kód .............................................................................................................. 32 3.1
Klíčová slova ........................................................................................................ 33
3.1.1
Výběr klíčových slov ...................................................................................... 34
3.1.2
Hustota klíčových slov ................................................................................... 35
3.2
Tagy ve zdrojovém kódu ...................................................................................... 37
3.2.1
Titulek ............................................................................................................ 37
3.2.2
Description .................................................................................................... 39
3.2.3
Keywords ....................................................................................................... 40
3.2.4
Nadpisy a jejich velikosti H1 až H6 .............................................................. 40
3.2.5
Tagy strong a em ........................................................................................... 41
3.2.6
Atributy alt a title v popiscích obrázků.......................................................... 41
3.3
4
5
6
Domény a www adresy ......................................................................................... 41
3.3.1
Duplicity URL ................................................................................................ 43
3.3.2
Přesměrování je lék ....................................................................................... 43
3.3.3
Chybové stránky ............................................................................................ 44
3.3.4
Sitemap – mapa stránek................................................................................. 46
Linkbuilding – budování zpětných odkazů ............................................................. 48 4.1
Kupování zpětných odkazů ................................................................................... 49
4.2
Výměna odkazů .................................................................................................... 49
4.3
Registrace do katalogů .......................................................................................... 50
4.4
Microsites.............................................................................................................. 52
4.5
Sociální sítě ........................................................................................................... 53
4.6
Linkbaiting ............................................................................................................ 54
4.7
Důležité faktory pro vyhledávače ......................................................................... 54
4.8
Praktiky budování zpětných odkazů ..................................................................... 55
PPC aneb reklamní kampaně na internetu ............................................................. 57 5.1
Google AdWords .................................................................................................. 57
5.2
Sklik ...................................................................................................................... 58
5.3
Pozice inzerátů a jejich klikanost .......................................................................... 60
5.4
Etarget ................................................................................................................... 60
Analýza stavu domény www.bivs.cz ........................................................................ 62 6.1
Analýza zdrojového kódu ..................................................................................... 63
6.2
Google Analytics .................................................................................................. 67
6.3
Další kroky při optimalizaci webu www.bivs.cz .................................................. 72
6.3.1
Návštěvy ......................................................................................................... 72
6.3.2
Atraktivní stránky .......................................................................................... 72
6.3.3
Odkazující stránky ......................................................................................... 73
6.3.4
Vyhledávače ................................................................................................... 73
6.3.5
Klíčová slova ................................................................................................. 73
6.3.6
Zpětné odkazy ................................................................................................ 74
7
Závěr ........................................................................................................................... 76
8
Seznam použité literatury ......................................................................................... 77 8.1
Tištěná literatura ................................................................................................... 77
8.2
Internetové zdroje ................................................................................................. 77
8.3
Seznam obrázků .................................................................................................... 78
8.4
Seznam tabulek ..................................................................................................... 79
1 Úvod WWW (World Wide Web) – celosvětová pavučina se začala splétat v listopadu roku 1990, kdy byl uveden do provozu první webový server ve výzkumném ústavu CERN ve Švýcarsku. V té době neexistovaly a ani nebyly zapotřebí internetové vyhledávače, jelikož se obsah celého internetu dal přečíst za pár hodin. Dnes je všechno jinak, často měnící se algoritmy předních fulltextových vyhledávačů z SEO (Search Engine Optimization) dotvořily jeden z plnohodnotných oborů internetového marketingu. Důkazem toho je počet nejen existujících, ale právě prosperujících společností, zabývajících se poradenstvím a outsourcingem v oblasti SEO a SEM (Search Engine Marketing). O jejich důležitosti bezesporu svědčí i otevření pracovní pozice Specialista online marketingu, kterou na Bankovním institutu vysoké škole, a.s. zastávám. To umožňuje, abych v této diplomové práci podrobněji představil SEO a SEM jako nástroje pro zvýšení relevantní návštěvnosti webu společnosti BIVŠ – www.bivs.cz. Cílem této diplomové práce je seznámit čtenáře s problematikou vyhledávání stránek a jejich hodnocením fulltextovými vyhledávači, poukázat na novodobé trendy, provést analýzu současného stavu webu www.bivs.cz a navrhnout další kroky vedoucí k lepšímu umístění této domény na výsledkových stránkách hledání na fulltextových vyhledávačích. Začátek diplomové práce se věnuje základním informacím o internetových vyhledávačích a katalozích, jejich fungování a samotných počátcích. Následuje vysvětlení základních principů SEO s důrazem na on-page a off-page faktory. Práce se dále zabývá provedenými analýzami současného stavu domény www.bivs.cz. Závěr práce je věnován návrhům dalších kroků optimalizace webových stránek Bankovního institutu vysoké školy, a.s.
8
2 SEO – Search Engine Optimization SEO, neboli optimalizace webových stránek pro fulltextové vyhledávače, lze velmi zjednodušeně definovat jako soubor navzájem na sebe navazujících aktivit, jejichž úkolem je umožnit umístění daných optimalizovaných stránek na předních pozicích ve výsledcích vyhledávání. Zatímco v počátcích internetu nebylo potřeba toto mnohdy složité a časově náročné uzpůsobování stránek praktikovat, nyní nastává doba, kdy se SEO stává nezbytností k samotnému úspěchu v byznysu. Tento trend má na svědomí rychle rostoucí počet internetových prezentací v informačním světě WWW (World Wide Web). Máme-li tedy společnost, prezentující se na internetu jako soukromá vysoká škola poskytující služby v podobě bakalářského studia, navazujícího magisterského studia, studia MBA a dalších kurzů celoživotního vzdělávání, budeme logicky usilovat o to, aby se po zadání klíčové fráze „vysoká škola“ do internetových vyhledávačů umístila na předních pozicích, respektive dosáhla co možná nejlepšího výsledku. Na obrázku 2.1 je vidět jak nám www.google.com po vyhledání dané klíčové fráze nabídl přibližně 1 820 000 výsledků hledání. Vyhledávač www.seznam.cz nám jich nabídl 7 884 332 (obrázek 2.2). Obrázek 2.1: Výsledek hledání klíčové fráze „vysoká škola“ na www.google.com
Zdroj: http://www.google.cz/#sclient=psy&hl=cs&source=hp&q=vysok%C3%A1+%C5%A1kola&aq=f& aqi=g5&aql=&oq=&pbx=1&fp=8455eb0b9322c343
9
Obrázek 2.2: Výsledek hledání klíčové fráze „vysoká škola“ na www.seznam.cz
Zdroj: http://search.seznam.cz/?sourceid=szn-HP&thru=&q=vysok%C3%A1+%C5%A1kola
SEO tak i ve velmi silném konkurenčním prostředí, jakým je internet, pomáhá dostat webové prezentace na první pozice stránek s výsledky hledání – SERP (Search Engine Result Page). Jakkoliv komplikované se můžou aktivity SEO procesu zdát, jejich cíl je naopak velmi prostý a jasný – nárůst počtu relevantních návštěv optimalizovaného webu.
2.1 SEO vs. SEM V současné době se výraz SEO často mylně zaměňuje s výrazem SEM. I přes to, že spolu velmi úzce souvisí, je důležité si uvědomit, že tyto dva pojmy mají různé významy. SEO je jednou ze základních a nejdůležitějších aktivit SEM. Zatímco se SEO zabývá optimalizací stránek za účelem lepšího umístění stránek ve výsledcích přirozených hledání, SEM je proces mnohem komplexnější. Search Engine Marketing vedle SEO zahrnuje širokou paletu aktivit, které společnost může provádět za účelem propagace svých webových stránek, včetně placených zápisů, sponzorovaných odkazů, bannerů a ostatních podob reklamy, dostupných nejen na internetových vyhledávačích a katalozích. Search Engine Optimization tedy můžeme chápat jako proces navazování přátelství mezi webovou stránkou a internetovými vyhledávači. Tento proces se obejde bez dalších investic do reklamy, či sponzorovaných odkazů, které mohou zařídit, aby se naše webová
10
stránka objevovala mezi prvními ve výsledcích hledání. Právě naopak, spoléhá se na přirozené zatraktivnění stránek pro internetové vyhledávače, aby docházelo k jejich zobrazení vysoko ve výsledcích hledání. Mezi techniky takového procesu patří: tvorba zpětných odkazů, efektivní výběr klíčových slov, využívání META tagů a map webových stránek (sitemap), smysluplných webových adres (URL) apod.
2.2 Vyhledávače Internetové vyhledávače jsou interaktivní služby, jež umožňují uživatelům najít webové stránky či jiné soubory dle jimi zadaných kritérií (klíčových slov). Chápeme je tedy jako programy, které svou hlavní funkci, vyhledávání webových stránek a souborů, poskytují všem svým přímým návštěvníkům nebo uživatelům jejich doplňků zakomponovaných do internetových prohlížečů. Každý provozovatel internetových stránek má za cíl dostat co nejvíce takovýchto uživatelů na své stránky, nevyjímaje ani velké globální vyhledávače jako jsou www.google.com, či lokální www.seznam.cz. Na druhé straně, uživatelé internetových vyhledávačů a internetu vůbec, mají za cíl najít „to, co hledají“, přeloženo do jazyka vyhledávačů: relevantní výsledky jejich hledání. Charakteristiku vystihující hledanou webovou stránku či dokument, kterou uživatel zadává do vyhledávače, nazýváme jednoduše klíčovým slovem. Je-li klíčových slov v uživatelově charakteristice více, nazýváme toto spojení klíčovou frází. Podle těchto klíčových slov, respektive frází, hledá vyhledávač ve svém seznamu indexovaných stránek relevantní odkazy a nabízí je uživateli ve výsledcích hledání (SERP – Search Engine Result Page). Index, neboli databáze vyhledávače, si fulltextový internetový vyhledávač tvoří sám a automaticky, zatím co index internetových katalogů je tvořen a udržován v aktualizovaném stavu ručně pomocí správců a registrovaných uživatelů jejich databází. Díváme-li se na problematiku vyhledávačů očima uživatele, pak by nás rozdíly mezi fulltextovými vyhledávači a internetovými katalogy vůbec nemusely zajímat, jelikož je jim lhostejné, dostávají-li požadované informace jednou nebo druhou cestou. Ze statistik však vychází tvrzení, že naprostá většina uživatelů se na požadované internetové stránky dostává právě z fulltextových vyhledávačů.
11
2.3 Katalogový vyhledávač Internetový katalogový vyhledávač si můžeme představit jako interaktivní podobu katalogu tištěného. Ten si můžeme vzít do ruky, ať už při návštěvě obchodního domu, kde bude mít podobu dvoustránkového letáku, na kterém jsou uvedeny pouze aktuální a výhodné nabídky, nebo ho občas najít ve vlastní poštovní schránce v podobě rozsáhlého katalogu realitní kanceláře sídlící někde poblíž našeho bydliště. Ten ovšem obsahuje zpravidla o pár desítek stran více než leták v obchodním domě a je rozdělen do kategorií a podkategorií, které čtenáři usnadní jeho hledání podle toho, jestli preferuje dům či byt, nebo mu záleží více na lokalitě nežli na ceně. Právě takto funguje i internetový katalogový vyhledávač, na úvodní stránce nabízí výhodné a také mnohdy zpoplatněné zápisy v databázi, zatím co všechny ostatní informace a odkazy má roztříděné do kategorií a podkategorií. Funkce vyhledávání v takovémto katalogu je v dnešní době nutností a zřídkakdy se setkáme s její absencí. Uživatel tu má možnost vyhledávat slova v titulcích, obecném textu či v klíčových slovech, jež některé katalogy umožňují svým „inzerentům“ vkládat. Jako výsledky hledání předkládá katalog jen odkazy, které má zaregistrované ve své databázi. Nové webové stránky se do katalogů dostávají zpravidla ručně, a to většinou registrací jejich majitelů nebo správci stránek. Po registraci zápisu v databázi následuje schvalovací proces, jehož časová náročnost se odvíjí podle velikosti, ale hlavně kvality daného katalogového vyhledávače. Registrace v katalogu bývá většinou zdarma s možností zaplacení příplatku za rozšířený či jinak zvýhodněný nebo zvýrazněný zápis. Mezi hlavní zahraniční katalogové vyhledávače patří www.dmoz.org (obrázek 2.3) a Directory na www.yahoo.com (obrázek 2.4)
12
Obrázek 2.3: Zahraniční katalogový vyhledávač www.dmoz.com
Zdroj: http://www.dmoz.org
Obrázek 2.4: Zahraniční katalogový vyhledávač Directory na www.yahoo.com
Zdroj: http://dir.yahoo.com
Mezi nejlepší a nejpoužívanější katalogové vyhledávače v České republice patří Firmy.cz (obrázek 2.5), které formálně spadají pod fulltextový vyhledávač Seznam a dále pak Najisto.cz (obrázek 2.6) patřící pod další dva z úspěšných fulltextových vyhledávačů Centrum a Atlas.
13
Obrázek 2.5: Tuzemský katalogový vyhledávač Firmy.cz
Zdroj: http://www.firmy.cz
Obrázek 2.6: Tuzemský katalogový vyhledávač Najisto.cz
Zdroj: http://najisto.centrum.cz
2.4 Fulltextové vyhledávače Fulltextové vyhledávače si podle svých možností a dostupných nástrojů samy procházejí obsah celého internetu a stahují si do svých indexů informace, ať už se jedná o navštívené webové stránky, nalezené textové dokumenty, PDF soubory, obrázky atd. Tyto indexované údaje a informace jsou dále zpracovávány a nabízeny jako výsledky hledání na zadaná 14
klíčová slova a fráze jim nejvíce podobné. Tajemství účinnosti, rychlosti a vůbec celé podstaty fulltextového vyhledávání spočívá v robotech. Takzvaný robot (bot, crawler, pavouk, spider, worm, fish atd.) je vysílán svým vyhledávačem na jemu známé odkazy za jediným cílem. Tím cílem je navštívit tyto stránky a stáhnout je do databáze vyhledávače. „V současné době umí pavouci patřící nejvýkonnějšímu vyhledávači na světě (Google) stáhnout během pouhé vteřiny kolem stovky stránek. Stahují tak průběžně a nepřetržitě procházejí miliardy stránek, které dnes na internetu existují.“1 Nové stránky sice lze například u Googlu zaregistrovat pomocí formuláře, nicméně praxe je taková, že jistějším postupem je vložit do některé z již dříve zaindexovaných stránek svůj zpětný odkaz a návštěva robota je zaručená. Roboti totiž stránky procházejí a postupují dále na odkazy, které na těchto stránkách naleznou. „Procházení (anglicky crawling), má svá přísná pravidla. Obsah internetu i přes to, že neustále roste, je konečný. Zároveň se však jedná o ohromný objem dat, jenž není v možnostech jediného vyhledávače pojmout do své databáze. Proto proces procházení řídí počítačové programy svými algoritmy, které určují dle přesných kritérií, jaké webové stránky se budou procházet a hlavně do jaké hloubky, tedy kolik stránek z jedné webové domény pavouk projde.“2
2.5 Pavouci a roboti Zadáme-li dotaz, nezačne fulltextový vyhledávač po jeho odeslání narychlo prozkoumávat internet, ale hledá a skládá odpověď z dostupných a již stažených informací uložených na jeho serveru. Tyto informace, tedy webové stránky a jejich obsah, se do jeho databáze dostávají pomocí již popsaných robotů, nebo chcete-li, pavouků. Pavouk svou cestu začíná většinou výběrem odkazu z vlastní databáze. Po přečtení stránky si uloží všechny další nalezené odkazy označené v HTML kódu dané stránky mezi párovými značkami
a . Postupně pak chodí na ně a opakuje celý proces. Dokud v procesu nalézá další odkazy, pokračuje ve stahování dál. Pokud již žádné nové odkazy na něj nečekají, vrací se do své databáze a vybírá si další odkaz v pořadí. Z tohoto vyplývá, že pavouk se po své imaginární síti může pohybovat pouze ve směrech, kam vedou jeho vlákna a objevuje tak pouze ty stránky, na které ho vedou nalezené odkazy.
1
KUBÍČEK, Michal. Velký průvodce SEO : Jak dosáhnout nejlepších pozic ve vyhledávačích. Praha : Computer Press, a.s. 2008, s. 35. 2
KUBÍČEK, Michal. Velký průvodce SEO : Jak dosáhnout nejlepších pozic ve vyhledávačích. Praha : Computer Press, a.s. 2008, s. 35-36.
15
Vyhledávače disponují různými pavouky a roboty, přičemž každý z nich může mít rozdílné úkoly. Ty, kteří jsou pověřeni stahováním obsahu internetu do své vlastní databáze, nazýváme Stahovači. Zároveň mají na starosti vytváření vzájemných vazeb mezi URL odkazy a obsahy stažených HTML stránek. Obrázky a jiné druhy dokumentů jako jsou textové soubory DOC, tabulkové zápisy ve formátu XLS či postscriptové dokumenty typu PDF apod. stahují do své databáze Prohlížeči. Další roli zastupují Kontroloři, kteří se věnují pouze hledání chybových hlášek, jako jsou například 404 – Not found, 500 – Server internal error, atp. Při opakovaném zjištění závady na stejné adrese dávají tito roboti povel k vymazání těchto odkazů z databáze. Nakonec tu jsou Statistici a Počtáři, jejichž funkcí je počítání odkazů a webů za účelem evidence změn a nárůstu počtu webových stránek. Nejdůležitějším však zůstává robot starající se o tzv. fetching, neboli Nosič. Poté co se do hlavní databáze dostanou informace o stránce, vyšle Nosič na její URL dotaz ve tvaru HTML a extrahuje tak z mnohdy obsáhlejších webů pouze informace, mezi které patří: Hlavička dokumentu – tuto hlavičku tvoří především meta tagy, mezi které patří meta tag keywords a description. Tag title představuje název stránky, který v porovnání s meta tagem keywords má pro vyhledávače mnohem větší význam. Stavové HTML kódy – 200 OK, 404 error, včetně přesměrování (300 redirection) Informace o poslední změně stránky – je časový údaj, jenž je zohledňován ve výpisech SERP (Search Engine Result Page). Tento údaj je obzvláště důležitý u webových stránek, jako jsou zpravodajské servery, u kterých by se na přední pozice vyhledávačů měly dostávat ty nejaktuálnější zprávy. Čas, za který se stránka zpracuje Až na čas potřebný ke zpracování stránek, se jedná o informace budující relevantnost stránek vůči klíčovým slovům. Čas robot zjišťuje ze dvou důvodů. Prvním je ten, aby neztrácel zbytečně čas, jedná-li se o nějakou chybu na straně serveru, která zpomaluje chod stránky, nebo aby nezahltil databázi nepotřebnými daty. Zároveň si tyto informace uchovává a porovnává s minulými návštěvami a zohledňuje výsledky při další aktualizaci stavu databáze. Z toho vyplývá, že náhodná jednorázová nedostupnost stránky nemá žádné fatální následky. Pokud se ale problémy budou často opakovat, například vinou pomalého nebo chybám náchylného serveru, na kterém jsou stránky uloženy, pak to značně limituje možnosti úspěchu ve snaze dosáhnout lepších výsledků ve fulltextových vyhledávačích. 16
2.6 Historický vývoj katalogů a vyhledávačů ve světě Prvním použitelným nástrojem na prohledávání Internetu byl vyhledávač Archie (obrázek 2.7). Vytvořil ho Alan Emtage v roce 1990, student McGillovy univerzity v Montrealu. Tento program stahoval výpisy adresářů z veřejných anonymních FTP (File Transport Protocol) stránek, ze kterých pak skládal databázi, ve které bylo možné vyhledávat. Zatímco Archie indexoval názvy souborů, Gopher indexoval textové dokumenty. Ten vytvořil Marc McCahill o rok později na Minesotské univerzitě. Programy Veronica a Jarhead pak využívaly Gopherových indexů a umožňovaly tak vyhledávání klíčových slov. Byl to ale Matthew Grey, kdo v roce 1993 vytvořil prvního robota pod názvem World Wide Web Wanderer. Byl vytvořen za účelem počítání aktivních webových serverů, čímž by zapisoval a měřil aktuální velikost Internetu. Po dvou letech provozu změnil svou funkci a začal weby ukládat. Vytvořil tak první databázi webů nazvanou Wandex. Obrázek 2.7: První použitelný vyhledávač - Archie
Zdroj: http://archie.icm.edu.pl/archie_eng.html
1993 byl také rokem, kdy Martijn Koster vytvořil vyhledávač ALIWEB, který se velmi podobal vyhledávači Archie. Nedisponoval však robotem, který by automaticky procházel internet a skladoval data. Uživatelé měli možnost přihlásit svoji webovou stránku, a teprve po zpracování této přihlášky byla stránka zaindexována.
17
Postupem času se z Internetu čím dále tím více stával výnosný nástroj. To přimělo investory, aby se zapojili do vývoje vyhledávačů, které se tímto staly oprávněně velkým byznysem.
V roce 1993 byl šesti studenty Stanfordské univerzity představen Excite, vyhledávač, jenž využíval statistickou analýzu slovních vazeb a vylepšoval tím své výsledky hledání. Koncem roku 1995 byl zaveden do provozu a v dnešní době je součástí společnosti AskJeeves.
Světlo internetu v roce 1994 spatřilo Yahoo!, kdy ho vytvořili Jerry Yang a David Filo. Yahoo! začalo jako katalog jejich oblíbených webových stránek, který zároveň poskytoval možnost pod odkazem zobrazovat popis dané stránky. Do projektu Yahoo! investovala společnost Sequoia Capital a dopomohla tak založení společnosti Yahoo!.
Později stejného roku byl Brianem Pinkertonem představen WebCrawler. Ten se do historie zapsal jako první crawler, který indexoval celé webové stránky a ne pouze jejich hlavičky a URL linky. O něco později se WebCrawler stal součástí Excite.
Své postavení ve špičce využívaných vyhledávačů si právem drželo Yahoo. To ale spíš bylo katalogem, a tak když v roce 1995 nastoupila AltaVista, nebylo pro ni těžké se do této špičky dostat a udržet se tam. AltaVista byla prvním vyhledávačem, který byl schopen vyhledávat klíčové fráze v jejich „nespisovném“ tvaru, a který nabízel techniky pokročilého vyhledávání společně s možností hledat multimediální soubory, jako jsou fotky, hudba a videa. 18
O rok později se objevují nové techniky koncepčního vyhledávání, které představuje Inktomi. Popisuje se jako způsob vyhledávání beroucí v potaz lidské analýzy, úvahy, zvyky a další vodítka tak, aby ze všech těchto informací vypočítalo index populárnosti, podle kterého by výsledky hledání nakonec seřadil.
Zmatek a nepořádek ve výsledcích vyhledávání, který způsobovala nerelevantnost nalezených odkazů na hledaná klíčová slova, vedl k tomu, aby v lednu roku 1996 Larry Page a Sergey Brin začali pracovat na vývoji vyhledávače prozatím nazvaného BackRub. Pojmenovali ho na základě jeho schopnosti analyzovat zpětné odkazy. BackRub využíval právě tento citační koncept hodnocení odkazů, který je dobře známý v akademickém světě. Spočíval v přesvědčení, že jestli existuje zdroj, který je citován mnoha jinými zdroji, ten původní získává na své důvěryhodnosti. Stejně tak se daly webové stránky pokládat za zdroje a odkazy na těchto stránkách za citace.
Chvála o nové vyhledávací technice se šířila rychle, a tak se Larry a Sergey rozhodli dát svému vyhledávači nové jméno. Inspiraci našli spojením své vize za cílem uspořádat zdánlivě nekonečné množství informací na internetu s definicí čísla googol (googol = 10100). Výsledkem bylo v roce 1998 spuštění nového vyhledávače Google s hodnotícím algoritmem nazvaným PageRank podle jeho autora.
Ve stejném roce své zveřejnění zažily i MSN Search a DMOZ. DMOZ, jinak také nazýván jako Open Directory Project, je i dodnes jedním z největších manuálně citovatelných katalogů na internetu. MSN Search byl výtvorem společnosti Microsoft, která v té době
19
ještě o vyhledávání nejevila zájem. Ze začátku se Microsoft spokojil s technikami hledání zprostředkovanými jeho tehdejšími partnery Overture, Looksmart a Inktomi.
Až roku 2005 přešla společnost Microsoft z technologie pro přirozené hledání Yahoo na svůj vlastní vyhledávač, který v roce 2006 pojmenovali Live Search.
V červnu roku 2009 pak Microsoft spustil Bing, vyhledávač, který změnil dosavadní vzhled stránek s výsledky hledání tím, že přímo do stránky umísťuje nabídku souvisejících klíčových frází.
2.7 Historický vývoj katalogů a vyhledávačů v ČR
České vyhledávače se oproti těm zahraničním vyvíjely se značným zpožděním a v mnohem menším měřítku. Nejznámějším českým vyhledávačem je bezesporu Seznam.cz. Ten byl na jaře roku 1996 založen Ivo Lukačovičem a stal se tak prvním katalogovým vyhledávačem v České republice. Hned další rok mezi služby Seznamu přibyla možnost fulltextového vyhledávání. O její naprogramování se zakladatel postaral ve spolupráci se svým spolužákem z ČVUT Štěpánem Škrobem. Vzniklá technologie vyhledávání nesla název Kompas a ve své jisté podobě byla v provozu až do roku 2001, kdy Seznam začal jako první vyhledávač v ČR používat fulltextovou technologii Google. Nakonec i tuto technologii Seznam opustil a nahradil ji v roce 2005 svou vlastní, známou pod názvem Seznam Fulltext. Opustil tak definitivně hledání v katalogu a věnuje se naplno hledání ve fulltextu, které zdokonalil o technologii SRank, tedy obdobu algoritmu hodnotícího důvěryhodnost webových stránek. Po získání ocenění v anketě Křišťálové lupy v roce 2009 neusnuli tvůrci na vavřínech, nýbrž provedli upgrade fulltextu, který od té doby významně zlepšuje relevanci ve vyhledávání.
Dalším z významných vyhledávačů, který vznikl v České republice, je Centrum.cz. Ten vždy byl v popředí díky svému marketingovému týmu, nicméně uživatelé dávali a stále dávají přednost Seznamu. Fulltext Centrum spustil na svých stránkách v roce 1999.
20
Koncem roku 2002 dostalo toto fulltextové hledání s přidělením vlastní domény i nový název, a to Centrum Webfast. Hned v dalším roce Centrum opět prodělalo značné změny v možnostech vyhledávání. Specializace na češtinu v podobě toho, že vyhledávač začal brát v potaz ohýbání slov, jejich synonyma i překlepy, a zároveň i zprovoznění vlastní technologie podobné algoritmu PageRank, vedly ke změně značky na Morfeo. Od té doby se Centrum věnovalo více marketingovým tahům než zlepšování služby hledání. Do svého portfolia postupně přibíralo projekty, jako jsou: internetová podoba Lidových novin lidovky.cz; zpravodajský server aktuálně.cz, katalog najisto.cz, chat server XChat, chat aplikaci ICQ, komunikační aplikaci Skype či dokonce konkurenční portál Atlas.cz.
Atlas.cz vznikl v roce 1997 a jeho vývoj byl už od začátku propojen se společností Microsoft, která jeho potenciál chtěla využít ve prospěch své značky MSN. Ta měla sloužit jako zastřešení celé řady vyhledávacích technologií a portálů. Nakonec z jejich spolupráce sešlo kvůli neshodám ve vzájemné teritoriální strategii. Přijít o defaultní nastavení stránky atlas.cz jako domovské webové stránky v Internet Exploreru v nově nainstalovaných operačních systémech Windows, byla společně s rostoucí konkurencí na trhu vyhledávačů rána, která snesla Atlas z druhé pozice na čtvrté až páté místo. Postupný propad vyhledávače vyústil ve fúzi s Centrum Holding, které Atlas nechává v jeho nynější podobě „dojet“.
Jyxo vznikl v roce 2002. Fungoval však od začátku spíše jako technologie, kterou využívaly významnější vyhledávače, než byl on sám. Mezi ně patřily například Atlas či Seznam. Podobně jako Morfeo se stal Jyxo specialistou na ohýbání slov, překlepy a synonyma. Disponoval také obdobou algoritmu PageRank s názvem JyxoRank.
21
2.8 Historický vývoj SEO v období od 1994 do 2010 Obrázek 2.8: Infografika historického vývoje SEO
22
2.9 Hodnocení webových stránek vyhledávači Když dáme vyhledat klíčové slovo ve vyhledávacím poli fulltextového vyhledávače, dostaneme jako výsledek zobrazenou první ze stránek výsledků hledání, neboli SERP (Search Engine Result Page). Na těchto stránkách nalezneme určitý počet odkazů (zpravidla prvních deset nejlépe optimalizovaných stránek) na webové stránky či jiné dokumenty, které jsou interpretovatelné námi hledaným klíčovým slovem. To jak dobře a relevantně jsou tyto výsledky SERP seřazené záleží na vlastním hodnotícím systému použitého fulltextového vyhledávače. Takzvané odkazové ranky jsou výsledek součtu hodnocení mnoha faktorů webových stránek. Tyto faktory, které vyhledávače hodnotí, se ve skutečnosti mohou a nemusí nacházet přímo na hodnocených webových stránkách. Podle toho je dělíme na On-page a Off-page faktory. On-page faktory, tedy vlastnosti ovlivňující umístění webových stránek ve vyhledávačích, jsou na rozdíl od off-page faktorů umístěny přímo na daných webových stránkách. Jejich plný potenciál můžeme lehce využít, jelikož k jejich editaci máme volný přístup. Budu jim věnovat celou příští kapitolu. Mezi Off-page faktory patří zejména anchor text, text související a blízký anchor textu, zpětné odkazy a dále pak tematičnost a vyhledávači přiřazovaná důvěryhodnost webové stránky.
2.9.1 Anchor text Anchor text je text, na který lze kliknout, a který je většinou zabarven a podtržen jako odkaz na jinou webovou stránku. Tento text je specifikován mezi párovými HTML značkami
a . Uvedeme-li jako příklad právě společnost Bankovní institut vysokou školu, měli bychom usilovat, aby na web školy odkazoval link s plným jménem společnosti a nejen její zkratkou. Je tedy výhodnější a lepší mít link v podobě Bankovní institut vysoká škola – první soukromá vysoká škola v ČR. Tento link je zapsán v HTML jako
Bankovní institut vysoká škola – první soukromá vysoká škola v ČR.
než pouze
23
BIVŠ – první soukromá vysoká škola v ČR. Tento link je zapsán v HTML jako
BIVŠ – první soukromá vysoká škola v ČR.
Rozepsaný název společnosti nabízí možnost užití více klíčových slov. Zároveň zde určitou roli hraje i blízké okolí anchor textu (v příkladu uvedeno ve znění „první soukromá vysoká škola v ČR“). Je-li odkazem obrázek, hraje důležitou roli i popis obrázku definovaný atributem alt v HTML. Pomineme-li SEO pohled na důležitost popisu obrázků, nabízí se ještě pár dalších důvodů, proč tento atribut využívat naplno. Jedním z nejdůležitějších je snadnější komunikace se čtecími zařízeními nevidomých návštěvníků webových stránek. Atribut title se postará o zobrazení zadaného textu poté, co by najela myš nad tento odkazový obrázek. Obrázek 2.9: Otisk obrazovky, na kterém je obrázkový odkaz
Tento obrázkový link (obrázek 2.9) je zapsán v HTML jako:
Těmto zdánlivě jen popisovým textům je potřeba v dnešní době věnovat čím dál tím větší pozornost. Jsou totiž jedním z dalších významných faktorů, které určují, jak vysoko bude naše optimalizovaná stránka zařazena ve výpisu SERP.
2.9.2 Zpětné odkazy Tvorba zpětných odkazů je považována za jeden z nejdůležitějších procesů při optimalizaci webových stránek pro vyhledávače. Nezbývá než s tímto společným tvrzením všech SEO analytiků souhlasit. Metodám a praktikám tvorby a využívání zpětných odkazů věnuji samostatnou kapitolu pod názvem Linkbuilding – budování zpětných odkazů. Proč jsou ale tak důležité?
24
Na těchto zpětných odkazech totiž fulltextové vyhledávače lpí nejvíce. Nejen počet, ale hlavně jejich kvalita je jedním z nejvíce využívaných parametrů pro řazení stránek ve výpisu výsledků ve vyhledávačích. Pokud tedy na dané stránky povede určité množství odkazů z kvalitních a důvěryhodných webů, bude to znamenat, že webové stránky jsou kvalitní. Zpětnými odkazy se převádí část kvality respektive popularity ze stránky, na které je odkaz umístěn, na webovou stránku, kam tento odkaz směřuje. Celkové výsledky veškerých podobných převodů jsou předmětem výpočtů algoritmů fulltextových vyhledávačů pro takzvaný ranking. Již jsem zmínil PageRank (Google), S-Rank (Seznam) a JyxoRank (Jyxo) v kapitole o historickém vývoji katalogů a vyhledávačů, principy těchto algoritmů budou popsány podrobněji.
2.9.3 PageRank PageRank je značka patřící Googlu, jehož zakladateli byl i vyvinut. Zároveň byl po jednom z nich i pojmenován, a to po Larrym Pageovi. Google PageRank byl vytvořen jako číselný systém nabývající hodnot v řádech milionů. Vypočítanou, a tím i stanovenou hodnotou vyjadřoval své hodnocení relativní důležitosti a věrohodnosti měřené webové stránky. Algoritmus pro výpočet Google PageRanku: PR(A) = (1-d) + d (PR(T1)/(T1) + … + PR(Tn)/C(Tn)) kde: PR(A) je PageRank webové stránky A, PR(Ti) je PageRank stránek, které odkazují na měřenou stránku A, C(Ti) je celkový počet odchozích odkazů na stránce Ti a d je tzv. faktor útlumu (damping factor), který je mezi 0 a 1. V součastnosti není přesné znění algoritmu PageRank známé, ale mělo by vycházet právě z této rovnice. Velmi zjednodušeně se dá říct, že celý tento systém je tvořen příchozími a odchozími odkazy celého internetu, kde jeden web odkazující na druhý mu tím stejným odkazem dává jakýsi pomyslný hlas, který ve výsledku zvyšuje jeho důvěryhodnost a důležitost. Zároveň platí pravidlo, že s rostoucím počtem odkazů na stránce klesá hodnota významnosti tohoto hlasu. Bude-li tedy na webové stránky Bankovního institutu vysoké školy odkazovat jeden z celkem deseti odkazů na stránce s PageRankem 5, předá tato stránka mnohem větší podíl
25
svého ranku, než by předala stránka s PageRankem 6 a celkem 100 odkazy. Přitom také platí, že odkaz ze stránky s vyšším PageRankem má samozřejmě mnohem větší hodnotu než odkaz ze stránky s PageRankem nižším. Obrázek 2.10: Ilustrace systému předávání důležitosti v podobě PageRanku
Zdroj: vlastní zpracování
Poté co v roce 2002 Google vydal Toolbar pro přední internetové prohlížeče, zařadil do něj i zobrazování PageRanku. Tam už ovšem nabýval hodnot od 0 do 10, pro jeho snadnější interpretaci. Pokud by stránka vykazovala PageRank roven nule, tedy PR0, znamenalo by to, že se jedná o stránku s minimem odkazů vedoucích na ni, nebo že webová stránka použila některých nekalých praktik a je vyhledávačem Google penalizována. PagerRank 10 má sám Google, poté státní instituce Spojených států amerických a webové stránky zpravodajských stanic jako je například CNN. Mezi webové stránky ohodnocené PR9 patří nadnárodní kolosy jako je například Microsoft, Apple nebo většina vzdělávacích institucí vyznačujících se doménou .edu. V současné době má Bankovní institut vysoká škola se svojí homepage na adrese http://www.bivs.cz PR4. Často můžeme slyšet ještě pořád přežívající mýtus, že podle velikosti PageRanku řadí Google webové stránky do výsledků vyhledávání. Není to sice pravda, ale můžeme s jistotou tvrdit, že PageRank, a tím především myslíme počet a kvalitu zpětných odkazů,
26
jež vyjadřuje, patří na seznam těch nejdůležitějších faktorů potřebných k dobré optimalizaci.
2.9.4 S-Rank Svůj vlastní hodnotící algoritmus schovávající se za názvem S-Rank, má i nejlepší tuzemský fulltextový vyhledávač Seznam.cz. S-Rank je stejně jako PageRank u Googlu číselná hodnota, jež by měla vypovídat o kvalitě a důležitosti měřených stránek na českém webu. S-Rank stupnice nabývá hodnot od 0 do 10. Přesné znění S-Rank algoritmu není známé, nicméně s jistotou lze tvrdit, že se nijak výrazně neliší od zaběhnutého hodnocení již představených off page faktorů. Seznam na svých webových stránkách uvádí, že „S-Rank je pouhou orientační hodnotou populárnosti stránky,“ a že „z této hodnoty nelze odvozovat předpokládané pořadí ve výsledcích vyhledávání“. Stejně jako u Googlu není nic neobvyklého na tom, že se stránka s vyšším S-Rankem může objevit ve výsledcích SERP až teprve za stránkou s nižším S-Rankem. Celková relevance v souvislosti s hledanou klíčovou frází se vypočítává z mnoha kritérií a S-Rank je pouze jedním z nich. V současné době má Bankovní institut vysoká škola – http://www.bivs.cz S-Rank 7/10.
2.9.5 JyxoRank Vyhledávač Jyxo, u kterého se sice můžeme domnívat, že své nejlepší a populárnější časy má za sebou, používá taktéž vlastní hodnotící systém. Stejně jako předešlé systémy hodnotí stránky na základě všech zpětných odkazů v databázi. Čím více takových odkazů, tím větší JyxoRank. Hodnota JyxoRanku se aktualizuje každé 2 dny a nabývá hodnot od 0 – 220. V současné
době
má
webová
stránka
Bankovního
institutu
vysoké
školy
–
http://www.bivs.cz JyxoRank 202.
2.9.6 Tematičnost Už několik let se mluví o tom, že by vyhledávače měly brát tematičnost či předmětovou relevantnost mnohem vážněji než dosud. Jako hlavní důvod těchto debat a návrhů můžeme brát omezení spamových stránek s koupenými zpětnými odkazy. Jako mnoho dalších věcí ve světě SEO je i přesné fungování hodnocení tematičnosti stránek záhadou. Je možné, že stránka není hodnocena samostatně, ale i podle obsahu svých příbuzných stránek. K tomu je ještě možné, že hodnocení stránky podstatně ovlivňují i obsahy jiných stránek, které na ni odkazují. Systém tohoto hodnocení by pak měl fungovat tak, že stránka referující o 27
bakalářském studiu na webové stránce Bankovního institutu vysoké školy by měla mít lepší hodnocení, než kdyby se nacházela na webových stránkách společnosti prodávající letenky. Je celkem nesporné, že je pouze otázkou času kdy vyhledávače implementují tematické hodnocení na bázi podobné PageRanku či jiného bodování. Zatím nám nezbývá, než se držet zažitého a velmi doporučovaného pravidla, které říká, že výměna odkazů s tematicky příbuznými stránkami je mnohem lépe hodnocena než výměna odkazů se stránkami, které mají naprosto odlišné téma a zaměření.
2.9.7 Důvěryhodnost Za důvěryhodnost v kontextu off-page faktorů ovlivňujících účinnost optimalizace pro vyhledávače se považuje stáří domény, na které se webové stránky nacházejí. Platí zde zcela prosté a jasné pravidlo, které říká, že čím starší doména, tím je lepší z pohledu SEO optimalizace. Je to jednoduché, ale velmi účinné vodítko pro vyhledávače a jejich algoritmy jak posuzovat relevantnost výsledků hledání. Právě stáří webu a hlavně jeho domény je faktor, který přidává na hodnotě jak důvěře, tak jeho autoritě. Je však důležité si uvědomit, že tímto stářím nemyslíme datum, kdy byla doména registrována, nýbrž datum a čas, kdy na ni poprvé zavítal robot daného fulltextového vyhledávače. Ani to ovšem nestačí, pokud tímto robotem poprvé indexovaná stránka neobsahuje žádné relevantní informace. Je tedy nutné chovat se k webu „lidsky“ a nevypočítavě. Naplnit webovou stránku pro návštěvníky užitečným a zajímavým obsahem by mělo být hlavní prioritou jakéhokoliv začínajícího webu.
2.10 Tržní podíly vyhledávačů v České republice Vývoj tržního podílu využívaných vyhledávačů je nejen u nás, ale i v celém světě neustále se měnící proces. I když se společnosti Google, provozující ve světovém měřítku nejvyužívanější fulltextový vyhledávač, daří svůj podíl na trzích po celém světě neustále zvyšovat, u nás se stále na prvním místě přesvědčivě drží Seznam. V současné době fulltextový vyhledávač Seznam používá v průměru kolem 50 procent uživatelů, zatím co Google používá průměrně kolem 35 procent uživatelů internetových vyhledávačů. Na světě jsou v podstatě pouze čtyři země, kde v tržním podílu mezi vyhledávači Google nevévodí. Jsou to Čína, Rusko, Korea a Česká republika. Vyhledávače Centrum.cz společně s Jyxo.cz v průběhu posledních let klesly pod bod mrazu, zatímco se Centrum ještě s podílem 2,5 procent drží ve výčtech statistik, Jyxo.cz už se propadl a jeho setiny
28
procent jsou tak přičítány do položky ostatní. V následujícím grafu můžeme sledovat vývoj návštěvnosti za rok 2009 (obrázek 2.9). Statistiky z roku 2009 jsem společně s tabulkou vývoje tržního podílu v tomto roce (tabulka 2.1) použil pro znázornění zřetelného výkyvu v užívání vyhledávače Bing (zvýrazněno v tabulce). To bylo způsobeno z převážné míry tím, že 19. března 2009 uvedla na trh společnost Microsoft svůj nový internetový prohlížeč Internet Explorer 8. Ten měl v sobě nastavenou jako výchozí domovskou stránku právě URL vyhledávače Bing. Uživatelé si ho po dobu zhruba půl roku zkoušeli a nakonec někteří IE8 jako internetový prohlížeč zavrhli a jiní si jednoduše přednastavenou URL adresu domovské stránky změnili.
Vyhledávač
leden
únor
březen
duben
květen
červen
červenec
srpen
září
říjen
listopad
prosinec
Tabulka 2.1: Vývoj tržního podílu vyhledávačů v ČR za rok 2009 (v procentech)
Seznam.cz
55,94
55,88
54,39
52,41
52,79
53,09
50,92
52,19
54,82
54,97
55,41
53,91
Google.cz, .com
31,64
31,54
31,27
31,63
31,84
31,90
32,22
31,41
31,27
31,68
31,49
32,85
Zboží.cz
3,15
3,43
3,51
3,46
3,24
3,28
3,63
3,99
4,63
4,48
4,47
4,95
Firmy.cz
4,03
4,01
3,98
3,66
3,65
3,32
3,33
3,85
4,24
4,02
3,90
3,52
Centrum.cz
2,54
2,57
2,45
2,27
2,28
2,29
2,35
2,74
2,75
2,66
2,56
2,50
Bing.com
0,42
0,49
2,40
4,72
4,46
4,44
5,79
4,04
0,51
0,51
0,46
0,48
Zdroj: http://www.iinfo.cz/tiskove-centrum/tiskove-zpravy/navrcholu-vyhledavace-2009/
29
Obrázek 2.11: Graf tržního podílu vyhledávačů v ČR za rok 2009 (v procentech)
Zdroj: http://www.toplist.cz/stat/?a=history&type=4
Obrázek 2.12: Graf průměrného tržního podílu vyhledávačů v ČR za rok 2009
Zdroj: http://www.iinfo.cz/tiskove-centrum/tiskove-zpravy/navrcholu-vyhledavace-2009/
30
2.11 Tržní podíly vyhledávačů ve světě Ve světě je nejpoužívanějším fulltextovým vyhledávačem Google. Tento náskok před konkurencí si nejen udržuje, ale i efektivně zvyšuje. Graf, zobrazený v obrázku 2.13 ukazuje průměrný tržní podíl vyhledávačů ve světě za měsíc listopad roku 2010. Obrázek 2.13: Graf tržního podílu vyhledávačů ve světě za listopad 2010
Zdroj: http://www.comscore.com/Press_Events/Press_Releases/2010/12/comScore_Releases_November_ 2010_U.S._Search_Engine_Rankings
31
3 Zdrojový kód Zdrojovým kódem běžně rozumíme text počítačového zápisu v určitém programovacím jazyce. V případě SEO jde především o zápis v HTML (HyperText Markup Language) formátu, tedy jazyce, který je jedním ze základních a nejvíce využívaných pro tvorbu webových stránek na internetu. Zdrojový kód je tak tím největším stavebním kamenem každé webové stránky nejen po její obsahové stránce, ale především jejích SEO vlastností. Podstatnou částí vedle off-page faktorů představených v minulé kapitole je samotná optimalizace obsahu webové stránky takzvaných on-page faktorů. Pod tímto názvem se skrývají všechny esenciální vlastnosti webové stránky, její obsah, titulek, meta tag description, meta tag keywords, nadpisy a jejich seřazení od velikosti H1 až po velikost H6, vlastnosti textu tag <strong>, tag <em> atd. Klíčová slova, která bez výjimky tvoří stěžejní bod optimalizace, jsou taktéž obsažena ve zdrojovém kódu. Tam můžeme ovlivňovat jejich hustotu v textu, stejně tak jako jestli tato slova či fráze budou ještě nějak zvýrazněná, nebo jak daleko budou umístěna ve srovnání se začátkem stránky či nějakého interního zpětného odkazu, aby je vyhledávače nebraly na lehkou váhu. Je důležité mít na paměti, že webovou stránku netvoří pouze vykrášlená a graficky atraktivní vstupní stránka, nýbrž další stovky podstránek popisující jednotlivé služby, produkty, akce a další informace. Tyto stránky vyhledávače hodnotí zvlášť, takže pohybujeme-li se na webové stránce soukromé vysoké školy, měla by se spíše než na optimalizování pár klíčových slov na úvodní stránce soustředit na každou z podstránek stejnou silou a prostředky. Články nabízející a popisující jednotlivé studijní obory ať už bakalářského nebo navazujícího magisterského studia, ale i kurzů celoživotního vzdělávání a studia MBA, by měly být optimalizovány každý zvlášť a provázány vnitřními odkazy jeden na druhý. Takto strukturovaná síť vnitřních prolinků má za následek předávání důvěry a hodnocení, nemluvě o návštěvnících, pro které tento obsah v prvé řadě tvoříme. Je potřeba, aby každý článek byl omezen na určitá klíčová slova a v souvislosti s nimi také náležitě optimalizován. Pro doménu čítající k 300 jednotlivých stránek není vhodné, aby se soustředila na optimalizování pouhých pár desítek klíčových slov, nýbrž pár stovek. Aby všechna tato práce byla zužitkována, klíčová slova nemohou být namátkou vybrána. Správný postup vede přes důkladnou analýzu, kde přinejmenším pomocí nástrojů pro vyhledávaná slova zjistíme:
32
jaká relevantní klíčová slova vybrat, jak si stojíme s celkovou hledaností na internetu, jak tuto hledanost zvýšit, jak je na tom konkurence a jaká klíčová slova používá právě ona.
3.1 Klíčová slova Keywords, neboli klíčová slova či fráze, jsou tou nejdůležitější položkou on-page faktorů v procesu optimalizace pro fulltextové vyhledávače. Jsou to ve skutečnosti řetězce slov, které vyhledávač přímo porovnává a vrací nám relevantní výsledek. Z toho plyne, že nejpodstatnější věcí v celé problematice klíčových slov je jejich správný výběr. Paradoxně se to zdá být lehce zvládnutelným úkolem, nicméně po prostudování podstatných měřítek, podle kterých jsou tyto výběry prováděny, to může leckoho od tohoto nezbytného úkolu odradit. Zamyslíme-li se jako provozovatelé stránek 1. soukromé ekonomické vysoké školy v ČR, jaké by mělo být první optimalizované klíčové slovo, je jasné, že většina případně dotázaných odpoví, že vysoká škola. Chceme přece být mezi nejlepšími, ať už mezi veřejnými či soukromými vysokými školami. Tento postup může za velkých finančních zdrojů být sice nejúčinnější, ale i tak bychom se mnohdy nakonec našli u dna s financemi s nepříliš velkým zájmem o studium na naší škole. Všichni by se sice podívali na naše krásné stránky, avšak polovina těchto návštěvníků by z nich odešla z důvodu, že se až na místě dozvěděla, že jsme soukromá vysoká škola, a ta druhá polovina by je následovala hned poté, co by zjistili, že sídlíme v Praze a ne například v Ostravě. Naprostá většina návštěvníků nám tak odejde z webových stránek neuspokojena. Následující tabulka 3.1 ukazuje počet hledání konkrétních, a přitom Bankovní institut vysokou školu vystihujících frází. Sama o sobě nám poví dostatečné množství informací, a to jak vysokou návštěvnost stránek můžeme očekávat poté, co bychom je zoptimalizovali na dané fráze. Ale ještě více nám toho poví ve spojení s tabulkou 3.2, která ukazuje počet stránek nalezených na zadané klíčové slovo. Z těchto dvou údajů si můžeme pomyslně vytvořit jakési cash-flow návštěvníků stránek a zvážit, zdali to bude stát za danou investici.
33
Tabulka 3.1: Hledanost klíčových frází Seznam
Google
Vysoká škola
3580
135 000
Soukromá vysoká škola
>100
1 900
Soukromá vysoká škola Praha
>100
390
Tabulka 3.2: Počet nalezených webových stránek na dané klíčové fráze Seznam
Google
1 602 000
5 030 000
Soukromá vysoká škola
406 150
968 000
Soukromá vysoká škola Praha
238 275
418 000
Vysoká škola
3.1.1 Výběr klíčových slov Na začátku je potřeba vžít se do role potenciálního návštěvníka, zauvažovat nad tím jak by nás hledal a zapsat si případná slova, která by zadával do vyhledávače. Systémem „více hlav, více ví“ bychom do tohoto procesu mohli zapojit další lidi či celá oddělení v naší společnosti. Každý uživatel internetu totiž vyhledává jinak a tyto drobné nuance nám pomáhají pokrýt co nejvíce možností klíčových frází, při čemž bychom neměli opomenout ani skloňování a tvary slov v množném čísle, které dodneška některé vyhledávače neodvozují. K odkrytí rozdílů v hledání můžeme použít dostupné nástroje na internetu. Příkladem takového nástroje je „Google AdWords: Návrhy klíčových slov“, který můžeme nalézt na URL adrese https://adwords.google.com/select/KeywordToolExternal. Jak je vidět na obrázku 3.1, nástroj společnosti Google nám pomáhá najít výrazy hledané uživateli fulltextových vyhledávačů, v tomto případě tedy konkrétně Googlu, a společně s těmito výrazy nám nabízí i seznam souvisejících slov společně s jejich vyčíslenou přibližnou hledaností. Ve výsledcích si můžeme všimnout, že zrovna společnost Bankovní institut vysoká škola, a.s. si ve hledání nestojí špatně, jelikož je obsažena ve výpisu souvisejících slov k hledané frázi „vysoká škola praha“.
34
Obrázek 3.1: Google AdWords – Návrhy klíčových slov
Zdroj: http://adwords.google.com
Takovýto nástroj pro hledání klíčových slov může být zejména nápomocný, hledáme-li: Nová klíčová slova a fráze Doplňky a upřesnění existujících klíčových slov a frází Konkrétní dotazy návštěvníků na související slova a fráze Hledanost a její vyčíslení k určitým klíčovým slovům a frázím Nové nápady pro již dobře zoptimalizované stránky Výběr těch správných a relevantních klíčových slov je tak pro nalezení našich webových stránek to nejdůležitější. Právě tím pomáháme návštěvníkům snadněji dospět ke správným výsledkům v jejich hledání. Klíčová slova také plní důležitou funkci v odvětví placených kampaní na internetu, tzv PPC (pay per click) kampaní, a proto další nástroje pro správný výběr klíčových slov bude popsán v kapitole týkající se právě reklamních systémů PPC.
3.1.2 Hustota klíčových slov K velmi často přeceňovaným faktorům, souvisejícím s klíčovými slovy, patří jejich hustota. Vyhledávače neberou v potaz pouze počet určitého klíčového slova na webové stránce jako vodítko pro jeho možnou důležitost, nýbrž jeho hustotu. Tedy přesný poměr 35
jeho výskytů oproti celkovému počtu slov obsažených v textu na dané stránce. Za optimální hustotu klíčového slova se bere poměr mezi 3 a 8 procenty celkového počtu slov. Má-li klíčové slovo menší poměr než 2 procenta, je potřeba předělat text do podoby, která ho přes tuto hranici přenese, a tím zlepší jeho pozici ve výsledcích vyhledávání. Pokud klíčové slovo překročí optimální hustotu, je možné, že vyhledávače penalizují tuto stránku na základě pocitu přeoptimalizace. OOP (Over Optimized Penalty) je udělována především stránkám používajícím zakázané praktiky optimalizace, jako jsou White, Gray či Black Hat. Tyto praktiky spočívají zejména ve schovávání nesouvislého textu přecpaného klíčovými slovy na stránce tak, aby návštěvníky nerušil, nicméně zároveň tak, aby roboti tento text naplněný klíčovými slovy našli, přečetli, zaindexovali a dali mu tak vysoké hodnocení. Blíží-li se tedy optimalizovaný článek a jeho klíčové slovo hustotě osmi procent, je třeba další užití tohoto slova zvážit a hlavně každé další užití monitorovat v podobě jeho postupu či poklesu ve výsledcích vyhledávání. Z důvodu toho, že tento efekt na SERP není okamžitý, časová náročnost a efektivnost celého procesu je spíše menší. Proto je doporučováno vytvoření a optimalizování další souvislé stránky a naplnění její kvóty z hlediska doporučené hustoty klíčových slov. Stejně tak jako pro návrh klíčových slov si můžeme vybrat i jeden z mnoha přístupných nástrojů pro počítání jejich hustoty. Všechny si zdaleka nedokážou poradit s diakritikou a češtinou jako takovou. K jednomu z využívanějších patří Keyword density analyzer, který lze nalézt na URL adrese http://www.ranks.nl. Pro ilustraci je na obrázku 3.2 znázorněna analýza hustoty klíčových slov stránky Bankovního institutu zabývající se studiem MBA. Na něm je patrné, že k nejlépe optimalizovaným výrazům této konkrétní URL adresy (http://www.bivs.cz/studium-mba) patří právě klíčová slova studium, MBA a BIVŠ a jejich složením vzniklé klíčové fráze studium MBA, MBA BIVŠ a studium MBA BIVŠ, na které jsme se již při tvorbě článku zaměřili. Nicméně stále se nám hustota těchto klíčových slov a frází pohybuje kolem tří procent z celkového počtu slov v článku o MBA studiu na Bankovním institutu vysoké škole. Samotný článek a jeho optimalizace klíčových slov bez podpory zpětných odkazů nám zařídil zobrazení sice na konci, ale zato první stránky SERP při hledání výrazu studium MBA ve vyhledávači Google. Ve fulltextovém vyhledávači Seznam se náš článek při hledání stejného výrazu zobrazil ve výsledcích SERP na čtvrté pozici první stránky. Z toho se dá usoudit, že po doladění a přidání dalších pár vět s klíčovými slovy do zmíněného článku a zapojení zpětných odkazů s obsahem stejných 36
klíčových frází se nám umístění v SERP nepochybně zlepší a v případě Seznamu můžeme očekávat i první pozici v jeho výsledcích hledání výrazu studium MBA. Obrázek 3.2: Analýza hustoty klíčových slov v článku představujícím studium MBA
Zdroj: http://www.ranks.nl/cgi-bin/ranksnl/spider/spider.cgi?lang=
3.2 Tagy ve zdrojovém kódu Určité tagy použité ve zdrojovém kódu webové stránky mají pro proces optimalizace zásadní význam. Jsou dokonce úzce spjaty s klíčovými slovy a jejich společnými silami můžeme dosáhnout obdivuhodných výsledků.
3.2.1 Titulek Titulek je v HTML zapsán následujícím způsobem:
Titulek webové stránky o délce 10-70 znaků
Tag
je zcela nepochybně tím nejdůležitějším on-page faktorem obsaženým ve zdrojovém kódu jakékoliv webové stránky. Naprostá většina fulltextových vyhledávačů, včetně Googlu a Seznamu, zobrazuje titulky stránek jako výsledky v SERP. Z toho plyne, že každá stránka by měla mít odlišný titulek, než mají ostatní na společné doméně. Zároveň by v sobě měl obsahovat klíčová slova či fráze, na které je daná stránka optimalizována, a v ideálním případě by měl dokonale popisovat obsah stránky, již reprezentuje. Jeho doplňkem by dále měl být buď název samotné domény, pokud je 37
předmětem optimalizace, či název firmy. Ve zmiňovaném článku o studiu MBA na Bankovním
institutu
vysoké
škole,
který
můžeme
nalézt
na
URL
adrese
http://www.bivs.cz/mba-studium, si můžeme všimnout, že v názvu článku figuruje výchozí klíčová fráze společně s názvem společnosti. Titulek MBA studium - Bankovní Institut Vysoká Škola je tedy ideálním příkladem jak by správný titulek webové stránky měl vypadat. I přes vyzdvihování důležitosti titulku bychom neměli zapomenout na obsah stránky, jelikož fulltextové vyhledávače procházejí stránky jako celek a neomezují se pouze na jejich názvy. Samotný titulek, ani se svojí nespornou vahou pro vyhledávače, v dnešním vysoce konkurenčním světě nemůže bez dobrého obsahu obstát. Přesto, že je nezbytnost dobrého titulku pro úspěch na internetu a v SEO bezesporná, je mnoho příkladů správců stránek, kteří na to zapomínají. Důkazem může být obrázek 3.3, který ukazuje výsledky hledání výrazu Untitled document. Untitled document je výchozí hodnota titulku v případě, že ve zdrojovém kódu stránky není tento tag definován. Obrázek 3.3: Výsledky hledání výrazu Untitled document
Zdroj: http://www.google.cz/#sclient=psy&hl=cs&site=&source=hp&q=untitled+document
Otázka, která se nám sama nabízí, by zněla: „Proč titulek a obsah stránky nezahustit klíčovými slovy, abychom v optimalizaci a výsledcích hledání vynikli bez větší námahy?“. Odpovědí by ale mohla být ještě smysluplnější otázka, či spíše úvaha k velmi krátkému zamyšlení. Hodláme ve skutečnosti obsah stránky tvořit pro vyhledávače nebo pro lidi, které k nám zavedl jejich nefalšovaný zájem?
38
3.2.2 Description Meta tag description je v HTML zapsán následujícím způsobem: <meta name="description" content="Popis obsahu webové stránky o doporučené délce až 200 znaků">
V minulosti se meta tag description těšil velkému významu a popularitě mezi fulltextovými vyhledávači. Obsah meta tagu měl velikou váhu na umístění stránky ve výsledcích hledání, a tak jeho vyplněním klíčovými slovy bylo velmi snadné dosáhnout dobrých výsledků. Jeho časté zneužívání správci stránek pro dosažení excelentních výsledků v SEO však vedlo k zásadním změnám v algoritmech hodnocení stránek vyhledávači. Dnes jsme svědky toho, že pro tyto algoritmy má tento meta tag význam velmi slabý, ne-li zcela žádný. Tím se nedá tvrdit, že je nepodstatný a že by se mu nemělo dostat pozornosti. Je jen využíván vyhledávači k jiným účelům než k hodnocení stránek. Jeho obsah je většinou fulltextových vyhledávačů zobrazován jako krátký popis stránek ve výsledcích vyhledávání. Tím se popis stránek zařadil mezi faktory, které mohou přímo ovlivnit uživatele vyhledávače, aby na náš výpis v SERP kliknul, a tím se dostal na naše stránky. Proto se pro účely zvýšení této míry prokliků doporučuje meta tag description svědomitě a smysluplně vyplnit unikátním obsahem popisujícím každou danou stránku. Častou chybou je, že správci vyplní jeden popisek a nakopírují ho do každé podstránky webu. Obvykle však nedokážou v tomto krátkém prostoru pokrýt význam a obsah všech stránek, a tak vždy určité procento webu trpí nepřesným, ne-li neodpovídajícím, či dokonce špatným popisem. Už jen kvůli Googlu, který meta tag description aktivně využívá, se vyplatí popis zodpovědně vyplňovat. U Seznamu se popis využívá v případě, že doména nemá záznam v jejich katalogovém vyhledávači Firmy.cz. Příklad dobrého meta tagu description můžeme nalézt ve zdrojovém kódu stránek BIVŠ na URL adrese http://www.bivs.cz, který zní: <meta name="description" content="Bankovní institut vysoká škola, první
soukromá
vysoká
škola
v
České
republice.
celoživotního učení, Bc, Mgr, Ing, kurzy a semináře.">
39
Institut
3.2.3 Keywords Meta tag keywords je v HTML zapsán následujícím způsobem: <meta name="keywords" content="klíčová slova o doporučené délce až 10 slov">
Stejně tak jako meta tag description, keywords se těšil až přehnaně velkému významu pro algoritmy vyhledávačů. Po změnách v těchto algoritmech dnes má funkce meta tagu spíše doplňkovou funkci. Google stejně tak jako Seznam nebere na tento meta tag ohled ve spojitosti s výsledky hledání. Nicméně jisté srovnání mezi obsahem stránky a meta tagem keywords probíhá a v případě, že se klíčová slova shodují s obsahem meta tagu, je to pro stránku určitě spíše ku prospěchu. Je ale naprosto zbytečné očekávat, že by se ve výsledcích hledání umístila stránka, která by hledané klíčové slovo neobsahovala v těle stránky, ale pouze v meta tagu, ať už by se jednalo o keywords, nebo description.
3.2.4 Nadpisy a jejich velikosti H1 až H6 Nadpis stránky o velikosti H1
Nadpis stránky o velikosti H2
…
Důležitost a váhu nadpisů můžeme zcela logicky přirovnat ke stejným vlastnostem tagu title, avšak v menší míře. Váha je přikládána prvním třem velikostem a to: H1, H2 a H3. H1 by se mělo na každé stránce objevit pouze jednou, zatímco u H2 a H3 není počet užití nijak omezen. Používání klíčových slov v nadpisech je sice doporučeno, ale v přiměřeném množství. Klíčovým slovům se při jejich užití v nadpisech přidává na důležitosti, nicméně čím by byl nadpis delší, tím se bude snižovat i tento přidělený význam. Pro zachování významu, který nadpisy představují, i pro využití jejich maximálního potenciálu, by se měla zachovat jejich hierarchie a neměly by se navzájem přeskakovat. Příkladem by byla následující logická posloupnost: Planeta Země
Evropa
Česká republika
Praha
Stodůlky
Nárožní
40
3.2.5 Tagy strong a em <strong>tučný text <em>kurzíva
Jakkoliv se nám můžou uvedené značky zdát cizí, jedná se o HTML tagy, které každý uživatel softwaru z řady Microsoft Office důvěrně zná pod zkratkami b a i. Jedná se totiž o vlastnosti textu, které můžeme aplikovat i v rámci webových stránek a jazyka HTML. Je obecně doporučeno klíčová slova v textu v přiměřené míře mít jak tučně tak i kurzívou.
3.2.6 Atributy alt a title v popiscích obrázků
Optimalizace obrázků se stává čím dál tím právoplatnějším, a tím i významným faktorem v SEO. Využívání atributu alt je přitom docela podstatným krokem kupředu, který je velmi často přehlížen. Přímo v návodech a doporučeních vydaných společností Google se využívání zmíněného atributu vřele doporučuje. Proč by nás v tom podporovali, když by to pro ně nebylo důležité? Odpověď je jednoduchá. Fulltextové vyhledávače jsou na tom v podstatě stejně jako nevidomí uživatelé na internetu. Nevidí obrázky, a tak jsou odkázáni právě na atribut alt, který má za úkol daný obrázek jednoznačně popsat. Pokud na webu máme možnost vyhledávání a jako aktivátor vyhledávacího procesu na webu máme obrázek lupy, popis obsahu tohoto obrázku, či chcete-li ikonky, by měl být výraz Hledat nebo Najdi a ne Lupa. Atribut alt se tedy pokládá za důležitý faktor optimalizace pro fulltextové vyhledávače a jeho správnému vyplnění by se měla věnovat nemenší pozornost než jiným on-page faktorům. Atribut title je na druhou stranu volitelným a má za úkol popsat obsah obrázku, nebo ho ještě jinak rozvést či obohatit. Jeho funkcí je zobrazit jím definovaný text poté, co se ukazovatel myši na daném obrázku zastaví. Je mnohem méně důležitý než atribut alt, a tak se jeho vliv na umístění ve výsledcích hledání pokládá za téměř nulový.
3.3 Domény a www adresy Samotný název domény v SEO hraje velikou roli. Dalo by se říct, že stejně jako bychom hledali určitou publikaci v knihkupectví, tak bychom se snažili najít i určitou stránku na internetu. Tituly jsou seřazené v policích tak, že jsou vidět pouze jejich hřbety, u zajímavých a vystihujících názvů se teprve odhodláme k tomu, že si publikaci prstem 41
povytáhneme a prohlédneme její titulku. V případě, že by nás zaujala i titulní stránkou, vytáhli bychom si ji a prolistovali si v ní. Uživatel na internetu bude hledat nejdříve přesnou shodu toho, co hledá. Teprve v případě, že nenajde to, co hledal, upustí ze svých nároků a nechá si nabídnout výsledky hledání ve volné shodě klíčových slov, které původně zadal. Bankovní institut vysoká škola provozuje svoje oficiální stránky na URL adrese www.bivs.cz. Je sice pravda, že jako první možnost uživatel pravděpodobně bude hledat přesné shody s jeho klíčovými frázemi. Nicméně s rostoucím počtem písmen v těchto frázích a naší pohodlností se postupem času ukázalo, že zkratky jsou dobrou volbou. Jednoduchým porovnáním hledaných klíčových slov a frází, přes které se uživatelé k nám na stránky dostali, jsem zjistil že: přes klíčové slovo bivš se k nám na stránky dostalo v roce 2010, 14 845 návštěvníků, zatím co přes klíčovou frázi bankovní institut vysoká škola ve stejném roce bylo 1400 návštěvníků. Je samozřejmostí, že přesné shody názvů domén s hledanými klíčovými frázemi vzbuzují dojem důvěryhodnosti a důležitosti. To však neznamená, a webové stránky BIVŠ jsou důkazem, že se zkrácenými názvy nemůžeme ve světě SEO uspět. Je však dobré si k hlavní doméně zaregistrovat i takové kombinace klíčových slov, které ve svém názvu budou obsahovat spojení podporující dlouhodobý proces budování značky společnosti, a zároveň budou i snadno zapamatovatelná. Příkladem takové domény v souvislosti s Bankovním institutem vysokou školou jsou dva možné zápisy, a to: bankovni-institut.cz bankovniinstitut.cz. Pomlčka v doméně má sice jen pár, ale za to velmi důležitých opodstatnění. Prvním z nich je snadnost verbálního šíření. V rozhlasových spotech, jejichž počet vysílání se v případě BIVŠ ročně blíží pěti stům, nebo praktikách „word of mouth“ marketingu. Druhým, nebezpečnějším důvodem je možnost využití domény podobné té naší k nekalé soutěži. Nechceme přece vynakládat nemalé peněžní zdroje na marketingovou reklamu a
42
podporovat tím konkurenci, která by si velmi podobnou a snadno zaměnitelnou doménu zaregistrovala a přesměrovala na svoji hlavní stránku. V současnosti BIVŠ zmíněnými doménami nedisponuje a nepropaguje je právě z toho důvodu, že jedna z nich je již registrována.
3.3.1 Duplicity URL Registrace mnoha souvisejících názvů domén zvyšuje naše šance na úspěch v dosažení co nejlepších výsledků v SERP. Skýtá však i nebezpečí pro nezkušené správce těchto webových stránek. Nestačí si pořídit domény a obsah jednoho webu nakopírovat na každou z nich či nastavit, aby všechny zobrazovaly stejný obsah. Způsobilo by to obrovské roztříštění, jelikož by vyhledávače zaindexovaly jednu z těchto stránek a zbylé označily za duplicity. Tyto duplicity pak nejsou obsaženy ve výsledcích hledání a způsobují tak nemalé ztráty, jak ve vynaložených výdajích, tak i v předpokládaných příjmech. Za duplicity webových stránek jsou pokládány i takové případy, kde na stejný obsah stránky odkazují stránky umístěné na stejné doméně: http://www.bivs.cz, http//bivs.cz, http://www.bivs.cz/index.html a http://bivs.cz/index.html.
3.3.2 Přesměrování je lék Nesnáze s duplicitami mají své řešení. Je jím přesměrovávání. Máme-li zobrazován duplicitní obsah na našich doménách, měli bychom se rozhodnout pro jednu z nich a označit ji jako hlavní stránku. Obsahem ostatních stránek či domén pak bude jednoduché přesměrování označované stavovým kódem 301. Jedná se o nejvhodnější přesměrování, které nedává robotům vyhledávačů šanci si pomyslet, že by se jednalo o duplicitu. Zároveň při hodnocení stránek vyhledávači kód 301 umožňuje předání části PageRanku stránce, na kterou je přesměrování nastaveno. Existuje mnoho způsobů přesměrování, z nichž některé jsou méně vhodné. Dva nejběžnější způsoby přesměrování jsou použití meta tagu v HTML či funkce header v PHP. V současnosti je přesměrování z adresy http://bivs.cz na adresu http://www.bivs.cz zapsáno právě použitím meta tagu a má tuto podobu: <META HTTP-EQUIV="refresh" content="1; url=http://www.bivs.cz/">
43
Kde content je hodnota zadaná v sekundách, po jejímž uplynutí se uskuteční samotné přesměrování. Je obecně doporučováno tuto dobu mít v takovém rozmezí, aby se načetla stránka. Jelikož se v našem případě jedná o stránku obsahující zhruba 10 řádků kódu HTML, je postačující hodnota pouhé vteřiny. Mnohem přívětivější, a pro vyhledávače a jejich roboty srozumitelnější, je přesměrování v jazyce PHP. Takové přesměrování z adresy http://bivs.cz na adresu http://www.bivs.cz by bylo zapsáno následujícím kódem:
3.3.3 Chybové stránky Zobrazení chybového hlášení Error 404 znamená, že cílová stránka nebyla nalezena. Obvykle jde o stránku, která se zobrazí návštěvníkovi, když se v jeho požadované URL adrese vyskytuje překlep, nebo když stránka na cílové doméně byla odstraněna, popřípadě přesunuta. Problém je, že standardní stránka s chybou 404 uvedená na obrázku 3.4 je ošklivá a neužitečná. Obrázek 3.4: Běžné zobrazení chybové stránky Error 404
Zdroj: http://www.nyx.cz/404 44
Mnoho správců webových stránek přišlo na to, že pokud místo běžné chybové stránky použijí vlastní, mohou tak návštěvníkovi nabídnout mnohem příjemnější východisko ze slepé uličky, do které se neúmyslně dostal. Jak by měla taková správná chybová stránka Error 404 vypadat, aby návštěvníka neodradila? Chybová hláška je napsaná jasně a srozumitelně pro každého návštěvníka. Není nutné uvádět odborné a technické názvy chyby. Je potřeba být lidský a omluvit se za způsobené potíže, ať už je zobrazení této chybové stránky naše vina či nikoliv. Obsahuje popisy možností, co které mohly vést k zobrazení chyby, aniž by z této informace bylo cítit sebemenší obviňování či kárání: o Vysvětluje návštěvníkovi, proč nemohla jím požadovaná stránka být nalezena a zobrazena o Zobrazí stručný seznam běžných chyb vedoucích k zobrazení chybové stránky o Nabídne kontrolu překlepů v požadované webové adrese Umožní návštěvníkovi přejít na jiné důležité stránky o Zobrazí stručné a návštěvníkovi již známé menu o Nabídne odkaz na hlavní stránku domény, stránku s nápovědou a stránku FAQ (Frequently Asked Questions – stránka obsahující často kladené otázky a k nim stručné a výstižné odpovědi) o Představí jiné často zobrazované webové stránky na stejné doméně o Celkově nenabídne více než deset smysluplných odkazů Na přehledném místě zobrazí e-mail na správce webu či formulář pro snadné nahlášení chyb nalezených na stejných webových stránkách Obsahuje vyhledávací proužek pro další snadnou navigaci návštěvníka k jeho cíli Nezobrazuje reklamy a placené odkazy Zdaleka se vyhýbá přesměrování
45
Při tvorbě vlastní chybové stránky není nutné dodržovat všechny tyto kroky, ale je rozhodně potřeba mít na paměti mnohá z těchto obecných doporučení. V dnešní době kaskádových stylů (CSS) je beztak půlka bodů z tohoto seznamu splněna už jen tím, že by se zobrazila prázdná stránka s omluvou. Tím, že je v souborech CSS většinou nadefinována převážná část každého dynamického webu, zobrazí se nám jeho záhlaví, menu, vyhledávací formulář, e-mail správce webu a zápatí i na prázdné stránce. Takovým příkladem je i web BIVŠ, jehož chybovou stránku můžeme vidět na obrázku 3.5. Obrázek 3.5: Chybová stránka webu BIVŠ - www.bivs.cz
Zdroj: http://www.bivs.cz/404error
3.3.4 Sitemap – mapa stránek Tímto cizím slovem je označen výraz pro grafické znázornění architektury webu, neboli mapu stránek. Jejich důležitost se odvíjí přímou úměrou k velikosti a rozsahu webu samotného. Máme-li web o čtyřech stránkách, je tvorba mapy stránek zbytečná. Její kouzlo však ocení správci a majitelé větších webů, jejichž architektura sekcí a podsekcí je natolik rozvětvená, že by se v tom nejen běžný návštěvník, ale i robot fulltextového vyhledávače nevyznal. „Stránky umístěné příliš hluboko ve struktuře webu, na které se dostaneme po třetím, čtvrtém nebo pátém kliknutí myší, jsou pro vyhledávače neviditelné. Mapa stránek může být v takovém případě velmi přínosná.“3 Můžeme tvrdit, že existují dva druhy těchto 3
KUBÍČEK, Michal. Velký průvodce SEO : Jak dosáhnout nejlepších pozic ve vyhledávačích. Praha :
Computer Press, a.s. 2008, s. 174.
46
map. Jeden slouží jako graficky atraktivní rozhraní pro navigaci návštěvníka webem od hlavní stránky až po jeho nejzatoulanější zákoutí (obrázek 3.6). Druhý pak představuje strohý XML soubor, který je nápomocen samotným robotům fulltextových vyhledávačů v jejich dobrodružství celým webem za účelem indexování. Obrázek 3.6: Mapa stránek webu BIVŠ
Zdroj: http://www.bivs.cz/informace/mapa-stranek
47
4 Linkbuilding – budování zpětných odkazů Jak už bylo uvedeno v první kapitole, zpětné odkazy patří mezi off-page SEO faktory a jejich budování je jedním z nejdůležitějších procesů při optimalizaci webových stránek pro vyhledávače. Tento proces se dá považovat za další logický a dlouhodobý krok v SEO, poté co byly webové stránky naplněny zoptimalizovaným a hlavně atraktivním obsahem pro potencionální návštěvníky. Možností a detailů při budování zpětných odkazů je nespočetné množství, a tak je potřeba si je zařadit do širších skupin. „Zpětné odkazy lze: Kupovat Vyměňovat Dále pak zpětné odkazy lze získávat: Přirozeným způsobem Registrací do katalogů Pomocí PR – tiskové zprávy, články, publikování na cizích webech Účastí ve fórech a diskuzích Publikováním a komunikací na sociálních sítích – facebook, twitter, flicker… Na vlastních satelitních webech, takzvaných micrositech Informační a encyklopedické stránky – Wikipedia … Affiliate programy Publikováním na blogu Vytvářením atraktivního obsahu – takzvaný linkbaiting Publikováním v záložkových systémech Na inzertních serverech Černými praktikami – spam, komentářový spam, diskusní spam, viry atd.“ 4 Nejvhodnějším, nejpraktičtějším a fulltextovými vyhledávači nejvíce ceněným způsobem linkbuildingu je samozřejmě budování přirozenou cestou. Řečí marketingu by se tento 4
KUBÍČEK, Michal. Velký průvodce SEO : Jak dosáhnout nejlepších pozic ve vyhledávačích. Praha :
Computer Press, a.s. 2008, s. 190.
48
způsob mohl označit za praktiky připomínající „word of mouth“ marketing. Jedná se o tvorbu tak zajímavého a atraktivního obsahu, že si o tom návštěvníci budou povídat a psát sami od sebe. Z hlediska úspěšnosti při budování zpětných odkazů prakticky platí heslo čím více, tím lépe. Je samozřejmě výhodnější, když na optimalizovaný web směřuje 5 odkazů ze stránek s hodnocením PageRank 6 až 8, než 25 odkazů ze stránek s hodnocením PageRank 2. Nikdo však netvrdí, že se weby s nižším hodnocením nemůžou propracovat do vedoucích pozic a zvýšit tak hodnotu jak svého webu, tak i PageRanku. Opačně například může platit, že weby s vysokým hodnocením mohou obsahovat takové množství odchozích odkazů, že při rovnoměrném rozdělení mezi všechny z původně vysokého hodnocení na nás nezbude skoro nic.
4.1 Kupování zpětných odkazů Nákup zpětných odkazů je praktikou většinou efektivního jednorázového nákupu jejich určitého množství. Existují společnosti nabízející toto určité množství za jimi danou cenu, které si pak paušálně musíme udržovat v aktivním provozu. Dále jsou tu PPC systémy předních světových a místních vyhledávačů a katalogů. Těm bude věnována celá další kapitola. Ať už si vybereme jakoukoliv formu budování zpětných odkazů, musíme pamatovat na jednu důležitou věc. Tempo růstu zpětných odkazů by mělo být pozvolné a rozprostřené rovnoměrně v průběhu času. Nejsou na to přesná měřítka, ale můžeme si být jistí, že pokud během pár týdnů web získá několik tisíc zpětných odkazů, vyhledávače si toho všimnou a budou vědět, že to zcela jistě nebude náhlým zkvalitněním obsahu webu, ale nadměrným a neuváženým nákupem odkazů.
4.2 Výměna odkazů Link exchange má již dlouhou historii. Je to jeden z nejstarších způsobů získávání zpětných odkazů již od dob, kdy se internet teprve probouzel. Patří společně s registrací do katalogů k jednomu z nejsnadnějších a nejlevnějších způsobů získávání zpětných odkazů. Dodnes přetrvávají výměny odkazů v podobě standardizovaného ikonového formátu 88x31 obrazových bodů. Tyto většinou animované upoutávky na jiné weby však z pohledu SEO trpí nepřítomností textu. Právě z tohoto důvodu se trendem staly textové odkazy, které tím, 49
že v sobě mohou obsahovat smysluplná spojení klíčových slov, řeknou robotům vyhledávačů mnohem více, než velmi často nepopsaný obrázek. V obou případech, tedy obrázkového i textového odkazu, jsou pro plné využití síly zpětných odkazů důležité právě jejich popisy. V případě obrázku je to v minulé kapitole zmiňovaný atribut alt a zároveň i samotný název obrázku:
A v případě textových odkazů jsou těmi důležitými SEO faktory anchor text a samotná podoba URL adresy: Bankovní institut vysoká škola – první soukromá vysoká škola v ČR.
Na vzájemné výměny odkazů s partnery je při jejich větším množství třeba vytvořit speciální stránku pojmenovanou například Partneři a asociace, jak to máme udělané na webu Bankovního institutu. Není li však výměn mnoho, můžeme tyto odkazy zobrazit v patičce webu či jiném vyhrazeném prostoru. Dříve byly od těchto výměn očekávány četné návštěvy z partnerských webů. Ze začátku tomu tak i mohlo být, avšak nyní návštěvníci banery a jiné odkazy spíše ze zásady ignorují. Nemusíme se tím ale trápit. To, že se přes zpětné odkazy umístěné na partnerských webech k nám na stránky nedostávají návštěvníci, nám ve skutečnosti až tolik nevadí. Důležité pro nás je, že si těchto odkazů zcela nepochybně všimnou roboti a zaznamenají předání poměrné části PageRanku hostitelské stránky našemu webu.
4.3 Registrace do katalogů Při registracích do katalogů existuje jen pár možností. Když máme dostatek času, předem si vytvoříme plán, kde všude chceme stránky registrovat pro dosažení kýženého výsledku. Pokud ale čas nemáme, svěříme tento lehký, avšak časově náročný úkol, do rukou firem či automatických registrátorů. Ty to sice udělají za nás, ale zato naše stránky zaregistrují do stovek katalogů, o jejichž existenci jsme u dvou třetin z nich neměli ani ponětí. Podle mého názoru vede správná cesta někde mezi těmito dvěma scénáři. Je potřeba si vyhradit nezbytně nutný čas k zamyšlení se nad možnostmi různých katalogů, vybrat ty správné podle jejich obsahu a stávajících nabídek, a zaregistrovat tam dané stránky.
50
Katalogy významných vyhledávačů a registrace do nich by měla být tím základním a hlavním krokem pro zviditelnění na Internetu. Nemusíme ihned vytvořit stovky registrací, stačí základ, na kterém se pak dá jednodušeji budovat. Mezi hlavní katalogy v České republice patří: www.firmy.cz – katalog patřící společnosti Seznam, a.s. provozující fulltextový vyhledávač www.seznam.cz, zpravodajský server novinky.cz a jiné zajímavé weby www.najisto.cz – katalog společnosti Centrum Holdings provozující vyhledávače centrum.cz, atlas.cz a zpravodajský server aktuálně.cz www.dmoz.org/world/cesky – česká verze světoznámého katalogu dmoz.org www.klikni.cz – katalog mediální skupiny Mafra Rozsáhlý seznam českých katalogů je dostupný na adrese: http://seokniha.cz/katalogy Samotná registrace se ve většině případů, jak je vidět na obrázku 4.1, skládá z vyplnění několika základních, avšak podstatných údajů: a) Titulek – se zadává většinou v maximální dovolené délce o 50 znacích. V nich je třeba obsáhnout nejdůležitější klíčová slova a název webové stránky. Obrázek 4.1: Ukázka registrace v katalogu www.katalog-odkazu.cz
Zdroj: http://www.katalog-odkazu.cz/?page=pridat-odkaz
51
b) Popis stránky – běžná povolená délka je 200 – 250 znaků. Zde je opět nutné zopakovat nejdůležitější klíčová slova. Ne však formou výčtu, ale v podobě krátkého, smysluplného a atraktivního textu. c) Zařazení do kategorie – je-li umožněno vybírání ze sekcí a jednotlivých podsekcí, je dobré toho využít. Má-li katalog jistou úroveň, nabídne svým návštěvníkům přehledné a logické rozdělení hlavních oblastí a jejich podoblastí, čímž bude jejich cesta k cíli snadná a rychlá. d) Mezi nevýhody hromadných registrací do katalogů patří nevyhnutelný spam od provozovatelů a jejich systémů, jak po samotné registraci, tak posléze v podobě informačních zpráv. Doporučuji proto pro tyto účely vytvořit emailovou schránku, kterou není třeba aktivně sledovat, či kterou lze postrádat úplně a její případné smazání nezpůsobí žádné potíže.
4.4 Microsites Jestli je tvorba zpětných odkazů přirozenou cestou, tedy tvorba kvalitního obsahu webu, na který lidé budou sami od sebe rádi odkazovat, označována za obdobu „word of mouth“ marketingu, microsites lze označit za obdobu virálního marketingu. Microsites, neboli mikrostránky využívají především weby s širokým záběrem služeb. Ty se pak snaží na jednoduchých, ale zato velmi atraktivních a přehledných webech představit své jednotlivé služby nebo jejich o něco širší okruhy. Mikrostránky mohou plnit hned několik důležitých úkolů. Tím hlavním je samozřejmě poskytnutí prostoru k určitému množství zpětných odkazů. Stránka s kvalitním a příbuzným obsahem určitě zaujme i samotného návštěvníka a odkáže ho na web, kde si může službu objednat. A v poslední řadě bude tato stránka sloužit jako výplň minimálně jedné pozice ve výsledcích vyhledávání fulltextových vyhledávačů, čímž odsune odkazy konkurence a přivede na web více návštěvníků. Příklad dobré mikrostránky, kterou provozuje internetový obchod www.mall.cz může být nalezen na adrese http://www.domaci-pekarny.cz.
52
4.5 Sociální sítě Chce-li firma držet krok s dobou, musí sledovat trendy. O to důležitější je sledování tohoto pravidla ve světě internetu. Sociální sítě jsou nesporně jedním z velkých trendů současnosti. Již skoro neexistují weby, kde by na hlavní stránce vedle sebe nebo pod sebou nebyly ikonky facebook, twitter, flicker, slideshare či youtube.
Zdroj: http://icondock.com/free/vector-social-media-icons
V prosinci roku 2010, jak ukazuje obrázek 4.2, byla v České republice téměř pokořena třímilionová hranice uživatelů Facebooku. Tím se Facebook stává velmi významným prostorem na internetu, kde firmy mohou propagovat nejen své služby, ale i budovat reputaci společně s jejich vztahy se zákazníky. Nabízí možnosti informovat o aktualitách, akcích, výhodných nabídkách, soutěžích či nových produktech, nejen psanou a nezáživnou formou, ale i videem nebo fotkami. Nabízí tak atraktivní možnosti skloubení příjemného s užitečným, komunikace se zákazníky s tvorbou a budováním zpětných odkazů. Obrázek 4.2: Vývoj počtu uživatelů sociální sítě Facebook v České republice za rok 2010 (v tisících)
Zdroj: http://www.czso.cz/csu/redakce.nsf/i/1_uzivatele_facebooku_v_ceske_republice
53
4.6 Linkbaiting Toto spojení dvou anglických slov link (odkaz) a bait (návnada), nemá přesný překlad do češtiny. Nejlépe by se linkbaiting dal přeložit jako nalákání zpětných odkazů. Celá praktika spočívá ve využívání dostupných možností a schopností tvořit tak zajímavé a užitečné věci, že to přiláká pozornost, a tím i nové návštěvníky. Ti o těchto věcech budou psát a odkazovat tím na tvůrcovské weby. Funkci návnad často plní nejrůznější prográmky, kvízy, testy, komiksy, soutěže, hry atd. Jsou většinou zábavné, a jelikož se lidé rádi baví, je to pro ně zajímavé.
4.7 Důležité faktory pro vyhledávače V následujícím seznamu je shrnutí důležitých faktorů, které při zkoumání zpětných odkazů berou fulltextové vyhledávače nejvíce v potaz. Všechny faktory pohromadě slouží vyhledávačům jako jasné vodítko v hodnocení dané stránky. Zpětné odkazy a jejich faktory pro vyhledávače Technická přístupnost odkazu Typ odkazu – text či obrázek Text odkazu v případě textového, či název a popis v případě obrázkového odkazu Text v okolí textového odkazu nebo obrázku Stáří odkazu Technická přístupnost odkazující stránky Typ odkazující stránky – html, pdf, doc atd. Autorita odkazujícího webu Relevance odkazujícího webu Stáří odkazující a cílové domény Odkazová popularita odkazující stránky Relevance odkazující stránky s cílovou stránkou Další obsah odkazující stránky společně s obsahem metadat Umístění zpětného odkazu na stránce
54
Počet dalších odchozích odkazů na stránce Poměr odchozích odkazů vůči ostatnímu obsahu stránky Relevance všech odchozích odkazů na stránce Kvalita ostatních odkazů na odkazující stránce
4.8 Praktiky budování zpětných odkazů Současné trendy při tvorbě zpětných odkazů, ať už klasickou formou či pomocí tvorby zajímavého obsahu, který sám o sobě láká uživatele, aby na něj odkazovali (linkbaiting), jsou otevřenou knihou. Každým dnem se do ní zapíše někdo, kdo právě vymyslel jak na svůj web upoutat pozornost. Stejně tak jako je oblast informačních technologií bez hranic, jsou nekonečné praktiky využívající tyto technologie za účelem přivést na web nového návštěvníka. V následujícím seznamu je uvedena jen část inspirace ze současných trendů linkbuildingu. Jedná se především o využívání vlastních zdrojů k tvorbě dobře vymyšlených věcí, které dokážeme sami, nebo pomocí již existujících služeb na internetu nabídnout potencionálním návštěvníkům. Nabídka již existujících odborných článků, či psaní na míru pro blogy, odborné nebo zpravodajské servery Publikování článků v databázích pro jejich volné šíření, např. www.volneclanky.cz Publikování článků na placených serverech, např. www.placla.cz Využití serverů a distribučních sítí k nabídce vlastních tiskových zpráv Psaní rozhovorů se známými osobnostmi v daném oboru Nákup a výměna zpětných odkazů Nákup PR článků, reklamních prezentací a recenzí Registrace v katalozích. V těch kvalitních zaplatit za rozšířené zápisy. Využívání PPC reklamy za účelem jednorázových promo akcí a přilákání nových návštěvníků
55
Tvorba zajímavých a na internetu často hledaných věcí, např. spořiče obrazovek, tapety na plochu, šablony pro programovou sadu Office nebo návod na něco užitečného Nabídnout něco zdarma ke stažení. Vlastní hru, aplikaci do „chytrých“ telefonů, rozšíření pro Mozillu Firefox, panel nástrojů pro Internet Explorer, software jako open source Využívání affiliate programů Vytváření map v Google Maps, například seznam oblíbených podniků, kde bydlí zaměstnanci, atd. Přispívání do fór a diskuzí z oboru Využívání komentářů na blozích, diskusních a zpravodajských serverech Aktivní přispívání na sociálních sítích Spolupráce s neziskovými organizacemi a charitou, například nadace, sponzorství, dobročinnost, adopce na dálku, adopce zvířat v ZOO, atd. Aktivní provozování, využívání a tvorba Microsites Přidávání odkazů a popisu firmy do příbuzných článků na Wikipedii Pořádání tiskových a odborných konferencí Sdílení prezentací na Slideshare Publikování záznamů z významných událostí na YouTube, Google Videos, Stream a jiných serverech sloužících k zveřejňování videozáznamů a spotů Pořádání či naopak přihlášení do soutěží v oboru
56
5 PPC aneb reklamní kampaně na internetu PPC je zkratka výrazu pay per click, který by se z angličtiny přeložil jako platba za kliknutí. Tento nástroj internetové reklamy byl poprvé nasazen v roce 1998 společností Yahoo! a jeho princip spočíval v platbě za každé kliknutí na reklamu a ne za její pouhé zobrazení. Od té doby začal postupně vytlačovat reklamní systémy CPT – cost per thousand, jehož princip je založen na platbě za tisíc zobrazení. V roce 2000 společnost Google integrovala PPC systém i do svého fulltextového vyhledávače. Ceny za prokliky ještě v té době byly pevně dané a platilo se za jeden tisíc prokliků. Vývojem a stanovováním trendů v oblasti PPC reklamy se na jeho dnešní podobě nejvíce zasloužil Google. V současnosti je považován za nejlepší a nejpropracovanější PPC systém právě Google AdWords. V České republice se první systém PPC reklamy objevil v roce 2002 v podobě kontextové reklamy v síti Etarget. Tyto reklamy byly zasazovány do stránek partnerských webů. Zatímco Google své reklamy nabízel v kontextu klíčových slov při hledání v jeho vyhledávači, Etarget je nabízel v obsahovém kontextu na stránkách partnerských webů registrovaných v jeho databázi. Mezi další, v té době populární kontextové PPC systémy patřil AdFox pocházející z rodiny vyhledávače Centrum. Ten ovšem k 31. 3. 2011 svůj provoz ukončil, uzavřel strategické partnerství se společností Google a stal se tak autorizovaným distributorem služby Google AdWords. Jako poslední z významných hráčů na český trh přišel Seznam, který v roce 2006 nabídl svým uživatelům PPC systém Sklik.
5.1 Google AdWords Prozatím nejrozšířenějším systémem PPC je Google AdWords. Prostřednictvím svého systému zobrazuje reklamy nad výsledky přirozeného fulltextového hledání a v úzkém sloupci na pravé straně vedle stejných výsledků (obrázek 5.1).
57
Obrázek 5.1: Umístění reklamních ploch PPC systému AdWords
Zdroj: http://www.google.cz/#sclient=psy&hl=cs&source=hp&q=kurzy+%C5%A1kolen%C3%AD&aq= f&aqi=g1&aql=&oq=&pbx=1&fp=98e024354688f720
Společnost Google se však neorientuje pouze na zobrazování inzerátů na svém fulltextovém vyhledávači. V roce 2006 totiž plně zprovoznila českou verzi své kontextové reklamy AdSense. Tento systém stejně jako Etarget a v té době ještě existující AdFox, zobrazuje kontextové PPC reklamy v síti registrovaných partnerských webů. Pro poskytování těchto služeb je zapotřebí vyhradit malé místo na webu pro zobrazování reklamy a zaregistrovat ho. Síla těchto inzerátů spočívá především v tematické příbuznosti. Jako společnost provozující soukromou vysokou školu se nechceme ocitnout na webových stránkách pojednávajících o kosmetických doplňcích či levných pneumatikách. Je potřeba mířit reklamu na vlastní cílovou skupinu, to znamená soustředit se na weby provozující seznamy a hodnocení vysokých škol, nebo blogy vysokoškoláků.
5.2 Sklik I když Seznam se svým PPC systémem přišel na český trh až po Google AdWords, získal si velmi rychle své věrné zákazníky. Je to dáno především tím, že zabírají v podstatě dva různé prostory pro zobrazování reklamy, a tak se z důvodu snahy zákazníků pojmout co nejširší záběr potencionálních návštěvníků, prakticky nedají považovat za konkurenci. V očích inzerentů jsou jeden druhému spíše doplňkem.
58
Systém Sklik, stejně jako AdWords, zobrazuje své reklamy nad a vlevo od výsledků přirozených hledání (obrázek 5.2). Inzertní místo nad výsledky přirozených hledání je označováno jako prémiová pozice. Inzerenti, jejichž reklamy se nacházejí v těchto místech, dostávají jako bonus pozici zobrazovanou pod samotnými výsledky hledání (obrázek 5.3). Obrázek 5.2: Umístění reklamních ploch PPC systému Sklik
Zdroj: http://search.seznam.cz/?q=kurzy&sId=u0W4WrRxwPfL3XlH0kGV&sourceid=top&thru=
Obrázek 5.3: Umístění reklamních ploch PPC systému Google AdWords
Zdroj: http://search.seznam.cz/?q=kurzy&sId=u0W4WrRxwPfL3XlH0kGV&sourceid=top&thru=
59
5.3 Pozice inzerátů a jejich klikanost Ač se to tak může zdát, přesnou pozici inzerátu si nelze koupit. O pozici inzerátů rozhoduje více faktorů. Jedním z nich je samozřejmě maximální možná inzerentem nabídnutá cena za proklik. Dalším a neméně důležitým je takzvaný koeficient kvality. Ten se skládá z veličin, jako jsou podobnost a relevance klíčových slov v inzerátu s hledaným výrazem a mírou prokliku. Míra prokliku je hodnota v procentech, jež napovídá, s jakou pravděpodobností uživatelé na inzerát kliknou. Je určená poměrem počtu prokliků a počtem zobrazení inzerátu. Není nezvyklým jevem, že se i přes ochotu zaplatit nejvyšší cenu zobrazují určité inzeráty níže než jejich konkurence, která ve finále za proklik svého inzerátu zaplatí méně.
5.4 Etarget Etarget je nejstarším PPC systémem v České republice. Zároveň je také dodavatelem placených výsledků vyhledávání na slovenském, maďarském, rumunském, srbském, bulharském, chorvatském, polském a rakouském trhu. Jeho síť partnerských webů čítá 1206 českých portálů, na kterých zobrazuje pouze kontextovou reklamu. Mezi nejznámější portály patří: Annonce, iDNES.cz, ihned.cz, lidovky.cz, bleskove.cz, kurzy.cz, evropská databanka – edb.cz, ČeskéNoviny.cz, FinančníNoviny.cz. Mezi nimi také nalezneme i méně známé fulltextové vyhledávače, které inzeráty zprostředkované systémem Etarget umisťují přibližně do stejných pozic jako Google AdWords či Sklik. Vyhrazené místo pro zobrazování kontextových reklam, ať už Etarget či jiných PPC systémů, bývá většinou pod hlavním článkem na dané stránce a v některých 60
případech i v pravém sloupci. Inzerátů je většinou pět a jejich pozice se řadí v závislosti na ceně, kterou inzerent za proklik zaplatí. Shodují-li se částky více inzerentů, jejich místa určí stáří inzerátu podle hesla kdo dřív přijde, ten dřív mele. Obrázek 5.4: Umístění reklamních ploch PPC systému Etarget na serveru www.idnes.cz
Zdroj: http://zpravy.idnes.cz/klauna-muze-vystridat-loutka-komentuji-exministri-plan-vymeny-johna-1k6/domaci.asp?c=A110417_142415_domaci_jan
61
6 Analýza stavu domény www.bivs.cz V případě, že usilujeme o to, aby byly webové stránky Bankovního institutu vysoké školy dobře hodnoceny fulltextovými vyhledávači, je třeba vzít v úvahu a sladit všechna dosud uvedená kritéria, která toto hodnocení ovlivňují. Pak teprve bude vyhledávačům nabídnuta optimalizovaná webová stránka, plná užitečných informací a dalšího zajímavého obsahu, jejíž URL adresu můžeme s jistotou očekávat na prvních pozicích ve výsledcích fulltextových vyhledávání. Obrázek 6.1: Úvodní stránka webu Bankovního institutu vysoké školy - www.bivs.cz
Zdroj: http://www.bivs.cz
62
6.1 Analýza zdrojového kódu Pro detailní analýzu zdrojového kódu lze využít on-line nástroje společnosti SEO Servis na jejich webových stránkách http://seo-servis.cz. Výstup analýzy je uveden v obrázku 6.2. Obrázek 6.2: Výsledek analýzy zdrojového kódu webové stránky BIVŠ
63
Zdroj: http://seo-servis.cz/source-zdrojovy-kod/5559398
64
Je potřeba připomenout, že se zde jedná především o analýzu zdrojového kódu a nikoliv o zkoumání jak působí web na jeho návštěvníka. I když bude webová stránka ohodnocena nejlepší možnou známkou, neznamená to, že se uživatel na nich zdrží o poznání déle než jinde. Je proto nutné mít na paměti, že obsah webu se tvoří především pro jeho uživatele. Výsledek hodnocení analýzy zdrojového kódu je uveden v procentech. Webová stránka Bankovního institutu vysoké školy tedy byla ohodnocena 65 body ze sta. Byly nalezeny následující chyby a nedostatky: Popisek stránky je příliš dlouhý. Ve skutečnosti současný popis stránky je tvořen 27 slovy obsahujícími celkem 186 znaků včetně mezer. Pochybuji, že tento on-line nástroj sleduje SEO standardy pro meta tag description, jelikož současné trendy tvrdí, že jeho doporučená délka je do 200 znaků. Příliš mnoho klíčových slov. Současný počet klíčových slov definovaný meta tagem keywords je 30. Doporučený počet klíčových slov je maximálně 10. Pro dosažení lepšího hodnocení by se měla chyba napravit. Důsledkem jejího vzniku je snaha obsáhnout co největší počet klíčových slov hned na úvodní stránce. Většinou je však web rozvětven do mnoha sekcí a podstránek, které mohou pojmout klíčová slova neobsažená ve výčtu na titulní stránce. Robots.txt neexistuje Na webu neexistuje soubor robots.txt. V případě, že jsou na webu stránky, u kterých nechceme, aby se na ně dostali roboti fulltextových vyhledávačů, je potřeba jim to sdělit právě v tomto dokumentu. Webová stránka BIVŠ nemá žádné takové stránky, a tak chybějící soubor není žádnou chybou, či nedostatkem. Sitemap neexistuje U rozsáhlých webů, jakým www.bivs.cz bezpochyby je, se může stát, že robot fulltextového vyhledávače nenavštíví všechny stránky webu. To by způsobilo, že nenavštívené stránky by nebyly zaindexované v databázích vyhledávačů, a tudíž by logicky chyběly i ve výsledcích hledání. Proto se na webech generují sitemapy,
65
které napevno stanoví všechny stránky, jež má robot navštívit. V současné době na webu BIVŠ existuje pouze grafická podoba sitemapy, a tak je potřeba chybu napravit a vygenerovat stejnou mapu, robotům více srozumitelnou. Stránka obsahuje 10 html chyb. Stránka by měla být validní a bez chyb, jinak se nemusí správně, popř. vůbec zobrazit u uživatele. Stránka obsahuje příliš mnoho inline vložených CSS stylů, které by měly být ve zvláštním souboru. Velikost v CSS navíc: 5.46 kB Stránka obsahuje přímo v html kódu příliš mnoho zbytečného JavaScriptu. Definice JavaScriptových funkcí by měly být bez výhrad ve zvláštním souboru. Velikost JavaScriptu navíc: 11.08 kB Tyto tři chyby spolu úzce souvisí. Velký počet definic a volání jak JavaScriptových funkcí tak i kaskádových stylů stránky nabízí prostor pro překlepy a četné syntaktické chyby. Opravení těchto překlepů je pro získání lepšího hodnocení nezbytné. Stránka obsahuje více nadpisů H1. Nadpis formátu H1 by se na každé stránce měl objevit pouze jednou. Tuto duplicitu tvoří chybně zobrazený obrázek v záhlaví webové stránky. Opravení této chyby je žádoucí z hlediska úbytku důležitosti ostatních nadpisů. Nadpisy na stránce nejsou ve správném pořadí. Nemělo by se skákat například z nadpisu první úrovně na 3. apod. Počet nadpisů formátů H2 a H3 na stránce není nijak omezen, avšak měla by se dodržovat logická pravidla, že by se velikosti titulků neměly přeskakovat. Je samozřejmě příjemné moci se pyšnit bezchybnými stránkami a chlubit se jimi v různých diskuzích a komentářích oborových článků či na samotné stránce společnosti SEO Servis, která nabízí možnost zveřejnit výsledek analýzy. Dá se tak využít jedinečné příležitosti k vytvoření pár hodnotných zpětných odkazů. Proto doporučuji i přes nesmyslnost některých upozornění tohoto on-line nástroje pro analýzu zdrojového kódu uvedené chyby opravit a využít možnosti se stránkami pochlubit.
66
6.2 Google Analytics Služba Google Analytics (GA) měří a poskytuje informace o tom, jak uživatelé internetu měřené weby nacházejí, jak je využívají a jak se uživatelský dojem návštěvníků z webu celkově dá zvýšit. Pomocí poskytnutých údajů se efektivně zlepší návratnost investic, zvýší počet konverzí a navýší profit. Pomocí GA se dá monitorovat pohyb a chování návštěvníků na webu. Zda návštěvníci na web přišli z reklam, výpisu přirozených výsledků hledání, jaký vyhledávač a jaká klíčová slova při hledání použili, jsou informacemi doslova k nezaplacení. Tím spíše v případě Google Analytics, jehož služby jsou poskytovány zdarma. Pro jeho aktivaci je potřeba do zdrojového kódu každé stránky na webu vložit měřicí kód, s jehož pomocí bude možné všechny tyto analýzy procházet v přehledném prostředí Google Analytics (obrázek 6.3). Obrázek 6.3: Prostředí služby Google Analytics v profilu www.bivs.cz
Zdroj: http://www.google.com/analytics/
67
Mezi nejvíce využívané funkce Google Analytics patří různá srovnání stavů minulostí se stavy současnosti. Pro ilustrování těchto měření využiji v grafech a obrázcích data webu www.bivs.cz z ledna roku 2010 a 2011 k vzájemnému srovnání: návštěvnosti webových stránek (obrázek 6.4), využitých vyhledávačů (obrázek 6.5), klíčových slov použitých při hledání ve vyhledávačích (obrázek 6.6), konverzí cílů (obrázek 6.7). Obrázek 6.4: Srovnání návštěvnosti webových stránek
Zdroj: http://www.google.com/analytics/
Z tohoto srovnání je patrné, že leden roku 2011 byl, co se týče celkového počtu návštěv webu, počtu návštěvníky zobrazených stránek a průměrné doby, kterou návštěvník na webu strávil, značně lepší než leden v roce 2010. V lednu 2011 zaznamenal web Bankovního institutu o 12 315 více návštěv než v lednu roku 2010. To je zlepšení celkem o 36 % a z toho plyne, že povědomí o webu a značce BIVŠ je zatím na vzestupu.
68
Obrázek 6.5: Srovnání využití vyhledávačů
Zdroj: http://www.google.com/analytics/
V lednu roku 2011 přišlo z fulltextových vyhledávačů a jejich přirozených výsledků hledání na web www.bivs.cz celkem 13 288 návštěvníků, což představuje 55% nárůst oproti lednu z roku 2010. Tento údaj poukazuje na to, že v průběhu roku 2010 se na webu Bankovního institutu aktivně pracovalo na jeho optimalizaci a že se v tom má nadále pokračovat.
69
Obrázek 6.6: Srovnání klíčových slov použitých při hledání ve vyhledávačích
Zdroj: http://www.google.com/analytics/
Při srovnání klíčových slov je patrné, že se v průběhu roku prováděla optimalizace webu Bankovního institutu se zaměřením na vyznačená klíčová slova v předchozím obrázku.
70
Jejich nárůst byl způsoben tím, že po provedení optimalizace těchto klíčových slov na webu stránky www.bivs.cz byly vypisovány vysoko ve výsledcích SERP a noví návštěvníci si jich tak mohli lépe všimnout. Obrázek 6.7: Konverze cílů, zobrazení sekce kontaktů
Zdroj: http://www.google.com/analytics/
S rostoucím počtem návštěv na webu logicky očekáváme i navýšení konverzního poměru. Na obrázku je zobrazen jeden z nastavených základních cílů, zobrazení kontaktů na webu. V okamžiku, kdy se příchozí návštěvník dostane na stránku s kontakty, připočte se k současnému stavu konverzí jednička. Tímto způsobem lze sledovat veškerý pohyb na webu a sledovat plnění předem stanovených cílů. Nezobrazí-li si návštěvníci stránku s kontakty po delší dobu, bude to signál pro zatraktivnění obsahu a zlepšení navigace k určeným cílům.
71
6.3 Další kroky při optimalizaci webu www.bivs.cz Podrobnějším srovnáváním a analýzou období ledna 2011 jsem sestavil následující návrhy dalšího postupu při optimalizaci webu společnosti Bankovní institut vysoká škola.
6.3.1 Návštěvy
Zdroj: http://www.google.com/analytics/
Návštěvy jsou jedním z nejdůležitějších ukazatelů úspěšnosti webu. Stoupající počet návštěv oproti stejnému období roku 2010 vykazuje, že se na optimalizaci webu aktivně pracuje.
6.3.2 Atraktivní stránky
Zdroj: http://www.google.com/analytics/
Mezi nejnavštěvovanější stránky patří s drtivým náskokem oproti ostatním úvodní stránka. Je to způsobeno tím, že většina zpětných odkazů, reklamních PPC kampaní a výsledků přirozených hledání zavede návštěvníka nejdříve na titulní stránku. Je potřeba podpořit tvorbu zpětných odkazů, které budou směrovat návštěvníky hlouběji do struktury webu, aby se zvyšovalo celkové hodnocení udělované fulltextovými vyhledávači.
72
6.3.3 Odkazující stránky
Zdroj: http://www.google.com/analytics/
Největším zdrojem návštěvníků mezi odkazujícími stránkami se ukázal být katalog Firmy.cz. Jelikož záznam v tomto katalogu dosáhl své maximální možné kvality, je potřeba podpořit jiné, více opomenuté záznamy v ostatních katalozích a na jiných odkazujících stránkách.
6.3.4 Vyhledávače
Zdroj: http://www.google.com/analytics/
Zcela očekávaně jsou favority mezi vyhledávači Google a Seznam. Český vyhledávač je v ČR stále využívanější než Google. Proto je potřeba zacílit kroky optimalizace vstříc českému vyhledávači, aby zobrazenou ztrátu dohnal.
6.3.5 Klíčová slova
Zdroj: http://www.google.com/analytics/
73
Rozbor klíčových slov ukazuje, že se návštěvníci na web Bankovního institutu dostávají většinou hledáním volných shod obsahujících části názvu společnosti či jejího webu. Je potřeba na přední pozice dostat klíčová slova, o která se na poli soukromých vysokých škol neustále bojuje. Klíčová slova, vhodná pro další optimalizaci: vysoké školy, vysoké školy v Praze, soukromé vysoké školy, celoživotní vzdělávání, bakalářské studium, magisterské studium, dálkové studium, kombinované studium, studium MBA, titul MBA, studijní obory, bankovnictví, informační technologie, oceňování majetku.
6.3.6 Zpětné odkazy Celkový počet zpětných odkazů lze zjistit více způsoby. Jedním z lepších je využití on-line nástroje Site Explorer provozovaného vyhledávačem Yahoo!. Podle něj, jak je vidět na následujícím obrázku 6.8, má webová stránka www.bivs.cz 5051 zpětných odkazů.
74
Obrázek 6.8: Výsledek analýzy zpětných odkazů on-line nástrojem Site Explorer
Zdroj: http://siteexplorer.search.yahoo.com/search;_ylt=A0oG7zSVfKtNNDIBmF9dhMkF?p=www.bivs.cz &y=Explore+URL&fr=sfp
Po zohlednění a zapracování těchto postřehů si můžeme být jisti, že se webová stránka Bankovního institutu vysoké školy ocitne na výsluní mezi nejlepšími výsledky vyhledávání ve fulltextových vyhledávačích.
75
7 Závěr V dnešní pohodlné a silně konkurenční době hrají fulltextové vyhledávače velmi důležitou roli při získávání nových návštěvníků. Uživatelé internetu zpohodlněli, a stejně tak jako v běžném životě téměř přestali využívat Zlaté stránky, přestávají postupně užívat i katalogy na internetu. Tato skutečnost působí správcům webových prezentací starosti a navyšuje tím jejich zájem o praktiky SEO. V úvodních kapitolách jsem popsal problematiku optimalizace pro fulltextové vyhledávače společně s historií SEO. Rozsáhlá část byla věnována on-page a off-page faktorům ovlivňujícím umístění webových stránek ve výsledcích hledání. Tam bylo dokázáno, že optimalizace je bitvou na mnoha frontách zároveň. V posledních kapitolách jsem se ujal velení a popsal strategie pokrývající většinu dosud nekrytého bitevního pole. Za vítězství se může pokládat dosažení prvních pozic ve výsledcích SERP.
76
8 Seznam použité literatury 8.1 Tištěná literatura [1]
KUBÍČEK, Michal. Velký SEO průvodce : Jak dosáhnout nejlepších pozic ve vyhledávačích. Brno : Computer Press a.s., 2008. 318 s. ISBN 978-80-251-2195-5
[2]
SMIČKA, Radim. Optimalizace pro vyhledávače – SEO : Jak zvýšit návštěvnost webu. Dubany : Knihkupectví Jasmínka. 2004. 120 s. ISBN 80-239-2961-5 Dostupné z WWW. http://seo/jasminka.cz/seo-kniha.pdf.
8.2 Internetové zdroje [3]
http://blog.h1.cz
[4]
http://napoveda.seznam.cz/cz/fulltext-hledani-v-internetu
[5]
http://napoveda.seznam.cz/cz/hledani-fulltext-algoritmus-vyhledavani-razenivysledku-faq-dotazy.html
[6]
http://onas.seznam.cz/cz/o-firme/historie-firmy
[7]
http://www.google.com/support/webmasters/bin/answer.py?hl=cs&answer=66736
[8]
http://nastroje.dobryweb.cz/validator
[9]
http://seo-servis.cz
[10]
http://www.jakpsatweb.cz/html/bloky.html
[11]
http://www.jakpsatweb.cz/seo/pagerank.html
[12]
http://www.sovavsiti.cz/weblog
77
8.3 Seznam obrázků Obrázek 2.1: Výsledek hledání klíčové fráze „vysoká škola“ na www.google.com ............ 9 Obrázek 2.2: Výsledek hledání klíčové fráze „vysoká škola“ na www.seznam.cz............. 10 Obrázek 2.3: Zahraniční katalogový vyhledávač www.dmoz.com ..................................... 13 Obrázek 2.4: Zahraniční katalogový vyhledávač Directory na www.yahoo.com ............... 13 Obrázek 2.5: Tuzemský katalogový vyhledávač Firmy.cz.................................................. 14 Obrázek 2.6: Tuzemský katalogový vyhledávač Najisto.cz ................................................ 14 Obrázek 2.7: První použitelný vyhledávač - Archie............................................................ 17 Obrázek 2.8: Infografika historického vývoje SEO ............................................................ 22 Obrázek 2.9: Otisk obrazovky, na kterém je obrázkový odkaz ........................................... 24 Obrázek 2.10: Ilustrace systému předávání důležitosti v podobě PageRanku .................... 26 Obrázek 2.11: Graf tržního podílu vyhledávačů v ČR za rok 2009 (v procentech) ............ 30 Obrázek 2.12: Graf průměrného tržního podílu vyhledávačů v ČR za rok 2009 ................ 30 Obrázek 2.13: Graf tržního podílu vyhledávačů ve světě za listopad 2010 ........................ 31 Obrázek 3.1: Google AdWords – Návrhy klíčových slov ................................................... 35 Obrázek 3.2: Analýza hustoty klíčových slov v článku představujícím studium MBA...... 37 Obrázek 3.3: Výsledky hledání výrazu Untitled document ................................................. 38 Obrázek 3.4: Běžné zobrazení chybové stránky Error 404 ................................................. 44 Obrázek 3.5: Chybová stránka webu BIVŠ - www.bivs.cz................................................. 46 Obrázek 3.6: Mapa stránek webu BIVŠ .............................................................................. 47 Obrázek 4.1: Ukázka registrace v katalogu www.katalog-odkazu.cz ................................. 51 Obrázek 4.2: Vývoj počtu uživatelů sociální sítě Facebook v ČR za rok 2010 .................. 53 Obrázek 5.1: Umístění reklamních ploch PPC systému AdWords ..................................... 58 78
Obrázek 5.2: Umístění reklamních ploch PPC systému Sklik ............................................ 59 Obrázek 5.3: Umístění reklamních ploch PPC systému Google AdWords ........................ 59 Obrázek 5.4: Umístění reklamních ploch PPC systému Etarget na serveru .idnes.cz ......... 61 Obrázek 6.1: Úvodní stránka webu Bankovního institutu vysoké školy - www.bivs.cz .... 62 Obrázek 6.2: Výsledek analýzy zdrojového kódu webové stránky BIVŠ ........................... 63 Obrázek 6.3: Prostředí služby Google Analytics v profilu www.bivs.cz ............................ 67 Obrázek 6.4: Srovnání návštěvnosti webových stránek ...................................................... 68 Obrázek 6.5: Srovnání využití vyhledávačů ........................................................................ 69 Obrázek 6.6: Srovnání klíčových slov použitých při hledání ve vyhledávačích ................. 70 Obrázek 6.7: Konverze cílů, zobrazení sekce kontaktů....................................................... 71 Obrázek 6.8: Výsledek analýzy zpětných odkazů on-line nástrojem Site Explorer ............ 75
8.4 Seznam tabulek Tabulka 2.1: Vývoj tržního podílu vyhledávačů v ČR za rok 2009 (v procentech) ............ 29 Tabulka 3.1: Hledanost klíčových frází............................................................................... 34 Tabulka 3.2: Počet nalezených webových stránek na dané klíčové fráze ........................... 34
79