Bankovní institut vysoká škola Praha Katedra Informačních technologií a elektronického bankovnictví
Search Engine Optimization Bakalářská práce
Autor:
Michal Panec DiS. Informační technologie, Manažer projektů IS
Vedoucí práce:
Písek
Ing. Martin Černý
Červen, 2010
Prohlášení: Prohlašuji, že jsem bakalářskou, resp. diplomovou práci zpracoval samostatně a s použitím uvedené literatury.
V Hostíně, 10.6.2010
Michal Panec
Poděkování: Rád bych touto formou poděkoval panu Ing. Martinovi Černému za vedení, připomínky a konzultaci při tvorbě bakalářské práce.
Michal Panec
Anotace Obsahem této bakalářské práce bude zaměření na problematiku SEO optimalizace. Jedná se o postup při vytváření a úpravě obsahu webové stránky. Cílem těchto optimalizací je jednoznačně dosažení lepších pozic při vyhledávání webových stránek s daným obsahem. Optimalizace webových stránek zvyšuje obrat dané firmy a zajišťuje stále více nových klientů, kteří přicházejí na webové stránky pomocí klíčových slov. Další nedílnou součástí SEO optimalizace je analyzování klíčových slov, které určí nejčastěji zadávané slova pro hledání. Dalším cílem této práce bude analyzování a vyhodnocování dosažených výsledků. SEO optimalizace je stálá kontrola nad webovým obsahem.
Annotation The content of this work is focused on SEO problem. This is a method to create and edit Web page content. The aim of optimization is achievement of better positions in searching of web pages with a given content. Website Optimisation increases the turnover of the company and assumes more and more new clients, who comes to the Web sites through the use of keywords. Another integral part of SEO is keywords analyzing that determines the most awarded words for search. Another objective of this work is analyzing and evaluating the results. SEO is a constant control over the content of the Web.
Obsah Úvod ....................................................................................................................... 7 1 Základy SEO ................................................................................................ 8 1.1 Co je to SEO .......................................................................................... 8 1.2 Rozdíl mezi katalogem a vyhledávačem ............................................... 8 1.2.1 Katalog ................................................................................. 8 1.2.2 Fulltextový vyhledávač ........................................................ 10 1.3 Jak funguje Google ................................................................................ 11 1.3.1 Co je to index vyhledávače .................................................. 13 1.4 Známkování webových stránek vyhledávačem ..................................... 14 1.4.1 Pagerank ............................................................................... 14 1.4.2 S-rank ................................................................................... 14 1.4.3 Jyxo rank .............................................................................. 15 1.4.4 Alexa rank ............................................................................ 15 1.4.5 Zjištění ranku webových stránek ......................................... 15
2 Optimalizace stránek .............................................................................. 15 2.1 Validita .................................................................................................. 16 2.2 On-Page faktory .................................................................................... 16 2.2.1 Klíčová slova (keywords) .................................................... 16 2.2.2 Hustota klíčových slov ......................................................... 17 2.2.3 Titulek stránky ..................................................................... 17 2.2.4 Klíčová slova v URL adrese ................................................ 18 2.2.5 Nadpisy ................................................................................ 19 2.3 Off-Page faktory .................................................................................... 20 2.3.1 Zpětné odkazy ...................................................................... 21 2.3.2 Anchor text ........................................................................... 22 2.3.3 Site map ................................................................................ 24 5
3 Zakázané metody optimalizace......................................................... 26 3.1 Cloaking ................................................................................................ 26 3.2 Doorway ................................................................................................ 26 3.3 Deceptive redirect.................................................................................. 27 3.4 Hidden kontent ...................................................................................... 27 3.5 Alt image tag spaming ........................................................................... 28 3.6 Stuffing .................................................................................................. 29 3.7 Link farms ............................................................................................. 29 3.8 Duplicitní obsah .................................................................................... 30 3.9 Kopírování a vykrádání cizích webů ..................................................... 31 3.10 Falešné a konkurenční metaznačky ..................................................... 31 3.11 Spam klíčovými slovy ......................................................................... 32 3.12 Komentářový a katalogový spam ........................................................ 32 3.13 Reakce vyhledávačů na zakázané metody optimalizace ..................... 34 3.13.1 Spam report ........................................................................ 34 3.13.2 Spam report formulář Google ............................................ 35 3.13.3 Spam report formulář Seznam ........................................... 36
4 Analyzování a vyhodnocení dosažených výsledků ................ 38 4.1 Analýzy chování návštěvníků a vyhledávačů ....................................... 38 4.2 Vlastní statistika na serveru ................................................................... 39 4.3 Externí statistiky .................................................................................... 39 4.3.1 Navrcholu.cz ........................................................................ 40 4.3.2 Toplist .................................................................................. 40 4.3.3 Google Analytics .................................................................. 41 4.4 Shrnutí analyzování a vyhodnocení dosažených výsledků ................... 45
Závěr...................................................................................................................... 46 Zdroje ................................................................................................................... 47 Přílohy .................................................................................................................. 51 6
Úvod Cílem této bakalářské práce je seznámení s moderní metodou optimalizace webových stránek pro vyhledávače. Celý název této metodiky úprav zní Search Engine Optimization. V praxi spíše uslyšíme zkrácený pojem SEO. Získávání nových klientů, zakázek a odběratelů je prováděno zejména přes internet. Z tohoto důvodu by se veškeré naše kroky měli ubírat právě správnou optimalizací webových stránek tak, aby se staly pro vyhledávače lákavými. Je mnoho pravd o tvorbě a psaní zdrojového kódu stránek, ale jediným správným ověřením bývají právě dobré pozice webové stránky ve výsledku vyhledávače. Jednotlivé kapitoly práce nás postupně seznámí od základů přes jednotlivé úpravy správné optimalizace webových stránek. V samostatné kapitole přiblížím i zakázané metody optimalizace, kterou chtějí někteří tvůrci předehnat konkurenční webové stránky. V závěru práce bych se rád zabýval následnou analýzou dosažených výsledků. Dobře optimalizovaný zdrojový kód webové prezentace je bez následného ověření zbytečný. Toto téma jsem si zvolil z důvodu tvorby webových stránek a také pro zlepšení svých dosavadních znalostí. Na začátku své tvorby jsem nedosahoval takových výsledků, ale postupem času jsem své znalosti více prohluboval. V jistých případech svých prvních internetových stránek jsem pozoroval obrovský nárůst návštěvnosti. Některé mnou vytvořené webové prezentace vedly k přeskočení placených pozic ve vyhledávačích. Každý tvůrce internetových stránek by měl vytvářet dobře vypadající a uživatelsky oblíbený webový obsah. Při své dlouholeté činnosti jsem nikdy neužil zakázaných praktik nebo jiných metod, jak rychle a jednoduše získat vysoké pozice svých stránek. Neustálé vytváření nových metod a doporučení při tvorbě internetových stránek, mě vede k neustálému sledování aktuálního dění v této oblasti. Obecně platí, že techniky používané před několika lety, jsou v současnosti upravené nebo zcela nevyužívané. Získat zkušenosti v této oblasti nebývá složité, ale při neustálém zdokonalování dříve nebo později ztrácíme pojem o dané problematice.
7
1 Základy SEO V této kapitole se budu snažit vysvětlit pojmy jako je SEO, index vyhledávače, hodnocení webových stránek (rank stránek). Dále objasním základní rozdíly mezi katalogem a fulltextovým vyhledávačem. Popíši ve stručnosti základní principy fungování vyhledávače Google. V neposlední řadě se zaměřím na vyhledávání aktuální hodnoty daného hodnocení stránky. Veškeré tyto pojmy jsou důležitým předpokladem pro pochopení následujících kapitol.
1.1 Co je to SEO SEO je zkratka anglického slova Search Engine Optimization, v překladu znamená optimalizace pro vyhledávače. Tato optimalizace se zabývá metodikou vytváření a upravování internetových stránek takovým způsobem, aby jejich forma a obsah dosáhly co možná nejlepších výsledků v internetových vyhledávačích. Cílem SEO optimalizace je dosáhnout ve výsledku vyhledávače pro webovou prezentaci co možná nejvyšší pozice, která odpovídá danému obsahu, a tím přivádí více nových návštěvníků. [1]
1.2 Rozdíl mezi katalogem a vyhledávačem Základním úkolem každé webové stránky je sdělování informace popř. prodávat výrobky, proto je důležité, aby naše stránky vyhledalo velké množství lidí (potencionálních zákazníků). Pokud při hledání daného obsahu neznáme přesnou URL adresu nazpaměť jediné, co nám zbývá, je hledání pomocí katalogu nebo využití vyhledávače k nalezení požadovaných informací. [2] Katalog shromažďuje odkazy na další webové stránky, které bývají setříděny do určitých kategorií, aby bylo možná snadnější orientace při hledání dané problematiky. Na rozdíl od katalogu vyhledávač hledá v celém obsahu daného webu. [2]
1.2.1 Katalog Katalogy jsou webovým místem, které shromažďují odkazy na jiné webové stránky a portály. V těchto katalozích jsou webové odkazy tříděný do jednotlivých sekcí. 8
Při hledání v katalogu můžeme procházet jednotlivými sekcemi nebo vyhledávat podle jednoduchých dotazů. Při přidávání záznamu provedeme registraci do příslušné vybrané sekce. Po následné kontrole správnosti vložených údajů, úpravu a doplnění provede správce katalogu vložení tohoto záznamu do katalogu. [2] Tabulka č.1 Nejznámější české katalogy Seznam Tiscali Centrum Atlas
http://www.seznam.cz/ http://www.tiscali.cz/ http://www.centrum.cz/ http://atlas.centrum.cz/
Tabulka č.2 Nejznámější zahraniční katalogy DMOZ Yahoo
http://www.dmoz.org/ http://www.yahoo.com/
Při vyhledávání v katalogu se porovnává hledané slovo s nadpisem odkazu, jeho popisem a u některých katalogů i s tvarem zadané URL adresy. Důležité je připomenout, že při řazení výsledků vyhledávání se nebere v potaz samotný obsah webu. [2] Pořadí v katalogu lze ovlivnit vhodným výběrem klíčových slov nadpisu záznamu, popisem stránky a optimalizací URL adresy. Hustota klíčových slov a správné použití v kontextu má také obrovský vliv. Veškeré záznamy vložené do katalogu kontrolují lidé a proto nemůžeme vložit posloupný výpis klíčových slov. Takto vybraná klíčová slova pro SEO optimalizaci použijme i pro záznam do katalogu. Zásadně nevyužívejme přídavná jména a různé superlativy v popisu webové stránky, které mají nulovou informační hodnotu a nejsou tak vhodná. Většina katalogů také neumí skloňovat klíčová slova. Z tohoto důvodu je možné vyhledat vždy jen přesně vložené klíčové slovo. V opačném případě uživatel nedostane žádný výsledek. Vlastní řazení proběhne podle klíče. Většina dnešních katalogů má tento klíč podobný. Na prvních pozicích se řadí placené odkazy a to v pořadí podle zaplacené částky. Na dalších pozicích se zařadí neplacené odkazy a to podle výše hodnocení z fulltextu. Český katalog Seznam řadí podle S-ranku, Centrum provádí řazení dle svého rankingu fulltextu Morfeo. [2] V neposlední řadě je dobré si uvědomit, že registrací odkazu do katalogu zřídíme zpětný odkaz. Tvorba zpětných odkazů je jedna z části SEO optimalizace. Takto vytvořený zpětný odkaz tvoří dobrý základ pro posílení pozice ve vyhledávači. [2] 9
1.2.2 Fulltextový vyhledávač Fulltextový vyhledávač má za úkol hledat a stahovat dokumenty (webové stránky, dokumenty textových editorů, PDF atd.), které zapisuje do své databáze. Těmto úkonům zápisu do databáze říkáme indexace. Na základě takto vytvořené databáze umožní návštěvníkům vyhledávat jednoduché i složité dotazy. Google je jeden z nejznámějších zahraničních fulltextových vyhledávačů. Seznam, Jyxo a Morfeo patří mezi české internetové fulltextové vyhledávače. Většina dnešních vyhledávačů prohledává celý obsah daného dokumentu, takovým vyhledávačům potom říkáme fulltextové. [3] Fulltextový vyhledávač tvoří dvě základní části. První část je tvořena robotem, který je také nazýván crawler, spider, bot nebo pavouk a druhá webovým rozhraním. Základní činností robota je prohledávání webových stránek, stahování souborů a jejich indexaci. Další možné rozdělení robota by bylo na getter, který pouze stahuje soubory a indexer, který má za úkol soubory zpracovat a uložit do databáze pro další potřeby vyhledávače. Činnost robota nelze řídit, ale je možné zakázat indexaci některých stránek pomocí definice v souboru robot.txt. Tento soubor se nachází v kořenovém adresáři internetové prezentace. Robot si pamatuje, kde byl a v jeho algoritmu je přesně naprogramováno, kdy se na danou navštívenou stránku vrátí. Vyhledávači je možné zaplatit za pravidelné indexace dané webové stránky. [3] Registrace webové stránky do vyhledávače většinou postrádá smysl. Každý robot je schopen si danou stránku najít sám. Provádět registraci bez odkazu na stránku nepomůže. Výjimku tvoří pouze české stránky, které mají jinou doménu než .cz (například .com nebo .org). Takové stránky vyhledávače Jyxo nebo Morfeo indexují automaticky na základě vložení do některého katalogu. Pokud stránka nebude vložena do katalogu, je možné ji zaregistrovat do vyhledávače přímo. [3] Při zadání hledaného výrazu na webové stránce vyhledávače se porovnává dotaz s databází. Řazení výsledků vyhledávání je u moderních vyhledávačů tvořeno kombinací četnosti výrazu a popularity webové stránky (ranking). Fulltextový vyhledávač Google využívá PageRank, zatímco český vyhledávač Seznam používá jiný algoritmus nazývaný S-Rank. Přesný algoritmus řazení znají pouze programátoři. [3]
10
1.3 Jak funguje Google Google se skládá ze serveru obsahujícího seznam URL adres, které v pravidelných intervalech rozesílá pavoukům. Stažené webové stránky jsou odeslány do skladového serveru nazývaného storeserver. Následně jsou stránky zkomprimovány a uloženy do depozitáře. Každé stránce je posléze přiřazeno unikátní identifikační číslo docID. O indexování se stará tzv. indexer, který bývá nepostradatelnou součástí vyhledávače. [4]
Obrázek č.1 Cesta informace databázemi Google [4]
Každý dokument je následně převeden do souboru slovních spojení zvaných hity. Tyto hity obsahují záznam o slovu, pozici v dokumentu, přibližnou velikost fontu a jeho řez (tučně, kapitálky, kurzíva). Indexer odešle tyto hity do tzv. barelů, kde jsou připraveny pro odeslání k uživatelům. Následně je každé slovo převedeno na další unikátní 11
identifikační číslo wordID. Indexer současně spolupracuje se sdíleným slovníkem. Po převedení slova na wordID se jeho výskyt zapíše do seznamu v barelech. [4] Indexer dále plní funkci extrakce odkazů z indexovaných stránek. Zaznamenává nejenom samotnou URL adresu v odkazu, ale také tzv. anchor text, tedy text, který obsahuje uvedený odkaz. Do procesu vstupuje další program URLresolver, který čte text v odkazu a následně převádí relativní odkazy na absolutní. Tyto odkazy řadí podle docID. Následně tyto odkazy páruje s již obsaženými stránkami zpracované v rejstříku. Z takto vytvořené databáze se následně čerpá při výpočtu PageRanku všech dokumentů. [4] Google uchovává index všech svých internetových dat na řadě oddělených serverů, které se nacházejí na různých místech světa. Takové servery nazýváme Google Data Center a jejich úkolem je uchovávat informace. Většina Data Center je tvořena obyčejnými PC, která využívají upravenou verzi operačního systému GNU/Linux. Následné dotazy jsou pak distribuovány do jednotlivých Data Center pomocí hlavního Google server. Při volbě Data Centra dochází k výběru podle aktuálního vytížení a rozhoduje i geografická poloha uživatele. Postupná aktualizace indexu je způsobena aktualizací serverů jeden po druhém. [4] Z důvodu postupné aktualizace každého serveru je možné pro daný web získat více různých indexů v různém čase. Proces je někdy nazýván jako Google Dance. Tyto pohyby indexování umožnily sledovat začátek procesu aktualizace a bylo možné současně odhadnout konečný index webu. V dnešní době již tento stav nenastává. Aktualizace se v současné době provádí průběžně. [4] V minulosti existovalo odhadem deset Data Center. Každé toto centrum mělo svůj název (např. http://www-ab.google.com, http://www-ex.google.com atd.). Začátkem ledna 2004 byla tato centra nahrazeny bezmála půl stovkou nových. V současnosti jsou tato Data Centra přístupná pomocí IP adresy. Při změně na webu můžeme obdržet přibližný odhad finálního ohodnocení klíčových slov vyhledávačem Google za pomoci kontroly jednotlivých Data Center, protože ty jsou aktualizovány mnohem dříve než hlavní server na google.com. [4] Oblíbenost Google docílila založení inzertního systému Google AdWords a Google AdSense. Google AdWords umožňuje po založení účtu u společnosti Google vkládat inzeráty, které se zobrazí při fulltextovém vyhledávání ve zvláštním sloupci. Zobrazení je podmíněno finančními prostředky na účtu. Vložení inzerátu nese i své zásady. Je omezeno na rozsah a jeho obsah je také limitován. K vloženému inzerátu je možné zvolit několik 12
klíčových slov, po jejichž zadání vyhledávač Google zobrazí právě daný inzerát. Každé kliknutí na inzerát je poté zpoplatněno. Cenu za každé kliknutí si zvolí každý uživatel sám, ale minimální částku vždy stanoví Google. Cena za kliknutí má poté vliv na pořadí zobrazení daného inzerátu. [5]
1.3.1 Co je to index vyhledávače Pojmem index vyhledávače rozumíme databázi všech slov vyskytujících se v prohledávaných webových stránkách, která má za úkol urychlení vyhledávání. V současnosti rozeznáváme dva typy indexů. [4] Invertovaný index je řazený abecední seznam všech termínů, které se vyskytují na webové stránce. Současné internetové vyhledávače využívají právě tento typ indexu. Invertovaný index vytvoří slovník tvořený ze všech slov v daném dokumentu nebo souboru dokumentů (stránek) a každému slovu přiřadí dokumenty, ve kterých se nachází. Také přiřadí jeho pozici v rámci dokumentu jak je patrné na následujícím obrázku. [4]
Obrázek č.2 Výpis z indexu vyhledávače [4]
Druhým typem indexu je příponový strom. Jak již název napovídá, vytváří stromovou strukturu na ukládání řetězců znaků nad danou abecedou. Tento typ je vhodnější pro práci s frázemi. Následně se s ním rychleji pracuje, ale hůře se udržuje a vytváří. [4]
13
1.4 Známkování webových stránek vyhledávačem Všeobecně slouží rank k ohodnocení webové prezentace. Každý fulltextový vyhledávač obsahuje několik takových ranků, ale propaguje vždy jen jeden hlavní a ostatní jsou skryté. Internetových vyhledávač Google hodnotí stránky dle svého hodnocení, které je nazýváno PageRank. Oblíbený český vyhledávač hodnotí své stránky dle svého S-Ranku. V současné době nemá rank stránky veliký vliv na řazení výsledků vyhledávače. Na řazení výsledků se podílí mnoho dalších faktorů, které jednotlivé vyhledávače neprozrazují. Všeobecně platí, že čím je vyšší rank, tím je webová prezentace kvalitnější. Ranky mají 3 základní funkce. V menší míře se podílejí na řazení výsledků vyhledávače. Dle hodnoty se řídí počet návštěv webové stránky vyhledávacím robotem, který je také označován jako tzv. crawler. Poslední funkcí je zobrazení určité odvozeniny ranku, která se zobrazuje následně uživatelům některého toolbaru (doplňující lišta do prohlížeče). [6]
1.4.1 Pagerank Pagerank je algoritmus sloužící k ohodnocení webových stránek. Tento algoritmus tvoří základní pilíř světového vyhledávače Google. Byl navržený Larry Pagem a Sergeyem Brinem. Čím vyšší je hodnota Pageranku, tím je webová stránka kvalitnější. Přičemž Pagerank nabývá hodnot od 0 do 10. K výpočtu hodnoty Pageranku se využívá složitý algoritmus, který využívá strukturu hypertextových odkazů jako vzájemné doporučování stránek. [7]
1.4.2 S-rank S-rank je ukazatelem dobře zpracované webové prezentace a zaměřuje se především na český internet. Vyhodnocuje webové prezentace pro český internetový vyhledávač Seznam. Budování S-ranku se vyplatí při působení webové stránky na českém internetu. Hodnocení se soustředí jak na počet odkazů vedoucích na naši internetovou prezentaci tak i na jejich kvalitu. Dále hodnotí kvalitu webových stránek, na které odkazujeme my, proto je nezbytné pravidelně kontrolovat tyto odkazy. Hodnota S-ranku se pohybuje od 0 do 100, a vzrůstá po 10. Čím vyšší je hodnota, tím lepší je webová prezentace. [6]
14
1.4.3 Jyxo rank Vyhledávač Jyxo využívá algoritmus Jyxorank. Jyxorank určuje, jak moc jsou stránky známé a oblíbené na internetu. Výpočet je prováděn z množství odkazů na daný web. Vyšší hodnotu Jyxoranku získá web, na který odkazuje mnoho lidí. Tento rank je využíván pro české prostředí internetu. Jyxorank nabývá hodnot od 0 do 220. [6]
1.4.4 Alexa rank Alexa je název internetového vyhledávače. Alexa rank hodnotí doménu na základě návštěvnosti jednotlivých stránek uživateli, kteří mají nainstalovaný Alexa toolbar. Velikosti ranku ovlivňuje počet uživatelů, kteří vstoupí na náš web. Toto hodnocení nabývá hodnot od 1 do 10 000 000. Čím vyšší je hodnota, tím je postavení stránek horší. [8]
1.4.5 Zjištění ranku webových stránek Dnešní internetový prostor nabízí hned několik nástrojů pro zjištění aktuální hodnoty daného ranku. Pro nalezení daného nástroje využijeme některého z vyhledávačů. Po zadání názvu daného ranku dostaneme výpis vyhovujících stránek. Mnohé nástroje nabídnou zjištění více ranků najednou. Při tvorbě vlastních internetových stránek vím, že velikost ranku má vysoký vliv na cenu za umístění odkazu na tomto dobře hodnoceném webu.
2 Optimalizace stránek V následující kapitole se budeme věnovat jednotlivým úpravám zdrojového kódu webové prezentace, tak aby byl pro vyhledávače žádanější. Zaměřím se na validitu zdrojového kódu, která bývá hlavním problémem. Objasním rozdíly mezi On-page a Off-page faktory. V následujících podkapitolách postupně projdeme jednotlivé faktory, které ovlivňují umístění ve výsledcích vyhledávání. Vybereme pouze ty, které mají největší podíl a je potřeba se zaměřit právě na ně. Vysvětlím i pojem mapa webu, který výrazně zjednodušuje orientaci na daných webových stránkách.
15
2.1 Validita Pojem validita se dá vysvětlit jako syntaktická správnost zdrojového kódu webové stránky podle daných pravidel a standardů. Validita je jedním z měřítek definující kvalitu internetové prezentace. Pokud je zdrojový kód stránky validní, její tvůrce dodržel definovaná pravidla a standardy. Validní webová stránka se nepotýká se špatným nebo jiným zobrazením, které tvůrce nezamýšlel. Běžného uživatele prohlížejícího webovou stránku nebude zajímat její zdrojový kód, ale bude se ohlížet na obsah a grafické zpracování dané stránky. Většina vyhledávačů se snaží spíše o hodnocení očima běžného člověka a dává přednost kvalitnímu obsahu. Proto je již na každém tvůrci zda dodrží všechny standardy pro psaní zdrojového kódu internetové prezentace. [9] Pokud si na veřejně přístupném validátoru (např. validačním nástroji konsorcia W3C) necháme ověřit zdrojový kód webové stránky, kterou vyhledávač zařadil na první pozici, zjistíme, že drtivá většina takto úspěšných stránek nemá validní kód. Kvalitní a dobře strukturovaný obsah je důležitější pro optimalizaci pro internetový vyhledávač. [9]
2.2 On-Page faktory Vše co na našich internetových stránkách dokážeme ovlivnit, nazýváme On-Page faktory. Mezi tyto faktory zařazujeme veškeré HTML značky a jejich uskupení ve zdrojovém kódu. Dále pak navigační prvky a všechny části webové stránky, které můžou ovlivnit výsledky ve fulltextových vyhledávačích. Tyto faktory by měl každý dobrý tvůrce využívat již při samotné tvorbě. [10] Základní chybou mnohých autorů a návodů popisující jak optimalizovat internetové stránky je pouze snaha se zaměřit se na validitu HTML kódu. Tento přístup však není dobrým základem úspěchu. Základním problémem On-page faktorů není pouze validní kód, ale problematika je mnohem složitější. Mezi nejdiskutovanější elementy On-page faktorů patří zdrojový kód webové prezentace, nadpisová struktura, description (popisový meta tag), keywords (klíčová slova) a správná tvorba titulků webové prezentace.
[10]
2.2.1 Klíčová slova (keywords) Důležitou částí optimalizace jsou právě klíčová slova. Pokud daná webová stránka nebude obsahovat klíčové slovo, které zadáme do vyhledávače, pak se stránka neobjeví ve výpisu vyhledávače. Veškerá klíčová slova charakterizují konkrétní web. Takto vybraná 16
klíčová slova je dobré použít i pro inzerát, který vkládáme na inzertní webové servery. Při zadání vybraných slov dojde k zobrazení právě námi vloženého inzerátu ve výsledku vyhledávání. V opačném případě bude výsledek vyhledávání nulový. Klíčovým slovům se podřizují i texty na webu, nadpisy, odkazy. Vše musí být přirozené, naším hlavním cílem by měl být uživatel. [11] Veškerá klíčová slova je dobré si stanovit hned na začátku tvorby webové stránky. Než se pustíme do určování klíčových slov pomocí nejrůznějších nástrojů, je dobré provést průzkum prostředí spojené s tématikou webu. Nejlepším řešením je vytvoření jednoduchého dotazníku, který necháme vyplnit majitele budoucích stránek, zaměstnance, ale také zákazníky. Z těchto dotazníků dostaneme seznam klíčových slov. [11] Při vytváření webových stránek pro společnost prodávající několik výrobků, vedli mé kroky vždy k rozdělení do samostatných stránek. Raději jsem využil pět oddělených stránek pro každý výrobek, na kterých jsem mohl samostatně optimalizovat klíčová slova pro daný produkt. Vždy se mi vyplatilo toto řešení, než využití jedné stránky pro více výrobků.
2.2.2 Hustota klíčových slov Klíčová slova by se měla na stránkách objevovat v takové míře, aby nebudila dojem nečitelného nebo nesrozumitelného textu. Vždy se snažíme počet klíčových slov omezit na hranici, kdy zachováme dobrou čitelnost daného obsahu na webové stránce. Optimální hodnota výskytu není stanovena přesnou hranicí. Při tvorbě vlastních webových stránek se řídím pravidlem používat klíčová slova v rozumné míře. Veškeré snahy s použitím několikrát opakovaného klíčového slova v obsahu je negativně ohodnoceno a má velký dopad na výsledky vyhledávače. [12]
2.2.3 Titulek stránky Pokud provádíme optimalizaci pro vyhledávače, je dalším důležitým prvkem právě titulek stránky. Pokud naše webové stránky navštíví některý z robotů, první na co se zaměří, bude právě titulek, který je poté zobrazen při výsledku vyhledávání jako první. Správným vytvářením titulků webových stránek zlepšujeme své pozice v internetových vyhledávačích. [13]
17
V zásadě se při tvorbě titulku stránky musíme držet základních pravidel. Nezahrnujeme do titulku název firmy, ale využijeme prostor spíše pro klíčová slova, která uživatelům přiblíží danou internetovou prezentaci. [13] Délka titulku má také svá pravidla nebo spíše doporučení. Pokud se soustředíme na vyhledávač Google, který je schopný zobrazit 65 znaků a Seznam 67 znaků, bude optimální hodnota titulku 64 znaků. Tuto hodnotu doporučuje i asociace W3C. Zásadně neopakujme slova v titulku stránky, která jsou vyhledávači brána jako spam. Obecně platí, že každá stránka má mít svůj vlastní unikátní titulek. [13] Při vytváření optimalizace spousta internetových prezentací kopíruje konkurenci a tak je možné spatřit při výsledku vyhledávání naprosto stejné titulky webů. Je možné využít některé znaky, jako jsou např. závorky, tečky, šipky, které oživí podobné titulky. Ve většině případů takto upravený titulek zaujme daleko více, než odkaz na první pozici. V praxi se doporučuje vytvoření nového titulku ihned při tvorbě následující webové stránky, proto aby nedošlo k jeho zkopírování. [13] Při tvorbě vlastních webových stránek jsem se vždy snažil využít některého klíčového slova právě do titulku. Tento čas strávený nad správným výběrem titulku internetové prezentace se velice vyplatil. Internetová prezentace v krátké době vystoupala na první pozice při zadání klíčového slova, které jsem využil do titulku.
2.2.4 Klíčová slova v URL adrese Použití klíčových slov v URL adrese je velice důležité a to stejně jako v doméně. Při optimalizaci pro vyhledávače se setkáme s výrazem SEO friendy URL (SEF) nebo také cool URL. Ukázku dané SEF adresy vidíme na následujícím obrázku. [4]
Obrázek č.3 Rozdíl mezi generovanou adresou URL a SEF URL [4]
Každá jednotlivá stránka se chová na serveru jako pevný dokument. Proto takto vytvořené URL adresy jsou raději indexovány než dynamické adresy s mnoha otazníky, 18
lomítky a proměnnými. Tyto URL adresy se snáze zapamatují a lépe popisují konkrétní stránku. Běžný uživatel při pohledu na takový odkaz přesně ví, co na takové stránce může očekávat. Dynamický odkaz nám mnoho neřekne. [4] Dalším pravidlem bývá neměnnost URL. Pokud z nějakého důvodu potřebujeme adresu změnit, je lepší tento krok ošetřit na straně serveru přesměrováním s upozorněním v hlavičce dokumentu. Při příchodu vyhledávače na původní stránku dochází ke zjištění z přesměrování v hlavičce, že obsah stránky je trvale přesunut na jiné místo. Je Důležité vědět, že i přes odstranění některé adresy si je vyhledávač schopen stále tuto adresu pamatovat. [4]
2.2.5 Nadpisy Každý nadpis tvoří základ dobře strukturovaného dokumentu. Nadpisem bychom měli stručně charakterizovat následující text. Nadpis první úrovně tvoří element H1 a měl by se vyskytovat v dokumentu pouze jednou. Pokud však máme logické důvody k využití více nadpisů této úrovně, může být začleněn tento element vícekrát. Nadpisy nižších úrovní se označují H2 až H6. Správné využívání nadpisů je základem úspěchu. Nedoporučuje se přeskakovat z nadpisů druhé úrovně na první, ale postupovat vždy od první úrovně níže. [14]
19
Obrázek č.4 Ukázka struktury nadpisů
Většina uživatelů má problémy se čtením dlouhého nestrukturovaného dokumentu, tvořeného několika stránkami nepřerušovaného textu. Použitím nadpisů ulehčujeme práci v orientaci v dokumentu. Takto strukturovaný text bude pro uživatele daleko příjemnější. Důležitá je patrná struktura dokumentu na první pohled. [14] I vyhledávače kladou velký důraz na dobře vytvořené nadpisy jednotlivých kapitol. V nadpisu by měla být obsažena hlavní myšlenka celého textu, aby daný uživatel zadáním klíčového slova našel právě daný text. V zásadě se vyvarujte používání obecných termínů typu kapitola 1. [14]
2.3 Off-Page faktory Vše co naši webovou stránku ovlivňuje, ale nenachází se na ni, nazýváme Off-Page faktory. Jedná se především o zpětné odkazy, které jsou směrovány na danou stránku. V zásadě se nejedná jen o odkazy směrované pouze na konkrétní stránku, ale i odkazy, které vedou z vlastní webové stránky. Jednoduše se jedná o součet všech odkazů, které se nacházejí na stránce a podle důležitosti v sobě vyjadřují ranking stránky. Mezi další Off-Page faktory řadíme anchor text, kterému se bude věnovat samostatná kapitola. V neposlední řadě nás bude zajímat také mapa webu (site map). [3]
20
2.3.1 Zpětné odkazy Tento pojem chápeme jako odkazy, které se nachází na jiných webových stránkách a jsou směrovány na naši webovou prezentaci. Zpětné odkazy můžeme zakoupit nebo vyměnit. Zakoupený zpětný odkaz je po zaplacení dané částky za zobrazení zveřejněn. Naproti tomu výměna funguje na principu vzájemné výměny odkazů. Za zobrazení zpětného odkazu se neplatí žádná finanční částka, ale je podmíněna výměnou odkazů obou stránek. Při nedodržení zobrazení odkazu většina webů stahuje odkaz ze svého prostoru. Další možností získání je přirozenou cestou, kdy z důvodu kvalitního webového obsahu se na nás ostatní uživatelé budou odkazovat sami. Existuje ještě mnoho cest jak získat kvalitní zpětný odkaz a to buď registrací do katalogů, účastí ve fórech, publikování na blogu, inzercí na vlastních satelitních webech. Při výběru máme tedy hned několik hledisek jak získat zpětný odkaz na své webové stránky. [4] Při veškerém budování zpětných odkazů záleží na kvalitě stránky, z níž je odkazováno. Pokud na naše stránky bude odkazovat dvacet webů s Pagerank 6/10 bude to lepší než třicet stránek s Pagerank 2/10. Čím vyšší je hodnocení stránky s naším odkazem, tím více vyhledávač vidí důležitost našich vlastních stránek. Nemusíme se obávat poklesu našeho hodnocení, pokud odkazujeme na stránky s nižším hodnocením. Vyhněme se pouze odkazům na stránky se špatným obsahem. Poté můžeme značně poškodit vlastní stránky. [4] V žádném případě však není na škodu mít odkazy z méně hodnocených stránek. Výpočet hodnotnosti a relevantnosti stránky je dán kombinací kvality a kvantity zpětných odkazů. Jedna z dobrých cest je vybudování sítě výměnných odkazů se svými obchodními partnery, spřátelenými weby a dodavateli v našem odvětví. Model prosíťování je opět účinnější otevřený než uzavřený. Na internetu stále hledejme vhodná umístění pro odkaz na své webové stránky. Čím více stránek bude obsahovat odkaz na váš web, tím budou výsledky lepší. Postupem času se může z méně hodnocené stránky stát lépe hodnocená a náš odkaz náhle stoupne na ceně. [4] Vždy při odkazování na svůj web mějme na paměti, že neodkazujeme pouze názvem vašich stránek, ale snažme se začlenit i klíčová slova. Text obsažený ve viditelné části hypertextového odkazu má zásadní vliv na vnímání stránky, na které odkazuje. Tento text je označován jako anchor text, kterému bude věnována následující kapitola. Vyhledávač Google postupně přesouvá svůj důraz spíše na autoritu domény a počtu citací, nicméně správným zapsáním tohoto textu napovíme vyhledávači mnohé o dané stránce. [4]
21
Ukázka nevhodně zapsaného odkazu: Více o stolním tenise se dozvíte na následujícím odkazu
zde. Ukázka vhodně zapsaného odkazu:
Vše o stolním tenisenajdete právě na tomto místě. Ukázka nejlépe zapsaného odkazu:
Stolní tenisnezisková organizace. Více o
termínech zápasůzde.
Při hledání umístění zpětných odkazů si vytipujte vhodné stránky. Pamatujme na to, že umístění se stává lepší na webových stránkách stejného zaměření. Algoritmus, který hodnotí příbuznost tematického zaměření, nazýváme Topic Rank. Na základě příbuznosti daných tematických zaměření se řadí posléze do tzv. clusterů. Pokud se naše webová stránka zařadí mezi podobné tematicky zaměřené stránky, je to jenom dobře. Primárně se snažme vyhledávat weby se stejnou tématikou, na místo naprosto odlišných. [4] Pokud budeme na Internetu propagovat jen hlavní stranu, nedosáhneme žádné vysoké návštěvnosti. Čím větší bude počet jednotlivých WWW stránek, tím více práce nás bude čekat. [4] Z mé vlastní zkušenosti s prodejem na Internetu vytvářím zpětné odkazy přímo na stránku s nově přidanými výrobky. Snažím se získat odkazy u firem, které daný produkt využívají nebo jej distribuují. Nevyužívám k nabídce nových výrobků hlavní stránku, kde většinou představuji danou webovou stránku. Z důvodu lepší propagace výrobků se mi vyplatí vytváření zpětných odkazů na jednotlivé stránky.
2.3.2 Anchor text Velké množství lidí (uživatelů) si ani nedokáže představit význam nebo pojem slova anchor text a přitom jsou s ním v každodenním kontaktu. Pod pojmem anchor text rozumíme viditelnou část hypertextového odkazu, která může značně vylepšit naše webové stránky. Většina fulltextových vyhledávačů velice ocení, pokud je tento odkaz tvořen klíčovými slovy. Na základě těchto klíčových slov, které jsou zahrnuty v odkazu je možné zjistit obsah dané webové prezentace. Po následné analýze odkazované stránky přidá zvýhodnění na slovní spojení, které tvoří již zmiňovaný anchor text. Odkazy jsou tvořeny 22
s ohledem na optimalizaci, ale pokud by to bylo spíše na škodu, nemusí být takto vytvořeny. S dobrou optimalizací klasických odkazů se setkáme na internetové encyklopedii, která se jmenuje Wikipedie. Každý článek, který na ni najdeme, obsahuje mnoho odkazů. Po bližším prozkoumání pozorujeme dobře zvolené anchor texty. Více ukazuje následující obrázek. [15]
Obrázek č.5 Praktická ukázka odkazů v článku [15]
Například vyhledávač Google kromě anchor textu porovnává okolí odkazu a také téma dané stránky. Z tohoto důvodu pro nás bude mnohem cennější, pokud odkazy budou směřovat na podobně zaměřené stránky. V jednoduchosti by se dalo říci, že odkazy vedoucí na dovolenou ve Španělsku, prodej mobilních telefonů, odkazy na stažení filmů a obchod s čluny nebude příliš dobré řešení. Daleko výhodnější jsou dobře zaměřené odkazy na stránce, než vytvoření dlouhého seznamu všeho možného. Vše má i své nevýhody, vytvoření takového výběru dá značně vyšší úsilí. Z hlediska PageRanku mají větší hodnotu stránky bez těchto naprosto nesmyslných odkazů na všechno možné.
[3]
Při porovnání zda je lepší textový nebo obrázkový odkaz, vychází daleko lépe využívat textový odkaz z důvodů, které budou uvedeny v následujícím odstavci. Už jen z praktického hlediska snadné úpravy textového odkazu, změny pomocí CSS (kaskádové styly) mohou dostat pěkný vzhled a v neposlední řadě jsou okamžitě stažené i na pomalém připojení. Na rozdíl od obrázkového odkazu, který je velice nepraktický. Z důvodu daleko větší velikosti bývá doba stažení mnohem delší a hodnota pro vyhledávač je nulová. Pokud i přes všechno musíme využít této možnosti, nezapomene na dvě nepostradatelné vlastnosti alt a title. V případě opomenutí těchto vlastností a vypnutí zobrazení obrázků ze strany uživatele, by se nic nezobrazilo. Této situace předejdeme právě vlastností alt, která se 23
zobrazí. Při najetí na daný obrázek vlastnost title zobrazí určitý textový popisek. Pokud porovnáme informační hodnotu pro vyhledávač, u obrázkového vidíme pouze dvě vlastnosti, nikoliv však co je na obrázku. Ve shrnutí nemají obrázkové odkazy takovou váhu jako anchor text. [3]
2.3.3 Site map V jednoduchosti bychom mohli Site map přirovnat k mapě webových stránek. Vytvořený soubor slouží k orientaci a informaci o jednotlivých stránkách webové prezentace. Site map umožní informovat vyhledávače o URL adresách, které se nacházejí na vašich webových stránkách. Zmiňovaný protokol již podporuje Google, Microsoft, Yahoo a pár měsíců i český vyhledávač Seznam. [16] Soubor sitemap.xml, který se nachází v kořenovém adresáři webové stránky, pomáhá indexovacím robotům v lepší indexaci obsahu. Pokud robot přijde na váš web a nalezne zmiňovaný soubor, máte mnohem větší šance indexace všech stránek. Prohlížečům sděluje důležitost vašich stránek a jejich aktualizaci. [16]
Obrázek č.6 Ukázka souboru sitemap
Pro praktickou ukázku přikládám stručný výpis takového sitemap.xml. který je zapsaný v kódování UTF-8. Tento soubor jsem vytvořil pomocí jednoduchého generátoru dostupného na Internetu.
24
•
- Zapouzdřuje soubor a odkazuje na aktuální standard protokolu.
•
- Nadřazená značka pro každou zadanou adresu URL.
•
- Adresa URL stránky musí být v absolutním tvaru, která je zakončena zpětným lomítkem.
•
- Datum poslední změny souboru ve formátu W3C pro datum a čas.
•
- Předpokládaná frekvence změn stránky.
•
<priority> - Priorita dané adresy URL ve vztahu k ostatním URL adresám na vašem webu. Rozmezí platných hodnot je 0.0 až 1.0. [16]
Při tvorbě souboru sitemap si jistě klademe otázku, zda ho vytvořit ručně nebo přenechat vytvoření online generátoru. Při malém rozsahu webových stránek doporučuji využití ručního vytvoření sitemap.xml. Pokud již webová prezentace disponuje stovkami stránek, které by při ručním vytváření mohly být špatně napsány, pak je lepší využít k tvorbě online generátor. Výhodu ruční tvorby máme rozhodně v určení priorit jednotlivým stránkám. Tuto možnost generátor nenabídne a přidělí všem stejnou prioritu. Ve většině případů doba vytvoření sitemap souboru je závislá na rozsáhlosti webové stránky. Existují i jednoúčelové aplikace, které po vložení adresy webové prezentace vytvoří tento soubor. Jako příklad uvedu aplikaci s názvem WonderWebWare SiteMap Generator, která je freeware. Při vytvoření souboru jakýmkoliv způsobem je pak vhodné použít následnou kontrolu. [16] Site map je z principu určený pro roboty, ale může být využitý i pro běžné návštěvníky. Pomocí jednoúčelových programů lze vytvořit z tohoto souboru schéma. Stejně jako soubor pro zakázání přístupu robota do určitých míst i tento soubor hledá robot v kořenovém adresáři webové prezentace. [16]
25
3 Zakázané metody optimalizace Tato kapitola se bude věnovat zakázaným metodám optimalizace webových stránek. Je dobré se seznámit s metodami, kterých bychom se měli při tvorbě vyvarovat. Obsahem práce není vysvětlení jak obejít nebo jiným způsobem vylepšit skóre webových stránek. Podle aktuálních informací vznikají stále nové a další důmyslnější metody, proto zde vysvětlené zakázané metody optimalizace nejsou v žádném případě všechny. Objasním také postavení vyhledávačů k těmto metodám používaných při tvorbě webových stránek.
3.1 Cloaking Metodu Cloaking bychom mohli volně přeložit jako podstrkávání, která označuje podvodnou techniku optimalizace pro vyhledávače. Stručně řečeno jde o způsob, kdy se snažíme podstrčit vyhledávacímu robotovi jiný obsah, než skutečnému návštěvníkovi webových stránek. [17] Vyhledávací roboti posuzují kvalitu webové stránky podle zdrojového kódu a obsahu (tzv. On-Page faktory). Metoda Cloaking je založena na podstrčení upravené webové stránky na míru algoritmu vyhledávajícího robota. Webová stránka je potom vyhodnocena robotem jako kvalitní a následně je díky tomu posunuta ve vyhledávání výše. Běžnému návštěvníkovi se zobrazuje obyčejná stránka. Rozlišení přístupu od běžného uživatele a vyhledávajícího robota se děje na základě IP adresy. Při zjištění přístupu vyhledávajícího robota dojde k podstrčení upravené stránky za pomoci serverového skriptu. [17] V dnešní době již tento způsob podvodu příliš nefunguje. Převážná většina vyhledávačů za použití této metody navíc penalizačně trestá. Cílem snažení vyhledávačů je tvorba ochrany jako obrana proti umělé manipulaci s výsledky vyhledávání. K odhalování slouží i konkurence, která přes spam report (viz. kapitola 3.13.1) nahlašuje podezřelé stránky. [17]
3.2 Doorway Další metoda zakázané optimalizace se nazývá Doorway a je založená na manipulaci s vyhledávači. Slouží k ovlivnění výsledků, jak bude webová stránka 26
hodnocena. V překladu by se tento druh metody nazýval jako podvodné vstupní stránky. Úvodní stránka je vytvořena tak, aby získala vysoké hodnocení robotem. Takto upravená úvodní stránka by běžnému uživateli nepřinesla žádný užitek. Z tohoto důvodu je opět pomocí serverového skriptu přesměrován na další, která se již stává pro uživatele zajímavou. V principu je tato metoda velice podobná předchozí zvané Cloaking. [18]
3.3 Deceptive redirect Metoda Deceptive redirect je další podvodnou optimalizací webové stránky a její český název zní klamavé přesměrování. Zjednodušeně řečeno uživatele přesměruje na jiné cílené místo. Uživatel při prohlížení webové stránky klikne na odkaz, který si vybral právě podle popisu daného odkazu. Z tohoto popisu se domnívá, že obsah ukrývající odkaz bude pro něho relevantní. Při zobrazení však dostává naprosto jiný druh obsahu, než obsahoval daný popis. V tomto případě došlo k přesměrování na naprosto odlišné místo. Podvodné klamavé přesměrování se také využívá při konkurenčním boji na internetu. Uživatel je přesměrován na výrobek konkurence při prokliku na konkrétní výrobek. [19]
3.4 Hidden content Metoda Hidden content je založena na skrývání textu nebo odkazů. Takový způsob je opět brán jako pokus o podvodný způsob získání lepších výsledků. Toto chování je vyhodnoceno jako nedůvěryhodné ze strany vyhledávačů. Z logického hlediska je samozřejmé, že zobrazování jiných informací pro vyhledávače a jiné pro běžného návštěvníka webových stránek je nepřípustné. [4] Veškerý text na webové stránce, který nevidí běžný uživatel, je brán jako skrytý. Ne rozlišuje se jakým způsobem je daný text zamaskován. Mezi nejčastější metody jak schovat text nebo nadbytečná klíčová slova patří využití barvy stejné s pozadím, umístění textu pod obrázek, skrytí textu pomocí kaskádových stylů a nastavení velikosti písma na nulovou hodnotu. [4] Jsou různé důvody, proč tvůrci webových stránek využívají Hidden content. Mezi důvody patří nesmyslné napsání textu od zákazníka, který trvá na dané stylizaci obsahu a není tedy možné zakomponovat důležitá klíčová slova. Vzhledové působení webu je možné také narušit použitím klíčových slov, které výrazně změní vzhled dané webové 27
stránky. Takový problém správce webových stránek vyřeší skrytím potřebných klíčových slov před zraky klienta a budoucích návštěvníků. [4] Při použití atributu H1 (nadpisový tag) na název dané stránky dochází k výraznému posílení důležitosti. Takto vytvořený text je následně schován pomocí kaskádových stylů a na místo textu se návštěvníkovi zobrazí grafické logo. Při hlubším prozkoumání tohoto řešení by se mohlo mluvit o neškodné záležitosti. Ovšem ze strany vyhledávače by se mohlo jednat o využívání skrytého textu v obsahu stránek. Při tomto zjištění by taková stránka mohla být penalizována. Z tohoto důvodu využití stylově vytvořeného grafického loga firmy nebývá dobrým řešením. Pokud i přes všechna varování chceme využít takto skrytý text, pomocí kaskádových stylů, je nezbytné, aby daný text odpovídal tomu, co je na obrázku. V opačném případě špatného nebo naprosto odlišného popisu obrázku se opět bude jednat o nepovolenou praktiku. V neposlední řadě je možné také využití značky alt, která je právě k popisu obrázku určena. [4] Obdobné řešení se využívá při skrývání odkazů. Pod výrazem skrytý odkaz si představme odkaz, který je před zraky uživatelů schován a vyžívá se pouze pro procházení robotů. Pro toto schování využijeme skrytý text, zmenšení pomocí kaskádových stylů na velikost jednoho pixelu nebo schováním do malé pomlčky nebo tečky. [4] Z vlastní tvorby webových stránek jsem nebyl do současné doby nucený použít metodu Hidden content pro získání lepších výsledků, protože využívám optimálního rozložení klíčových slov do textu a z tohoto důvodu dosahuji stejných výsledků.
3.5 Alt image tag spaming Metodou Alt image tag spaming (zaspamování popisů obrázků) se tvůrci snaží nashromáždit do svých internetových stránek co nejvíce klíčových slov, které se jinak v celém obsahu nevyskytují. Při vložení klíčových slov pomocí popisů nebo spíše alternativních textů v parametru alt docílí zlepšení počtu klíčových slov, které by v případě vložení do obsahu naprosto znehodnotily webovou stránku. Vyhledávač Google přikládá velkou váhu na parametr alt. Pro nalezení obrázku vyhledávačem je brán za základ popis a text nacházející se okolo obrázku. Zaspamování popisů u obrázku získáme jednoznačně lepší pozice při řazení výsledků. [20] Skutečným účelem parametru alt je zobrazení alternativního textu při nezobrazení nebo zákazu zobrazení obrázku ze strany uživatele. Nikoliv však k získání lepších pozic při řazení výsledků. Parametr alt je dobré využívat, ale neměl by sloužit k nashromáždění 28
velkého množství klíčových slov. Při popisu obrázku využijeme krátkého výstižného popisu konkrétního obrázku. [20]
3.6 Stuffing Metoda, která je založena na často se opakujících a matoucích slovech a je nazývána Stuffing. Tato slova jsou nesmyslně opakovaná například v předchozí metodě zaspamování parametru alt. Bez přesného důvodu jsou často zařazována do souvislého textu a budí dojem něčeho nadbytečného. Běžný text je uměle doplněn o klíčová slova a vypadá následujícím způsobem. [21]
Příklad využití metody Stuffing: Náš hotel nabídne příjemné prožití prázdnin (levné ubytování, Internet, bazén, tenisové kurty, mp3, stahování filmů, dovolená, sport).
Příklad je značně nadnesený, ale při bližším pohledu na dnešní internetové stránky je možné takto nesmyslný text najít. K těmto praktikám tvůrce nevede ani tak nízká znalost českého jazyka jako spíše touha vměstnat zajímavá klíčová slova do obsahu. Rozumnější a zkušenější tvůrci vyhledávají lepší možnosti začlenění zajímavých slov do textu.
[21]
Stuffing se nevyskytuje jen v běžném textu, ale můžeme ho najít v meta značkách webových prezentací typu keywords, description nebo title. Použití několikanásobné zkopírování slova ve značce title, nemá naprosto žádný význam. Ve výsledku budou mít slova naprosto stejný význam, jako osamocené slovo. Lepších výsledků tak nedosáhneme, naopak obrovské množství slov bude odměněno penalizací. Naprosto stejného výsledku dosáhneme při zaspamování meta značek. [21]
3.7 Link farms Patičkové farmy jsou označeny anglickým výrazem Link farms a obsahují nepřeberné množství externích odkazů. Jedná se o několik set nebo i tisíců stránek vzájemně provázaných
odkazy. Po příchodu vyhledávače na stránky dochází
k zaindexování, a protože je obsaženo obrovské množství vzájemných zpětných odkazů, přiřadí vysoké hodnocení. Tyto jednotlivé stránky nepřinášejí žádnou informační hodnotu a pro uživatele nemají žádný význam. Přesto se objevují ve výsledcích vyhledávání. Často 29
takové stránky vznikají na subdoménách, které při penalizaci zrušíme a přestěhujeme celou farmu odkazů na jiné místo. Veškeré toto snažení zvyšuje ranking daných stránek. [22] Jediné nebezpečí hrozí v případě odkazování na tyto špatné stránky. V opačném případě nedojde k žádnému negativnímu projevu, pokud link farma odkazuje na naše stránky. Toto má své praktické odůvodnění. Podobně by šlo bez přičinění zlikvidovat konkurenční stránky pouhým umístěním odkazu na některou z takových farem. Zápatí s více jak dvaceti nerelevantními externími odkazy považujeme za Link farmu. Dnešní vyhledávače se snaží postihovat weby s více jak šedesáti externími odkazy. [22]
3.8 Duplicitní obsah Duplicitní obsah vzniká tehdy, pokud větší množství různých adres URL směřuje na totožnou webovou stránku nebo na stránky s podobným obsahem. Nejčastějším typem duplicitního obsahu jsou stejné webové stránky, na které je možné odkazovat např. čtyřmi různými adresami. [23]
http://plastiko.cz/ http://plastiko.cz/index.htm http://www.plastiko.cz/ http://www.plastiko.cz/index.htm
Většina vyhledávačů nabízí ve výsledcích vyhledávání kvalitní webové stránky, které se neopakují nebo si nejsou velice podobné. Z tohoto důvodu jsou vyhledávače velice citlivé na duplicitní obsah stránek. Z uvedeného příkladu si vyhledávač vybere vždy jen jednu verzi a ostatní nezobrazuje při výsledku vyhledávání. V některých případech naprosto ignoruje zpětné odkazy na ostatní varianty URL a daná webová stránka ztrácí hodnocení, které určuje její pozici. [23] K duplicitnímu obsahu může dojít velice jednoduše. Při zadání adresy na webovou stránku využíváme www, ale v některých případech zadáme adresu bez www. Používáme tak 2 různé adresy vedoucí, ale ke stejnému obsahu. Pokud využíváme více domén, které směřují ke stejnému zdroji, je lepší využít přesměrování na straně serveru hlavičkou 301 nebo 302 na jedinou zvolenou adresu. Drtivá většina vyhledávačů tento krok respektuje a pochopí tak, že hodnocení jednotlivých stránek domén sčítá. [23] 30
Osobní tvorba webových stránek mě několikrát přivedla na přesměrování pomocí meta značky typu refresh přímo ve zdrojovém kódu konkrétní stránky. Přesměrování jsem využíval hlavně z důvodu nemožnosti konfigurace webového serveru. Při nastavení vlastního webového serveru bych raději volil přesměrování pomocí hlavičky 301. <meta http-equiv="refresh" content="10;url=http://www. lhota-mlckovsky.eu/"> Na tomto konkrétním zápisu ukazuji přesměrování z jedné domény na druhou. Hodnota 10 určuje dobu, po které dojde přesměrování. Po uplynutí doby dochází k přechodu na udanou URL adresu.
3.9 Kopírování a vykrádání cizích webů Obecně se vyhledávače k takovému vykrádání webových stránek staví velice negativně. Zejména český vyhledávač Seznam. Jako příklad je možné uvést naprosto nový web, který neobsahuje žádné texty a pouze využije kopií dat stažených z jiné webové stránky (bez souhlasu vlastníka původních webových stránek). Při tomto zjištění, kdy vyhledávač Seznam kontaktuje danou stránku a ověří si odcizení textů, dojde k tomu, že zařadí kopírovanou webovou stránku na černou listinu. Ke zjištění může docházet v zásadě dvěma způsoby. Jednak si tohoto zneužití všimnou sami administrátoři vyhledávačů nebo se konkrétní majitel ukradených textů přihlásí sám. Jeho povinností je doložení autorství. Vyhledávače využívají jednoduché nástroje, které porovnávají stáří shodných textů, vyberou vždy ten starší. [21]
3.10 Falešné a konkurenční metaznačky Typickým příkladem špatného využití SEO technik je zneužití meta značek. I v tomto případě se využívá spojení, které naprosto nezapadá nebo nesouvisí s obsahem webové stránky. Využívají se slova, která jsou často vyhledávaná. Taková klíčová slova se používají k lákání návštěvníka na webové stránky. [24] Při zneužití této techniky je návštěvník, který zadá klíčové slovo hledaného produktu naveden naprosto do jiných míst. Obvykle i na stránky konkurence, které však nemá s daným produktem nic společného. Konkurence takto může využívat značky
31
renovované a zavedené firmy, na jejímž budování se nepřičinily. Každý vyhledávač má za svůj cíl nezneužívání těchto meta značek ve svůj prospěch. [24]
3.11 Spam klíčovými slovy Metoda Spamu klíčovými slovy je podobnou technikou jakou jsme se zabývali v předchozí kapitole. Často se tyto dvě zakázané metody objevují v kombinaci. V praxi se jedná o velké množství naprosto nesouvisejících klíčových slov obsažených v metaznačce typu KEYWORDS. Z důvodu zlepšení vyhledávání využívá tvůrce značek konkurence, názvy měst a začleňuje i velké množství duplicitních slov. Takto přespamované značky meta typu KEYWORDS nebývají dobrou vizitkou kvalitního autora webové stránky. [24]
3.12 Komentářový a katalogový spam Další rozšířenou technikou je komentářový spam. Jeho výskyt můžeme pozorovat hlavně na nechráněných blogovacích systémech. Velmi často jsou tyto spamy vytvořeny za pomoci robotů a programů, kteří danou práci odvedou rychleji než ruční vkládání. Například volně dostupný skript Dity (Did I tell you?). Tento skript funguje na principu zadání jména, odkazu a textu. Skript automaticky zadá vyhledávačům dotaz, který podle jistých symptomů zobrazí adresy nechráněných diskusí, fór a komentářů na blozích. Na základě tohoto seznamu začne rozesílat hromadný komentářový spam. Veškeré tyto operace bývají otázkou několika sekund. Účel této metody vede k získání více zpětných odkazů na stránky. [25]
Reakce na tento nešvar bývá zavedení do blogovacích programů (Blogger, WordPress) hodnotu nofollow (následovat) parametru rel. V praxi opatření znamená zamezení viditelnosti pro robota takového odkazu. Tento odkaz vyhledávací robot nenásleduje a nepředává mu žádný PageRank. V současné době hodnotu nofollow přidává i známá otevřená encyklopedie Wikipedia, která se stávala cílem spamerů s odkazy. Pro příklad uvádím zápis takového odkazu. [24]
Plastiko
32
Podobně lze velice snadno získat odkazy i v katalozích, které mají automatické zařazení nově vložených odkazů. Malé katalogy jsou po čase naprosto bez kontroly z důvodu nárůstu velkého množství registrací a takový správce přehlíží podezřelé odkazy. Tímto lze velice snadno přijít k obrovskému množství zpětných odkazů. [24] Cílem spamerů se stávají nejrůznější inzertní servery. V mnohých případech se zaměřují i na stránky obecních nebo městských úřadů. Praktickým důvodem je jednoznačně velice dobré hodnocení těchto stránek. Často tyto webové stránky úřadů umožňují velice jednoduché vložení inzerátu místních firem bez kontroly. Takový inzerát bývá ve tvaru odkazu a krátkého popisu činnosti. Seznam webových stránek, kde je možné jednoduše vkládat bez následné kontroly je velice cenný. [24] Penalizace za odkaz na komentářový nebo katalogový spam nehrozí. Z praktického hlediska za toto nelze trestat. Tato technika je velice jednoduše zneužitelná a mohla by sloužit k jednoduché likvidaci konkurence. V praxi penalizují vyhledávače pouze za aktivity nebo změny na stránkách, kde autorem je správce webové prezentace. Nikoliv však za aktivity vně takových stránek, za které nemusíte být zodpovědní. Potrestáni mohou být
paradoxně
provozovatelé
nechráněných
blogů
s otevřenými
komentáři
nebo bez ochrany pomocí obrázkových kódů. Tyto obrázkové kódy nazýváme CAPTCHA. Příklad takového obrázkového kódu ukazuje následující obrázek. [24]
Obrázek č.7 Ukázka obrázkového kódu proti spam robotům
S podobným typem obrázku se setkáváme při vyplňování formulářů, kde jsme vyzváni k opsání kódu z obrázku. Bez toho opsání do příslušné kolonky vyplněný formulář nelze odeslat. V současné době programátoři těchto spamerů jsou na takové úrovní, že obcházejí i tyto obrázkové kódy. ponechání formuláře bez ochrany.
Z principu věci je lepší alespoň tato ochrana, než
[26]
S obrázkovými kódy se setkávám prakticky denně. Při objednávce zboží naprostá většina internetových obchodů využívá tohoto zabezpečení, které považuji za dobré. Při využití obrázkových kódů vzniká problém rozluštit zamotané obrázkové kódy. 33
Z tohoto důvodu jsou pak použitelnější logické hádanky jako např. „jaro a ? (léto)“ nebo doplnění obecně známého faktu např. hlavní město ČR?
3.13 Reakce vyhledávačů na zakázané metody optimalizace Po zjištění těchto praktik má vyhledávač v zásadě dvě možnosti. U automatického rozpoznávání parser, který rozděluje stránku, zjišťuje implementaci některé známé zakázané metody optimalizace. Parser si testem hustoty slov všímá opakovaných slovních spojení, stejné barvy pozadí s textem, přesměrování a skrytého textu pomocí kaskádových stylů. Při zjišťování podstrkávání se na danou webovou stránku vyšle robot tvářící se jako webový prohlížeč (návštěvník), a výsledky se porovnají s obsahem, který získal vyhledávající robot. Tímto způsobem lze velice jednoduše odhalit podezřelou stránku. Takto zjištěná stránka je odeslána administrátorovi k prověření. [24] Ruční kontrola funguje na principu upozornění konkrétní podezřelé stránky ze strany uživatele (návštěvníka), konkurence nebo od poškozeného majitele webové stránky. Některé případy odhalí samotní administrátoři. Okradení majitelé stránek mají právo nahlásit podezření na odcizení obrázků nebo textů. V takovém případě administrátoři rozhodují, kdo je majitelem daných materiálů. K rozhodnutí využívají datum uveřejnění. Jak nahlásit podezřelou stránku se budou věnovat následující podkapitoly. [4]
3.13.1 Spam report Termínem Spam report označujeme způsob vyrovnání se s konkurencí, která využívá nepovolené techniky SEO. Při zjištění jednoduše nahlásíme danou webovou stránku vyhledávači, který v obvyklých případech postihuje tvrdou penalizací. Odesláním spam reportu se nedopustíme ničeho nečestného. Ve většině případů přispíváme k odhalení ovlivňování výsledků vyhledávače. Pomocí spam reportu je možné velice jednoduchým způsobem bojovat s tvůrci těchto nepovolených praktik. Většina dnešních vyhledávačů nabízí jednoduchý spam report formulář. U některých je zapotřebí odeslání emailu. V následujících kapitolách se budu zabývat spam report formuláři vyhledávače Google a Seznam. [27] Osobně spam report využívám velice často. Při zjištění spamu na některých webových stránkách nahlašuji toto porušení, abych zamezil šíření pro mě neetických
34
praktik. Z mého pohledu si nepřipadám, jako někdo, kdo kazí druhým vysoké pozice ve výsledku vyhledávání.
3.13.2 Spam report formulář Google V této samostatné kapitole se budu snažit nastínit používání spam reportu vyhledávače Google. Jednoduchým popisem vysvětlím každou položku formuláře.
Tento formulář naleznete na adrese: http://www.google.cz/contact/spamreport.html
Obrázek č.8 Ukázka spam report formuláře Google
První řádek tohoto formuláře nás vybídne k zadání přesného dotazu, který jsme zadali do vyhledávače Google. Osobně jsem zadal „google spam report“. Následný odkaz, který vygeneroval po vyhledávání Google, zkopíruji do druhého řádku formuláře (např. http://www.google.cz/#hl=cs&source=hp&q=google+spam+report&lr=&aq=f&aqi=&a ql=&oq=&gs_rfai=&fp=15d0aff19ebe9d8). Do třetího řádku jsem zapsal odkaz na podezřelou stránku. Následně jsem zatrhl, co na stránce není v pořádku. Mohl jsem vybírat z následujících možnosti. Skrytý text nebo odkazy, nesmyslná nebo opakující slova, stránky, kde není možné najít obsah, který Google nabídl v popisu, stránky 35
využívající podstrkávání, klamavé přesměrování, podvodné vstupní stránky, duplicitní weby nebo obsahy, ostatní. Poslední textové pole je možné využít k bližšímu popisu problému na stránce. Po stisknutí tlačítka submit došlo k odeslání mého reportu. Využití tohoto reportu je možné i pro uživatele s částečnou znalostí angličtiny.
3.13.3 Spam report formulář Seznam Seznam ve většině případů reaguje velice rychle na nahlášení spamu SEO. Po nahlášení jsou z výsledků vyhledávání webové stránky odstraněny zpravidla do druhého dne. To může mít pro jisté stránky nepříliš dobrý dopad. Z dnešního pohledu Seznam doručí na webové stránky polovinu návštěvníků. Zvláště u mladých stránek nebo stránek, které se nesnaží za každou cenu získávat odkazy i z jiných webů, to může být devastující. Toto se týká i webových stránek, které na své propagaci a reklamě příliš nepracují. [4] V některých případech pro stránku na černé listině používáme také výraz „zabanovaná“. Pokud již nastane tato situace a dojde k blokaci webových stránek, je v první řadě potřeba odstranit zdroj blokace. O návratu dané webové stránky rozhoduje administrátor ruční kontrolou, z tohoto důvodu může odblokování trvat i několik měsíců. Postupně prochází jednotlivé blokované webové stránky a u každé z nich vidí přesný popis s odůvodněním penalizace. [4] Pro příklad uvedu zablokovanou stránku z důvodu skrytého textu. Pro odstranění blokace musí administrátor vstoupit do zdrojového kódu stránky a ručně ji překontrolovat. Při kontrole ověřuje, zda důvod blokace stále trvá. Pokud byl tento důvod odstraněn, obnoví stránku do indexu. Pokud však problém stále přetrvává, nechá blokování tak, jak je. Osobně vím, že další taková kontrola přichází obvykle opět za rok. Z tohoto důvodu se obecně vyplatí odstranit problém včas a nedávat vyhledávačům důvod k blokaci webových stránek. Spam report Seznam se od předchozího příliš neliší. Především je v češtině, která je pro většinu uživatelů příjemnější.
36
Následující formulář se nachází na adrese: http://search.seznam.cz/nahlasit-spam
Obrázek č.9 Ukázka spam report formuláře Seznam
Podobnost obou formulářů pro nahlášení je skoro totožná. Opět se zde nalézá řádek pro zapsání URL adresy podezřelé stránky. Na rozdíl od Google spam reportu, kde jsme typ podezření vybírali zatržením, tak Seznam formulář nabídne rozbalovací menu. Formulář se nás dotazuje, na jaký vyhledávaný dotaz se podezřelá stránka v Seznamu zobrazuje. Tento řádek nejsme povinni vyplnit. Následující pole je vyhrazeno pro naše připomínky, z kterých usuzujeme právě o podezření na spam. Poslední důležitou položkou je vyplnění obrázkové kódu. Tento kód jsem podrobně rozebíral v kapitole s názvem komentářový a katalogový spam. Formuláři přispíváme k pročištění výsledků vyhledávání.
37
4 Analyzování a vyhodnocení dosažených výsledků Kapitola se bude zabývat vyhodnocením dosažených výsledků při optimalizaci webových stránek. Předchozí kapitoly ukázaly jak dosáhnout pomocí SEO technik lepších pozic při vyhledávání. Pro vyhodnocení
dosažených výsledků je dobré využít např.
statistik přístupů návštěvníků na webové stránky. Získat takové informace můžeme vlastní interní statistikou nebo externí službou. Obsahem kapitoly bude podrobnější popis využití již vytvořených nástrojů pro analýzu výsledků.
4.1 Analýzy chování návštěvníků a vyhledávačů Položme si otázku co spojuje úspěšné WWW stránky? Jednoznačně to není jen špičkový grafický vzhled, není to úžasný rozsáhlý obsah, zapamatovatelná doména nebo velké obrázkové menu. Veškeré tyto faktory jsou velice podstatné, ale kvalitního tvůrce spíše zajímá, co jejich zákazníci na webové stránce hledají, co od ní očekávají. Vytvářím kvalitní rozsáhlé webové prezentace, ale bez následné kontroly, vyhodnocování a sledování požadavků zákazníků bych žádné výsledky nezískal. Vyhodnocování provádím k bližšímu poznání chování uživatelů, kteří navštěvují webové stránky. Pokud zjistím, jaká klíčová slova zákazníci nejraději zadávají, nebo které webové stránky je spíše nezajímají, můžu použít těchto informací k úpravě webové prezentace. Sleduji následující údaje, které posléze analyzuji. V první řadě se zaměřuji na počet návštěvníků, kteří na webové stránky přicházejí. Dalším důležitým údajem bývá, jakým způsobem se na stránky dostali, zda využili vyhledávače, záložku, přímé zadání URL adresy, odkazu z e-mailů, z jiných WWW stránek, systému PPC (internetová reklama) atd. Dobrým kritériem bývá analýza rozlišení monitoru návštěvníků, podle které je možné určit optimální rozlišení webových stránek. V současné době mnoho lidí využívá velké monitory, ale i přes to je potřeba mít stránky optimalizovány na menší rozlišení. Z analýzy plyne, že lidé využívají rozlišení 1024x768. Klíčová slova, která zadají zákazníci, jsou dobrým hlediskem optimalizace. Doba, po kterou uživatelé procházejí webové stránky ověřuje, jak mají o daný obsah zájem. Následně můžeme vypozorovat oblíbenost jednotlivých stránek. Poté je možné neoblíbené stránky upravit nebo odstranit. K vyhodnocování těchto údajů máme hned několik možností. Pro většinu lidi budou nejjednodušší automatizované statistické nástroje. Osobně využívám externích 38
služeb pro monitorování přístupů. Je možné využít i interní statistiky na vlastním serveru. Dle získaných informací bych řekl, že dodávají nejpřesnější výsledky. Metodika měření bývá velice rozdílná a každá externí služba využívá jinou. Z tohoto důvodu jsem již mnohokrát pozoroval naprosto odlišné výsledky. Při zaplacení určitého poplatku se stává externí služba uživatelsky příjemnější. V některých případech je tento poplatek zbytečně vysoký. V následujících kapitolách se budu věnovat jednotlivým společnostem a jejich službám, které nabízejí k monitorování našich stránek.
4.2 Vlastní statistika na serveru K využití vlastní statistiky jsem do současné doby nebyl nucený, z důvodu využívání externích nástrojů, které považuji za jednodušší. Z nastavení webového serveru APACHE vím, že přístupy se zapisují do logovacích souborů, které je možné prohlížet. Analýza takových souborů běžným uživatelem není možná, protože k nim nemá přístup. Na internetu se vyskytuje několik nástrojů, které po instalaci na daném serveru analyzují logovací soubory bez přihlášení. Zobrazené údaje jsou velice podobné externím nástrojům. Opět se jedná o webovou aplikaci, ve které je vidět grafické zpracování výsledků. Z pohledu zákazníka je lépe využívat externích služeb, u kterých není zapotřebí se zabývat zabezpečením a konfigurací.
4.3 Externí statistiky Využívání externích statistik je z důvodu jednoduchosti a nenáročnosti lepším řešením. Nemusíme se zabývat vytvářením analyzátorů logovacích souborů, které při naprosté neznalosti základního nastavení serveru nespustíme. Pro využívání těchto statistik je zapotřebí pouhá registrace u některého z poskytovatelů služby. Následně vložíme vygenerovaný kód do těla webové stránky, který poskytuje potřebné informace pro zpracování. Při základním využití externích služeb neplatíme žádné poplatky. I využívání externích služeb sebou nese špatné vlastnosti. Například při porovnání přístupů s logovacím souborem, který generuje server, nebude ve většině případů stejný výsledek. Při vypnutí zobrazení obrázků, nebude započítána návštěva dané stránky. Proto je potřeba si předem ujasnit, k jakým účelům a jak přesně potřebujeme provádět vyhodnocování. V neposlední řadě tyto externí statistiky nerozlišují, zda naši webovou stránku navštívil vyhledávací robot nebo běžný návštěvník. 39
4.3.1 Navrcholu.cz Externí služba je určena pro analýzu a měření návštěvnosti webových stránek. Poskytuje přehledné a jednoduché zobrazení analyzovaných údajů, které získá o webové prezentaci. Grafické zpracování nástroje je uživatelsky příjemné a přehledné. Pro nekomerční účely je využívání bez poplatku. Následující placené služby nabídnou zobrazení vyšších návštěvností a detailnějšího pohledu chování zákazníka na webové stránce. [28, 29] Nástroj nabízí podrobné statistiky návštěvnosti webové prezentace. Jako je např. počet návštěvníků, návštěv, unikátních IP adres, zobrazené a nejčastěji zobrazované stránky a v neposlední řadě také rekordní hodnoty návštěvnosti. Dalším údajem, který je analyzován jsou vstupní webové stránky, z kterých návštěvníci přicházejí a výstupní stránky označují, kam daný návštěvník odešel. Následně sleduje i čas strávený návštěvníkem na konkrétní stránce. Mezi další zobrazené údaje patří jazyk, země původu a klíčová slova. Zajímavá informace je údaj o operačním systému, který prohlížeč využívá, je také samozřejmostí. K dalším analyzovaným údajům patří typ prohlížeče, barevná hloubka, rozlišení monitoru. Analýze se nevyhne ani podpora technologií Flash, Java, JavaScript, cookies. [28] Výhodou externích služeb je přístup k výsledkům odkudkoliv a nevyžadují žádné speciální softwary. Pro zobrazení využijeme běžný webový prohlížeč (Mozilla Firefox, IE, Opera). Nedílnou součástí po přihlášení je možnost filtrace dle zadaných kritérií a snadná orientace. Zaregistrované webové prezentace jsou roztříděny do jednotlivých kategorií, ve kterých se řadí podle návštěvnosti. [28] Pro využití nástroje je nutná registrace příslušných webových stránek, které chceme vyhodnocovat a následné umístění měřícího kódu do těla stránky. Pro správnou funkci je zřejmé, že vygenerovaný kód nesmí být upraven. Po vyžádání stránky návštěvníkem vyvolá vložený skript akci na straně monitorovacího serveru, který získá potřebná data o návštěvě i návštěvníkovi. Skript se navenek tváří jako viditelný nebo neviditelný obrázek. Pro započtení požadavku je tedy nutné mít podporu zobrazení obrázků. V opačném případě se neprovede žádný zápočet a výsledky se zkreslují. [29, 30]
4.3.2 Toplist Využívání služby Toplist je velice podobné se službou Navrcholu.cz. Jednotlivé poskytované funkce jsou velice podobné s předcházejícím externím nástrojem. Při analýze 40
údajů o návštěvnosti využívám právě služeb Toplist pro jeho jednoduchost, přehlednost a oblíbenost. Po registraci a vygenerování měřícího kódu je služba připravena k využití. Grafické zpracování jednotlivých grafů je velice příjemné a přehledné. Hlavním kritériem, které vyhodnocuji, jsou počty návštěv za rok, měsíc a den. Nástroj nabízí i statistiky o webových prohlížečích konkrétních návštěvníků. Mezi další statistické údaje, které sleduji, jsou barevná hloubka, rozlišení monitoru, země, operační systém. V neposlední řadě sleduji stránky, z kterých návštěvníci přišli. Z tohoto údaje přesně vidím, zda na webové stránky využili cestu přes vyhledávač nebo přímým zadáním URL adresy do prohlížeče. Při základním využití služby neplatím žádné poplatky. Vkládání skrytého měřícího kódu využívám z důvodu zachování grafického rázu webových stránek.
4.3.3 Google Analytics Google Analytics je dalším zástupcem rozsáhlých webových aplikací, které poskytuje Google. K jeho označení spíše používáme zkratku GA. Prostřednictvím nástroje Google Analytics je možné sledovat návštěvnosti našich webových stránek. Využívá se k bližšímu zkoumání trendů v chování zákazníků webových stránek. Výsledků, kterých dosáhneme při využívání nástroje Google Analytics mají velký význam pro samotné tvůrce webových stránek i marketingové pracovníky. [31] Součástí Google Analytics je služba, která uchovává a archivuje údaje o přístupech návštěvníků k jednotlivým stránkám. Kvalita a spolehlivost měření je velice dobrá. Pro tyto vlastnosti se zařadil GA mezi uznávané nástroje v oblasti měření návštěvnosti. Google Analytics je neustále rozvíjen a jeho využívání je bezplatné. Od roku 2007 je navíc služba dostupná v českém jazyce. [31] Analýza návštěvnosti prostřednictvím Google Analytics zodpoví pouze otázky spjaté se souhrnným chováním návštěvníků stránek. V žádném případě neumožní monitorování chování konkrétních uživatelů. Pro příklad uvedu několik otázek. [31] Počet zaregistrovaných zákazníků minulý týden? Kolik procent návštěvníků se vrací na naše webové stránky? Jaká klíčová slova využil zákazník do vyhledávače? Počet návštěvníků našich stránek za minulý měsíc? 41
Jaké odkazy využívají naši zákazníci na stránkách? Jaký typ prohlížeče využil daný návštěvník? Nejčtenější webové stránky posledního půl roku? Na které webové stránce tráví zákazníci nejvíce času?
Při využití měření, které Google Analytics přináší, je zapotřebí si nechat vygenerovat unikátní měřící kód, který bez úprav zkopírujeme do patičky svého webu, který chceme monitorovat. Po několika hodinách již můžeme pozorovat prvotní údaje 31]
získané o naší návštěvnosti. [
Veškeré toto měření realizuje GA pomocí kódu Javascriptu využívajícího cookies. Pro správnou funkci je tedy nezbytně nutné, aby daný prohlížející měl povolen používání Javascript
a cookies. V opačném případě by nedošlo k získání potřebných údajů. Ke
zkreslení výsledků dochází při smazání cookie ze strany uživatele, tak i automaticky po vypnutí webové prohlížeče. V takovém případě bude návštěvník považován za nového, a tudíž budou výsledky ovlivněny. [31] Uvedené nepřesnosti v žádném případě nesnižují mocnost tohoto nástroje. Ve výsledku pro nás budou důležitější vědět nárůst návštěvnosti po spuštění internetové kampaně než přesný počet uživatelů. [31] Pro analyzování informací, která nám Google Analytics nabídne, je zapotřebí rozumět základním pojmům (návštěvník, návštěva, zobrazená stránka nebo poměr návratů). [31]
Návštěvník Je osoba, kterou Google Analytics identifikuje prostřednictvím cookie souboru. Osobu označujeme také jako Visitor. Cookie soubor je vygenerován při první návštěvě stránky. Platnost identifikace je 2 roky od poslední návštěvy serveru. Pokud by se cookie soubor smazal, nedošlo by k rozpoznání při další návštěvě a byla by přidělena nová identifikace. [31] Google analytics rozděluje návštěvníky na nově přicházející a vracející se. S rozdělením úzce souvisí i pojem unikátní návštěvník. Opakované přístupy návštěvníka 42
na webové stránky v rámci návštěv je unikátní návštěvník započítáván do daného časového období pouze jednou. V takovém případě se jedná o jednoho unikátního vracejícího se návštěvníka. [31]
Návštěva Návštěva je v Google Analytics definována jako 30 minutová interakce mezi webovým prohlížečem a danou stránkou. Při vypnutí okna prohlížeče nebo neaktivitě více než 30 minut, je stávající návštěva ukončena. Po dalším zobrazení stránky nebo pohybu na stránce se započítá jako nová návštěva. Celý mechanizmus je opět založený na identifikaci návštěv pomocí cookie souboru. [31]
Zobrazená stránka Pod pojmem zobrazená stránka rozumíme načtení stránky v prohlížeči. Většina začátečníků dělá zásadní chybu v soustředění pozornosti na právě jednu metriku, a to na počet zobrazených stránek. [31]
Poměr návratů Poměr návratů je metrika vyjadřující v procentech zastoupení návštěvníků, kteří opustí stránku, aniž by v rámci sledovaného webu navštívili jinou stránku. Čím větší je tato hodnota, tím více návštěvníci nenalézají na našich webových stránkách relevantní obsah. Z této hodnoty jednoduše poznáme, zda je naše stránka zajímavá či nikoliv. [31] V hierarchii Google Analytics jsou účty na nejvyšší pozici. Jejich hlavním úkolem bývá z pravidla seskupení souvisejících domén. Při správě webových stránek je dobré využít založení GA účtu s názvem dané firmy a poté spravovat v rámci účtu jednotlivé subdomény. U každého účtu máme možnost nastavení míry sdílení informací s ostatními GA produkty. Jako druhý stupeň hierarchie jsou tzv. profily. [31] Profilem máme na mysli sledování konkrétní domény nebo subdomény. V rámci jednoho účtu máme možnost spravovat až padesát takových profilů. Což ve většině případů bývá dostačujícím. Na úrovni profilů máme možnost definice uživatelů, kteří mají posléze možnost vidět naše reporty. Lze také nastavit filtry zobrazených informací. Ke každému vytvořenému profilu Google Analytics zpracovává reporty se statistikami. [31]
43
Obrázek č.10 Ukázka prostředí Google Analytics
Jak je z obrázku č.10 patrné, je každý report se obvykle skládá z levého a pravého panelu. Levý panel obsahuje dále pět hlavních kategorií pro navigaci a také rychlý přístup k nápovědě. Pravá část je tvořena již samotnými statistikami. Tato část obsahuje kalendář pro výběr nebo vymezení časového období. Dále obsahuje velice podstatnou část sumarizačních informací a hlavní obsahovou část. Standartním zobrazením bývá prostý výpis nebo tabulka. Ovšem máme možnosti i grafického zobrazení pomocí sloupcových nebo koláčových grafů. [31] První report, který se zobrazí po kliknutí na námi zvolený profil, je tzv. řídící panel. Tento panel obsahuje soupis nejdůležitějších přehledů se statistikami o naší webové stránce. Obrovská výhoda řídícího panelu je přizpůsobivost. Máme možnost tyto přehledy přesouvat pouhým přetažením myši, editovat a mazat. Počet panelů se nijak nelimituje, a proto je možné vlastní přizpůsobení. [31] Navigační kategorie obsahuje pět hlavních prvků. Řídící panel, návštěvníci, zdroje provozu, cíle a obsah. V následujícím popisu vysvětlím ve stručnosti každou kategorii. Kategorie návštěvníci obsahuje odpovědi na otázky týkající se počtu návštěvníků našich stránek. Nabídne široké spektrum přehledů jako je např. délka a hloubka jednotlivých návštěv, poměr nových a vracejících se a v poslední řadě také grafické zobrazení. [31] 44
Druhá důležitá kategorie obsahuje zdroje provozu s přehledy placených i neplacených klíčových slov. Veškerá tato slova jsou opatřena informacemi se způsobem návštěvy našich stránek. Často díky těmto údajům přicházíme na nedostatky z našich internetových kampaní. Následně je možné tyto nedostatky eliminovat nebo zcela odstranit. [31] Kategorie obsah poskytuje informace o neoblíbených částech webové prezentace, ale i údaje o nejčastějších vstupních stránkách. [31]
4.4 Shrnutí analyzování a vyhodnocení dosažených výsledků Využiji samostatné kapitoly, ve které shrnu získané informace z předchozích kapitol. Z mého pohledu je v naprosté většině tvůrců vždy brán ohled na přesnost a jednoduchost daného nástroje. S výběrem konkrétního řešení si vždy položme otázky, jaké údaje budeme potřebovat analyzovat a s jakou přesností. Využívání interních statistik má své klady i zápory. Jednoznačně se jedná o námi vytvořenou službu za využití nástroje, který bývá většinou zdarma. Dalším pohledem by mohl být dobrý pocit z vlastně vytvořeného rozhraní pro analýzu přístupů. Pokud nechceme řešit problémy spojené s nastavením konkrétního nástroje na vlastním serveru, využijeme některou z externích služeb. Mezi hlavní takové společnosti jsem zahrnul NAVRCHOLU.cz, Toplist a Google Analytics, které v současné době považuji za nejlepší řešení. Každá společnost nabídne rozličné grafické zpracování, možnost nastavení a úprav ze strany uživatele. Důležité je připomenutí, že veškeré externí služby jsou dostupné v české lokalizaci. Dosažené výsledné pozice ve vyhledávačích je pak možné prezentovat např. i zákazníkům. Navíc registrací své webové prezentace do databáze externích služeb získáme velice kvalitní zpětný odkaz na vlastní stránky.
45
Závěr Veškeré úpravy a změny zdrojového kódu stránek ovlivňují výsledné pozice naší webové prezentace. Celý obsah bakalářské práce poukazoval na možnosti kvalitního zpracování zdrojového kódu a aplikaci SEO technik webových stránek. Rozsah práce se také zaměřoval na ukázku špatně optimalizovaných stránek, kterých v dnešním internetu bývá nepřeberné množství. Práce byla koncipována jako průvodce metodami SEO technik a vyzdvihla důležité faktory, které mohou ovlivnit naše pozice ve výsledcích vyhledávání. Do práce jsem zahrnul i své osobní dlouholeté poznatky, které jsem za dobu své tvorby získal. Veškeré On-Page faktory jsou dobrým přínosem kvalitní webové stránky, ale zkušenosti z vlastní tvorby poukázaly na využití kvalitních titulků stránek a dostatečné množství klíčových slov. Při optimalizaci pro český vyhledávač Seznam se především zaměřuji na kvalitní a jedinečné titulky jednotlivých stránek webové prezentace. Pro zahraniční vyhledávač Google se zaměřuji na kvalitní zpracování klíčových slov webové stránky. Při tvorbě bakalářské práce jsem pochopil detailnější potřeby SEO optimalizací a následující tvorba webových stránek již ponese nové prvky, které jsem získal. Některé části práce pro mě byly naprosto novým poznáním a v některých jsem si pouze zopakoval a prohloubil již získané informace. Závěrem bych rád vyzdvihnul aplikaci metod SEO optimalizací. V dnešní době, kdy lze výrobky prodávat přes internet je důležité využívat SEO optimalizace. Díky využití těchto metod můžeme dosáhnout dobré pozice ve vyhledávání a následně přilákat zákazníka na naše webové stránky. Pro následné rozhodnutí zákazníka bude mít vliv i grafického zpracování. Bez SEO optimalizací více či méně kvalitní webová prezentace ztrácí v dnešním světě smysl.
46
Zdroje [1] MAXON DESIGN s.r.o. [online]. 2008 [cit. 2010-03-23]. Co to je seo - terminologie. Dostupné z WWW:
[2] WebPrezent [online]. 2007 [cit. 2010-03-23]. Rozdíl mezi katalogem a vyhledávačem. Dostupné z WWW:
[3] SMIČKA, Ing. Radim. Optimalizace pro vyhledávače - SEO : Jak zvýšit návštěvnost webu. Dubany : Knihkupectví Jasmínka, 2004. 120 s. Dostupné z WWW: . ISBN 80-239-2961-5
[4] KUBÍČEK, Michal. Velký průvodce SEO : Jak dosáhnout nejlepších pozic ve vyhledávačích. Vydání první. Brno : Computer Press, a.s., 2008. 311 s. ISBN 978-80-2512195-5
[5] Seo optimalizace - Co je google a jak funguje [online]. 2007 [cit. 2010-03-23]. Co je GOOGLE a jak funguje...?. Dostupné z WWW:
[6] WebŽurnál.cz [online]. 2008 [cit. 2010-03-24]. Jak pomáhají ranky a k čemu jsou dobré. Dostupné z WWW:
[7] Zpětné odkazy - Srank, Pagerank, Alexarank [online]. 2008 [cit. 2010-03-25]. Srank, Pagerank, Alexarank. Dostupné z WWW:
[8] SEO - Expert.cz > Alexa rank [online]. 2010 [cit. 2010-03-26]. Alexa rank. Dostupné z WWW: 47
[9] Význam validity kódu pro SEO [online]. 2008 [cit. 2010-03-27]. Validace kódu a SEO. Dostupné z WWW:
[10] Seo-slovnik.cz [online]. 2009 [cit. 2010-03-27]. On-page faktory. Dostupné z WWW:
[11] WebPrezent [online]. 2007 [cit. 2010-03-27]. On-Page faktory. Dostupné z WWW:
[12] SWMag.cz [online]. 2008 [cit. 2010-03-28]. Optimalizace On Page faktorů - SEO – díl 2. Dostupné z WWW:
[13] Blog SEO-Profesionál.cz [online]. 2008 [cit. 2010-04-05]. Efektní titulky stránek je základ pro dobré SEO. Dostupné z WWW:
[14] Interval.cz [online]. 2005 [cit. 2010-04-05]. SEO - sémantický kód. Dostupné z WWW:
[15] Seo-slovnik.cz [online]. 2009 [cit. 2010-04-06]. Anchor text. Dostupné z WWW:
[16] WALL.CZ [online]. 2008 [cit. 2010-04-07]. Mapa stránek sitemap.xml - usnadněte indexování robotům. Dostupné z WWW:
[17] SEO slovník [online]. 2008 [cit. 2010-04-08]. Cloaking. Dostupné z WWW:
48
[18] WebŽurnál.cz [online]. 2008 [cit. 2010-04-08]. Doorway pages. Dostupné z WWW:
[19] SEO slovník :: Internetová agentura ACTUAL NET s.r.o. [online]. 2010 [cit. 2010-04-09]. SEO OPTIMALIZACE PRO VYHLEDÁVAČE - SLOVNÍK. Dostupné z WWW:
[20] Alt Image Tag Spamming [online]. 2008 [cit. 2010-04-09]. Alt Image Tag Spamming. Dostupné z WWW:
[21] CSS-idea.cz - webová galerie » Detail blogu » Black Hat SEO [online]. 2009 [cit. 2010-04-09]. Black Hat SEO - Nepovolené praktiky optimalizace (2. díl). Dostupné z WWW:
[22] SEO - Profesionál.cz [online]. 2008 [cit. 2010-04-09]. Link farmy. Dostupné z WWW:
[23] Vyhledávače.info [online]. 2006 [cit. 2010-04-09]. Co znamená duplicitní obsah a proč vyhledavačům vadí?. Dostupné z WWW:
[24] CSS-idea.cz - webová galerie » Detail blogu » Black Hat SEO [online]. 2009 [cit. 2010-04-10]. Black Hat SEO - Nepovolené praktiky optimalizace (3. díl). Dostupné z WWW:
[25] SEO spam: zneužité umění - LUPA [online]. 2005 [cit. 2010-04-11]. SEO spam: zneužité umění. Dostupné z WWW:
49
[26] About [online]. 2005 [cit. 2010-04-12]. Captcha: robot nebo člověk?. Dostupné z WWW:
[27] Adaptic [online]. 2009 [cit. 2010-04-15]. Spam report. Dostupné z WWW:
[28 ] Informační list (leták) : NAVRCHOLU.cz. [online]. 2010 [cit. 2010-04-15] Dostupné z WWW:
[29] Dobrý web [online]. 2009 [cit. 2010-04-15]. NAVRCHOLU.cz - měření a analýza návštěvnosti. Dostupné z WWW:
[30] NAVRCHOLU.cz [online]. 2009 [cit. 2010-04-16]. Metodika a technologie. Dostupné z WWW:
[31] Nástroje Google. 7. Google Analytics [online]. 2010 [cit. 2010-04-17]. Nástroje Google. 7. Google Analytics. Dostupné z WWW:
50
Přílohy
51