Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze
Aleš Rouček
Projektová analýza webu Calounik-a-dekorater.cz. Bakalářská práce
2009
Prohlašuji, že jsem bakalářskou práci na téma Projektová analýza webu Calounik-adekorater.cz zpracoval samostatně a použil pouze zdrojů, které cituji a uvádím v seznamu použité literatury.
Administrační systém ....................................................................................................... 45 Zdroj dat ................................................................................................................... 45
8.2
Editovatelná data kostry stránky: ............................................................................. 45
8.3
Kontextové informace .............................................................................................. 46
Závěr................................................................................................................................. 47 Použitá literatura .......................................................................................................... 48
5
2 AUTORSKÁ ANOTACE Není to tak dlouho, co bylo obrovským trendem pro většinu firem a společností pořídit si svoji vlastní webovou stránku. V dnešní době, kdy téměř každý malý živnostník svoji prezentaci na internetu vlastní, začíná záviset více na kvalitním a estetickém zpracování. Ne každý, kdo se rozhodne si webovou prezentaci pořídit, se však v momentálních trendech vyzná. Z vlastní zkušenosti vím, že pokud se zadá projekt vývojářské firmě, obvykle se snaží přizpůsobit výsledné řešení svým zaběhlým praktikám, které se mohou od požadovaného výsledku více či méně lišit. Právě z tohoto důvodu vidím jako velmi výhodné nechat si vypracovat projektovou analýzu od třetí firmy. V mé bakalářské práci, projektové analýze internetové prezentace Calounik-a-dekorater.cz, se o jakýsi návod pro realizaci kvalitního webu snažím. Na začátku práce rozebírám technické provedení, kde se soustředím zejména na volbu správných norem, dodržení validity kódu a upřesňuji, pro které prohlížeče by měly být stránky validní. V dalších částech proberu formu navigace, strukturu stránky i celého webu, dostanu se i na vysvětlení základní funkčnosti dynamické sekce materiál. Ke konci práce vysvětlím funkční prvky na budoucí stránce a základní požadavky na administrativní systém. Právě administrativní systém si většinou nemůžeme moc volit, protože bývá závislý na realizátorovi dané prezentace. Jelikož jsem si vědom, že prezentace Calounik-a-dekorater.cz bude mít striktně obchodní cíl, nejvíce jsem se věnoval SEO optimalizaci pro vyhledávače a vhodnou volbu klíčových slov. Bezesporu právě internetové vyhledávače jsou dnes hlavním zdrojem návštěv webových prezentací menšího a středního rozměru.
6
3 TECHNICKÉ PROVEDENÍ V této kapitole shrnuji základní technické faktory, které by měly být dodrženy při tvorbě nové, moderní internetové prezentace. Právě správnou volbou těchto faktorů, ať už validního (X)HTML kódu, optimalizace pro vyhledávače, dodržení pravidel přístupnosti, či správných meta-tagů získáme z budoucí prezentace maximum.
3.1 (X)HTML KÓD a CSS Je nutné klást velký důraz na validitu výsledného kódu. Jako odpovídající normu pro validitu můžeme brát konsorcium W3C, které nám poskytuje na svých webových stránkách nástroj zvaný Validátor W3C, který po zadání příslušné adresy internetové stránky dokáže určit, zda je stránka napsána validním kódem, popřípadě zobrazit chyby, které se musí pro správnou validitu stránek opravit.
Je třeba dát si záležet na přehledném, dobře strukturně i sémanticky stavěném kódu. Snažit se vyvarovat zbytečných tabulkových designů, přebytečných značek v kódu, u nestandardních programovacích metod daný postup vždy patřičně okomentovat. Ulehčí nám to případné budoucí implementace nových, či editace již stávajících vzhledů naší prezentace. Nutným předpokladem je i vyvarování se použití, dříve tak populárních, rámců (tzv. frames).
Zajistíme, aby byl kód CSS umístěn do externího souboru (nevyskytoval se mezi HTML značkami). Tím dosáhneme oddělení obsahu od způsobu jeho prezentace a při budoucí editaci CSS kódu najdeme všechny CSS tagy na jednom místě a bude se nám soubor přehledněji editovat.
Na každé stránce musí být jasně vyznačeno, jaká kódovací sada byla použita. Zde doporučuji použít kódování UTF-8. Vyvarujeme se pak potíží při nadstavbě internetové prezentace o další jazykové verze.
7
3.1.1 (X)HTML norma
I když volba určité normy není pro správné vyhotovení výsledné prezentace rozhodující, doporučuji použít jednu z norem HTML 4.01 Strict, nebo XHTML 1.0 Strict. Při správné volbě normy musíme především myslet na to, abychom dosáhli co možná s nejmenším úsilím validní stránky, a to i přihlédnutím na uživatelská data, která budou uživatelé sami přidávat. Zde stojí za zmínku zejména uživatelské přidávání dat přes WYSIWYG (What You See Is What You Get – volně přeloženo „Co vidíš, to dostaneš“). Je to nástroj podobný textovému editoru, který nám „živě zobrazuje“ náhled výsledné stránky. Problém je, že často ve svém kódu zanechává spoustu zbytečných značek, a tím kód ztrácí na validitě a nabírá na velikosti.
I když není stoprocentní validita pro správné zobrazení v internetovém prohlížeči podmínkou, budeme ji brát do naší prezentace jako nutnost. Pokud jsou stránky validní, mnohem snadněji se pak odhalují chyby, které mohou být zásadní například pro roboty starající se o indexování stránek do databází vyhledávačů. Vhodnou aplikací pro kontrolu validity je výše zmíněný Validátor W3C (http://validator.w3c.org).
3.1.2 Rozvržení stránky
Při základním rozvržení stránek je třeba myslet na dnešní nejrozšířenější rozlišení obrazovek uživatelů. V době psaní této bakalářské práce (3. čtvrtletí roku 2008) to jest standardní rozlišení 1024x768 pixelů (zjištěno pomocí statistik Google Analytics). Nesmíme si ovšem představit, že 1024 pixelů na šířku je možné zcela využít. Stačí, aby měl uživatel zapnutý postranní panel svého internetového prohlížeče a náhle máme o více než 50 pixelů méně. Proto se pro návrh naší prezentace budeme držet přizpůsobivé šířce stránek. Užší stránku jsme tím vyřešili, ale bystrého čtenáře určitě napadne, že stránka může být samozřejmě i mnohem širší než 1024 pixelů. Aby nevznikaly zbytečně dlouhé řádky, které mají podstatně horší čitelnost, omezíme přizpůsobivou šířku z obou stran na hodnoty 750 – 1000 pixelů. To nám zajistí, že naše prezentace bude dobře čitelná na rozlišení s šířkou 800, stejně tak jako na velikých širokoúhlých obrazovkách s rozlišeními 1680 pixelů a vyššími.
Následující obrázek znázorňuje rozlišení monitorů návštěvníků internetového magazínu Drumandbass.cz. Tento magazín má denní návštěvnost přes 2000 unikátních návštěvníků, čili dá se považovat za reprezentativní vzorek rozlišení obrazovek. Je třeba ovšem podotknout, že 8
věkové složení návštěvníků se pohybuje mezi 16 až 28 lety. To je skupina lidí, kteří jsou otevření novým technologiím a ve většině případů právě oni mají ve svých domovech velmi moderní zařízení (rozuměj většími a výkonnějšími periferiemi než celkový vzorek). I tak zde vyhrává výše uvedené rozlišení 1024x768 pixelů.
1Google Analytics – stav rozlišení návštěvníků Drumandbass.cz ke dni 16.12.2008
Stejně tak jako horizontální rozvržení stránky je důležité i vertikální. S tím již není tak lehké pracovat. Téměř na každé stránce se setkáme s posuvným jezdcem, který nám stránku posouvá směrem dolů. Bez toho se neobejdeme nejspíš ani my. Na co se ale zaměříme je takzvaný přelom stránky. Nahlédneme-li opět do výše vložené tabulky rozlišení monitorů návštěvníků, vidíme, že za průměrnou hodnotu výšky stránky můžeme brát zhruba 800 pixelů. Odmyslíme-li si horní a spodní panel prohlížeče, dostáváme se řádově kolem 650 pixelů. Právě tato hodnota nás bude nejvíce zajímat, protože zde dochází k takzvanému předělu stránky. To je přesně to místo, kde se stránka „ztrácí“ a abychom ji viděli dál, musíme použít posuvný jezdec.V tomto místě stránky je důležité umístit výrazný objekt, který jasně napovídá, že stránka zde nekončí, nýbrž pokračuje dále. Z tohoto důvodu není vhodné na toto místo dávat výrazný přehyb stránky, protože v návštěvnících by to mohlo vzbuzovat dojem, že na tomto místě stránka končí.
3.1.3 Sémantické značky
Správné použití sémantických značek mnoho lidí podceňuje, ale právě ty mohou hrát jednu z hlavních rolí při indexování prezentace roboty vyhledávačů. Dalším jejich velkým kladem je
9
použití v alternativních zobrazovacích zařízeních. Zpřehledňují tak obsah stránky, pokud dané zařízení nepodporuje například CSS styly.
U naší prezentace Calounik-a-dekorater.cz je pro nás stěžejní dobré umístění ve vyhledávačích, proto budeme brát za nutné správné dodržení následujících značek: - každý nový odstavec textu označíme značkou
- všechny hlavní nadpisy označíme značkou
- další nadpisy budeme správně značkovat pomocí
-
- všechny seznamy a odrážky označíme podle jejich druhu -
, ,
3.1.4 Kaskádové styly
Kaskádové styly musí být uloženy výhradně v externích souborech (nebudou se vyskytovat mezi samotným (X)HTML kódem). Zvýší to přehlednost a pozdější úpravy stylu stránky. Je velice žádoucí, aby CSS soubory měly vhodně zvolenou HTTP hlavičku, aby je prohlížeče mohly ukládat do své cache paměti. Při opětovném načtení to výrazně zvýší rychlost zobrazení stránky.
Pro definování stránky pro tisk se rovněž využijí kaskádové styly. Vhodně se označí elementy stránky, které se nemají tisknout (navigace, políčko pro vyhledávání, filtry, a další). Použitím kaskádových stylů se vyvarujeme generování dalších tiskových dokumentů, například ve formátu PDF.
3.1.5 Podpora prohlížečů
I za té podmínky, že dodržíme stoprocentní validitu naší prezentace, nemáme zaručeno, že se stránka ve všech prohlížečích zobrazí správně. Proto bych zde rád vyjmenoval ty nejvíce používané prohlížeče, ve kterých prezentace musí vypadat přesně podle grafického návrhu (označeny jako „nutné“). Dále uvádím další prohlížeče, u kterých již vzhled stránky nemusí stoprocentně odpovídat grafickému návrhu, ale zobrazené změny nesmějí nikterak rozhodit celkovou strukturu stránek a nesmí dojít k jakémukoliv porušení čitelnosti obsahu. 10
Nutné: -
MS Windows (98, 2000, ME, XP, Vista) o Internet Explorer 6 o Internet Explorer 7 o FireFox (aktuální verze, momentálně FireFox 3) o Opera (aktuální verze, momentálně Opera 9.6)
Ostatní: -
Mac OS X o Safari (aktuální verze, momentálně Safari 3.1) o Camino (aktuální verze, momentálně 1.6)
-
Linux o Konqueror (aktuální verze, momentálně 3.5)
3.2 Optimalizace pro vyhledávače – SEO Vzhledem k faktu, že stránky sítě čalounictví a prodejen dekorativního materiálu jsou stránkami, které nabízejí a prodávají služby, je pro nás kapitola SEO optimalizace velice důležitá. Pokud si dáme na optimalizaci pro vyhledávače skutečně záležet, pomocí silných vyhledávačů (jako jsou Google, Seznam, Yahoo a další) k nám přijde velké množství nových návštěvníků, tedy potencionálních zákazníků.
3.2.1 Výběr nejvýstižnějších slov pro optimalizaci
Správná volba klíčových slov je jednou z nejdůležitějších faktorů ovlivňujících výskyt naší prezentace v nabídce internetových vyhledávačů. Při jejím sestavování bychom měli využít slova, která se nejvíce vyhledávají, ve spojení se slovy, která charakterizují naši firmu Calounik-a-dekorater.cz. Svoji analýzu těchto slov jsem provedl podle srovnání nejvyhledávanějších frází, které jsou spjaty s čalounictvím, za posledních 12 měsíců.
11
Přibližný průměr objem Klíčová slova
vyhledávání
látky
14800
křeslo
12100
křesla
9900
látka
5400
pohovka
4400
pohovky
4400
křeslo
1900
čalounictví
1900
rozkládací pohovka
1300
rozkládací pohovky
1300
potahové látky
880
rozkládací křeslo
720
polohovací křeslo
590
prodej látek
480
rozkládací pohovky
320
kožené křeslo
260
látky praha
260
čalouník
260
oprava nábytku
210
rohová pohovka
210
2 - četnost vyhledávání jednotlivých klíč. slov podle Google.cz
Klíčová slova můžeme později přidávat a zesilovat tím pravděpodobnost vyhledání právě naší stránky přes určitý vyhledávač. Zejména nesmíme zapomenout na slova, která se obvykle vyskytují ve slovních spojeních. I když slova sama od sebe se příliš často nevyhledávají, právě v daném spojení nám mohou přivést velký počet potencionálních zákazníků.
3.2.2 Optimálně volená klíčová slova
Existuje několik zásad, které by měly být při výběru klíčových slov dodržovány.“ -
Klíčová slova by měla podporovat cíle webu. U webu čalounictví by měla podporovat zájem o službu, nebo o prodej. Cílem toho je přilákat zákazníky, kteří jsou ochotni objednat, či zaplatit službu. Nejen ty, kteří chtějí pouze bezplatné informace.
12
-
Klíčová slova by měla co nejlépe vyjadřovat obsah cílových stránek. V našem případě tedy stručné a jasné informace o nabízených čalounických službách, včetně katalogu a informacích o síti prodejen. Není vhodné používat všeobecná slova, typu „prodej“, „opravy“. Tyto slova sice mohou na stránku přivést velký počet návštěvníků, ale nejedná se o návštěvníky, kteří hledají naše služby, a tak stránku opouštějí.
-
Klíčová slova by měla mít co nejmenší konkurenci – měla by být originální. V opačném případě slovo opět přivede hodně návštěvníků, ovšem placená kampaň by se nám pak nemusela vyplatit.
-
Pokud máme slovo, které opravdu dobře vystihuje naše cíle, mělo by být toto slovo jedno z nejvyhledávanějších.“ [5.]
3.2.3 Zacházení s tvary slov a synonymy
Uživatelé vyhledávačů používají pro hledání širokou škálu tvarů slov. Nejčastěji vyhledávaná slova si můžeme snadno ověřit například v aplikaci Našeptávač na Seznam.cz. Je velice žádoucí, aby v obsahu stránek, popřípadě i v navigaci, se tato klíčová slova vyskytovala.
Výpis nejčastěji hledaných slov a jejich tvarů pro slovo Čalounictví – Našeptávač (Seznam.cz a.s.). -
čalounictví
-
čalouněné postele
-
čalouněná postel
-
čalounění dveří
-
čalounické potřeby
-
čalounění
-
čalounické látky
-
čalounictví ostrava
13
3.2.4 Zaindexování našeho webu ve vyhledávačích
Dobré zaindexování webu pro vyhledávač je jedním z prvních úkolů, který bychom měli provést při optimalizaci našeho webu. Důležité je vyhnout se následujícím častým chybám.
Zdvojený obsah
Je velmi důležité předejít situaci, kdy stránky s dvěma různými URL obsahují stejný obsah. Jakmile vyhledávací robot takovou stránku nalezne, druhou již nezaindexuje a v některých případech se může stát, že nezaindexuje ani samotnou první stránku. Jedná se zejména o případy se zpětnými odkazy. Stránka tím přichází o výhodné mezistránkové odkazy, které jí mohouce vyhledávačích posunout směrem vzhůru.
Obvykle nebývá velký problém uhlídat si jedinečnost URL v odkazech na našich stránkách. Jistě si však umíme představit, že na cizích stránkách je to nemožné.
Pro úplnost níže uvádím nejčastější případy, kdy dochází ke zdvojenému obsahu, kterého se při tvorbě našeho nového webu musíme vyvarovat.
1. Stránky, které mají v sobě parametr, vedou na stejné stránky jako bez parametru. Vyvarovat se například, aby stránka http://www.calounik-a-dekorater.cz/index.php?paramter=true nesměrovala na stejnou stránku jako adresa http://www.calounik-a-dekorater.cz/
2. Bude-li na naší prezentaci použito stránkování, je třeba zajistit, aby první stránka neměla duplicitní obsah jako stránka s parametrem stránkování. Tedy, aby například stránka http://www.calounik-a-dekorater.cz/index.php neměla stejný obsah jako http://www.calounik-a-dekorater.cz/index.php?parametr=true&page=1
14
3. Zajistit v celé prezentaci, aby se na hlavní stránku odkazovalo vždy bez udání přesného souboru. V našem případě všude používat odkaz http://www.calounik-a-dekorater.cz/, nikoliv však http://www.calounik-a-dekorater.cz/index.php.
4. Zajistit, aby stránky nebyly současně dostupné z více domén třetího řádu.
5. Je třeba myslet na to, že dynamicky generované URL jsou totožné, i když se pořadí jejich parametrů liší.
Podobný obsah
Další faktor, na který musíme dávat pozor, pokud chceme, aby nám roboti vyhledávačů bez problému zaindexovali všechny stránky, je podobný obsah. Podobný obsah může stejně jako duplicitní obsah „přesvědčit“ vyhledávacího robota, aby podobné stránky ignoroval. Algoritmy, podle kterých robot vyhodnocuje podobný obsah, nejsou známy a neustále se vyvíjí. Níže uvádím několik rad, jak se tomuto problému budeme snažit vyhnout.
1. Budeme klást velký důraz na jedinečnost titulku. Každá stránka, která se bude v prezentaci nalézat, bude mít svůj jedinečný titulek, který bude ve formátu: „Úvodní stránka – Calounika-dekorater.cz“, popřípadě bude-li se jednat o materiál, tak: „Název materiálu – kategorie výrobků – Calounik-a-dekorater.cz“.
2. Vyvarujeme se obrázkových nadpisů. Pokud budeme z důvodu hezčího vzhledu nuceni použít obrázkové nadpisy, dáme si extra záležet na tom, aby každý obrázek měl vyplněný HTML atribut alt. Jednak to rapidně pomůže vyhledávačům, jednak to znatelně pomůže lidem, kteří mají z jakéhokoliv důvodu vypnuté obrázky v prohlížeči (PDA, mobilu, atd.).
3. Vyvarovat se velkého množství stránek, které se liší jen maličkými detaily. V takovém případě je lepší se zamyslet a uvážit, zda-li by se to vhodnou kombinací nedalo spojit do jedné stránky.
4. Budeme se snažit, aby zdrojový kód stránek začínal hlavním obsahem, nikoliv hlavičkou, postranními sloupci atd. Zvýšíme tím rychlost i spolehlivost indexace. 15
Flash
Pokud bude nutné některé stránky udělat pomocí technologie Flash, musíme přidat i HTML verzi stránek. Pokud by HTML verze nebyla, stránky by byly v podstatě neoptimalizovatelné.
Vytvoření souboru Robots.txt Ne každý používá na stránkách soubor Robots txt1. Je to velice důležitý soubor, který vyhledávač vyhledává jako první. Na stránkách čalounictví nastavíme soubor Robots.txt na následující parametry:
User-agent: * Disallow:
Tím říkáme, že vyhledávač má prohledat všechny naše stránky.
Důležité shrnutí pro vývojáře:
Pro lehčí orientaci přikládám stručné shrnutí standardů, které musí vývojáři při programování stránek dodržet, abychom vyšli co možná nejvíce vstříc vyhledávacím robotům.
-
URL – snaha o co nejkratší URL adresy. Pokud musí obsahovat parametry, silně doporučuji nejvíce dva.
-
TEXT/HTML - vyhledávače indexují zpravidla jen takové dokumenty, které jsou napsány v typu text/html. Google indexuje například i PDF a DOC soubory, ale takovéto soubory prakticky nelze pro optimalizaci využít.
1
-
Vyvarovat se duplicitnímu obsahu (vysvětleno viz výše).
-
Přístupnost – stránky musí vyhovovat pravidlům přístupnosti.
-
Správné nastavení souboru Robots.txt.
-
Správně zvolené úrovně v navigační struktuře.
Robots.txt je textový soubor, který slouží pro povolování, nebo zakazování botů (vyhledávacích robotů).
16
3.2.5 Vliv kvality kódu (X)HTML na indexaci
Jak jsem v úvodu řekl, naše internetová prezentace by měla mít stoprocentně validní (X)HTML kód. Právě indexovací roboti vyhledávačů jsou na chyby v kódu velice citliví, mnohem více než například internetové prohlížeče. Pokud robot na své indexovací cestě nalezne závažnější chybu, může se stát, že se zaindexuje jen část stránky, v horším případě se nezaindexuje celá.
Pro robota je rovněž velmi výhodné, pokud se do (X)HTML kódu neplete CSS formátování, popřípadě i JavaScript. Jak jsme si již řekli, ty mají své místo ve vlastním externím souboru.
Otázkou zůstává mezní velikost kódu, který bude ochotný robot indexovat. Maximální velikost se pohybuje kolem 100 KB, ale nutno říci, že rozumná mez je do 30 KB.
3.2.6 JavaScript
JavaScript je kód, který probíhá na straně klienta. Vyhledávače to, samozřejmě, nemohou procházet, proto pokud se rozhodneme použít JavaScriptový kód, měli bychom k tomu vyrobit i adekvátní statickou HTML stránku.
3.2.7 Klientské přesměrování
Roboti obvykle nejsou schopni odhalit klientské přesměrování. To je takové, které se odehrává na straně klienta. Klasickým příkladem je javascriptové přesměrování, či meta refresh. Pokud nám to okolnosti dovolí, provedeme přesměrování pomocí HTTP hlavičky (301 nebo 302). Pokud z nějakých důvodů musíme přesměrování skutečně provést na straně klienta, je potřeba, abychom do těla kódu za znak přidali odkaz s atributem na přesměrovávanou stránku.