konzultační hodiny: středa od 9:45 - 11:15
(předem napsat email o konkrétním problému, který chcete konzultovat)
1. přednáška - webové služby, jazyk HTML, editory pro úpravu HTML (15.10.09) 2. přednáška - internet v cestovním ruchu, trendy, WEB 1.0, WEB 2.0 (29.10.09) 3. přednáška - OpenSpa - odborník z praxe (12.11.09) 4. přednáška - OpenSpa - odborník z praxe (26.11.09) 5. přednáška - úprava fotografií a tvorba obrázků, GIMP (10.12.09)
Nástroj nabízející služby pro vyhledání informací na základě požadavku od uživatele Dělení dle architektury: ◦ Centralizované – seznam, google ◦ Decentralizované – Gnutella, FreeNet ◦ Hybridní – Napster, BitTorrent
Podle obsahu a služeb ◦ Katalogové (firmy.cz, seznam.cz) ◦ Fulltextové (google.cz, seznam.cz)
Katalogové ◦ Stromová struktura odkazů ◦ Manuální údržba ◦ Propojení s fulltextem
Fulltextové ◦ Rozsáhlá databáze informací (index) ◦ Automatická údržba
Typy dotazů ◦ Navigační (přístup na stránku) ◦ Informační (získání konkrétní informace) ◦ Transakční (informace pro následnou akci…)
Co katalogy umožňují Procházení stromovou strukturou sekcí podle oborů Prohlížení odkazů. Vyhledání odkazů podle určitého slova. Přidávání odkazů do databáze. Pro autory stránek je zajímavé hlavně přidávání vlastních odkazů. Tématické katalogy
Technika pro vyhledávání je založena na zkoumání každého slova ve zdrojových datech Sběr dat – robot, spider, crawler Uložení dat do databáze (index) Dotazování
Zdroj: http://eprints.rclis.org/archive/00007606/01/Internet_Search_Engines.pdf
Začne, např. v nějakém katalogu. Najde odkaz a sleduje ho. Nalezenou stránku si stáhne pro zaindexování, zároveň hledá další odkazy, které případně opět sleduje Z toho vyplývá, že robot může odhalit pouze stránku, na kterou vede nějaký odkaz. (Pokud na vaše stránky nebudou roboti chodit, žádný čtenář ty stránky nemůže najít fulltextovým vyhledávačem.) Sleduje odkazy v témž webu jen do určité úrovně (1 až 2) nebo do určitého počtu. Roboti si pamatují, kde už byli, aby tam nemuseli znovu. Čas od času se robot na stránky vrací, aby se podíval, jak se změnily.
Co vyhledávače sledují
Důležitost (váha)
Jak je to v HTML
titulek
text titulku
obrovská
klíčová slova
<meta name=keywords content="slovo, slovo">
značná, někdy žádná (Google)
popis (description)
<meta name=description content="Stručný popis">
různá
nadpis 1. úrovně
Nadpis
značná
ostatní nadpisy
Nadpis
sporná
začátek stránky
Několik prvních slov ...
větší než malá
adresa URL
jméno souboru včetně cesty
různá
text odkazů mířících na tu stránku z jiného serveru
text odkazu
u některých vyhledávačů obrovská (Google, Jyxo)
alty u obrázků
malá
text stránky
prostě text
malá
katalogový popisek
co zadáte do případného spřízněného katalogu
různá (pouze na Seznamu)
Inteligentní zpracování a tvorba dotazů Selekce zdrojů pro dotazování Personalizace Integrace vyhledávačů Sémantika ◦ z pohledu tvorby obsahu, indexu ◦ z pohledu tvorby dotazu
SEO (Search Engine Optimization, optimalizace pro vyhledávače) je metodika vytváření a upravování webových stránek takovým způsobem, aby jejich forma a obsah byly vhodné pro automatizované zpracování v internetových vyhledávačích. Cílem pak je získat ve výsledku hledání ve vyhledávačích pro danou webovou stránku vyšší pozici, která odpovídá obsahu a tím četnější a zároveň cílené návštěvníky. SEM (Search engine marketing) Jedná se o marketingový nástroj, další forma on-line reklamy, zaměřený na propagaci a zvyšování viditelnosti a známosti webu, tedy navyšování návštěvnosti placenou formou. PPC (pay per click) AdWords, Sklik
http://marketing.blogs.ie.edu/archives/mdac%20sem.gif
PageRank algoritmus pro ohodnocení důležitosti webových stránek Algoritmus využívá strukturu hypertextových odkazů jako vzájemné “doporučování” stránek, ne nepodobné hodnocení vědeckých prací podle počtu citací. Na rozdíl od sledování počtu citací ale dovádí tento princip ještě dál: hodnocení stránky se nepočítá z prostého počtu odkazů, které na ni vedou, ale bere se v úvahu i hodnocení odkazujících stránek.
Velikost indexu a aktualizace indexu Formáty dokumentů Dynamicky generované stránky Index spamming (oklamání relevance stránek, křížové odkazy, neviditelný text, etický problém, penalizace) Zpracování přirozeného jazyka (význam slov a obsah stránky) Interakce uživatelů a vyhledávače (lidé často nemají jasnou představu co hledají) Ověřování informací (vybrání té správné)
Etické metody ◦ Kvalitní a unikátní obsah ◦ Používání (X)HTML značek (tagů) podle normových předpisů ◦ Používání titulku, nadpisů a popisů (title, h1, alt) ◦ Krátká a neměnná URL adresa ◦ Budování zpětných odkazů ◦ Správné používání souboru robots.txt ◦ Používání description, keywords
Neetické metody: ◦ Spam ◦ Oklamání robotů ◦ Skrytý text
Indexuje cca 2mil. stránek za den Přeindexování nejhůře 1x za 2 měsíce Ignoruje meta tagy 200 000 screenshotů za den 200 dotazů za 1sekundu zpracování výsledku cca 250ms
Vyhledávač každodenně obslouží přes dvě miliardy dotazů, probíhá na něm 47,7% vyhledávání ( V červnu 2005 dokázal Google hledat v 8,05 miliardách stránek, 1,3 miliardách obrázků a více než miliardě zpráv z diskusních skupin. Většinu tohoto obsahu také archivuje. Google nabízí své rozhraní v mnoha jazycích, včetně češtiny. Výsledky vyhledávání lze omezit podle místa, jazyku a času zveřejnění. Vyhledávač původně navrhli Sergey Brin a Larry Page v rámci svého výzkumu na Stanfordově univerzitě, aby ověřili funkčnost svého algoritmu pro ohodnocování webových stránek PageRank.
Kromě řazení výsledků podle PageRanku bylo v Googlu novinkou i kladení důrazu na vyhledávání frází (takže se nestávalo, že víceslovný dotaz vrátil stránky, kde se tato slova vůbec nevyskytovala pohromadě) a ukládání plného textu indexovaných stránek (které umožňovalo u výsledných stránek rovnou zobrazovat relevantní fragmenty textu.
Rank znamená hodnocení. "Page" je příjmení jednoho ze zakladatelů Google (Larry Page a Sergey Brin). Takže Page Rank je to vlastně "Hodnocení pana Page". Často se uvádí výklad Page = angl. stránka, takže Page Rank = stránkový rank. To je špatné vysvětlení.
AdWords je reklamní produkt Google. Zobrazuje reklamní textové odkazy v pravém sloupečku vyhledaných výsledků. Do systému si můžete zadat i svoji reklamu. Stanovíte si klíčová slova, fráze a jazyk. Zvolíte maximální cenu, průměrnou cenu za kliknutí a celkový rozpočet. produkt AdSense. Ten umožňuje webmasterům (po registraci do Google) umístit určitý reklamní kód do stránky. Na místě reklamního kódu se bude zobrazovat textová reklama posílaná z Google, tematicky související s obsahem stránky. Jde o tatáž reklamní sdělení, která jsou zadána v AdWords. Pokud si čtenáři stránky na reklamu kliknou, dostává webmaster od Google provizi (a Google si započítá proklik na účet klienta
1.výměnné bannerové systémy (veřejné) 2.agenturní systémy (otevřené jen pro velké a středně velké servery) 3.soukromé nebo firemní systémy (na velkých serverech) 4.systémy pro vyhledávače (Google AdWords
PPV = pay per view, platba za zobrazení Flat rate = paušální platba za čas a pozici PPC = pay per click, platba za proklik PPS = pay per sale, platba za prodej, PPA = pay per action, platba za nějakou akci
Příklad SEM kampaně: Dejme tomu, že prodávám zájezdy do Chorvatska. 1.Předpoklady: ◦musím mít hotový web, na který chci dostat lidi, aby si zájezdy koupili ◦musím mít peníze na kampaň 2.Postup: ◦Nakoupím si klíčová slova související s Chorvatskem v reklamním systému Google AdWords. Můj odkaz se bude objevovat v pravém sloupci výsledků vyhledávání na Google, když bude nějaký uživatel hledat nějaké mé slovo nebo sousloví. ◦Zároveň si tatáž slova zadám v systému Sklik na Seznam. ◦Zvážím, zda se mi vyplatí nakoupit sponzorovaný odkaz na Seznamu na slovo Chorvatsko. ◦Podle oboru (např. cestování) zkusím najít jiné partnerské weby, které mi umožní mít u nich reklamu, která se mi vyplatí.
Vyplatí se mi to? Jak kdy. Ale dá se to vždy přesně spočítat. Vtip je v tom, že náklady na kliknutí jsou malé a potenciální zisk je velký. Ne všichni lidé, kteří si na moje stránky kliknou, něco nakoupí. Reklamní systémy dokážou změřit, jestli si zákazník, který přišel z vyhledávače, něco koupil. Dokáží i spočítat útratu. Vstupy výpočtu: Dejme tomu, že si zájezd objedná každý padesátý člověk, (2%) který přijde z reklamního odkazu. Za každý reklamní proklik třeba 1 Kč (v AdWords odpovídající suma). Z jednoho prodaného zájezdu mám zisk např. 500 korun. 2% lidí si koupí zájezd -- tomuto číslu se říká míra konverze. (Dobře udělané weby s dobře cílenými kampaněmi dosahují míry konverze v jednotkách procent) Výpočet vypadá takto: Za sto prokliků zaplatím 100 korun. Z těchto sta prokliků přijmu pravděpodobně 2 objednávky, což odpovídá 2x500 Kč = 1000 Kč Když odečtu náklady na kampaň , tak se dostávám k odpovědi: Za 100 prokliků mám čistý zisk 900 Kč. Return On Investment. V tomto příkladu je ROI rovno 900%. Není důležitý být první na Googlu nebo na Seznamu -- důležité je mít vysokou ROI.