Možnosti využití umělé inteligence v optimalizaci pro vyhledávače Ing. Jiří Kutal, Ing. Tereza Varyšová Vysoké učení technické v Brně, Fakulta podnikatelská, Ústav informatiky
[email protected],
[email protected]
Abstract This thesis deals with Search Engine Optimization methods and presents an instrument for prediction of natural search results development on search engines. Thesis also gives the definition of the procedure for the prediction of the model results in natural search.
Key words Search Engine Optimization, Off-Page Factors, Artificial Intelligence, Artificial Neural Networks, Datamining
Abstrakt Práce popisuje metody optimalizace pro vyhledávače a dále uvádí nástroje pro predikci vývoje výsledků přirozeného vyhledávání u internetových vyhledávačů. Definuje rovněž schéma postupu tvorby modelu pro predikci výsledků v přirozeném vyhledávání.
Klíčová slova Optimalizace pro vyhledávače, Off-page faktory, umělá inteligence, neuronové sítě, dolování z dat
Úvod a cíle výzkumu Internetový marketing je v současnosti jednou z nejvíce rozvíjejících se oblastí marketingu. Stačil již co do velikosti investic firem vytlačit reklamu v rádiích a velmi razantně se dotahuje na televizní reklamu. Samotný internetový marketing se rozděluje do několika oblastí, jako jsou optimalizace pro vyhledávače, PPC reklamní systémy, publikace v internetových médiích, psaní tematických blogů, eMailing, virální marketing nebo banerová reklama. Tento článek se věnuje výhradně optimalizaci pro vyhledávače a možnosti využití umělé inteligence v souvislosti s optimalizací. Rovněž je v příspěvku uvedeno základní rozdělení optimalizace na on-page a off-page faktory, kdy je pozornost zaměřena především na off-page faktory a zpětné odkazy. V další části jsou uvedeny termíny týkající se oblasti umělé inteligence ve spojení s optimalizací pro vyhledávače vzhledem k predikci výsledků vyhledávání pro vybranou oblast. Cíl výzkumu Cílem tohoto článku je návrh modelu predikce výsledků vybraných internetových stránek v přirozeném vyhledávání internetových vyhledávačů s využitím umělé inteligence beroucí ohled na kvalitu a počet zpětných odkazů směřovaných na pozorovaný web.
Použité metody a výsledky výzkumu SEO – search engine optimization, SERP – search engine result page Optimalizace stránky pro vyhledávače (SEO) je činnost pro docílení toho, aby se optimalizované webové stránky objevily po zadání určitého slovního spojení (klíčové slovo / slova) na co nejvyšší pozici v přirozeném vyhledávání fulltextového vyhledávače (Seznam.cz, Google.cz, …). Toto umístění přímo ovlivňuje vícero faktorů, které jsou popsány níže. Vedle přirozeného vyhledávání je dále velmi oblíbenou marketingovou aktivitou investování do PPC reklamy (Sklik u Seznam.cz, AdWords u Google). Velkým rozdílem v obouch aktivitách je ten, že v případě přerušení investic do PPC reklamy stránky z vyhledávání zmizí. V případě dobře provedené optimalizace pro přirozené vyhledávání zůstanou stránky ve vyhledávání i po krátkodobém ukončení optimalizačních prací. Z dlouhodobého hlediska je tedy mnohem výhodnější investicí SEO (optimalizace pro vyhledávače).
Obrázek 1:: SERP vyhledávače vyhledávač Seznam.cz (v rámečku organické - přirozené řirozené vyhledávání).
Optimalizace sledovaného webu pro vyhledávače Následující schéma popisuje metody optimalizace pro vyhledávače, vyhledáva které jsou rozděleny na on-page page faktory (prvky vlastních internetových stránek)) a off-page off faktory (především zpětné odkazy vedoucí z dalších stránek na optimalizovaný web). web Schéma 1: Schéma optimalizace pro vyhledávače
Optimalizace on-page faktorů je ze schématu výše jasná. Jedná především o výskyt klíčového slova ve správném tvaru ve všech důležitých prvcích webu. V optimalizaci off-page faktorů rozhodně neplatí, že rozhodujícím faktorem pro vyšší pozice webu je počet zpětných odkazů vedoucí na optimalizovanou stránku. Důležitými veličinami jsou především relevance obsahu stránky, ze které vede odkaz na optimalizované internetové stránky a dále síla stránky dle hodnocení vyhledávačů (tzv. Google PageRank a Seznam Srank). Datamining a umělé neuronové sítě Datamining, neboli dolování z dat, je technika, s jejíž pomocí se získávají a vyhodnocují data, na jejichž základě lze objevit strategické informace sloužící k rozhodování manažerů. Jde v podstatě o proces extrakce dat z velmi rozsáhlých databází či datových skladů. Data jsou dále analyzována a je mezi nimi nacházena určitá propojenost, jež nese relevantní informaci pro manažery. Obvykle jde o novou, nečekanou informaci, která jistým způsobem ovlivní manažerské rozhodování. Umělé neuronové sítě tvoří analogii lidského myšlení, zjednodušeně kopírují princip lidského mozku. Bývají popisovány jako tzv. černá skříňka, u níž není známa vnitřní struktura, ale pouze výstupy. Na vnitřní strukturu systému klademe pouze předpoklady, které umožní popsat chování funkcí, jež transformuje vstupy na výstupy. Neuronové sítě je vhodné použít v případech, kdy značnou roli v procesu hraje náhoda a deterministické závislosti jsou natolik složité a provázané, že je nedokážeme analyzovat a analyticky identifikovat. Používají se tedy při modelování složitých a rozvětvených procesů, při nichž není lidský mozek schopen podchytit a analyzovat vlivy a velikost jejich dopadu na sledovaný proces. V našem případě, kdy předpovídáme vývoj pozice webové stránky ve vyhledávači, jde o nejvhodnější metodu k použití. Využití metod pro výzkum V první řadě je nutné získat data, na jejichž základě je možné odhadnout vliv různých faktorů na pozici webové stránky ve vyhledávači. Jde především o zmíněné off-page faktory, z této skupiny se zaměříme na zpětné odkazy. Získaná data je potřeba upravit, aby se s nimi dalo dále pracovat a čerpat z nich důležité informace. Provede se třídění, čištění a transformace dat, dále bude vytvořen model, s jehož využitím dataminingem identifikujeme hlavní faktory a jejich vliv na pozici webové stránky ve vyhledávači. Současnou situaci a vývoj je potřeba analyzovat obzvlášť pečlivě, jelikož tyto data budou stěžejní pro následující zkoumání a předpověď budoucího stavu. Je potřeba zjistit nejen jaké faktory působí na pozici webové stránky ve vyhledávači, ale také jakou měrou a po jak dlouhou dobu. Dále je nutné zabývat se daty interními, vztahující se ke konkrétní internetové stránce, vyjadřující minulý vývoj její pozice v rámci vyhledávače. Tato data chceme získat proto,
abychom byli schopni namodelovat vývoj v minulosti a s jeho pomocí odhadli, jak se bude stránka v rámci vyhledávače če chovat do budoucna. Schéma 2: Schéma postupu tvorby modelu. Získání příslušných dat
Úprava dat dle potřeby
Analýza součané sou situace a minulého vývoje
Učení umělé neuronové sítě
Predikce budoucího vývoje
V tuto chvíli se dostává ke slovu využití umělé um neuronové sítě. Z dat, která v současné době máme k dispozici, sestavíme vícevrstevnou umělou lou neuronovou síť, síť kterou následně použijeme pro predikci budoucího stavu. Za vstupní data zvolíme jednotlivé vlivy spolu s s jejich hodnotami, které jsme zjistili přii dataminingu a také minulý vývoj pozice stránky ve vyhledávači. Za metodu učení u bude zvolena Back-propagation, propagation, bude využito Neural Network Toolboxu v programovacím prostředí jazyka MATLAB. Po naučení ení neuronové neuronov sítě,, kdy bude dosaženo minimální odchylky od modelu minulého vývoje, bude provedena predikce vývoje pozice webové stránky ve vyhledávači vyhledáva v námi požadovaném budoucím čase. Pokud bude tento model vytvořen řen a neuronová síť sí spolehlivě naučena, ena, je možné zjistit zjist pozici ve vyhledávačii ve kterémkoliv časovém č okamžiku, jež si zvolíme.
Diskuse Řešení problematiky optimalizace pro vyhledávače a analýzy pozice webové stránky ve vyhledávači s použitím metod umělé inteligence vytváří nový pohled na zkoumanou oblast. Zapojení pokročilých metod rozhodování, především umělých neuronových sítí a dataminingu, umožňuje vytvořit z dané problematiky exaktní oblast s možností prognózovat výsledky. Predikce pozice stránek v internetovém vyhledávači je však pro příslušnou firmu sama o sobě nedostačující. Pomocí dalších nástrojů, například opět dataminingu, je pak potřeba odhadnout, jaké vlivy mají na získanou pozici největší dopad, čili jak je možné dosáhnout co nejvyšší pozice v požadovaném čase. Firmě je potom možné podat soubor doporučení, po jejichž splnění dosáhne nejvýhodnější pozice ve vyhledávači po zadání vhodných klíčových slov (popř. v daném oboru). Jestliže má firma dané exaktní informace jako soubor doporučení, dosáhne nemalé úspory nákladů, jelikož je schopna efektivněji vynaložit své peněžní prostředky určené na internetovou reklamu.
Závěr Podstatou tohoto článku je uvedení do problematiky optimalizace internetových stránek pro vyhledávače ve spojení s predikcí výsledků přirozeného vyhledávání. Optimalizace pro vyhledávače je totiž v dnešní době na obrovském vzestupu, mnoho firem ale často investuje do své propagace špatné množství svých finančních prostředků. Stává se, že dochází ze strany firem k nedostatečné podpoře nebo naopak ke zbytečně velkým investicím do budování zpětných odkazů vzhledem k očekávaným cílům. V další fázi výzkumu dojde ke konkrétnímu sběru dat a aplikaci výše definovaného postupu v tvorbě modelu. Tyto výstupy budou opět diskutovány vzhledem k vytvoření kompletní metodiky pro ideální investici firem v oblasti optimalizace pro vyhledávače a především správnému přístupu k tvorbě či nákupu zpětných odkazů.
Literatura DOSTÁL, P. Pokročilé metody analýz a modelování v podnikatelství a veřejné správě. Vyd. 1. Brno : Akademické nakladatelství CERM, 2008. 340 s. ISBN 978-807-2046-058. DOSTÁL, P.; RAIS, K.; SOJKA, Z. Pokročilé metody manažerského rozhodování : pro manažery, specialisty, podnikatele a studenty : konkrétní příklady využití metod v praxi. 1. vyd. Praha : Grada, 2005. 166 s. ISBN 80247-1338-1. ENGE, E., SPENCER, S., FISHKIN, R., STRICHOLA, J. The Art of SEO. 1. Vyd. Sebastopol: O´Reilly, 2009. ISBN 978-0-596-51886-8. KUBÍČEK, M. Velký průvodce SEO. Jak dosáhnout nejlepších pozic ve vyhledávačích. 1. vyd. Brno: Computer Press, a.s., 2008. ISBN 978-80-251-2195-5.