Debreceni Egyetem Informatikai Kar
XML adatfeldolgozás
Készítette:
Megyesi Emil Programtervező Informatikus (BS.c.) hallgató
Témavezető:
Dr. Juhász István egyetemi adjunktus
Debrecen 2007
XML adatfeldolgozás
Tartalomjegyzék Bevezetés..........................................................................................................3 A szabványosítás szükségessége...........................................................................5 Hivatalos, de-jure szabványok .........................................................................5 Ipari, de-facto szabványok ..............................................................................6 Egyéni, de azért is szabványok ........................................................................ 6 W3C World Wide Web Consortium.........................................................................9 Az eXtensible Markup Language (XML).................................................................11 Története ....................................................................................................11 Előnyei és hátrányai ......................................................................................12 XML verziók .................................................................................................14 Google.............................................................................................................17 A goto.com története.....................................................................................21 AdSense, AdWords............................................................................................22 A keresőmarketingről.........................................................................................28 Apache.............................................................................................................32 PHP.................................................................................................................34 MySQL.............................................................................................................37 KeyAdMan - a hirdetéskezelő..............................................................................38 A problémakör nehézségei..............................................................................39 Összefoglalás....................................................................................................41 Irodalomjegyzék...............................................................................................43 Köszönetnyilvánítás...........................................................................................44
Ábrajegyzék 1. ábra: Google hirdetések egy weboldalon..........................................................................21 2. ábra: Más stílusú Google hirdetések egy másik weboldalon............................................21 3. ábra: A bejegyzett oldalak számának alakulása................................................................23 4. ábra: Az egyes webszerverek használtsága.......................................................................28
-1-
XML adatfeldolgozás
Bevezetés
Napjaink
egyik
legjobban
és
leggyorsabban
fejlődő
informatikai
ágazata az internet (world wide web). Szinte naponta kerül a figyelem középpontjába valamilyen új fejlesztés vagy egy új szabvány (vagy csak annak jelölt). Jelen dolgozatomban egy teljesen aktuális webes témán, az online marketingen betartásának
keresztül
szeretném
megmutatni
fontosságát és nélkülözhetetlenségét,
a
szabván yo k
valamint
egyes
s z a b v á n yo k a t , a m e l y e k n é l k ü l m a n e m l e h e t n e k ö n n ye b b e n m e g o l d a n i eg ye s problé máka t. Ezt egy jelenleg az iparban működő, és napi használatban lévő szoftveren keresztül szeretném megmutatni, amiben az XML és az Unicode előnyeit éles körülmények között tapasztalhattam meg. Kezdetben áttekintem, hogyan lett az internetes marketing a mai egyik legfontosabb marketing
reklámozási
szereplő
–
és
felületté. nem
Ezt
a
mellékesen
legnagyobb az
e g yi k
internetes
legfontosabb
elindítója – a Google történetének és szolgáltatásainak áttekintésével illusztrálom. Az internetes szabványok elterjesztésében a Google vezető szerepe kétségtelen, ám hosszú és rögös út vezetet t eddig. A szabván yo k szükségességét is bemutatom a kezdeti lépésektől a mai kaotikus á l l a p o t o k i g . R á m u t a t o k , h o g y m i é r t f o n t o s a k a s z a b v á n yo k , m i é r t -2-
XML adatfeldolgozás kellene a szabványokat kötelezővé tenni. Bemutatom
az
egyik
legnagyszerűbb,
az
interneten
elterjedt
s z a b v á n yt , a z X M L t , e l ő n y e i v e l é s h á t r á n y a i v a l e g ye t e m b e n . Dolgozatom végén a példaalkalmazás problémakörét tekintem át, majd rámutatok a továbbfejlesztési lehetőségekre. Ez a web dinamikus fejlődése következtében nem csak az asztali szoftvereknél megszokott “mivel
lehet
még
jobbá
tenni”
kérdés,
változtatások és fejlesztések sorozata.
-3-
hanem
a
jövőtől
függő
XML adatfeldolgozás
A szabványosítás szükségessége A " s z a b v á n y" s z ó n a k t ö b b k ü l ö n b ö z ő é r t e l m e z é s e l é t e z i k , k ü l ö n ö s e n az
informatikában.
időtállóság,
A
minőség,
szóhoz
olyan
t e k i n t é l y,
képzetek
kapcsolódnak,
együttműködés
és
mint
konszenzus.
Á l t a l á b a n e g y i p a r á g i m e g á l l a p o d á s t é r t ü n k a l a t t a , m e l yn e k k e r e t é b e n egy
termék
előállítása
vagy
egy
szolgáltatás
üzemeltetése
előre
specifikált (szabványosított) módon történik. Ahogyan
a
világ
minden
területén,
úgy
az
informatikában
is
s z ü k s é g e s s é v á l t a k a s z a b v á n yo k . A l e g k o r á b b i i d ő s z a k á t ó l k e z d v e felismerték
az
iinformatikusok,
hogy
megfelelő
szabván yo k
nélkülözhetetlenek az informatikában. H á r o m f é l e s z a b v á n yt k ü l ö n b ö z t e t ü n k m e g a z i n f o r m a t i k á b a n :
Hivatalos, de-jure szabványok I d e t a r t o z n a k a z o k a s z a b v á n y o k , m e l ye k e t a k ü l ö n b ö z ő á l l a m o k á l t a l t ö r v é n yi
szinten
szervezetek
adnak
elismert, ki.
A
szabványok
s z a b v á n yü g y i
megalkotására testületek
három
létrejött szinten
hel ye zk ednek el, és az általuk kiadott szabványok is általáb an ezekre s z i n t e k r e é r v é n ye s e k : • globális, nemzetközi szint (pld. ISO, IEC, ITU-T) • regionális szint (pld. az Európai Unióban: CEN, CENELEC, ETSI) • n e m z e t i s z i n t ( p l d . M a g ya r S z a b v á n yü g y i T e s t ü l e t )
-4-
XML adatfeldolgozás
Ipari, de-facto szabványok A l e g t ö b b i l ye n s z a b v á n y e g y a d o t t i p a r á g , k o n z o r c i u m b a t ö m ö r ü l t é r d e k e l t f e l e i n e k e g yü t t m ű k ö d é s i t ö r e k v é s e k a p c s á n j ö n l é t r e . H a b á r ezek
n e m d e - j u r e s z a b v á n yo k ,
hitelességüket
mégis
a n yi t o t t
és
átlátható együttműködési törekvések biztosítják. Példa erre a W3C (World Wide Web Consortium), mely több mint 350 informatikában érdekelt cég és non-profit szervezet együttműködése. A W3C is ajánlásokat (recommendations) bocsát ki szabványok helyett, hiszen neki sincs jogi engedélye de-jure szabványok kiadására.
Egyéni, de azért is szabványok N é h á n y s p e c i f i k á c i ó , h a b á r e g yi k s z a b v á n yü g y i s z e r v e z e t s e m a d t a k i v a g y h a g y t a j ó v á , a n n y i r a e l t e r j e d t , h o g y l é n y e g é b e n s z a b v á n n yá v á l t . Il ye n például a Microsoft® Windows® operációs rendszer. Ez az i n f o r m a t i k á b a n k i a l a k u l t “ m i n é l e l ő b b l e g yü n k a p i a c o n ” f e l f o g á s n a k l e h e t e g yr é s z t k ö s z ö n n i . M i n d e g yi k n a g y g yá r t ó / s z o l g á l t a t ó m i n é l előbb piacon akar lenni a termékével, hogy a felhasználók minél előbb szokjanak rá a saját termékükre. Hiányzó informatikai érdekvédelmi szervezet híján ezt megtehetik és meg is teszik.
Sajnos
az
informatikában
ellentmondások
és
a
hibák
s z a b v á n yo s í t á s találhatóak
-
területén lásd
az
hatalmas utolsó
s z a b v á n yc s o p o r t o t . A c é g e k i g y e k e z n e k m i n é l t ö b b h e l y e n a s a j á t mego ldásaika t használtatn i, íg y - szabványos ítás előtt - olyan előn yr e és
pozícióra
megoldásuk,
szert vagy
tenni,
hogy
elfogadják
és
később mindenki
-5-
vagy
szabvány
használja
-
lesz
a
hivatalos
XML adatfeldolgozás s z a b v á n yo s í t á s n é l k ü l . Ezt hívják vendor lock-innek.
A v e n d o r l o c k - i n a n g o l k i f e j e z é s t a r r a a h e l yz e t r e a l k a l m a z z u k a számításte chnikáb an és a köré csoportosuló iparban, mikor eg y üg yf él egy
g yá r t ó
(vendor)
bizonyos
termékét
elkezdi
használni
használva
csapdába,
kén ys zerhe l yze tb e kerül.
Példa:
egy
ü g yf é l
programcsomagját. tárolja
az
Ez
információt,
a
programcsomag amely
s e m e l yi k
X
g yá r t ó
irodai
o l ya n
fileformátumokban
másik
konkurens
gyártó
hasonló termékév el sem kompat ibil is. Emel let t a formátum nem n yí lt , így a konkurenseknek esélye sincs kompatibilis programcsomagot készíteni. Az ügyfél hosszú évekig használja a programcsomagot, és ennek következtében nagymennyiségű fontos dokumentuma tárolódik már ezekben a formátumokban. Közben úgy döntene, hogy Y gyártó irodai
programcsomagjára
váltana,
mert
az
jobban
megfelelne
igén ye in ek. Saj nos nem tud váltani, mert az évek óta felhal mozódo tt dokumentumokkal
nem
tud
mit
kezdeni.
Az
ü g yf é l
kénytelen
kén ys zerűségből X gyár tó ter mékvonal ánál maradni és ha naprakész szeretne maradni, akkor kénytelen a verzióváltásokkal együtt haladni.
-6-
XML adatfeldolgozás
W3C World Wide Web Consortium
"A webtársadalomhoz tartoznak mindazok, akik böngésznek vagy információkat helyeznek el a Weben, akiknek a Web jelenti a munkahelyüket, akik új termékeket és szolgáltatásokat fejlesztenek a Weben, ezenkívül az internetszolgáltatók, valamint azok, akik elképzelésekkel rendelkeznek arról, hogyan fejlesszék tovább a Webet... A Konzorcium az a semleges közeg, melyben ezek a csoportok megegyezésre juthatnak a szabványokat illetően. Ezeknek az erőknek a találkozása révén gazdagodik a W3C." Tim Berners-Lee, a W3C igazgatója
A World Wide Web Consortiumot (W3C) 1994-ben alapította Tim Berners-Lee, a Web szülőatyja. A cél elsősorban az volt, hogy a webtechnológiák
fejlesztésével
foglalkozó
vállalatok
és
kutatóintézetek a jövőben ne forgácsolják szét feleslegesen tudásukat, e l é r t e r e d m é n ye i k e t , h a n e m e g y m á s s a l v á l l v e t v e , e g y m á s t s e g í t v e t e r e l j é k u g yn a z o n i r á n y b a a z i n f o r m a t i k a ú j í t á s a i t . M á r a m á r k i d e r ü l t , hogy a Web nyújtotta lehetőségek tárháza rendkívüli tempóban bővül napról
napra
a
kereskedelem,
a
kommunikáció,
az
információs
f ó r u m o k é s a k o l l e k t í v t u d á s t e r é n e g ya r á n t . A W 3 C é p p e n e z e k n e k a fol ya mat osan bővülő lehetőségeknek a kiaknázására szerveződött. Az MTA SZTAKI 1995 óta tagja a Konzorciumnak. A W3C itt nyitotta meg első kelet-közép-európai irodáját, a W3C Magyar Irodát.
-7-
XML adatfeldolgozás A W 3 C o l ya n e g y m á s s a l e g y ü t t m ű k ö d ő t e c h n o l ó g i á k ( s p e c i f i k á c i ó k , irán ye lv ek,
szoftverek)
fejlesztésével
foglalkozik,
me l ye k
segítségével kiaknázhatjuk a Web összes lehetőségét az információs fórumok, a kereskedelem, a kommunikáció és a kollektív tudás terén eg ya rá nt.
Egy
W3C-ajánlás
(W3C
Recommendation)
azt
jelzi,
hogy
egy
specifikáció stabil, elősegíti a Web interoperabilitását, a W3C tagjai átnézték, és helyeslik annak ipari alkalmazását.
A W3C karolta fel az XML specifikációt is.
-8-
XML adatfeldolgozás
Az eXtensible Markup Language (XML)
Az Extensible Markup Language (XML, kiterjeszthető leíró nyelv) a W 3 C á l t a l a j á n l o t t á l t a l á n o s c é l ú l e í r ó n ye l v s p e c i á l i s c é l ú l e í r ó n y e l v e k l é t r e h o z á s á r a . A z S G M L e g ys z e r ű s í t e t t r é s z h a l m a z a , m e l y különböző adattípusok leírására képes. Az elsődleges célja strukturált szöveg és információ megosztása az Interneten keresztül. Az XML-en a l a p u l ó n ye l v e k ( p é l d á u l R D F , R S S , M a t h M L , X S I L , S V G ) f o r m á l i s módon vannak leírva, így lehetővé téve a programok számára a dokumentumok
módosítását
és
validálását
a
formátum
előzetes
ismerete nélkül.
Története Az XML-t Tim Bray fejlesztette ki, miután az IBM, az Oxford University Press és a University of Waterloo egy által támogatott internetes
szótáron
kellett
tárolni
vontak
be
a
és
dolgozott.
Mivel
feldolgozni,
projektbe,
hogy
hatalmas
kereskedelmi megoldást
mennyiségű
adatot
szoftvermérnököket
találjanak
az
adatok
indexelésére és tárolására. Az Association for Computing Machinery (ACM)
számára
bevonták
a
adott
projektbe
interjú és
során
Bray
megmutatták
azt
neki
nyilatkozta, a
szótár
hogy
számára
k i f e j l e s z t e t t b e l s ő s t r u k t ú r á t : " k i s b e á g ya z o t t c í m k e h a t á r o z t a m e g , hogy mi bejegyzés illetve szó, és aztán kiejtés, etimológia, rövid idézet, és aztán adat, forrás, szöveg és így tovább" (ACM Queue, 2005). Ez vált az XML elődévé. Miután kifejlesztették a technológiát a szótár projekthez, Bray megalapította az Open Text Corporation-t, -9-
XML adatfeldolgozás kifejlesztett egy kereső motort, valamint meghívták a W3C-be, hogy leg ye n az XML specifikációj uk szerkesztőj e.
Előnyei és hátrányai Az
XML
azon
tulajdonságai,
m e l ye k
alkalmassá
teszik
adattovábbításra: •
mind ember, mind gép számára olvasható formátum
•
támogatja a Unicode-ot, ami lehetővé teszi bármely információ b á r m e l y e m b e r i n ye l v e n t ö r t é n ő k ö z l é s é t
•
képes
a
legtöbb
általános
számítástudományi
adatstruktúra
ábrázolására (rekord, lista, fa...) •
öndokumentáló formátum, amely struktúra- és mezőneveket ír le speciális értékekkel együtt
•
szigorú szintaktikus és elemzési követelményeket támaszt, ami biztosítja,
hogy
a
szükséges
elemzési
algoritmus
egyszerű,
hatékony és ellentmondásmentes maradjon A z X M L - t g ya k r a n h a s z n á l j á k d o k u m e n t u m t á r o l á s i é s f e l d o l g o z á s i formátumként, mind online mind offline módon, és több előnnyel is jár: •
internetes
szabványokon
alapuló
erőteljes,
logikailag
megfelel
a
(de
ellenőrizhető formátum •
a
hierarchikus
struktúrája
mindegyik) dokumentum típusnak
- 10 -
legtöbb
nem
XML adatfeldolgozás •
egyszerű
szöveg
formátumban
valósul
meg,
licencektől
és
korlátozásoktól mentesen •
platform-független,
így
viszonylag
immúnis
a
technológiai
változásokkal szemben •
az
XML-t
és
használják,
elődjét,
így
az
széles
SGML-t
már
tapasztalat
több
és
mint
tíz
éve
eszközkészlet
áll
rendelkezésre B i z o n yo s
alkalmazások
szempontjából
a
következő
h á t r á n yo k k a l
rendelkezik: •
A
szintaxisa
nehezítheti
elég
az
bőbeszédű
emberi
h a t é k o n ys á g á t ,
és
részben
olvashatóságot
valamint
nagyobb
és
redundáns. az
tárolási
Ez
alkalmazások
költséggel
jár.
Nehézzé teszi az XML alkalmazását korlátozott sávszélesség esetén,
bár
bizonyos
esetekben
a
tömörítés
csökkentheti
a
problémát. Ez részben igaz a telefonokon és PDA-kon futó multimédiás
alkalmazásokra,
m e l ye k
XML-t
szeretnének
használni képek és videók leírására. •
A szintaxis számos homályos, felesleges tulajdonsággal bír, ami az SGML hagyatéka.
•
Az
alapvető
elemzési
követelmények
nem
támogatják
az
adattípusok túl széles körét, így néha a kívánt adat kinyerése a dokumentumból plusz munkával jár az elemző részéről. Például nincs lehetőség XML-ben a "3,14159" lebegőpontos számként v a l ó m e g j e l ö l é s é r e h é t k a r a k t e r b ő l á l l ó s z t r i n g h e l ye t t . •
Nincs
lehetőség
a
dokumentum - 11 -
e g ye s
részeinek
közvetlen
XML adatfeldolgozás elérésére és frissítésére. •
Egymást
részben
átfedő
(nem
hierarchikus)
adatstruktúrák
m o d e l l e z é s e k ü l ö n e r ő f e s z í t é s t i g é n ye l . •
Az XML relációs és objektum orientált paradigmához kötése néha fáradságos.
X ML v e r z i ó k
Jelenleg két XML verzió létezik. Az XML 1.0-t 1998-ban definiálták. Többször átnézték már azóta anélkül, hogy új verziószámot kapott volna.
Jelenleg
a
2004.
február
4-én
publikált
harmadik
kiadás
aktuális. Széles körben elterjedt, és még mindig ajánlják általános felhasználásra. Az XML 1.1-et egy napon adták ki az XML 1.0 harmadik kiadásával. Sok olyan – néhány vitás – tulajdonsággal bír, aminek
célja
az
XML
használatának
egyszerűbbé
tétele
több
felhasználói csoport (főleg mainframe programozók) számára. Az XML 1.1 nem túl elterjedt, és csak azoknak ajánlják, akik ki tudják használni az egyedi képességeit. Az XML 1.0 és az XML 1.1 az elemek, attribútumok stb. nevében megengedett karakterekben különbözik. Az XML 1.0 csak a Unicode 2 . 0 s z a b v á n yb a n m e g e n g e d e t t k a r a k t e r e k e t e n g e d é l ye z i , a m i m a g á b a n foglalja
a
legtöbb
világnyelvet,
de
nem
tartalmazza
azokat
a
n ye lv eket, mel yek et a későbbi Unicode szabván y verzióban vezettek b e . I l ye n n ye l v a m o n g o l , a k a m b o d z s a i , a b u r m a i s t b . A z X M L 1 . 1 csak bizonyos vezérlő karakterek használatát tiltja , ami azt jelenti,
- 12 -
XML adatfeldolgozás hogy minden más karakter használható, még ha nem is definiálták az aktuális Unicode verzióban. Meg kell jegyezni, hogy az XML 1.0 megkötései csak az elemek illetve attribútumok neveire vonatkoznak: mind az XML 1.0, mind az XML
1.1
megengedi
a
teljes
Unicode
készlet
használatát
a
tartalomban. Így az XML 1.1 csak akkor szükséges, ha a Unicode 2.0 után publikált szöveghez szeretnénk elem és attribútum neveket fűzni. Másik kisebb különbség az XML 1.0 és az XML 1.1 között, hogy a vezérlő karakterek nem szerepelhetnek, hacsak nem "escape" karakter formátumúak, és két speciális Unicode karaktert tartalmaz, amit üres hel yk én t kezelnek. Az
XML
1.0
dokumentumok
dokumentumok egy
kivétellel:
h e l ye s e n a
nem
formázott "escape"
XML
formátumú
1.1 Cl
karakterek hibásak: az XML 1.1 megköveteli a Cl vezérlő karakterek számmal történő hivatkozását. M e g b e s z é l é s f o l yi k a z X M L 2 . 0 s z a b v á n yr ó l , b á r n e m l á t h a t ó e l ő r e , h o g y e g yá l t a l á n l é t r e f o g - e j ö n n i . A z X M L - S W ( S W : s k u n k w o r k s , t i t k o s p r o j e k t ) – a m i t a z X M L e g yi k e r e d e t i s z e r z ő j e í r t – t a r t a l m a z néhány utalást az XML 2.0 formátumára: a DTD kiküszöbölése a szintaxisból, névterek, XML Base és XML Information Set (infoset) integrációja az alap szabványba. A W3C rendelkezik egy XML Binary Characterization Working Grouppal, ami bevezető kutatást végez a binárisan kódolt XML infoset-ek felhasználásának
terén.
A
munkacsoportnak
nem
célja
bármilyen
szabvány létrehozása. Mivel az XML definíció szerint szöveg alapú, a S u n M i c r o s ys t e m s a g y o r s i n f o s e t n e v e t a d t a a s a j á t b i n á r i s i n f o s e t - 13 -
XML adatfeldolgozás implementációjának, hogy elkerülje az összetévesztés lehetőségét, és az ISO-n keresztüli szabványosításán dolgozik. A z X M L r ö v i d i d ő a l a t t a z i n t e r n e t k e d v e l t n ye l v é v é v á l t , a f e n t e b b említett hasznos tulajdonságai alapján. Az eredeti elképzelése, a p l a t f o r m f ü g g e t l e n s é g , e g yi k l e g j o b b a n k i h a s z n á l h a t ó t u l a j d o n s á g a a z i n t e r n e t e s k ö r n ye z e t b e n , í g y a v i l á g h á l ó t é n y l e g a t e l j e s s z a b a d s á g o t k í n á l j a – f e l t é v e , h o g y a h o n l a p o k k é s z í t ő i f i g y e l n e k a s z a b v á n yo k r a és betartják azokat. Látni fogjuk, hogy eg y ol ya n országokon-kultúrákon átívelő területen, mint az online marketing, az XML és vele az Unicode a leghasznosabb segítőtárs,
a
l e g k ö n n ye b b
és
l e g e g ys z e r ű b b
megoldásokhoz
nélkülözhetetlenek.
Most pedig lássuk az internetes hirdetések bölcsőjét, hogyan és h o n n a n i n d u l t e z a n a p j a i n k a t e g yi k l e g j o b b a n b e f o l y á s o l ó h i r d e t é s i forma.
- 14 -
XML adatfeldolgozás
Google
A n a g y p o r t á l o k k a l e g yi d ő b e n p e d i g s o k a n e l k ö v e t t é k a z t a h i b á t , hogy leírták a keresőgépeket - sokan úgy hitték, hogy igazából nincs szükség
keresőmotorokra…
A
“Google-éra”
g ye r m e k e i n e k ,
meglehetősen érthetetlennek tűnik ez a gondolat. Larry Page és Sergey Brin, a Google két alapítója sem így gondolták - és megszületett napjaink leginkább használt keresőmotorja. Talán nehéz elhinni, de amikor már megtette első sikeres lépéseit a Google, mint üzleti vállalkozás - nos, még akkor sem igazán volt túl sok elképzelésük az alapítóknak arról, hogy miképp is termeljenek pénzt a keresőmotor felhasználóiból. A kezdeti időkben a Google abszolút nem akart semmiféle reklámot megjeleníteni - a különféle bannereket
hihetetlenül
bosszantónak
tartották.
Igen,
a
f e l h a s z n á l ó k b a n m á r a k k o r i s i g e n g yo r s a n k i a l a k u l t a r e k l á m - u n d o r , nem akartak reklámokat nézegetni - Page és Brin meg nem akart reklámokat megjeleníteni a Google főoldalán. Mégis, az AdSense1 révén
ők
váltak
az
online
reklámpiac
e g yi k
legmeghatározóbb
figuráivá. Sokan úgy hiszik, hogy ezt a szöveg-alapú reklámot, ami az AdSense legfőbb jellemzője, Larry Page és Sergey Brin találták ki, holott ez így ebben a formában nem igaz. Egy Bill Gross nevű úriember 1997ben
alapította
meg
a
GoTo.com-ot2,
1 lásd a következő fejezetet 2 lásd a fejezet végén - 15 -
ami
már
azokkal
az
XML adatfeldolgozás alaptulajdonságokkal kísérletezett, amik később az AdSense-t tették sikeressé. Havi fél millió dollár kiadás - 20 millió dollár a bankszámlán bevétel
meg
g ya k o r l a t i l i a g
nuku.
Míg
egyre
többen
és
többen
k a t t a n t a k r á a G o o g l e h a s z n á l a t á r a , a c é g e t ü z l e t i l e g n a g yj á b ó l e z jellemezte ‘99 végén. Ezen a nem túl rózsás felálláson változtatott a Google AdWords bevezetése. Lássuk hát a történet második felvonását. Larry Page és Sergey Brin nem akarták, hogy a Google úgy nézzen ki, mint a legtöbb portál: nem akarták mindenféle csiricsáré, villogó bannerekkel telepakolni az oldalt, holott valószínűleg több millió dollárt kaszáltak volna, ha erre az útra lépnek. N e m e z t t e t t é k , l e g a l á b b i s n a g yo n - n a g y o n ó d z k o d t a k t ő l e . A m i k o r elkezdett gondolták:
formálódni ha
minden
az
üzleti kötél
elképzelésük,
szakad,
akkor
akkor
azért
mégiscsak
úgy
eladnak
bannerhelyet a Google.com nyitólapján, de ha lehet, megpróbálkoznak valami mással. Két dologhoz ragaszkodtak minden áron: egyrészt, a reklámok csak és kizárólag szövegesek lehettek - csiricsáré képek kizárva. Másrészt, a reklámok akkor bukkantak fel, ha valaki olyan kulcsszóra keresett, amihez passzolt a reklám - ha autóra kerestél, akkor jelent meg pl. a Ford hirdetése.
- 16 -
XML adatfeldolgozás A reklámozó itt a megjelenések számának arányában fizetett. Továbbá a
hirdetéseket
reklámszervező
hozta,
nem
lehetett
“csak
úg y”
k a m p á n yt i n d í t a n i a r e n d s z e r b e n . E z a r e n d s z e r j ó p é n z t h o z o t t u g y a n a k o n yh á r a , d e n e m e l e g e t nag yo n úgy nézett ki, hog y a Google mégiscsak meg fog állapodni a DoubleClick
nevű
reklámszolgáltatóval,
aki
a
h a g yo m á n y o s
bannerértékesítésben utazott. Csakhogy egy szép napon a DoubleClick k o r á b b a n 1 5 0 d o l l á r t é r ő r é s z v é n ye i l e z u h a n t a k 1 5 d o l l á r r a . 3 A Google előtt nem állt más lehetőség, mintsem hogy előremeneküljön - fogták tehát, és gyakorlatilag lemásolták a GoTo.com módszerét (kis ablakban
a
továbbra
is
goto
modszere),
élesen
egy
fontos
elkülönítette
a
különbséggel:
keresőprogram
a
Google
természetes
(organikus) találatait a fizetett hirdetésektől. És kezdetben továbbra is a megjelenések száma alapján kellett a hirdetőknek fizetniük. És
volt
még
egy
jelentős
különbség
-
az
átlagember
sokkalta
könn ye bben vásárolhatott magának reklámo t, és talán ez az a fő szempont, ami miatt sikeressé válhatott az AdWords szolgáltatás.
3 A sors különös fintora, hogy a Google pár héttel ezelőtt végül mégis felvásárolta a DoubleClicket – a történelem eddigi legnagyobb készpénzes kifizetésével. - 17 -
XML adatfeldolgozás
A goto.com története
Egy Bill Gross nevű úriember 1997-ben alapította meg a GoTo.com-ot, ami már azokkal az alaptulajdonságokkal kísérletezett, amik később az AdSense-t tették sikeressé. G r o s s e g ys z e r r e h á r o m n a g y ú j í t á s t v e z e t e t t b e : e g y r é s z t , a h i r d e t ő k nem a reklám megjelenéséért fizettek, hanem azért, ha egy felhasználó a
reklámra
rákattintott.
Másrészt,
a
reklámok
nem
össze-vissza
jelentek meg, hanem akkor, ha egy felhasználó bizonyos kulcsszavak után
kutakodott: ha autókereskedő
vagy,
akkor érdemes
az autó
kulcsszót megvenned - és akkor a reklámod akkor jelenik meg, ha valaki autók után kutakodik. Harmadrészt, hihetetlen alacsony árakkal indult a GoTo.com: kezdetben kattintásonként mindössze 1 centet kellett fizetnie a hirdetőnek. És
volt
még
licitálniuk
egy
kellett
nagy
újítása
a
a kulcsszavakra.
GoTo.comnak: Azaz,
ha több
a
hirdetőknek
autókereskedő
akarta megvenni az “autó” kulcsszót, akkor a sorrendet az döntötte el, hogy ki volt hajlandó többet fizetni egy kattintásért.
- 18 -
XML adatfeldolgozás
AdSense, AdWords
Tekintsünk egy picikét vissza, az AdSense előtti időkbe, hogy jobban megérthessük,
mi
vezetett
ahhoz,
hogy
a
világ
legsikeresebb
marketing-eszközévé válhatott ez a reklám-típus. A történet a nagy portálokkal, a keresőgépek megjelenésével, meg az első online reklá mokka l kezdődik: az interneten megj elentek az ol ya n óriási méretű portálok, mint a Yahoo (itthon pár évvel később az I n d e x - e l ő d I n t e r n e t t ó , i l l e t v e a z O r i g o ) , a m e l ye k ü z l e t i m o d e l l j e alapvetően egyszerű volt: azt az irgalmatlan mennyiségű forgalmat “adták el”, amit sikerült elérniük: megjelentek a reklámbannerek minden
oldalon,
a
reklámozók
pedig
a
reklámmegjelenés
száma
alapján fizettek. Az
AdWords
vállalkozást
lényege is
a
mai
vezessen,
napig
könnyen
az, és
hogy
bárki,
egyszerűen
bármilyen
tudja
magát
regisztrálni a rendszerben, és olcsón jusson minőségi találatokhoz. 2 0 0 3 - b a n m é g a n n yi l e h e t ő s é g e s e m v o l t e g y k i c s i v a g y k ö z e p e s honlap üzemeltetőjének arra, hogy reklámhelyeket adjon el, mint manapság: ma azért már van rá mód, hogy pl. az itthon Adnetwork néven
futó
szolgáltatáshoz
csatlakozzon
bárki,
és
a
látogató
/
letöltésszámát bedobja a “nagy közösbe”: az Adnetwork jellegű cégek b i z o n yo s
tematikák
szintet
megütő
mentén honlapot,
összegyűjtenek és
a
egy csomó,
reklámozók,
minimális jellemzően
marketingügynökségek felé egy nagy egészként adják el a teljes hálózatot.
- 19 -
XML adatfeldolgozás Az AdWords lényege, hogy a felhasználót abban a pillanatban találják m e g a r e k l á m m a l , a m i k o r a l e g f o g é k o n ya b b a n n a k ü z e n e t é r e : a G o o g l e keresőmotorjának segítségével sebészi pontossággal megtalálható ez a pillanat: ha én mondjuk videókamerák után kutakodok a Google s e g í t s é g é v e l , a k k o r a b s z o l ú t n y i t o t t v a g yo k e g y o l y a n r e k l á m r a , a m e l y v a l a m i l ye n v i d e ó z á s s a l k a p c s o l a t o s t e r m é k e t , s z o l g á l t a t á s t , ü z l e t e t ajánl. Nos, az AdSense ezt a nyit ot tságot terj eszti ki a blogokra, és eg yé b csatlakozó honlapokra is, mint amilyen az SFblogs.net rendszere. Az
AdSense
nem
sokkal
a
Blogger
megvásárlása
után,
2003
márciusában indult el. Az AdSense azt tette lehetővé a világon akkoriban
e g ye d ü l á l l ó
akármilyen
kicsi
a
módon,
hogy
látogatottsága
és
bárki, a
akinek
honlapja
letöltésszáma,
van,
szelhessen
magának egy szeletet a globális reklámtortából. Az AdSense azonban továbbra is a világ legnagyobb tartalmi és hirdetői
hálózata:
épp
o l ya n
e g ys z e r ű
módot
kínál
azóta
is
a
csatlakozásra, mint az AdWords a hirdetők részére: regisztrálod a honlapodat, blogodat a rendszerben, kapsz egy javascript kódot, amit be kell illesztened - és voilá, már meg is jelennek az első reklámok a weblapodon. Az
AdSense
rendszer
technikailag
más,
filozóia
szempontjából
a z o n b a n n a g yo n i s h a s o n l ó e l v e n m ű k ö d i k , m i n t e r e d e t i l e g m ű k ö d ö t t az AdWords: ha én a fenti példával élve, videó után keresek a Google.hu-n, akkor olyan reklámokat jelenít meg, amik kapcsolódnak a v i d e ó z á s h o z . A z A d S e n s e u g ya n e z t c s i n á l j a : a z A d S e n s e r o b o t elemzi a honlapodat, megpróbálja “kitalálni”, miről is szól az, és ezen tartalomnak megfelelő reklámokat helyez el rajta. - 20 -
XML adatfeldolgozás
1. ábra: Google hirdetések egy weboldalon
Az
AdSence
e g yi k
nagy
e l ő n ye ,
hogy
majdnem
tetszőlegesen
alakítható, több féle méretben és részletezettségben lehetséges a reklámokat a saját weboldalra elhelyezni, és a mai napig mindegyik szöveges. (igaz, már vannak kisérletek már a Google-nél is képes sőt újabban mozgóképes hirdetésekre is) formátumú.
2. ábra: Más stílusú Google hirdetések egy másik weboldalon A z A d S e n s e n a g y o n g yo r s a n n a g y o n n a g y s i k e r e k e t k ö n y v e l h e t e t t e l magának: ezrével csatlakoztak a honlaptulajdonosok a rendszerhez f ő l e g a z o k , a k i k k e l k o r á b b a n a h i r d e t ő k , r e k l á m ü g yn ö k s é g e k n e m törődtek: túl picik voltak ahhoz, hogy bármi eredményt el tudjanak érni hirdetésszervezés tekintetében… pláne, hogy azok a honlapok, amik
a
web
túlnyomó
részét
adják,
nem
tudják,
h o g ya n
kell
hirdetéseket szervezni, és pénzük sincs ezzel foglalkozó szakember felvételére.
- 21 -
XML adatfeldolgozás É r t e l e m s z e r ű e n n a g y e s é l l ye l o l ya n r e k l á m o k j e l e n í t ő d n e k m e g a z adott oldalon, ami az oldallal kapcsolatos – például az autózás történetéről
szóló
oldalakon
autókereskedők
hirdetései
fognak
m e g j e l e n n i – h i s z e n í g y s o k k a l n a g yo b b a z á t k a t t i n t á s 4 e s é l y e , m i n t ha például drogériák reklámait látná a látogató. A
Google
hajlandó
volt
kiterjeszteni
a
rendszerét
ezekre
a
w e b o l d a l a k r a i s - f e l i s m e r t é k , h o g y a z A d W o r d s e s e t é b e n f é n ye s e n bevált “sok kicsi sokra megy” elve kiterjeszthető: “még több kicsi m é g t ö b b r e m e g y” . A G o o g l e a m á r a m á r t ö b b m i l l i á r d d o l l á r o s v a g y o n á t g ya k o r l a t i l a g c e n t e n k é n t k e r e s t e m e g - 2 0 0 5 . e l e j é r e m i n d e n 15. cent az AdSense rendszeréből származott. A B l o g g e r m e g v á s á r l á s a í g y u t ó l a g t e l j e s e n e g yé r t e l m ű : a m a s s z í v felhasználói réteg, amit ezzel megszerzett, egy világméretű hirdetési hálózat alapkövét jelentette számára. A Google korán felismerte azt, hogy minél több ember használja a szolgáltatásait, annál több helyen látják a reklámait, annál többen kattintanak rá, ami számára pénzt jelent, ráadásul nem kevés pénzt. M á s r é s z t a z t i s f e l i s m e r t e , h o g y m i n é l k ö n n ye b b e n l e h e t h a s z n á l n i a s z o l g á l t a t á s a i t , a n n á l t ö b b e n é s g ya k r a b b a n f o g j á k h a s z n á l n i .
4 a hirdetésre való rákattintás - 22 -
XML adatfeldolgozás
3. ábra: A bejegyzett oldalak számának alakulása A g r a f i k o n a b e j e g yz e t t o l d a l a k s z á m á n a k n ö v e k e d é s é t m u t a t j a . A bej eg yz et t
oldalakkal
arányosan
emelkedik
az
internetet
aktívan
használók száma, és így a potenciális célközönség is növekedik. Minél több ember használja az internetet, annál több ember válik – főleg
az
interneten
megjelenésével fejezetben
azt
–
a
keresztül
történő
keresőmarketing
tekintem
át,
hogy
dinamikusan növekedő ágazat.
- 23 -
mi
vásárlási
célpotjává. ez
a
fiatal,
lehetőségek A ám
következő láthatóan
XML adatfeldolgozás
A keresőmarketingről
Láthattuk
eddig
hog ya n
a
Google
hirdethetünk
a
cég
rövid
keresőóriás
történetét, oldalain,
megismerhettük, illetve
hog ya n
hel ye zh etünk el célzott hirdetéseket az internet es oldalak mi llió in. Néhány szót ejtenék arról, hogy ez miért fontos. Az internet felhasználói - amennyiben egy, számukra eddig ismeretlen weboldalt
szeretnének
megtalálni
-
l e g g ya k r a b b a n
a
keresőket
használják. A keresés során a látogató egy adott kifejezésre keres rá, és
várja
a
potenciális
site-okat,
amelyeken
további
információkat
talál.
A
vevők nagy része is a keresőkön keresztül jut el a
honlapokra. Lényeges tehát, hogy egy adott keresés eredményeként m e g j e l e n ő t a l á l a t o k k ö z ö t t m i l ye n h e l ye t f o g l a l e l a z a d o t t c é g honlapja. Iparágtól, illetve a begépelt kulcsszavaktól függően akár több ezer, sőt több millió találat is lehetséges a keresőprogramokban. A keresőbeli viselkedésre vonatkozó statisztikák adatai szerint az é r d e k l ő d ő k n a g y r é s z e l e g g ya k r a b b a n c s a k a z e l s ő t a l á l a t i o l d a l t ( a z a z az első tíz találatot) nézi meg. A második-harmadik oldalon szereplő t a l á l a t o k n a g ys á g r e n d d e l k i s e b b a r á n y b a n g e n e r á l n a k l á t o g a t á s t , a további
találatok
átkattintási
a r á n ya
pedig
elhanyagolhatóan
kis
mértékű. Ebből is kitűnik tehát, hogy egy keresés során a találati l i s t á b a n a z e l s ő o l d a l n a k v a n a l e g n a g yo b b s z e r e p e .
- 24 -
XML adatfeldolgozás A keresőmarketing feladata, hogy az internetes keresőket használó emberek közül minél többet irányítson megrendelő weboldalára. Ennek egyik fejtája a keresőkben való hirdetés.
A keresőkben való hirdetés során a találatok előtt vagy mellett elhelyezett hirdetési felületeken jelennek meg a hirdetések, amelyek a cégek
tevékenységére
szolgáltatások)
utaló
meghatározások
köréből kiválasztott
(terméknevek,
kulcsszavakra jelenik
meg,
a
hirdető cég webhelyére vezető hivatkozással. Ezekért a rövid szöveges h i r d e t é s e k é r t á l t a l á b a n á t k a t t i n t á s o n k é n t k e l l f i z e t n i , v a g yi s a k k o r , h a tén yl eg esen
rákattintanak
mutatkozik
meg,
hogy
a a
hirdetésre.
A
h a t é k o n ys á g a
keresőkből
érkező
látogatók
abban már
befogadóképes állapotban érkeznek a cég oldalára, mivel ők maguk k e r e s n e k a z a d o t t t é m á r a , e m i a t t k ö n n ye b b e n m e g s z ó l í t h a t ó k , j o b b a konverziós arány, mint az általános látogatóké. Ez a típusú hirdetés jellégéből adódóan rengeteg adatot termel, amit később ki kell elemezni, hogy a kampányt pontosítani, finomítani l e h e s s e n . E r r e a r e n g e t e g a d a t r a e g yb e n a m e g r e n d e l ő n e k i s s z ü k s é g e van - melyik kulcsszó mennyire hatásos, illetve mennyibe kerül a k a m p á n y.
Természetesen
minden
megrendelőnek,
más
szempont
alapján van szüksége az adatokra, ezért lényeges egy saját rendszer ezen adatok tárolására és a jelentések készítésére.
- 25 -
XML adatfeldolgozás A KeyAdMan, a hirdetéskezelő rendszer, ezt a feladatot látja el, a keresőktől (egyelőre csak a Google-től, de úgy lett megtervezve a r e n d s z e r , h o g y a k é s ő b b i e k f o l ya m á n m á s h i r d e t é s i a d a t o k a t i s t u d j o n kezelni) érkező adatokat dolgozza fel, a Report Maker (jelentés k é s z í t ő ) r é s z e p e d i g a m e g r e n d e l ő k i g é n ye i n e k ( a c é g v e z e t ő i n e k ) megfelelő formában szolgáltatja a kampányaikról az adatokat. Így elősegítve a döntéshozókat a későbbi lépések megtételéhez.
A
továbbiakban
bemutatom
azt
a
környezetet,
amiben
dologzva
elkészítettem ezt a jelenleg az iparban működő, online marketinggel foglalkozó cég által használt terméket.
- 26 -
XML adatfeldolgozás
Apache
A z A p a c h e p r o j e k t c é l j a e g y o l ya n W e b - s z e r v e r p r o g r a m l é t r e h o z á s a , karbantartása, Internet
és
fejlesztése,
amely
k ö v e t e l m é n ye i n e k ,
megfelel
a
biztonságos,
gyorsan
üzleti,
változó vállalati
felhasználásra is megfelelő és szabadon használható. Az Apache a régi NCSA httpd szerverre épül, az Apache Szoftver Licenc feltételei alatt terjesztik. Az
Apache
HTTP/1.1
robosztus,
(RFC2616)
erőteljes,
protokoll
flexibilis
webszerver,
kompatibilis.
Az
Apache
amely projekt
koordinálását az Apache Software Foundation végzi. Néhány vezető és több száz fejlesztő van e mögött a projekt mögött. Az Apache webszervernek semmi köze az Apache indiánokhoz, akik az Eg ye sül t Álla mok dél- nyuga ti részén élő őslakók. A név egy szój áték: "a
patchy
server”,
ami
arra
utal,
hogy
a
szervert
eleinte
a
webmesterek által készített patchekkel frissítették. Az Apache az N C S A W e b - s z e r v e r t o l d o z g a t á s á b ó l f e j l ő d ö t t k i . A z N C S A e g yi k e v o l t a z e l s ő W e b - s z e r v e r e k n e k , a m e l y e t a z I l l i n o i s - i e g ye t e m e n t a l á l h a t ó NCSA fejlesztett ki. Az Apache projektet webmesterek, rendszergazdák kezdték el, amikor Rob
McCool,
az
NCSA
(National
Center
for
Supercomputing
Applications) webszerverének írója 1994. közepén kilépett az NCSAtól, és a szoftver nem fejlődött tovább. A webmesterek levelezéssel tartották egymással a kapcsolatot, azon keresztül adták át egymásnak a patcheket, amelyek így körbe jártak. Ezt látva Brian Behlendorf és Cliff Skolnick a Hotwired segítségével elindított egy levlistát, ahova - 27 -
XML adatfeldolgozás a core fejlesztők feliratkozhattak. Így indult el az Apache projekt. 1995.
februárjában
8
core
fejlesztővel
megindult
a
koordinált
fejlesztés. Jelenleg a legnépszerűbb webszerver, a serverek 60%-án fut Apache a Netcraft adatai alapján.
4. ábra: Az egyes webszerverek használtsága
Jelenleg
két
párhuzamosan
verzió egymás
(1-es
és
mellett,
verziószámoknál tartva.
- 28 -
2-es) 1.3.37
fejlesztése és
fut
2.2.4-es
XML adatfeldolgozás
PHP
A
dolgozathoz
használt
programozási
nyelv
legfőbb
előnyei:
A PHP, bővebben "PHP: Hypertext Preprocessor" egy széles körben használt, különösen
n yí l t jó
forráskódú, web-fejlesztés
általános
célú
támogatással,
programozási és
HTML-be
nyelv, ágyazási
képességekkel. A szintakszisa a C, Java és Perl nyelvekre épül, könn ye n
megtanulható.
A
nyelv
fő
célja
lehetőséget
teremteni
d i n a m i k u s a n g e n e r á l t w e b o l d a l a k g yo r s k é s z í t é s é r e , á m a P H P e n n é l sokkal többre is képes. A PHP használható a legfontosabb operációs rendszereken, beleértve a Linuxot, sok Unix változatot (beleértve a HP-UX, Solaris és OpenBSD rendszereket), a Microsoft Windows-t, a Mac OS X rendszert, a RISC OS-t, és másokat. A PHP a legtöbb webszervert is támogatja, beleértve az Apachet, Microsoft Internet Information Servert, és másokat. A PHP rendelkezik egy DBX adatbázis absztrakciós kiterjesztéssel is, amellyel
egyöntetűen
és
áttetszű
módon
lehet
kezelni
bármilyen
adatbázist, amit ez a kiterjesztés támogat. Ezen kívül a PHP támogatja az
ODBC-t,
ezért
bármilyen
más,
adatbázishoz is lehet kapcsolódni.
- 29 -
ezt
a
s z a b v á n yt
támogató
XML adatfeldolgozás Az XML dokumentumok feldologozásához és eléréséhez PHP4-ben a S A X é s D O M s z a b v á n yo k i s h a s z n á l h a t ó a k , a z X S L T k i t e r j e s z t é s X M L dokumentumok általakítására használható. Mivel a nyelv jelenleg az 5-ös verziónál tart, ezért a teljességhez meg kell említeni, hogy a PHP 5
az
XMLel
kapcsolatos
feladatokat
egységesen,
a
libxml2
f ü g g v é n yk ö n y v t á r r a t á m a s z k o d v a l á t j a e l . E z e n b i z t o s a l a p o k o n a P H P 5 bevezeti a SimpleXML és az XMLReader támogatást is. Jelenleg az 5.2.1-es verziónál tart a fejlesztése, de párhuzamosan fejlesztik a 4-es verziót is, ez a 4.4.6-os verziónál jár.
- 30 -
XML adatfeldolgozás
MySQL
A M y S Q L e g y g yo r s , t ö b b s z á l a s , t ö b b f e l h a s z n á l ó s r o b o s z t u s S Q L adatbázis- szerver. A MySQL Unix, OS/2 platformok alatt általános e s e t b e n i n g ye n e s e n h a s z n á l h a t ó , m í g M i c r o s o f t p l a t f o r m o k a l a t t a 3 0 napos próba használat után meg kell vásárolni (a licenszt) a MySQL honlapján,
a
http://www.mysql.com/
helyen.
Jelenleg
az
5.1.17es
verziónál tart a MySQL, de párhuzamosan fejlesztik tovább a 4-es verziót, ez jelenleg a 4.1.21-nél tart. A fejlesztések kb. 1996-ban kezdődtek el, amikor a szerzőknek TcXnél egy nagy adatbázisokat biztonságosan és gyorsan kezelő SQL szerverre
volt
szükségük,
u g ya n i s
ekkor
más
adatbázis-rendszer
f e j l e s z t ő c é g n e m r e n d e l k e z e t t i l ye n k ö r n y e z e t h e z i g a z á n h a t é k o n y SQL szerverrel - a szerzők szerint.
- 31 -
XML adatfeldolgozás
KeyAdMan - a hirdetéskezelő
Most pedig röviden tekintsünk át egy példa alkalmazást, ami az eddig ismertetett szabványokat és eljárásokat használja fel és az iparban jelenleg is működik. A K e yA d M a n p r o g r a m e g y o n l i n e m a r k e t i n g g e l f o g l a l k o z ó c é g , a m e l y Google-ben (lábléc: és később más hirdetési rendszerekben) gondozott k a m p á n ya i
adatait
döntéshozóinak
és
dolgozza
fel
ü g yf e l e i n e k
és
tárolja
k ö n n ye n
és
le,
hogy
g yo r s a n
a
cég
lehessen
kimutatásokat előállítani. A Google AdWordsbeli kampányok hirdetési adatai XML formátumban érkeznek minden nap hajnali 5 órakor. Az XML állomány mindig az előző nap adatait tartalmazza, kulcsszó szinten megmutatva az előző napi megjelenési adatokat és átkattintási rátákat. A KeyAdMan a Google-től érkező adatok feldolgozását végzi. Működése során a m e g é r k e z ő a d a t o k a t k ö n n ye n f e l h a s z n á l h a t ó f o r m á b a k o n v e r t á l j a á t é s letárolja a helyi adatbázisban. A program másik fele ebből az adatbázisból a kiválasztott formában készít
jelentést,
melynek
ismertetése
nem
témája
szakdolgozatomnak, ezért csak említés szinten foglalkozom vele.
- 32 -
a
XML adatfeldolgozás Lássunk egy példát kitalált adatokkal illusztrálva a rendszert:
|
1. kód: A Google-től érkező XML egy sora (kitalált adatokkal)
|
2. kód: A feldolgozás után, az adatbázisban való tárolás előtt
A problémakör nehézségei -
A Googletől kapott XML szerkezete nem egységes, többször előfordult, hogy változott az adatok formája (pl. a dátum).
-
Ha változott egy kulcsszó átkattintási értéke, akkor ugyanazon a nap több sorban érkeznek az adott kulcsszó adatai.
- 33 -
XML adatfeldolgozás -
Az
egyes
értékek
valamikor
lebegőpontos
valamikor
pedig
tizedes tört alakban érkeznek. Ez egy XMLen belül is változó, és naponta más kulcsszavaknál fordul elő. -
Különösen körültekintően kellett bánni a rendelkezésre álló e r ő f o r r á s o k k a l , m e r t a f e l d o l g o z a n d ó a d a t m e n n yi s é g r e n g e t e g .
-
Az XML teljes Unicode támogatása miatt könnyen megoldható a nem latin karakteres írások feldolgozása. Az internet széles k ö r b e n v a l ó e l t e r j e d é s e m i a t t e z n a g y o n l é n ye g e s e l e m , m i v e l nem kell Európán kívül menni, hogy a latin abc-től különböző k a r a k t e r e k k e l t a l á l k o z z u n k . A c é g ü g yf e l e i k ö z ö t t i s v a n , a k i n e k a kulcsszavai tartalmaznak nem latin karaktereket, tehát éles, ipari
körülmények
között
tapasztalhattam
e l ő n ye i t .
- 34 -
meg
az
Unicode
XML adatfeldolgozás
Összefoglalás
D o l g o z a t o m c é l j a v o l t a z e g yi k l e g n é p s z e r ű b b , i n t e r n e t e n i s s z é l e s körben
használt
szabvány,
az
XML
által
nyújtott
lehetőségek
áttekintése. L á t h a t t u k , h o g y é l e s k ö r ü l m é n ye k k ö z ö t t m i l ye n e l ő n ye i s z á r m a z n a k egy
cégnek
ha
könn ye bben
és
szabványos
megoldásokat
gyorsabban
lesz
képes
használ:
e g ys z e r ű b b e n ,
fejleszteni,
hamarabb
használhatja más cégek szintén szabványon alapuló megoldásait és könn ye bb
a
későbbiekben
integrálnia
új,
szintén
a
szabván yo n
alapuló, szolgáltatásokat. Valamint későbbi fejlesztések hozzátétele a programhoz szintén egyszerűbben történik.
K é s ő b b i f e j l e s z t é s e k r e i s b i z t o s a n s z ü k s é g l e s z , m e r t – a h o g ya n a z i n f o r m a t i k á b a n m i n d e n – e z i s e g y o l ya n s z e g m e n s , a m i m é g m e s s z e nem érte el a határait. Konkrét példánál maradva a dolgozatomban is említett DoubleClick felvásárlás is olyan kérdéseket és megoldandó p r o b l é m á k a t f o g f e l v e t n i , a m i v e l m i n d e n b i z o n n ya l f o g l a l k o z n i k e l l a r ö v i d i d ő n b e l ü l . Á m e z e k o l ya n t á v l a t i p r o b l é m á k ( m é g h a c s a k hetekben legrosszabb esetben is csak hónapokban mérhető is), amivel jelenleg nem tudtam foglalkozni.
- 35 -
XML adatfeldolgozás A program továbbfejlesztése is várható, mert az AdWords és az AdSence is hatalmas fejlődésen ment keresztül az elmúlt hónapokban, és várhatóan ez folytatódni is fog.
A
felhasznált
forrásanyagon
is
látszik,
hogy
–
szintén
ahogy
említettem az elején – a “Google-éra” gyermekeként nagy mértékben támaszkodok az internet adta lehetőségekre – főleg a blogokra. A m a g y a r k e r e s ő m a r k e t i n g s z a k e m b e r e i o l ya n k o r r e k t b l o g o k a t í r n a k , a m i k b ő l a t é m á h o z n e m i s é r t ő e m b e r e k i s n yu g o d t a n m e r í t h e t n e k , h a erre a témakörre kíváncsiak.
- 36 -
XML adatfeldolgozás
Irodalomjegyzék
http://hu.wikipedia.org/wiki/XML http://www.w3.org/XML/ http://www.w3c.hu http://keresomarketing.wordpress.com/ http://onlinemarketing.blog.hu/ http://reklam.sfblogs.net/ http://www.seroundtable.com/ http://www.php.net http://www.mysql.com http://www.apache.org http://googleblog.blogspot.com
- 37 -
XML adatfeldolgozás
Köszönetnyilvánítás Hálás köszönetemet szeretném kifejezni a következő személyeknek, akik nélkül nem jutottam volna el idáig:
–
Édesanyámnak, aki mindig hitt bennem és támogatott
–
Témavezetőmnek, Dr. Juhász Istvánnak, az elmúlt 3 év támogatásáért
–
Szabó Csillának, aki nélkül biztosan elvesztem volna valahol, valamikor
–
Az ONIK Öntevékeny Csoport minden tagjának – nélkületek, b i z o n y, s z i n t é n e l v e s z t e m v o l n a
–
Barátaimnak, akik mögöttem állnak és támogatnak mindig, minden k ö r ü l m é n ye k k ö z ö t t .
- 38 -