1 MA Scriptie Universiteit van Amsterdam Zoekmachine optimalisatie: optimalisatie of manipulatie? De grens tussen optimalisatie en manipulatie bij het...
Samenvatting Bij zoekmachine optimalisatie (Search Engine Optimization, afgekort SEO) worden bepaalde technieken toegepast om een website hoger te laten komen in de zoekresultaten. Zo kunnen er meer bezoekers gegenereerd worden. Zowel (niet-)commerciële als politieke belangen kunnen een rol spelen. Wanneer kan er niet meer gesproken worden van optimalisatie, maar van manipulatie? De zoekmachines bepalen wat manipulatie is. Houdt een websitebeheerder zich niet aan hun regels, dan kan dit resulteren in een lagere positie in de zoekmachine of zelfs een verwijdering uit de index. Deze scriptie gaat in op de relatie tussen zoekmachines en de mensen die zoekmachine optimalisatie toepassen. Dit wordt duidelijk in een vergelijking tussen drie edities van Search Engine Optimization for Dummies van Peter Kent (Kent, 2004; 2006; 2008). Technieken die eerder nog werkten, worden nu als manipulerend gezien door zoekmachines. De zoekmachines hebben invloed op welke methoden de SEO-industrie kan toepassen. De SEO industrie volgt de ontwikkelingen van de zoekmachines, maar andersom geldt het ook. Nog niet erkende technieken kunnen zorgen voor een hoge positie, maar zoekmachines passen later hun algoritme daar weer op aan. Peter Kent kijkt voornamelijk naar welke methoden werken, niet of ze manipulatief zijn. Door de lijn optimalisatie/manipulatie te bestuderen, wordt duidelijk dat zoekresultaten beïnvloed kunnen worden. Tevens roept het vragen op hoe een zoekmachine zou moeten functioneren. Er wordt ook met praktijkvoorbeelden ontleed hoe een geoptimaliseerde website eruit ziet. Zijn SEO technieken zichtbaar en hoe? Bepaalde methoden blijken zichtbaar te zijn en het laat zien dat de technieken invloed kunnen hebben op de content en structuur van de website. Het zegt niet alleen iets over de geoptimaliseerde website, maar het zegt ook iets over de zoekmachines. Om de werking van een zoekmachine duidelijker te krijgen, hoeft er niet alleen gekeken te worden naar de zoekmachine zelf, maar er kan ook worden gekeken aan de kant van de websitebeheerders. Door websites te analyseren, in dit geval geoptimaliseerde websites, kan er in bepaalde gevallen iets worden gezegd over hoe zoekmachines werken.
Trefwoorden
Zoekmachine optimalisatie, Search Engine Optimization (SEO), manipulatie, zoekmachines, SEO technieken
2
Inhoudsopgave Inleiding..........................................................................................................................................................5 Hoofdstuk 1: Wat is zoekmachine optimalisatie? ....................................................................................7 1.1 Wat is zoekmachine optimalisatie? ..............................................................................................7 1.2 Wat is het doel van SEO? Waarom wordt het toegepast? .......................................................9 1.4 Waarom is SEO belangrijk?........................................................................................................14 1.5 Hoe groot is de SEO industrie? .................................................................................................19 1.6 Wat Google onder andere belangrijk vindt ..............................................................................20 1.7 SEO methoden .............................................................................................................................21 Conclusie .................................................................................................................................................22 Hoofdstuk 2: De grens tussen optimalisatie en manipulatie................................................................24 2.1 Wat is de definitie van manipulatie en wie bepaalt wat manipulatie is op het Internet? ...24 2.2 De visie van zoekmachines op manipulatie..............................................................................26 2.2 Hoe gaan de zoekmachines om met manipulatie of het overtreden van de regels? ..........29 2.3 Ethical SEO: optimalisatie vs. manipulatie volgens de regels van de zoekmachines ........30 2.4 Welke technieken zijn manipulerend? .......................................................................................32 2.5 Staat Ethical SEO gelijk aan morele ethiek? ............................................................................33 2.6 Ethische code volgens de SEO industrie .................................................................................34 2.7 Waar ligt de ethische grens tussen optimalisatie en manipulatie? .........................................35 2.8 De functie van een zoekmachine ...............................................................................................36 2.9 Welk percentage van de Internetsites is geoptimaliseerd? .....................................................38 2.10 Wat gebeurt er als alle websites worden geoptimaliseerd?...................................................38 Conclusie .................................................................................................................................................40 Hoofdstuk 3: For dummies onderzoek: vergelijking van drie edities van het boek Search Engine Optimization for Dummies..............................................................................................................................43 3.1 Waarom een vergelijking van drie edities van Search Engine Optimization for Dummies? ......43 3.2 Hoe komt men aan de kennis van het optimaliseren?............................................................44 3.3 Is er één manier om te optimaliseren voor alle zoekmachines of wordt er geoptimaliseerd per zoekmachine individueel?...............................................................................................................45 3.4 Bevindingen...................................................................................................................................45 3.5 Ongewijzigde teksten ...................................................................................................................46 3.6 Discussie ........................................................................................................................................46 Conclusie .................................................................................................................................................48 3
Hoofdstuk 4: Methoden en tools van optimalisatie. Hoe is er te zien dat een website geoptimaliseerd is? ......................................................................................................................................50 4.1 Waarom is het belangrijk om deze websites te onderzoeken? ..............................................50 4.2 Methode .........................................................................................................................................51 4.3 Factoren die van invloed zouden kunnen zijn op de positie in de zoekresultaten.............51 4.4 Vragenlijst voor het onderzoeken van websites op zoekmachine optimalisatie.................55 4.5 Gevalsanalysen: Portfolio van SEO bedrijf Goedgevondenworden.nl ...............................55 4.6 Specifieke bevindingen ................................................................................................................57 4.7 Algemene bevindingen ................................................................................................................58 4.7.1 Analyse binnen de zoekmachine Google en Google Adwords .........................................58 4.7.2 Zoekwoorden.............................................................................................................................60 4.7.3 Inlinks..........................................................................................................................................65 4.8 Werking van SEO methoden in verschillende zoekmachines...............................................67 Conclusie .................................................................................................................................................67 Conclusie ......................................................................................................................................................70 Bibliografie...................................................................................................................................................75 Bijlagen: Bijlage 1
84
Bijlage 2
106
Bijlage 3
120
Bijlage 4
188
4
Inleiding Zoekmachine optimalisatie, ook wel Search Engine Optimization (SEO) genoemd, is het optimaliseren van Internetsites om een hogere positie te verwerven in de zoekmachine resultaten. Verschillende aspecten van de website worden dusdanig ingesteld waardoor de pagina als belangrijker wordt gezien en hoger verschijnt in de zoekresultaten (Zhang & Dimitroff, 2005: 666). Wanneer is er geen sprake meer van optimalisatie en wordt het manipulatie? Deze grens tussen optimalisatie en manipulatie is de rode draad in deze scriptie. Hoofdstuk 1 gaat dieper in op de vraag: ‘Wat is zoekmachine optimalisatie?’. Zoekmachine optimalisatie valt onder zoekmachine marketing.1 Waarom worden websites geoptimaliseerd? Er wordt duidelijk in hoofdstuk 1 dat redenen kunnen zijn om meer bezoekers aan te trekken, maar ook de zichtbaarheid te vergroten. Zelfs de zoekmachine kan er profijt van hebben. Waarom is dit onderwerp belangrijk? De zoekmachine is een centraal punt om websites te bereiken. Om bereikbaar te zijn voor bezoekers is het van belang om goed gevonden te kunnen worden binnen die zoekmachine. Aandacht krijgen en bezoekers genereren kan geld opleveren. Daarom is het interessant voor commerciële- en marketingdoeleinden, maar ook andere belangen kunnen een rol spelen. Verder wordt er in het hoofdstuk ingegaan op de industrie van zoekmachine optimalisatie. Hoe zit deze industrie in elkaar? Er gaat veel geld om in de zoekmachine marketing en de daarbij horende SEO industrie. In hoofdstuk 1 wordt er verder ingegaan op de grootte van de industrie. Hoofdstuk 2 behandelt de lijn tussen optimalisatie en manipulatie. Wie bepaalt er wat manipulatie is? Zijn dat de zoekmachines, de industrie of zijn dat andere instellingen? Er blijkt dat de zoekmachines dit zelf bepalen. Hoe denken de zoekmachines over manipulatie? De zoekmachines hebben reglementen waar staat welke technieken zij niet op prijs stellen. Voor deze, maar ook niet genoemde manipulerende technieken, kunnen zij straffen uitdelen. Er wordt ook ingegaan op welke technieken manipulerend zijn. Hierbij is een onderscheid tussen ‘ethical SEO’ of ‘white hat’ technieken die toegestaan worden door de zoekmachines en ‘black hat’ technieken, die niet worden toegestaan. De ‘black hat’ technieken worden als manipulerend gezien. Maar als er sprake is van bepaalde regels, is dit dan ook hetzelfde als ethische manipulatie? Dit hoeft niet zo te zijn. Waarom dit zo is wordt in hoofdstuk 2 uitgelegd. Bij deze discussie komt de vraag naar boven over hoe een zoekmachine maatschappelijk zou moeten functioneren 1
Blacquière, Eduard. ‘Stand van zaken: zoekmachine marketing in Nederland.’ SES Amsterdam. Grand Hotel
Krasnapolsky, Amsterdam, Nederland. Presentatie, 17 maart 2009. Streaming: site bezocht op 16 april 2009 .
5
en hoe wij daarmee om moeten gaan. Het leveren van relevante en belangrijke resultaten voor de zoekopdracht lijkt naar mijn mening daarbij het meest te horen. Onrelevante en onbelangrijke resultaten zouden eerder gezien kunnen worden als spam. Verder wordt in hoofdstuk 2 de vraag gesteld: wat gebeurt er als iedereen websites optimaliseert? Het hangt af van de methode. Bij spamming methoden zou de kwaliteit van het web in het geding komen. Anderzijds wordt het moeilijker om bovenaan te staan in de zoekresultaten van zoekmachines. Deze vraag wordt verder beantwoord in hoofdstuk 2. In Hoofdstuk 3 worden drie versies van de Search Engine Optimization for Dummies (Kent, 2004; 2006; 2008) met elkaar vergeleken. Het is de bedoeling om er uit af te leiden of er bepaalde wijzigingen hebben plaatsgevonden in de loop der jaren. Bijvoorbeeld het verdwijnen van bepaalde technieken of een toename van het aantal waarschuwingen. Zo kan er wellicht worden gezien of bepaalde methoden in de loop der jaren niet effectief zijn gebleken of later zelfs verboden zijn. Het kan iets zeggen over de wisselwerking tussen de zoekmachines en de mensen die optimaliseren. De mensen die optimaliseren volgen de zoekmachines, maar tegelijkertijd hebben zij ook weer invloed op de zoekmachines. De wijzigingen geven aan dat technieken die eerst niet werden bestraft, later worden gezien als manipulerende technieken. Wat betekent het als er geen wijzigingen zijn? Geen wijzigingen kunnen aangeven dat de technieken zijn blijven werken. In Hoofdstuk 4 wordt er gekeken of er te zien is dat een website geoptimaliseerd is en hoe dit te zien is. Een aantal websites die zijn geoptimaliseerd door SEO ondernemingen wordt geanalyseerd op mogelijke SEO technieken. Door een anatomie te maken van deze websites met behulp van vragenlijsten en tools, wordt er zichtbaar hoe de websites zijn opgebouwd. Er blijkt dat verschillende SEO methoden zijn toegepast door het SEO bedrijf.
6
Hoofdstuk 1: Wat is zoekmachine optimalisatie? In dit hoofdstuk wordt het begrip zoekmachine optimalisatie, ofwel Search Engine Optimization (SEO), nader uitgewerkt. Er wordt ingegaan op de volgende vragen: ‘wat is het?’, ‘waarom doet men het?’ en ‘waarom is SEO belangrijk?’. Verder wordt er doormiddel van onderzoekscijfers ingegaan op de grootte van de SEO industrie. 1.1
Wat is zoekmachine optimalisatie?
Eduard Blacquière stelt in zijn presentatie op het Search Engine & Optimization Event dat er anno 2009 nog geen echte definitie bestaat voor zoekmachine optimalisatie.2 Wel worden er in de literatuur en op Internet beschrijvingen gegeven voor de term. Volgens Zhang en Dimitroff is SEO “[…] the process of identifying factors in a webpage which would impact search engine accessibility to it and fine-tuning the many elements of a website so it can achieve the highest possible visibility when a search engine responds to a relevant query” (Zhang & Dimitroff, 2005: 666). Verschillende elementen van een website worden aangepast om de zichtbaarheid van een website te verhogen in de zoekresultaten van een zoekmachine. Ook op Internet worden er definities gegeven van het begrip. Volgens Jeroen.com is de definitie van zoekmachine optimalisatie het volgende: “Zoekmachine optimalisatie, ook wel SEO (Search Engine Optimization) genoemd, is het gehele traject van het beter vindbaar maken van websites in zoekmachines.”3 Volgens About.com is het de kunst om websites zo aantrekkelijk mogelijk te maken voor zoekmachines. Er worden verschillende technieken gebruikt om dit te bereiken.4 Wikipedia stelt dat het doel van zoekmachine optimalisatie het verbeteren van het aantal bezoekers is. Dit gebeurt via de ‘natuurlijke’ zoekresultaten, dus niet via betaalde advertenties. Het doel bij SEO is om zo hoog mogelijk in de lijst van zoekresultaten te komen en
2
Blacquière, Eduard. ‘Stand van zaken: zoekmachine marketing in Nederland.’ SES Amsterdam. Grand Hotel
Krasnapolsky, Amsterdam, Nederland. Presentatie, 17 maart 2009. Streaming: site bezocht op 16 april 2009 . 3
‘Zoekmachine optimalisatie.’ Jeroen.com. Jeroen.com. Bezocht op 27 maart 2009
. 4
‘Search engine optimization definition.’ About.com. About.com. Bezocht op 14 april 2009
.
7
daarmee eerder gevonden te worden en dus bezoekers te genereren.5 Dit kan gedaan worden met bepaalde SEO technieken. De Search Engine Marketing Professional Organization (SEMPO) doet samen met Radar Research onderzoek naar zoekmachine marketing. Respondenten van het onderzoek gaven de volgende definitie voor Organic Search Engine Optimization: “The practice of using a range of techniques, including augmenting HTML code, web page copy editing, site navigation, linking campaigns and more, in order to improve how well a site or page gets listed in search engines for particular search topics.”6 SEO technieken kunnen een verhoging van de ranking opleveren voor bepaalde zoekonderwerpen binnen organische resultaten Volgens Blacquière is zoekmachine marketing (SEM ofwel Search Engine Marketing) de overkoepelende term waar SEO onderdeel van is. Hij maakt een onderscheid tussen SEO en SEA. SEA is een afkorting voor Search Engine Advertising, in het Nederlands ‘zoekmachine adverteren’. SEO is optimalisatie voor de ‘organische’ of ‘natuurlijke’ resultaten in de zoekmachine; SEA is het adverteren in gesponsorde zoekresultaten. Men moet betalen om hier een advertentie te plaatsen. In Afbeelding 1 wordt een overzicht gegeven: de natuurlijke resultaten staan bij Google aan de linkerkant en de gesponsorde resultaten aan de rechterkant of boven de natuurlijke resultaten (Jensen & Jepsen, 2008).7
5
‘Search engine optimization.’ Wikipedia. The free encyclopedia. The Wikimedia Foundation, 9 april 2009. Bezocht op 23
april 2009 . 6
SEMPO. ‘The state of search engine marketing 2008.’ SEMPO. Presentatie, februari 2009. Bezocht op 21 april
2009 . 7
Blacquière, Eduard. ‘Stand van zaken: zoekmachine marketing in Nederland.’ SES Amsterdam. Grand Hotel
Krasnapolsky, Amsterdam, Nederland. Presentatie, 17 maart 2009. Streaming: site bezocht op 16 april 2009 . ‘Verschil tussen SEO en SEA.’ QueroMedia. Bezocht op 16 april 2009 .
8
Afbeelding 1: SEO en SEA in Google.com8
Samenvattend kan zoekmachine optimalisatie worden gezien als het gebruiken van technieken om de positie binnen de organische zoekresultaten te verbeteren voor een website en daardoor beter zichtbaar te worden. Voor bepaalde onderwerpen of zoekopdrachten 1.2
Wat is het doel van SEO? Waarom wordt het toegepast?
Volgens Zang en Dimitroff is het doel van SEO het volgende: “Search engine optimization aims at achieving good search engine accessibility for webpages, high visibility in a search engine result, and improvement of the chances the webpages are retrieved. (Zang & Dimitroff, 2005: 666)”. Dus het doel is dat de webpagina’s die geoptimaliseerd worden toegankelijker worden binnen de zoekmachine. Daarnaast is een hoge zichtbaarheid binnen de zoekmachine belangrijk. Uiteraard heeft dit het doel om meer bezoekers aan te trekken, maar ook om sneller gevonden te worden. De Wikipedia entry voor SEO vult daarbij aan dat een toename van het aantal websites op Internet ervoor kan zorgen dat pagina’s onvindbaar worden en daardoor ook onzichtbaar worden. SEO is dan een middel om zichtbaarheid en vindbaarheid te vergroten, waardoor de site sneller bezocht wordt.9
8
Magneet Webdesign Zwolle. SEO&SEA. Bezocht op 24 april 2009
. 9
Search engine optimization.’ Wikipedia. The free encyclopedia. The Wikimedia Foundation, 9 april 2009. Bezocht op 23
april 2009 .
9
Een ander doel kan zijn het verbeteren van de kwaliteit en gebruik van de zoekmachine. SEO zou wellicht kunnen helpen om de resultaten in de zoekmachine relevanter te maken.10 Of zoekmachines verbeteren of verslechteren door SEO staat centraal in deze scriptie. Google geeft zelf ook aanwijzingen om zoekmachine optimalisatie toe te passen. SEO consultants die adviseren over SEO moeten zich echter wel houden aan de ‘Webmaster Guidelines’11. Ze waarschuwen voor ‘unethical SEOs’ die zich daar niet aan houden. Tips die Google geeft zijn bijvoorbeeld het genereren van kwalitatieve content op de site en ervoor te zorgen dat andere websites naar de desbetreffende site linken. Op die manier wordt de zichtbaarheid van de site vergroot.12 Waarom geeft Google deze adviezen? Ik ben van mening dat Google zelf wil dat men hun site in een bepaalde mate optimaliseert, bijvoorbeeld met kwalitatieve content, om daarmee hun eigen zoekmachine te verbeteren. Als men bijvoorbeeld relevante titels genereert bij hoogwaardige content, dan zou deze site met dat onderwerp hoger komen te staan bij het juiste onderwerp. Een slecht geoptimaliseerde site zou bijvoorbeeld de verkeerde zoekwoorden associëren met deze site. Een zoekopdracht zou dan verkeerde resultaten opleveren. Wellicht is dus de reden van Google om zoekresultaten relevanter te maken zodat hun zoekmachine verbetert in kwaliteit en gebruik. Waarom is zoekmachine optimalisatie nodig? Waarom gebeurt het en waarom, zoals later wordt behandeld in dit hoofdstuk, gaat er zoveel geld in om? Er zijn verschillende redenen waarom SEO gebruikt wordt. Richard Rogers stelt dat websites voortdurend met elkaar concurreren om informatie te leveren. Rogers stelt: “They compete for inclusion as as well as prominence in all manner of information spaces. They also compete to be the leading information, the source that matches the information requested or given at any particular time.” (Rogers, 2004: 1). De bronnen willen domineren of willen op zijn minst aanwezig zijn binnen een bepaalde informatie ruimte. Rogers geeft met deze concurrentie aan dat er een marktwerking is
10
‘Main Purpose of SEO Services.’ Free online articles directory. Articlesbase.com, 31 mei 2008. Bezocht op 17 april
2009 . 11
‘Webmaster guidelines.’ Google.com. Google Inc. Bezocht op 6 mei 2009
. 12
‘Search Engine Optimization (SEO).’ Google Webmaster Central. Google Inc. Bezocht op 17 april 2009
.; ‘Google-friendly sites.’ Google Webmaster Central. Google Inc. Bezocht op 17 april 2009 .
10
voor informatie. Rogers stelt ook dat informatie daardoor niet meer apolitiek is.13 Deze competitie wekt juist het gebruik van SEO methoden in de hand. Rogers geeft aan met het begrip ‘information politics’ dat alternatieve weergaven van de realiteit weg worden gelaten en hij vraagt zich af of dit ook gaande is op het web (Rogers, 2004: 1, 2). De dominante ruimtes op het web worden gezien als officiële uitingen van de realiteit. Dit betekent dat de websites die bovenaan staan binnen een informatie ruimte als de officiële uiting worden gezien voor dat onderwerp (Rogers, 2004). Rogers citeert Lucas Introna en Helen Nissenbaum die vooral bezorgd zijn over zoekmachines die vooral de populaire, rijke en machtige websites meer bekendheid geven ten koste van anderen (qtd. in Rogers, 2004: 4). Het bezwaar volgens Rogers is dat de positie van de bovenste websites in de zoekresultaten steeds worden herbevestigd, doordat men niet verder kijkt dan de eerste twintig resultaten. Rogers stelt daarbij: “Hierdoor blijven die webpagina's vaak lange tijd hoog scoren, terwijl de relevantie van die webpagina's ten opzichte van de lager geplaatste websites dat niet altijd rechtvaardigt.”14 Bovendien kunnen rijke en machtige websites het zich veroorloven om SEO consultants in te schakelen, waardoor hun positie des te meer wordt versterkt. Toch kunnen alternatieve uitingen van de realiteit versterkt worden met SEO en daardoor als tegenbeweging fungeren. Rogers stelt dat er op het web een ruimte ontstaat waar officiële en onofficiële bronnen met elkaar in botsing zijn. Het web fungeert als een middel om de realiteit te checken. Rogers laat zien dat officiële bronnen, zoals de medische industrie, de overheid en kranten het medicijn Viagra alleen gepresenteerd worden als medicijn, terwijl onbekende alternatieve bronnen het middel op een andere manier kunnen omschrijven (Rogers, 2004: 38, 168). Een persoon kan ook met SEO methoden ingaan tegen negatieve krantenberichten, zoals later beschreven in dit hoofdstuk. Worden SEO methoden goed toegepast, dan kunnen alternatieve bronnen een plaats verwerven tussen dominante sites. De realiteit voor een bepaald onderwerp in de zoekmachine kan dan veranderd worden met een alternatieve realiteit. Redenen om SEO toe te passen, kunnen zowel voor commerciële als politieke doeleinden worden gebruikt. De concurrentie voor het leveren van informatie lijkt in lijn te liggen met het begrip ‘attention economy’ dat Goldhaber (1997) beschrijft. Met dit begrip wil Goldhaber zeggen dat er een overdaad aan informatie is, maar dat aandacht schaars is op het Internet. Goldhaber is van mening dat niet informatie, maar aandacht de natuurlijke economie is in cyberspace (Goldhaber,
13
Rogers, Richard. ‘Vier politieke aspecten van zoekmachines’ Tegenlicht. VPRO. Bezocht op 17 september 2009
. 14
Ibidem.
11
1997). Goldhaber was niet de eerste die met dit idee kwam. Davenport en Beck gebruiken het volgende citaat van Herbert Simon uit 1971 die stelt: "What information consumes is rather obvious: it consumes the attention of its recipients. Hence a wealth of information creates a poverty of attention.” (qtd. in Davenport en Beck, 2001: 11). Dus hoe meer informatie er is hoe minder mensen het kunnen consumeren. Om een beeld te geven van hoe schaars de aandacht is, is naar mijn idee moeilijk uit te drukken in één getal. Wel kan er aan de hand van een aantal feiten iets gezegd worden over deze schaarste. Google geeft namelijk bij zoekopdrachten aan hoeveel resultaten er zijn. Echter, het totaal wordt weergegeven, maar het aantal resultaten stopt bij 1000. Voor de zoekopdracht “search engine optimization” in google.com zijn 35.000.000 resultaten.15 Daarvan zijn er slechts 1000 zichtbaar.16 Dit betekent dat de overige resultaten voor deze zoekopdracht niet bereikbaar zijn. In 2004 stellen Spink en Jansen het volgende: “The size of the web and and the number of websites continue to grow.” Volgens hen groeit het Internet, maar ook de grootte van de websites neemt toe (Spink & Jansen 2004: 11) Als we aannemen dat er meer webpagina’s bijkomen en het maximum aantal zoekresultaten 1000 blijft, dan wordt een groter aantal webpagina’s moeilijk te bereiken. Bovendien betekent een toename aan websites een toename in concurrentie, waardoor het moeilijker wordt om hoog in de zoekresultaten te komen. Daar komt nog bij, zoals in kopje 1.4 wordt uitgelegd, dat vooral de resultaten van de eerste webpagina worden bezocht en dat de bezoeken van de resultaten vanaf pagina twee drastisch omlaag gaan. Websites kunnen daardoor zoek en onvindbaar raken. Vandaar dat SEO gebruikt kan worden om dit te bestrijden. Aandacht is nodig om bezoekers naar een webpagina te trekken. Waarom willen de beheerders van de website bezoekers aantrekken? Op deze vraag zijn meerdere antwoorden mogelijk. SEMPO heeft in 2007 adverteerders gevraagd waarom ze SEM toepassen (zie Afbeelding 2). Dit is echter vooral gericht op betaalde advertenties, maar het zou ook iets kunnen zeggen over SEO. Vooral naamsbekendheid van hun merk en het verkopen van producten waren belangrijk. Tevens het aantrekken van bezoekersaantallen om adverteerders naar hun website te trekken was een reden. Hoe meer bezoekers hoe groter de kans dat advertenties worden bekeken of dat men erop klikt zodat er geld mee wordt verdiend.
15
Google.com. Google Inc. Zoekopdracht: “search engine optimization”. Bezocht op 14 juli 2009
. 16
Rogers, Richard. ‘Vier politieke aspecten van zoekmachines’ Tegenlicht. VPRO. Bezocht op 17 september 2009
.
12
Afbeelding 2: Redenen voor gebruik van SEM17
Dit zijn voorbeelden van commerciële belangen. Ook niet commerciële belangen kunnen een rol spelen. Iemand met een blog wil bijvoorbeeld dat zijn of haar verhaal zoveel mogelijk gelezen wordt, of dat de juiste doelgroep wordt bereikt. Dit kan tevens interessant zijn voor adverteerders. Niet alleen het aantal bezoekers hoeft van belang te zijn. Ook kan het gemak waarmee een webruimte wordt gevonden van belang zijn. Een bedrijf, instelling of persoon wil bijvoorbeeld dat hun website snel gevonden kunnen worden. Iemand die op zoek is naar een baan wil bijvoorbeeld een website optimaliseren waar zijn of haar portfolio opstaat. Stel dat er een conferentie gehouden wordt, dan kan het handig zijn dat de presentatie sheets achteraf snel te vinden zijn via de zoekmachine. Ook het verbeteren van een imago kan een doel zijn om SEO toe te passen. De Pers noemt dit Search Engine Reputation Management (SERM). Zowel bedrijven als personen (personal branding) gebruiken SEO om hun imago binnen de zoekmachines te verbeteren. Een voorbeeld is Nina Brink. Zij heeft een negatief imago gekregen door haar rol in het Internetbedrijf WorldOnline tijdens de Internetluchtbel rond 2000. Om hier iets aan te doen heeft Brink een SEO consultant ingehuurd om de zoekresultaten te beïnvloeden. Door sites, zoals NinaBrink.com en NinaBrink.info aan te maken en te optimaliseren, is de top tien positiever gekleurd.18 In feite heeft Brink een alternatieve realiteit weergegeven voor de informatieruimte van haar naam en imago. Niet alleen personen kunnen hun imago oppoetsen. De Pers meldt ook dat bedrijven die slecht hebben gescoord in het verleden, maar inmiddels
17
SEMPO. ‘The state of search engine marketing 2007 Canada.’ SEMPO. Presentatie, maart 2008. Bezocht op 21
april 2009 . 18
Google.nl. Google Inc. Zoekopdracht: nina brink. Bezocht op 14 mei 2009
.
13
verbeterd zijn, last kunnen hebben van oude negatieve zoekresultaten die verwijzen naar hun oude imago. Doormiddel van SEO kunnen zij de oude negatieve resultaten naar beneden drukken en de hoogste resultaten vullen met positieve resultaten.19 Een bedrijf, instelling of persoon zou ook aan het imago kunnen werken door met een bepaalde kwestie of onderwerp geassocieerd te worden. Zoekmachine optimalisatie kan helpen om de kwestie te koppelen met het bedrijf. Stel dat een bedrijf geassocieerd wil worden met zuinig en groen. Het bedrijf moet er dan voor zorgen om binnen de resultaten van bijvoorbeeld het zoekwoord ‘zuinig’ te komen. In Google.nl komt Shell voor op nummer 22 in de zoekresultaten voor het woord ‘zuinig’.20 Connotaties voor Shell als ‘vervuilend’ zouden daardoor bijvoorbeeld vervangen kunnen worden door ‘zuinig’ en ‘groen’. Als iemand een bepaalde boodschap wil verkondigen dan zou SEO kunnen helpen om die boodschap meer zichtbaar te maken. Deze boodschappen kunnen uiteraard commercieel zijn, maar bijvoorbeeld ook van politieke of religieuze aard. 1.4
Waarom is SEO belangrijk?
Allereerst is zoekmachine optimalisatie belangrijk, aangezien er een industrie voor bestaat. Dit wordt behandeld onder kopje 1.5. Ten tweede is al aangegeven waarom men gebruik maakt van SEO. Er is een competitie gaande van websites dat bovenaan de zoekresultaten wil staan voor bepaalde keywords. Zo kunnen degenen die hoog staan de leidende bron zijn voor bepaalde onderwerpen. Bovendien is een hoge positie binnen de zoekresultaten een mogelijkheid om veel bezoekers op de website te genereren en het product of idee te verkopen of bijvoorbeeld te gebruiken voor politieke doeleinden. SEO kan binnen deze competitie een rol spelen in het verhogen van de positie van een website. Een andere mogelijkheid is dat SEO als tegenbeweging gebruikt zou kunnen worden om ook een alternatieve ruimte te kunnen weergeven. Machtige websites die een dominante realiteit weergeven voor bepaalde onderwerpen zouden dan concurrentie kunnen krijgen van websites
19
Deiters, Edward. ‘Maak jezelf tot held in Google.’ Dagblad De Pers. DePers.nl. Gepubliceerd: 3 mei 2009, Laatste
update: 4 mei 2009. Bezocht op 14 juli 2009 . 20
Google.nl. Google Inc. Zoekopdracht: zuinig. Bezocht op 14 mei 2009
.
14
met een alternatieve realiteit. Bovendien geeft SEO nog duidelijker weer dat zoekmachines niet neutraal zijn. Dit naar aanleiding van het feit dat vooral de bovenste resultaten profiteren.21 Er kan uit commercieel oogpunt worden gekeken naar SEO. Bijvoorbeeld welke tactieken en methoden toegepast kunnen worden om een zo hoog mogelijke positie te verwerven. Echter, het testen van dergelijke technieken is meer geschikt voor een onderzoek van grotere omvang. Deze scriptie gaat dieper in op filosofische en ethische vraagstukken. Wanneer wordt SEO niet meer een vorm van optimalisatie, maar van manipulatie? Waar ligt de grens en wat is het verschil tussen optimalisatie en manipulatie? Waarom is het belangrijk om dit te weten? Deze scriptie gaat niet alleen in op de degenen die SEO toepassen, maar het gaat ook in op de rol en de werking van zoekmachines. Als iedereen zou manipuleren, zijn zoekmachine resultaten dan nog wel betrouwbaar? Bovendien gaat het om de wisselwerking tussen SEO en zoekmachines. Waarom is het belangrijk om een website te optimaliseren? Er is al een aantal mogelijke redenen gegeven waarom dit gebeurt. Maar als men hoog in de resultaten van een zoekmachine terecht wil komen dan is het van belang om eerst te weten te komen of zoekmachines ook veel gebruikt worden. Volgens Jansen en Spink is het Internet een primaire bron om informatie te zoeken. Daarnaast verwijzen zij naar een onderzoek uit 1997 waarin wordt gesteld dat 80% van de mensen een zoekmachine gebruiken om informatie te vinden (Jansen & Spink, 2006: 248). Dit zijn gedateerde cijfers. Volgens een onderzoek van Burst Media in 2005 onder 13.000 webgebruikers van 14 jaar en ouder blijkt dat meer dan 56% een zoekmachine gebruikt om op een website te komen.22 Dit soort cijfers kunnen per onderzoek verschillen, maar waar het om gaat is dat zoekmachines toch een groot aandeel hebben bij het bezoeken en vinden van sites. Laura van der Vlies stelt in het “browse vs. search” debat dat men steeds meer zoekt met zoekmachines in plaats van surfen en browsen (Van der Vlies, 2008). Als zoekmachines een ingang zijn om Internetpagina’s te bereiken, dan betekent dit dat zoekmachine optimalisatie een belangrijke rol speelt. Waarom is het belangrijk om hoog in de zoekresultaten te komen? Omdat vooral de bovenste resultaten bezocht worden. Uit een onderzoek van Granka e.a. uit 2004, waarbij oogbewegingen worden gemeten tijdens het gebruik van de Google zoekmachine, blijkt dat hoe hoger het zoekresultaat staat, hoe vaker het resultaat wordt gezien en bezocht. De eerste twee resultaten worden bijna even lang gezien, maar het eerste resultaat wordt veel meer bezocht. Na
21
Rogers, Richard. ‘Vier politieke aspecten van zoekmachines’ Tegenlicht. VPRO. Bezocht op 17 september 2009
. 22
‘Burst: most users reach websites via search.’ MarketingVOX.com. MarketingVOX, 3 augustus 2005. Bezocht op 23
april 2009. .
15
het tweede resultaat neemt de fixatie tijd sterk af en vanaf ongeveer resultaat zes is er een dip. Vervolgens blijft het constant. Volgens de onderzoekers komt dit doordat de eerste vijf/zes resultaten zichtbaar zijn zonder te scrollen. Na resultaat tien, het laatste resultaat van de eerste pagina, neemt de aandacht sterk af. Men moet hier namelijk de volgende pagina bezoeken (Granka e.a., 2004: 478-479). Een studie gedaan door Enquiro Did-it en Eyetools, Inc. geven een oogbeweging onderzoek visueel weer (zie Afbeelding 3).
Afbeelding 3: Enquiro en Dit-it onderzoek oogbeweging in Google.23
Lorigo e.a. zijn doorgegaan met het onderzoek naar oogbewegingen. Zij concluderen dat er sterke gelijkenissen zijn tussen Google en Yahoo! (Lorigo e.a., 2008: 1051). Volgens Lorigo e.a. is de hoogte van de ranking erg belangrijk: “In an impressive 96% of the queries, participants looked at only the first result page, containing the first 10 abstracts, and no participant looked beyond the third result page for a given query. Participants looked primarily at the first few
23
Sherman, Chris. ‘A new F-word for Google search results.’ Search Engine Watch, 8 maart 2005. Bezocht op 17 april
2009 . ‘Google search’s golden triangle.’ Eyetools research and reports. Eyetools, Inc., 2005. Bezocht op 16 juli 2009 .
16
results, with nearly equal attention given to results one and two. Despite nearly equal viewing times on those two result abstracts, participants clicked on results one and two 42% and 8% of the time, respectively.” (Lorigo e.a., 2008: 1044). iProspect (2008) heeft een soortgelijk onderzoek gedaan: volgens iProspect bekijkt 92% van de bezoekers van een zoekmachine alleen de eerste drie pagina’s van de zoekresultaten en klikt 68% een resultaat aan op de eerste pagina. De onderzoekers zeggen dat het belangrijker is geworden om zo hoog mogelijk in de resultaten te komen. 49% gebruikt andere zoektermen nadat diegene geen goed resultaat heeft gevonden en 91% doet dit als het nog niet in de eerste drie pagina’s van de zoekresultaten is gevonden.24 Uit een artikel van Jansen en Spink blijkt er een toename te zijn van gebruikers die alleen op de eerste pagina kijken: “We see that the percentage of searchers viewing only one results page is increasing for users of both US and European-based Web search engines. The percentage of searchers viewing only the first results page has increased from 29% in 1997 to 73% in 2002 for US-based Web search engines users. (Jansen en Spink, 2006: 257)”. De toename is gemeten tussen 1997 en 2002. Ook Marable stelt dat de meeste bezoekers alleen op de eerste pagina kijken. (Marable, 2003: 5). Mocht de toename zich hebben voortgezet dan is het mijns inziens niet vreemd dat bovenstaande onderzoeken aangeven dat een groot percentage van de gebruikers niet verder kijkt dan de eerste pagina. Ook een studie gedaan door Enquiro en Did-it laten zien dat de bovenste resultaten het meest worden bezocht. Het onderzoek is gedaan door de oogbewegingen te meten bij 50 deelnemers die navigeerden door de zoekmachine Google. Bij de organische resultaten worden de eerste drie resultaten 100% gezien terwijl dit daarna afloopt naar 20% bij resultaat tien. Naar de gesponsorde resultaten wordt minder gekeken: 50% bij resultaat één en daarna aflopend.25 Duidelijk is dat sommige percentages uit bovenstaande onderzoeken verschillend zijn. Afgezien van deze verschillen komen de onderzoeken wel op hetzelfde neer: hoe hoger de positie van een site, hoe meer deze zichtbaar wordt en hoe meer bezoekers deze aantrekt. Vooral de eerste pagina van resultaten blijkt belangrijk te zijn. Bovendien is de aandacht na de derde pagina niet groot. Om meer in het zicht te komen, kan het optimaliseren van een website belangrijk zijn.
24
‘iProspect Blended Search Results Study.’ iProspect. iProspect, 2008. Bezocht op 20 april 2009
. 25
Sherman, Chris. ‘A new F-word for Google search results.’ Search Engine Watch, 8 maart 2005. Bezocht op 17 april
2009 .
17
In Afbeelding 3 op de vorige pagina is te zien waar het meest naar gekeken wordt in de resultaten. SEO heeft alleen invloed op de organische resultaten en niet op de gesponsorde resultaten. Zijn deze organische resultaten belangrijk? Een onderzoek van iProspect (2004) laat zien dat 60,5% van de deelnemers binnen Google, Yahoo!, MSN and AOL voor een natuurlijk resultaat kiezen in plaats van een betaald resultaat. Deze resultaten worden als meer relevant gezien. Bij Google verkiezen zelfs 72,3% van de deelnemers de natuurlijke zoekresultaten. Daarom kan SEO belangrijk zijn.26 Aan de grootte van de SEO industrie is ook het belang van zoekmachine optimalisatie af te leiden. Dit wordt in hoofdstuk 1.5 behandeld. Bovenstaande onderzoeken geven aan dat het dus belangrijk is om zo hoog mogelijk in de zoekresultaten te komen van zoekmachines om gevonden te worden. Bovendien geeft het ook een schaarste van aandacht aan. Voor bijvoorbeeld een paar miljoen resultaten worden slechts de bovenste resultaten bezocht. SEO speelt een belangrijke rol om de competitie aan te gaan voor een hoge positie in de zoekresultaten. Hierboven heb ik het belang van SEO voornamelijk aangegeven voor mensen die het toepassen, maar ook zoekmachines zelf kunnen hierdoor verbeteren. Er kan worden gekeken naar SEO om economische redenen, maar er kunnen ook filosofische en ethische vraagstukken worden gesteld. Men kan bijvoorbeeld een website optimaliseren, maar wanneer is er sprake van manipulatie? En worden de resultaten in de zoekmachine daar niet nadelig op beïnvloed? Bijvoorbeeld doordat een minder relevante pagina ineens bovenaan komt te staan, terwijl de niet geoptimaliseerde websites verder naar beneden komen te staan? Ook vormen van spam zouden kunnen ontstaan. De Google Bomb is hier een voorbeeld van. Bij ‘Google Bombing’ worden links naar een bepaalde website gemaakt met een bepaalde ankertekst (de tekst van een hyperlink). Hoe meer daar op die manier naar wordt verwezen, hoe hoger de verwezen website in de resultaten verschijnt die verwijzen naar deze ankertekst (Kahn & Kellner, 2004). Dit betekent dat bepaalde zoekwoorden ineens verwijzen naar een website die daar niets mee te maken heeft. In 2003 werd President Bush doelwit van een Google Bomb. Met de zoekwoorden "miserable failure" kwam zijn biografie bovenaan te staan in de zoekresultaten. Op een groot aantal websites zijn de woorden “miserable failure” als ankertekst gebruikt. Niet relevante pagina’s kunnen zo bovenaan komen te staan. Dit laat zien dat resultaten gemanipuleerd kunnen worden met SEO technieken.27 Als er meervoudig wordt gemanipuleerd en de zoekresultaten vol komen te staan 26
‘iProspect Search Engine User Attitudes.’ iProspect. iProspect, 2004. Bezocht op 20 april 2009
. 27
McNichol, Tom. ‘Engineering Google results to make a point.’ The New York Times, 22 januari 2004. Bezocht op
28 mei 2009 .
18
met spam, dan zal de betrouwbaarheid van de zoekmachine waarschijnlijk in het geding komen. Enerzijds is SEO dus belangrijk voor de mensen die SEO praktiseren, maar anderzijds zegt het ook iets over ethische kwesties van zoekmachines. Bijvoorbeeld hoe de kwaliteit van zoekmachines verstoord kan worden door gebruik van SEO technieken. 1.5
Hoe groot is de SEO industrie?
Een andere manier om naar het belang van SEO te kijken is om na te gaan hoeveel geld er in omgaat. SEO valt onder de Search Engine Marketing (SEM). De Search Engine Marketing Professional Organization (SEMPO) heeft samen met Radar Research onderzoek gedaan naar de industrie in Noord-Amerika. Volgens het onderzoek ging er in 2008 13,5 biljoen dollar om in de Noord-Amerikaanse SEM industrie. De onderzoekers voorspellen dat dit in 2013 zal oplopen tot 26,1 biljoen. Het grootste gedeelte wordt bepaald door betaalde advertenties. 10,6% van de markt wordt bepaald door SEO. In 2008 was dat 1,4 biljoen. Het grootste gedeelte, 78,9% van de SEO bestedingen gaat naar in house SEO. Het overige gedeelte, 21,1%, gaat naar externe SEO ondernemingen.28 Uit een eerdere studie van SEMPO bleek dat 54% van de globale respondenten 100% van de SEO activiteiten intern (in house) wilden doen zonder een externe SEM onderneming in te schakelen.29 De genoemde cijfers geven aan dat er veel geld omgaat in de SEM en de daarbij behorende SEO industrie. Ook blijkt dat de meerderheid van de websitebeheerders zelf hun websites optimaliseren. De cijfers laten zien dat er meer wordt geïnvesteerd in betaalde advertenties ten opzichte van SEO. Ravi Sen geeft daar een verklaring voor: ‘paid placement’, ofwel betaalde advertenties, levert economisch heeft meeste rendement op. Adverteerders denken dat SEO te weinig oplevert. Toch zegt Sen dat gebruikers van zoekmachines de betaalde advertenties niet vertrouwen. Ze prefereren eerder de organische zoekresultaten. Sen geeft echter de voorkeur aan voor het investeren in betaalde advertenties (Sen, 2005: 22). Aangezien organische resultaten eerder worden aangeklikt vanwege de betrouwbaarheid, kan het een reden zijn om in SEO te investeren. Uit een studie blijkt dat men eerder klikt op links met betrouwbare, onbevooroordeelde informatie. Daarnaast blijken hier ook organische resultaten beter te scoren dan paid placement. Ze geven ook voor 77% de voorkeur aan organische resultaten.
28
SEMPO. ‘The state of search engine marketing 2008.’ SEMPO. Presentatie, februari 2009. Bezocht op 21 april
2009 . 29
Ibidem.
19
Hoe groot is de Nederlandse industrie? Blacquière heeft in 2007 dertig verschillende partijen de vraag gesteld hoe groot zij de Nederlandse SEM markt schatten. Dit was 200 miljoen. Voor 2009 hadden zij een schatting van 400 miljoen.30 Uit deze verwachtingen van de grootte van de SEM industrie in Noord-Amerika en Nederland blijkt dat de industrie groter zal worden. Hieruit blijkt het economische belang van SEO. 1.6
Wat Google onder andere belangrijk vindt
Om te begrijpen hoe zoekmachine optimalisatie in elkaar zit, wordt er hierover een korte inleiding gegeven van hoe huidige zoekmachines over het algemeen werken, dit zonder al te technisch op in te gaan. In deze scriptie worden verschillende zoekmachines betrokken, maar de nadruk ligt op Google. Wat vind Google bijvoorbeeld belangrijk bij het beoordelen van waar de webpagina moet komen te staan? SEO gaat in op de aspecten die zoekmachines belangrijk vinden. Het algoritme van Google is gebaseerd op PageRank. PageRank geeft aan hoe belangrijk een website door hen wordt gezien. Hoe hoger de PageRank, hoe belangrijker de webpagina wordt gezien en hoe hoger de website in de top van de zoekresultaten komt. Als iemand naar een webpagina linkt dan geldt dat volgens Google als een stem, dus hoe meer links hoe belangrijker en hoe hoger de PageRank.31 Google let zelf op de volgende elementen: “We use more than 200 signals, including our patented PageRank™ algorithm, to examine the entire link structure of the web and determine which pages are most important. We then conduct hypertext-matching analysis to determine which pages are relevant to the specific search being conducted. By combining overall importance and query-specific relevance, we're able to put the most relevant and reliable results first.”32 Google kijkt niet alleen naar de link-structuur. Ook de content speelt een rol:
30
Blacquière, Eduard. ‘Stand van zaken: zoekmachine marketing in Nederland.’ SES Amsterdam. Grand Hotel
Krasnapolsky, Amsterdam, Nederland. Presentatie, 17 maart 2009. Streaming: site bezocht op 16 april 2009. . 31
Google. ‘Technology Overview.’ Google.com. Google Inc. Bezocht op 24 juni 2009
. 32
Ibidem.
20
“Hypertext-Matching Analysis: Our search engine also analyzes page content. However, instead of simply scanning for page-based text (which can be manipulated by website publishers through meta-tags), our technology analyzes the full content of a page and factors in fonts, subdivisions and the precise location of each word. We also analyze the content of neighboring web pages to ensure the results returned are the most relevant to a user's query.”33 Hier begint de basis van zoekmachine optimalisatie. Men kan hoger scoren in de zoekresultaten van zoekmachines door zich te houden aan de factoren die zoekmachines belangrijk vinden. En wat zoekmachines belangrijk vinden is vooral hetgeen dat de SEO industrie wil achterhalen. Het volledige algoritme wordt niet prijsgegeven. Google is zich bewust van manipulatie in de code. Wel blijkt dat de inhoud van de website en hoe de website is opgebouwd een rol speelt in hoe hoog een webpagina komt staan. Mogelijk is dat SEO bedrijven inspelen op hoe ze de content moeten schrijven, wanneer ze bepaalde lettertypes moeten gebruiken en waar ze welke content moeten zetten. In hoofdstuk 2, 3 en 4 wordt er dieper ingegaan op SEO optimalisatie en manipulatie technieken. In hoofdstuk 4 wordt er zichtbaar gemaakt hoe SEO in de praktijk wordt uitgevoerd. 1.7
SEO methoden
De SEO methoden worden ingedeeld in verschillende technieken: white hat, black hat en gray hat. Melius Weideman omschrijft het als volgt: “White hat techniques are considered to be ethical and above board, as viewed by a search engine crawler. These include judicial keyword placement, correct use of metatags, single submissions to search engines and avoiding the use of frames. Black hat techniques are considered to be unethical, since they attempt to present a website in such a way to a crawler, that the website earns a higher ranking than what it deserves by virtue of its contents (Mbikiwa & Weideman, 2006). These include search engine spamming, bait switching, tiny text and doorway pages.” (Weideman, 2007: 718).
33
Ibidem.
21
Er wordt dus naar het ethische aspect gekeken bij het classificeren van de technieken. Echter, hierbij gaat het erom hoe de zoekmachines er zelf over denken. Welke zoekmachines dit bepalen, wordt beschreven in hoofdstuk 2, waarin de lijn optimalisatie/manipulatie verder wordt uitgediept. Gray hat SEO is nog een vorm. Deze technieken zitten tussen white hat en black hat in. Het is een grijs gebied waar de vraag gesteld kan worden of dit nog ‘ethical SEO’ is. Niet alle technieken worden goedgekeurd door zoekmachines.34 Svore e.a. noemen bijvoorbeeld de methode ‘keyword stuffing’. Hierbij worden zoveel mogelijk bepaalde keywords gebruikt waardoor de website hoger scoort op die termen in de zoekmachine (Svore e.a., 2007). Volgens het zoekmachine marketingbedrijf QueroMedia is er nog een onderscheid te maken tussen on-site en off-site optimalisatie. On-site optimalisatie is het aanpassen van de code van de website en het optimaliseren van de keywords. Off-site optimalisatie zijn de elementen die buiten de website liggen, zoals de link building (de websites die naar de betreffende website verwijzen) en de interactie met sociale media.35 In hoofdstuk 2 wordt verder ingegaan op SEO methoden. Er wordt gesproken over white-, gray- en black hat, maar hoe verhoudt zich dit tussen de lijn van optimalisatie en manipulatie? In hoofdstuk 3 en 4 wordt verder ingegaan op verschillende SEO methoden en technieken. Conclusie
In dit hoofdstuk is gekeken naar wat zoekmachine optimalisatie is, waarom dit gebeurt en waarom dit belangrijk is. SEO is een middel om een Internetpagina hoger te krijgen in de zoekresultaten voor een bepaalde zoekopdracht. Ook de zichtbaarheid van de website wordt hiermee verhoogd en daardoor kunnen de bezoekersaantallen stijgen. Er kunnen uiteenlopende redenen zijn om SEO toe te passen. Voor commerciële doeleinden, politieke kwesties, voor reputatie van bedrijven of personen, maar ook om binnen een bepaalde informatie ruimte te domineren of om bepaalde onderwerpen aan de kaak te stellen. SEO zou ook onofficiële bronnen de mogelijkheid kunnen geven om dominanter te worden binnen bepaalde informatie ruitmes waar normaal gesproken alleen officiele bronnen dominant waren, zoals bijvoorbeeld de overheid, kranten of televisie. Bovendien zou SEO kunnen helpen voor imagoverbetering van 34
Jackson, Mark. ‘Which hat should I wear?’ Search Engine Watch. Searchenginewatch.com, 21 augustus 2007. Bezocht
op 23 augustus 2009 . 35
‘Search marketing tips: tip 2 van 8.’ QueroMedia. Bezocht op 21 augustus 2009 <www.zoekmachine-marketing-
een bepaalde bron. Daarnaast kan optimalisatie zelfs voor een verbetering van de zoekmachines leiden, terwijl manipulatie de resultaten verslechterd. Het belang van SEO is ook behandeld. Er blijkt dat zoekmachines een belangrijke rol spelen bij het vinden van informatie en websites worden grotendeels via zoekmachines bereikt. Ook blijkt dat de hoogste resultaten op de eerste pagina van de zoekresultaten in zoekmachines voornamelijk bezocht worden. Aangezien het aantal websites toeneemt, wordt de kans groter voor een website om onzichtbaar en onvindbaar te worden. SEO kan de zichtbaarheid juist vergroten. Om te domineren of om zoveel mogelijk bezoekers te genereren met als doel om producten te verkopen of te adverteren, kan SEO een middel zijn om dit te bereiken. Ook blijkt er voor SEO een groeiende industrie te bestaan.
23
Hoofdstuk 2: De grens tussen optimalisatie en manipulatie In hoofdstuk 1 is een beeld geschetst wat zoekmachine optimalisatie is, waarom dit gebeurt en hoe de industrie in elkaar zit. Dit hoofdstuk gaat in op de vraag: waar eindigt optimalisatie en waar begint manipulatie? Er wordt geschetst hoe zoekmachines denken over manipulatie en wat zij daartegen doen. Daarbij wordt handelen volgens de richtlijnen van de zoekmachines aangeduid met ‘ethical SEO’. Staat dit ook gelijk aan morele ethiek? En welke technieken zijn manipulerend? Verder wordt er vanuit de ethiek bekeken wanneer er sprake is van optimalisatie en wanneer er van manipulatie gesproken kan worden. Als laatste wordt de vraag gesteld: wat gebeurt er als alle websites op het Internet worden geoptimaliseerd? 2.1
Wat is de definitie van manipulatie en wie bepaalt wat manipulatie is op het Internet?
Om vast te stellen wanneer zoekmachine optimalisatie een vorm van manipulatie is, is het belangrijk om eerst een definitie van manipulatie te geven. Wordnet Search van de Princeton Universiteit geeft de volgende definitie van manipulatie: “exerting shrewd or devious influence especially for one's own advantage.”36 En de definitie voor het woord ‘manipulatief’ wordt als volgt weergegeven: “[…] skillful in influencing or controlling others to your own advantage.”37 Kort gezegd wordt er op een onoprechte manier invloed uitgeoefend op anderen om er een bepaald doel of voordeel uit te halen. Bij SEO kan dit tot uiting komen als bijvoorbeeld een website geoptimaliseerd wordt en daarmee relevantere resultaten wegdrukt. Drost en Scheffer geven aan waarom sommige methoden van zoekmachine optimalisatie nadelig kunnen werken voor zoekmachines: “As the page rank becomes subject to manipulation, it loses its correlation to the true relevance of a web page. This deteriorates the quality of search engine results” (Drost en Scheffer, 2005: 97). In het artikel geven Drost en Scheffer aan hoe de PageRank doormiddel van ‘link spamming’ wordt beïnvloed. Niet alleen kunnen websites hoger in de zoekresultaten komen, maar Drost en Scheffer geven daarbij tevens aan dat de kwaliteit van de zoekresultaten verslechterd kunnen worden.
36
‘Manipulation.’ Wordnet Search - 3.0. Princeton University. Bezocht op 4 mei 2009
. 37
‘Manipulative.’ Wordnet Search - 3.0. Princeton University. Bezocht op 4 mei 2009
.
24
Wie bepaalt er wat manipulatie is? Zijn dat de zoekmachines of de industrie zelf? Of zijn er andere partijen in het spel die dit bepalen? In het vorige hoofdstuk is er al een aantal methoden van optimalisatie gegeven: white hat, black hat en gray-hat. Vanessa Fox heeft onder andere bij Google gewerkt en heeft daar meegewerkt aan de Google Guidelines.38 Fox stelt dat de regels die de zoekmachine heeft opgesteld bepalen wat white hat is en wat black hat. White hat betekent het niet in strijd zijn met de Guidelines. Als de Guidelines niet worden nageleefd, bestaat de kans dat een website wordt verwijderd van de index. Fox verwijst naar een conferentie die ze heeft bijgewoond, de SES.39 Voor Fox is het verschil tussen het volgen van de Guidelines (white hat) en het schenden van de regels (black hat) duidelijk, maar voor sprekers van de conferentie is dit minder duidelijk. Zij speculeren over welke techniek wel en welke techniek niet kan. Voor hen zijn er te weinig regels en moet er meer geëxperimenteerd worden. Fox geeft ook aan dat er niet naar rechtvaardigheid wordt gekeken bij het schenden van de Guidelines.40 Kort gezegd bepalen zoekmachines dus wat toelaatbaar en wat ontoelaatbaar is. Echter, de regels voor manipulatie hoeven niet altijd rechtvaardig te zijn. Aan de kant van de zoekmachines wordt er ook gekeken welke richtlijnen opgesteld kunnen worden. SEOPro.org is een organisatie die bepaalde richtlijnen heeft opgesteld. Zij stellen het volgende: “Search Engines determine what is "inappropriate" all we are doing is interpreting the "intent" of the guidelines. Search engines are not in total agreement between themselves further confusing what is acceptable and "appropriate"”41 Het zijn dus de zoekmachines zelf die de regels bepalen, maar per zoekmachine kunnen de regels verschillend zijn. Dit verschil blijkt uit een vergelijking tussen Yahoo! en Google met betrekking tot de Google Bomb “miserable failure”. Yahoo! verwijst in de
38
‘Webmaster guidelines.’ Google.com. Google Inc. Bezocht op 6 mei 2009
. 39
‘Search Engine Strategies.’ Search Engine Strategies. Incisive Media Ltd. Bezocht op 23 juni 2009
. 40
Fox, Vanessa. “What’s really black hat anyway?” Nine by blue. 24 augustus 2008. Bezocht op 4 mei 2009
. 41
‘SEO "best practices" standards for optimization technique.’ SeoPros.org. SeoPros, 2008. Bezocht op 7 mei 2009
.
25
bovenste resultaten42 naar George Bush en Barack Obama, terwijl Google43 deze verwijzingen niet meer laat zien door een aanpassing in het algoritme.44 Er bestaan dus verschillen in wat gezien wordt als manipulatie. Een bepaalde techniek kan een tijd werken. Echter, dit hoeft niet te betekenen dat als een techniek werkt het geen manipulatie is. Resultaten kunnen bijvoorbeeld onterecht hoog staan, terwijl het kan voorkomen dat zoekmachines dit pas op een later moment ontdekken. 2.2
De visie van zoekmachines op manipulatie
Wat vinden zoekmachines manipulatief? Verschillende zoekmachines, zoals Google, Yahoo! en Live Search, hebben zogenaamde ‘Quality Guidelines’. Hierin staat wat de zoekmachine misleidend of manipulatief gedrag vindt. Als beheerders van websites zich niet houdt aan het reglement houden dan kan dit negatieve gevolgen hebben en bestaat de kans dat hun website een penalty krijgt, een verwijdering uit de zoekmachine. Yahoo! duidt het manipuleren van de zoekmachine aan met de term ‘spam’. Zij geven aan dat er op dat moment ongepaste zoekresultaten verschijnen. Zij zien bepaalde SEO technieken als manipulatief en dus als spam.45 De reglementen van Google, Yahoo! en Live Search heb ik met elkaar vergeleken. Aangezien Yahoo! het meest uitgebreide reglement heeft, wordt het reglement hieronder weergeven. Tussen haakjes staan de overeenkomsten met de zoekmachines Google en Live Search. Verder worden de specifieke reglementen van Google en Live Search ook weergegeven. Vandaar dat het reglement van Yahoo! hieronder staat met de overeenkomsten en verschillen tussen Google en Live Search.
42
Yahoo.com. Yahoo! Inc. Zoekopdracht: miserable failure. Bezocht op 20 juli 2009
. 43
Google.com. Google Inc. Zoekopdracht: miserable failure. Bezocht op 20 juli 2009
. 44
Sullivan, Danny. ‘Google kills Bush’s miserable failure search & other Google Bombs.’ Search Engine Land, 25
januari 2007. Bezocht op 25 juni 2009 . 45
‘Yahoo! Search content quality guidelines.’ Yahoo!. Yahoo! Inc. Bezocht op 8 mei 2009
.
26
Overeenkomstige technieken die vermeld worden als manipulatief van de zoekmachines Google, Yahoo! en Live Search: • “The use of text or links hidden from the user (Yahoo!, Google, Live Search) • Pages built primarily for the search engines or pages with excessive or irrelevant keywords (Yahoo!, Google, Live Search) • Sites cross-linked excessively with other websites to inflate a site's apparent popularity (link schemes) (Yahoo!, Google, Live Search) • Pages that rely heavily on content or links to content created for another web site, such as affiliate content (Yahoo!, Google, Live Search) • Pages dedicated to directing the user to another page (doorway pages) (Yahoo!, Google) • Multiple websites or pages offering substantially the same content (Yahoo!, Google) • Pages in great quantity, automatically generated or of little value (cookie-cutter pages) (Yahoo!, Google) • Pages that give the search engine different content than what the end user sees (cloaking) (Yahoo!, Google) • Sites that use excessive pop-ups, install malware (i.e. spyware, viruses, trojans), or interfering with user navigation (Yahoo!, Google) • Pages that rely heavily on content or links to content created for another web site, such as affiliate content (Yahoo!, Google) • Pages using methods to artificially inflate search engine ranking (Yahoo!, Google)”46 De volgende technieken staan alleen in het Yahoo! reglement: • “Pages that harm accuracy, diversity or relevance of search results (Hier zullen de andere zoekmachines het ook mee eens zijn. Het staat echter niet in hun reglement vemeld) • Sites with numerous, unnecessary virtual hostnames • Misuse or inaccurate use of competitor or brand names • Pages that seem deceptive, fraudulent, or provide a poor user experience”47 Alleen Google heeft de volgende regels vermeld staan op hun site: •
“Don't use unauthorized computer programs to submit pages, check rankings, etc. Such programs consume computing resources and violate our Terms of Service. Google does
46
Ibidem.
47
Ibidem.
27
not recommend the use of products such as WebPosition Gold™ that send automatic or programmatic queries to Google. • Don't send automated queries to Google. • Dit is een aanvulling op de regel van het affiliate program: If your website participates in an affiliate program, make sure that your website adds value. Provide unique and relevant content that gives users a reason to visit your website first.” • Other misleading practices such as misspellings from of well-known websites.48 Live Search noemt ook ‘link farms’: “Using techniques, such as link farms, to artificially increase the number of links to your webpage.”49 Dit is een punt dat alle drie de zoekmachines in de richtijnen hebben staan. Met deze techniek wordt er veelvuldig over en weer gelinkt met andere websites zodat de PageRank stijgt. Hoe hoger de PageRank hoe belangrijker de website wordt gezien en hoe hoger een website in de zoekresultaten komt te staan. PageRank telt de links van een webpagina op het Internet naar een andere webpagina. Dit zijn zogenaamde ‘inlinks’. Hoe meer er naar de webpagina gelinkt wordt, hoe belangrijker de webpagina wordt gezien en hoe hoger de PageRank wordt. Het heeft ervoor gezorgd dat de relevantie van de webpagina’s verbeterd zijn (Köhne, 2006: 29; 30). Link farms doen dit op een kunstmatige manier en hierbij wordt een onbelangrijke webpagina belangrijk gemaakt. De relevantie wordt daardoor verstoord. Het wil niet zeggen dat als een zoekmachine bepaalde technieken niet in hun reglement hebben staan dat zij dat altijd toelaten. Yahoo! heeft alleen de meest algemene manipulerende technieken gegeven.50 Vanessa Fox stelt dat de leden van de SES vinden dat er een gebrek aan regels is, maar is zelf van mening dat de richtlijnen van Google duidelijk gepubliceerd staan op het web. Voor haar is het overtreden van die regels dus black hat.51 Toch staan niet alle regels vermeld. Google meldt: “These quality guidelines cover the most common forms of deceptive or manipulative behavior, but Google may respond negatively to other misleading 48
‘Webmaster guidelines.’ Google.com. Google Inc. Bezocht op 6 mei 2009
. 49
‘Guidelines for successful indexing.’ Live Search. Microsoft Corp. Bezocht op 8 mei 2009
. 50
‘Yahoo! Search content quality guidelines.’ Yahoo!. Yahoo! Inc. Bezocht op 8 mei 2009
. 51
Fox, Vanessa. “What’s really black hat anyway?” Nine by blue. 24 augustus 2008. Bezocht op 4 mei 2009
.
28
practices not listed here (e.g. tricking users by registering misspellings of wellknown websites). It's not safe to assume that just because a specific deceptive technique isn't included on this page, Google approves of it.”52 Technieken die Google niet vermeld in hun reglement kunnen door hen dus ook gezien worden als manipulatief. Zij kunnen daarbij maatregelen treffen. Juist de technieken die niet genoemd worden in het reglement maakt het onduidelijker. Hierbij is het naar mijns inziens deels speculeren naar waar de grens ligt tussen wat toelaatbaar en niet toelaatbaar is. 2.2
Hoe gaan de zoekmachines om met manipulatie of het overtreden van de regels?
Als een website houder dusdanige technieken toepast waarvan de zoekmachine van mening is dat het manipulatie is, dan kan de zoekmachine beslissen om een ‘penalty’ uit te delen. Dit betekent dat de zoekmachine de website houder bestraft. Dit kan een lichte straf betekenen voor websitebeheerders die voor een eerst een overtreding begaan tot zwaardere bestraffingen naarmate de manipulatie erger wordt. Een penalty kan bijvoorbeeld bestaan uit het verlagen van de PageRank. Bijvoorbeeld van PR3 naar PR2. Hierdoor komt men lager in de zoekresultaten te staan. Penalities kunnen van enkele maanden duren tot permanent.53 Het kan ook dat een website volledig wordt verwijderd uit de index van de zoekmachine. De website is dan niet meer te vinden in de zoekmachine.54 Houders van websites willen dit soort straffen uiteraard vermijden. Daarom is voor hen de vraag “Wanneer wordt het manipulatie?” belangrijk, aangezien zoekmachines manipulatie bestraffen.
52
‘Webmaster guidelines.’ Google.com. Google Inc. Bezocht op 6 mei 2009
. 53
‘Google penalties and how to avoid them. SEOchat.com. SEO Chat, 24 mei 2004. Bezocht op 8 mei 2009
. 54
Webmaster guidelines.’ Google.com. Google Inc. Bezocht op 6 mei 2009
.
29
2.3
Ethical SEO: optimalisatie vs. manipulatie volgens de regels van de zoekmachines
In hoofdstuk 1 werd het begrip ‘ethical SEO’ geïntroduceerd met daarbinnen het onderscheid tussen white hat, gray hat en black hat. Volgens Vanessa Fox betekent white hat het houden aan de regels van de zoekmachines en black hat het overtreden daarvan.55 Zowel Köhne als Weideman noemen white hat ‘ethical’, terwijl ze black hat ‘unethical’ noemen (Köhne, 2006: 38; Weideman, 2007: 718). Als white hat voornamelijk in overeenstemming staat met de reglementen van de zoekmachines, dan bepalen de zoekmachines wat ‘ethical’ is en ‘unethical’. Op het web wordt ethical SEO of white hat SEO in één van de web definities van Google als volgt beschreven: “Ethical SEO (White Hat) - Search Engine Optimisation that follows the guidelines set out by search engines, which are in place to maintain the quality and relevance of the search results. Ethical, or white hat SEO sets out to maintain the integrity of the Internet, and does not attempt to artificially manipulate search results.”56 Ethical SEO hoeft niet zozeer hetzelfde te zijn als morele ethiek. Zoekmachines kunnen namelijk zelf regels opstellen. Het optimaliseren van een website met white hat technieken zou ervoor moeten zorgen dat de kwaliteit van de Internetsite verbetert. Een voorbeeld is een goede content met een goede structuur. Doordat er relevante tekst gebruikt wordt, zal de website hoger in de ranking komen bij de relevante zoekwoorden. Dit is optimalisatie waarbij niet alleen de website veranderd, maar waarbij ook de resultaten van de zoekmachine verbeteren. De informatie op de website wordt hier bruikbaar voor veel gebruikers. (Svore e.a., 2007: 9). Black hat SEO wordt ook wel gezien als spam. In een artikel van Chris Edwards wordt een volgende definitie gegeven van black hat SEO: “Search engine spam AKA ‘black hat’ SEO is using tactics that actually hurt the relevancy of the search engines to achieve highranking websites.” (Edwards, 2008: 63). Ook Svore e.a. zien Black- en gray hat technieken als
55
Fox, Vanessa. “What’s really black hat anyway?” Nine by blue. 24 augustus 2008. Bezocht op 4 mei 2009
. 56
‘Internet marketing glossary.’ SearchPath. SearchPath. Bezocht op 11 april 2009
.
30
web spam: “Web spam is defined as a page that uses gray-hat or black hat methods to improve ranking; it is designed solely to increase ranking and not to increase the quality or content of the page.” (Svore e.a., 2007: 10). Gyöngyi en Garcia-Molina hebben een eigen visie op ethical en unethical SEO. Volgens hen wordt het spam als volgt: “Please note that according to our definition, all types of actions intended to boost ranking (either relevance, or importance, or both), without improving the true value of a page, are considered spamming. (Gyöngyi en Garcia-Molina, 2005: 2)” De manipulatie ligt dus vooral in het feit dat de kwaliteit van de website verslechterd of dat de kwaliteit niet verbeterd bij een verhoging van de ranking. Bovendien ligt het in het feit dat de kwaliteit van de zoekmachine daarvan ten koste gaat. De relevantie van zoekresultaten wordt dus door gray hat of black hat technieken verslechterd. Door spam is er weinig bruikbare en kwalitatieve informatie voor gebruikers. Door SEO te bestuderen wordt er meer duidelijk over hoe een zoekmachine zou moeten functioneren. Al deze definities komen aardig overeen met de definitie van manipulatie aan het begin van dit hoofdstuk: het beïnvloeden van anderen om er zelf voordeel uit te halen. In dit geval komt de website van een beheerder bovenaan te staan, maar de bezoeker heeft er niets aan en de kwaliteit van de zoekmachine gaat achteruit. Deze scriptie legt de nadruk bij dit onderwerp vooral op het optimaliseren van websites. Het onderwerp wordt in mindere mate bekeken vanuit zoekmachines.57 Johan Köhne noemt in zijn scriptie een indeling die Archer heeft gemaakt voor white hat, gray hat en black hat technieken: • “Search engine optimization: Ensuring that your code and content is appropriately organized and easy for search engines to interpret accurately. • Search engine exaggeration: Reinforcing your desired keywords through frequent repetition, hidden keywords, etc. • Search engine deception: Creating content, pages, etc., that aren’t intended for human consumption, but are instead designed only to pull in search engine traffic. (Köhne, 2006: 38)”
57
‘Manipulation.’ Wordnet Search - 3.0. Princeton University. Bezocht op 4 mei 2009
.
31
De indeling van het Archer model staat als volgt in lijn met het model van ethical SEO: Model Archer
Ethical SEO
Zoekmachine optimalisatie
White hat
Zoekmachine overdrijving
Gray hat
Zoekmachine misleiding
Black hat
Tabel 1: vergelijking tussen het model van Archer en 'ethical SEO'
2.4
Welke technieken zijn manipulerend?
Voor de SEO industrie is het van belang om te weten welke technieken manipulerend zijn. De zoekmachines bepalen immers wanneer zij straffen kunnen uitdelen. Eigenlijk hoeven SEO bedrijven alleen maar te weten wat zoekmachines vinden dat manipulatie is om niet bestraft te worden. Allereerst door zich te houden aan de reglementen van de zoekmachines, dus door white hat technieken te gebruiken. Bij het gebruik van gray hat of black hat bestaat namelijk de kans om een penalty te krijgen. Volgens Svore e.a. is gray hat namelijk ook een vorm van spam (Svore, 2007). Echter, white hat kan niet altijd een garantie bieden, aangezien sommige technieken later als black hat gezien kunnen worden. Om daarom ook in de toekomst geen straf te krijgen van zoekmachines, is het belangrijk om te kijken of men ethisch verantwoord bezig is. Of er geen sprake is van manipulatie. Er zijn ook technieken die niet in de Guidelines staan. Is bijvoorbeeld het opzettelijk verkeerd spellen van een bepaald keyword misleidend? Een website houder kan een groep bezoekers mislopen als deze groep zoeken met verkeerd gespelde keywords. De beheerder van de website kan daardoor meerdere spellingsvormen toepassen. Het laatste woord hierover ligt bij de zoekmachines. Gyöngyi en Garcia-Molina hebben een artikel geschreven over web spam. Zij noemen web spamming het misleiden van zoekmachines om hoger in de ranking te komen dan dat ze verdienen. In het artikel geven zij een overzicht van spamming technieken. Zij gaan er vanuit dat een website relevante en belangrijke resultaten moet leveren (Gyöngyi en Garcia-Molina, 2005: 1). Zij maken een onderscheid tussen ‘boosting techniques’ die ervoor zorgen dat de webpagina belangrijker wordt en beter scoort op relevantie en ‘hiding techniques’ die dit soort technieken verbergen voor de gebruiker. Onder de ‘boosting’ technieken noemen ze ‘term spamming’. Dit is het aanpassen van de teksten in de code van de website en op de website zelf om relevanter te worden voor bepaalde zoekopdrachten (Gyöngyi en Garcia-Molina, 2005: 2). Ze noemen verder ‘link spamming’. Links bepalen hoe belangrijk een webpagina is. Het wordt als spam gezien als
32
men bijvoorbeeld links met elkaar uitwisselt (Gyöngyi en Garcia-Molina, 2005: 4, 6). De ‘hiding’ technieken bestaan bijvoorbeeld uit het verbergen van technieken om de ranking te verhogen. Zo kan bijvoorbeeld tekst worden verborgen om daar allerlei keywords in te zetten zodat de ranking op die keywords stijgt. Ook kan er doormiddel van cloacking een andere inhoud worden weergegeven dan wat zoekmachines zien (Gyöngyi en Garcia-Molina, 2005: 6, 7). Voor het volledige overzicht van spamming technieken verwijs ik u door naar het artikel van Gyöngyi en Garcia-Molina. Aangezien zoekmachines niet alle technieken prijsgeven, blijft het gissen van wat wel en niet mag. Dit wordt ook duidelijk in hoofdstuk 3 waarin de veranderingen van SEO methoden over tijd worden bekeken. 2.5
Staat Ethical SEO gelijk aan morele ethiek?
Staat ‘ethical SEO’, ofwel wat wordt toegestaan door zoekmachines, gelijk aan morele ethiek? Dit hoeft niet zo te zijn. Toen het Internet nog net bestond, werd de ranking bepaald door de woorden op de webpagina en de HTML code. Vandaar dat bepaalde keywords regelmatig werden herhaald om hoger in de lijst te komen. Destijds werkte het, maar tegenwoordig wordt dit door de zoekmachines gezien als spamming (Wilson en Pettijohn, 2008: 134). Ook Bruce Clay heeft een voorbeeld op zijn website staan. De doorway page is een webpagina die gebruikers naar een andere webpagina doorsluist.58 Voor 2002 kon dit nog gebruikt worden, maar vanaf dit jaar hebben ze de regels aangepast: het werd spam. Clay stelt dat sommige zoekmachines de doorway pages nog toelaten.59 Wat eerst white hat SEO of ethical SEO was, is nu black hat SEO. Als er met deze voorbeelden in het achterhoofd wordt gekeken naar ‘ethical SEO’ dan betekent het dat de zoekmachines de regels voortdurend aanpassen. Moreel ethisch zou er een constante lijn verwacht worden. Als ethical SEO hetzelfde zou zijn als morele ethiek, dan zou een bepaalde techniek niet eerst toegestaan worden en later als spam of manipulatief worden gezien. Bovendien hanteert niet iedere zoekmachine dezelfde regels. Wel kan het zijn dat zoekmachines destijds bepaalde technieken nog niet herkende, maar dat zij daar later pas regels voor hebben opgesteld. Dit betekent dat het gebruik van bepaalde SEO technieken ethisch manipulatief kan zijn, terwijl zoekmachines hier nog niet tegenop treden. Zoekresultaten kunnen
58
‘Yahoo! Search content quality guidelines.’ Yahoo!. Yahoo! Inc. Bezocht op 8 mei 2009
. 59
Clay, Bruce. ‘Search Engine Optimization Standards and Spam Discussion.’ Bruceclay.com. Bruce Clay, Inc., 2009.
Bezocht op 12 mei 2009 .
33
daardoor gemanipuleerd zijn. Dit geldt nog steeds voor de Google Bomb “miserable failure” die nog zichtbaar is in Yahoo!. 60 Het is ook de vraag of ethiek altijd universeel en constant is. Volgens Zdravko Radman zijn een groot deel van de beslissingen die we nemen tussen wat “goed” en “fout” is cultuur afhankelijk. De morele rechtvaardiging is volgens Radman contextafhankelijk. Dit wil zeggen dat historische, sociale en culturele aspecten een rol spelen (Radman, 2006: 392). Een zoekmachine als Google zou dus vanuit hun Amerikaanse cultuur andere ethische normen kunnen hebben dan mensen in een ander land. 2.6
Ethische code volgens de SEO industrie
Zoekmachines hebben manipulerende technieken in hun reglementen staan. Maar welke richtlijnen heeft de industrie zelf? Bruce Clay heeft een zogenaamde ‘SEO code of ethics’ opgesteld, waarin staat aan welke ethische regels zoekmachine optimalisatie zou moeten worden uitgevoerd.61 Volgens Wilson en Pettijohn is de code van Clay de belangrijkste code op het gebied. Bij de zoekwoorden “seo code ethics” staat hij van de 408.000 resultaten op de nummer één positie. Wilson en Pettijohn zeggen ook dat er in mei 2008 in de gehele industrie nog geen ethische standaard is (Wilson en Pettijohn, 2008: 143). Vandaar dat er vanuit de Search Engine Strategies62, die conferenties houdt op het gebied van Search Engine Marketing (SEM), behoefte is aan standaarden en regels.63 De code of ethics gaat een stuk verder dan de reglementen van de zoekmachines. In de versie van Bruce Clay moet men zich wel houden aan de regels van de zoekmachines. Ook is het uitgebreid met andere morele aspecten, waarbij de hoofdgedachte is: “doe geen kwaad”.64
60
Yahoo.com. Yahoo! Inc. Zoekopdracht: miserable failure. Bezocht op 20 juli 2009
. 61
Clay, Bruce. ‘SEO code of ethics, do not harm.’ Bruceclay.com. Bruce Clay, Inc., 2009. 7 mei 2009
. 62
‘Search Engine Strategies.’ Search Engine Strategies. Incisive Media Ltd. Bezocht op 23 juni 2009
. 63
Fox, Vanessa. “What’s really black hat anyway?” Nine by blue. 24 augustus 2008. Bezocht op 4 mei 2009
. 64
Clay, Bruce. ‘SEO code of ethics, do not harm.’ Bruceclay.com. Bruce Clay, Inc., 2009. 7 mei 2009
.
34
2.7
Waar ligt de ethische grens tussen optimalisatie en manipulatie?
In deze paragraaf wordt er niet gekeken naar wat zoekmachines vinden dat ethisch verantwoord is, maar er worden verschillende ethische benaderingen vanuit de filosofie toegepast op deze kwestie. Er wordt de vraag gesteld: wanneer wordt er ethisch gehandeld (optimalisatie) en wanneer is er sprake van manipulatie? In eerste instantie is het voor SEO bedrijven belangrijk om alleen naar ‘ethical SEO’ te kijken, waarbij ze binnen de grenzen van de zoekmachines blijven. Waarom is het dan van belang om naar ethiek te kijken? Bruce Clay geeft aan: “But understand that things are changing, and that what is a trick allowed today will be blacklisted tomorrow. It is better to focus on "honest page" Search Engine Optimization than waste your time on something that will need to be abandoned soon.”65 Om penalties in de toekomst te voorkomen kan het handig zijn om technieken te gebruiken die blijvend zijn. De ethische grens kan daarbij helpen. Er zijn vijf verschillende benaderingen of bronnen voor ethische standaarden die de Santa Clara Universiteit66 noemt. Alan Perkins heeft deze benaderingen toegepast op SEO. Volgens hem zijn de volgende vijf punten daaruit van belang voor ethical SEO: • “produces the most good and does the least harm • respects the rights and dignity of all stakeholders and treats all stakeholders fairly • promotes the common good • helps all participate more fully in the goods we share as a community and a society • enables the deepening or development of those virtues or character traits that we value as individuals, professions and members of a society”67 Daarbij noemt hij de belanghebbenden: • “Searchers • Search Engines • Site owners, their employees and their agents
65
Clay, Bruce. ‘SEO code of ethics, do not harm.’ Bruceclay.com. Bruce Clay, Inc., 2009. 7 mei 2009
. 66
‘A framework for thinking ethically.’ Markkula Center for Applied Ethics. Santa Clara University, mei 2009. Bezocht
SilverDisc, 2 oktober 2005. Bezocht op 13 mei 2009 .
35
• The Web as a whole”68 Het maatschappelijk belang komt hierbij kijken. Volgens de ethische benaderingen die afkomstig zijn van de Santa Clara Universiteit zouden de belanghebbenden er het meeste baat bij hebben als alle groepen rechtvaardig behandeld zouden worden en als allen er zoveel mogelijk voordeel uit zouden halen met zo min mogelijk schade. Als er sprake is van optimalisatie dan zou een website zo geoptimaliseerd moeten worden dat de meeste belanghebbenden er baat bij hebben. De zoekers vinden dan de meest belangrijke en relevante informatie bij hun zoekwoorden. Zoekwoorden die niets met een bepaalde website te maken hebben, zullen daar dan ook niet naar verwijzen. Als meerdere houders van websites hun website op deze manier optimaliseren, dan worden de zoekresultaten in de zoekmachine verbeterd met relevantere zoekresultaten. Een geoptimaliseerde website zou ook van hoogwaardige kwaliteit moeten zijn. De website trekt dan de juiste doelgroep aan. De zoekmachine verbetert dan ook in kwaliteit. In deze situatie is er voordeel voor alle belanghebbenden en is er sprake van optimalisatie. Stel dat een website weinig relevante informatie biedt en dat deze door SEO technieken toch bovenaan de lijst komt te staan bij bepaalde zoekwoorden. De houder van de website zou dan veel bezoekers kunnen trekken. Daarentegen vinden de zoekers niet de juiste informatie. Zij zijn teleurgesteld in de zoekmachine en voor het web als geheel komt het ook niet ten goede. Alleen de website houder is in het voordeel, terwijl de mensen die zoeken, de zoekmachine met bijbehorende zoekresultaten en het web als geheel worden benadeeld. In dit geval kan er sprake zijn van manipulatie. 2.8
De functie van een zoekmachine
Om manipulatie vast te stellen, kan er ook worden gekeken naar de kant van zoekmachines. Wat is de functie van een zoekmachine? Waar moet een zoekmachine aan moet voldoen, wat is het doel van een zoekmachine en hoe behoort deze op een objectieve manier te werken? In deze scriptie wordt vooral de vraag gesteld wanneer bepaalde SEO methoden manipulerend zijn. Hierbij wordt manipulatie door zoekmachines zelf buiten beschouwing gelaten om het onderwerp af te bakenen. Uiteraard kunnen er vragen worden gesteld bij subjectiviteit van zoekmachines, handmatige wijzigingen of prominente advertenties. Hier wordt er vooral op
68
Ibidem.
36
ingegaan wanneer er aan de kant van websites de kwaliteit van het web wordt bevorderd of verslechterd. Gyöngyi en Garcia-Molina omschrijven de doelstelling van een zoekmachine als volgt: “The objective of a search engine is to provide highquality results by correctly identifying all web pages that are relevant for a specific query, and presenting the user with some of the most important of those relevant pages. (Gyöngyi en Garcia-Molina, 2005: 1).” De belangrijkste en meest relevante webpagina’s met een hoge kwaliteit behoren bij de desbetreffende zoekopdracht. Het belang van een webpagina wordt voornamelijk bepaald door de populariteit of link structuur (Gyöngyi en Garcia-Molina, 2005: 2). Er is dus sprake van manipulatie als een webpagina zonder relevante inhoud als belangrijk of relevant wordt gezien. Er is ook sprake van een lage kwaliteit. Manipulatie wordt dus gezien als spam. Gyöngyi en Garcia-Molina noemen het spamming als de relevantie of belangrijkheid onrechtvaardig is (Gyöngyi en Garcia-Molina, 2005: 2). Een voorbeeld is dat een webpagina met weinig inhoud hoger komt te staan dan een webpagina met meer informatie behorende bij de zoekopdracht. De webpagina kan bijvoorbeeld geoptimaliseerd zijn met black hat technieken, zoals het gebruik van bepaalde keywords of onterecht verworven links (link farms). De relevantie en kwaliteit van de zoekresultaten is meerdere keren teruggekomen binnen dit hoofdstuk en deze staan ook in de Guidelines van Yahoo!, Google en Live Search. Als een zoekmachine hoogwaardige en relevante resultaten moet genereren en daarbij gesorteerd op belangrijkheid, dan zijn technieken die kwaliteit, relevantie en belangrijkheid tegengaan, vormen van manipulatie. Maatschappelijk gezien is een goed werkende zoekmachine het meest van belang. Goede websites die goed geoptimaliseerd zijn, kunnen de zoekmachine helpen om de kwaliteit te waarborgen, maar websites die ondanks hun lage kwaliteit toch hoog komen te staan, hebben het tegenovergestelde effect. Neutraliteit zou verwacht kunnen worden bij zoekmachines, maar zoekmachines bepalen ook zelf hoe het algoritme eruit ziet. Richard Rogers stelt dat hoe zoekmachines informatie selecteren en indexeren politiek is (Rogers, 2004: 1). Achter het ontwerp van een algoritme liggen bepaalde keuzes en zoekmachines kunnen bijvoorbeeld handmatige wijzigingen invoeren. Zoekmachines kunnen zelf hun regels opstellen. Er zou gesteld kunnen worden dat SEO de neutraliteit nog verder verstoord, aangezien geoptimaliseerde websites een voorrangspositie hebben ten opzichte van niet-geoptimaliseerde websites. Wellicht ontstaan er in de toekomst zoekmachines met nieuwe algoritmen waarbij de meeste SEO technieken die nu werkzaam zijn geen invloed meer hebben. Dit zou een algoritme kunnen zijn waarin bijvoorbeeld ook meer
37
kunstmatige intelligentie in wordt verwerkt, zodat ook de kwaliteit wordt beoordeeld. Of wellicht ontstaan er nieuwe SEO methoden. 2.9
Welk percentage van de Internetsites is geoptimaliseerd?
Volgens een studie van Oneupweb uit 2007 was slechts 20% van de Internet retailers top 100 websites goed geoptimaliseerd. In 2005 was dit 17%.69 Searchenginewatch.com presenteert de volgende cijfers op hun website: 20% was goed geoptimaliseerd, 20% gematigd, 34% nominaal en 26% was niet geoptimaliseerd. Verder blijkt dat 90% van de goed geoptimaliseerde websites op de eerste webpagina van de Google resultaten verschijnen met minstens twee zoektermen. Daarentegen geldt voor de niet-geoptimaliseerde websites een percentage van 22%.70 Ook Sen laat zien dat in 2004 minder dan 10% van de Fortune Magazine Top 100 bedrijven SEO gebruikten als onderdeel van hun SEM strategie (Sen, 2005: 21). De cijfers geven aan dat het grootste aantal van de bedrijven hun website niet heeft geoptimaliseerd. Vanaf twee zoektermen komen goed geoptimaliseerde websites dus veelvoudig voor in de eerste webpagina resultaten van Google. De niet geoptimaliseerde webpagina’s komen dus veel minder vaak op de eerste webpagina. De kans op bezoekers wordt dus voor deze websites lager. Als het merendeel van de websites niet geoptimaliseerd is, dan zou er nog ruimte zijn voor beheerders van websites zijn om via optimalisatie een hogere positie te verwerven. 2.10 Wat gebeurt er als alle websites worden geoptimaliseerd?
Stel dat iedereen besluit om zijn of haar website te gaan optimaliseren. Wat zou er dan gebeuren? Wilson en Pettijohn hebben Bruce Clay geïnterviewd en daar kwam uit voort dat het steeds moeilijker wordt om in de top van de zoekresultaten te komen: “‘The number of websites trying to be in the Top 10 has doubled in the last 2 or 3 years. As a result, more companies are using SEO firms, making it 20 times as harder to achieve a Top 10 ranking than previously’ (Wilson en Pettijohn, 2008: 137).” Wilson en Pettijohn zeggen dat het vooral moeilijk is bij veelvoudig gebruikte keywords. Er is daarbij een hoge concurrentie. De enige oplossing om bovenaan te
69
‘Most Top Retail Sites Optimized Little or Not at All.’ MarketingVOX.com. MarketingVOX, 12 oktober 2005.
Bezocht op 21 april 2009 . 70
Newcomb, Kevin. ‘Retailers' SEO Efforts Found Lacking.’ Search Engine Watch. Searchenginewatch.com. 15
augustus 2007. Bezocht op 21 april 2009 .
38
komen is volgens Wilson en Pettijohn het inhuren van een goede SEO onderneming. (Wilson en Pettijohn, 2008: 137). Het hangt er ook vanaf of de websites geoptimaliseerd of gemanipuleerd worden. Als iedereen zou manipuleren dan zou de zoekmachine vol komen te staan met spam. Bij een bepaalde zoekopdracht zou de verkeerde website bovenaan komen te staan. Een voorbeeld is de Google Bomb. Stel dat er een grote groep websites naar een pornosite verwijzen met de ankertekst ‘cola’. Als dit op een goede manier gedaan is, dan verschijnt de pornosite hoger dan Pepsi en Coca-cola. Bij manipulatie zou de kwaliteit worden verslechterd. Als iedere website black hat SEO technieken zou toepassen, dan zou er veel spam ontstaan. Ook zou een groot deel van de websites een penalty kunnen krijgen door het gebruik van black hat technieken. Bij optimalisatie zouden de zoekwoorden juist overeen moeten komen met de content op de site. Internetsites met de beste kwaliteit zouden dan bovenaan komen te staan. Het is moeilijk bij veelgebruikte keywords om een positie bovenaan te verwerven. Een voorbeeld is het keyword ‘sex’. Dit woord is zo alomtegenwoordig dat er grote concurrentie is. Er zijn ook bepaalde woorden die zich in een nichemarkt bevinden. Als de website zich daarin bevindt, dan is het minder moeilijk om bovenaan te komen. Met de Google Adwords Keyword Tool71 is het mogelijk om te zien op welke keywords een grote concurrentie zit en hoeveel er naar dat keyword wordt gezocht. De grootte van de concurrentie wordt bepaald door het aantal adverteerders dat het woord gebruikt via Google Adwords. Om de website zo goed mogelijk te optimaliseren, is het de kunst om woorden te kiezen die zo veel mogelijk worden gezocht, maar waar zo weinig mogelijk concurrentie is. Er worden via deze website alternatieven gegeven voor keywords. In feite kan een beheerder van een website de teksten op de website zo aanpassen dat de juiste zoekwoorden worden aangesproken. Er kan worden afgevraagd of dit manipulatie is. Google en Yahoo! stellen dat men de website moet maken voor de gebruikers, niet voor de zoekmachines.72 Toch kan het betekenen dat als iemand bepaalde klanten wil aantrekken, via andere keywords het juiste publiek aantrekt. Ik ben van mening dat als daarmee de zoekresultaten relevant blijven dat er dan geen sprake is van manipulatie. Er is sprake van manipulatie als de zoekwoorden helemaal niets met de inhoud te maken hebben. Als iedereen deze tool zou 71
Google Adwords: Keyword Tool. Google.com. Bezocht op 10 juni 2009
. 72
‘Webmaster guidelines.’ Google.com. Google Inc. Bezocht op 6 mei 2009
. ‘Yahoo! Search content quality guidelines.’ Yahoo!. Yahoo! Inc. Bezocht op 8 mei 2009 .
39
gebruiken dan voorspel ik dat de woorden met een lagere concurrentie ook steeds meer gebruikt gaan worden. Als iedere website vanaf nu geoptimaliseerd zou worden, dan zou er nog iets anders meespelen: de leeftijd van een website. Michael P. Evans heeft in zijn onderzoek geoptimaliseerde websites afgezet tegenover niet-geoptimaliseerde websites. Daarin blijkt dat de leeftijd van de website ook invloed heeft op de hoogte van de PageRank. Een website die al langer actief is op het web wordt door de zoekmachine gezien als betrouwbaarder dan nieuwe sites. Vandaar dat deze websites een hogere PageRank hebben (Evans, 2007: 31). Als iedereen optimaliseert, zullen de websites die het langst bestaan bovenaan blijven staan. De nieuwste websites zullen de grootste moeite hebben. De concurrentie wordt dus hoger als iedereen optimaliseert, maar belangrijk is ook welke technieken men gebruikt. Het aantal inlinks kan worden verhoogd door zelf kunstmatig inlinks aan te maken. Toch is het een grote opgave om een groot aantal inlinks te verwerven. Naar websites die door bezoekers als waardevol worden beschouwd, wordt eerder naar gerefereerd naar websites die als minder waardevol worden beschouwd. Daarom zal een website die populairder is eerder hoger komen te staan dan een minder populaire site. De populaire website heeft bijvoorbeeld meer inlinks. Als de content op elke webpagina geoptimaliseerd zou worden, dan zouden er bepaalde keywords herhaaldelijk gebruikt kunnen worden om daarop te scoren. Alle geoptimaliseerde webpagina’s op het Internet zouden daardoor op een bepaalde manier en met een bepaalde structuur opgezet worden. Dit kan gepaard gaan met kwaliteitsverlies. Er wordt dan niet meer geschreven voor de bezoeker, maar voor de zoekmachine. Stel dat iedereen zou optimaliseren, dan zouden ook de verhoudingen binnen bepaalde informatie ruimten kunnen veranderen. Websites die eerder dominant waren zouden bijvoorbeeld voorbijgestreefd kunnen worden door kleinere sites. Conclusie
In dit hoofdstuk heb ik weergegeven hoe zoekmachines denken over manipulatie en hoe er vanuit de ethiek nagedacht kan worden over zoekmachine optimalisatie en manipulatie. Mij is gebleken dat het de zoekmachines zelf zijn die bepalen wat manipulatie is. Wordt er niet aan de reglementen van de zoekmachines gehouden dan bestaat de kans om bestraft te worden. Dit wordt ook wel ingedeeld in white hat (volgens het reglement) en black hat (niet toegestaan). De
40
vraag “Wanneer wordt het manipulatie?” is belangrijk, aangezien manipulatie bestraft wordt en websitebeheerders geen straf willen oplopen. Ethisch gezien hoeft het niet te betekenen dat wat de zoekmachines als manipulatie bestempelen ook manipulatie is. In feite zijn de technieken die werken belangrijk, maar waarom is zou er naar een ethische lijn gekeken worden? Omdat SEO technieken die eerder werkten later gezien kunnen worden als manipulatief. Het kan dan nuttig zijn om te kijken naar welke technieken voor langere tijd zullen werken om een straf in de toekomst te voorkomen. Bovendien kan het betekenen dat zoekresultaten ethisch gezien gemanipuleerd zijn, terwijl zoekmachines hier (nog) niet tegenop treden. Ook wekt dit vragen op over de functie van een zoekmachine en hoe deze het beste werkt. Op het web zijn er verschillende belanghebbenden: mensen die zoeken, de zoekmachines, de beheerders van de websites en het web als geheel. Maatschappelijk gezien is de doelstelling van een zoekmachine om voor een bepaalde zoekopdracht van relevante resultaten te leveren gesorteerd op belangrijkheid. Hierbij is de kwaliteit van de zoekmachine en van het web het hoogst. Als een website van lage kwaliteit doormiddel van bepaalde SEO technieken boven relevantere websites komt te staan, dan wordt de kwaliteit van de zoekmachine en het web verstoord. Gebruikers krijgen dan niet het juiste resultaat. In dit geval worden vrijwel alle belanghebbenden benadeeld en is er sprake van manipulatie. Deze black hat methodes worden ook wel spamming genoemd. In feite hebben websites met werkende SEO methoden voorrang op niet-geoptimaliseerde websites. De posities in zoekresultaten zouden beïnvloed kunnen worden. Enerzijds ben ik van mening dat dit niet neutraal is en anderzijds biedt het in bepaalde gevallen een mogelijkheid voor alternatieve bronnen om dominanter te worden binnen een bepaalde informatie ruimte. Stel dat iedereen gaat optimaliseren dan ontstaat er een grote concurrentie op het web. Het wordt dan veel moeilijker om een hoge positie te verwerven. Vooral op algemene zoektermen wordt het moeilijker. Bij manipulatie zou het web dan vol kunnen staan met spam, waardoor de kwaliteit van de resultaten in het geding komt. De verhoudingen zouden ook kunnen wijzigen. Bepaalde dominante websites zouden ingehaald kunnen worden door alternatieven. Het zijn dus nu de zoekmachines die bepalen wat manipulatie is, maar je kunt de vraag stellen of een zoekmachine verantwoordelijk is om te bepalen wat manipulatie is. Ik ben van mening dat de zoekmachine niet enkel verantwoordelijk kan zijn, aangezien er ook een maatschappelijke verantwoordelijkheid is. Daarbij zou bijvoorbeeld de overheid een rol kunnen spelen. Dit om bijvoorbeeld concurrentievervalsing te bestrijden of te voorkomen.
41
Concurrentievervalsing kan betekenen dat er een oneerlijke concurrentie ontstaat op het web doordat bepaalde merken door manipulatie hoger komen dan andere merken die dat niet doen.
42
Hoofdstuk 3: For dummies onderzoek: vergelijking van drie edities van het boek Search Engine Optimization for Dummies In dit hoofdstuk worden drie edities van het boek Search Engine Optimization for Dummies van Peter Kent (Kent, 2004; 2006; 2008) met elkaar vergeleken. In het boek worden verschillende methoden en technieken uitgelegd om een website te optimaliseren. De drie edities zijn naast elkaar gelegd en onderzocht op verschillen in de tekst. Middels deze vergelijking wordt er onderzocht in hoeverre deze methoden en technieken in de loop der jaren door de edities heen zijn veranderd. Wat zegt het over de desbetreffende techniek? Is deze bijvoorbeeld niet meer toegestaan door de zoekmachines? Of zijn er juist technieken die ineens wel werken? En wat zegt een gebrek aan veranderingen uit het boek? Wat zegt dit over optimalisatie en manipulatie? Hoe komt de auteur aan de kennis van het optimaliseren? Deze vragen worden behandeld in dit hoofdstuk. Maar als eerst wordt de vraag gesteld: waarom dit onderzoek? 3.1
Waarom een vergelijking van drie edities van Search Engine
Optimization for Dummies?
Door een vergelijking tussen de drie edities kan worden afgeleid of er verschillen zijn binnen de edities over hoe geoptimaliseerd wordt. Welke technieken worden aangeraden of juist afgeraden en wanneer wordt er voor gewaarschuwd? Waarom worden deze vragen gesteld, of anders gezegd: waarom dit onderzoek? Door de vergelijking kan de wisselwerking tussen de zoekmachines en de mensen die optimaliseren worden blootgelegd. Wat is er eerst? Het algoritme of de methode van optimalisatie? Welke invloed hebben deze op elkaar? Heeft SEO invloed op het algoritme? Wat zegt het over de optimalisatie en manipulatie en de grens daartussen? Worden technieken gebruikt die worden toegestaan door zoekmachines of geven de verschillen juist weer dat bepaalde technieken in een eerdere editie manipulatief waren. Er kan bijvoorbeeld zichtbaar worden hoe een bepaalde methode ontstaat, verandert of verdwijnt. Of hoe een methode van optimalisatie techniek verandert in een manipulatie techniek. Ook kan de analyse laten zien dat bepaalde methoden in de loop der tijd ontdekt zijn of dat ze juist minder ingewikkeld worden. In navolging op het vorige hoofdstuk kan deze vergelijking kan de grens tussen optimalisatie en manipulatie weergeven.
43
3.2
Hoe komt men aan de kennis van het optimaliseren?
Search Engine Optimization for Dummies is één van de boeken die als gids fungeert voor het optimaliseren van websites. Hoe komt de auteur aan de kennis van het optimaliseren? Is de informatie die wordt verstrekt gebaseerd op wetenschappelijke kennis? De auteur Peter Kent beschrijft het als volgt: “Although how search engines function is based on science, search engine optimization is more art than science. Why? Because search engines don’t want outside parties to know exactly how they rank sites. You have to just experiment. (Kent, 2008: 43)” Peter Kent heeft zijn kennis onder andere vergaard door te experimenteren en uit te proberen. Hij heeft technieken uitgeprobeerd en daarvan een gids samengesteld. De zoekmachines geven hun algoritme namelijk niet prijs. De adviezen van Kent zijn deels gebaseerd op praktijkervaring. Fortunato e.a. stellen het volgende: “However from inspecting the hundreds of bulletin boards and blogs maintained by search engine marketers it is evident that their work is largely guided by guesswork, trial and error. (Fortunato e.a., 2005)” Fortunato e.a. stellen dat de meeste kennis van zoekmachine marketeers dus gebaseerd is op uitproberen. Echter, er zijn ook conferenties die over de hele wereld worden gehouden, zoals bijvoorbeeld de Search Engine Strategies conferentie.73 Bovendien bestaan er verschillende boeken op het gebied van SEO74 en zijn er verschillende websites over zoekmachine optimalisatie. Ook wetenschappers als Michael Evans en Bifet e.a. houden zich bezig met het testen van SEO technieken. Het is mogelijk dat Peter Kent de kennis baseert op zowel eigen ervaring en experiment als de ideeën van derden.
73
‘Search Engine Strategies.’ Search Engine Strategies. Incisive Media Ltd. Bezocht op 23 juni 2009
. 74
‘Amazon.com: SEO’. Amazon.com. Amazon.com. Bezocht op 23 juni 2009
.
44
3.3
Is er één manier om te optimaliseren voor alle zoekmachines of wordt
er geoptimaliseerd per zoekmachine individueel?
Kent richt zich in het optimaliseren tot vijf belangrijkste zoeksystemen: Google, Yahoo!, MSN Live Search, Ask en Open Directory Project (Kent, 2008: 18). Er wordt één methode gepresenteerd om te optimaliseren. Kent gaat in op zoekmachines in het algemeen, niet op een specifieke zoekmachine. Dit wordt ook duidelijk in de hoofdstukken: “Chapter 6: Creating Pages That Search Engines Love” en “Chapter 7: Avoiding Things That Search Engines Hate” (Kent, 2008: 97; 121). Ondanks dat de methode is gericht op alle zoekmachines, hoeft dit niet te betekenen dat de zoekmachines hetzelfde in elkaar zitten. Zo geeft een zoekopdracht in Yahoo! met de zoekwoorden “miserable failure” op nummer twee en nummer drie de site van het witte huis met Barack Obama en George Bush.75 Dit is de zogenaamde Google Bomb. Echter, bij Google zijn deze verwijzingen niet aanwezig.76 Zij hebben namelijk het algoritme aangepast naar aanleiding van de Google Bomb.77 Zoekmachines kunnen dus verschillende resultaten leveren. 3.4
Bevindingen
Er wordt voornamelijk ingegaan op de veranderingen die de drie edities aangaan. Elke editie is uitgebreider geworden, dus dat betekent dat er ook veel bij is gekomen. De nadruk ligt op de onderlinge veranderingen van de drie edities. De veranderingen kunnen namelijk iets zeggen. Waarom zijn de technieken bijvoorbeeld veranderd? De vergelijking is als volgt gedaan: de drie edities zijn naast elkaar gelegd en er is gekeken naar de verschillen binnen de teksten. Daarbij is vooral gelet op de technieken die worden aangeraden of waar juist voor wordt gewaarschuwd. Verder is er gekeken wat er bij is gekomen of juist is weggelaten en of er bijvoorbeeld meer waarschuwingen zijn gekomen. De veranderingen per editie zijn verwerkt in een tabel in Bijlage 1. De belangrijkste bevindingen die daaruit voortvloeien, kunt u nalezen in Bijlage 2. Deze 75
Yahoo.com. Yahoo! Inc. Zoekopdracht: miserable failure. Bezocht op 25 juni 2009
. 76
Google.com. Google Inc. Zoekopdracht: miserable failure. Bezocht op 25 juni 2009
. 77
Sullivan, Danny. ‘Google kills Bush’s miserable failure search & other Google Bombs.’ Search Engine Land, 25
januari 2007. Bezocht op 25 juni 2009 .
45
bevindingen zijn onderverdeeld in de volgende categorieën: technische veranderingen, extra opmerkingen en waarschuwingen, waarschuwingslogo’s en veranderingen met betrekking tot tools. In dit hoofdstuk zelf worden algemene bevindingen getrokken uit de specifieke bevindingen. 3.5
Ongewijzigde teksten
Naast veranderingen in de edities zijn ook veel van de teksten ongewijzigd gebleven. Het boek is in de loop der jaren verder uitgebreid. Wat kan er gezegd worden over de teksten die hetzelfde zijn gebleven? Peter Kent raadt voornamelijk technieken aan die bevorderlijk werken voor de zoekmachines (Kent, 2008: 97). Tevens geeft hij aan welke technieken te vermijden die tegen de regels van de zoekmachines ingaan (Kent, 2008: 121). Dit geeft aan dat hij vooral ‘ethical SEO’ wil bedrijven. Het lijkt erop dat de technieken die ongewijzigd zijn gebleven gedurende de drie edities werkzaam waren. Althans, ze brachten (nog) geen schade toe. Een wijziging in het algoritme kan hier alsnog verandering in brengen. 3.6
Discussie
Uit de veranderingen in de Search Engine Optimization for Dummies gids kunnen bepaalde dingen afgeleid worden. Technieken die eerst bijvoorbeeld werden aangeraden, kunnen een aantal jaren later niet meer werken. Dit zou iets over de techniek kunnen zeggen, maar ook over de wisselwerking tussen zoekmachines en zoekmachine optimalisatie. Als een zoekmachine bepaalde wijzigingen invoert of het algoritme verandert, dan betekent dit ook dat de aanpak voor zoekmachine optimalisatie gewijzigd moet worden. Bepaalde technieken die een aantal jaren geleden succesvol waren, hebben bijvoorbeeld in de huidige tijd nauwelijks waarde meer. Verborgen tekst werd een aantal jaar geleden nog gebruikt, terwijl er in de laatste editie van het boek extra voor wordt gewaarschuwd om het niet te gebruiken. Dit geldt ook voor het herhalen van keywords. Volgens Kent werkt het niet meer zo goed als een paar jaar eerder (Kent, 2008: 157; 2008: 155). Hetzelfde geldt ook voor het wederzijds linken (reciprocal linking). Hierbij verwijzen twee pagina’s naar elkaar zodat beide pagina’s daardoor meer inlinks vergaren (Kent, 2008: 282). Reciprocal linking werkt niet meer zo goed, maar toch worden er alternatieve technieken ontwikkeld zoals de 3-way en 4-way link (Kent, 2008: 283). Eigenlijk is dit een verkapte vorm van reciprocal linking. Reciprocal linking wordt niet toegestaan door zoekmachines, maar 3-way en 4-way linking schijnt (nog) te werken. Dit is waarschijnlijk
46
moeilijker te herkennen voor zoekmachines (Kent, 2006: 273; 2008: 287). Als dit werkt wil dit niet betekenen dat het ‘ethical SEO’ is. De methode komt op hetzelfde neer als reciprocal linking. Hieruit blijkt dat Kent vooral kijkt naar welke methode werkt en welke niet. Kent kijkt niet naar of een methode in de toekomst als manipulatief wordt gezien (Kent, 2006: 273; 2008: 287). Een ander voorbeeld waarbij een wijziging in het algoritme heeft geleid voor een wijziging in optimalisatie is de opmerking van Kent dat grotere sites meer moeite moeten doen voor een hoge PageRank. Hij stelt dat grotere sites voor de wijziging in het algoritme meestal een hogere PageRank hadden dan sites met minder pagina’s. Het kan ook zijn dat bepaalde technieken ontstaan en worden toegepast door beheerders van websites. Door de komst van de ‘nofollow’ attribuut worden links niet meer meegeteld voor de PageRank als deze attribuut wordt toegepast. Dit betekent dat bepaalde links vanuit blogs of andere sites geen waarde meer hebben. Zo wordt bijvoorbeeld blog spamming tegengegaan (Kent, 2008: 269). Tevens zijn er dingen die eerst niet mogelijk waren en nu wel. Zo stelt Kent dat de DESCRIPTION
tag vanaf 2007 wordt gebruikt (Kent, 2008: 36). Mensen die SEO toepassen,
kunnen volgens hem de tag gebruiken. Bovendien biedt Google vanaf 2005 de mogelijkheid om een sitemap te maken (Kent, 198; 208). Het kan ook zijn dat Kent tot nieuwe inzichten is gekomen door de edities heen. Zo adviseert hij meer woorden te gebruiken per pagina in de editie 2008 ten opzichte van de eerdere edities (Kent, 2004: 95; 2006: 108; 2008: 113). Kent doet waarschijnlijk een schatting. Het is voor hem uitproberen en achterhalen hoe het algoritme in elkaar zit. Content is volgens Kent in 2004 nog ‘erg belangrijk’, terwijl dit in 2008 ‘extreem belangrijk’ is (Kent, 2004: 149; 2006: 161; 2008: 167). Tevens gist hij of het belangrijk is in 2004 en 2006 om te registreren bij zoekmachines voor indexatie. In 2008 stelt hij dat het niet zo is (Kent, 2004: 211; 2008: 237; 2008: 249). Kent wordt dus stelliger over bepaalde technieken. Voor het herhalen van keywords heeft hij in de 2006 editie de indruk dat de methode minder goed werkt, terwijl hij in 2008 stelt dat het zo is (Kent, 2006: 151; 2008: 155). In 2004 meldt Kent dat relevante links vooral waarde hebben, terwijl hij vanaf 2006 stelt dat alle links van waarde kunnen zijn. Ook links met een lage PageRank (Kent, 2008: 272). Het is niet duidelijk of Kent dit baseert op wijzigingen in het algoritme of dat hij dit uit ervaring put. Uit de analyse van de drie edities blijkt dat concurrentie een belangrijker punt is geworden. Er zijn extra opmerkingen toegevoegd over competitieve woorden. Wellicht is het aantal geoptimaliseerde sites toegenomen waardoor het moeilijker wordt om hoog in de zoekresultaten te komen. Daarom wordt er vanaf de 2006 editie bijvoorbeeld aangeraden om
47
minder populaire keywords te gebruiken (Kent, 2006: 43; 2008: 43). Als dit zo is dan kan de vergelijking ook iets zeggen over hoe het Internet zich ontwikkeld. Er worden steeds meer waarschuwingen gegeven in de nieuwere edities. Er wordt bijvoorbeeld een extra alinea toegevoegd waarbij wordt gewaarschuwd voor een overdrijving van de keyword dichtheid (Kent, 2006: 43; 2008: 43). Ook verschijnen er nieuwe waarschuwingen voor het linken met link farms of voor betaalde links (Kent, 2008: 295). Opvallend is dat waarschuwingslogo’s nog weinig worden gebruikt in de 2004 versie. Deze worden voornamelijk vanaf 2006 toegevoegd. Niet alleen zijn er extra waarschuwingen gekomen. Ook zijn er bepaalde ‘versoepelingen’ te vinden in de methoden. Zo worden ineens alle inlinks belangrijk, terwijl er eerst voornamelijk naar relevante links werd gekeken (Kent, 2004: 231; 2006: 257; 2008: 272). Net als dat Kent stelt dat ook links met een lagere PageRank van waarde kunnen zijn, niet alleen links met een hoge PageRank. Conclusie
Zoekmachines stellen het algoritme op. Peter Kent probeert dit algoritme te ontcijferen en hij zoekt naar SEO methoden die werkzaam zijn. Veranderingen in het algoritme merkt hij op. Bepaalde technieken die eerst nog werkten, werken nu niet meer. Kent geeft zelf aan om binnen de regels van de zoekmachines te blijven. Zoekmachine optimalisatie loopt dus achter de zoekmachines aan. Een techniek die zij nu gebruiken, kan morgen niet meer werken. Daarom worden ook alternatieve methoden bedacht die op dat moment wel werken. Een voorbeeld is de 3-way en 4-way link. Er blijkt dat Kent kijkt naar wat werkt en wat niet werkt, niet of de methode manipulatief is. Niet alleen de mensen die optimaliseren worden beïnvloedt door de zoekmachines. Het lijkt ook andersom op te gaan. Het is een soort kat- en muisspel. Als er manipulerende technieken gebruikt worden, waardoor bepaalde sites onterecht bovenaan komen te staan, dan passen zoekmachines hun algoritme aan. Verborgen tekst werd bijvoorbeeld een aantal jaren geleden nog gebruikt, terwijl Kent er in de 2008 editie voor waarschuwt. Kent geeft ook meer waarschuwingen in de latere edities. Hieruit blijkt dat er kennelijk strenger op bepaalde technieken wordt toegekeken. Een ander voorbeeld van een wijziging in het algoritme is de Google Bomb. Bepaalde websites kwamen met bepaalde ankerteksten bovenaan te staan. Google
48
heeft het algoritme gewijzigd waardoor een aantal Google Bombs verdwenen.78 Zoekmachines proberen dus verschillende methoden van spamming tegen te gaan. Een spamming methode heeft bijvoorbeeld een tijd gewerkt en was een SEO methode. De zoekmachine kan besluiten om hier tegen op te treden en het algoritme te wijzigen en bijvoorbeeld straffen uit te delen. SEO consultants zoals Peter Kent merken dit op en waarschuwen in de nieuwste versie van een SEO gids om de techniek niet of in mindere mate te gebruiken. Er zijn waarschuwingen en discussies bijgekomen. Kent geeft in de loop der jaren meer waarschuwing voor bepaalde technieken waar de zoekmachines niet van gediend zijn. Dit geeft aan dat Kent steeds meer waarschuwt voor manipulatie. Aangezien sommige waarschuwingen er eerder nog niet waren, lijkt het erop dat bepaalde methoden uit het boek op de grens liggen van wat (nog) wel toegestaan is en wat (nog) niet. Wederzijdse links worden bijvoorbeeld eerder nog aangeraden, terwijl ze later min of meer worden afgeraden. Dit soort wijzigingen in de analyse geven een grens weer tussen manipulatie en optimalisatie. Bepaalde methoden worden ineens manipulerend. Dat wat eerst een optimalisatie techniek (‘ethical SEO’) was, is nu een manipulatie techniek (‘black hat’). En huidige methoden kunnen op een later moment door zoekmachines als manipulerend worden gezien. Het laat dus zien dat ‘ethical SEO’ niet constant is, maar aan verandering onderhevig is. Er is dus geen methode die altijd blijft werken of die altijd op dezelfde manier werkt. Vooral aan de wijzigingen, de technieken die in de loop van de tijd manipulerend worden, geven ten eerste aan dat de grens is overschreden en ten tweede dat deze grens variabel is. Het geeft aan dat de grens tussen optimalisatie en manipulatie verschuift. De grens is voornamelijk de grens die SEO gebruikers opzoeken en de grens die zoekmachines daarbij stellen. Deze analyse gaat voornamelijk in op de wijzigingen. Veel teksten en methoden in het boek zijn echter hetzelfde gebleven. Het is mogelijk dat deze methoden zijn blijven werken in de periode dat de boeken verschenen. De wijzigingen en waarschuwingen geven ook aan dat Kent technieken wil gebruiken die werken en toegestaan zijn door de zoekmachines. Wellicht neigen de technieken die onveranderd blijven meer naar ‘ethical SEO’. Althans, op dit moment. In de toekomst zou het kunnen wijzigen. Wijzigingen in de loop der jaren hoeven niet per se aan te geven dat het algoritme veranderd is. Het kan ook zijn dat Kent tot nieuwe inzichten is gekomen. Ook lijkt het erop dat aantallen of percentages meestal schattingen zijn, aangezien deze per editie verschillend zijn. 78
Sullivan, Danny. ‘Google kills Bush’s miserable failure search & other Google Bombs.’ Search Engine Land, 25
januari 2007. Bezocht op 25 juni 2009 .
49
Hoofdstuk 4: Methoden en tools van optimalisatie. Hoe is er te zien dat een website geoptimaliseerd is? In deze scriptie is zoekmachine optimalisatie vanuit verschillende invalshoeken benaderd. Dit hoofdstuk behandelt een aantal praktijkvoorbeelden en daarbij wordt de vraag gesteld: is het mogelijk om te zien dat een website website geoptimaliseerd is? En hoe is dit te zien. Hoe kan dit zichtbaar gemaakt worden? Om dit te toetsen is ervoor gekozen om een portfolio van het SEO bedrijf Goedgevondenworden.nl te analyseren. Zij hebben namelijk een lijst met door hen geoptimaliseerde websites op hun website. Daarbij staan de zoekwoorden waar zij hoog mee staan in de zoekresultaten van Google.nl of Google.com. Aangezien het zeker is dat deze websites geoptimaliseerd zijn, kan hun tactiek worden achterhaald. Als de methode van een SEO bedrijf wordt blootgelegd, kan er dan een extra stap worden gemaakt door iets te zeggen over de werking van hun methodes? Zijn er bepaalde SEO technieken die invloed kunnen hebben op de hoogte van de positie in de zoekresultaten?79 4.1
Waarom is het belangrijk om deze websites te onderzoeken?
Het analyseren van websites om optimalisatiemethoden bloot te leggen heeft verschillende doelen. Het zegt zowel iets over de website houders als de zoekmachines. Er wordt gedeeltelijk meer duidelijk over hoe zoekmachines werken. Zoals in hoofdstuk 1.6 blijkt, kijkt Google naar 200 factoren, inclusief PageRank en Hypertext-Matching Analysis: de content.80 Verder geeft Google niet bloot hoe het algoritme er precies uitziet. Belangrijk is dus de link-structuur, de volledige content, opmaakelementen zoals lettertypen en locatie van de woorden. Tevens de omliggende pagina’s spelen een rol.81 Door een analyse van de websites wordt wellicht de werking van zoekmachines op deze manier meer zichtbaar. Het kan ook laten zien welke technieken er worden gebruikt bij het optimaliseren van websites. Daarbij kan er getoond worden of het mogelijk is om te zien of deze technieken wel of niet werkzaam zijn.
79
‘Bovenaan bij Google.’ Goed gevonden worden. Goedgevondenworden.nl. Bezocht op 8 juni 2009
. 80
Google. ‘Technology Overview.’ Google.com. Google Inc. Bezocht op 24 juni 2009
. 81
Ibidem.
50
Bovendien zegt het iets over de eigenaars van de websites. Het kan wellicht laten zien dat zij hun websites doelbewust aanpassen voor de zoekmachines. Is er zichtbaar dat de inhoud en structuur van de website is aangepast voor de zoekmachine? De analyse in dit hoofdstuk geeft ook aan hoe een website onderzocht kan worden en hoe er met bepaalde tools zichtbaar gemaakt kan worden hoe een SEO bedrijf bepaalde SEO technieken heeft gebruikt. De methode zelf is ook een uitkomst: hoe SEO methoden achterhaald kunnen worden en zichtbaar gemaakt kunnen worden. Tevens bestaat daaruit de mogelijkheid om te zien waarom een bepaalde website een hoge positie heeft in de zoekresultaten voor een bepaalde zoekopdracht. 4.2
Methode
De te onderzoeken websites zijn allemaal geoptimaliseerde websites die door een SEO onderneming onder handen zijn genomen. De vraag is dus hoe er aan deze websites te zien is dat ze geoptimaliseerd zijn. Het doel daarbij is om een anatomie van de websites te schetsen. Bij een analyse van de website is er nog de vraag op welke elementen te letten. Hiervoor heb ik uit de literatuur factoren gebruikt die in andere onderzoeken zijn gebruikt. Zo heeft Michael Evans (Evans, 2007) verschillende technieken onderzocht. De elementen zijn verwerkt in een vragenlijst die gebruikt kan worden voor de analyse. Het grootste gedeelte stamt af van de factoren die Albert Bifet e.a. 2005 hebben opgesteld. Daarnaast is er een aantal punten door mijzelf toegevoegd. Er is ook rekening gehouden spamming technieken die door Györgyi en GarciaMolina 2005 uiteen zijn gezet. De factoren zijn vertaald in een vragenlijst. Hierbij is gebruik gemaakt van tools op het Internet. Enerzijds om handmatige handelingen te automatiseren en anderzijds om bepaalde informatie boven water te krijgen en visueel te laten weergeven. 4.3
Factoren die van invloed zouden kunnen zijn op de positie in de
zoekresultaten
Michael Evans heeft verschillende populaire SEO technieken onderzocht of ze van invloed zijn op een hogere plaatst in de zoekresultaten bij een bepaalde zoekopdracht (Evans, 2007). Evans heeft gelet op het aantal pagina’s van een website dat geïndexeerd is door een zoekmachine, de PageRank van de website, het aantal inlinks, de leeftijd van de domein naam van de website, vermelding in de Yahoo en Dmoz directories en het aantal pagina’s in Del.icio.us (Evans, 2007: 25).
51
Evans’ bevindingen zijn als volgt: • Een hoog volume van pagina’s is niet nodig voor een hoge rank (ofwel positie in de zoekresultaten): kwaliteit gaat boven kwantiteit (Evans, 2007: 26). • PageRank is extreem belangrijk voor een hoge positie in de zoekresultaten, maar het maakt het alleen aannemelijk dat een webpagina hoog komt. Andere factoren kunnen de PageRank juist tenietdoen (Evans, 2007: 30). • Het aantal inlinks neemt af naarmate de ranking lager wordt (Evans, 2007: 30). Györgyi en Garcia-Molina stellen dat zoekmachines naar link informatie kijken om te bepalen hoe belangrijk een webpagina is (Györgyi en Garia-Molina, 2005: 4). Richardson en Domigros stellen het volgende: “PageRank rates a page highly if it is at the center of a large sub-web (i.e., if many pages point to it, many other pages point to those, etc.).” Richardson en Domigros denken dat de website met de meeste links neigen te domineren. (Richardson en Domigros, 2001: 2). Waarschijnlijk is het dus zo dat meer links een grotere kans geven op een hogere ranking. • De leeftijd van het domein speelt misschien een rol in de ranking (Evans, 2007: 31). Zowel Michael Evans als Albert Bifet e.a. maken een onderscheid tussen twee factoren: QueryFactors, die gebaseerd zijn op de content van de webpagina, en Query-Independent Factors, die gebaseerd zijn op informatie van externe webpagina’s die naar de website linken (Evans, 2007: 23; Bifet e.a., 2005: 53-54). Bifet e.a. hebben een aantal factoren uiteengezet die van invloed zouden kunnen zijn op de ranking. Daarbij zijn ze nagegaan welke factoren invloed hebben en welke minder invloed. Een aantal van deze factoren worden gebruikt voor het onderzoek in dit hoofdstuk. De volgende factoren zijn afkomstig uit hun tekst: Content eigenschappen, query onafhankelijk: -
Het aantal verschillende woorden (termen) in het document.
-
Het gedeelte aan woorden uit het document dat in de woordenboek kan worden gevonden.
-
Het aantal bytes van het originele document.
-
Het aantal bytes aan tekst van het originele document.
52
-
Het aandeel van een woord van het totaal aantal woorden, bijvoorbeeld de woord frequentie. Dit kan onderzocht worden doormiddel van de Keyword Analysis Tool82. Er wordt hierbij gekeken naar het totaal op de gehele website.
-
Gemiddelde lengte van een woord.
Content eigenschappen, query afhankelijk: -
Woord frequentie van het zoekwoord: hoe vaak komt het gezochte woord voor in het document? Ook hier kan de Keyword Analysis Tool gebruikt worden. Hierbij wordt niet gekeken naar het aantal woorden op de webpagina zelf, maar naar het totaal op de website (Keyword Analysis Tool).
-
Vergelijking tussen de term en het document volgens het vector space model.
-
De gemiddelde positie van de termen in het document. Van boven (1) naar onder (0).
-
Gemiddelde overeenkomsten met de query termen.
-
Afstand tussen de termen uit de zoekopdracht in de webpagina.
-
De frequentie waarin de term voorkomt in ankerteksten (de tekst van de hyperlink).
Eigenschappen van de opmaak, query afhankelijk: -
Wordt de term gebruikt in het document met behulp van de volgende HTML tags: B, I, U, FONT, BIG, H1-H6, A, LI,
of TITLE?
-
De term in een attribuut: IMG/@ALT, IMG/@TITLE.
-
De term in meta keywords of description. In hoofdstuk 3 wordt Peter Kent geparafraseerd met de boodschap dat vanaf 2007 de DESCRIPTION tag gebruikt wordt door Google (Kent, 2008: 36). In de analyse van de praktijkvoorbeelden wil ik nagaan of dit ook zo is.
-
Term in hoofdletters
Er is een tool op het Internet waarmee bovenstaande eigenschappen van de opmaak geanalyseerd kunnen worden. Dit is de Web Page Analyser83. De gebruiker kan de URL van de website invoeren met het daarbij behorende keyword. Vervolgens wordt er gekeken of het keyword voorkomt in de volgende mogelijkheden: vetgedrukt, als link, in de titel, in de description en keywords meta tag, in de header (H1-H6) of in ALT tekst. Het wordt echter over de gehele website
82
Keyword Analysis Tool. Webmaster Toolkit. Bezocht op 12 juni 2009
toolkit.com/keyword-analysis-tool.shtml>. 83
Web Page Analyser. Webmaster Toolkit. Bezocht op 12 juni 2009
analyser.shtml>.
53
berekend, dus niet alleen de hoofdpagina.84 Een andere tool die nog een uitgebreider overzicht laat zien, is de Keyword Density Analyzer.85 Link kenmerken, query onafhankelijk: -
Het aantal webpagina’s dat linkt naar de webpagina. Bifet e.a. gebruiken de Google API. In mijn analyse wil ik onderzoeken welke webpagina’s naar de betreffende website verwijzen. Wellicht is zo te zien of het SEO bedrijf zelf links heeft aangemaakt of zich heeft aangemeld bij bepaalde websites.
-
Wat is de PageRank van de webpagina (0-10)? Deze kan worden verkregen via de Google Toolbar.
-
Het aantal uitgaande links van de webpagina.
-
Het gedeelte uitgaande links naar externe websites.
-
Hieraan wil ik zelf de vraag toevoegen: waar komen de links vandaan? Is er uit op te maken dat er doelbewust links zijn aangemaakt? Doelbewust aanmaken van links zou namelijk kunnen wijzen op zoekmachine optimalisatie.
Metadata eigenschappen: -
Is de term in de URL van de webpagina?
-
Staat de term in een web directory? (Bifet e.a., 2005: 53-54).
Györgyi en Garcia-Molina geven een aantal voorbeeld die overeenkomstig zijn met een aantal eigenschappen die Bifet e.a. noemen. Het zou namelijk gebruikt kunnen worden als spamming technieken. Er is een aantal voorbeelden: -
Body spam, waarbij bijvoorbeeld spam woorden zich in de body van het document bevinden.
-
Title spam. Volgens Györgyi en Garcia-Molina hechten zoekmachines veel waarde aan de termen in de titel van de webpagina. Spam woorden zouden hierin gezet kunnen worden.
-
Meta tag spam. Dit kunnen de KEYWORDS of DESCRIPTION meta tags zijn.
-
Anchor text spam. Volgens Györgyi en Garcia-Molina is de ankertekst zeer belangrijk voor zoekmachines. Een hyperlink die met een bepaald keyword verwijst naar een website, kan ervoor zorgen dat die website voor dat keyword hoger komt in de resultaten voor dat keyword.
84
Ibidem.
85
Keyword Density Analyzer. goRank.com. Bezocht op 17 juni 2009 .
54
-
URL spam. Hierbij worden spam woorden in de URL geplaatst.
-
Herhaling van bepaalde termen. Hierdoor zou een bepaald woord door de herhaling relevanter worden bij het bijbehorende zoekwoord. (Györgyi en Garia-Molina, 2005: 3).
De bovenstaande spam technieken zouden bijvoorbeeld gebruikt kunnen worden om een niet relevante webpagina hoger in de resultaten te laten verschijnen. Het is ook mogelijk dat er keywords worden gebruikt die bij de inhoud van de website passen. Bovenstaande spamming technieken geven niet alleen spamming methoden aan, maar ze zouden ook bepaalde optimalisatie technieken kunnen achterhalen en of er te zien is dat de desbetreffende website is geoptimaliseerd. 4.4
Vragenlijst voor het onderzoeken van websites op zoekmachine
optimalisatie
Vanuit bovenstaande factoren is een vragenlijst ontstaan die zou kunnen helpen bij het opsporen van optimalisatie technieken binnen websites. Tijdens het analyseren is de vragenlijst voortdurend aangepast, aangezien iedere website nieuwe vragen opriep. Tools zijn gebruikt om processen te automatiseren, maar ook om informatie boven water te krijgen die handmatig moeilijk zichtbaar is. De vragenlijst met bijbehorende gevalsanalyses kunt u nalezen in Bijlage 3. In dit hoofdstuk zelf worden de bevindingen daaruit gepresenteerd. 4.5
Gevalsanalysen: Portfolio van SEO bedrijf Goedgevondenworden.nl
De website Goedgevondenworden.nl86 is een zoekmachine optimalisatie bedrijf dat websites optimaliseert. Op hun website staat een portfolio. Met behulp van de vragenlijst wordt dit portfolio onderzocht op optimalisatie methoden. Er is gekozen voor een portfolio van een SEO bedrijf, aangezien er dan zeker is dat er SEO methoden zijn toegepast. Welke methoden er zijn toegepast moet de analyse duidelijk maken. Goedgevondenworden.nl heeft een portfolio met websites die bovenaan staan op bepaalde zoekopdrachten in de Nederlandse en Engelse editie van Google87.88 De analyse in Bijlage 3 maakt wellicht zichtbaar hoe zij te werk zijn gegaan.
86
‘Bovenaan bij Google.’ Goed gevonden worden. Goedgevondenworden.nl. Bezocht op 8 juni 2009.
. 87
http://www.google.nl. http://www.google.com. Google Inc. Bezocht op 10 juni 2009.
55
Onderzochte websites De volgende websites zijn geanalyseerd (de website; de zoekwoorden; de ranking): • http://www.champagneproeverij.nl: champagneproeverij #1 • http://www.champagneproeverij.nl/kadobon_bestellen.html: kadobon bestellen #1 • http://www.1fish.nl: o ontwerpstudio Amsterdam #2 o grafisch ontwerp Amsterdam #1 • http://www.zarzana.nl: D'Acquasparta Amsterdam #1 • http://www.vangoghstudio.com: o reproduction van gogh #1 o van gogh replica #1 o van gogh reproductions #1 • http://www.caulils.nl: delicatessen Amsterdam #1 • http://www.octas.nl: bank detachering #1 • http://www.octas.nl/detachering/banking-professionals: bank detachering #2 • http://www.fair-women.nl/index.php?pgname=brand: o patrizia pepe den bosch #1 (www.google.com) o by malene birger den bosch #1: http://www.fair-women.nl (www.google.nl) • http://www.vaarmij.nl: rondvaart trouwerij #2 • http://sandrina.nl: trouwkleding Haarlem #489 Naast de methode van Evans kan ook de Search Engine Optimization for Dummies gids van Peter Kent (Kent, 2008) een aanvulling zijn om te zien of er bepaalde technieken uit dit boek terugkomen binnen de te onderzoeken websites. Het SEO bedrijf zou namelijk technieken kunnen gebruiken die worden aangeraden in SEO literatuur of webpagina’s. De invloed van PageRank op de ranking Om te zien hoe belangrijk een website is, kan er naar de PageRank worden gekeken. Hierbij is zichtbaar hoe belangrijk Google de website ziet.90 De PageRank van een webpagina kan onder
88
Bovenaan bij Google.’ Goed gevonden worden. Goedgevondenworden.nl. Bezocht op 8 juni 2009
. 89
Ibidem.
56
andere worden opgevraagd via de Google Toolbar.91 De PageRank in de Google Toolbar loopt van nul t/m tien. Hoe hoger het getal, hoe belangrijker de website wordt gezien en hoe hoger deze scoort in de zoekresultaten. Google schijnt 200 factoren te gebruiken om de PageRank van een webpagina te bepalen (Evans, 2007: 22). Een hoge PageRank hoeft niet te betekenen dat de website gelijk bovenaan staat. Vandaar dat er ook naar andere factoren wordt gekeken in de analyse. Michael Evans stelt: “Google’s PageRank (Brin and Page, 1998) algorithm helps rank web websites according to the number of inlinks, and the calculated authority of each website providing the inlink. Generally, the higher a website’s PageRank, the higher its ranking (and the more authority it can confer to other websites it links to) (Evans, 2007: 25).” Het aantal inlinks dat naar de website verwijst is dus belangrijk. Ook de authoriteit van die websites is belangrijk: websites die met een hoge PageRank naar de desbetreffende website linken, zorgen ervoor dat ook die website een hogere PageRank krijgt. Woordanalyse gehele domein Helaas heb ik geen tool kunnen vinden die de woorden analyseert over het gehele domein. In deze analyse heb ik voornamelijk naar de hoofdpagina’s gekeken van de websites. In een vevolgonderzoek zou het interessant zijn om de volledige websites te onderzoeken met alle daarbij behorende subpagina’s. Wel is het mogelijk om met de optie “site:www.website.nl zoekwoord” in Google.nl na te gaan of de zoekwoorden waar de website positie #1 staat, voorkomen in andere webpagina’s van het domein. De subpagina’s worden namelijk meeberekend door Google.92 4.6
Specifieke bevindingen
In Bijlage 3 kunt u de ingevulde vragenlijsten bekijken. Achter elke vragenlijst staat per website de bevindingen die eruit zijn gekomen. In Bijlage 4 kunt u de bijbehorende resultaten inzien die behoren bij het onderzoek met de goRank Keyword Density Analyzer.
90
Google. ‘Technology Overview.’ Google.com. Google Inc. Bezocht op 24 juni 2009
. 91
Google Toolbar. Google.com. Bezocht op 16 juni 2009
. 92
Google. ‘Technology Overview.’ Google.com. Google Inc. Bezocht op 24 juni 2009
.
57
4.7
Algemene bevindingen
Hieronder staan de algemene bevindingen die voortkomen uit de analyses van het portfolio van Goedgevonden.nl. 4.7.1 Analyse binnen de zoekmachine Google en Google Adwords
Pagerank en inlinks Er zijn drie webpagina’s met een PageRank van PR 5, daarnaast drie met PR 4, drie met PR 3 en één met een PR 2. De meeste webpagina’s hebben dus een redelijk hoge PageRank. Een aantal van de websites hebben een hoge PageRank en daarbij hebben ze veel inlinks. Toch kunnen sommige websites met minder inlinks een hogere PageRank hebben. Andere factoren zullen hierbij een rol spelen. Eén website, www.zarzana.nl heeft een PR 0. De website is volledig in flash gemaakt en er zijn slechts vijf inlinks. Toch heeft deze website een #1 positie voor een term. Dit kan liggen aan het feit dat de website zich in een nichemarkt begeeft en dat de zoektermen vooral goed aanwezig zijn in de TITLE en meta tags. Kent raadt in ieder geval aan om de TITLE tag, DESCRIPTION en KEYWORDS meta tags te gebruiken als er gebruik gemaakt wordt van Flash (Kent, 2008: 135). Leeftijd domein Volgens Michael Evans speelt de leeftijd van het domein een rol bij het vaststellen van de PageRank (Evans, 2007: 31). Eén website heeft een domein uit 2007. De overige websites hebben een leeftijd tussen 2001 en 2005. Deze domeinen bestaan dus al een tijd. Toch heeft de website www.vaarmij.nl met PR 5 en een domeinleeftijd van 08-2007 een hogere PageRank dan sandrina.nl met een PR 3 en domeinleeftijd van 03-2001. Er zijn nog veel meer factoren die invloed hebben op de PageRank. Google suggesties van Google Adwords Google kan een webpagina analyseren met de Google Adwords tool. Vervolgens kunnen daarbij suggesties komen voor relevante zoekwoorden. Uit de suggesties kan de inhoud van de webpagina worden afgelezen. Het kan wellicht als reflectie worden gezien waar de website over gaat. Als de suggesties niets met het onderwerp van de website te maken zou hebben dan zou dat eventueel kunnen duiden op spam. Voorbeelden zijn ‘hiding’ technieken, waarbij bepaalde
58
spamming termen onzichtbaar worden gemaakt voor de bezoeker, terwijl de zoekmachine ze indexeert, en cloacking technieken, waarbij website bezoekers een andere inhoud krijgen te zien dan de zoekmachines (Gyöngyi en Garcia-Molina, 2005: 6, 7). De website bezoeker zou dan iets anders te zien krijgen dan de zoekmachine. In het geval van deze portfolio komen de suggesties die Google geeft overeen met de inhoud van de websites. Worden relevante woorden meegerekend? Het is mij onduidelijk of Google relevante woorden meerekent in de berekening voor de ranking. Bij het invoeren van een zoekwoord in enkelvoud in de zoekmachine worden ook regelmatig meervoudstermen meegerekend. Het zou kunnen zijn dat termen die een grote verwantheid hebben, ook worden meegerekend. Met de Google Adwords Keyword Tool kan Google laten zien welke woorden relevant zijn aan de zoekterm of aan de content op de website. Het is mij niet duidelijk of dergelijke woorden invloed hebben op de ranking.93 DESCRIPTION tag wordt gebruikt door Google Uit de analyse blijkt dat de DESCRIPTION tag gebruikt wordt door Google. Peter Kent stelt dat de DESCRIPTION
tag vanaf 2007 wordt gebruikt door Google (Kent, 2008: 36). Bij de analyse van het
portfolio blijkt dat alle websites op één website na precies dezelfde DESCRIPTION tag hebben als Google weergeeft in de omschrijving van de website in de zoekresultaten. Degene die niet precies dezelfde omschrijving had, had een deel van de DESCRIPTION tag plus een zin uit de webpagina zelf. De zin bevatte hier namelijk één van de zoekwoorden. Bij een extra zoekopdracht met andere termen leverde de omschrijving binnen Google een ander resultaat op dat de DESCRIPTION tag.
In dit geval werd de omschrijving uit de Dmoz gebruikt. Het lijkt er dus op dat
Google eerst kijkt naar de DESCRIPTION tag voor de zoekwoorden en als deze er niet zijn naar de Dmoz en content op de website. Bij www.vaarmij.nl is de DESCRIPTION tag zeer kort. De omschrijving wordt aangevuld met tekst uit de webpagina zelf waarbij het zoekwoord aanwezig is. In alle gevallen wordt de DESCRIPTION tag gebruikt door het SEO bedrijf. Op één website na staan alle websites ook in de Dmoz. De Dmoz wordt aangeraden in de SEO literatuur. Peter Kent stelt dat het belangrijk is om aan te melden bij de Dmoz, aangezien het door Google wordt gebruikt en omdat het kan zorgen voor extra inlinks (Kent, 2008: 11, 29). Het SEO bedrijf maakt er dus ook gebruik van.
93
Google Adwords: Keyword Tool. Google.com. Bezocht op 24 juli 2009
.
59
Uiteraard is het zo dat de zoekwoorden waarop werd gezocht in de analyse de zoekwoorden zijn waarop ze hebben geoptimaliseerd. De zoekwoorden staan meestal in de TITLE en /of andere meta tags, waardoor bijvoorbeeld de DESCRIPTION tag getoond wordt door Google. 4.7.2 Zoekwoorden
Zoekwoorden in de zoekresultaten van Google Aan de zoekresultaten kunnen dingen worden afgelezen. Zo is bijvoorbeeld te zien of het zoekwoord voorkomt in de titel, de omschrijving en de URL van de resultaten. Bij www.octas.nl komen de zoekwoorden ook voor in de URL. In het tweede resultaat worden de woorden ‘detachering/bank’ in de URL vetgedrukt weergegeven. Het is mogelijk dat hierbij de naam van de URL een rol speelt in de positie van deze subpagina. Onduidelijk is of het SEO bedrijf de URL met opzet zo heeft genoemd. Opvallend is dat de zoekwoorden regelmatig voorkomen binnen de titel, omschrijving of URL binnen de zoekresultaten in Google. Deze verwijzen naar de TITLE en DESCRIPTION tag en de naam van de URL. De zoekwoorden worden vetgedrukt weergegeven in de zoekresultaten. De titel, ofwel de link naar de website, verwijst naar de TITLE tag en de omschrijving, de snippet94, naar de DESCRIPTION tag. Google zegt zelf dat de DESCRIPTION
tag geen invloed heeft op de ranking.95 Toch heeft het SEO bedrijf heeft de
zoekwoorden bij vrijwel elke website in de meta tags staan. Geoptimaliseerde zoekwoorden Met behulp van de goRank Keyword Density Analyzer kan er worden onderzocht welke woorden het meest worden gebruikt op de webpagina, of de zoekwoorden voorkomen in meta tags en of de woorden speciaal zijn opgemaakt. In Bijlage 4 kunt u de resultaten die zijn van alle websites bekijken die met behulp van deze tool zijn gemaakt. Zoekwoorden staan meestal in de TITLE en/of andere meta tags Met behulp van de goRank Keyword Density Analyzer zijn de meta tags binnen het portfolio van Goedevondenworden.nl onderzocht. Er blijkt dat de zoekwoorden in de meeste gevallen
94
Krishnan, Raj. ‘Improve snippets with a meta description makeover.’ Official Google Webmaster Central Blog. Google
Inc., 27 september 2007. Bezocht op 1 september 2009 . 95
Ibidem.
60
voorkomen in de TITLE en meta tags: KEYWORDS en DESCRIPTION. In de resultaten pagina’s van Google werd ook al duidelijk dat de zoekwoorden in de TITLE en DESCRIPTION vetgedrukt werden weergegeven. De TITLE tag heeft volgens Gyöngyi & Garcia-Molina invloed. Zij stellen ook dat de meta tags hun waarde hebben verloren vanwege spamming (Gyöngyi & Garcia-Molina, 2005: 3). Volgens Kent zijn TITLE en DESCRIPTION tag juist heel belangrijk. Hij stelt dat het belangrijk is dat de zoekwoorden daarin voorkomen (Kent, 2008: 35-36). Google maakt in ieder geval gebruik van de DESCRIPTION tag en TITLE tag. De analyse van de website www.zarzana.nl maakt dit nog duidelijker. De website is compleet opgebouwd in Flash. De enige indexeerbare tekst zijn de TITLE en de meta tags. Op de webpagina zelf (in de body) is geen indexeerbare tekst. Toch heeft deze website een hoge positie voor de zoekwoorden. Hierbij wordt duidelijk dat Google wel naar de TITLE en/of de meta tags gekeken moet hebben. In ieder geval geeft Google in de zoekresultaten de zoekwoorden vetgedrukt weer uit de DECRIPTION tag. Het SEO bedrijf maakt in ieder geval gebruik van de TITLE, KEYWORDS en DESCRIPTION tags. In Search Engine Optimizationn for Dummies wordt aangeraden om deze tags te gebruiken (Kent, 2008: 35-36). Over de werking ervan wordt getwist, maar deze methode wordt toegepast door Goedgevondenworden.nl en zoals in het geval van www.zarzana.nl wordt duidelijk dat een webpagina zelfs met alleen TITLE en meta tags succes kan hebben binnen vermoedelijk een nichemarkt. Zoekwoorden komen regelmatig voor in opmaak tags Het komt regelmatig voor in het portfolio dat de zoekwoorden zijn opgemaakt met met html tags zoals headings (
-
),
of vetgedrukt (, <strong>). Volgens Google hebben deze factoren invloed op de berekening: “[…] our technology analyzes the full content of a page and factors in fonts, subdivisions and the precise location of each word.”96 Peter Kent stelt daarbij het volgende: “_ Use particularly important keywords — those that people are using to search for your products and services — near the top of the page. _ Place keywords into (heading) tags. _ Use bold and italic keywords; search engines take note of this. 96
Google. 'Technology Overview.’ Google.com. Google Inc. Bezocht op 24 juni 2009
.
61
_ Put keywords into bulleted lists; search engines also take note of this. _ Use keywords multiple times on a page, but don’t use a keyword or keyword phrase too often. If your page sounds really clumsy through overrepetition, it may be too much.” (Kent, 2008: 39). De suggesties die Kent geeft, komen overeen met de aspecten waar Google naar kijkt. Binnen het portfolio worden de zoekwoorden dus regelmatig gebruikt in headings, als vetgedrukte tekst en in lijsten. Locatie van de woorden In het citaat hierboven geeft Google aan dat de locatie van het woord ook van belang is. In de analyse is hier ook aandacht aan besteed. Bij een aantal websites komt het voor dat de zoekwoorden zich helemaal bovenaan de webpagina begeven. Bij www.vangoghstudio.com bijvoorbeeld staan de zoekwoorden gelijk in de eerste regel van de body tekst. Kent geeft aan dat het belangrijk is om de zoekwoorden bovenaan de webpagina te plaatsen (Kent, 2008: 39). Bij deze website en www.caulils.com staan de zoekwoorden helemaal bovenaan de webpagina. Bij de andere websites staan ze vaak iets verder in de webpagina, bijvoorbeeld onder het menu, maar nog redelijk bovenaan. Voor de verschillende websites is niet overal dezelfde tactiek toegepast. Zoekwoorden binnen de webpagina De Keyword Density Analyzer geeft een goed overzicht hoe en in welke mate bepaalde woorden voorkomen binnen de website. In de analyse wordt er gekeken naar de zoekwoorden, aangezien de websites met die woorden een hoge plaats hebben bemachtigd. Bij alle gevallen komen de zoekwoorden voor op de website. Niet alle woorden hoeven zich te begeven op de webpagina waar Google naar verwijst, aangezien dat bij één website in de analyse het geval is. Als het zoekwoord op subpagina binnen het domein staat, dan kan er toch naar verwezen worden. Er blijkt hieruit dat Google niet de pagina’s als apart ziet, maar dat er ook naar de website als geheel wordt gekeken. Google geeft zelf ook aan: “We also analyze the content of neighboring web pages to ensure the results returned are the most relevant to a user’s query.”97 Bij het optimaliseren is het van belang om niet één pagina te optimaliseren, maar de website als geheel. Subpagina’s kunnen een hoofdpagina ondersteunen. In deze portfolio komt het voor dat sommige webpagina’s apart zijn geoptimaliseerd, zodat elke pagina hoog kan staan
97
Ibidem.
62
op bepaalde zoekwoorden. Het komt ook voor dat de zoekwoorden voorkomen binnen verschillende pagina’s van het domein. Eerder dit hoofdstuk zijn verschillende vormen van spam behandeld die door Györgyi en Garia-Molina uiteen gezet zijn, zoals: title spam, body spam, meta tag spam, ankertekst spam, URL spam en herhaling van bepaalde termen. Dit kan voor spam doeleinden worden gebruikt, maar het kan ook worden gebruikt om bepaalde termen te optimaliseren. In hoeverre komt dit terug in de websites van Goedgevondenworden.nl? Dit is onderzocht met een analyse via de Keyword Density Analyzer98 en een handmatige analyse naar de zoekwoorden. Hieronder staat een aantal gebruikte methoden: Herhaling van keywords De Keyword Density Analyzer maakt zichtbaar welke woorden het meest gebruikt worden. Er blijkt dat het SEO bedrijf sommige woorden meerdere keren terug laat komen, zowel in meta tags als in de webpagina zelf. Soms worden de woorden zelfs achter elkaar geplaatst of in enkelvoud of meervoud. Het meervoudig laten terugkomen van bepaalde keywords in verschillende meta tags kan een methode zijn om te optimaliseren op die keywords. Volgens Györgyi en Garia-Molina zijn dit spamming methoden (Györgyi en Garia-Molina, 2005: 3). Ik ben van mening dat verschillende schrijfwijzen voor een woord minder op manipulatie duiden dan het overladen met keywords. Woorden kunnen namelijk verschillend worden gespeld door bezoekers. Het hoeft niet te betekenen dat de zoekwoorden waarmee de websites een hoge positie hebben verworven ook de zoekwoorden zijn waar de website op is geoptimaliseerd. Ze kunnen op bepaalde keywords hebben gemikt en uiteindelijk hoog gekomen zijn met andere keywords. Ook met de density, de dichtheid van het keyword, kan worden gezien hoe groot het aandeel is van een keyword op de webpagina. Een voorbeeld is dat de combinatie ‘grafisch ontwerp amsterdam’ voor www.1fish.nl in meerdere meta tags voorkomt. Bovendien worden de woorden binnen bepaalde meta tags herhaald. Ankerteksten De zoekwoorden komen regelmatig voor in de ankerteksten. Bij de meeste websites komt een bepaalde ankertekst meerdere manieren op dezelfde manier voor. De ankertekst zou een rol kunnen spelen in het verhogen van de positie. De Google Bomb is daar een voorbeeld van (zie hoofdstuk 2). Daarbij wordt de ankertekst zo vaak gebruikt met een link naar een bepaalde website, dat de desbetreffende website met die woorden bovenaan komt te staan. Het is daarom 98
Keyword Density Analyzer. goRank.com. Bezocht op 17 juni 2009 .
63
niet gek dat de zoekwoorden regelmatig voorkomen in de ankerteksten. Het SEO bedrijf heeft meerdere inlinks zelf aangemaakt door een aanmelding bij startpagina websites. Hierdoor is het mogelijk om zelf de ankertekst te kiezen. Een voorbeeld is www.caulils.com waarbij steeds om startpagina’s de ankertekst ‘relatiegeschenken van caulils delicatessen haarlemmerstraat amsterdam’ is aangemaakt. Op deze startpagina’s kan men zelf een link toevoegen en bovendien zou het wel erg toevallig zijn dat verschillende bronnen precies dezelfde ankerteksten hebben gekozen. Het is dus goed mogelijk dat ze de zoekwoorden waarmee ze hoog willen komen in zoekmachines meerdere keren hebben gebruikt als ankertekst. Elke pagina apart optimaliseren Voor de website www.champagneproeverij.nl is duidelijk dat de hoofdpagina en de subpagina beiden apart zijn geoptimaliseerd. De pagina’s hebben verschillende TITLE en meta tags gebruikt. De hoofdpagina staat op positie #1 met de zoekopdracht ‘champagneproeverij’, terwijl de subpagina op #1 staat met ‘kadobon bestellen’. Er blijkt uit de subpagina dat het SEO bedrijf geoptimaliseerd heeft op de zoekwoorden ‘kadobon bestellen’. De TITLE bevat uitsluitend deze woorden, ze staan daarnaast in de URL, de meta tags, in de body: van bovenaan tot onder en meestal in combinatie, opgemaakt met HTML tags, binnen andere pagina’s uit het domein en in ankerteksten. Deze subpagina leunt op de hoofdpagina met betrekking tot PageRank en het aantal inlinks. De hoge positie is waarschijnlijk te danken via een combinatie van beide: query afhankelijk en query onafhankelijk. Ook www.caulils.com heeft verschillende DESCRIPTION tags per pagina. Hierbij zijn sommige pagina’s geoptimaliseerd voor bepaalde keywords. Op deze manier kunnen meerdere pagina’s binnen het domein voor verschillende zoekopdrachten hoog komen te staan voor verschillende zoekopdrachten. Handmatige analyse Uit het onderzoek blijkt dat het ook belangrijk is om handmatig naar de paginabron te kijken. De tools hoeven namelijk niet altijd betrouwbare informatie op te leveren. In de paginabron zijn bepaalde html tags, zoals headers of vetgedrukte woorden, met tools niet zichtbaar terwijl ze handmatig wel te herkennen zijn.
64
4.7.3 Inlinks
Zelf aangemaakte inlinks Opvallend is dat de meeste onderzochte websites inlinks hebben vanuit linkpagina’s of anders genoemd: startpagina’s. Bij de meeste linkpagina’s is het mogelijk om zelf de website aan te melden. Bij één website wordt er zelfs terug gelinkt. Dit is mogelijk een wederzijdse link waarbij een link wordt verkregen door terug te linken. Sommige webpagina’s hebben een vermelding in jouwpagina.nl. Hierbij wordt zelfs een vermelding gegeven voor linkruil.99 Hierbij kan men wederzijdse links aanmaken. Dit is een SEO methode om daarmee inlinks te vergaren om zo de PageRank kunstmatig te verhogen. Het lijkt er in veel gevallen op dat het SEO bedrijf zelf links heeft aangemaakt. Niet alleen jouwpagina.nl gebruikt wederzijdse inlinks. Het SEO bedrijf heeft namelijk ook wederzijdse links aangemaakt bij andere sites. Daar is het ook mogelijk om wederzijdse links aan te maken.100 Het lijkt erop dat het SEO bedrijf deze SEO methode gebruikt om websites mee te optimaliseren. Veel ankerteksten zijn precies hetzelfde voor sommige onderzochte websites. Ook verwijzen sommige webpagina’s die geoptimaliseerd zijn door Goedgevondenworden.nl naar elkaar. Michael Evans stelt dat inlinks belangrijk zijn voor het bepalen van de PageRank (Evans, 2007: 25).” De vraag: “Heeft de website zelf links aangemaakt?” is gesteld om te onderzoeken of SEO bedrijven kunstmatig links aanmaken om zo een hogere PageRank te krijgen. Voordeel voor het SEO bedrijf is dat zelf aangemaakte links de mogelijkheid bieden om zelf de ankerteksten te kiezen. Het lijkt in ieder geval een tactiek te zijn om op deze manier het aantal inlinks te verhogen en daarmee waarschijnlijk een hogere PageRank te bemachtigen. Bovendien ook om de ankerteksten te beheren, waardoor er op de woorden uit de ankerteksten geoptimaliseerd wordt. Als dit in overdreven mate gebeurt dan ontstaat er ankertekst spam. Relevante inlinks Volgens Kent is er discussie in de SEO wereld over het nut van relevante inlinks, ofwel inlinks die relevantie hebben met het onderwerp van de website. Kent was eerst van mening dat vooral 99
Hecke, A. van. ‘Secretaresse? Jouw pagina!’ Jouwpagina.nl. Jouwpagina. Bezocht op 14 oktober 2009. <
http://secretaresse.jouwpagina.nl/>. 100
Carbonell, Robert. ‘Add link reciprocal abstract art.’ Abstract Art Informel by Robert Carbonell . Bezocht op 14
oktober 2009. . 100
‘SEO directory. Paid inclusion or free listings with reciprocal links.’ RSS Feeds Submission Directory. Rss-feeds-
submission.com .
65
relevante links belangrijk waren, maar nu stelt hij dat alle links kunnen bijdragen (Kent, 2006: 257; 2008: 272). Zijn de inlinks uit deze portfolio relevante inlinks? Dit kan worden gemeten door met de Yahoo! inlinks tool te kijken of de zoekwoorden voorkomen binnen de inlinks. Bij de meeste websites komt een deel van de zoekwoorden voor binnen de inlinks. Niet alleen kunnen zoekwoorden voorkomen in ankerteksten van inlinks. Ze kunnen ook voorkomen binnen de URL, de TITLE, meta tags of content van de inlink. Ook het navigeren door de inlinks is een mogelijkheid om relevantie te testen. Er blijkt dat veel van de inlinks komen vanuit websites met relevantie. Verder worden linkpagina’s gebruikt. Deze webpagina’s hebben enige relevantie. Ook is er soms minder relevantie en is er zichtbaar dat het SEO bedrijf zelf zoveel mogelijk links heeft aangemaakt. Bijvoorbeeld de champagneproeverij-bon voor een startpagina voor kinderfeestjes.101 Het lijkt mij vrij onwaarschijnlijk om kinderen als doelgroep te kiezen voor een champagneproeverij. Het zou kunnen dat de relevantie van inlinks belangrijk is, aangezien een website met veel relevante inlinks zich dan in het midden van een bepaald web begeeft, maar of de zoekmachines hier onderscheid in maken, is onduidelijk. Wel kunnen relevante inlinks een vorm van optimalisatie aangeven, aangezien de websites dan met elkaar te maken hebben. Veel irrelevante inlinks, dus inlinks vanuit websites die niets met de desbetreffende website te maken hebben, kunnen aanbevelingen zijn, maar het kunnen ook aangemaakte links zijn met als doel om alleen de PageRank te verhogen. Ik ben van mening dat dit een vorm van manipulatie is. Het heeft namelijk niets met relevantie te maken. Subpagina’s kunnen wellicht meeliften op het aantal inlinks binnen het gehele domein Een subpagina binnen champagneproeverij.nl heeft slechts twee inlinks. Toch staat de webpagina op positie #1 met de zoekwoorden ‘kadobon bestellen’. Waarschijnlijk kan deze pagina meeliften op de inlinks van andere pagina’s binnen het domein. Inlinks en PageRank Kent stelt dat naast inlinks met een hoge PageRank ook inlinks met een lagere PageRank van waarde kunnen zijn. Hij zegt wel dat de keywords binnen die websites belangrijk zijn (Kent, 2008: 272). Voor verder link onderzoek kan er met bepaalde tools, zoals de Link Diagnosis102 worden gekeken naar de PageRank van de inlinks. Hierbij wordt wellicht duidelijk of veel inlinks van websites met een hoge PageRank van invloed zijn op de desbetreffende website. 101
‘Kidsfeest!’ Goedbegin.com. GoedBegin. Bezocht op 4 september 2009 .
102
Link Diagnosis. Link Diagnosis. Bezocht op 4 september 2009 .
66
4.8
Werking van SEO methoden in verschillende zoekmachines
Het wil niet zeggen dat als een SEO onderneming bepaalde SEO technieken heeft toegepast, dat deze daadwerkelijk werkzaam zijn. Een methode kan bijvoorbeeld toegepast zijn, maar geen effect hebben. Bovendien kan, zoals in voorgaande hoofdstukken is gebleken, de werking van SEO technieken aan verandering onderhevig zijn. Sommige technieken die jarenlang gewerkt hebben, kunnen ineens gezien worden als spamming technieken. Voor deze analyse is gebruik gemaakt van de zoekmachine Google. Een zoekmachine kan het algoritme aanpassen, maar ook ontstaan er nieuwe zoekmachines met een ander algoritme. Zo kunnen de zoekmachines Google, Bing, Yahoo! en Live Search bijvoorbeeld verschillende resultaten geven. Wat voor de ene zoekmachine werkt, kan voor de andere zoekmachine niet werken. Conclusie
In dit hoofdstuk is er ten eerste onderzocht of er te zien is dat een bepaalde website is geoptimaliseerd. Ten tweede is er ook gekeken naar hoe de website geoptimaliseerd is, dus welke methoden ze hebben gebruikt. De methode om dit te weten te komen is tevens van belang. Ten derde zegt de analyse niet alleen iets over de websites zelf, maar het kan ook iets zeggen over hoe zoekmachines werken. Er is in dit hoofdstuk gebruik gemaakt van een portfolio van een zoekmachine optimalisatie bedrijf. Van elke website uit het portfolio is een anatomie gemaakt. Dit is met behulp van een vragenlijst tot stand gekomen. Vervolgens zijn resultaten zijn geanalyseerd. Er blijkt dat het mogelijk is om te zien of een website geoptimaliseerd is. Er is hierbij gekeken of bepaalde factoren die volgens Evans en Bifet van invloed kunnen zijn op de positie in de zoekresultaten ook aanwezig zijn binnen deze websites. Daarnaast zijn spamming methoden van Györgyi en Garia-Molina vergeleken en er is terugverwezen naar het boek Search Engine Optimization for Dummies van Peter Kent om te kijken of een aantal van zijn methoden erin terugkomen. Uit de analyse blijkt dat het SEO bedrijf gebruik maakt van verschillende SEO technieken en dat dit ook zichtbaar gemaakt kan worden. Voorbeelden zijn het plaatsen van keywords op prominente plekken en de herhaling van keywords (in meta tags of in de body), het gebruik van de TITLE tag en andere meta tags, het gebruik van opmaak tags, meerdere schrijfwijzen van de keywords, het zelf aanmaken van (wederzijdse) inlinks en het daarbij zelf
67
kiezen van de ankerteksten. Er is voor gekozen om voornamelijk te richten op de zoekwoorden waar ze hoog mee staan in Google. Er blijkt hieruit dat de zoekwoorden meestal ook voorkomen binnen de TITLE en meta tags en op prominente plaatsen binnen de website. Het komt ook voor dat de zoekwoorden in de ankerteksten staan. De analyse zegt niet alleen iets over het optimaliseren en de websites zelf. Het zegt namelijk ook iets over hoe zoekmachines in elkaar zitten en hoe zij webpagina’s beoordelen. Er is namelijk te zien dat zoekwoorden vaak op de pagina staan, maar dat dit niet altijd het geval hoeft te zijn. Het woord kan namelijk ook op een andere pagina binnen het domein staan. De website als geheel is belangrijk: de pagina’s binnen het domein hebben invloed op elkaar. Ook is zichtbaar dat Google de TITLE en DESCRIPTION tag gebruikt in de pagina van de zoekresultaten. Mochten de zoekwoorden daarin niet voorkomen dan gebruikt Google informatie uit de content of de Dmoz. De TITLE tag schijnt invloed te hebben. Of ook andere meta tags van waarde zijn, is onduidelijk. Dit SEO bedrijf maakt in ieder geval gebruik van meta tags. De methode die hier is toegepast, richt zich dus niet zozeer op de zoekmachine zelf, maar op de websites. Door websites te analyseren, kan er ook iets worden gezegd over de werking van zoekmachines. Niet alleen het resultaat van de analyse is van belang, maar ook de methode zelf. Met deze methode en bijbehorende onderzoeksinstrumenten is het mogelijk om een website te ontleden. Uit de analyse blijkt dat er met deze methode bepaalde SEO technieken achterhaald kunnen worden. Er is dus zichtbaar hoe het SEO bedrijf te werk is gegaan om de websites te optimaliseren. Bovendien laat de analyse zien dat het mogelijk is om dit van buitenaf te achterhalen. De gegevens zijn online beschikbaar. De gestelde vragen zijn gedurende het onderzoek steeds verder uitgebreid. Ook is het onderzoek begonnen met een handmatige analyse in de code. Tijdens het onderzoek is er gebleken dat deze analyse deels geautomatiseerd uitgevoerd kan worden. Verschillende tools kunnen de website ontleden en er een overzicht van geven. Bovendien kan er bepaalde informatie boven water komen worden die met een handmatige analyse onmogelijk is. Uit deze analyse is dus gebleken dat het mogelijk is om optimalisatie technieken te achterhalen en om te zien hoe een optimalisatie bedrijf te werk is gegaan. Het is goed mogelijk dat dit SEO bedrijf de content dusdanig heeft aangepast zodat de zoekwoorden er veelvuldig en op de juiste plaats of met opmaak tags in voorkomen. De structuur van de website en de content kunnen er daardoor anders uitzien dan zonder optimalisatie. Dit betekent dat een beheerder van een website schrijft voor de zoekmachine. De woorden die op de website staan, worden dan dusdanig aangepast aan zoekwoorden waar veel op gezocht wordt. Bepaalde woorden kunnen dus gebruikt worden binnen een tekst om daarmee een hoge positie te bemachtigen. Er zou
68
sprake zijn van spam als zij met bepaalde zoekwoorden bovenaan staan die niets met de inhoud van de website te maken hebben. Ook zou een website die hoog staat in de zoekresultaten, maar waarbij de kwaliteit van de website zeer slecht is, kunnen duiden op spamming methoden. Niet alleen de content kan beïnvloed zijn door SEO methoden. Ook de structuur van de website kan er anders uitzien en inlinks kunnen kunstmatig zijn aangemaakt. Aanbevelingen De vragenlijst is een methode om optimalisatie methoden uit een website bloot te leggen. Daarnaast blijken bepaalde technieken uit het Search Engine Optimization boek van Peter Kent (2008) gebruikt te worden door Goedgevondenworden.nl. Bovendien zijn de gebruikte tools voornamelijk SEO tools, dus instrumenten die gebruikt worden om SEO toe te passen of te onderzoeken. Aangezien Google bijvoorbeeld al naar 200 factoren kijkt, kan er verder onderzoek gedaan worden door te kijken naar verschillende SEO boeken uit de SEO literatuur en te onderzoeken of de beschreven methoden gebruikt zijn bij verschillende websites. Er zouden ook andere tools gebruikt kunnen worden. Deze studie heeft zich voornamelijk gericht op hoe er te zien is dat een website geoptimaliseerd is. In een bepaalde mate kan er ook iets gezegd worden over de werking van bepaalde methoden, maar om hier meer over te kunnen zeggen, is uitgebreider onderzoek nodig. Met behulp van een vragenlijst, waarbij websites worden ontleed, kan de nummer één bij een zoekopdracht worden vergeleken met websites binnen dezelfde zoekresultaten met lagere postities. Het is dan wellicht mogelijk om te zien waarom de ene website hoger staat dan de andere website. Een andere manier is om zelf verschillende websites te optimaliseren met verschillende SEO technieken en over tijd te zien welke websites hoog komen in de zoekmachine.
69
Conclusie Deze scriptie heeft de lijn tussen optimalisatie en manipulatie voor zoekmachine optimalisatie (SEO) in kaart gebracht. Er is de vraag gesteld: “Wanneer is er geen sprake meer van optimalisatie, maar van manipulatie? Enerzijds is het belangrijk voor degenen die SEO toepassen om te weten wanneer zij een grens overgaan. Anderzijds laat het zien welke rol zoekmachines spelen en waar zij aan zouden moeten voldoen. Bovendien geeft het weer dat zoekresultaten in zoekmachines beïnvloed kunnen worden door beheerders van websites. Bij zoekmachine optimalisatie worden verschillende technieken gebruikt om de positie van een website te verhogen binnen zoekresultaten van een zoekmachine. Er zijn verschillende redenen om zoekmachine optimalisatie (SEO) toe te passen. Zowel voor commerciële redenen als niet-commercieel. Redenen kunnen zijn om meer bezoekers aan te trekken met als doel het verkopen van ideeën of producten, naamsbekendheid of voor aantrekken van adverteerders door grotere bezoekersaantallen. Voorbeelden van niet-commerciële doeleinden kunnen politiek van aard zijn, dominant zijn binnen de zoekresultaten van een bepaald onderwerp of iemand die wil dat zijn of haar verhaal gelezen wordt, zoals bij een blog. Maar ook het zuiveren van een imago van een persoon of bedrijf kan een reden zijn. Het imago kan verbeterd worden door negatieve websites weg te drukken door positieve websites op de eerste pagina van de zoekresultaten voor die persoon. Volgens Richard Rogers concurreren bronnen met elkaar om de leidende informatiebron te zijn voor een bepaalde informatie ruimte. De websites die bovenaan staan, worden ook als officiële realiteit gezien voor dat onderwerp. Vooral degenen die bovenaan staan in zoekresultaten hebben de macht en dominantie. Rogers pleit voor alternatieve uitingen van de realiteit in plaats van één dominante realiteit. SEO kan juist sterke bronnen nog sterker maken door SEO technieken toe te passen. Het kan echter ook een middel zijn als tegenbeweging. Websites zouden kunnen binnendringen binnen de dominante realiteit en daarmee een alternatieve tegenhanger kunnen zijn binnen die informatie ruimte. Waarom is het belangrijk om hoog in de zoekresultaten te staan? Aandacht wordt schaarser en zoekmachines spelen een steeds belangrijkere rol voor websites om gevonden te worden. Waarom wordt aandacht schaarser? Het aantal websites neemt toe, maar in Google kan men niet verder dan resultaat duizend. Vooral de hogere resultaten in zoekmachines worden bezocht door bezoekers. Na de eerste pagina van zoekresultaten wordt het aantal websites steeds minder bezocht. Daarom is het belang om hoog in de zoekresultaten te komen groot, aangezien de website anders niet wordt gevonden. Dit zijn redenen waarom zoekmachine optimalisatie 70
wordt toegepast en waarom er een groeiende industrie voor bestaat. Zoekmachine optimalisatie valt onder zoekmachine marketing. Uit marketingoogpunt is het ook van belang om de zichtbaarheid van de website te vergroten doormiddel van SEO. Wat optimalisatie en manipulatie is, wordt bepaald door de zoekmachines. Zij hebben de macht om regels op te stellen en wie zich daar niet aan houdt, wordt bestraft. De SEO industrie volgt de ontwikkelingen van de zoekmachines. Zij spreken in termen van ‘ethical SEO’: zoekmachine optimalisatie binnen de grenzen die zijn toegestaan door de zoekmachines. ‘White hat’ is toegestaan en ‘black hat’ wordt gezien als manipulatie. De ethische lijn hoeft niet zozeer gelijk te staan met de grenzen die zoekmachines stellen. Een zoekmachine kan namelijk het algoritme aanpassen waardoor bepaalde technieken die eerder nog werden toegelaten later als manipulerend kunnen worden gezien. De regels kunnen voortdurend veranderen. Eigenlijk is het voor SEO bedrijven alleen van belang om te weten welke technieken werkzaam zijn. Ethisch gezien zouden zoekresultaten gemanipuleerd kunnen worden terwijl een zoekmachine deze doorlaat. Ook is er vanuit de industrie zelf behoefte aan regels. Uit het Search Engine for Dummies onderzoek van hoofdstuk 3 blijkt dat bepaalde methoden eerder nog werkten en later als manipulatie werden gezien. Manipulatie is daarom niet constant. Daarom ben ik van mening dat het beter is om te kijken naar de maatschappelijke functie van een zoekmachine om zo meer een constante lijn vast te stellen. Bijvoorbeeld om meer duidelijkheid te krijgen van waar de grens voor een langere tijd ligt. Bovendien zegt manipulatie niet alleen iets over de mensen die SEO technieken gebruiken, maar het kan ook iets zeggen over hoe een zoekmachine zou moeten functioneren. Daarom is deze grens tussen optimalisatie en manipulatie belangrijk. De doelstelling van een zoekmachine zou als volgt beschreven kunnen worden: relevante zoekresultaten gesorteerd op belangrijkheid voor de juiste zoekopdracht. In deze situatie is er sprake van optimalisatie. Websites zouden met behulp van bepaalde SEO methoden zelfs de kwaliteit van de zoekmachine kunnen verbeteren door hun content aan te laten sluiten bij de juiste bijbehorende zoekwoorden. Voor alle belanghebbenden die gebruik maken van het Internet, zoals de zoekers, de zoekmachines en de eigenaars van websites, is dit bevorderend. Echter, komen onrelevante en onbelangrijke resultaten boven bij een zoekopdracht, dan duidt dit op manipulatie. Het eerste resultaat dat boven komt drijven heeft dan bijvoorbeeld niets met de zoekwoorden te maken. In dit geval heeft degene die de zoekopdracht uitvoert een verkeerd resultaat. Bovendien wordt de kwaliteit van de zoekmachine en van het web verstoord. Uit het onderzoek in hoofdstuk 3 van de drie edities van Search Engine Optimization for Dummies (Kent, 2004; 2006; 2008) blijkt er een wisselwerking te zijn tussen zoekmachines en de SEO industrie. Niet alleen volgt Peter Kent de ontwikkelingen van de zoekmachines, het gaat
71
ook andersom op: zoekmachines passen ook hun algoritme aan als gevolg van bepaalde SEO technieken uit de SEO industrie. Peter Kent waarschuwt voor methoden die ingaan tegen het protocol van de zoekmachines. Werken ze niet meer, dan waarschuwt hij voor deze methoden. Maar andersom zijn er bepaalde SEO technieken bedacht en toegepast door mensen die hebben geoptimaliseerd. Voorbeelden zijn de Google Bomb en ‘hiding’ technieken. Met de Google Bomb konden bepaalde websites stijgen in de positie in de zoekresultaten door verschillende inlinks te maken naar die website met een bepaalde ankertekst (de hyperlink tekst) en bij ‘hiding’ technieken worden bepaalde woorden verborgen gehouden voor de bezoeker van de website terwijl de zoekmachine ze wel indexeert. Beide technieken konden de positie van een website laten stijgen. Toen Google lucht van kreeg van deze technieken, is het algoritme aangepast. Dit geldt voor meerdere technieken die in Search Engine Optimization for Dummies worden beschreven. Bepaalde technieken die eerder nog werkten, werken nu minder goed, niet meer of er wordt zelfs voor gewaarschuwd het niet meer te gebruiken. Aangezien Peter Kent zijn edities steeds aanpast en waarschuwt voor technieken die eerder nog werden aanbevolen, plus het feit dat hij alternatieven biedt voor manipulerende technieken, blijkt het dat hij zich voornamelijk richt op technieken die op dat moment werken. Ik vermoed dat hij minder kijkt of bepaalde methoden die nu nog werken in de toekomst als manipulerend kunnen worden gezien. Als de techniek werkt, vermoed ik dat hij zich dus niet de vraag stelt of het manipulerend is. Kent probeert ‘ethical SEO’ toe te passen door zich zoveel mogelijk aan het protocol van zoekmachines te houden. Door de edities met elkaar te vergelijken over een periode wordt er zichtbaar dat wat in een eerdere editie ‘ethical SEO’ leek, in een latere editie manipulatie werd. Sommige technieken werken in een latere editie niet meer zo goed. Dit kan betekenen dat Google deze methoden als een vorm van manipulatie ziet. Het laat ook zien dat Kent zich soms in het gebied van ‘gray hat’ technieken bevindt: technieken die zich op de grens van optimalisatie en manipulatie begeven.. Wordt er geoptimaliseerd naar wat toegestaan is of naar wat niet wordt bestraft? In het algemeen proberen mensen uit de SEO industrie methoden uit. De Google Bomb en hiding’ technieken zorgden voor wijzigingen in het algoritme van zoekmachines. Het reglement van zoekmachines is niet volledig. Daarom wordt er ook gesteld dat andere niet vermelde manipulerende technieken ook verboden zijn. Waarschijnlijk zullen technieken uitgeprobeerd worden en worden ze gebruikt zolang ze werken en zolang er niet bestraft wordt. Maar Kent waarschuwt voor bestraffingen zoals het krijgen van een penalty. Aangezien bepaalde technieken uit Search Engine Optimization for Dummies van Peter Kent minder zijn gaan werken, wordt er min of meer gehandeld binnen het grijze gebied, dat wat niet wordt bestraft. De relatie tussen de SEO industrie en de zoekmachines lijkt op een kat- en muisspel. De technieken die ongewijzigd zijn
72
gebleven binnen de drie edities, zijn waarschijnlijk in elke editie binnen de grenzen van wat wordt toegelaten of in ieder geval niet wordt bestraft. Hoofdstuk 4 geeft weer hoe SEO in de praktijk wordt toegepast. Is het mogelijk om te zien dat SEO methoden zijn gebruikt? En hoe is dit zichtbaar? Met behulp van een vragenlijst en tools zijn verschillende geoptimaliseerde websites geanalyseerd. Hiermee blijkt dat het mogelijk is om SEO methoden te achterhalen en dit kan van buitenaf achterhaald worden door informatie over de website te gebruiken die beschikbaar is op het Internet. In deze analyse is er gebruik gemaakt van een portfolio van een SEO bedrijf om te achterhalen hoe de websites zijn geoptimaliseerd. Het SEO bedrijf geeft zelf aan met welke keywords hun geoptimaliseerde websites bovenaan staan bij Google. Er is een keyword analyse gedaan voor elke website om te zien waar bepaalde keywords voorkomen en hoe. Er blijkt dat de zoekwoorden waar ze hoog mee staan regelmatig op prominente plekken staan, worden herhaald, in de TITLE tag en meta tags staan, opgemaakt zijn of op verschillende manieren worden geschreven of gespeld. Bovendien is een tactiek om zelf inlinks aan te maken. In deze gevallen op zogenaamde startpagina’s (pagina’s met een verzameling van links naar websites). Niet alleen heeft het SEO bedrijf de tactiek om zelf links aan te maken, maar er komen ook wederzijdse links tussen. Hierbij kan het SEO bedrijf een inlink krijgen door terug te linken. Uit het Search Engine Optimization for Dummies onderzoek blijkt dat het wederzijds naar elkaar linken steeds minder goed werkt en dit laat zien dat deze methode tegen de grens ligt van wat nog wel en nog niet is toegestaan door zoekmachines. Door het aanmaken van inlinks is het mogelijk om zelf ook de ankertekst (de tekst van de hyperlink) te bepalen en dit kan ervoor zorgen dat de woorden uit deze ankertekst zwaarder worden meegewogen. Meer inlinks kunnen zorgen voor een hogere positie in de zoekresultaten en ankerteksten kunnen ook invloed hebben op de positie in de zoekresultaten voor die woorden. Niet alleen zegt de analyse iets over de websites en hoe er geoptimaliseerd wordt; het zegt ook iets over de zoekmachines. Op deze manier wordt hun ondoorzichtige algoritme iets meer zichtbaar. Er is bijvoorbeeld zichtbaar dat Google de TITLE en DESCRIPTION tag gebruikt in de zoekresultaten. Komen de zoekwoorden niet voor dan gebruikt Google een zin uit de website zelf of de beschrijving uit de Dmoz, (Open Directory Project). Een dergelijke vergelijking uit de broncode van de website met de resultaten in Google laat zien dat websites zelf ook kunnen laten zien hoe een zoekmachine in elkaar zit. Dit in tegenstelling tot het analyseren van de zoekmachine zelf, waarbij de websites zelf van ondergeschikt belang zijn. Ook blijkt uit de analyse dat het mogelijk is dat websitebeheerders eerder schrijven voor zoekmachines dan voor hun publiek om zo een hoge positie te krijgen. Dit door bepaalde
73
keywords te gebruiken waar veel op wordt gezocht en deze op te maken en op bepaalde plekken te zetten. SEO technieken kunnen invloed uitoefenen op de content en structuur van de website. Hierbij bestaat de kans dat ook bepaalde websites onterecht bovenaan komen te staan, waardoor er sprake is van spam. Soms kunnen bepaalde SEO methoden juist de juiste mensen aantrekken voor een website bijvoorbeeld omdat er eerst keywords werden gebruikt waar niemand op zoekt. Optimalisatie is er als de content ook relevant is aan de zoekwoorden. Manipulatie ontstaat als de relevantie en belangrijkheid van zoekresultaten in het geding komen. Als beheerders van websites SEO methoden gebruiken die werkzaam zijn en daardoor bovenaan in de zoekresultaten komen, dan hebben zij in feite een bevoorrechte positie ten opzichte van andere websitebeheerders. Hun kennis van SEO technieken maakt deze bevoorrechte positie mogelijk. Of zoekmachines dit tegengaan door andere algoritmen te ontwikkelen, zal de toekomst uit moeten wijzen. Aanbevelingen In een vervolgonderzoek zouden SEO methoden verder onderzocht kunnen worden door verschillende SEO literatuur te bestuderen en te analyseren of deze voorkomen binnen geoptimaliseerde sites. Dit onderzoek heeft laten zien dat het mogelijk is om te zien dat een site geoptimaliseerd is en in een bepaalde mate hoe. Een iets ander onderzoek is om te onderzoeken waarom een bepaalde website in de zoekresultaten op nummer één staat. Hierbij kunnen zowel geoptimaliseerde als niet-geoptimaliseerde websites worden geanalyseerd. Door de nummer één te analyseren en te vergelijken met lagere zoekresultaten, wordt er wellicht duidelijker zichtbaar welke factoren een belangrijke rol spelen.
74
Bibliografie Boeken en artikelen Bifet, Albert e.a. ‘An analysis of factors used in a search engine's ranking.’ In: Brian Davidson, red. First international workshop on adversarial information retrieval on the web. Bethlehem, PA (USA), Lehigh Universiteit, 2005: p. 48-57. Bezocht op 8 oktober 2009 . Davenport, Thomas H., John C. Beck. The attention economy. Understanding the new currency of business. Boston: Harvard Business School Press, 2001. Drost, Isabel, Tobias Scheffer. ‘Thwarting the nigritude ultramarine. Learning to identify link spam.’ In: J. Gama e.a., red.: Machine Learning. ECML 2005. Springer-Verlag Berlin Heidelberg, 2005: p. 96–107. Bezocht op 8 oktober 2009 . Edwards, C. ‘Search. The next generation.’ Engineering & Technology, jrg. 3, nr. 11, (juni-juli 2008): p. 60-63. Bezocht op 11 mei 2009 . Evans, Michael P. ‘Analysing Google rankings through search engine optimization data.’ Internet Research, jrg. 17, nr. 1 (2007): p. 21-37. Bezocht op 8 juni 2009 . Fortunato, S. e.a. ‘How to make the top ten. Approximating PageRank from in-degree.’ 14th International World Wide Conference, Edinburgh (UK), 2005. Bezocht op 9 juni 2009 . Goldhaber, Michael H. ‘Attention shoppers!’ Wired, jrg. 5, nr. 12 (1997). Bezocht op 14 april 2009 . Granka, Laura A., Thorsten Joachims, Geri Gay. ‘Eye-tracking analysis of user behavior in WWW search.’ SIGIR '04: Proceedings of the 27th annual international ACM SIGIR conference on Research and development in information retrieval. New York, NY, USA: ACM Press, 2004, 478-479. Bezocht op 16 juli 2009 . Gyöngyi , Zoltán & Hector Garcia-Molina. ‘Web spam taxonomy.’ In: First International Workshop on Adversarial Information Retrieval on the Web (AIRWeb ’05). New York, NY, USA: ACM Press, 2005: p. 1-9. Bezocht op 8 oktober 2009 . 75
Jansen, B.J., A. Spink. ‘How are we searching the World Wide Web? A comparison of nine search engine transaction logs.’ Information Processing & Management, jrg. 42, nr. 1 (2006): p. 248-263. Bezocht op 15 juli 2009 Jensen, Morten Bach, Anna Lund Jepsen. ‘Online marketing communications. Need for a new typology for IMC?’ Journal of Website Promotion, The Haworth Press, jgr. 2. nr. 1 en 2 (2008): 19-35. Bezocht op 12 oktober 2009 Kahn, R., D. Kellner. ‘New media and Internet activism. From the battle of Seattle to blogging.’ New Media & Society, Londen: SAGE Publications, jrg. 6 nr. 1 (2004): p. 87-95. Bezocht op 20 april 2009 < http://nms.sagepub.com/cgi/reprint/6/1/87.pdf>. Kent, Peter. Search engine optimization for dummies. Indianapolis, Indiana: Wiley Publishing, Inc., 1e editie, 2004. Kent, Peter. Search engine optimization for dummies. Indianapolis, Indiana: Wiley Publishing, Inc., 2e editie, 2006. Kent, Peter. Search engine optimization for dummies. Indianapolis, Indiana: Wiley Publishing, Inc., 3e editie, 2008. Köhne, Johan. ‘Optimizing a large dynamically generated website for search engine crawling and ranking’. Masterscriptie. Delft University of Technology, 2006: p. 1-102. Bezocht op 8 oktober 2009 . Lorigo, Lori e.a. ‘Eye tracking and online search. Lessons learned and challenges ahead.’ JASIS&T, jrg. 59, nr. 7 (2008): p. 1041–1052. Bezocht op 16 juli 2009 . Marable, Leslie. ‘False oracles. Consumer reaction to learning the truth about how search engines work. Results of an Ethnographic Study.’ Consumer WebWatch, 2003: p. 1-66. Bezocht op 16 juli 2009. . McNichol, Tom. ‘Engineering Google results to make a point.’ The New York Times, 22 januari 2004. Bezocht op 28 mei 2009 . Radman, Zdravko. ‘The ethical mind. An outline.’ Synthesis Philosophica, jrg. 21. nr. 2 (2006): p 385394. Bezocht op 12 mei 2009 . Republiek Mauritius (Indische Oceaan), 2007: p. 717-727. Bezocht op 12 oktober 2009 .
76
Richardson, Mathew, Pedro Domingos. ‘The intelligent surfer. Probabilistic combination of link and content information in PageRank.’ (2002). Bezocht op 12 oktober 2009 . Rogers, Richard. Information Politics on the Web. Cambridge, MA: MIT Press, 2004. Rungsawang, Arnon, Komthorn Puntumapon, Bundit Manaskasemsak. ‘Un-biasing the link farm effect in PageRank computation," 21st International Conference on Advanced Networking and Applications (AINA '07), 2007. Bezocht op 22 april 2009 . Sen, Ravi. ‘Optimal search engine marketing strategy.’ International Journal of Electronic Commerce, jrg. 10, nr. 1, 2005: p. 9-25. Bezocht op 15 april 2009 Simon, Herbert. Designing organizations for an information-rich world (1996). In: Davenport, Thomas H., en John C. Beck. The attention economy. Understanding the new currency of business. Harvard Business School Press, 2001. Spink, Amanda, Bernard J. Jansen. Web Search. Public searching of the web. Information science & knowledge management, vol. 6. Kluwer Academic Publishers, 2004. Svore, Krysta M. e.a. ‘Improving web spam classification using rank-time features.’ In: Third International Workshop on Adversarial Information Retrieval on the Web (AIRWeb ’07). New York, NY, USA: ACM Press, 2007: 9-16. Bezocht op 11 mei 2009 . Van der Vlies, Laura. ‘Googlization. A new form of mass critique.’ Masterscriptie. Amsterdam: Universiteit van Amsterdam, 2008. Bezocht op 27 juni 2009 . Weideman, Melius. ‘Use of ethical SEO methodologies to achieve top rankings in top search engines.’ In: Proceedings of the 2007 Computer Science and IT Education Conference, Wilson, F. Ralph, James B. Pettijohn. ‘Search engine optimisation. A primer on outsourcing key tasks.’ Journal of Direct, Data and Digital Marketing Practice, jrg. 10. nr. 2 (2008): p. 133–149. Bezocht op 5 mei 2009 . Zhang, J., A. Dimitroff. ‘The impact of webpage content characteristics on webpage visibility in search engine results (part I).’ Information Processing and Management: an International Journal, jrg. 41. nr. 3, 2005: p. 665-690. Bezocht op 15 april 2009 .
77
Presentaties & rapporten Blacquière, Eduard. ‘Stand van zaken: zoekmachine marketing in Nederland.’ SES Amsterdam. Grand Hotel Krasnapolsky, Amsterdam, Nederland. Presentatie, 17 maart 2009. Streaming: site bezocht op 16 april 2009 . SEMPO. ‘The state of search engine marketing 2007 Canada.’ SEMPO. Presentatie, maart 2008. Bezocht op 21 april 2009 . SEMPO. ‘The state of search engine marketing 2008.’ SEMPO. Presentatie, februari 2009. Bezocht op 21 april 2009 . Tools Backlink Anchor Analyzer. Online-utility.org. Bezocht op 28 juni 2009 . Domain Outbound Links Check. Witznell.net. Bezocht op 15 juni 2009 . Google Adwords: Keyword Tool. Google.com. Bezocht op 24 juli 2009 . Google Toolbar. Google.com. Bezocht op 16 juni 2009 . Keyword Analysis Tool. Andy Hoskinson, LLC. Bezocht op 12 juni 2009 . Keyword Analysis Tool. Webmaster Toolkit. Bezocht op 12 juni 2009 . Keyword Density Analyzer. goRank.com. Bezocht op 17 juni 2009 . Keyword density and keyword frequency tool. LinkVendor.com. Bezocht op 16 juni 2009 . Keyword Density Tool. SEOBook.com. Bezocht op 17 juni 2009 . Link Diagnosis. Link Diagnosis. Bezocht op 4 september 2009 . SEO for Firefox. SEOBook.com. Bezocht op 16 juni 2009 .
78
SEO Toolbar. SEOBook.com. Bezocht op 16 juni 2009 . Site Link Analyzer. SEOChat.com. Bezocht op 12 juni 2009 . Web Page Analyser. Webmaster Toolkit. Bezocht op 12 juni 2009 . Webmasters tool (SEO): Anchor Text Backlinks Checker. Online-utitity.org. Bezocht op 16 juni 2009 . Websites ‘'Miserable failure' links to Bush.’ BBC News. BBC, 7 december 2003. Bezocht op 20 april 2009 . ‘A framework for thinking ethically.’ Markkula Center for Applied Ethics. Santa Clara University, mei 2009. Bezocht op 13 mei 2009 . ‘Amazon.com: SEO’. Amazon.com. Amazon.com. Bezocht op 23 juni 2009 . ‘Bovenaan bij Google.’ Goed gevonden worden. Goedgevondenworden.nl. Bezocht op 8 juni 2009 . ‘Burst: most users reach websites via search.’ MarketingVOX.com. MarketingVOX, 3 augustus 2005. Bezocht op 23 april 2009 . ‘Google penalties and how to avoid them. SEOchat.com. SEO Chat, 24 mei 2004. Bezocht op 8 mei 2009 . ‘Google search’s golden triangle.’ Eyetools research and reports. Eyetools, Inc., 2005. Bezocht op 16 juli 2009 . ‘Google-friendly sites.’ Google Webmaster Central. Google Inc. Bezocht op 17 april 2009 .
79
‘Guidelines for successful indexing.’ Live Search. Microsoft Corp. Bezocht op 8 mei 2009 . ‘Internet marketing glossary.’ SearchPath. SearchPath. Bezocht op 11 april 2009 . ‘iProspect Blended Search Results Study.’ iProspect. iProspect, 2008. Bezocht op 20 april 2009 <
s.pdf>. ‘iProspect Search Engine User Attitudes.’ iProspect. iProspect, 2004. Bezocht op 20 april 2009 . ‘Kidsfeest!’ Goedbegin.com. GoedBegin. Bezocht op 4 september 2009 . ‘Main Purpose of SEO Services.’ Free online articles directory. Articlesbase.com, 31 mei 2008 Bezocht op 17 april 2009 . ‘Manipulation.’ Wordnet Search - 3.0. Princeton University. Bezocht op 4 mei 2009 . ‘Manipulative.’ Wordnet Search - 3.0. Princeton University. Bezocht op 4 mei 2009 . ‘Most Top Retail Sites Optimized Little or Not at All.’ MarketingVOX.com. MarketingVOX, 12 oktober 2005. Bezocht op 21 april 2009 . ‘Search Engine Optimization (SEO).’ Google Webmaster Central. Google Inc. Bezocht op 17 april 2009 . ‘Search engine optimization definition.’ About.com. About.com. Bezocht op 14 april 2009 . ‘Search engine optimization.’ Wikipedia. The free encyclopedia. The Wikimedia Foundation, 9 april 2009. Bezocht op 23 april 2009 . ‘Search Engine Strategies.’ Search Engine Strategies. Incisive Media Ltd. Bezocht op 23 juni 2009 .
80
‘Search marketing tips: tip 2 van 8.’ QueroMedia. Bezocht op 21 augustus 2009 <www.zoekmachine-marketing-blog.com/downloads/Tip-2-SEO-ZoekmachineOptimalisatie.pdf>. ‘SEO "best practices" standards for optimization technique.’ SeoPros.org. SeoPros, 2008. Bezocht op 7 mei 2009 . ‘Tegenlicht webspecial: alles over zoekmachines’ Tegenlicht. VRPO. 7 mei 2006. Bezocht op 17 september 2009 . ‘Webmaster guidelines.’ Google.com. Google Inc. Bezocht op 6 mei 2009 . ‘Yahoo! Search content quality guidelines.’ Yahoo!. Yahoo! Inc. Bezocht op 8 mei 2009 . ‘Zoekmachine optimalisatie.’ Jeroen.com. Jeroen.com. Bezocht op 27 maart 2009 . Clay, Bruce. ‘Search Engine Optimization Standards and Spam Discussion.’ Bruceclay.com. Bruce Clay, Inc., 2009. Bezocht op 12 mei 2009 . Clay, Bruce. ‘SEO code of ethics, do not harm.’ Bruceclay.com. Bruce Clay, Inc., 2009. 7 mei 2009 . Deiters, Edward. ‘Maak jezelf tot held in Google.’ Dagblad De Pers. DePers.nl. Gepubliceerd: 3 mei 2009, Laatste update: 4 mei 2009. Bezocht op 14 juli 2009 . Fox, Vanessa. ‘Problems getting URLs indexed.’ Google Webmaster Help. Google Inc., 26 november 2006. Bezocht op 3 juni 2009 . Fox, Vanessa. “What’s really black hat anyway?” Nine by blue. 24 augustus 2008. Bezocht op 4 mei 2009 . Google. ‘Technology Overview.’ Google.com. Google Inc. Bezocht op 24 juni 2009 . Hecke, A. van. ‘Secretaresse? Jouw pagina!’ Jouwpagina.nl. Jouwpagina. Bezocht op 14 oktober 2009 < http://secretaresse.jouwpagina.nl/>. Jackson, Mark. ‘Which hat should I wear?’ Search Engine Watch. Searchenginewatch.com, 21 augustus 2007. Bezocht op 23 augustus 2009 .
81
Krishnan, Raj. ‘Improve snippets with a meta description makeover.’ Official Google Webmaster Central Blog. Google Inc., 27 september 2007. Bezocht op 1 september 2009 . Newcomb, Kevin. ‘Retailers' SEO Efforts Found Lacking.’ Search Engine Watch. Searchenginewatch.com. 15 augustus 2007. Bezocht op 21 april 2009 . Onlinewinkelcentrum. begincool.nl. Bezocht op 16 juni 2009 . Perkins, Alan. ‘Ethical search engine optimization explained.’ SilverDisc: Professional Ethical Search Engine Marketing. SilverDisc, 2 oktober 2005. Bezocht op 13 mei 2009 . Rogers, Richard. ‘Vier politieke aspecten van zoekmachines’ Tegenlicht. VPRO. Bezocht op 17 september 2009 . Sherman, Chris. ‘A new F-word for Google search results.’ Search Engine Watch, 8 maart 2005. Bezocht op 17 april 2009. . Sullivan, Danny. ‘Google kills Bush’s miserable failure search & other Google Bombs.’ Search Engine Land, 25 januari 2007. Bezocht op 25 juni 2009 . ‘Verschil tussen SEO en SEA.’ QueroMedia. Bezocht op 16 april 2009 . Carbonell, Robert. ‘Add link reciprocal abstract art.’ Abstract Art Informel by Robert Carbonell . Bezocht op 14 oktober 2009 . ‘SEO directory. Paid inclusion or free listings with reciprocal links.’ RSS Feeds Submission Directory. Rss-feeds-submission.com . Websites onderzoek Hoofdstuk 4 (in volgorde van het onderzoek) Champagneproeverij.nl. Champagneproeverij.nl. Bezocht op 19 oktober 2009 .
82
‘Kadobon bestellen.’ Champagneproeverij.nl. Champagneproeverij.nl. Bezocht op 19 oktober 2009 . OneFish. OneFish. Bezocht op 19 oktober 2009 . Zarzana. Zarzana. Bezocht op 19 oktober 2009 . Van Gogh oil painting reproductions. VanGoghStudio.com. Bezocht op 19 oktober 2009 . Caulils delicatessen Amsterdam. Caulils. Bezocht op 19 oktober 2009 . Octas Finance. Octas. Bezocht op 19 oktober 2009 . ‘Octas Finance – detachering.’ Octas Finance. Octas. Bezocht op 19 oktober 2009 . Fair damesmode Den Bosch. Fair-women.nl. Bezocht op 19 oktober 2009 . ‘Brands.’ Fair damesmode Den Bosch. Fair-women.nl. Bezocht op 19 oktober 2009 . Hollandse Vaartochten Maatschappij. Hollandse Vaartochten Maatschappij. Bezocht op 19 oktober 2009 . Betaalbare bruidsmode Haarlem. Bruidsmode Sandrina. Bezocht op 19 oktober 2009 . Afbeeldingen Magneet Webdesign Zwolle. SEO&SEA. Bezocht op 24 april 2009 . SEMPO. ‘The state of search engine marketing 2007 Canada.’ SEMPO. Presentatie, maart 2008. Bezocht op 21 april 2009 . Sherman, Chris. ‘A new F-word for Google search results.’ Search Engine Watch, 8 maart 2005. Bezocht op 17 april 2009 .
83
Bijlage 1 Veranderingen ‘For Dummies’ serie (Hoofdstuk 3)
84
Bijlage 1: Veranderingen ‘For Dummies’ serie (Hoofdstuk 3) Onderstaande tabel geeft een vergelijking weer tussen drie edities van de volgende boeken: Kent, Peter. Search engine optimization for dummies. Indianapolis, Indiana: Wiley Publishing, Inc., 1e editie, 2004. Kent, Peter. Search engine optimization for dummies. Indianapolis, Indiana: Wiley Publishing, Inc., 2e editie, 2006. Kent, Peter. Search engine optimization for dummies. Indianapolis, Indiana: Wiley Publishing, Inc., 3e editie, 2008. In de linker kolom staat wat er in de loop der jaren is veranderd. Daarnaast staat per kolom wat er is veranderd in die editie. De nummers geven aan om welk paginanummer het gaat. Er staan ook citaten bij. Als een vak leeg is dan betekent het dat citaat of het stuk waarover het gaat niet in die editie staat. Stel dat er in de 2004 editie niets staat, terwijl er in de 2006 editie een citaat staat, dan betekent het dat er in de 2006 editie iets is bijgekomen. In de 2004 editie stond de tekst uit dit citaat er nog niet in. Verandering In 2006 komt de local search erbij
2004 (1e editie) 2:
2006 (2e editie) 2008 (3e editie) 2: Kent wil lokaal zoeken behandelen 2: Hetzelfde als 2006. in het boek. Citaat: “Get search engines to display your site when people search locally.”
Er is een verandering met cijfers. Was het in 2004 nog 50 % van de bezoeken die begonnen via de zoekmachine, in 2008 is het cijfer weggelaten. In 2004 gebruikte waarschijnlijk meer dan 80% een zoekmachine voor productinformatie. In 2006 was dit 67%.
14: Citaat: “At the time of writing, almost 50 percent of site visits begin at the search engines. Sure, it’s not 80 percent, but it’s still a lot of traffic. “Of the over 50 percent of visits that don’t originate at a search engine, a large proportion are revisits — people who know exactly where they want to go.” “Some studies indicate that a large number of buyers begin at the search engine. That is, of all the people who go online planning to buy something or looking for product information while planning a purchase, perhaps over 80 percent start at the search engines.” In de 2004 editie moest MSN.com van de 16: MSN heeft nog geen eigen lijst van belangrijke zoekmachines. Bij index. 2006 en 2008 is dit niet het geval. Dit komt omdat MSN vanaf dan een eigen “At the time of writing, MSN gets index heeft en daardoor belangrijk wordt. results from Inktomi; remove it Ook zijn er bepaalde zoekmachines from the list.” verdwenen terwijl er anderen bij zijn gekomen.
14: Citaat: “The proportion of visits originating at search engines is significant. Not so long ago, one survey put the number at almost 50 percent. Sure, it’s not 80 percent, but it’s still a lot of traffic. “Of the visits that don’t originate at a search engine, a large proportion are revisits – people who know exactly where they want to go.” “Some studies indicate that a large number of buyers begin at the search engines. That is, of all the people who go online planning to buy something or looking for product information, perhaps over 67 percent use a search engine, according to a study in 2005 by iCrossing.”
14: Citaat: “The proportion of visits originating at search engines is still significant. Sure, it’s not 80 percent, but with billions of searches each month, it’s still a lot of traffic.” “Of the visits that don’t originate at a search engine, a large proportion are revisits – people who know exactly where they want to go.”
17: Vanaf hier heeft MSN een eigen index. Citaat: “Ditto; MSN creates its own index, and gets many searches.”
17: Hetzelfde als 2006, maar de naam is veranderd in MSN Live Search. Citaat: “Ditto; MSN Live Search creates its own index, and gets many searches.”
In 2004 worden tips over een competitieve markt niet gegeven. Dit gebeurt vanaf 2006.
24:
Bij 2006 en 2008 werd er een opmerking 26: gemaakt over de alexa tool. Men dacht dat het spyware was. In 2004 werd deze opmerking nog niet gegeven.
54: Er verschijnen extra tips over de competitieve markt. Citaat: “But there’s more. If you’re in a very competitive market, you may want to really push two techniques: _ Create large amounts of content. Make hundreds, perhaps thousands, of pages of content. _ Go after links in a big way. You may need hundreds, perhaps thousands, of links to rank well if your competitors have done the same. 24: “I’ve been criticized for recommending the Alexa toolbar in earlier editions of this book: Some people claim it is spyware”.
54: Hetzelfde als 2006.
26: Hetzelfde als 2006.
Uitleg over competitieve woorden staat alleen bij 2006 en 2008.
26:
Yahoo! verkrijgt in 2004 nog resultaten van Google. MSN wordt vanaf 2006 belangrijker. Het Open Directory Project komt vanaf 2006 Er wordt verwezen naar verschillende systemen om keywords te vinden. Yahoo! is namelijk gestopt met een gratis dienst. De DESCRIPTION tag wordt pas sinds 2007 gebruikt.
43: Hetzelfde als 2006.
30: Yahoo! Geen MSN. Yahoo! heeft resultaten van Google
43: Extra uitleg dat competitieve woorden het moeilijker maken om bovenaan te komen staan. Citaat: “The degree of work required depends on the competitiveness of the keywords you’re going after. Some keywords are incredibly competitive: mortgage, insurance, attorney, real estate, and so on, are highly competitive, with millions of people wanting some of the action. Other phrases are very easy — such as rodent racing, for instance. If you’re in the rodent-‐racing business, you’re in luck because you can probably rank right at the top very easily!” 27: Yahoo! en MSN. Yahoo! heeft eigen index
30:
29:
29:
33: Point your browser to www.overture.com.
32: Point your browser to http://searchmarketing.yahoo.com/ rc/ srch/. 36: de DESCRIPTION tag wordt niet 35: gebruikt. Citaat: “In most cases these days, the major search engines usually don’t Citaat: “Google usually doesn’t use use the DESCRIPTION tag to provide the DESCRIPTION tag to provide the description in the search results.” the description in the search results”
28: Yahoo! en MSN Live Search
32: Point your browser to https://adwords.google.com/select/ KeywordToolExternal. 36: Citaat: “Starting sometime in 2007, though, Google changed this and began working with the DESCRIPTION tag.”
39: Er wordt in de 2004 en 2006 editie verwezen naar keyword tools. Overture en Yahoo! komen niet meer voor in 2008. Yahoo! is gestopt met de gratis service. Er is in de drie versies een verschil met hoe vaak een woord gebruikt mag worden. In de 2008 editie geven ze een minder duidelijke richtlijn. Althans niet meer in getallen.
De sitemap staat alleen in 2008 versie.
39: Overture
38: Yahoo! Search Marketing
38:
40: 5 tot 10% van alle woorden: Citaat: “Use keywords multiple times on a page, but don’t use a keyword or keyword phrase too often. If a word makes up more than, say, 5 to 10 percent of all the words on the page, it may be too much.” 41:
38: 8 tot 10% van alle woorden: Citaat: “Use keywords multiple times on a page, but don’t use a keyword or keyword phrase too often. If a word makes up more than, say, 8 to 10 percent of all the words on the page, it may be too much.”
39: Hier geven ze geen aanwijzing: Citaat: “Use keywords multiple times on a page, but don’t use a keyword or keyword phrase too often. If your page sounds really clumsy through overrepetition, it may be too much.”
40: 41: Hoofdstuk 3 is nieuw.
40: Er wordt aangeraden om een XML sitemap te maken. Dit staat niet in de 2004 en 2006 versie. 41: Hetzelfde als 2006.
59: Remember logo
61: Remember logo
60: Waarschuwingslogo
63: hetzelfde als 2006.
Hoofdstuk 3 wordt ingevoegd vanaf de 2006 editie. Er is een extra waarschuwing dat web designers niet altijd verstand hoeven te hebben van SEO. Verder wordt er extra aandacht gegeven aan competitie. Verandering logo bij het volgende citaat: 46: geen logo “The search engines base your rank, to a great degree, on the number and type of keywords they find in your pages.” Vanaf 2006 verschijnt er een 49: waarschuwingslogo bij het volgende citaat: “If you’re always working with the very latest Web-‐development technology, more of your visitors are likely to run into problems.” Er wordt gewaarschuwd om niet de allernieuwste technieken te gebruiken.
Hier een tip om links bovenaan te plaatsen. Zo kunnen mensen met een langzame verbinding ze zien. Misschien is het in 2008 niet meer nodig vanwege de grote hoeveelheid breedband.
51: Citaat: “One technique that I 63: Hetzelfde als 2004 like is to add simple text links near the top, rather than the bottom, of the page. Users with slow connections see these links quickly, and search engines are sure to find them. (Sometimes, on large and complex Web pages, search engines may miss links at the bottom of the page.)” In 2008 vervalt het tip logo voor de alinea 52: Tip logo 63: Tip logo die met dit citaat begint: “You also have a problem if all the links on your site are on image buttons […]” In 2008 komt er een extra waarschuwing 52 64: Waarschuwingslogo bij voor het steeds herstructureren van de site.
In 2008 komt erbij dat een lelijke site niet 52 verkoopt.
64
De geheime criteria van de zoekmachine zijn weggelaten in 2006 en 2008.
69: Hier is de zin weggelaten
55: Er worden technieken gegeven die in het SEO proces kunnen helpen. Het eindigt met het volgende punt: “. . and hundreds of other criteria, all of which are secret!”
65: Hier is het weg. Op blz. 133 staat er wel iets over.
65: Geen tip logo
66: Het waarschuwingslogo verdwijnt Er verschijnt een extra punt in de lijst: “If you don’t restructure carefully, all the pages you have indexed in the search engines may be lost, so you have to start over from the beginning — it may take weeks or months to get fully reindexed.” 66: Er is bijgekomen dat een lelijke site niet verkoopt.
73: Hier ook.
Yahoo! is gestopt met de gratis keyword tool
Verschil populariteit Wordtracker.
Het aantal zoekopdrachten daalt, dus Wordtracker ontvangt minder zoekopdrachten.
De prijzen van Wordtracker zijn verhoogd.
‘Most’ is veranderd in ‘many’. Dit is een verschil. Minder mensen schijnen er dus gebruik van te maken.
78: Hier komt de mededeling dat de gratis tool is gestopt: “Yahoo! used to provide a neat little keyword tool associated with their PPC (pay per click) service (see Chapter 18). However, this free tool is long gone; Yahoo! stopped providing it some time in 2006.” 62: Er wordt stellig gezegd dat 76: De zin uit 2004 is hetzelfde, maar 81: Hier wordt het minder stellig vrijwel alle SEO professionals wordtracker wordt niet aangeprijsd. gezegd. Het programma wordt ook wordtracker gebruiken. Vervolgens minder duidelijk aangeprijsd. wordt het programma aangeprijsd. “Wordtracker (www.wordtracker.com) Citaat: “Wordtracker is perhaps the most popular keyword (www.wordtracker.com) is the tool tool among SEO professionals.” that virtually all SEO professionals use.” 63: Citaat: “Wordtracker gets the 76: Hier 120 miljoen 81: Hier 100 miljoen zoekopdrachten. information about what people are zoekopdrachten. searching for from Metacrawler.com, Dogpile.com, and others, for a total of over 150 million searches each month.” 64: 78: Iets duurder dan 2004. 82: Een heel stuk duurder dan bij de Citaat: andere versies. De dagprijs staat niet “day (£4.20, around $7.25 Citaat: meer vermeld, dus het is mogelijk dat currently), “Day for £4.20, around $7.32 dit niet meer mogelijk is. the week (£14/$24.15), currently the month (£28/$48.31), Week for £14/$24.39 Citaat: three Month for £28/$48.78 “Week for $30 (124% t.o.v. 2004) months (£69/$119.04), or Year for £140/$243.86” Month for $59 (122% t.o.v. 2004) the year (£140/$241.53).” Year for $329 (136% t.o.v. 2004)” 64: “Most professionals in the 78: “Many professionals in the SEO 83: Hetzelfde als 2006 SEO business have a regular business have a regular account with account with Wordtracker,” Wordtracker,”
Bij de alinea van het volgende citaat verandert het tip logo uit 2004 in een waarschuwingslogo in 2006 en 2008: “Don’t use a domain-‐forwarding service for Web sites you want to turn up in the search engines.” Vanaf 2006 komt de tip of het waard is om ook minder populaire keywords te kiezen.
82: Tip logo
94: Waarschuwingslogo
100: Waarschuwingslogo
84:
In 2006 en 2008 is er een extra alinea waar ook wordt gewaarschuwd voor het overdrijven van het aantal keywords.
86:
97: Tip logo 103: Hetzelfde als 2006. Citaat: “It’s often easy to create pages that rank well for the keywords at the bottom of your list because they’re unusual terms that don’t appear in many Web pages. However, they’re at the bottom of your list because people don’t often search for them! Therefore, you have to decide whether it’s worthwhile to rank well on a search term that’s searched for only once or twice a month.” 98: 105: Zelfde als 2006. Citaat: “You can get hung up on keyword density, and some people use special tools to check the density on every page. This strategy can be very time consuming, especially for large sites. You’re probably better off “eyeballing” the density in most cases. If the phrase for which you’re optimizing appears an awful lot, you’ve overdone it. If the text sounds clumsy because of the repetition, you’ve overdone it.”
Er komt vanaf 2006 een extra punt bij om te onthouden. Algemene titels zijn niet goed voor SEO.
89
Google gebruikt t/m 2007 geen DESCRIPTION tag. Daarna wordt er wel wat mee gedaan.
90: Citaat: “In most cases, Google doesn’t use the text from the DESCRIPTION meta tag in its search results page.” 90:
Bij het stukje ‘overloading description’, waarbij wordt gewaarschuwd voor het overladen van de DESCRIPTION tag, komt er vanaf 2006 een waarschuwingslogo. In 2008 is de opmerking dat je geen 91: penalty krijgt, weggelaten. Het slechte Citaat: “Make sure that most of ervan is dus minder afgezwakt. the keywords in the tag are also in the body text. Inktomi says that keywords in the tag should also appear in the Web page itself. If they don’t, I don’t believe you’ll be penalized, but it probably won’t do you any good either, with that search engine anyway. Many people also use the KEYWORDS tag as a good place to stuff spelling mistakes that are commonly searched.”
100: Remember logo Citaat: “Titles are often generic: Welcome to Acme, Inc., or Acme Inc. – Home Page. Such titles are not beneficial for search engine optimization.” 102: Hetzelfde als 2004
107: Hetzelfde als 2006.
103: Waarschuwingslogo
110: Waarschuwingslogo
103: Citaat: “Make sure that most of the keywords in the tag are also in the body text. If they aren’t, I don’t believe you’ll be penalized, but it probably won’t do you any good either. Many people also use the KEYWORDS tag as a good place to stuff spelling mistakes that are commonly searched.”
111: Citaat: “Make sure that most of the keywords in the tag are also in the body text. If they aren’t, it probably won’t do you any good either. Many people also use the KEYWORDS tag as a good place to stuff spelling mistakes that are commonly searched.”
109: Citaat: “However, Google changed the manner in which it gathers the search-‐ results description text.”
Een paragraaf uit de 2004 versie is verdwenen vanaf 2006.
Er verschijnen vanaf 2006 steeds meer opmerkingen over de ‘nosnippet’ tag. Er wordt gezegd dat het overbodig is en dat het ervoor zorgt dat de pagina verdwijnt uit de Google cash. De opmerkingen stonden niet in de 2004 versie. De opmerking dat Google’s automatische cash systeem de copyright wet overtreedt is alleen aanwezig in de 2004 en 2006 editie. In 2008 is de opmerking verdwenen. Vanaf 2006 komen er tips als Flash wel wordt gebruikt.
91: Citaat: “Some search engines are case sensitive, so it’s probably a good idea to lowercase your keywords. Some people say you should make the first letter of each word uppercase; others say it doesn’t make any difference. (However, I’m really talking about “every tiny bit” counts here. Some of these KEYWORD issues are not going to make a huge amount of difference!)” 92
104:
111:
105: Citaat: “However, it will also remove the page from Google’s cache.”
92: Citaat “(By the way, it seems likely that Google’s automatic caching feature breaks copyright law, though this is an issue that hasn’t been tested yet.)” 95:
105: Zelfde als 2004
112: Citaat: “However, this tag, at least at thetime of writing, may be rather redundant because Google isn’t usually using a snippet (as explained earlier in this chapter); also, this tag has the effect of removing the page from Google’s cache.” 112: Hier is deze opmerking verdwenen.
107: Citaat: “* Make sure to use your <TITLE> tags and DESCRIPTION and KEYWORDS meta tags. * Put text between tags. You can use the text displayed in the Flash within these tags, or if you’re using audio, use a transcription of the text audio.”
135: Hetzelfde als 2006.
Er is een waarschuwingslogo gekomen vanaf 2006 vanaf het volgende citaat: “Putting text into graphics has significant drawbacks.” Er wordt advies gegeven in hoeveel woorden er ongeveer op een pagina kunnen. Het aantal woorden in 2008 is verhoogd.
Er wordt vanaf 2004 een hackmethode uitgelegd.
Het stukje over het paid-‐inclusion program is weg
Vanaf 2006 is er een waarschuwingslogo gekomen bij het stukje waar gewaarschuwd wordt voor cloacking. Dit is een techniek waarbij de zoekmachine een pagina te zien krijgt, terwijl de bezoeker een andere pagina krijgt te zien.
95:
108: Waarschuwingslogo.
135: Waarschuwingslogo.
95: Citaat: “You need text in your page. How much? More than a little, but not too much. Maybe 100 to 250 words are good.” 104:
108: Zelfde als 2004
113: Citaat: “You need text in your page. How much? More than a little, but not too much. Maybe 200 to 400 words is a good range.”
126: Citaat: “You can get pages into search engines by using a paid- inclusion program. (See Chapter 15.) Paid inclusion can be expensive (around $150 per page for several of the top search engines), and Google, the most important search engine, doesn’t offer this service.” 128:
115: 120: Hetzelfde als 2006. Citaat: “In fact, this technique is sometimes used nefariously; I know of one case in which someone hacked into a site and placed the Disallow: / command into the robots.txt file — and Google dropped the site from its index!” 138: vanaf hier is het weg 143
140: Waarschuwingslogo.
145: Waarschuwingslogo.
Bij het stukje over de REFRESH meta tag komt er een waarschuwingslogo bij en een opmerking dat zoekmachines geen penalty uitdelen.
132:
144: Waarschuwingslogo.
In 2004 waren er nog pagina’s met verborgen tekst. Vanaf 2006 wordt er gesteld dat deze pagina’s zeldzaam zijn. Een aantal jaren daarvoor waren er wel veel.
138: Citaat: “For the moment, all the tricks in this chapter do work, at least in some circumstances for some search engines. This may be a little surprising, considering that some of these tricks are very crude and have been known to the search engines for a long time. You’ll still find crudely keyword- stuffed pages and pages with hidden text sometimes ranking well in the search engines. Some of this search engine spam does filter through. But most major search engines are much better at recognizing the tricks and eliminating those pages.” 139:
150: Citaat: “Tricks do work, at least in some circumstances for some search engines. Even some tricks that are very crude and have been known to search engines for a long time still work. On the other hand, over time, search engines get better and better at dropping the more obvious tricks; you don’t find crudely keyword-stuffed pages and pages with hidden text ranking well very often these days, for instance, though only a couple of years ago you did.”
Er is sinds 2006 een opmerking bij gekomen. In 2006 is zijn indruk dat het herhalen van keywords minder goed werkt en in 2008 stelt hij dat het zo is.
151: Citaat: “My impression is that this sort of trick is working less frequently than it used to just a couple of years ago, and sites doing this are also becoming less abundant.”
148: Waarschuwingslogo. De volgende zin is toegevoegd: Citaat: “Don’t listen to the nonsense that you’ll hear about your site being penalized for using refresh pages: Search engines don’t index the page, but they don’t go so far as to penalize your entire site.” 154: Hetzelfde als 2006.
155: Citaat: “This sort of trick is working less frequently than it used to just a couple of years ago, and sites doing this are also becoming less abundant.”
In 2008 verschijnt er een extra 139: opmerking tussen haakjes: dat zoekmachines geen hiding content willen. Er is in 2008 een extra waarschuwing bijgekomen bij een paragraaf over verborgen tekst. Het wordt afgeraden om het te doen.
141:
NOSCRIPT tag wordt in 2006 in een aparte alinea behandeld en in 2008 bijgevoegd bij de andere technieken. In 2004 was de NOSCRIPT tag er nog niet.
141:
152:
156: Citaat: “(Remember that search engines don’t want you to show them content that isn’t also visible to the site visitor.)” 152: 157: Citaat: “I still see this trick employed now and then; just last week, when reviewing a client’s site, I discovered a long link pointing back to my client’s Web designer’s site, hidden by making the text match the background color. My opinion of this crude trick goes like this: _ It probably doesn’t help. I doubt whether it helps anything any more. _ It might not hurt. You still find pages using this trick, so I suspect that in most cases, the search engines ignore it and it doesn’t help or hurt. _ . . . but it might. Search engines might in some cases drop a page that has hidden text. _ So why do it? It doesn’t help, but it might hurt, so don’t do it!” 153: NOSCRIPT tag wordt apart 157: noscript komt bij de andere behandeld, aangezien het meer effect technieken te staan. heeft. Citaat: “Placing text inside Citaat: “This is another way to hide