UNIVERSITEIT GENT
FACULTEIT ECONOMIE EN BEDRIJFSKUNDE ACADEMIEJAAR 2014 – 2015
SEARCH ENGINE OPTIMIZATION: EEN EVALUATIESTUDIE NAAR DE BASISTECHNIEKEN Masterproef voorgedragen tot het bekomen van de graad van
Master of Science in de Handelswetenschappen
Xavier Desmet onder leiding van Prof. Amy Van Looy
UNIVERSITEIT GENT
FACULTEIT ECONOMIE EN BEDRIJFSKUNDE ACADEMIEJAAR 2014 – 2015
SEARCH ENGINE OPTIMIZATION: EEN EVALUATIESTUDIE NAAR DE BASISTECHNIEKEN Masterproef voorgedragen tot het bekomen van de graad van
Master of Science in de Handelswetenschappen
Xavier Desmet onder leiding van Prof. Amy Van Looy
I. Vertrouwelijkheidsclausule PERMISSION Ondergetekende verklaart dat de inhoud van deze masterproef mag geraadpleegd en/of gereproduceerd worden, mits bronvermelding.
Naam student: Xavier Desmet
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina V
II. Woord Vooraf Met deze masterproef sluit ik mijn vierjarige academische opleiding Handelswetenschappen af aan de Universiteit Gent. De inspiratie en motivatie voor het onderwerp van deze studie haalde ik uit de lessen ‘Waarde creëren via sociale media’ van professor Amy Van Looy, eveneens de promotor van mijn masterproef. Tijdens haar lessen kwam zoekmachineoptimalisatie kort aan bod maar wekte meteen mijn interesse. Ik ben dan ook verheugd dat ik me op dit onderwerp kon toeleggen voor mijn masterproef.
Aangezien deze masterproef niet tot stand zou gekomen zijn zonder de hulp van enkele mensen wil ik hen hier eerst voor bedanken.
Een eerste dankwoord gaat uiteraard naar mijn promotor, Professor Amy Van Looy, voor haar sturing, uitvoerige feedback, kritiek en suggesties. Ze heeft mij de mogelijkheid gegeven om dit boeiende onderwerp te behandelen en dankzij haar begeleiding kon ik deze thesis tot een goed einde brengen.
Daarnaast bedank ik ook van harte Sofie Golaszewski en Philippe Desmet voor het nalezen van dit werk. Tot slot bedank ik ook mijn ouders en mijn vriendin voor hun niet aflatende aanmoediging, oprechte steun en eindeloze begrip.
11 augustus 2015, Xavier Desmet
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina VI
Inhoudsopgave I.
Vertrouwelijkheidsclausule .............................................................................................................. V
II.
Woord Vooraf ................................................................................................................................. VI
III.
Lijst gebruikte afkortingen ......................................................................................................... IX
IV.
Lijst van de figuren en tabellen ................................................................................................... X
Inleiding ................................................................................................................................................... 1 Deel 1: literatuurstudie ........................................................................................................................... 4 1.1
Onderdelen van een zoekmachine .......................................................................................... 4
1.1.1
Interface .............................................................................................................................. 4
1.1.2
Zoekopdracht of Query ....................................................................................................... 4
1.1.3
Crawler of Spider ................................................................................................................. 5
1.1.4
Index database .................................................................................................................... 5
1.2
Waarom Google ...................................................................................................................... 7
1.3
SEO-Technieken ....................................................................................................................... 8
1.3.1
On-page optimalisatie ......................................................................................................... 9
1.3.2
Off-page optimalisatie ....................................................................................................... 14
1.4
Overzicht bestaande studies ................................................................................................. 15
Deel 2: methodologie ............................................................................................................................ 17 2.1
Probleemstelling.................................................................................................................... 17
2.2
Wetenschappelijke- en maatschappelijke relevantie, onderzoeksvraag .............................. 18
2.3
Werkwijze .............................................................................................................................. 19
Deel 3: empirische studie ...................................................................................................................... 21 3.1
Beschrijving variabele ‘ranking’ ............................................................................................. 21
3.2
Analyse .................................................................................................................................. 22
3.2.1
Titels en URL’s ................................................................................................................... 23
a.
Titels ...................................................................................................................................... 26
b.
URL’s ...................................................................................................................................... 28
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina VII
3.2.2
Keywords ........................................................................................................................... 30
3.2.3
Links ................................................................................................................................... 33
3.2.4
Controlevariabelen ............................................................................................................ 36
3.2.5
Alle categorieën samen ..................................................................................................... 39
3.3
Conclusie van de analyse ....................................................................................................... 44
Deel 4: besluit ........................................................................................................................................ 46 Referenties ............................................................................................................................................... I Bijlagen .................................................................................................................................................... 1 1.
Onderzochte variabelen .............................................................................................................. 1
2.
Analyses ....................................................................................................................................... 5 2.1
Titels en URL’s ..................................................................................................................... 5
a.
Titels ...................................................................................................................................... 10
b.
URL’s ...................................................................................................................................... 14
2.2
Keywords ........................................................................................................................... 19
2.3
Links ................................................................................................................................... 27
2.4
Controlevariabelen ............................................................................................................ 36
2.5
Volledige model ................................................................................................................. 48
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina VIII
III. Lijst gebruikte afkortingen HTML: HyperText Markup Language HTTP: Hypertext Transfer Protocol kB:
kilobyte
s:
Standaardafwijking
SEA:
Search Engine Advertising
SEO:
Search Engine Optimization
URL:
Uniform Resource Locator
VIF:
de variance inflation factor
ZM:
zoekmachines
ZRG:
zoekresultaten van Google
ZRZM: zoekresultaten van een zoekmachine
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina IX
IV. Lijst van de figuren en tabellen Figuur 1. SEO vs. SEA ............................................................................................................................... 1 Figuur 2. Interface zoekmachine Google................................................................................................. 4 Figuur 3. Marktaandeel Google ............................................................................................................... 7 Figuur 4. Hyperlinks Wikipedia .............................................................................................................. 12
Tabel 1. Overzicht Literatuur met hun resultaten ................................................................................. 15 Tabel 2. Analyse variabele ranking ........................................................................................................ 21 Tabel 3. Intervallen van de ranking ....................................................................................................... 21 Tabel 4. Samenvatting model Titels en URL's ....................................................................................... 23 Tabel 5. Coëfficiënten van de variabelen bij de categorieën Titels en URL's ........................................ 24 Tabel 6. Samenvatting model Titels ...................................................................................................... 26 Tabel 7. Coëfficiënten van de variabelen bij de categorie Titels........................................................... 27 Tabel 8. Samenvatting model URL's ...................................................................................................... 28 Tabel 9. Coëfficiënten van de variabelen bij de categorie URL's .......................................................... 29 Tabel 10. Samenvatting modellen Keywords ........................................................................................ 30 Tabel 11. Coëfficiënten van de variabelen bij de categorie Keywords ................................................. 31 Tabel 12. Coëfficiënten van de variabelen met multicollineariteitsprobleem bij de categorie Links ... 33 Tabel 13. Samenvatting modellen Links ................................................................................................ 34 Tabel 14. Coëfficiënten van de variabelen bij de categorie Links ......................................................... 35 Tabel 15. Coëfficiënten van de variabelen met multicollineariteitsprobleem bij de categorie Controlevariabelen ................................................................................................................................ 36 Tabel 16. Samenvatting modellen Controlevariabelen ......................................................................... 36 Tabel 17. Coëfficiënten van de variabelen bij de categorie Controlevariabelen .................................. 37 Tabel 18. Samenvatting modellen onderdelen categorie Controlevariabelen ..................................... 38 Tabel 19. Samenvatting model alle categorieën ................................................................................... 39 Tabel 20. Samenvatting model alle categorieën zonder multicollineariteitsprobleem ........................ 40 Tabel 21. Coëfficiënten van de variabelen bij het Globale Model ........................................................ 42 Tabel 22. Samenvatting alle modellen .................................................................................................. 44 Tabel 23. Overzicht alle significante parameters in modellen .............................................................. 45
Bijlagen: Tabel 24. Variabelen regressiemodel ...................................................................................................... 1
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina X
Inleiding Door het grote aantal webpagina’s zijn zoekmachines (ZM) alomtegenwoordig om een wegwijs te bieden in het web. Ze maken het mogelijk om aan de hand van zoekopdrachten of query’s te navigeren door relevante informatie uit de massale collectie van webpagina’s. Dagelijks ontvangen zoekmachines meer dan vijf miljard zoekacties (Statistic Brain Research Institute, 2015), die worden weergegeven in een kwestie van seconden (Spink & Jansen, 2006). Daarnaast beginnen 93% van de online activiteiten met een ZM (College Of Marketing, 2014). Dit maakt van ZM’s een cruciale schakel in het verbinden van inhoud en gebruikers (Baye, De los Santos, & Wildenbeest, 2013)
Verschillende onderzoeken (Enge, Spencer, Stricchiola, & Fishkin, 2012) tonen aan dat de positie van een website in de zoekresultaten van een zoekmachine (verder als ZRZM) een enorme impact heeft op het aantal bezoekers dat deze website zal ontvangen. Zo ontvangen de eerste tien zoekresultaten 90% van alle doorklik verkeer. De volgende tien resultaten, meestal gerangschikt op de tweede pagina, ontvangen nog 4,38% (Enge et al., 2012). De nummer één van de organische zoekresultaten ontvangt de meeste klikactiviteit, namelijk 33% (Mediative, 2014).
Het staat buiten kijf dat zo hoog mogelijk in de ZRZM staan belangrijk is. Zoekmachine marketing helpt daartoe en bestaat zowel uit Search Engine Optimization als uit Search Engine Advertising (Kai Li, Mei Lin, Zhangxi Lin, & Bo Xing, 2014). Figuur 1. SEO vs. SEA (2015). Copyright 2015 Google. Overgenomen van https://www.google.be/search?q=search+engine+optimization
Masterproef
Xavier Desmet
Pagina 1/48
Aan de hand van Search Engine Optimization (SEO) of zoekmachineoptimalisatie is het mogelijk om op een organische, niet betalende manier, een zoekmachine-vriendelijke website te ontwerpen. Dit in tegenstelling tot Search Engine Advertising (SEA). SEA zijn betaalde zoekadvertenties die zich in ZRZM helemaal bovenaan en/of naast de organische zoekresultaten bevinden (zie Figuur 1). Dit is de voornaamste inkomstenbron van zoekmachines (Enge et al., 2012). Bedrijven kunnen deze advertentie-plaats kopen aan de hand van verschillende betalingswijzen. Bij Pay Per Click bijvoorbeeld betalen ondernemingen per klik op de advertentie, terwijl er bij Pay Per Conversion wordt betaald per aankoop op de website van de onderneming (Ramos & Cota, 2008).
Volgens een studie uitgevoerd door de National Retail Federation (2014) was zoekmachine marketing voor 85% van de online winkels in 2014 de meest efficiënte manier in het aantrekken van nieuwe klanten. Het grootste deel (94%) van het verkeer die ZM’s ontvangen verloopt via de organische zoekresultaten (Goodwin, 2012). Om deze reden houden adverteerders zich vooral bezig met zoekmachineoptimalisatie in plaats van met de aankoop van gesponsorde links (Baye et al., 2013). In het vervolg van deze masterproef wordt SEA niet meer behandeld.
SEO kan worden omschreven als “een cluster van strategieën en technieken die worden gebruikt om het aantal bezoekers van een website te verhogen, door het verkrijgen van een hoge ranking plaats in de zoekresultaten van een zoekmachine (ZRZM) “. Het hoofddoel van SEO is bijgevolg het verhogen van het aantal bezoekers naar een website en deze om te vormen tot potentiële klanten (Parikh & Deshmukh, 2013, p. 3146). Elk jaar evolueert SEO naar een meer geavanceerde dicipline. Zoals marketeers hun vaardigheden verfijnen, verbeteren zoekmachines hun zoekmechanismen. Verschillende sectoren merken de impact die organische zoekresultaten kunnen hebben op hun groei. Zoekmachineoptimalisatie is dan ook uitgegroeid tot een erkend strategisch gebied in marketing (Yu, 2015).
Hoewel zoekmachines steeds geavanceerder worden, kunnen ze nog steeds een webpagina niet op dezelfde manier zien en begrijpen als een mens. SEO helpt ZM’s om erachter te komen waarover elke pagina gaat en hoe het gemakkelijk gebruikt kan worden voor gebruikers. Zoekmachines zijn bovendien niet in staat om zelf populaire inhoud te produceren, maar wel om deze te promoten. Bijgevolg zullen SEO-strategieën altijd effectief zijn, aangezien deze technieken de factoren erkennen die ZM’s gebruiken als rankingsmechanisme en ze zoveel mogelijk gaan benutten (Mavridis & Symeonidis, 2014). Het vinden van manieren om de ranking positie bij ZM’s te verhogen is een belangrijk doel voor alle websites die belang hechten aan het lokken van nieuwe klanten (Su, Hu, Kuzmanovic, & Koh, 2014).
Masterproef
Xavier Desmet
Pagina 2/48
Deze masterproef zal drie basis SEO-technieken vergelijken en evalueren aan de hand van de zoekmachine Google.
Na deze inleiding zal eerst de bestaande literatuur besproken worden, bestaande uit volgende componenten: onderdelen van een zoekmachine, toelichting bij de keuze voor Google, de verschillende basis SEO-technieken en tot slot een overzicht van belangrijkste technieken volgens bestaande studies. In het tweede deel wordt de methodologie uitgediept die aangewend wordt om een antwoord te formuleren op de onderzoeksvraag van deze masterproef: “Welke SEObasistechniek heeft het meeste effect op de ranking van een website in de zoekresultaten van Google?” inclusief de probleemstelling, werkwijze, wetenschappelijke- en maatschappelijke relevantie. In het derde deel van deze studie wordt de uitgevoerde empirische studie in detail uitgeschreven met bijhorende resultaten en conclusies. Tot slot wordt er in het vierde deel tot een besluit gekomen en wordt er meegedeeld waar verder onderzoek is aangewezen.
Masterproef
Xavier Desmet
Pagina 3/48
Deel 1: literatuurstudie Alvorens de literatuur kan besproken worden, dienen eerst de verschillende componenten van zoekmachines (ZM) in detail uitgediept te worden.
1.1 Onderdelen van een zoekmachine 1.1.1 Interface De interface met hierop webpagina's als zoekresultaten is het enige onderdeel van een ZM die de gebruiker ziet (Ledford, 2009). Het is de webpagina waar de gebruiker de zoekopdracht kan formuleren, terwijl de index van de database hierachter actief is (Meghabghab & Kandel, 2008). Zie voorbeeldfoto hieronder.
Search Engine
Figuur 2. Interface zoekmachine Google (2015). Copyright 2015 van Google. Overgenomen van https://www.google.be/
1.1.2 Zoekopdracht of Query Een zoekopdracht is een verzoek tot informatie gemaakt met behulp van een zoekmachine. Telkens wanneer een gebruiker een reeks tekens typt in de interface van een ZM en vervolgens op zoeken klikt, wordt een zoekopdracht gemaakt en uitgevoerd. Deze reeks tekens, vaak één of meerdere woorden, werken als trefwoorden die de ZM gebruikt om resultaten weer te geven die overeenkomen met de query (Techopedia, 2015). De resultaten worden bijgevolg weergegeven in de ZRZM in volgorde van relevantie (zie later). Figuur 2 geeft een voorbeeld van een zoekopdracht, namelijk ‘Search Engine’.
Masterproef
Xavier Desmet
Pagina 4/48
1.1.3 Crawler of Spider Een crawler of spider is een softwareprogramma dat de ruwe HyperText Markup Language (HTML, de pagina bron en onderliggende code) van miljarden webpagina’s analyseert (Search Engine Land, 2015). Naast de inhoud analyseert de crawler tevens http (Hypertext Transfer Protocol)-koppen die onzichtbaar zijn op de pagina zelf en de manier waarop de pagina’s aan elkaar gelinkt zijn (Enge et al., 2012, p. 38).
1.1.4 Index database Informatie en data verzameld door de crawler wordt in een index database opgeslagen om later aan te wenden als reactie op de zoekopdracht van een gebruiker (Ledford, 2009, p. 9). Bij het uitvoeren van query’s verzamelt de zoekmachine informatie betreffende de ingevoerde zoektermen (Meghabghab & Kandel, 2008).
PageRank (Google) PageRank is een algoritme dat gebruikt wordt door de zoekmachine Google om een numeriek gewicht toe te kennen aan URL’s van webdocumenten. Dit algoritme wordt continu aangepast en verbeterd (Parikh & Deshmukh, 2013). Op basis van het gewicht worden webpagina’s gerangschikt naar relevantie van de zoekopdracht. Meer dan honderd factoren bepalen de relevantie van een webpagina (Moz, 2015), waarvan de belangrijkste besproken zullen worden in deel 1.3 ‘SEOTechnieken’.
De positie van een webpagina in de ZRZM is een combinatie van enerzijds de relevantie op de zoekterm en anderzijds de populariteit van de website (Baye et al., 2013). Op deze manier proberen zoekmachines de evolutie van het web de afgelopen tien jaar in rekening te brengen en gebruikers een verbeterde kwaliteitsinhoud te bieden. ZM’s zijn dan ook onderhevig aan constante veranderingen om de ranking strategiën up-to-date te houden (Mavridis & Symeonidis, 2014).
Tot voor kort waren deze factoren machinegerelateerd, d.w.z. metrieken berekend door machines, niet door gebruikers. Onlangs hebben belangrijke zoekmachines geprobeerd de kwaliteit van de inhoud voor gebruikers als belangrijk kenmerk voor website evaluatie te promoten (Mavridis & Symeonidis, 2014). Zo begon Google met het gebruik van menselijke beoordelaars om handmatig duizenden websites een cijfer te geven, op zoek naar (lage) kwaliteit van de inhoud. Hierna bootste Google de menselijke beoordelaars na aan de hand van machine learning. Zodra computers de inhoud nauwkeurig konden voorspellen, werd het algoritme geïntroduceerd (Fishkin, 2015, Hfdst. 6).
Masterproef
Xavier Desmet
Pagina 5/48
Hits Hits ten slotte, is het aantal keer dat de index overeenkomt met de criteria in de zoekopdracht (Ramos & Cota, 2008). Met andere woorden, het aantal zoekresultaten van de zoekmachine. Op het voorbeeld in figuur 1 zijn 76.700.000 hits of zoekresultaten.
Masterproef
Xavier Desmet
Pagina 6/48
1.2 Waarom Google De keuze voor de zoekmachine Google is niet lukraak gekozen. Google is namelijk wereldwijd marktleider in het gebied van zoekmachines met een marktaandeel van 88% voor de maand januari 2015, zie figuur 3. Dit percentage houdt rekening met alle platformen (desktop, mobiel, tablet en console). 4,53 procent van de wereldwijde internet gebruikers zocht daarnaast met de online zoekmachine Bing en 4,13% met Yahoo. Baidu, een Chinese zoekmachine, heeft een marktaandeel van 0,61 procent. 2,63% van de gebruikers zochten met nog een andere zoekmachine (Statista, 2015). Figuur 3. Marktaandeel Google. Bron Statista (2015)
Wereldwijd marktaandeel Jan '15 4,53% 4,13%
0,61%
2,63%
Google Yahoo Bing 88,10%
Baidu Other
Er bestaan dus diverse zoekmachines, maar enkel Google is echt doorgebroken bij de internetgebruikers. De keuze voor deze ZM is bijgevolg logisch. Door beperkte middelen en tijd van deze masterproef en door het grote marktaandeel van Google, worden verdere analyses m.b.t. ZM’s beperkt tot de zoekmachine Google. Toch zijn de analyses meer generiek en kunnen ze ook van toepassing zijn op de andere ZM’s.
Masterproef
Xavier Desmet
Pagina 7/48
1.3 SEO-Technieken Door middel van analyses, experimenten en tests zijn onderzoekers erin geslaagd om basishandelingen van ZM’s en kritische componenten bij het maken van websites met een hoge ranking bloot te leggen (Moz, 2015).
SEO is geen eenmalige gebeurtenis, maar een continu proces dat ondernomen dient te worden om ervoor te zorgen dat een website geoptimaliseerd blijft (Ahuja, 2013). Om een website zo hoog mogelijk in de organische zoekresultaten terecht te laten komen, zijn er fundamentele richtlijnen die gevolgd moeten worden (Peris-Ortiz, Gil-Pechuán, Palacios-Marqués, Vendrell, & Ferri-Ramirez, 2013). Hierbij dient vermeld te worden dat optimaliseringen in de eerste plaats gebaseerd moeten zijn op wat het beste is voor de bezoekers van de website. Door té hard te focussen op specifieke aanpassingen om een hogere ranking te verkrijgen in de ZRZM, kan het gewenste resultaat niet altijd verwezenlijkt worden (Baye et al., 2013). Het is dus zaak om een goed evenwicht te vinden.
Vooreerst bestaan er ‘white hat’ en ‘black hat’ technieken. Terwijl white hat-technieken door ZM’s zelf worden gepromoot, gaan black hat-technieken in tegen de zichtlijnen van ZM’s. Deze laatste zijn technieken die leiden tot een hogere ranking in de ZRZM, zonder dat de inhoud van de website dit rechtvaardigt (Moreno & Martinez, 2013). Door black hat-technieken te gebruiken kan een website bestraft of zelfs verwijderd worden uit de index van een ZM (Enge et al., 2012). Hiermee rekening houdend, zullen in deze masterproef enkel white hat technieken besproken worden.
Verschillende studies (Ahuja, 2013; Enge et al., 2012; Ledford, 2009; Moreno & Martinez, 2013; Moz, 2015; Parikh & Deshmukh, 2013; Peris-Ortiz et al., 2013; Search Engine Land, 2015) zijn het eens over twee basiselementen voor het toepassen van SEO: on-page optimalisatie en off-page optimalisatie.
Masterproef
Xavier Desmet
Pagina 8/48
1.3.1 On-page optimalisatie Ranking factoren op de pagina zelf (On-Page) vallen volledig binnen de controle van de websiteeigenaar (Search Engine Land, 2015).
Zoektermen of keywords Een goede ranking in de ZRZM voor een bepaalde query wordt bekomen door de juiste zoektermen of keywords te gebruiken. Er wordt geadviseerd om niet meer dan drie keywords te kiezen waarvoor de website wenst gevonden te worden (Ledford, 2009, p. 47). De beste keywords zijn diegene die de meeste conversies met zich meebrengen (Ramos & Cota, 2008). De gekozen keywords dienen bijgevolg gebruikt te worden in de inhoud van de website. Het te veel gebruiken van dezelfde keywords heeft een negatieve impact op de ranking van de webpagina. Ledford (2009) adviseert om een bepaald keyword maximaal vijf à zeven keer te gebruiken op een bepaalde pagina. Pelser (2013) heeft het echter over een maximumpercentage van 5% t.o.v. het totaal aantal woorden op een pagina (exclusief stopwoorden). Dit zijn algemene woorden zoals ‘van’ of ‘in’ die van weinig waarde zijn en die ZM’s dan ook niet gebruiken voor hun analyses (Cambridge University Press, 2008). Indien er bijvoorbeeld 100 zoektermen op één pagina staan, dan mag het gekozen kernwoord maximaal vijf keer gebruikt worden volgens Pelser (2013).
Kwaliteit van de inhoud De inhoud van een website is een erg belangrijk element om een SEO-vriendelijke website te bouwen. Zoekmachines hechten hier enorm veel belang aan en meten dit op verschillende manieren. Zo worden spellings- en grammaticale fouten gezien als een teken van slechte kwaliteit van de webpagina (Enge et al., 2012). Het creëren van een kwalitatief hoogstaande inhoud is een zware taak en eist veel inspanningen en tijd, maar uiteindelijk is de beloning enorm. Originaliteit en uniciteit van webpagina’s effenen de weg tot succes in de online wereld (Ahuja, 2013). Tevens speelt de leeftijd van een webpagina een rol. Zo hebben oudere pagina’s een klein positief effect op de ranking. Dit aangezien Google aan deze pagina’s een grotere mate van vertrouwen hecht (Cutts, 2010). Ramos en Cota (2008) adviseren dan weer om zoveel mogelijk deskundige informatie te bieden aan bezoekers van een webpagina. De pagina moet volledig beantwoorden aan wat de bezoekers willen weten.
Zoekmachines kunnen ook de leesbaarheid van een webpagina analyseren. Een populaire manier om dit na te gaan, is de Flesch-Kincaid leesbaarheidsformule. Deze neemt zaken zoals de gemiddelde lengte van een woord en het aantal woorden in een zin in beschouwing om het opleidingsniveau te bepalen dat nodig is om een tekst te begrijpen. Indien er bijvoorbeeld speelgoed voor kinderen
Masterproef
Xavier Desmet
Pagina 9/48
verkocht wordt op een webpagina, maar het leesbaarheidsniveau suggereert dat een masterniveau nodig is om de pagina te lezen, is dit een indicator van slechte kwaliteit (Enge et al., 2012, p. 49).
Een andere methode die zoekmachines gebruiken om te kwaliteit van een webpagina te beoordelen, bestaat erin de betrokkenheid van gebruikers te meten. Bijvoorbeeld als een grote hoeveelheid bezoekers van een website meteen na het klikken op het resultaat van de ZRZM terugkeren naar de ZM, is dat een indicator van een slechte kwaleit (Enge et al., 2012). Als bedrijven zich willen onderscheiden van miljoenen andere websites, moet het proberen om een stap verder te gaan en zaken anders aan te pakken. Peris-Ortiz et al. (2013) adviseren om niet te denken over wat zoekmachines willen dat het bedrijf moet doen met zijn website, maar over wat het kan doen om het gemakkelijker te maken voor gebruikers. Dit impliceert het navigeren, informatie verzamelen, winkelen en interageren met de website.
Titels (zelfs indien niet zichtbaar) Titels en ondertitels worden steeds belangrijker en dienen erg zorgvuldig gekozen te worden. HTMLtitels zijn het belangrijkste element dat zoekmachines gebruiken om te begrijpen waarover een pagina gaat (Search Engine Land, 2015). Titels samen met zoektermen dienen bijgevolg te weerspiegelen waarvoor de pagina gevonden wil worden in de zoekresultaten.
Volgens studies in 2005 kijken mensen vooral in de linker bovenhoek van de ZRZM en gebeurt het lezen horizontaal (Hotchkiss, Alston, & Edwards, 2005). Later, in 2014, vinden studies dat de top organische resultaten zich niet altijd meer in de linkerbovenhoek bevinden en dat men verticaal leest, mede door de opkomst van de mobiele apparaten. Mensen lezen nu meer zoekresultaten en besteden minder tijd aan het bekijken van elk resultaat (Mediative, 2014).
Aan de hand van meta tags, kleine stukken HTML-code in het hoofdlabel van de webpagina, kan er controle verkregen worden over hoe zoekmachine-crawlers zich gedragen op websites. Door het gebruik van deze labels kan er zelf gekozen worden wat verschijnt in de ZRZM van de desbetreffende webpagina (Ledford, 2009, p. 302). Meta tags bestaan uit de titel- , omschrijving- en keywordtags (Ramos & Cota, 2008). ZM’s geven enkel de eerste 65-75 tekens van een titel tag in de zoekresultaten weer. Het dient derhalve een nauwkeurige, beknopte beschrijving van de inhoud van een webpagina te zijn. Daarnaast raadt Moz (2015) tevens aan om belangrijke zoektermen op te nemen aan het begin van titel tags. Indien geen meta-omschrijving tag toegevoegd wordt, kiezen ZM’s zelf de relevante tekst van de desbetreffende pagina. Bij websites die zich richten op drie of meer trefwoorden is het verstandiger om ZM’s zelf de relevante tekst van de pagina’s te laten halen. De Masterproef
Xavier Desmet
Pagina 10/48
reden hiervoor is simpel, ZM’s extraheren namelijk altijd de trefwoorden met de omliggende zinnen van de query (Moz, 2014a).
Keywordtags werden jaren geleden gebruikt door marketeers om meer paginaweergaves te verkrijgen door zoektermen toe te voegen die niets met hun pagina te maken hebben. Daarom besloot Google om deze tool te devalueren en zijn ze tegenwoordig van geen belang meer (WordStream, 2014). Tot slot zijn verborgen keywords niet zichtbaar voor gebruikers, maar wel voor crawlers en helpt het hen om webpagina’s te vinden (Parikh & Deshmukh, 2013).
URL’s Uniform Resource Locators, afgekort URL’s, vormen samen met de titels van een pagina (zie supra) de fundamenten van een site, het is dan ook essentieel dat deze consistent blijven en zoekmachine vriendelijk zijn doorheen een website (8 Ways Media, 2015).
Er zijn betreffende URL’s een aantal richtlijnen. Zo heeft Marketing Sherpa gevonden dat er op korte URL’s twee keer meer geklikt wordt dan op lange URL’s, gegeven dat de ranking in de ZRZM gelijk is. Het is dus aangewezen om zo weinig mogelijk parameters op te nemen in een URL (Spencer, 2008). Search Engine Land (2015) raadt ook aan om de zoektermen, waarvoor een site gevonden wil worden, op te nemen in de URL. Het gebruik van hoofdletters aan het begin van elk woord, maakt het gemakkelijker om te lezen (Ramos & Cota, 2008).
Koppeltekens worden gezien als het beste scheidingsteken voor woorden in een URL, desondanks liggende streepjes in de laatste jaren aan een opgang bezig zijn (Spencer, 2008). Tot slot mogen URL’s geen onnodige cijfers, letters en woorden bevatten die de pagina niet op gepaste wijze voorstelt. Dit is eenvoudig toe te passen en laat de lezer precies weten waarover de pagina gaat (8 Ways Media, 2015).
Hyperlinks Een ander element om een SEO-vriendelijke website te bouwen is het gebruik van hyperlinks. Dit impliceert woorden op de pagina te laten linken naar een ander gedeelte of andere pagina’s op dezelfde site (Gecko Gully, 2014). Het is dus een navigatie-element of een referentie naar een ander deel van hetzelfde of een verschillend document binnen dezelfde website. Het brengt de bedoelde informatie automatisch naar de gebruiker wanneer de hyperlink geselecteerd wordt (Parikh &
Masterproef
Xavier Desmet
Pagina 11/48
Deshmukh, 2013). Dit principe wordt bijvoorbeeld door Wikipedia erg consistent gebruikt, aangegeven door onderlijnde woorden op onderstaande voorbeeld.
Figuur 4. Hyperlinks Wikipedia (2015). Copyright 2015 van Wikipedia. Overgenomen van https://nl.wikipedia.org/wiki/Zoekmachineoptimalisatie
Laadsnelheid website Ook de laadsnelheid van een website is een belangrijk element van on-page optimalisatie. In het algemeen hebben pagina’s die traag laden namelijk meer last van een lage betrokkenheid van gebruikers. Dit duidt op een hoger percentage bezoekers die de webpagina onmiddelijk verlaten en een lage gemiddelde tijd die gebruikers doormaken op desbetreffende webpagina (Siotos, 2013). De laadtijd van een webpagina speelt een cruciale rol in het gedrag en de beleving van een bezoeker (Skadberg & Kimmel, 2004). Daarnaast heeft de laadsnelheid een direct effect op de ranking van een website in de ZRZM. Laadsnelheid van een pagina is één van de 200 rankingmechanismes die Google gebruikt om de ranking te bepalen (Costill, 2014).
Crawler-vriendelijke website De laatste belangrijke ranking factoren op de pagina zelf, zijn enerzijds het beperken en het vereenvoudigen van het analyseren van webpagina’s en anderzijds het verhogen van de leesbaarheid voor crawlers of spiders (zie 1.1 ‘Onderdelen van een zoekmachine’). Het beperken van analyses wordt toegepast door middel van een ‘robots.txt’ bestand. Dit document vertelt aan ZM’s of ze specifieke pagina’s al dan niet hoeven te analyseren. Zo kunnen pagina’s die niet nuttig zijn om te vinden in de ZRZM voor gebruikers niet worden opgenomen (Google, 2010). Een website kan eveneens vereenvoudigd worden om te worden gecrawld door ZM’s, door het gebruik van van ‘sitemaps’. Een sitemap is een bestand waarin de webpagina’s van een site vermeld staan om ZM’s te informeren over de structuur van de site-inhoud (Google, 2014). Door het goed implementeren van beide bestanden wordt een crawler-vriendelijke website gecreërd, wat een positieve invloed heeft op de ranking.
Masterproef
Xavier Desmet
Pagina 12/48
Om de leesbaarheid voor crawlers te verbeteren en zo beter te presteren in de ZRZM, moet de belangrijkste inhoud in het HTML-tekstformaat weergegeven worden. Zo kunnen afbeeldingen, flash bestanden, Java-toepassingen en andere niet-tekstuele inhoud die vaak genegeerd of gedevalueerd worden door crawlers, toch geïnterpreteerd worden door ZM’s (Moz, 2015). Voor afbeeldingen is het eveneens van belang om de ‘Alt tekstbox’ in te vullen. Het algoritme van Google analyseert grondig de data die in deze box zit en gebruikt de gegevens om te bepalen wat de inhoud van de afbeelding is. Daarnaast heeft de ‘Alt tekstbox’ ook een ander doel, deze tekst wordt namelijk getoond als vervanging van de afbeelding als deze om de een of andere reden niet kan worden weergegeven. Dit kan bijvoorbeeld het geval zijn bij trage internetverbindingen of bij gebruikers die afbeeldingen niet zien. Het is dan ook de bedoeling om in deze tekstbox te beschrijven waarover het beeld gaat (Dion, 2015).
Masterproef
Xavier Desmet
Pagina 13/48
1.3.2 Off-page optimalisatie Ranking factoren niet op de pagina zelf (Off-Page), zijn diegene die website-eigenaars niet rechtstreeks onder controle hebben (Parikh & Deshmukh, 2013).
Links Zoekmachines meten wie er linkt naar een bepaalde webpagina (back-links) en wat ze over deze pagina zeggen. Er wordt tevens rekening gehouden met wie verbonden is met wie (op basis van historische datalinks, registratiegegevens van de website, etc.), wie het waard is om te vertrouwen (zie reputatie), alsook contextuele gegevens over de locatie waar de pagina wordt gehost (Enge et al., 2012, p. 51). Op basis van een algoritme, rekening houdend met voorgaande factoren, wordt een waarde toegekend aan elke link. Bovendien wordt er aan links van websites die over hetzelfde onderwerp berichten een hogere waarde gehecht (Google, 2010). Het analyseren van links is dus meer dan eenvoudigweg het tellen van het aantal links naar een site. Zoekmachines geven bijgevolg meer gewicht aan links die van een betere kwaliteit worden beschouwd (Search Engine Land, 2015).
Parikh & Deshmukh (2013) geven een aantal mogelijkheden om back-links te creëren: regelmatig nieuwe inhoud posten op een blog, het toevoegen en delen van unieke inhoud en informatie op sociale netwerksites, een persbericht verspreiden via relevante nieuwssites of video’s die relevant en informatief zijn met een link naar de website.
Reputatie Websites met consistente nieuwe boeiende inhoud en groeiende kwaliteit van links kunnen beschouwd worden als reizende sterren. Deze zullen het goed doen in zoekmachines (Gecko Gully, 2014). Daarnaast houden ZM’s ook rekening met de populariteit van een webpagina. Populariteit verwijst naar het aantal keer dat gebruikers klikken op een webpagina. Hoe vaker de site wordt geselecteerd uit de zoekresultaten, hoe hoger de ranking in ZM’s (Ledford, 2009, p. 38). Elke relevante pagina krijgt zo een totaalscore, die een combinatie is van de inhoud- en de populariteit score (Langville & Meyer, 2011).
Voorgaande oplijsting van on-page en off-page optimalisatietechnieken zijn slechts de basistechnieken. Daarnaast bestaan er nog andere, meer gesofisticeerde technieken om een website beter te laten scoren in de ZRZM maar deze vallen buiten de scope van deze masterproef. Hierna volgt een overzicht van bestaande studies over de hierboven opgelijste SEO-technieken.
Masterproef
Xavier Desmet
Pagina 14/48
1.4 Overzicht bestaande studies SEO bestaat meestal uit het maken van kleine aanpassingen aan een website om de zichtbaarheid in zoekmachines te vergroten. Wanneer deze individueel worden bekeken, lijken ze op incremetele aanpassingen. Echter, in combinatie met andere optimalisaties kunnen ze een aanzienlijke invloed hebben op, zowel de ervaring van de gebruikers als de prestaties in de organische zoekresulaten (Google, 2010). Tevens wordt er meestal geen onderscheid gemaakt tussen de technieken onderling (Google, 2010; Moz, 2015; Parikh & Deshmukh, 2013)
Enkele onderzoeken maken toch een prioritering. Zo is volgens Search Engine Land (2015) het belangrijkste element in zoekmachineoptimalisatie de kwaliteit van de inhoud, gevolgd door het gebruik van goede keywords of zoektermen. Daarnaast zijn links de beste externe methode (zie offpage) om de ranking te verbeteren (Search Engine Land, 2015).
Ook Ramos en Cota (2008) stellen dat de inhoud van een website primordiaal is, hierna komen dan de titels inclusief tags. Parikh en Deshmukh (2013) beweren dan weer dat links de beste manier zijn om een website te promoten op zoekmachines. Ook Enge et al (2012) verklaren links de voornaamste techniek, gevolgd door het gebruik van keywords. Volgens Su et al. (2014) is de ranking van de webpagina zelf de belangrijkste factor, met in het bijzonder keywords die voorkomen in: de hostnaam, de titel-tag, HTML-header, de meta-tag en de URL.
Tot slot besluit Searchmetrics uit hun studie in 2014 dat de inhoud en relevantie van keywords van een webpagina op een bepaald zoekresultaat de belangrijkste onderdelen zijn bij SEO, gevolgd door links en sociale media. Deze laatste bestaat onder meer uit Facebook (reacties, likes en shares) en Twitter (tweets). Sociale media wordt een steeds belangrijker element in zoekmachineoptimalisatie (Searchmetrics, 2014). Tabel 1. Overzicht Literatuur met hun resultaten
Auteur
Datum
Resultaten
Ramos & Cota
2008
1. Inhoud; 2. Titels
Enge et al.
2012
1. Links; Keywords
Parikh & Deshmukh
2013
1. Links
Su et al.
2014
1. On-Page: Keywords
Searchmetrics
2014
1. Relevantie keywords en inhoud; 2. Links; 3. Social Media
Search Engine Land
2015
1. Kwaliteit inhoud; 2. Keywords; 3. Links
Masterproef
Xavier Desmet
Pagina 15/48
Uit de literatuur kunnen we besluiten dat keywords of zoektermen de belangrijkste basistechniek is bij zoekmachineoptimalisatie1. Op de tweede plaats komen links2, gevolgd door het gebruik van titels3.
Bovenstaande tabel zegt echter niet alles. Zo worden in de wetenschappelijke artikelen van Enge et al. (2012), Parikh & Deshmukh (2013), Ramos & Cota (2008) en Search Engine Land (2015) de verschillende basistechnieken niet (allemaal) tegenover elkaar gezet, noch worden geen van de resultaten tussen de technieken in deze artikelen ondersteund door enig gepubliceerd wetenschappelijk bewijs. Het zijn dus eerder persoonlijke meningen van de auteurs op basis van eigen bevindingen, zonder enig gefundeerd bewijs.
Enkel Searchmetrics en Su et al. vergelijken verschillende technieken onderling op basis van statistische methoden. Zo ontwikkelden Su et al. (2014) een model om de ranking van een webpagina met een hoge nauwkeurigheid te kunnen voorspellen. Hierbij maakten ze een onderscheid tussen het gewicht van de verschillende technieken onder elkaar. Maar Su et al. namen slechts een beperkt aantal SEO-technieken in beschouwing, namelijk enkel de optimaliseringen op de pagina zelf (on-page, cfr. supra). Meer specifiek ligt de focus van hun studie op keywords: waar ze voorkomen (tags, URL, tekst), het aantal keer dat ze voorkomen en de leeftijd van een webpagina. Gezien de essentie van hun studie ligt bij het voorspellen van de ranking van een webpagina in de ZRZM, wordt er minder belang gehecht aan een onderscheid tussen de technieken zelf.
Searchmetrics (2014) geeft in hun studie dan weer een diepgaande evaluatie van de correlatie tussen de 30 belangrijkste SEO-technieken onderling. Eveneens rangschikken ze de verschillende technieken volgens belangrijkheid in de organische zoekresultaten. Deze studie is echter enkel gebaseerd op websites binnen de Verenigde Staten en hecht het meeste belang aan de verschillen en gelijkenissen (zie correlatie) tussen de technieken onderling en minder aan de rangschikking van de technieken zelf. De volgorde is eerder een interpretatie van de in het algemeen meer relevante factoren.
Er kan dus besloten worden dat statistisch onderzoek in deze materie nuttig kan zijn om nieuwe inzichten teweeg te brengen of bestaande bevindingen wetenschappelijk te onderbouwen. Vooraleer er begonnen kan worden met het onderzoek, wordt eerst de methodologie toegelicht.
1
Twee keer op de eerste plaats en twee keer op de tweede plaats. Twee keer op de eerste plaats, één keer op plaats twee en één keer op plaats drie. 3 Eén keer op de tweede plaats. 2
Masterproef
Xavier Desmet
Pagina 16/48
Deel 2: methodologie In het tweede deel van deze masterproef wordt de onderzoeksmethode die gehanteerd wordt om een antwoord te formuleren op de centrale onderzoeksvraag “Welke SEO-basistechniek heeft het meeste effect op de ranking van een website in de zoekresultaten van Google?” uiteengezet. Om te beginnen wordt de probleemstelling voorgesteld om vervolgens de onderzoeksvraag en de wetenschappelijke- en maatschappelijke relevantie toe te lichten. Tot slot zal de gebruikte werkwijze in deze studie uitgediept worden.
2.1 Probleemstelling Bestaande literatuur maakt vaak geen onderscheid in de relevantie tussen de verschillende technieken onderling. Zoals reeds vermeld in deel 1.4 ‘Overzicht bestaande studies’, zijn de onderzoeken die toch een onderscheid maken voornamelijk gebaseerd op basis van eigen bevindingen zonder enig gefundeerd bewijs. De enige twee studies (Searchmetrics, 2014; Su et al., 2014) die de verschillende technieken onderling vergelijken op basis van statistische methoden, zijn dan weer ofwel enkel gebaseerd op websites uit de Verenigde Staten, ofwel enkel gebaseerd op keywords. Bij deze studies is het vergelijken van de technieken bovendien telkens niet de focus van het onderzoek en wordt er dus weinig aandacht aan besteed.
Dit maakt het interessant om deze hiaat in de literatuur te onderzoeken. Deze masterproef zal dan ook nagaan welke technieken het meeste effect hebben op de ranking van een website in de zoekresultaten van Google (ZRG). Deze vraag zal beantwoord worden door het analyseren van webpagina's op drie basis SEO-technieken: titels (inclusief URL’s), keywords en links. De webpagina’s zullen zowel bestaan uit Engelstalige- als uit Nederlandstalige websites.
De drie basistechnieken zullen gequoteerd en geëvalueerd worden op verschillende parameters. Op die manier kan gezien worden welke technieken aanwezig zijn, welke niet, wat hun omvang is en wat hun positie in de ZRZM is.
Masterproef
Xavier Desmet
Pagina 17/48
2.2 Wetenschappelijke-
en
maatschappelijke
relevantie,
onderzoeksvraag In de praktijk wordt SEO niet enkel als een totaalpakket toegepast. Indien er bijvoorbeeld op korte termijn toch significante vooruitgang geboekt wil worden met beperkte middelen, kan dit onderzoek van belang zijn doordat er een duidelijk onderscheid gemaakt wordt in de technieken die Google als de belangrijkste beschouwd. Bestaande literatuur hechtte hier weinig belang aan, toch kan het ook erg waardevol zijn om te weten aan welke technieken er de meeste aandacht dient besteed te worden. Deze studie kan op deze manier nieuwe inzichten verschaffen in de SEO-markt.
Er wordt gekozen om te werken met 3 basis SEO-technieken: titels (inclusief URL’s), keywords en links. De keuze voor deze drie werd gemaakt aangezien zoekmachines hun ranking mechanismen regelmatig bijstellen en er slechts een paar zijn die doorheen de tijd dezelfde bleven (Ahuja, 2013). De meer gesofisticeerde technieken worden voortdurend aangepast. Om deze masterproef bijgevolg niet irrelevant te maken binnen een aantal jaar, zullen enkel de basistechnieken geanalyseerd worden.
Sommige onderzoeken zien de kwaliteit van de inhoud van een website als een belangrijk kenmerk, maar deze techniek valt desalniettemin buiten de scope van dit onderzoek. Kwaliteit is in de praktijk namelijk erg moeilijk objectief te meten. Daarenboven zijn de technieken uitgelegd in het deel ‘Onpage optimalisatie’ op pagina 9 en 10, vaak enkel te berekenen door de website-eigenaar en Google zelf. Het is tevens niet bekend hoe het algoritme van Google de kwaliteit van een webpagina exact bepaald. Door voorgaande redenen zal de kwaliteit van de inhoud van een website dan ook niet onderzocht worden in deze masterproef.
De onderzoekvraag die deze masterproef zal beantwoorden luidt: Welke SEO-basistechniek heeft het meeste effect op de ranking van een website in de zoekresultaten van Google?
Op basis van de literatuur wordt volgende hypothese opgesteld: Het toepassen van keywords of zoektermen is de belangrijkste techniek bij zoekmachineoptimalisatie. Hierna volgen achtereenvolgens het gebruiken van links en titels.
Masterproef
Xavier Desmet
Pagina 18/48
2.3 Werkwijze Bij het verzamelen van de basistechnieken voor deze studie zal gebruik gemaakt worden van verschillende webtools om de website evaluatie te automatiseren. Er zal zowel gezocht worden op Engelstalige- als Nederlandstalige keywords. Bijvoorbeeld ‘Zoekmachine’ en ‘Search Engine’.
Het steekproefkader bij het analyseren van webpagina’s bestaat uit de volledige ranking van Google. Bepaalde keywords kunnen echter miljoenen zoekresultaten bevatten. Om de externe validiteit toch te behouden en zo de resultaten van dit onderzoek te kunnen veralgemenen naar andere situaties, zijn de steekproefomvang en de keywords zorgvuldig gekozen.
Er zal een stochastische steekproefmethode gehanteerd worden, meer specifiek een systematische steekproef. Stochastisch aangezien er een representatieve statistische schatting gemaakt moet worden van de populatie, en systematisch omdat er met regelmatige intervallen websites gekozen worden uit het steekproefkader (Callaert, n.d.). Op pagina één, vijf, tien, twintig, dertig, veertig en vijftig van de ZRZM zullen telkens drie van de tien zoekresultaten op elke pagina geanalyseerd worden op SEO-technieken, zie ook tabel 3. Per keyword of zoekterm zullen dus 21 links in detail bekeken worden. De pagina’s zijn zo uitgekozen zodat er een duidelijk onderscheid merkbaar wordt tussen websites waarbij SEO reeds erg goed toegepast wordt (pagina één en in iets mindere mate pagina vijf), websites die SEO niet volledig onder de knie hebben (pagina veertig en vijftig) en websites die daartussen gerankt staan. De Engelstalige zoektermen zijn bovendien zodanig gekozen zodat websites die hoog willen staan in de ranking van ZM’s, SEO zeer compleet dienen toe te passen. Deze keywords staan namelijk in de top 20 duurste keywords van Google (zie SEA) (Walgrove, 2015; WordStream, 2011). Bij de Nederlandstalige zoektermen is dit minder het geval, om op deze manier een zo volledig mogelijk beeld te creëren van het steekproefkader.
Om een goed evenwicht te bewaren zullen er in beide talen, zowel in het Engels als in het Nederlands, drie keywords onderzocht worden. Dit komt neer op 126 websites.
Naast de drie basistechnieken titels (inclusief URL’s), keywords en links worden er een aantal controlevariabelen opgenomen. Deze variabelen kunnen ook een invloed hebben op de ranking van een website of ze kunnen onderling afhankelijk zijn. Door deze controlevariabelen op te nemen in de analyses worden de resultaten accurater en kunnen de verschillende technieken vergeleken worden. Bijvoorbeeld of bepaalde technieken significant meer belangrijk zijn dan andere. In totaal zijn er 54 variabelen waarop de 126 websites gequoteerd worden.
Masterproef
Xavier Desmet
Pagina 19/48
De gebruikte webtools zijn: SEO Site Checkup (2014), Moz (2014b), SERPs (2015), Site Analyzer (2014), Google (2015), SEO Review Tools (2014) en Developer Shed (2014). Hierna wordt verduidelijkt welke tool gebruikt wordt voor welke techniek, om hiermee in Deel 3: empirische studie’ vervolgens analyses uit te voeren.
Via SEO Site Checkup (2014) en Site Analyzer (2014) worden websites geanalyseerd op titels (12 variabelen), URL’s (vijf variabelen), keywords of zoektermen (negen variabelen) en crawlervriendelijkheid (controlevariabele, bestaande uit vier variabelen).
Op de websites van Moz (2014b) en Site Analyzer (2014) worden de metrieken betreffende links onderzocht. Deze SEO-basistechniek wordt onderverdeeld in 12 variabelen. De webtool van SERPs (2015) wordt dan weer gebruikt bij zoekresultaten op de eerste pagina’s om de ranking bij een bepaald keyword zeker juist vast te stellen. Op deze tool zijn enkel de eerste 120 zoekresultaten per zoekwoord te raadplegen.
De controlevariabelen laadsnelheid (drie variabelen) en de mobiele bruikbaarheid (drie variabelen) van een website worden nagegaan via Google (2015) en SEO Site Checkup (2014). Daarnaast wordt sociale media, eveneens een controlevariabele, geanalyseerd met SEO Review Tools (2014) en SEO Site Checkup (2014) op drie variabelen. Tot slot wordt de leeftijd van een domein vastgesteld met de tools van Developer Shed (2014) en Site Analyzer (2014) en uitgedrukt in aantal dagen sinds de creatie.
Na het bespreken van de methodologie kan overgegaan worden op de empirische studie. Hier zal aan de hand van de eigen verzamelde data via de hierboven vermelde technieken voor elke categorie / basistechniek een analyse uitgevoerd worden met alle variabelen die in elk van deze categorieën thuishoren.
Masterproef
Xavier Desmet
Pagina 20/48
Deel 3: empirische studie Om de onderzoeksvraag te beantwoorden zal meervoudige lineaire regressie toegepast worden. Analyses worden uitgevoerd via SPSS Statistics (IBM, 2011). Berekeningen en achtergrondinformatie zijn gehaald uit het boek ‘Statistiek, een inleiding’ van McClave, Benson, Sincich, & Knypstra (2011).
De variabelen zijn opgedeeld in vijf categorieën: titels, URL’s, keywords of zoektermen, links en controlevariabelen. De te verklaren variabele of afhankelijke (y) variabele is de plaats of ranking van een website in de zoekresultaten van Google (ZRG) voor een bepaald keyword. In bijlage 1 worden alle onderzochte variabelen in detail toegelicht. Alvorens de analyses besproken worden, vraagt de afhankelijke variabele ‘ranking’ om een woordje uitleg.
3.1 Beschrijving variabele ‘ranking’ De variabele ‘ranking’ stelt de plaats van een website in ZRG voor. Deze variabele is een schaalvariabele en tevens de te verklaren variabele. Dit houdt in dat alle andere variabelen deze variabele proberen te voorspellen. Er zijn 126 websites geanalyseerd, waarvan allen over een geldige ranking positie beschikken. Uit tabel 2 kan besloten worden dat de gemiddelde ranking van de onderzochte websites 210 is, met een minimum van 1 (= de best gerangschikte website) en een maximale ranking van 498 (= laagst gerangschikte website). Verder komen er geen outliers voor in de steekproef (websites met ranking hoger dan het gemiddelde plus drie maal de standaardafwijking).
N
Minimum
Plaats in ZRZM
126
Valid N (listwise)
126
Maximum 1
498
Gemiddelde 209,62
Std. Afwijking
Tabel 2. Analyse variabele ranking
159,962
Tabel 3. Intervallen van de ranking
Aantal
Percentage
Cumulatief Percent.
Zoals aangegeven in tabel 3 zijn er op pagina’s één (met ranking 1 t.e.m. 15), vijf (40 t.e.m. 50), tien (91
1 - 15
18
14,3
14,3
40 - 50
18
14,3
28,6
t.e.m. 101), twintig (191 t.e.m. 210), dertig (291
91 - 101
18
14,3
42,9
t.e.m. 300) en veertig (290 t.e.m. 417) telkens 18
191 - 210
18
14,3
57,1
291 - 300
18
14,3
71,4
334 - 360
6
4,8
76,2
bepaalde zoektermen ging de ranking echter niet
390 - 417
18
14,3
90,5
tot pagina 50. Zo ging bij het keyword ‘annuity’ de
441 - 444
3
2,4
92,9
471 - 500
9
7,1
100,0
126
100,0
Total
Masterproef
websites geanalyseerd (drie per keyword). Bij
ranking maar tot pagina 36 (exclusief gelijke resultaten). Bijgevolg zijn hier om de consistentie te
Xavier Desmet
Pagina 21/48
behouden pagina’s 34 en 36 geanalyseerd, in plaats van pagina’s 40 en 50. De zoektermen ‘insurance’ en ‘programmeren’ vertonen een gelijkaardig probleem. Hier zijn respectievelijk pagina’s 41 en 45 geanalyseerd in plaats van pagina 50. Bij de overige zoektermen ‘mortgage’, ‘zoekmachine’ en ‘verzekering’ zijn geen beperkingen vastgesteld.
3.2 Analyse De op te nemen variabelen zijn allen geschikt om te gebruikten in de regressie. Zo is tekst (strings) gecodeerd als dummyvariabelen (0 of 1) en zijn ordinale variabelen gecodeerd volgens de Likertschaal zodat deze als schaalvariabele kan geïnterpreteerd worden.
Elke individuele variabele apart zal weinig bijdragen aan de te verklaren variabele y, de ranking van een website in de ZRG. Daarom zal voor elke categorie een (meervoudige) lineaire regressie uitgevoerd worden met alle variabelen die in deze categorie thuishoren. Zo kan er per categorie nagegaan worden hoeveel procent van de variatie wordt verklaard van de ranking door de opgenomen verklarende x-veranderlijken en of deze significant zijn (3.2.1 ‘Titels en URL’s’, 3.2.2 ‘Keywords’, 3.2.3 ‘Links’ en 3.2.4 ‘Controlevariabelen’). Hiervoor wordt niet de correlatiecoëfficiënt ‘R’ gebruikt, gezien R bij het opnemen van meerdere verklarende variabelen minder duidelijk wordt. De aangepaste R² (R2a ) is hiervoor het meest aangewezen (zie later).
Daarenboven kan gekeken worden welke variabelen binnen elke categorie het meest effect hebben op de ranking, en hoe sterk deze de ranking beïnvloed (positief of negatief). Hierna kunnen alle variabelen tegelijk opgenomen worden en kan geanalyseerd worden hoeveel deze samen verklaren over de positie van een website in de ZRG en welke individuele variabelen nog significant zijn (3.2.5 ‘Alle categorieën samen’). Door alle variabelen gezamenlijk op te nemen wordt het PageRank algoritme van Google gesimuleerd (zie p. 5). In elk van de categorieën wordt het optimale model gezocht om deze in de paragraaf 3.3 ‘Conclusie van de analyse’ te kunnen vergelijken.
Bij de categorie ‘links’ worden dus 12 variabelen opgenomen, bij keywords negen enzoverder. Titels zullen zowel samen als apart met URL’s onderzocht worden, aangezien URL’s in de literatuur vaak samen hangen met titels (Ledford, 2009; Moz, 2015). Ook de controlevariabelen, bestaande uit leeftijd, crawler-vriendelijkheid, laadsnelheid, sociale media en mobiele bruikbaarheid, zullen als geheel onderzocht worden om vervolgens te kijken wat de invloed is van elk specifiek onderdeel.
Masterproef
Xavier Desmet
Pagina 22/48
3.2.1 Titels en URL’s De categorie titels bestaat uit 12 variabelen. Enkele voorbeelden hiervan zijn de aanwezigheid van een titel tag, het aantal tekens van een titel tag, de titel vriendelijkheid en het aantal tekens van de meta-omschrijving tag. Daarnaast bestaat de categorie URL’s uit vijf variabelen, waaronder de URL lengte, de aanwezigheid van het keyword in de URL en de URL vriendelijkheid. Meer informatie over deze variabelen en waarop de quotering gebaseerd wordt bij de titel- en URL vriendelijkheid is te vinden in bijlage 1 'Onderzochte variabelen’ (tabel 24). De relevante tabellen omtrent het uitvoeren van de analyses zijn opgenomen in bijlage 2.1 Titels en URL’s op pagina 5. Tabel 4. Samenvatting model Titels en URL's Model 1
R ,619
R Square
Adjusted R Square
,384
,287
Std. Error of the Estimate 135,115
Als deze twee categorieën samen worden genomen bij het uitvoeren van de meervoudige lineaire regressie,
wordt er geconstateerd dat de opgenomen x-variabelen 28,7% verklaren van de variatie in de ranking van een website (zie tabel 4). Het verschil tussen R² en de aangepaste R² (R2a ) is dat deze laatste ook rekening houdt met de steekproefgrootte n (=126) en het aantal parameters β in het model (opgenomen variabelen x). R2a is bijgevolg erg handig om modellen onderling te vergelijken.
Uit de tabel ‘Descriptive Statistics’ in bijlage 2.1 valt af te lezen dat de gemiddelde ranking 210 bedraagt. Hierbij is de standaardafwijking 135,115 (zie tabel hierboven), wat wil zeggen dat dit model de ranking van website zal voorspellen binnen een fout van ± 270,23 (twee keer de standaardafwijking). De globale F-toets wijst aan dat de nulhypothese (H0 ) verworpen wordt, en de alternatieve hypothese (Ha ) wordt aanvaard (p = 0,000 < alfa 0,05).4 Er heeft dus minstens één variabele een significant effect op de ranking, bijgevolg is dit model bruikbaar.
Aansluitend kan onderzocht worden welke variabelen de meeste impact hebben op de ranking. Door te kijken naar de gestandaardiseerde coëfficiënt, kan dit eenvoudig aangegeven worden. Maar eerst dient nagegaan te worden via een individuele t-toets of dit verband wel significant is. Alle bijhorende gegevens zijn te vinden in tabel 5. Voorbeeld titel-vriendelijkheid:
𝐻0 : 𝛽1 = 0 𝐻𝑎 : 𝛽1 ≠ 0
4
Nulhypothese (H0 ): β1 = β2 = β3 = β4 = β5 = β6 = β7= 0 (dit wil zeggen dat de ranking niet kan verklaard worden door de opgenomen variabelen) Alternatieve hypothese (Ha ): Minstens 1 β is verschillend (er is dus wel een betekenisvol effect) Indien P-waarde < alfa H0 verwerpen
Masterproef
Xavier Desmet
Pagina 23/48
De P-waarde is in dit voorbeeld 0,005 wat kleiner is dan alfa (0,05). Dit betekent dat de nulhypothese verworpen wordt. Er is dus een significant verband tussen de titel-vriendelijkheid en de bijhorende ranking van een website in de ZRG. De overige significante variabelen zijn: gebruikte metaomschrijving tag (door Google gekozen of eigen meta tag gebruikt), de meta vriendelijkheid en de aanwezigheid van het keyword in de URL (net significant).
Nu kunnen de gestandaardiseerde coëfficiënten bekeken worden. Het gebruik van de eigen metaomschrijving tag heeft de grootste invloed (-0,401) op de positie van een website, gevolgd door de titel vriendelijkheid (-0,294), de meta vriendelijkheid (-0,261) en het voorkomen van de zoekterm in de URL (0,200). Door hierna te kijken naar de ongestandaardiseerde coëfficiënten kunnen deze resultaten geïnterpreteerd worden. Zo heeft gebruik van een eigen meta tag een sterk negatief effect op de ranking (-128,695). Dit impliceert dat indien de eigen meta-omschrijving tag gebruikt wordt in de ZRG, en dus geen meta-omschrijving tag die gekozen is door Google zelf, de ranking daalt met 129 posities (wanneer alle overige variabelen constant blijven). Hoe lager op de ranking, hoe beter. Wat inhoudt dat een website die eerst weergegeven wordt op pagina 13, zou verschijnen op de eerste pagina. Negatieve scores moeten in deze analyses dus positief geïnterpreteerd worden. Tabel 5. Coëfficiënten van de variabelen bij de categorieën Titels en URL's Unstandardized Coefficients B
Std. Error
Standardized Coefficients
De Sig.
Beta
aanwezigheid van een
meta-omschrijving tag is net niet significant (0,085). Toch
(Constant)
226,443
167,862
Titel_tag
167,925
147,338
,094
,257
-,075
,564
-,012
,894
-65,665
22,878
-,294
,005
omschrijving
63,366
36,473
,185
,085
noodzakelijk ten goede komt
,046
,056
,070
,409
aan
-128,695
34,312
-,401
,000
-69,339
21,575
-,261
,002
Header_H1
,016
1,928
,001
,993
Header_H2
,046
,675
,006
,945
effect op de ranking (63,366).
Header_H3
,182
1,654
,010
,913
Wat impliceert dat indien een
Header_H4
-,073
3,024
-,002
,981
website
Header_H5_H6
-2,639
3,047
-,088
,388
URL_Vriendelijk
-34,900
18,466
-,193
,061
URL_Lengte
1,010
,601
,153
,096
verwachte ranking in Google
URL_Domein
2,210
2,452
,077
,369
van deze website stijgt met
URL_keyword
79,765
39,890
,200
,048
gemiddeld
URL_LiggendStreepje
-1,484
,840
-,154
,080
Titel_Lengte Titel_Vriendelijk Meta_Tag Lengte_Meta Meta_Eigen Meta_Vriendelijk
Masterproef
,180
Xavier Desmet
wijst dit er op dat het louter bestaan
de
van
een
meta-
tag
niet
ranking
van
een
website. Deze variabele heeft namelijk een sterk positief
een
meta-
omschrijving tag bezit, de
63
posities
Pagina 24/48
wanneer alle overige variabelen constant blijven. De website komt dus later in de ZRG van een bepaald keyword. De meta-omschrijving tag dient dus relevant te zijn voor het keyword, zodat Google deze dan ook zal opnemen. Pas als deze meta-omschrijving tag werkelijk gebruikt wordt in de ZRG is dit positief voor de ranking (waarmee hier bedoeld wordt dat de ranking daalt).
Ook de aanwezigheid van het keyword in de URL heeft een sterk positief effect op de ranking. Dit lijkt vreemd aangezien er uit de literatuur vanuit gegaan kan worden dat dit de ranking ten goede zou moeten komen en dus juist zou moeten dalen (Search Engine Land, 2015). Een mogelijke verklaring hiervoor is dat de keywords in de steekproefomvang zo zijn gekozen zodat SEO goed toegepast moet worden om vooraan in de zoekresultaten terecht te komen. En aangezien een URL in kernwoorden beschrijft waarover de webpagina gaat, komt in bijna alle websites het keyword voor in de URL. Er dient bijgevolg verder niet veel aandacht aan deze merkwaardige bevinding worden besteed.
De titel- en de meta-vriendelijkheid hebben dan weer een sterk negatief effect op de ranking (-65,665 en -69,339). Als de titel-vriendelijkheid stijgt met een score van één (op een schaal van drie), daalt de verwachte ranking gemiddeld met 66 posities. Meta-vriendelijkheid kan analoog opgevat worden, maar dan op een schaal van nul tot twee. Hieruit kan worden vastgesteld dat het belangrijk is om bij het maken van een titel- en een meta-omschrijving tag volgende regels in acht te houden. Titel tags dienen normaliter te beginnen met de zoekterm, mogen geen herhalingen bevatten (bv. tweemaal de bedrijfsnaam) en moeten relevant zijn. Ook meta-omschrijving tags dienen zeker relevant te zijn, anders neemt Google deze al niet op in de zoekresultaten, en mogen geen quotes bevatten. Google kan deze namelijk (nog) niet interpreteren.
Daarnaast vertoont de verklarende variabele URL vriendelijkheid eveneens een sterk negatief verband met de ranking van een website (in de zoekresultaten van Google). Ondanks deze variabele nipt niet significant is (0,061), is het de moeite waard om volgende vuistregels te respecteren. URL’s mogen geen overbodige woorden, cijfers, spaties, liggende streepjes of tekens bevatten, gezien spiders (p. 5) hieruit niet kunnen afleiden wat bedoeld wordt. Idealiter beginnen woorden telkens met een hoofdletter en worden ze gescheiden met een koppelteken.
De overige opgenomen x-variabelen (titel tag, titel lengte, lengte meta, headers h1 t.e.m. h6, URL lengte, URL lengte domein en aantal liggende streepjes te vinden in URL’s op de webpagina) zijn allen overtuigend niet significant en worden niet in detail besproken.
Masterproef
Xavier Desmet
Pagina 25/48
Multicollineariteit Wanneer twee of meerde onafhankelijke (x) variabelen sterk gecorreleerd zijn kan dit leiden tot verwarrende resultaten. Dit wordt ook wel multicollineariteit genoemd (McClave et al., 2011). Bij deze meervoudige lineaire regressie vormt dit echter geen enkel probleem. Dit is pas het geval indien de tolerantie-waarde of de variance inflation factor (verder geschreven als VIF) van een variabele respectievelijk lager is dan 0,1 of groter is dan 10. Hier is de laagste tolerantie-waarde 0,498 en de hoogste VIF-waarde 2,006 (voor de variabele ‘gebruik eigen meta(-omschrijving) tag’) en is multicollineariteit bijgevolg niet van toepassing. Zie tabel ‘Coefficients’ in bijlage 2.1 p. 5.
Normale verdeling Vervolgens wordt nagegaan of de residuen normaal verdeeld zijn. Dit wordt onderzocht aan de hand van de Kolmogorov-Smirnov toets. De output van deze toets kan gevonden worden in bijlage 2.1 tabel ‘Npar Tests’. De nulhypothese, die stelt dat de residuen normaal verdeeld zijn, wordt aanvaard.5 De gestandaardiseerde residuen wijzen er namelijk op dat de verdeling significant is met de normale verdeling (p = 0,772 > 0,05). Grafisch wijzen het histogram en de normal P-Plot tot diezelfde bevinding (bijlage 2.1).
a. Titels In deze paragraaf zullen enkel de variabelen van de categorie titels opgenomen worden in het model. Relevante tabellen zijn opgenomen in bijlage 2.1a vanaf p. 10.
Tabel 6. Samenvatting model Titels Model 1
R ,538
R Square ,290
Adjusted R Square
Std. Error of the Estimate
,214
141,784
Uit tabel 6 valt af te leiden dat R² 29% bedraagt. Hier blijft nog 21,4% van over na aanpassing, rekening houdend
met de steekproefgrootte n (126) en het aantal opgenomen variabelen (12). 21,4 % van de variatie betreffende de positie van een website in ZRG kan verklaard worden door de categorie titels (de opgenomen x-variabelen). Verder bedraagt de nauwkeurigheid van de schatting ± 283,568. De
5
H0 : de residuen zijn normaal verdeeld Ha : de residuen zijn niet normaal verdeeld
Indien p-waarde > alfa H0 aanvaarden Masterproef
Xavier Desmet
Pagina 26/48
categorie titels, verklaart 7,3% minder dan de categorieën titels en URL’s samen. Ook de nauwkeurigheid van de schatting is bij titels en URL’s samen beter dan in dit model (-13,338). Bij uitvoering van de globale F-toets, kan gezien worden het significantie niveau (P-waarde = 0,000) kleiner is dan alfa (0,05), waardoor de nulhypothese verworpen wordt en het model dus bruikbaar is.
Tabel 7. Coëfficiënten van de variabelen bij de categorie Titels Unstandardized Coefficients B
Std. Error
Standardized Coefficients
De individuele t-toetsen wijzen op Sig.
dezelfde resultaten als bij het model waarin de categorieën titels
Beta ,029
en URL’s werden samengenomen.
,046
,586
Ook hier zijn enkel de variabelen
,574
,067
,477
-52,644
22,209
-,235
,019
50,876
38,015
,149
,183
tag (‘meta eigen’, 0,000), titel-
,056
,056
,084
,324
(0,019) en meta vriendelijkheid
-126,239
35,094
-,394
,000
(0,003)
-66,573
22,169
-,251
,003
Header_H1
-,297
2,005
-,012
,883
Header_H2
-,182
,683
-,022
,791
Header_H3
-1,351
1,642
-,077
,412
significant (0,183) net zoals alle
Header_H4
-,915
3,031
-,027
,763
overige opgenomen variabelen.
Header_H5_H6
-,862
3,079
-,029
,780
(Constant) Titel_tag Titel_Lengte Titel_Vriendelijk Meta_Tag Lengte_Meta Meta_Eigen Meta_Vriendelijk
338,041
152,550
82,269
150,784
,410
gebruik eigen meta-omschrijving
significant
Aanwezigheid
van
(tabel een
7).
meta-
omschrijving tag is nu sterk niet
De eigen meta tag heeft met een gestandaardiseerd coëfficiënt van -0,394 nog steeds de meeste invloed op de positie van een website in de ZRG, gevolgd door de meta vriendelijkheid (-0,251) en de titel vriendelijkheid (-0,235). In vergelijking met het vorige model weegt de meta vriendelijkheid (toen -0,261) in dit model meer door dan de titel vriendelijkheid (toen -0,294).
De invloed van de eigen meta is nog steeds sterk negatief, maar stijgt licht (van -128,695 naar -126,239 nu). Ook meta vriendelijkheid (van -69,339 naar -66,573) en de titel vriendelijkheid (van -65,665 naar -52,644) stijgen gering. De interpretatie van deze getallen blijft hetzelfde: de verwachte ranking van een website zal naar schatting gemiddeld dalen met 67 posities, indien de meta vriendelijkheid stijgt met een score van één (op een schaal van twee) en alle overige variabelen constant blijven.
Verder vormt de multicollineariteit geen probleem. Er zijn dus geen x-variabelen die sterk gecorreleerd zijn en daarom uit het model genomen moeten worden. De laagste tolerantie-waarde
Masterproef
Xavier Desmet
Pagina 27/48
bedraagt voor de variabele ‘meta tag’ 0,510 met een VIF-waarde van 1,963. Zie tabel ‘Coefficients’ in bijlage 2.1a op bladzijde 10.
Tot slot zijn ook de residuen normaal verdeeld. De P-waarde bedraagt 0,634 en is dus groter dan 0,05 (alfa), bijgevolg aanvaarden we de nulhypothese. De bijhorende tabel van deze toets kan gevonden worden in bijlage 2.1a op p. 10 in tabel ‘Npar Tests’.
b. URL’s Na het bestuderen van de categorie titels is het de beurt aan de categorie URL’s. In dit model zullen enkel de variabelen binnen de categorie URL’s opgenomen worden als onafhankelijke x-variabelen. De resultaten kunnen opnieuw vergeleken worden met het model waarbij beide categorieën tegelijk werden opgenomen (p. 23). De tabellen die horen bij de analyse zijn te vinden vanaf bladzijde 14 in bijlage 2.1b.
Tabel 8. Samenvatting model URL's Model 1
R ,382
R Square ,146
Adjusted R Square ,110
Std. Error of the Estimate 150,882
De variabelen binnen de categorie URL’s verklaren 11% van de variatie in de ranking van een website (zie tabel
8). De standaardafwijking is 150,882. Het model zal dus de ranking van een website in de ZRG voorspellen binnen een fout van ± 301,764 posities. Rekening houdend met de gemiddelde ranking van 209,62 is deze foutmarge behoorlijk groot. Verder verklaart het huidige model 17,7% minder dan de categorieën titels en URL’s samen en 10,4% minder dan het model waar enkel de parameters van de categorie titels zijn opgenomen. Ook de nauwkeurigheid van de schatting is bij titels en URL’s samen beter dan in dit model, de voorspellingsfout ligt 15,767 posities lager.
De globale F-toets wijst aan dat de alternatieve hypothese wordt aanvaard (p = 0,002 < alfa 0,05). Minstens één variabele heeft een significant effect op de ranking en bijgevolg is dit model bruikbaar.
Bij het uitvoeren van individuele t-toetsen van tabel 9, blijkt enkel de lengte van een URL significant (0,002). In het model waar titels en URL’s samen werden opgenomen was dit noch enkel de aanwezigheid van de zoekterm in de URL (‘URL keyword’). Terwijl de aanwezigheid van de zoekterm in de URL toen een positief effect had (79,765) en de ranking dus verhoogt, heeft deze variabele in dit model een negatief verband met de ranking in de ZRG (-5,124). In dit geval daalt de positie van een website in de ZRG wat positief is door het verhoogde verkeer dat deze website zal ontvangen (zie
Masterproef
Xavier Desmet
Pagina 28/48
Inleiding p. 1). Deze bevinding lijkt dan ook plausibeler dan de bevinding bij het model waar titels en URL’s samen werden opgenomen en stemt overeen met de literatuur. In huidig model heeft deze variabele wel een P-waarde van 0,898 wat ruim boven alfa (0,05) ligt.
Tabel 9. Coëfficiënten van de variabelen bij de categorie URL's Unstandardized Coefficients B
Std. Error
Standardized Coefficients
Uit tabel 9 kunnen we ook Sig.
Beta
aflezen
dat
de
URL
vriendelijkheid terug een
(Constant)
157,384
69,033
,024
URL_Vriendelijk
-30,832
19,812
-,170
,122
URL_Lengte
1,902
,604
,287
,002
met de ranking van een
URL_Domein
1,400
2,468
,049
,572
website (-30,832), doch niet
URL_keyword
-5,124
39,986
-,013
,898
significant is (0,122).
URL_LiggendStreepje
-1,337
,883
-,139
,133
sterk negatief verband heeft
De enige significante variabele, de lengte van een URL, heeft de meeste invloed op de afhankelijke yvariabele in dit model (0,287). Wanneer alle overige variabelen gelijk blijven en de URL lengte van een website met één karakter toeneemt, stijgt de verwachte ranking met gemiddeld 2 posities. Dus hoe korter de URL van een website, hoe voordeliger voor de positie van deze website in de ZRG van een bepaalde zoekterm.
Verder vormt de multicollineariteit ook in dit model geen enkel probleem. De laagste tolerantiewaarde bedraagt 0,594 met bijhorende VIF van 1,684 voor de variabele ‘URL vriendelijkheid’. Er zijn dus geen twee of meerdere sterk gecorreleerde onafhankelijke variabelen.
Ten slotte zijn de residuen normaal verdeeld. De P-waarde (0,067) is groter dan alfa (0,05) en dus wordt de nulhypothese aanvaard. Zie tabel bij ‘NPar Tests’ in bijlage 2.1b.
Masterproef
Xavier Desmet
Pagina 29/48
3.2.2 Keywords De derde categorie is de SEO-basistechniek die in de literatuur als belangrijkste wordt aanzien, namelijk keywords. Deze techniek bestaat uit negen variabelen waarvan er twee een berekening zijn. ‘Keyword aantal som’ is immers de som van variabele ‘keyword aantal’ (aantal keer keyword voorkomt op de webpagina) en ‘keyword aantal variant’ (aantal keer variant van het keyword voorkomt). Met variant wordt bedoeld het verkleinwoord of het meervoud van een woord, of leestekens direct na een woord (dit wordt door zoekmachines namelijk niet als eenzelfde woord geïnterpreteerd). ‘Keyword dichtheid som’ is de som van de ‘keyword dichtheid’ met de dichtheid van de variant van het keyword. Keyword dichtheid (variant) staat voor het aantal keer (een variant van) een keyword voorkomt gedeeld door het aantal woorden op de webpagina (exclusief stopwoorden).
Eerst zullen deze negen variabelen samen opgenomen worden, met bijzondere aandacht voor de multicollineariteit van deze berekeningen. In het tweede model worden de twee berekende variabelen weggelaten, om in het derde model enkel deze twee berekende variabelen op te nemen en de variabelen die de som vormen weg te laten. Door het vergelijken van deze modellen wordt het optimale model gekozen om verdere berekeningen mee uit te voeren.
Bij uitvoering van het eerste model, kan meteen geconstateerd worden dat de multicollineariteit een grote rol speelt. De variabelen ‘keyword dichtheid’ en ‘keyword aantal totaal’ (som van keyword aantal en keyword aantal variant) werden door dermate lage tolerantie-waarden (net geen nul) automatisch uitgesloten van het model. Zie tabel ‘Excluded Variables’ in bijlage 2.2a op p. 19
Tabel 10. Samenvatting modellen Keywords Model
R
R Square
Adjusted R Square
Std. Error of the Estimate
1
,427
0,182
0,134
148,859
2
,389
0,151
0,116
150,428
3
,427
0,182
0,134
148,859
Model één en drie, verklaren dan ook beiden 13,4% van de variatie in de ranking van een website (zie tabel 10). Het enige verschil in deze modellen is dat in het eerste model,
de variabele ‘keyword dichtheid som’ wordt opgenomen. Terwijl er in model drie in plaats hiervan de variabele ‘keyword dichtheid’ wordt opgenomen. De standaardafwijking bij deze modellen bedraagt 148,859. De ranking van een website in de ZRG wordt bijgevolg voorspeld binnen een fout van ± 297,718 posities. Het tweede model verklaart slechts 11,6% van de variatie omtrent de ranking en ook de standaardafwijking is hier minder goed (150,428). Dit model, waar enkel de totalen
Masterproef
Xavier Desmet
Pagina 30/48
opgenomen zijn i.p.v. de afzonderlijke aantallen, wordt dan ook niet gekozen om mee verder te werken. De globale F-toetsen wijzen in alle drie de modellen aan dat de nulhypothese verworpen wordt, en de alternatieve hypothese wordt aanvaard (p = 0,001 < alfa 0,05). De modellen zijn dus allen bruikbaar en er is telkens minstens één variabele die een significant effect heeft op de ranking.
Het verschil tussen het eerste en het derde model is miniem, toch wordt er geopteerd voor het derde model aangezien alle variabelen hier worden opgenomen behalve de twee totalen, die geen bijdrage leveren aan het model. De gestandaardiseerde coëfficiënten zijn bij deze variabelen namelijk het laagst (-0,006 en 0, zie bijlage 2.2a op p. 19 tabel ‘Coefficients’). Bij het eerste model wordt overigens door ‘keyword dichtheid variant’ en ‘keyword dichtheid som’ samen op te nemen, dezelfde aantallen tweemaal meegeteld.
Vervolgens wordt het derde model van dichterbij bekeken (zie tabel 11). Uit individuele t-toetsen op de onafhankelijke variabelen die de meeste invloed hebben, blijkt dat enkel het aantal verschillende titels of koppen waarin een keyword voorkomt (‘keyword aantal titel’, bv. h1 header, alt tag, etc.), het aantal keer het keyword voorkomt in de meta-omschrijving tag en de dichtheid van de variant van het keyword significant zijn.
Tabel 11. Coëfficiënten van de variabelen bij de categorie Keywords Unstandardized Coefficients B (Constant)
Standardized Coefficients
Std. Error
-0,117
0,185
(-0,316), hierna komen
21,075
0,221
0,012
-31,973
10,542
-0,316
0,003
Keyword_Aantal
-0,164
0,219
-0,124
0,457
en ‘keyword dichtheid
Keyword_Dichtheid
-0,416
8,403
-0,005
0,961
variant’.
Ook
0,507
0,295
0,322
0,088
variabele
die
-43,756
19,809
-0,26
0,029
hoeveel
keer
Keyword_Aantal_Titel
Keyword_Aantal_Variant Keyword_Dichtheid_Variant
-52,21
39,135
53,53
variabelen de meeste
Beta
invloed op de ranking
Keyword_Aantal_Meta
46,196
heeft van deze drie
Sig.
0
Keyword_In_Titel
301,831
‘Keyword aantal titel’
‘keyword aantal meta’
de meet een
variant van het keyword voorkomt heeft het sterkste verband met de ranking (0,322). Hoewel deze (net) niet significant is en we de nulhypothese dus dienen te aanvaarden (0,088 > 0,05 H0 verschilt niet voldoende van nul), is het interessant om de variabele te bespreken. Deze staat namelijk haaks op de variabele ‘keyword dichtheid variant’ die wel significant is. Per procent dat de dichtheid van de
Masterproef
Xavier Desmet
Pagina 31/48
variant van het keyword stijgt, verbeterd de verwachte ranking van deze website gemiddeld met afgerond 44 posities indien alle overige opgenomen variabelen gelijk blijven. Het totaal aantal woorden (exclusief stopwoorden) is echter niet opgenomen in dit model. Indien het totaal aantal woorden bijvoorbeeld 100 bedraagt, is het in deze steekproef niet verstandig om een variant van de zoekterm op te nemen.6 Enkel bij kleine webpagina’s, met een totaal aantal woorden kleiner dan 86 (43,756 / 0,507), draagt het opnemen van varianten van zoektermen bij tot de ranking van een website in de zoekresultaten van Google.
Verder betekent de ongestandaardiseerde coëfficiënt van de variabele keyword aantal titel, dat per verschillende soort titel waarin een keyword aanwezig is, dit de ranking van een website verbetert (daalt dus) met 32 posities. Met verschillende koppen of titels wordt verstaan: titels tags, h1, h2 … h6 tags, alt tag (zie p. 13), etc.
De laatste significante x-parameter die nog niet werd besproken is ‘keyword aantal meta’. Per keer de zoekterm voorkomt in de meta-omschrijving tag stijgt het aantal posities van de website in de ZRG met 54. Volgens dit model komt het keyword dus beter niet voor in de meta-omschrijving tag. Maar eerdere bevindingen wezen aan dat meta-omschrijving tags relevant dienen te zijn, anders neemt Google hen niet op en stijgt de ranking van een website (zie p. 24). Indien deze niet relevant is, kiest Google zelf relevante tekst uit de webpagina om in deze meta-omschrijving tag te plaatsten. Ook niet-relevante meta-omschrijving tags kunnen in sommige gevallen toch opgenomen worden, maar bezoekers zullen deze site dan ook niet aanklikken aangezien hun vraag niet wordt beantwoord. Website-eigenaars hebben op deze bevinding dus weinig impact. Er wordt geadviseerd om de zoekterm minimum één keer en maximaal twee keer op te nemen in de meta-omschrijving tag.
Multicollineariteit werd eerder besproken en vormt door het weglaten van de variabelen ‘keyword aantal som’ en ‘keyword dichtheid som’ geen probleem meer. De hoogste VIF-waarde en laagste tolerantie-waarde bedragen 5,063 en 0,198 voor de variabele ‘keyword aantal variant’.
De P-waarde voor de Kolmogorov-Smirnov Test bedraagt 0,092; wat groter is dan 0,05 (alfa). De residuen zijn dus normaal verdeeld. Ook grafisch is dit terug zichtbaar aan het histogram en de normal P-Plot (zie bijlage 2.2c).
6
Want dan is de marginale opbrengst ( deze variabele voorkomt. Masterproef
43,756 = 100
0,438) kleiner dan marginale kost (0,507) per keer
Xavier Desmet
Pagina 32/48
3.2.3 Links De laatste basistechniek die wordt besproken is de categorie links. Links houden in dat websites doorverwijzen of koppelen naar een andere webpagina, wat zowel intern als extern het domein7 van een website kan zijn. Meer informatie zie ‘Hyperlinks’ pagina 11 en ‘Links’ op bladzijde 14.
In deze steekproefomvang bestaan Links uit 12 parameters. Deze zullen allen opgenomen worden als onafhankelijk x-variabelen in volgend model. De variabelen met hun omschrijving zijn terug te vinden in bijlage 1 ‘Onderzochte variabelen’ (tabel 24).
Tabel 12. Coëfficiënten van de variabelen met multicollineariteitsprobleem bij de categorie Links
Uit Unstandardized Coefficients B (Constant)
Standardized Coefficients
Std. Error
Collinearity Statistics Sig.
Beta
Tolerance
VIF
eerste
analyses
uitvoering van dit
0
na
model
384,444
75,154
Links_Uniek
-0,337
0,588
-0,2
0,568
0,049
20,388
(tabel
Links_Extern
0,078
0,08
0,342
0,328
0,05
20,175
blijkt
Links_Domein
-5,83E-08
0
-0,017
0,98
0,012
82,468
Links_Domein_Uniek
-3,77E-05
0
-0,084
0,905
0,012
82,015
12), echter
meteen dat de resultaten
verwarrend zijn (zie ook tabel 13: R² en R2a ).
‘Links uniek’ en ‘links extern’ hebben erg lage tolerantie-waarden (0,049 en 0,05) en hoge bijhorende VIF-waarden (20,388 en 20,175). Ook links domein en links domein uniek hebben een hoge onderlinge afhankelijkheid (VIF-waarden van 82,468 en 82,015).
Om deze twee multicollineariteitsproblemen op te lossen dient er telkens één van de twee variabelen uit het model genomen te worden. De variabelen die minst bijdraagt aan de verklaring van de afhankelijke variabele ranking wordt uit het model gezet. Hiervoor wordt er eerst gekeken naar de gestandaardiseerde coëfficiënten en vervolgens wordt er getoetst welke variabelen het beste model verkrijgen door elke combinatie van variabelen te onderzoeken. In bijlage 2.3 vanaf p. 27 zijn alle modellen met hun relevante tabellen te vinden.
7
Het domein van de webpagina ‘zoekmachine.be/seo.html’ is ‘zoekmachine.be’.
Masterproef
Xavier Desmet
Pagina 33/48
Bij het eerste multicollineariteitsprobleem tussen links uniek en links extern, heeft links uniek het minste effect op de ranking (-0,2 tegenover 0,342 van links extern). In het tweede probleem heeft links domein (-0,017) het minste effect (ten opzichte van -0,084). Het beste model zou bijgevolg moeten voortkomen uit het enkel opnemen van links extern en links domein uniek. Of dit werkelijk ook zo is, wordt hieronder getoetst aan de hand van R² en de aangepaste R².
Tabel 13. Samenvatting modellen Links Model
R
R Square
Adjusted R Square
Std. Error of the Estimate
Bij het opnemen van alle variabelen (model nul tabel 13) verklaart het
0
,567
0,321
0,249
138,607
1
,562
0,315
0,256
137,987
2
,565
0,319
0,26
137,596
betreffende de ranking. Dit terwijl R²
3
,565
0,319
0,26
137,622
nog 32,1% verklaart, wat al wijst op
4
,561
0,315
0,256
138,02
model
24,9%
onderlinge
van
verbanden
de
variatie
tussen
de
opgenomen onafhankelijk parameters.
Uit globale F-toetsen blijkt dat alle vijf de modellen bruikbaar zijn (P-waarde telkens 0,000). Er bestaat in de vijf gevallen steeds minstens één coëfficiënt die een betekenis verband heeft met de ranking van een website.
Het eerste model is een model zonder de variabelen ‘links extern’ en ‘links domein’. Deze heeft een R2a van 25,6%, wat evenveel is als het vierde model dat de variabelen ‘links extern’ en ‘links domein uniek’ niet heeft opgenomen. Hoewel deze modellen al meer verklaren dan bij het tegelijk opnemen van alle variabelen, zijn deze opties duidelijk niet de beste combinaties van variabelen voor het oplossen van de verschillende multicollineariteitsproblemen. Modellen twee (zonder ‘links uniek’ en ‘links domein’) en drie (zonder ‘links uniek’ en ‘links domein uniek’) verklaren beiden 26% van de variatie van de ranking van een website. Het tweede model, dat volgens de gestandaardiseerde coëfficiënten de beste combinatie is, heeft ook de laagste standaardafwijking (137,596; zie tabel hierboven). Dit wil zeggen dat dit model de ranking van een website zal voorspellen met de laagste foutenmarge (± 275,192). Het tweede is derhalve het beste model om mee verder te werken.
Er kan aansluitend gezocht worden welke variabelen van dit model de meeste impact hebben op de ranking en of deze significant zijn. In bijlage 0 op p. 31 zijn relevante tabellen en figuren terug te vinden.
Masterproef
Xavier Desmet
Pagina 34/48
Tabel 14. Coëfficiënten van de variabelen bij de categorie Links Unstandardized Coefficients B (Constant)
Standardized Coefficients
Std. Error
De enige significante variabele (0,000) in de categorie links is
Sig.
Beta
de score op 100 die een
386,3
73,945
Links_Aantal
0
0,003
0,004
0,966
Links_Extern
0,035
0,026
0,154
0,174
Links_Extern_Totaal
0,381
0,485
0,075
0,435
heeft ook de sterkte invloed op
Links_Domein_Uniek
-5,27E-05
0
-0,117
0,303
de ranking van een website
Links_Score_Domein
-0,382
0,763
-0,051
0,618
(-0,549). De verwachte ranking
Links_Score_Pagina
-4,462
0,952
-0,549
0,000
van een website in de ZRG daalt
0,001
0,083
0,002
0,987
-0,818
0,845
-0,081
0,335
0,55
0,47
0,096
0,244
indien de score (op 100) stijgt
-0,725
1,076
-0,054
0,502
met één. Alle overige variabelen
Links_URL Links_Uniek_URL Links_Titel Links_Juice
0
webpagina krijgt o.b.v. link metrieken (Moz, 2014b). Deze
gemiddeld met 4,462 posities
zijn sterk niet significant en zullen dan ook niet in detail besproken worden.
Multicollineariteit is door het weglaten van de variabelen ‘links uniek’ en ‘links domein’ in orde. De laagste tolerantie-waarde en de hoogste VIF-waarde bedragen nog 0,432 en 2,317 voor de variabele ‘links score pagina’.
In dit model is er voor het eerst een outlier (uitschieter), zie bijlage 2.3c p. 31 tabel ‘Casewise Diagnostics‘. Dit zijn websites waarvan de verwachte ranking hoger is dan drie maar de standaardafwijking8 van het model. In dit specifieke geval is de verwachte ranking van de website 58,15 op basis van de opgenomen categorie links, maar heeft de website9 een eigenlijke ranking van 414,849 (3,015 keer de standaardafwijking). Indien deze website in detail bekeken wordt kan gezien worden dat deze website erg goed scoort in de categorie links, met een pagina score van 76 op een gemiddelde van 25 (zie tabel ‘Descriptive Statistics’ in bijlage 2.3a op bladzijde 27). De verklaring voor deze bevinding kan gevonden worden in de categorie keywords. Deze website bezit de zoekterm ‘verzekering’, waarop gezocht werd in Google, slechts één keer. Het gaat hier bijgevolg niet om een fout, dus moet de website niet uit de steekproefomvang genomen worden.
Ter afsluiting wijzen de gestandaardiseerde residuen van het model er op dat de verdeling significant is met de normale verdeling, aangezien de P-waarde van de Kolmogorov-Smirnov Test 0,066 bedraagt (is groter dan alfa 0,05). De nulhypothese wordt aanvaard. 8 9
137,596 x 3 = 412,788 https://www.rabobank.nl/bedrijven/
Masterproef
Xavier Desmet
Pagina 35/48
3.2.4 Controlevariabelen Ten slotte worden de controlevariabelen opgenomen in één model. Deze zijn in deze studie verwerkt aangezien zo de ranking van een website beter verklaard kan worden in 3.2.5 bij het opnemen van alle paramaters tegelijk. Controlevariabelen kunnen ook een invloed hebben op de ranking van een website en kunnen tot nieuwe inzichten leiden. Allereerst worden deze samengenomen, om vervolgens de verschillende onderdelen binnen de categorie te bespreken. Bijhorende tabellen zijn telkens te vinden in bijlage 2.4 ‘Controlevariabelen’ vanaf bladzijde 36.
Tabel 15. Coëfficiënten Controlevariabelen
van de variabelen met multicollineariteitsprobleem bij de categorie
Unstandardized Coefficients Std. Error
B (Constant)
Standardized Coefficients
Sig.
Beta
Tolerance
463,825 190,677
Snelheid
Collinearity Statistics VIF
Ook hier is terug een multicollineariteitsprobl eem (zie tabel 15). De
0,017
variabelen
-1,309
2,141
-0,064
0,542
0,679
1,472
0,253
2,456
0,023
0,918
0,15
6,682
Mobiel_Bruikbaar
80,146
75,104
0,25
0,288
0,135
7,385
bruikbaar’,
Mobiel_Ervaring
-1,263
2,201
-0,136
0,567
0,133
7,521
ervaring’
Mobiel_Snelheid
-2,038
2,54
-0,168
0,424
0,17
5,897
Snelheidsscore
‘snelheidsscore’, ‘mobiel ‘mobiel en
‘mobiel
snelheid’ liggen dicht bij
de drempel van 0,1 voor tolerantie-waarden en 10 voor de VIF-waarden. Dit zorgt terug voor verwarrende resultaten en verkeerde interpretaties. Bovendien blijkt uit de globale F-toets dat het model niet bruikbaar is (P-waarde 0,076 > 0,05 H0 wordt verworpen, zie bijlage 2.4a op p. 36). Er dienen dus parameters uit het model gelaten te worden.
Een eerste parameter die al zeker weggelaten kan worden is de snelheidsscore, aangezien deze sterk correleert met de variabele snelheid (in seconden). De tweede parameter, die het multicollineariteitsprobleem bij de mobiele parameters dient op te lossen, is ofwel de mobiele bruikbaarheid ofwel de mobiele ervaring (VIF-waarde telkens groter dan 7).
Model 0 1 2
3
R
,416 ,405 ,415 ,412
Adjusted R R Square Square
0,173 0,164 0,173 0,17
0,068 0,067 0,077 0,082
Std. Error of the Estimate
154,402 154,497 153,718 153,265
Tabel 16. Samenvatting Controlevariabelen
modellen
In model nul van tabel 16 werden alle variabelen opgenomen. Van de 17,3% in R² blijft in R2a slechts 6,8% over. Alle controlevariabelen
samen
verklaren
dus maar 6,8% van de variatie in de ranking van een website.
Masterproef
Xavier Desmet
Pagina 36/48
In het eerste model werd de parameter ‘mobiel bruikbaar’ weggelaten. R2a bedraagt in dit geval nog 6,7%. In het tweede model werd de snelheidsscore weggelaten. De aangepaste R² is aanzienlijk verbeterd in deze situatie (7,7%), maar het model is nog steeds niet bruikbaar (F-toets: P-Waarde = 0,052 > alfa). In het derde model werden de snelheidsscore en de mobiele ervaring (laagste gestandaardiseerde β) tegelijk uit het model weggelaten en hier wordt 8,2% van de variatie in de ranking van een website verklaard. Ook de globale F-toets wijst hier uit dat het model bruikbaar is (Pwaarde = 0,038; zie bijlage 2.4a.iii op p. 39). Op basis van dit model kan bijgevolg geanalyseerd worden welke parameters significant zijn.
Tabel 17. Coëfficiënten van de variabelen bij de categorie Controlevariabelen Unstandardized Coefficients B (Constant)
Std. Error
Standardized Coefficients
Uit de individuele t-toetsen Sig.
Beta
van de parameters in tabel 17 blijkt dat zowel ‘domein
388,602
131,704
-0,016
0,007
-0,22
0,018
-24,452
45,649
-0,05
0,593
Sitemap
25,54
32,036
0,079
0,427
waardes < 0,05). ‘Sociale
Afbeelding_Alt
1,139
0,96
0,118
0,238
autoriteit domein’ heeft de
Kwaliteit_Pagina
-1,63
16,801
-0,009
0,923
meeste
-0,361
0,273
-0,141
0,188
-1,3
2,035
-0,064
0,524
Sociale_Media
11,861
10,779
0,11
0,273
Sociale_Auto_Pagina
-0,001
0,004
-0,015
0,876
(gestandaardiseerde
Sociale_Autoriteit_Domein
-0,002
0,001
-0,231
0,019
-0,231). Gevolgd door de
Mobiel_Snelheid
-1,773
1,241
-0,146
0,156
parameter ‘domein dagen’
Mobiel_Bruikbaar
40,577
31,053
0,127
0,194
Domein_Dagen Robots
Paginagrootte Snelheid
0,004
dagen’ als ‘sociale autoriteit domein’ significant zijn (p-
invloed
op
de
ranking van alle opgenomen variabelen β
=
(-0,22). Deze variabele staat
voor het aantal dagen sinds de creatie van de domeinnaam. De verwachte ranking van een website zal naar schatting gemiddeld 0,016 posities dalen indien de datum van creatie van het domein één dag eerder ligt (wanneer alle overige variabelen constant blijven). Hoe ouder de domeinnaam, hoe beter.
De variabele ‘sociale autoriteit domein’ staat voor de gemiddelde interactie score op een domein, wat een berekening is van het totaal aantal interacties op de 5 platformen (Facebook, Twitter, LinkedIn, Google+ en Pinterest) samen gedeeld door vijf. Per stijging in de gemiddelde interactie van het domein van een website met een waarde van één, daalt de verwachte ranking van een website
Masterproef
Xavier Desmet
Pagina 37/48
met gemiddeld 0,002 (indien alle overige variabelen constant blijven). Hoe meer likes, reacties, enz. een domein krijgt, hoe voordeliger voor de positie van een website.
Multicollineariteit is in het begin van deze paragraaf reeds opgelost. Verder is de P-waarde van de Kolmogorov-Smirnov Test (0,001) kleiner dan alfa (0,05). De residuen wijken dus significant af van de normale verdeling (zie bijlage 2.4a.iii op p. 39). Dit kan voor problemen zorgen indien op basis van dit model simulaties worden gedaan omtrent de ranking van een website. Maar gezien dit model enkel tot doel heeft om de significante parameters af te leiden zodat deze in het volledige model kunnen weggelaten worden, vormt dit geen probleem.
Het kan nuttig zijn om te kijken welke onderdelen van de controlevariabelen nu de meeste invloed hebben op de ranking. De onderdelen bestaan uit: leeftijd (enkel uit Domein Dagen), crawlervriendelijkheid, laadsnelheid, sociale media en mobiele bruikbaarheid. De volledige onderverdeling en betekenis van elke parameter kan gevonden worden in bijlage 1 tabel 24. Tevens zijn alle relevante tabellen terug te vinden in bijlage 2.4b vanaf p. 41.
Tabel 18. Samenvatting modellen onderdelen categorie Controlevariabelen
Modellen
R Square
Adjusted R Square
,257 0,066
0,059
155,207 0,004
,130 0,017
-0,016
161,211 0,723
,132 0,017 ,124 0,015 ,020 0,000
-0,007 -0,001 -0,016
160,500 0,541 160,006 0,384 161,225 0,975
,277 0,077
0,054
155,592 0,021
,147 0,022 ,118 0,014 ,136 0,018
-0,002 -0,002 0,002
160,157 0,444 160,123 0,420 159,766 0,319
R
Std. Error of the Estimate
Pwaard e
Leeftijd Domein Dagen Crawler-vriendelijkheid Kwaliteit Pagina, Afbeelding Alt, Sitemap, Robots Laadsnelheid Snelheidsscore, Paginagrootte, Snelheid Snelheidsscore, Paginagrootte Snelheid, Paginagrootte Sociale media Sociale Autoriteit Domein, Sociale Media, Sociale Auto Pagina Mobiel bruikbaarheid Mobiel Snelheid, Mobiel Ervaring, Mobiel Bruikbaar Mobiel Ervaring, Mobiel Snelheid Mobiel Snelheid, Mobiel Bruikbaar
Uit tabel 18 blijkt dat er slechts drie modellen werkelijk iets bijdragen aan de variatie van de website ranking (aangepaste R² groter dan nul). Dit zijn de modellen van leeftijd, mobiele bruikbaarheid (met variabelen mobiel snelheid en mobiel bruikbaar) en sociale media. Hiervan zijn er twee modellen
Masterproef
Xavier Desmet
Pagina 38/48
bruikbaar (Globale F-toets: P-waarde < alfa). De leeftijd van een domein uitgedrukt in het aantal dagen verklaart de hoogste variatie in de ranking van een website (5,9%), gevolgd door de opgenomen variabelen in het onderdeel sociale media (sociale autoriteit domein, sociale media en sociale autoriteit pagina verklaren 5,4%).
Tot hier de bespreking van de categorie controlevariabelen. In volgende paragraaf worden alle hiervoor besproken categorieën opgenomen in één model.
3.2.5 Alle categorieën samen Nu de verschillende categorieën werden besproken (zie 3.2.1 p. 23 t.e.m. 3.2.4 p. 36) en geconstateerd is welke parameters best niet opgenomen mogen worden, kunnen deze verschillende modellen in één model gegoten worden. Volgende vragen kunnen in deze paragraaf beantwoordt worden. Hoeveel verklaren de basistechnieken (inclusief controlevariabelen) samen betreffende de ranking van een website? Welke individuele parameters zijn nog significant? Hoe nauwkeurig kan de ranking positie van een website worden voorspeld met het opnemen van alle categorieën, inclusief controlevariabelen?
Allereerst worden alle basistechnieken en controlevariabelen samengenomen, zonder rekening te houden met de multicollineariteit. Bijhorende relevante tabellen van de analyses zijn terug te vinden in bijlage 2.5a vanaf p. 48.
Tabel 19. Samenvatting model alle categorieën Model 1
R ,790
R Square
Adjusted R Square
0,624
0,373
Std. Error of the PEstimate waarde 126,679
Uit tabel 19 blijkt volgens de R² dat 62,4% van de variatie in
0,000
de ranking verklaart wordt door de opgenomen parameters x. R² houdt wel geen rekening met de steekproefgrootte n (126) en het aantal parameters β (of x) in het model (50). Na aanpassing bedraagt R² nog slechts 37,3%. Dit is al een eerste aanwijzing dat hier variabelen zijn opgenomen die niet bijdragen aan het model en/of onderling verbonden zijn met andere parameters. Pas als deze variabelen weggelaten zijn, kunnen de resultaten correct geïnterpreteerd worden.
Indien we vervolgens de multicollineariteit in detail gaan bekijken in dit model, zijn de variabelen ‘keyword dichtheid som’ en ‘keyword aantal totaal’ door dermate lage tolerantie-waarden (praktisch
Masterproef
Xavier Desmet
Pagina 39/48
nul) automatisch uitgesloten van het model. Dit wordt weergegeven in bijlage 2.5a p. 48 in de tabel ‘Excluded Variables’.
Ook andere parameters hebben respectievelijk lage tolerantie-waarden (< 0,1) en hoge VIF-waarden (> 10) of dragen weinig tot niets bij aan het model. Omwille van deze redenen, werden volgende variabelen uit het model gelaten: 10 o
‘Keyword aantal’: VIF van 10,022 en gestandaardiseerde β van 0,003
o
‘Keyword dichtheid variant’: correlatie met ‘keyword aantal variant’ (VIF 33,049) die meer bijdraagt aan het model (gestandaardiseerde β van -0,430 tegenover -0,089)
o
‘Header H2’: VIF van 17,952 en gestandaardiseerde β van -0,034
o
‘Links uniek’: VIF van 29,793 en gestandaardiseerde β van -0,228
o
‘Links extern totaal’: correlatie met ‘links extern’ (VIF 30,421) die meer bijdraagt aan het model (gestandaardiseerde β van 0,301 tegenover 0,061)
o
‘Links domein’: VIF van 101,237 en ongestandaardiseerde β dicht bij 0
o
‘Links domein uniek’: VIF van 102,2 en ongestandaardiseerde β 0
o
‘Links juice’: correlatie met ‘Links URL’ (VIF 17,784) die meer bijdraagt aan het model (gestandaardiseerde β van 0,553 tegenover -0,045)
o
‘Snelheidsscore’: VIF van 9,35 en gestandaardiseerde β van 0,003
o
‘Mobiel bruikbaar’: correlatie met ‘mobiel ervaring’ en ‘mobiel snelheid’ (VIF telkens > 9) die meer bijdragen aan het model (gestandaardiseerde β van 0,239 en -0,125 tegenover -0,075)
Tabel 20. Samenvatting model alle categorieën zonder multicollineariteitsprobleem Model 1
R ,783
R Square
Adjusted R Square
0,613
0,431
Std. Error of the Estimate 120,71
P-waarde
Door
het
voornoemde
weglaten
van
parameters
0,000
zitten er nog 40 verklarende onafhankelijke x variabelen in huidig model. Toch stijgt R2a van 37,3% naar 43,1% (met 5,8%). Alle categorieën samen verklaren 43,1% van de variatie in de positie van een website in de ZRG voor een bepaald keyword (zie tabel 20).
De gemiddelde ranking van een website is 209,62 (zie tabel ‘Descriptive Statistics’ in bijlage 2.5b op p. 52). Daarnaast is de standaardafwijking 120,71 (tabel 20). Dit model kan de ranking bijgevolg bepalen binnen een foutmarge van ± 241,42. 10
Op basis van tabel ‘Coefficients’ in bijlage 2.5a op p. 48.
Masterproef
Xavier Desmet
Pagina 40/48
De P-waarde voor de globale F-toets bedraagt 0,000. Indien we dit vergelijken met alfa (0,05), wordt de nulhypothese verworpen. Er is minstens één parameter met een significant effect op de ranking, dus is het model bruikbaar.
Het interactiemodel stelt het verband voor tussen E(y) en de 40 verklarende variabelen, dit wordt ook wel de kleinste-kwadraten-voorspellingsvergelijking genoemd (zie tabel 21 en tabel ‘Coefficients’ in bijlage 2.5b):
Ŷ = 839,644 - 271,992 * Titel_tag - 0,131 * Titel_Lengte - 12,361 * Titel_Vriendelijk + 67,684 * Meta_Tag - 0,017 * Lengte_Meta - 86,385 * Meta_Eigen - 65,509 * Meta_Vriendelijk - 0,595 * Header_H1 - 1,467 * Header_H3 - 3,063 * Header_H4 + 0,618 * Header_H5_H6 - 45,515 * URL_Vriendelijk + 0,526 * URL_Lengte + 1,037 * URL_Domein + 59,101 * URL_keyword - 2,344 * URL_LiggendStreepje - 93,555 * Keyword_In_Titel + 53,925 * Keyword_Aantal_Meta - 30,974 * Keyword_Aantal_Titel + 17,009 * Keyword_Dichtheid - 0,729 * Keyword_Aantal_Variant - 0,006 * Links_Aantal + 0,02 * Links_Extern - 1,713 * Links_Score_Domein - 2,358 * Links_Score_Pagina + 0,454 * Links_URL - 0,812 * Links_Uniek_URL + 0,438 * Links_Titel + 0,001 * Domein_Dagen + 10,946 * Robots - 27,667 * Sitemap + 0,561 * Afbeelding_Alt - 7,685 * Kwaliteit_Pagina - 0,153 * Paginagrootte - 1,716 * Snelheid + 18,657 * Sociale_Media + 0,001 * Sociale_Auto_Pagina + 0 * Sociale_Autoriteit_Domein + 1,47 * Mobiel_Ervaring - 1,348 * Mobiel_Snelheid
Met Ŷ = ranking van website En waarbij: de β’s (=ingevulde getallen) de verandering van E(y) voorstelt als de variabele met één eenheid toeneemt en alle overige variabelen constant blijven. Voorbeeld: de verwachte ranking van een website zal naar schatting gemiddeld 86,385 dalen, indien de website een eigen meta-omschrijving tag heeft in de ZRG van een bepaalde zoekterm. Een daling van de ranking betekent in dit model dat de ranking verbeterd (van pagina 10 op positie één, naar pagina één van zoekresultaten op positie 4).
Via dit interactiemodel kan de ranking van een website voorspeld worden (mits foutenmarge). Door alle variabelen samen op te nemen in één model, wordt het PageRank algoritme van Google gesimuleerd (zie p. 5).
Vooraleer er onderzocht kan worden welke parameters de meeste impact hebben op de ranking, dient nagegaan te worden aan de hand van individuele t-toetsen welke variabelen significant zijn.
Masterproef
Xavier Desmet
Pagina 41/48
Tabel 21. Coëfficiënten van de variabelen bij het Globale Model Unstandardized Coefficients B
Standardized Coefficients
Std. Error
Sig.
Beta
Collinearity Statistics Tolerance
VIF
(Constant)
839,644
335,422
Meta_Tag
67,684
35,698
0,198
0,061
0,419
2,388
Meta_Eigen
-86,385
34,463
-0,269
0,014
0,394
2,536
Meta_Vriendelijk
-65,509
22,831
-0,247
0,005
0,617
1,621
URL_Vriendelijk
-45,515
19,114
-0,252
0,019
0,408
2,45
-2,344
1,067
-0,243
0,031
0,371
2,696
-93,555
40,966
-0,21
0,025
0,538
1,858
Keyword_Aantal_Meta
53,925
21,853
0,223
0,016
0,558
1,791
Keyword_Aantal_Titel
-30,974
11,894
-0,306
0,011
0,329
3,037
Keyword_Dichtheid
17,009
8,476
0,203
0,048
0,445
2,245
Keyword_Aantal_Variant
-0,729
0,358
-0,463
0,045
0,088
11,336
Links_Score_Domein
-1,713
1,102
-0,23
0,124
0,208
4,819
Links_Score_Pagina
-2,358
1,09
-0,29
0,033
0,254
3,943
0,454
0,238
0,492
0,06
0,069
14,563
URL_LiggendStreepje Keyword_In_Titel
Links_URL
0,014
Uit tabel 21, valt af te lezen dat er 10 parameters significant zijn. De P-waarden bij de individuele ttoetsen van deze parameters is telkens kleiner dan alfa (0,05). Dit betekent dat de nulhypothese, die stelt dat de variabele niet significant afwijkt van nul (0), verworpen wordt. Er is dus een significant verband tussen de variabelen en de ranking van een website in de ZRG voor een bepaald keyword.
De significante parameter met de hoogste absolute waarde van alle gestandaardiseerde coëfficiënten en dus het meeste effect uitoefent op de ranking van een website is ‘keyword aantal variant’ (-0,463). De verwachte ranking van een website zal naar schatting gemiddeld met 0,729 dalen, indien er één extra variant van de zoekterm in de webpagina voorkomt en alle overige variabelen constant blijven. Er dient wel rekening gehouden worden met de dichtheid van het aantal keer dit keyword voorkomt (zie p. 31 en 32). Zo loont het niet altijd de moeite om varianten op te nemen van het keyword. Enkel bij webpagina’s met een beperkt totaal aantal woorden (exclusief stopwoorden) waar anders de dichtheid van het keyword zelf te hoog zou zijn, kan dit nuttig zijn.
Ook de aanwezigheid van een meta tag en het gebruik van die tag door Google stemt overeen met de eerdere bevindingen op p. 24 en 25. Ondanks de aanwezigheid van een meta-omschrijving tag net niet significant is (0,061), wijst dit er op dat het louter bestaan van een meta-omschrijving tag niet bijdraagt aan de ranking van deze website (positief effect van 67,684). Pas als de meta tag gebruikt wordt door Google, verbetert (daalt) de ranking (verschil van 18,701). De meta-omschrijving tag dient bijgevolg relevant te zijn voor het keyword, zodat Google deze opneemt in de zoekresultaten.
Masterproef
Xavier Desmet
Pagina 42/48
Tevens hebben de meta- en URL vriendelijkheid een sterke negatieve invloed op de ranking net zoals in paragraaf 3.2.1 vanaf pagina 23 (-65,509 en -45,515). De interpretatie van de meta vriendelijkheid: de verwachte ranking van een website zal naar schatting gemiddeld dalen met 65,509 posities indien de meta vriendelijkheid stijgt met een score van één (op een schaal van twee), wanneer alle overige variabelen constant blijven. URL vriendelijkheid kan analoog geïnterpreteerd worden, maar dan op een schaal van nul tot drie. Het is dus de moeite waard om in URL’s geen overbodige woorden, cijfers, spaties, liggende streepjes of tekens te gebruiken en woorden telkens beginnen met een hoofdletter en scheiden met een koppelteken. Daarnaast dienen meta-omschrijving tags relevant te zijn zodat Google hen opneemt en mogen ze geen quotes of andere speciale tekens bevatten. Google kan deze namelijk (nog) niet interpreteren.
De bevindingen van de parameters ‘keyword aantal titel’ en ‘keyword in titel’ stemmen eveneens overeen met de resultaten in paragraaf 3.2.2 op p. . Alleen is in dit model ‘keyword in titel’ wel significant (0,025) terwijl dit toen niet het geval was. Beide parameters wijzen erop dat het voorkomen van keywords in alle koppen op de pagina zorgt voor een betere notering van een website in de ZRG voor dat specifieke keyword. In het bijzonder zorgt de aanwezigheid van het keyword in de titel tag voor een erg sterke verbetering (daling) van de ranking (met gemiddeld 93,555 posities).
De laatste belangrijke parameter die wordt besproken is ‘links score pagina’. Dit is de enige significante parameter binnen de categorie ‘links’. Per verbetering van deze score met één (op 100), daalt de ranking van een website in de zoekresultaten van Google met gemiddeld 2,358 plaatsen. Hoe meer (unieke) links naar een webpagina, hoe beter.
Multicollineariteit vormt ondanks het weglaten van sterk onderling gecorreleerde- en weinig bijdragende parameters bij ‘keyword aantal variant’ en ‘links URL’ een probleem. De VIF-waarden bedragen bij deze variabelen meer dan 10 (respectievelijk 11,336 en 14,563). Maar indien deze variabelen weggelaten worden uit het model, verlaagt de aangepaste R² aanzienlijk (naar 41,7). De gestandaardiseerde coëfficiënten zijn bij deze twee parameters namelijk het hoogst en dragen dus het meest bij aan de voorspelling van de website ranking.
Tot slot geeft de Kolmogorov-Smirnov Test aan dat de residuen normaal verdeeld zijn. De nulhypothese wordt aanvaard. De gestandaardiseerde residuen wijzen er namelijk op dat de verdeling significant is met de normale verdeling (p = 0,200 > 0,05). Ook grafisch is dit zichtbaar in het histogram en de normal P-Plot op bijlage 2.5b bladzijde 52.
Masterproef
Xavier Desmet
Pagina 43/48
3.3 Conclusie van de analyse Nu alle modellen opgesteld en geanalyseerd zijn, kunnen ze onderling vergeleken worden om de onderzoeksvraag “Welke SEO-basistechniek heeft het meeste effect op de ranking van een website in de zoekresultaten van Google?” te beantwoorden. In tabel 22 wordt er een overzicht gegeven van de modellen. Voor het interpreteren en het vergelijken van modellen onderling is zoals eerder vermeld de aangepaste R² (R2a ) de beste optie. Voornamelijk gezien deze de steekproefgrootte n en het aantal opgenomen parameters β, die kunnen variëren tussen de verschillende modellen, in rekening brengt.
Model / Categorie
R
R Square
Adjusted R Square
Std. Error of the Estimate
Tabel 22. Samenvatting alle modellen
Titels en URL's
,619
0,384
0,287
135,115
Titels
,538
0,29
0,214
141,784
URL's
,382
0,146
0,11
150,882
Keywords
,427
0,182
0,134
148,859
gezien,
meeste variatie in de ranking
Indien titels en URL’s als eenzelfde categorie worden verklaren
ze
de
Links
,565
0,319
0,26
137,596
Controlevariabelen
,412
0,17
0,082
153,265
Leeftijd
,257
0,066
0,059
155,207
Sociale media
,277
0,077
0,054
155,592
de
Alles samen
,790
0,624
0,373
126,679
standaardafwijking (135,1).
Optimale model
,783
0,613
0,431
120,71
Titels en URL’s samen zijn
(28,7%). Tevens hebben ze laagste
bijgevolg de belangrijkste SEO-basistechniek om in acht te nemen. Hierna volgt de categorie links met 26% (s = 137,596). De op twee na belangrijkste techniek zijn de keywords (13,4% en s= 148,859). De controlevariabelen hebben samen een R2a van 8,2% (s= 153,265). De enige twee significante onderdelen binnen deze categorie zijn leeftijd en sociale media en verklaren respectievelijk 5,9% en 5,4% van de variatie in de ranking van een website (standaardafwijking van 155,207 en 155,592).
Wanneer Titels en URL’s echter als aparte categorieën worden gezien, hebben links de hoogste aangepast R² (26%). Gevolgd door titels (21,4%), die 4,6% minder verklaren van de variatie in de ranking van een website. Op de derde plaats staat dan de categorie keywords, die 12,6% minder verklaren dan links. Daarna komen URL’s (11%) en de opgenomen controlevariabelen (8,2%).
Terwijl in de literatuur gesteld wordt dat keywords de belangrijkste basistechniek bij zoekmachineoptimalisatie zijn, komen ze in voorgaande analyses pas op de derde plaats. Volgens verschillende studies volgen links op de tweede plaats en titels op de derde (zie 1.4 ‘Overzicht bestaande studies’ op p. 15). Deze bevindingen, die vaak niet statistisch of wetenschappelijk ondersteund zijn, worden bijgevolg niet bevestigd. De opgestelde hypothese, die vanuit de resultaten in de literatuur vertrekt, wordt verworpen.
Masterproef
Xavier Desmet
Pagina 44/48
In tabel 23 is een overzicht gegeven van alle individuele parameters die significant zijn in een bepaald model voor de verklaring van de ranking van een website in de ZRG van een bepaald keyword. In bijlage 1 ‘Onderzochte variabelen’ worden deze parameters omschreven (tabel 24).
Tabel 23. Overzicht alle significante parameters in modellen Unstandardized Coefficients B
Standardized Coefficients
Std. Error
In voorgaande analyses Sig.
Beta
(vanaf
paragraaf
3.2.1
t.e.m. 3.2.5) werden deze
Titel_Vriendelijk
-65,665
22,878
-0,294
0,005
Meta_Eigen
-86,385
34,463
-0,269
0,014
Meta_Vriendelijk
-65,509
22,831
-0,247
0,005
één besproken. Negatie-
URL_Vriendelijk
-45,515
19,114
-0,252
0,019
ve ongestandaardiseerde
1,902
0,604
0,287
0,002
bèta’s (β) staan voor een
URL_LiggendStreepje
-2,344
1,067
-0,243
0,031
URL_keyword
79,765
39,89
0,2
0,048
-93,555
40,966
-0,21
0,025
en dus een verbetering
Keyword_Aantal_Meta
53,925
21,853
0,223
0,016
van het aantal posities.
Keyword_Aantal_Titel
-30,974
11,894
-0,306
0,011
De website komt in dit
Keyword_Dichtheid
17,009
8,476
0,203
0,048
geval op eerdere pagina’s
Keyword_Aantal_Variant
-0,729
0,358
-0,463
0,045
-43,756
19,809
-0,26
0,029
Links_Score_Pagina
-2,358
1,09
-0,29
0,033
resultaten
Sociale_Autoriteit_Domein
-0,002
0,001
-0,231
0,019
bepaald keyword.
Domein_Dagen
-0,016
0,007
-0,22
0,018
URL_Lengte
Keyword_In_Titel
Keyword_Dichtheid_Variant
variabelen reeds één voor
daling van de ZM ranking
terecht
in
de
zoek-
van
een
De merkwaardigste bevinding was wellicht de parameter ‘URL keyword’. In het model waar titels en URL’s samen werden opgenomen had de aanwezigheid van de zoekterm in de URL toen een positief effect van 79,765 (zie 3.2.1). Dit impliceert dat de ranking met gemiddeld 79,765 posities verhoogt (dus achteruit gaat) indien de zoekterm voorkomt in de URL. In paragraaf 3.2.1b werd dit echter weer ontkracht door een negatief verband met de ranking in de ZRG (-5,124). In dit geval daalt de positie van een website in de ZRG, wat positief is door het verhoogde verkeer dat deze website zal ontvangen. Deze laatste bevinding lijkt dan ook plausibeler en staat in lijn met wat de literatuur aangeeft, al moeten we dit niet altijd als waar aannemen (zie analyse basistechnieken).
Aangezien alle modellen geanalyseerd en onderling vergeleken zijn, kan overgegaan worden naar het besluit van deze masterproef. Hierin zal eerst een overzicht gegeven worden van wat in deze studie juist gedaan werd. Vervolgens wordt de onderzoeksvraag (en hypothese) beantwoord en wordt er aangegeven waar verder onderzoek nuttig kan zijn.
Masterproef
Xavier Desmet
Pagina 45/48
Deel 4: besluit Het objectief van deze masterproef bestond erin om na te gaan welke SEO-basistechniek het meeste effect heeft op de ranking van een website in de zoekresultaten van Google. In bestaande studies is hieromtrent geen eenduidig antwoord te vinden. De hypothese die opgesteld werd vanuit de literatuur o.b.v. verschillende quoteringen, stelt dat het toepassen van keywords of zoektermen de belangrijkste basistechniek is bij zoekmachineoptimalisatie, gevolgd door het gebruiken van links en titels.
Om dit na te gaan was het vooreerst noodzakelijk om duidelijk te omschrijven hoe zoekmachines functioneren. Hierna werd de keuze voor de zoekmachine Google uitgelegd. Vervolgens werden de verschillende SEO-technieken in detail beschreven. Er werd een onderscheid gemaakt tussen twee basiselementen: on-page optimalisatie en off-page optimalisatie. Hier was het belangrijk om de verschillende parameters binnen deze technieken zo compleet mogelijk te kunnen verzamelen.
De analyses werden gebaseerd op eigen verzamelde data via een systematische aselecte steekproef van 126 websites om de externe validiteit of generaliseerbaarheid van de resultaten te vrijwaren. Deze websites werd nauwkeurig uitgekozen en gequoteerd op 54 parameters, onderverdeeld in vijf categorieën: titels, URL’s, keywords of zoektermen, links en controlevariabelen. Eerst werd er in elke categorie een meervoudige lineaire regressie uitgevoerd met de parameters die hierin thuishoren. Titels en URL’s werden zowel samen als apart onderzocht, gezien ze meestal als eenzelfde SEObasistechniek worden gezien in de literatuur. Per categorie kon zo nagegaan worden hoeveel procent van de variatie van de ranking van een website wordt verklaard door de opgenomen verklarende xparameters. In elk van de categorieën werd het optimale model gezocht. Tevens werd geanalyseerd welke (significante) variabelen binnen elke categorie het meeste effect hebben op de ranking, en hoe sterk deze de ranking beïnvloeden (positief of negatief).
Hierna werden alle variabelen uit de verschillende categorieën tegelijk opgenomen. Op deze manier kon geanalyseerd worden hoeveel deze samen verklaren over de positie van een website in de zoekresultaten van Google en welke individuele significante parameters de ranking het meest beïnvloeden. Het PageRank algoritme van Google werd op deze manier gesimuleerd. Tot slot werden de verschillende modellen onderling vergeleken om tot relevante resultaten te komen.
Masterproef
Xavier Desmet
Pagina 46/48
Het beantwoorden van de onderzoeksvraag “Welke SEO-basistechniek heeft het meeste effect op de ranking van een website in de zoekresultaten van Google?” kan opgesplitst worden in twee delen. Wanneer titels en URL’s als dezelfde categorie worden gezien, wordt vastgesteld dat de hypothese uit de literatuur niet bevestigd kan worden. Integendeel, uit de analyses blijkt dat indien titels en URL’s als eenzelfde categorie worden beschouwd, ze de meeste variatie in de ranking van een website verklaren en dus de belangrijkste basistechniek zijn (28,7%). Op twee komt de categorie links (26%) en op drie de keywords (13,4%). Verder verklaren de controlevariabelen samen 8,2% met als enige twee significante onderdelen binnen deze categorie ‘leeftijd’ en ‘sociale media' (respectievelijk 5,9% en 5,4%).
Wanneer vervolgens titels en URL’s echter als aparte categorieën worden gezien, zijn links de belangrijkste basistechniek (met 26%), gevolgd door titels (21,4%) en keywords (13,4%). Op de vierde plaats komen URL’s (11%) en daarna de opgenomen controlevariabelen (8,2%).
Terwijl in de literatuur gesteld wordt dat keywords de belangrijkste basistechniek bij zoekmachineoptimalisatie zijn, komen ze in voorgaande analyses pas op de derde plaats. De bevindingen uit de literatuur, die meestal niet statistisch of wetenschappelijk ondersteund zijn, worden bijgevolg verworpen.
Ook de individuele variabelen binnen elk van deze categorieën verschaffen interessante resultaten. Zo draagt het gebruik van een meta-omschrijving tag pas bij aan de ranking van een website als deze tag door Google werkelijk wordt opgenomen in de zoekresultaten van een bepaald keyword. Indien dit niet het geval is, heeft dit zelfs een negatief effect op de ranking. Verder is het bij webpagina’s die weinig woorden bevatten, aangeraden om ook een variant van het keyword waarvoor de site gevonden wil worden, op te nemen. En ten derde zorgt het voorkomen van keywords in verschillende koppen op de webpagina (h1, h2, … ,h6 tags, alt tags, etc.) voor een betere notering van een website in de ZRG voor dat specifieke keyword. In het bijzonder zorgt de aanwezigheid van het keyword in de titel tag voor een erg sterke verbetering. Daarnaast hebben ook tal van andere parameters een significante invloed en zijn ze voor website-eigenaars dus interessant om toe te passen. Deze kunnen teruggevonden worden op p. 42, 43 en in de resultaten van elke categorie (pagina’s 25, 28, 29, 32, 35 en 37).
Dit onderzoek heeft tevens enkele beperkingen. Ten eerste kan de keuze om de basistechnieken enkel aan de hand van Google te evalueren, een beperking zijn van dit onderzoek. De analyses kunnen echter meer generiek zijn en ook van toepassing zijn op de andere zoekmachines, maar enkel
Masterproef
Xavier Desmet
Pagina 47/48
verder onderzoek kan dit uitwijzen. Eveneens is het niet opnemen van de basistechniek ‘kwaliteit van de inhoud’ een beperking van deze studie. Indien hier een objectieve methode voor wordt gevonden om deze SEO-basistechniek te analyseren zijn ook hier verdere onderzoeken aangewezen. Ten derde zou de steekproefomvang een beperking kunnen zijn, hoewel deze nauwkeurig werd bepaald (n= 126). In verder onderzoek zou het interessant kunnen zijn om de steekproef uit te breiden en voorgaande bevindingen te toetsen.
Om af te sluiten dient nog eens vermeld te worden dat zoekmachines hun ranking algoritmes steeds bijschaven. SEO is dan ook geen eenmalige gebeurtenis, maar een continu proces dat steeds weer aangepast en verbeterd dient te worden. Enkel de basistechnieken bleven doorheen de tijd dezelfde. Om ervoor te zorgen dat de resultaten van deze studie in de toekomst bruikbaar blijven, werden hoofdzakelijk de belangrijkste basistechnieken onderzocht. Door de resultaten in deze verhandeling kunnen website-eigenaars meer aandacht besteden aan titels, URL’s (eenvoudig, doch grote invloed) en links, dan aan de overige technieken.
Masterproef
Xavier Desmet
Pagina 48/48
Referenties 8 Ways Media. (2015). 3 SEO techniques that Remain Important in 2015. Retrieved April 25, 2015, from http://www.8ways.ch/en/news/3-seo-techniques-remain-important-2015/ Ahuja, R. (2013). 10 Best SEO Techniques of All Time and Will Remain In Future. Retrieved May 2, 2015, from http://www.earningguys.com/seo/techniques/ Baye, M. R., De los Santos, B., & Wildenbeest, M. R. (2013). Search Engine Optimization: What Drives Organic Traffic to Retail Sites? SSRN Electronic Journal. Callaert, H. (n.d.). Steekproefmethoden. Universiteit Hasselt. Retrieved from http://www.uhasselt.be/documents/uhasselt@school/lesmateriaal/statistiek/Lesmateriaal/Ste ekproefmethoden_04.pdf Cambridge University Press. (2008). Dropping common terms: stop words. Retrieved July 17, 2015, from http://nlp.stanford.edu/IR-book/html/htmledition/dropping-common-terms-stop-words1.html College Of Marketing. (2014). Search Engine Usage Statistics. Retrieved February 24, 2015, from http://www.collegeofmarketing.com/seo-guide/search-engine-usage/ Costill, A. (2014). How Important is Site Speed in 2014? Search Engine Journal. Retrieved from http://www.searchenginejournal.com/seo-101-important-site-speed-2014/111924/ Cutts, M. (2010). Does Domain Age Really Matter? Retrieved June 6, 2015, from http://rapidwebseo.com/matt-cutts-does-domain-age-really-matter.php Developer Shed. (2014). Domain Age Checker. Retrieved July 9, 2015, from http://tools.seochat.com/tools/domain-age/ Dion, J. (2015). SEO 101: Optimize Your Images and Make Them #SEO Rockstars in 4 Steps. Retrieved July 22, 2015, from http://www.searchenginejournal.com/seo-101-optimize-images-make-seorockstars-4-steps/136290/ Enge, E., Spencer, S., Stricchiola, J., & Fishkin, R. (2012). The Art of SEO (Vol. 6). O’Reilly Media, Inc. Gecko Gully. (2014). What Is SEO / Search Engine Optimization? Retrieved February 18, 2015, from http://geckogullywebsites.com/what-is-seo-search-engine-optimisation/ Goodwin, D. (2012). Organic vs. Paid Search Results: Organic Wins 94% of Time. Retrieved June 19, 2015, from http://searchenginewatch.com/sew/news/2200730/organic-vs-paid-search-resultsorganic-wins-94-of-time Google. (2010). Search Engine Optimization Starter Guide. Retrieved March 15, 2015, from http://static.googleusercontent.com/media/www.google.com/nl//webmasters/docs/searchengine-optimization-starter-guide.pdf
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina I
Google. (2014). Informatie over sitemaps. Retrieved June 6, 2015, from https://support.google.com/webmasters/answer/156184?hl=nl Google. (2015). PageSpeed Insights. Retrieved July 6, 2015, from http://developers.google.com/speed/pagespeed/insights/ Hotchkiss, G., Alston, S., & Edwards, G. (2005). Google eye tracking report: How searchers see and click on Google search results. Enquiro Search Solutions Inc. IBM. (2011). SPSS Statistics 20. Retrieved from http://www01.ibm.com/support/docview.wss?uid=swg24029274 Kai Li, Mei Lin, Zhangxi Lin, & Bo Xing. (2014). Running and Chasing - The Competition between Paid Search Marketing and Search Engine Optimization. In 2014 47th Hawaii International Conference on System Sciences (pp. 3110–3119). IEEE. Langville, A. N., & Meyer, C. D. (2011). Google’s PageRank and Beyond: The Science of Search Engine Rankings. Princeton University Press. Ledford, J. L. (2009). Search Engine Optimization Bible (2nd ed.). John Wiley & Sons. Mavridis, T., & Symeonidis, A. L. (2014). Semantic analysis of web documents for the generation of optimal content. Engineering Applications of Artificial Intelligence, 35, 114–130. McClave, J. T., Benson, P. G., Sincich, T., & Knypstra, S. (2011). Statistiek, een inleiding (11e editie). Pearson Benelux B.V. Retrieved from http://www.pearsoneducation.nl/product.asp?isbn=9789043019651&cat=highM Mediative. (2014). The Evolution of Google’s Search Engine Results Pages and Their Effects on User Behaviour. Meghabghab, G., & Kandel, A. (2008). Search Engines, Link Analysis, and User’s Web Behavior (Vol. 99). Berlin, Heidelberg: Springer Berlin Heidelberg. Moreno, L., & Martinez, P. (2013). Overlapping factors in search engine optimization and web accessibility. Online Information Review, 37(4), 564–580. Moz. (2014a). Meta Description. Retrieved July 12, 2015, from https://moz.com/learn/seo/metadescription Moz. (2014b). Open Site Explorer. Retrieved July 3, 2015, from https://moz.com/researchtools/ose/ Moz. (2015). The Beginner’s Guide to SEO. Retrieved May 21, 2015, from https://moz.com/beginners-guide-to-seo/how-usability-experience-and-content-affect-searchengine-rankings National Retail Federation. (2014). The State of Retailing Online: Marketing. Forrester Research. Parikh, A., & Deshmukh, S. (2013). Search Engine Optimization. International Journal of Engineering Research & Technology (IJERT), 2(11), 3146–3153.
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina II
Pelser, B. (2013). Keywords voor zoekmachine optimalisatie. Retrieved April 9, 2015, from http://hosting.ber-art.nl/keywords-voor-zoekmachine-optimalisatie/ Peris-Ortiz, M., Gil-Pechuán, I., Palacios-Marqués, D., Vendrell, E., & Ferri-Ramirez, C. (2013). Strategies in E-Business: Positioning and Social Networking in Online Markets. Springer Science & Business Media. Ramos, A., & Cota, S. (2008). Search Engine Marketing (Vol. 17). McGraw Hill Professional. Search Engine Land. (2015). Search Engine Land’s Guide To SEO. Retrieved February 12, 2015, from http://searchengineland.com/guide/seo Searchmetrics. (2014). SEO Rank Correlations And Ranking Factors 2014. United States. Retrieved from http://www.searchmetrics.com/knowledge-base/ranking-factors/ SEO Review Tools. (2014). Social Page Authority Checker. Retrieved July 8, 2015, from http://www.seoreviewtools.com/social-authority-checker/ SEO Site Checkup. (2014). SEO ToolBox: Analyze and Monitor your website. Retrieved July 11, 2015, from http://seositecheckup.com/ SERPs. (2015). Keyword Rank Checker & SERP Checker Tool. Retrieved July 10, 2015, from https://serps.com/tools/rank_checker Siotos, M. (2013). Why Site Speed Optimisation Should Be Part of Your SEO Strategy. Retrieved April 11, 2015, from http://moz.com/ugc/why-site-speed-optimisation-should-be-part-of-your-seostrategy Site Analyzer. (2014). Website Analysis and SEO Tools. Retrieved July 11, 2015, from http://www.siteanalyzer.com/ Skadberg, Y. X., & Kimmel, J. R. (2004). Visitors’ flow experience while browsing a Web site: its measurement, contributing factors and consequences. Computers in Human Behavior, 20(3), 403–422. http://doi.org/10.1016/S0747-5632(03)00050-5 Spencer, S. (2008). Supercharge Your URLs For Maximum SEO Impact. Retrieved May 16, 2015, from http://searchengineland.com/supercharge-your-urls-for-maximum-seo-impact-14006 Spink, A., & Jansen, B. J. (2006). Web Search: Public Searching of the Web. Springer Science & Business Media. Statista. (2015). Worldwide market share of leading search engines from January 2010 to January 2015. Retrieved April 4, 2015, from http://www.statista.com/statistics/216573/worldwidemarket-share-of-search-engines/ Statistic Brain Research Institute. (2015). Google Annual Search Statistics. Retrieved March 11, 2015, from http://www.statisticbrain.com/google-searches/ Su, A.-J., Hu, Y. C., Kuzmanovic, A., & Koh, C.-K. (2014). How to Improve Your Search Engine Ranking : Myths and Reality. ACM Transactions on the Web, 8(2), 1–25. http://doi.org/10.1145/2579990
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina III
Techopedia. (2015). Search Engine Query. Retrieved March 31, 2015, from http://www.techopedia.com/definition/28064/search-engine-query Walgrove, A. (2015). The Most Expensive Keywords on Google, Bing. Retrieved July 10, 2015, from http://contently.com/strategist/2015/03/24/infographics-the-most-insanely-expensivekeywords-on-google-bing/ WordStream. (2011). The Top 20 Most Expensive Keywords in Google AdWords Advertising. Retrieved July 11, 2015, from http://www.wordstream.com/articles/most-expensive-keywords WordStream. (2014). Meta Tags - How Google Meta Tags Impact SEO. Retrieved July 12, 2015, from http://www.wordstream.com/meta-tags Yu, J. (2015). 5 Essential SEO Techniques To Master In 2015. Retrieved April 12, 2015, from http://searchengineland.com/5-essential-seo-techniques-master-2015-213135
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina IV
Bijlagen 1. Onderzochte variabelen Bij de omschrijving staat cursief en tussen haakjes telkens vermeld welk soort variabele het is (nominaal, ordinaal of schaal). In totaal zijn er 54 parameters waarop gequoteerd werd. Tabel 24. Variabelen regressiemodel
Naam variabele
Omschrijving
Ranking
Plaats in de zoekresultaten van Google (schaalvariabele)
Titels Titel tag
0 = geen titel tag aanwezig, 1 = titel tag aanwezig (nominale variabele)
Titel lengte
Aantal karakters (of tekens) van de titel tag (schaal) Is de titel tag goed opgesteld (keyword vooraan, geen herhalingen en
Titel vriendelijk
relevant), score van nul (0) voor slechte titel tags tot 3 voor zeer goede titel tags) (ordinale variabele)
Meta tag
0 = geen meta tag aanwezig, 1 = meta tag aanwezig (nominaal)
Meta lengte
Aantal karakters van de meta-omschrijving tag (schaal)
Meta eigen
0 = meta-omschrijving tag gekozen door Google zelf, 1 = eigen metaomschrijving tag wordt weergegeven (nominaal) Is meta tag in orde (geen quotes aanwezig en relevant), ook indien geen
Met vriendelijk
eigen meta-omschrijving tag aanwezig is, dan score voor meta-omschrijving tag die Google zelf heeft gekozen. Score van nul (0) voor een slechte meta tag, tot 2 voor goed opgestelde meta tags (ordinaal)
Header H1, H2 tot en met H6
Aantal h1, h2, h3, h4, h5 en h6 koppen op de webpagina (schaal)
URL’s URL lengte
Aantal karakters van de URL (bv: seo.be/index.html = 17 karakters) (schaal)
URL domein
Aantal karakters van het domein van een URL (bv: seo.be = 6 tekens) (schaal) Of URL geen overbodige woorden, cijfers, spaties, liggende streepjes of
URL vriendelijk
tekens bevat. Score van nul (0) voor een slechte URL tot 3 voor een zeer goede URL (ordinaal)
URL keyword
0 = keyword niet aanwezig in URL, 1 = keyword vermeld in URL (nominaal)
URL liggend streepje
Aantal liggende streepjes te vinden in URL’s (op gehele pagina) (schaal)
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 1
Keywords of zoektermen Keyword in titel
0 = Keyword niet in titel tag, 1 = keyword aanwezig in titel tag (nominaal)
Keyword aantal
Aantal keer keyword voorkomt in meta-omschrijving tag (zelf of niet zelf
meta
gekozen) (schaal)
Keyword aantal titel
Aantal koppen waar zoekwoord in voorkomt (schaal)
Keyword aantal
Aantal keer keyword gebruikt is op de pagina (schaal)
Keyword dichtheid
Aantal keer keyword voorkomt gedeeld door aantal woorden op pagina (exclusief stopwoorden) (schaal)
Keyword aantal
Aantal keer een variant van keyword voorkomt (verkleinwoord of meervoud)
variant
(schaal)
Keyword dichtheid
Aantal keer variant van keyword voorkomt gedeeld door aantal woorden op
variant
pagina (exclusief stopwoorden) (schaal)
Keyword aantal som
Som van keyword aantal en keyword aantal variant (schaal)
Keyword dichtheid
Som van de keyword dichtheid met de dichtheid van de keyword variant
som
(schaal)
Links Links aantal Links uniek
Links extern
Totaal aantal links naar een webpagina (bv: seo.be/index.html) (schaal) Aantal unieke root URL’s of domeinen die naar website linken. Verschillende links van hetzelfde domein, tellen slechts één keer mee (schaal). Aantal externe links die naar website linken, dit zijn links die van een ander domein komen (schaal).
Links extern totaal
Verhouding externe links t.o.v. het totale aantal links (schaal)
Links domein
Aantal links die naar het domein van een website linken (bv: seo.be) (schaal)
Links domein uniek
Aantal unieke root URL’s die naar domein van een website linken (schaal)
Links score domein
Score op 100 van het domein van de website (o.b.v. link metrieken) (schaal)
Links score pagina
Score op 100 van de webpagina, eveneens o.b.v. links metrieken (schaal)
Links URL
Links uniek URL
Aantal URL’s op de webpagina (links naar andere webpagina’s binnen of buiten het domein) (schaal) Percentage van unieke links op website (ratio tussen enkele en duplicate links) (schaal) Percentage van links op een webpagina met een titel attribuut (laat toe om
Links titel
keywords te associëren met een specifieke pagina, zie Hyperlinks op p. 11) (schaal)
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 2
Links juice
Percentage van links die naar andere websites leiden (verhouding tussen interne links en links die webpagina verlaten) (schaal)
Controlevariabelen Leeftijd website Leeftijd domein
Datum waarop domein is aangemaakt (wordt niet opgenomen)
Leeftijd dagen
Aantal dagen sinds creatie domein (schaal)
Crawler-vriendelijkheid Robots
0 = geen robots bestand, 1 = robots bestand aanwezig (nominaal)
Sitemap
0 = geen sitemap bestand, 1 = sitemap bestand aanwezig (nominaal)
Afbeelding Alt
Aantal afbeeldingen die geen alternatieve tekst hebben (zie p. 12) (schaal) Schaal van pagina vriendelijkheid van 0 tot 10 (quotering op volgende criteria:
Kwaliteit pagina
eenvoudig te printen, aanwezigheid flash objecten, CSS compatibiliteit, geïntegreerde scipts en html-vriendelijkheid) (schaal)
Laadsnelheid Paginagrootte
Snelheid
Snelheidsscore
Paginagrootte uitgedrukt in kB. Richtlijn: < 33 kB (SEO Site Checkup, 2014) (schaal) Site laadtijd uitgedrukt in seconden. Bij lange laadtijden kan dit variëren met een aantal seconden (schaal) Score op 100, die Google geeft op basis van inzichten in de paginasnelheid.11 (schaal)
Sociale media Sociale media
Score op 5 voor gebruik volgende sociale media op de webpagina: Facebook,
gebruik
Twitter, LinkedIn, Google+ en Pinterest. Bij gebruik (=1), anders 0 (schaal)
Sociale autoriteit
Gemiddelde interactie score op de webpagina, berekening van totale
pagina
interacties op de 5 platformen samen gedeeld door 5 (schaal)
Sociale autoriteit
Gemiddelde interactie score op domein, berekening van totale interacties op
domein
de 5 platformen samen gedeeld door 5 (schaal)
11
Mobiele snelheid-, pagina- en mobiele score van Google zijn indicaties van welke zaken toegepast zijn en
welke niet (Google, 2015). Voorbeelden hiervan zijn de lettergrootten, geoptimaliseerde afbeeldingen, JavaScript en css verkleinen, etc. Snelle websites (laadtijd in seconden) kunnen bijvoorbeeld toch een lagere score van krijgen dan tragere websites.
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 3
Mobiele bruikbaarheid Mobiel bruikbaar Mobiel ervaring
Mobiel snelheid
Universiteit Gent
0 = pagina niet mobiel bruikbaar, 1 = webpagina mobiel bruikbaar (nominaal) Score op 100, die Google geeft voor de mobiele gebruikerservaring op de webpagina.11 (schaal) Score op 100, die Google geeft voor de mobiele snelheid van de pagina.11 (schaal)
Master Handelswetenschappen Management & Informatica
Pagina 4
2. Analyses 2.1
Titels en URL’s Descriptive Statistics Mean
Std. Deviation
N
Ranking
209,62
159,962
126
Titel_tag
,99
,089
126
48,57
26,188
126
2,02
,715
126
,68
,467
126
112,48
240,513
126
,44
,499
126
Meta_Vriendelijk
1,46
,602
126
Header_H1
2,03
6,529
126
Header_H2
5,90
19,141
126
Header_H3
5,01
9,083
126
Header_H4
2,05
4,736
126
Header_H5_H6
1,37
5,323
126
URL_Vriendelijk
2,29
,884
126
URL_Lengte
62,34
24,155
126
URL_Domein
13,60
5,540
126
URL_keyword
,80
,400
126
8,09
16,617
126
Titel_Lengte Titel_Vriendelijk Meta_Tag Lengte_Meta Meta_Eigen
URL_LiggendStreepje
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 5
Coefficients Model
Unstandardized Coefficients
Standardized
a
t
Sig.
95,0% Confidence Interval for B
Collinearity Statistics
Coefficients B
Std. Error
Beta
(Constant)
226,443
167,862
Titel_tag
167,925
147,338
-,075
Lower Bound
Upper Bound
Tolerance
VIF
1,349
,180
-106,288
559,175
,094
1,140
,257
-124,123
459,974
,848
1,180
,564
-,012
-,134
,894
-1,194
1,043
,669
1,495
-65,665
22,878
-,294
-2,870
,005
-111,012
-20,318
,545
1,834
63,366
36,473
,185
1,737
,085
-8,929
135,661
,503
1,989
,046
,056
,070
,829
,409
-,064
,157
,811
1,233
-128,695
34,312
-,401
-3,751
,000
-196,707
-60,684
,498
2,006
-69,339
21,575
-,261
-3,214
,002
-112,104
-26,573
,866
1,155
Header_H1
,016
1,928
,001
,008
,993
-3,806
3,838
,922
1,085
Header_H2
,046
,675
,006
,069
,945
-1,291
1,383
,876
1,141
Header_H3
,182
1,654
,010
,110
,913
-3,096
3,460
,647
1,545
Header_H4
-,073
3,024
-,002
-,024
,981
-6,067
5,921
,712
1,404
Header_H5_H6
-2,639
3,047
-,088
-,866
,388
-8,679
3,401
,555
1,801
URL_Vriendelijk
-34,900
18,466
-,193
-1,890
,061
-71,502
1,701
,548
1,825
URL_Lengte
1,010
,601
,153
1,681
,096
-,181
2,201
,693
1,443
URL_Domein
2,210
2,452
,077
,901
,369
-2,651
7,071
,791
1,264
URL_keyword
79,765
39,890
,200
2,000
,048
,696
158,833
,573
1,747
URL_LiggendStreepje
-1,484
,840
-,154
-1,768
,080
-3,149
,180
,750
1,333
Titel_Lengte Titel_Vriendelijk Meta_Tag Lengte_Meta Meta_Eigen Meta_Vriendelijk 1
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 6
b
Model Summary Model
R
R Square
Adjusted R Square
Std. Error of the Estimate
1
,619
a
,384
,287
135,115
a. Predictors: (Constant), URL_LiggendStreepje, Titel_Lengte, Header_H4, Header_H2, Header_H1, Meta_Vriendelijk, Lengte_Meta, Titel_tag, Meta_Eigen, Header_H3, URL_keyword, URL_Domein, URL_Lengte, Header_H5_H6, Titel_Vriendelijk, URL_Vriendelijk, Meta_Tag b. Dependent Variable: Ranking Residuals Statistics Minimum Predicted Value
Maximum
a
Mean
Std. Deviation
-25,01
455,16
209,62
99,069
126
-300,069
266,566
,000
125,592
126
Std. Predicted Value
-2,368
2,478
,000
1,000
126
Std. Residual
-2,221
1,973
,000
,930
126
Residual
a. Dependent Variable: Ranking
a
ANOVA Model
1
Sum of Squares
df
Mean Square
Regression
1226836,519
17
72166,854
Residual
1971661,195
108
18256,122
Total
3198497,714
125
F
Sig.
3,953
,000
b
a. Dependent Variable: Ranking b. Predictors: (Constant), URL_LiggendStreepje, Titel_Lengte, Header_H4, Header_H2, Header_H1, Meta_Vriendelijk, Lengte_Meta, Titel_tag, Meta_Eigen, Header_H3, URL_keyword, URL_Domein, URL_Lengte, Header_H5_H6, Titel_Vriendelijk, URL_Vriendelijk, Meta_Tag
Universiteit Gent
N
Master Handelswetenschappen Management & Informatica
Pagina 7
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 8
NPar Tests
One-Sample Kolmogorov-Smirnov Test ZRE_2 N Normal Parameters
126 a,b
Most Extreme Differences
Mean Std. Deviation
0E-7 ,92951600
Absolute
,059
Positive
,059
Negative
-,050
Kolmogorov-Smirnov Z
,663
Asymp. Sig. (2-tailed)
,772
a. Test distribution is Normal. b. Calculated from data.
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 9
a. Titels
Variables Entered/Removed Model
Variables Entered
Variables
Descriptive Statistics Mean
Std. Deviation
N
Header_H5_H6,
209,62
159,962
126
Lengte_Meta,
Titel_tag
,99
,089
126
Titel_tag,
48,57
26,188
126
Header_H1,
2,02
,715
126
Meta_Vriendelijk,
,68
,467
126
112,48
240,513
126
Meta_Eigen,
,44
,499
126
Titel_Lengte,
Meta_Vriendelijk
1,46
,602
126
Header_H4,
Header_H1
2,03
6,529
126
Header_H3,
Header_H2
5,90
19,141
126
Titel_Vriendelijk,
Header_H3
5,01
9,083
126
Meta_Tag
Header_H4
2,05
4,736
126
a. Dependent Variable: Ranking
Header_H5_H6
1,37
5,323
126
b. All requested variables entered.
Titel_Vriendelijk Meta_Tag Lengte_Meta Meta_Eigen
Method
Removed
Ranking
Titel_Lengte
a
1
Header_H2,
. Enter
b
a
ANOVA b
Model
Model Summary Model
1
R
,538
R Square
a
Adjusted R
Std. Error of the
Square
Estimate
,290
,214
141,784
Sum of Squares Regression
1
df
Mean Square
926876,726
12
77239,727
Residual
2271620,988
113
20102,841
Total
3198497,714
125
F 3,842
a. Predictors: (Constant), Header_H5_H6, Lengte_Meta, Titel_tag,
a. Dependent Variable: Ranking
Header_H1, Meta_Vriendelijk, Header_H2, Meta_Eigen, Titel_Lengte,
b. Predictors: (Constant), Header_H5_H6, Lengte_Meta, Titel_tag, Header_H1, Meta_Vriendelijk,
Header_H4, Header_H3, Titel_Vriendelijk, Meta_Tag
Header_H2, Meta_Eigen, Titel_Lengte, Header_H4, Header_H3, Titel_Vriendelijk, Meta_Tag
b. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 10
Sig. ,000
b
Coefficients Model
Unstandardized Coefficients
Standardized
a
t
Sig.
95,0% Confidence Interval for B
Collinearity Statistics
Coefficients B (Constant)
,546
,586
-216,462
381,000
,891
1,122
,574
,067
,714
,477
-,727
1,547
,711
1,406
-52,644
22,209
-,235
-2,370
,019
-96,643
-8,644
,637
1,569
50,876
38,015
,149
1,338
,183
-24,440
126,191
,510
1,963
,056
,056
,084
,990
,324
-,056
,167
,878
1,140
-126,239
35,094
-,394
-3,597
,000
-195,766
-56,712
,525
1,906
-66,573
22,169
-,251
-3,003
,003
-110,493
-22,653
,903
1,107
Header_H1
-,297
2,005
-,012
-,148
,883
-4,269
3,675
,939
1,065
Header_H2
-,182
,683
-,022
-,266
,791
-1,536
1,172
,940
1,064
Header_H3
-1,351
1,642
-,077
-,823
,412
-4,604
1,902
,723
1,383
Header_H4
-,915
3,031
-,027
-,302
,763
-6,920
5,089
,781
1,281
Header_H5_H6
-,862
3,079
-,029
-,280
,780
-6,962
5,237
,599
1,670
Meta_Eigen Meta_Vriendelijk
,410
VIF
,046
Lengte_Meta
150,784
Tolerance
640,270
Meta_Tag
82,269
Upper Bound
35,812
Titel_Vriendelijk
152,550
Lower Bound ,029
Titel_Lengte
338,041
Beta 2,216
Titel_tag
1
Std. Error
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 11
Residuals Statistics Minimum Predicted Value
Maximum
a
Mean
Std. Deviation
N
40,54
451,33
209,62
86,110
126
-292,830
300,327
,000
134,807
126
Std. Predicted Value
-1,964
2,807
,000
1,000
126
Std. Residual
-2,065
2,118
,000
,951
126
Residual
a. Dependent Variable: Ranking
Charts
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 12
NPar Tests
One-Sample Kolmogorov-Smirnov Test ZRE_3 N Normal Parameters
126 a,b
Most Extreme Differences
Mean Std. Deviation
0E-7 ,95078915
Absolute
,066
Positive
,066
Negative
-,061
Kolmogorov-Smirnov Z
,746
Asymp. Sig. (2-tailed)
,634
a. Test distribution is Normal. b. Calculated from data.
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 13
b. URL’s Descriptive Statistics Mean Ranking
Std. Deviation
Variables Entered/Removed
N
209,62
159,962
126
2,29
,884
126
URL_Lengte
62,34
24,155
126
URL_Domein
13,60
5,540
126
URL_keyword
,80
,400
126
8,09
16,617
126
URL_Vriendelijk
URL_LiggendStreepje
Model
Variables Entered
Variables
a
Method
Removed URL_LiggendStre epje, 1
URL_Lengte,
. Enter
URL_Domein, URL_keyword, URL_Vriendelijk
b
a. Dependent Variable: Ranking b. All requested variables entered. a
b
ANOVA
Model Summary Model
1
R
,382
R Square
a
,146
Adjusted R
Std. Error of the
Square
Estimate ,110
150,882
a. Predictors: (Constant), URL_LiggendStreepje, URL_Lengte, URL_Domein,
Model
Sum of Squares Regression
1
df
Mean Square
466667,311
5
93333,462
Residual
2731830,403
120
22765,253
Total
3198497,714
125
F
Sig.
4,100
URL_keyword, URL_Vriendelijk
a. Dependent Variable: Ranking
b. Dependent Variable: Ranking
b. Predictors: (Constant), URL_LiggendStreepje, URL_Lengte, URL_Domein, URL_keyword, URL_Vriendelijk
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 14
,002
b
Correlations Ranking
URL_Vriendelijk
URL_Lengte
URL_Domein
URL_keyword
URL_LiggendStre epje
Ranking
1,000
-,197
,339
,083
-,047
-,075
URL_Vriendelijk
-,197
1,000
-,254
,014
,500
-,373
URL_Lengte
,339
-,254
1,000
,143
,063
-,013
URL_Domein
,083
,014
,143
1,000
,036
,028
URL_keyword
-,047
,500
,063
,036
1,000
-,223
URL_LiggendStreepje
-,075
-,373
-,013
,028
-,223
1,000
.
,013
,000
,178
,300
,202
URL_Vriendelijk
,013
.
,002
,438
,000
,000
URL_Lengte
,000
,002
.
,056
,241
,442
URL_Domein
,178
,438
,056
.
,346
,378
URL_keyword
,300
,000
,241
,346
.
,006
URL_LiggendStreepje
,202
,000
,442
,378
,006
.
Ranking
126
126
126
126
126
126
URL_Vriendelijk
126
126
126
126
126
126
URL_Lengte
126
126
126
126
126
126
URL_Domein
126
126
126
126
126
126
URL_keyword
126
126
126
126
126
126
URL_LiggendStreepje
126
126
126
126
126
126
Pearson Correlation
Ranking
Sig. (1-tailed)
N
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 15
Coefficients Model
Unstandardized Coefficients
Standardized
a
t
Sig.
95,0% Confidence Interval for B
Collinearity Statistics
Coefficients B
Std. Error
Beta
(Constant)
157,384
69,033
URL_Vriendelijk
-30,832
19,812
URL_Lengte
1,902
URL_Domein
Lower Bound
Upper Bound
Tolerance
VIF
2,280
,024
20,703
294,065
-,170
-1,556
,122
-70,059
8,395
,594
1,685
,604
,287
3,148
,002
,706
3,099
,855
1,170
1,400
2,468
,049
,567
,572
-3,487
6,288
,974
1,027
URL_keyword
-5,124
39,986
-,013
-,128
,898
-84,294
74,045
,710
1,407
URL_LiggendStreepje
-1,337
,883
-,139
-1,514
,133
-3,086
,412
,845
1,183
1
a. Dependent Variable: Ranking
Residuals Statistics Minimum Predicted Value
Maximum
a
Mean
Std. Deviation
N
38,17
428,07
209,62
61,101
126
-354,665
338,648
,000
147,833
126
Std. Predicted Value
-2,806
3,575
,000
1,000
126
Std. Residual
-2,351
2,244
,000
,980
126
Residual
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 16
Charts
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 17
NPar Tests One-Sample Kolmogorov-Smirnov Test ZRE_4 N Normal Parameters
126 a,b
Most Extreme Differences
Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)
Mean Std. Deviation
0E-7 ,97979590
Absolute
,116
Positive
,116
Negative
-,066 1,302 ,067
a. Test distribution is Normal. b. Calculated from data.
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 18
2.2
Keywords a. Eerste model Descriptive Statistics Mean
Ranking
b
Model Summary
Std. Deviation
N
209,62
159,962
126
,85
,359
126
Keyword_Aantal_Meta
1,35
,661
126
Keyword_Aantal_Titel
2,96
1,582
126
39,04
120,748
126
2,9856
1,90873
126
Keyword_Aantal_Variant
12,94
101,504
126
Keyword_Dichtheid_Variant
,5572
,95003
126
Keyword_Aantal_Totaal
51,98
212,857
126
3,5427
2,22336
126
Keyword_In_Titel
Keyword_Aantal Keyword_Dichtheid
Keyword_Dichtheid_Som
Model
R
1
R Square ,427
a
Adjusted R
Std. Error of the
Square
Estimate
,182
,134
148,859
a. Predictors: (Constant), Keyword_Dichtheid_Som, Keyword_Aantal_Meta, Keyword_In_Titel, Keyword_Aantal_Titel, Keyword_Aantal, Keyword_Dichtheid_Variant, Keyword_Aantal_Variant b. Dependent Variable: Ranking
a
ANOVA Model 1
Sum of Squares Regression
df
Mean Square
583718,796
7
83388,399
Residual
2614778,918
118
22159,143
Total
3198497,714
125
F
Sig.
3,763
,001
b
a. Dependent Variable: Ranking b. Predictors: (Constant), Keyword_Dichtheid_Som, Keyword_Aantal_Meta, Keyword_In_Titel, Keyword_Aantal_Titel, Keyword_Aantal, Keyword_Dichtheid_Variant, Keyword_Aantal_Variant Coefficients
Universiteit Gent
a
Master Handelswetenschappen Management & Informatica
Pagina 19
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B
Coefficients
Std. Error
Beta
(Constant)
301,824
46,196
Keyword_In_Titel
-52,221
39,134
Keyword_Aantal_Meta
53,529
Keyword_Aantal_Titel
t
Sig.
Lower Bound
Collinearity Statistics
Upper Bound
Tolerance
,000
210,344
393,304
-,117
-1,334
,185
-129,718
25,276
,897
1,115
21,075
,221
2,540
,012
11,794
95,263
,913
1,095
-31,980
10,543
-,316
-3,033
,003
-52,858
-11,102
,637
1,569
-,164
,219
-,124
-,746
,457
-,598
,271
,253
3,955
,507
,295
,322
1,719
,088
-,077
1,092
,198
5,063
-43,354
21,720
-,257
-1,996
,048
-86,365
-,344
,416
2,402
-,403
8,404
-,006
-,048
,962
-17,044
16,239
,508
1,969
Keyword_Aantal_Variant
Keyword_Dichtheid_Som a. Dependent Variable: Ranking
Excluded Variables
a
Collinearity Statistics Minimum Model 1
Beta In Keyword_Dichtheid
t
.
Sig.
Partial Correlation
Tolerance
VIF
Tolerance
b
-1,430
,155
-,131
8,284E-007
1207197,213
6,105E-007
b
.
.
.
,000
.
,000
-130,180
Keyword_Aantal_Totaal a. Dependent Variable: Ranking
b. Predictors in the Model: (Constant), Keyword_Dichtheid_Som, Keyword_Aantal_Meta, Keyword_In_Titel, Keyword_Aantal_Titel, Keyword_Aantal, Keyword_Dichtheid_Variant, Keyword_Aantal_Variant
Universiteit Gent
VIF
6,534
Keyword_Aantal
Keyword_Dichtheid_Variant
95,0% Confidence Interval for B
Master Handelswetenschappen Management & Informatica
Pagina 20
a
Residuals Statistics Minimum Predicted Value
Maximum
Mean
Std. Deviation
N
-1,38
383,36
209,62
68,336
126
-267,541
343,675
,000
144,631
126
Std. Predicted Value
-3,088
2,542
,000
1,000
126
Std. Residual
-1,797
2,309
,000
,972
126
Residual
a. Dependent Variable: Ranking
b. Tweede model b
Model Summary Model
R
1
R Square ,389
a
Adjusted R Square ,151
Std. Error of the Estimate
,116
150,428
a. Predictors: (Constant), Keyword_Dichtheid_Som, Keyword_Aantal_Meta, Keyword_In_Titel, Keyword_Aantal_Titel, Keyword_Aantal_Totaal b. Dependent Variable: Ranking a
ANOVA Model 1
Sum of Squares Regression
df
Mean Square
483076,576
5
96615,315
Residual
2715421,138
120
22628,509
Total
3198497,714
125
F 4,270
Sig. ,001
b
a. Dependent Variable: Ranking b. Predictors: (Constant), Keyword_Dichtheid_Som, Keyword_Aantal_Meta, Keyword_In_Titel, Keyword_Aantal_Titel, Keyword_Aantal_Totaal
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 21
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B
Coefficients
Std. Error
Beta
(Constant)
299,110
46,359
Keyword_In_Titel
-54,428
39,522
Keyword_Aantal_Meta
45,597
Keyword_Aantal_Titel Keyword_Aantal_Totaal Keyword_Dichtheid_Som
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
6,452
,000
207,323
390,898
-,122
-1,377
,171
-132,678
23,822
,898
1,114
20,962
,188
2,175
,032
4,094
87,100
,943
1,061
-28,922
9,397
-,286
-3,078
,003
-47,528
-10,317
,819
1,221
,054
,072
,072
,751
,454
-,089
,198
,761
1,313
-6,209
7,602
-,086
-,817
,416
-21,261
8,842
,634
1,578
a. Dependent Variable: Ranking
Residuals Statistics Minimum Predicted Value
Maximum
a
Mean
Std. Deviation
N
-13,44
384,88
209,62
62,166
126
-277,632
312,468
,000
147,388
126
Std. Predicted Value
-3,588
2,819
,000
1,000
126
Std. Residual
-1,846
2,077
,000
,980
126
Residual
a. Dependent Variable: Ranking
Universiteit Gent
VIF
Master Handelswetenschappen Management & Informatica
Pagina 22
c. Derde model
Variables Entered/Removed Model
Variables Entered
1
a
Variables Removed
b
Method
Model Summary
Keyword_Dichtheid_V ariant,
Model
Keyword_In_Titel,
1
Keyword_Aantal_Meta
R
R Square ,427
a
Adjusted R
Std. Error of the
Square
Estimate
,182
,134
148,859
a. Predictors: (Constant), Keyword_Dichtheid_Variant, Keyword_In_Titel,
, Keyword_Dichtheid,
. Enter
Keyword_Aantal_Meta, Keyword_Dichtheid, Keyword_Aantal,
Keyword_Aantal,
Keyword_Aantal_Titel, Keyword_Aantal_Variant
Keyword_Aantal_Titel,
b. Dependent Variable: Ranking
Keyword_Aantal_Varia nt
b
a. Dependent Variable: Ranking b. All requested variables entered. a
ANOVA Model 1
Sum of Squares Regression
df
Mean Square
583722,163
7
83388,880
Residual
2614775,551
118
22159,115
Total
3198497,714
125
F 3,763
Sig. ,001
b
a. Dependent Variable: Ranking b. Predictors: (Constant), Keyword_Dichtheid_Variant, Keyword_In_Titel, Keyword_Aantal_Meta, Keyword_Dichtheid, Keyword_Aantal, Keyword_Aantal_Titel, Keyword_Aantal_Variant
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 23
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B
Coefficients
Std. Error
95,0% Confidence Interval for B
Beta
(Constant)
301,831
46,196
Keyword_In_Titel
-52,210
39,135
Keyword_Aantal_Meta
53,530
Keyword_Aantal_Titel
t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
VIF
6,534
,000
210,351
393,310
-,117
-1,334
,185
-129,707
25,288
,897
1,115
21,075
,221
2,540
,012
11,795
95,264
,913
1,095
-31,973
10,542
-,316
-3,033
,003
-52,850
-11,096
,637
1,569
Keyword_Aantal
-,164
,219
-,124
-,746
,457
-,598
,271
,253
3,955
Keyword_Dichtheid
-,416
8,403
-,005
-,049
,961
-17,056
16,225
,689
1,451
,507
,295
,322
1,719
,088
-,077
1,092
,198
5,063
-43,756
19,809
-,260
-2,209
,029
-82,983
-4,529
,501
1,998
Keyword_Aantal_Variant Keyword_Dichtheid_Variant a. Dependent Variable: Ranking
Residuals Statistics Minimum Predicted Value
Maximum
a
Mean
Std. Deviation
N
-1,40
383,36
209,62
68,336
126
-267,495
343,676
,000
144,631
126
Std. Predicted Value
-3,088
2,542
,000
1,000
126
Std. Residual
-1,797
2,309
,000
,972
126
Residual
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 24
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 25
NPar Tests
One-Sample Kolmogorov-Smirnov Test ZRE_1 N Normal Parameters
126 a,b
Mean Std. Deviation
Most Extreme Differences
,0000000 ,97159662
Absolute
,073
Positive
,073
Negative
-,067
Test Statistic Asymp. Sig. (2-tailed)
,073 ,092
c
a. Test distribution is Normal. b. Calculated from data. c. Lilliefors Significance Correction.
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 26
2.3
Links a. Alle variabelen Descriptive Statistics
b
Model Summary Mean Ranking
Std. Deviation
N Adjusted R
Std. Error of the
Square
Estimate
209,62
159,962
126
Links_Aantal
1048,91
4756,866
126
Links_Uniek
15,54
95,186
126
Links_Extern
122,61
697,217
126
a. Predictors: (Constant), Links_Juice, Links_Score_Domein,
17,1056
31,34805
126
Links_Uniek_URL, Links_Titel, Links_Aantal, Links_Uniek,
8576575,63
47760729,326
126
Links_Extern_Totaal, Links_URL, Links_Domein_Uniek, Links_Score_Pagina,
Links_Domein_Uniek
56962,25
355704,852
126
Links_Extern, Links_Domein
Links_Score_Domein
47,18
21,514
126
b. Dependent Variable: Ranking
Links_Score_Pagina
24,68
19,671
126
Links_URL
123,91
173,361
126
Links_Uniek_URL
75,657
15,9152
126
Links_Titel
22,368
27,9829
126
Links_Juice
9,808
11,9358
126
Links_Extern_Totaal Links_Domein
Model
R
1
R Square ,567
a
,321
,249
138,607
a
ANOVA Model 1
Sum of Squares
df
Mean Square
Regression
1027568,403
12
85630,700
Residual
2170929,312
113
19211,764
Total
3198497,714
125
F
Sig. 4,457
,000
a. Dependent Variable: Ranking b. Predictors: (Constant), Links_Juice, Links_Score_Domein, Links_Uniek_URL, Links_Titel, Links_Aantal, Links_Uniek, Links_Extern_Totaal, Links_URL, Links_Domein_Uniek, Links_Score_Pagina, Links_Extern, Links_Domein
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 27
b
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Coefficients
Std. Error
Beta
384,444
75,154
Links_Aantal
-1,735E-005
,003
Links_Uniek
-,337
Links_Extern Links_Extern_Totaal
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
VIF
5,115
,000
235,550
533,337
-,001
-,006
,995
-,006
,006
,797
1,255
,588
-,200
-,572
,568
-1,502
,828
,049
20,388
,078
,080
,342
,982
,328
-,080
,237
,050
20,175
,309
,515
,061
,599
,550
-,712
1,330
,589
1,699
Links_Domein
-5,829E-008
,000
-,017
-,025
,980
,000
,000
,012
82,468
Links_Domein_Uniek
-3,770E-005
,000
-,084
-,119
,905
-,001
,001
,012
82,015
Links_Score_Domein
-,365
,771
-,049
-,473
,637
-1,893
1,163
,559
1,790
Links_Score_Pagina
-4,471
,967
-,550
-4,622
,000
-6,387
-2,554
,425
2,356
,007
,085
,008
,088
,930
-,160
,175
,713
1,402
-,800
,855
-,080
-,935
,352
-2,494
,895
,830
1,205
Links_Titel
,524
,482
,092
1,087
,279
-,431
1,480
,844
1,185
Links_Juice
-,654
1,095
-,049
-,598
,551
-2,824
1,515
,900
1,112
Links_URL Links_Uniek_URL
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 28
b. Model 1: zonder ‘links extern’ en ‘links domein’ b
Model Summary
Model 1
R ,562
Adjusted R
Std. Error of the
Square
Estimate
R Square a
,315
,256
137,987
a. Predictors: (Constant), Links_Juice, Links_Score_Domein, Links_Uniek_URL, Links_Titel, Links_Aantal, Links_Uniek, Links_Extern_Totaal, Links_URL, Links_Domein_Uniek, Links_Score_Pagina b. Dependent Variable: Ranking
a
ANOVA Model 1
Sum of Squares
df
Mean Square
Regression
1008839,246
10
100883,925
Residual
2189658,468
115
19040,508
Total
3198497,714
125
F 5,298
Sig. ,000
b
a. Dependent Variable: Ranking b. Predictors: (Constant), Links_Juice, Links_Score_Domein, Links_Uniek_URL, Links_Titel, Links_Aantal, Links_Uniek, Links_Extern_Totaal, Links_URL, Links_Domein_Uniek, Links_Score_Pagina
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 29
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Coefficients
Std. Error
Beta
385,275
74,207
Links_Aantal
,000
,003
Links_Uniek
,210
Links_Extern_Totaal
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
VIF
5,192
,000
238,286
532,264
,009
,105
,917
-,005
,006
,807
1,239
,191
,125
1,099
,274
-,168
,588
,462
2,166
,438
,485
,086
,904
,368
-,522
1,398
,660
1,515
Links_Domein_Uniek
-4,798E-005
,000
-,107
-,913
,363
,000
,000
,436
2,294
Links_Score_Domein
-,423
,764
-,057
-,554
,580
-1,937
1,090
,564
1,773
Links_Score_Pagina
-4,400
,952
-,541
-4,620
,000
-6,286
-2,513
,434
2,304
,003
,084
,003
,036
,971
-,164
,170
,716
1,398
-,804
,848
-,080
-,947
,346
-2,484
,877
,836
1,197
Links_Titel
,572
,471
,100
1,215
,227
-,361
1,504
,878
1,139
Links_Juice
-,795
1,077
-,059
-,739
,462
-2,928
1,337
,923
1,084
Links_URL Links_Uniek_URL
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 30
c. Model 2: zonder ‘links uniek’ en ‘links domein’ b
Model Summary
Model
R
1
,565
R Square a
Adjusted R
Std. Error of the
Square
Estimate
,319
,260
NPar Tests
137,596 One-Sample Kolmogorov-Smirnov Test
a. Predictors: (Constant), Links_Juice, Links_Score_Domein,
ZRE_1
Links_Uniek_URL, Links_Titel, Links_Aantal, Links_Extern_Totaal, Links_URL, Links_Extern, Links_Domein_Uniek, Links_Score_Pagina
N
b. Dependent Variable: Ranking
Normal Parameters
126 a,b
Mean Std. Deviation
Most Extreme Differences
a
ANOVA Model 1
Sum of Squares
df
Mean Square
Regression
1021240,605
10
102124,060
Residual
2177257,109
115
18932,671
Total
3198497,714
125
F 5,394
,000
b
,95916630
Absolute
,077
Positive
,049
Negative
-,077
Test Statistic
Sig.
,0000000
Asymp. Sig. (2-tailed)
,077 ,066
c
a. Test distribution is Normal. b. Calculated from data. c. Lilliefors Significance Correction.
a. Dependent Variable: Ranking b. Predictors: (Constant), Links_Juice, Links_Score_Domein, Links_Uniek_URL, Links_Titel, Links_Aantal, Links_Extern_Totaal, Links_URL, Links_Extern, Links_Domein_Uniek, Links_Score_Pagina
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 31
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Coefficients
Std. Error
Beta
386,300
73,945
Links_Aantal
,000
,003
Links_Extern
,035
Links_Extern_Totaal
95,0% Confidence Interval for B t
Sig.
Lower Bound
Collinearity Statistics
Upper Bound
Tolerance
VIF
5,224
,000
239,828
532,772
,004
,043
,966
-,006
,006
,803
1,246
,026
,154
1,368
,174
-,016
,086
,468
2,136
,381
,485
,075
,784
,435
-,581
1,342
,654
1,528
Links_Domein_Uniek
-5,270E-005
,000
-,117
-1,035
,303
,000
,000
,462
2,166
Links_Score_Domein
-,382
,763
-,051
-,500
,618
-1,894
1,131
,561
1,781
Links_Score_Pagina
-4,462
,952
-,549
-4,685
,000
-6,348
-2,575
,432
2,317
,001
,083
,002
,017
,987
-,164
,167
,725
1,380
-,818
,845
-,081
-,967
,335
-2,493
,857
,837
1,195
Links_Titel
,550
,470
,096
1,172
,244
-,380
1,480
,877
1,140
Links_Juice
-,725
1,076
-,054
-,674
,502
-2,856
1,406
,918
1,089
Links_URL Links_Uniek_URL
a. Dependent Variable: Ranking
Casewise Diagnostics Std. Case Number
Residual
a
Residuals Statistics
Predicted Ranking
Value
Minimum
3,015
a. Dependent Variable: Ranking
473
58,15
Mean
Std. Deviation
N
Residual Predicted Value
125
Maximum
a
414,849
-102,51
379,20
209,62
90,388
126
-301,365
414,849
,000
131,977
126
Std. Predicted Value
-3,453
1,876
,000
1,000
126
Std. Residual
-2,190
3,015
,000
,959
126
Residual
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 32
d. Model 3: zonder ‘links uniek’ en ‘links domein uniek’ b
a
Model Summary
Model 1
R ,565
Adjusted R
Std. Error of the
Square
Estimate
R Square a
ANOVA
,319
,260
Model 1
137,622
a. Predictors: (Constant), Links_Juice, Links_Score_Domein, Links_Uniek_URL, Links_Titel, Links_Aantal, Links_Extern_Totaal,
Sum of Squares
df
Mean Square
Regression
1020427,794
10
102042,779
Residual
2178069,920
115
18939,738
Total
3198497,714
125
F
Sig.
5,388
,000
b
b. Predictors: (Constant), Links_Juice, Links_Score_Domein, Links_Uniek_URL,
Links_URL, Links_Extern, Links_Domein, Links_Score_Pagina
Links_Titel, Links_Aantal, Links_Extern_Totaal, Links_URL, Links_Extern,
b. Dependent Variable: Ranking
Links_Domein, Links_Score_Pagina Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Coefficients
Std. Error
Beta
385,191
74,185
Links_Aantal
,000
,003
Links_Extern
,035
Links_Extern_Totaal
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
VIF
5,192
,000
238,245
532,137
,004
,049
,961
-,006
,006
,803
1,245
,026
,153
1,356
,178
-,016
,086
,467
2,142
,362
,483
,071
,749
,455
-,595
1,318
,661
1,512
-3,876E-007
,000
-,116
-1,014
,313
,000
,000
,454
2,201
Links_Score_Domein
-,380
,765
-,051
-,497
,620
-1,895
1,135
,560
1,786
Links_Score_Pagina
-4,441
,953
-,546
-4,662
,000
-6,328
-2,554
,432
2,317
,001
,083
,001
,016
,988
-,164
,167
,725
1,380
-,808
,846
-,080
-,955
,342
-2,484
,868
,836
1,197
Links_Titel
,562
,471
,098
1,193
,235
-,371
1,496
,871
1,149
Links_Juice
-,710
1,076
-,053
-,659
,511
-2,841
1,422
,919
1,088
Links_Domein
Links_URL Links_Uniek_URL
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 33
a
Residuals Statistics Casewise Diagnostics Case Number
Std. Residual
125
Ranking
3,014
a
Minimum
Predicted Value
473
58,26
Residual
Predicted Value
414,736
a. Dependent Variable: Ranking
Maximum
Mean
Std. Deviation
N
-100,44
378,65
209,62
90,352
126
-302,009
414,736
,000
132,002
126
Std. Predicted Value
-3,432
1,871
,000
1,000
126
Std. Residual
-2,194
3,014
,000
,959
126
Residual
a. Dependent Variable: Ranking
e. Model 4: zonder ‘links extern’ en ‘links domein uniek’ b
Model Summary
a
Model 1
R
R Square ,561
a
,315
Adjusted R
Std. Error of
Square
the Estimate
,256
138,020
a. Predictors: (Constant), Links_Juice, Links_Score_Domein, Links_Uniek_URL, Links_Titel, Links_Aantal, Links_Uniek,
ANOVA Model
Sum of Squares
df
Mean Square
1 Regression
1007796,016
10
100779,602
Residual
2190701,698
115
19049,580
Total
3198497,714
125
F 5,290
Sig. ,000
Links_Extern_Totaal, Links_URL, Links_Score_Pagina,
a. Dependent Variable: Ranking
Links_Domein
b. Predictors: (Constant), Links_Juice, Links_Score_Domein, Links_Uniek_URL, Links_Titel,
b. Dependent Variable: Ranking
Links_Aantal, Links_Uniek, Links_Extern_Totaal, Links_URL, Links_Score_Pagina, Links_Domein
Universiteit Gent
Master Handelswetenschappen Management & Informatica
b
Pagina 34
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Coefficients
Std. Error
Beta
384,348
74,447
Links_Aantal
,000
,003
Links_Uniek
,205
Links_Extern_Totaal
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
VIF
5,163
,000
236,884
531,813
,010
,112
,911
-,005
,006
,808
1,238
,190
,122
1,080
,283
-,171
,582
,464
2,153
,420
,481
,082
,872
,385
-,534
1,374
,669
1,495
-3,466E-007
,000
-,103
-,882
,379
,000
,000
,433
2,310
Links_Score_Domein
-,424
,765
-,057
-,555
,580
-1,940
1,091
,563
1,778
Links_Score_Pagina
-4,380
,953
-,539
-4,598
,000
-6,267
-2,493
,434
2,304
,003
,084
,003
,037
,971
-,164
,170
,715
1,398
-,794
,849
-,079
-,936
,351
-2,476
,887
,835
1,198
Links_Titel
,582
,473
,102
1,230
,221
-,355
1,519
,870
1,149
Links_Juice
-,781
1,076
-,058
-,725
,470
-2,912
1,351
,924
1,083
Links_Domein
Links_URL Links_Uniek_URL
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 35
2.4
Controlevariabelen a. Alle variabelen Descriptive Statistics b
Std. Mean Ranking
Deviation
Model Summary N
209,62
159,962
126
4540,80
2238,019
126
Robots
,88
,325
126
Sitemap
,57
,497
126
Afbeelding_Alt
5,61
16,632
126
Kwaliteit_Pagina
6,50
,910
126
Paginagrootte
35,7107
62,35717
126
Snelheid
9,74737
7,825724
126
Snelheidsscore
72,06
14,535
126
Sociale_Media
1,76
1,477
126
367,375
4080,0636
126
4735,444
21594,3924
126
,55
,500
126
Mobiel_Ervaring
79,37
17,209
126
Mobiel_Snelheid
59,63
13,205
126
Domein_Dagen
Sociale_Auto_Pagina Sociale_Autoriteit_Domein Mobiel_Bruikbaar
Model
R
1
Adjusted R
Std. Error of the
Square
Estimate
R Square ,416
a
,173
,068
154,402
a. Predictors: (Constant), Mobiel_Snelheid, Robots, Domein_Dagen, Sociale_Auto_Pagina, Afbeelding_Alt, Mobiel_Ervaring, Kwaliteit_Pagina, Sociale_Media, Sitemap, Sociale_Autoriteit_Domein, Snelheid, Paginagrootte, Snelheidsscore, Mobiel_Bruikbaar b. Dependent Variable: Ranking
a
ANOVA Model 1
Sum of Squares Regression
df
Mean Square
552272,019
14
39448,001
Residual
2646225,695
111
23839,871
Total
3198497,714
125
F
Sig.
1,655
,076
a. Dependent Variable: Ranking b. Predictors: (Constant), Mobiel_Snelheid, Robots, Domein_Dagen, Sociale_Auto_Pagina, Afbeelding_Alt, Mobiel_Ervaring, Kwaliteit_Pagina, Sociale_Media, Sitemap, Sociale_Autoriteit_Domein, Snelheid, Paginagrootte, Snelheidsscore, Mobiel_Bruikbaar
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 36
b
Coefficients
a
Standardized Unstandardized Coefficients Model 1 (Constant)
B
Std. Error
463,825
190,677
-,016
,007
Robots
-26,429
Sitemap
Coefficients Beta
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
VIF
2,433
,017
85,985
841,665
-,220
-2,387
,019
-,029
-,003
,876
1,142
46,230
-,054
-,572
,569
-118,038
65,179
,844
1,185
28,596
32,834
,089
,871
,386
-36,467
93,659
,717
1,395
1,166
,971
,121
1,200
,233
-,758
3,090
,731
1,367
-1,428
17,443
-,008
-,082
,935
-35,993
33,137
,757
1,321
-,359
,282
-,140
-1,271
,206
-,919
,201
,615
1,627
-1,309
2,141
-,064
-,611
,542
-5,552
2,934
,679
1,472
Snelheidsscore
,253
2,456
,023
,103
,918
-4,614
5,120
,150
6,682
Sociale_Media
11,590
10,869
,107
1,066
,289
-9,948
33,128
,740
1,352
,000
,004
-,012
-,123
,902
-,008
,007
,821
1,218
-,002
,001
-,229
-2,299
,023
-,003
,000
,748
1,337
Mobiel_Bruikbaar
80,146
75,104
,250
1,067
,288
-68,676
228,969
,135
7,385
Mobiel_Ervaring
-1,263
2,201
-,136
-,574
,567
-5,624
3,098
,133
7,521
Mobiel_Snelheid
-2,038
2,540
-,168
-,803
,424
-7,071
2,994
,170
5,897
Domein_Dagen
Afbeelding_Alt Kwaliteit_Pagina Paginagrootte Snelheid
Sociale_Auto_Pagina Sociale_Autoriteit_Domein
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 37
i. Model 1: zonder ‘mobiel bruikbaar’ b
Model Summary
Model 1
R ,405
R Square a
Adjusted R
Std. Error of the
Square
Estimate
,164
,067
a
ANOVA Model
154,497
1
Sum of Squares Regression
df
Mean Square
525123,252
13
40394,096 23869,415
a. Predictors: (Constant), Mobiel_Snelheid, Robots,
Residual
2673374,462
112
Domein_Dagen, Sociale_Auto_Pagina, Afbeelding_Alt,
Total
3198497,714
125
F
Sig.
1,692
,072
Mobiel_Ervaring, Kwaliteit_Pagina, Sociale_Media, Sitemap,
a. Dependent Variable: Ranking
Sociale_Autoriteit_Domein, Snelheid, Paginagrootte,
b. Predictors: (Constant), Mobiel_Snelheid, Robots, Domein_Dagen, Sociale_Auto_Pagina, Afbeelding_Alt,
Snelheidsscore
Mobiel_Ervaring, Kwaliteit_Pagina, Sociale_Media, Sitemap, Sociale_Autoriteit_Domein, Snelheid,
b. Dependent Variable: Ranking
Paginagrootte, Snelheidsscore
b
ii. Model 2: zonder ‘snelheidsscore’ b
Model Summary
Model 1
R ,415
R Square a
,173
a
ANOVA
Adjusted R
Std. Error of the
Square
Estimate
,077
Domein_Dagen, Sociale_Auto_Pagina, Afbeelding_Alt, Mobiel_Ervaring, Kwaliteit_Pagina, Sociale_Media, Sitemap,
Mobiel_Bruikbaar
1
153,718
a. Predictors: (Constant), Mobiel_Snelheid, Robots,
Sociale_Autoriteit_Domein, Snelheid, Paginagrootte,
Model Regression
Sum of Squares
df
Mean Square
552019,758
13
42463,058
Residual
2646477,956
112
23629,267
Total
3198497,714
125
F 1,797
Sig. ,052
b
a. Dependent Variable: Ranking b. Predictors: (Constant), Mobiel_Snelheid, Robots, Domein_Dagen, Sociale_Auto_Pagina, Afbeelding_Alt, Mobiel_Ervaring, Kwaliteit_Pagina, Sociale_Media, Sitemap, Sociale_Autoriteit_Domein, Snelheid, Paginagrootte, Mobiel_Bruikbaar
b. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 38
iii. Model 3: zonder ‘mobiel ervaring’ en ‘snelheidsscore’ b
Model Summary
a
Model 1
R ,412
Adjusted R
Std. Error of the
Square
Estimate
R Square a
,170
,082
ANOVA Model 1
153,265
Sum of Squares Regression
a. Predictors: (Constant), Mobiel_Bruikbaar, Snelheid, Domein_Dagen, Sociale_Auto_Pagina, Paginagrootte,
df
Mean Square
544100,677
12
45341,723
Residual
2654397,037
113
23490,239
Total
3198497,714
125
F
Sig.
1,930
Robots, Kwaliteit_Pagina, Sitemap,
a. Dependent Variable: Ranking
Sociale_Autoriteit_Domein, Sociale_Media, Afbeelding_Alt,
b. Predictors: (Constant), Mobiel_Bruikbaar, Snelheid, Domein_Dagen, Sociale_Auto_Pagina,
Mobiel_Snelheid
Paginagrootte, Robots, Kwaliteit_Pagina, Sitemap, Sociale_Autoriteit_Domein, Sociale_Media,
b. Dependent Variable: Ranking
Afbeelding_Alt, Mobiel_Snelheid
a
Residuals Statistics Minimum Predicted Value
Maximum
Mean
Std. Deviation
N
-109,38
352,99
209,62
65,976
126
-272,929
277,894
,000
145,723
126
Std. Predicted Value
-4,835
2,173
,000
1,000
126
Std. Residual
-1,781
1,813
,000
,951
126
Residual
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 39
,038
b
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Std. Error
Coefficients Beta
388,602
131,704
-,016
,007
Robots
-24,452
Sitemap
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
VIF
2,951
,004
127,673
649,531
-,220
-2,408
,018
-,029
-,003
,881
1,135
45,649
-,050
-,536
,593
-114,892
65,987
,853
1,172
25,540
32,036
,079
,797
,427
-37,928
89,008
,742
1,348
1,139
,960
,118
1,186
,238
-,763
3,040
,737
1,356
-1,630
16,801
-,009
-,097
,923
-34,916
31,655
,804
1,244
-,361
,273
-,141
-1,324
,188
-,902
,179
,649
1,540
Snelheid
-1,300
2,035
-,064
-,639
,524
-5,332
2,732
,741
1,350
Sociale_Media
11,861
10,779
,110
1,100
,273
-9,494
33,215
,741
1,350
Sociale_Auto_Pagina
-,001
,004
-,015
-,156
,876
-,008
,007
,824
1,214
Sociale_Autoriteit_Domein
-,002
,001
-,231
-2,380
,019
-,003
,000
,780
1,282
Mobiel_Snelheid
-1,773
1,241
-,146
-1,428
,156
-4,232
,687
,699
1,430
Mobiel_Bruikbaar
40,577
31,053
,127
1,307
,194
-20,944
102,098
,780
1,281
Domein_Dagen
Afbeelding_Alt Kwaliteit_Pagina Paginagrootte
a. Dependent Variable: Ranking
One-Sample Kolmogorov-Smirnov Test N
NPar Tests
Normal Parameters
126 a,b
Mean Std. Deviation
Most Extreme Differences
Test Statistic Asymp. Sig. (2-tailed)
Universiteit Gent
,0000000 ,95078915
Absolute
,106
Positive
,106
Negative
-,092 ,106 ,001
c
Master Handelswetenschappen Management & Informatica
Pagina 40
b. Individuele onderdelen i. Leeftijd b
Model Summary
Descriptive Statistics Mean Ranking
Std. Deviation
209,62
Domein_Dagen
4540,80
N
159,962
Model
126
2238,019
R
1
126
,257
R Square a
Adjusted R
Std. Error of the
Square
Estimate
,066
,059
155,207
a. Predictors: (Constant), Domein_Dagen b. Dependent Variable: Ranking
a
ANOVA Model 1
Sum of Squares Regression
df
Mean Square
211454,482
1
211454,482
Residual
2987043,232
124
24089,058
Total
3198497,714
125
F 8,778
Sig. ,004
b
a. Dependent Variable: Ranking b. Predictors: (Constant), Domein_Dagen
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 41
ii. Crawler-vriendelijkheid b
Model Summary
Model 1
R
Adjusted R
Std. Error of the
Square
Estimate
R Square
,130
a
a
ANOVA
,017
-,016
Model 1
Sum of Squares Regression
161,211
a. Predictors: (Constant), Kwaliteit_Pagina, Afbeelding_Alt, Sitemap, Robots
df
Mean Square
53820,576
4
13455,144
Residual
3144677,138
121
25989,067
Total
3198497,714
125
F
Sig. ,518
,723
b
a. Dependent Variable: Ranking
b. Dependent Variable: Ranking
b. Predictors: (Constant), Kwaliteit_Pagina, Afbeelding_Alt, Sitemap, Robots
iii. Laadsnelheid a
ANOVA b
Model Summary
Model 1
R ,132
R Square a
Model
Adjusted R
Std. Error of the
Square
Estimate
,017
-,007
1
Sum of Squares Regression
160,500
df
Mean Square
F
55760,853
3
18586,951
Residual
3142736,861
122
25760,138
Total
3198497,714
125
a. Predictors: (Constant), Snelheidsscore, Paginagrootte,
a. Dependent Variable: Ranking
Snelheid
b. Predictors: (Constant), Snelheidsscore, Paginagrootte, Snelheid
Sig. ,722
,541
b
Model Summary
a
Model
R
1
,020
R Square a
,000
Adjusted R
Std. Error of the
Square
Estimate
-,016
a. Predictors: (Constant), Snelheid, Paginagrootte b. Dependent Variable: Ranking
ANOVA Model
161,225
1
Regression
Sum of Squares
df
Mean Square
1295,980
2
647,990
Residual
3197201,734
123
25993,510
Total
3198497,714
125
F
Sig. ,025
,975
b
b. Predictors: (Constant), Snelheid, Paginagrootte
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 42
b
Coefficients
a
Standardized Unstandardized Coefficients Model
B
1
(Constant)
Std. Error
347,294
98,413
-,156
,245
Snelheid
-1,016
Snelheidsscore
-1,696
Paginagrootte
Coefficients
95,0% Confidence Interval for B
Beta
t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
VIF
3,529
,001
152,475
542,112
-,061
-,637
,525
-,641
,329
,883
1,132
2,054
-,050
-,495
,622
-5,082
3,049
,798
1,253
1,166
-,154
-1,454
,148
-4,005
,613
,717
1,394
F
Sig.
a. Dependent Variable: Ranking
a
b
ANOVA
Model Summary
Model 1
R ,124
Adjusted R
Std. Error of the
Square
Estimate
R Square a
,015
-,001
Model 1
Regression
160,006
a. Predictors: (Constant), Snelheidsscore, Paginagrootte b. Dependent Variable: Ranking
Sum of Squares
df
Mean Square
49451,315
2
24725,658
Residual
3149046,399
123
25602,003
Total
3198497,714
125
,966
,384
a. Dependent Variable: Ranking b. Predictors: (Constant), Snelheidsscore, Paginagrootte Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant) Paginagrootte Snelheidsscore
Std. Error
319,184
80,123
-,153
,244
-1,445
1,047
Coefficients Beta
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
VIF
3,984
,000
160,587
477,782
-,059
-,625
,533
-,636
,331
,884
1,131
-,131
-1,380
,170
-3,518
,628
,884
1,131
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 43
b
iv. Sociale media b
Model Summary
Model 1
R ,277
R Square a
a
ANOVA
Adjusted R
Std. Error of the
Square
Estimate
,077
,054
Model
Sum of Squares
1
Regression
155,592
a. Predictors: (Constant), Sociale_Autoriteit_Domein,
df
Mean Square
244997,234
3
81665,745
Residual
2953500,480
122
24209,020
Total
3198497,714
125
F
Sig.
3,373
,021
b
Sociale_Media, Sociale_Auto_Pagina a. Dependent Variable: Ranking
b. Dependent Variable: Ranking
b. Predictors: (Constant), Sociale_Autoriteit_Domein, Sociale_Media, Sociale_Auto_Pagina
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Std. Error
200,476
21,633
10,640
9,526
Sociale_Auto_Pagina
-,001
Sociale_Autoriteit_Domein
-,002
Sociale_Media
Coefficients Beta
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
9,267
,000
157,652
243,301
,098
1,117
,266
-8,218
29,499
,978
1,023
,004
-,026
-,274
,784
-,008
,006
,862
1,160
,001
-,263
-2,787
,006
-,003
-,001
,848
1,179
a. Dependent Variable: Ranking
Universiteit Gent
VIF
Master Handelswetenschappen Management & Informatica
Pagina 44
v. Mobiele bruikbaarheid b
Model Summary
Model 1
R ,147
Adjusted R
Std. Error of the
Square
Estimate
R Square a
a
ANOVA
,022
-,002
Model 1
Regression
160,157
a. Predictors: (Constant), Mobiel_Snelheid, Mobiel_Ervaring, Mobiel_Bruikbaar
Sum of Squares
df
Mean Square
69180,086
3
23060,029
Residual
3129317,628
122
25650,144
Total
3198497,714
125
F
Sig. ,899
,444
a. Dependent Variable: Ranking
b. Dependent Variable: Ranking
b. Predictors: (Constant), Mobiel_Snelheid, Mobiel_Ervaring, Mobiel_Bruikbaar
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Std. Error
346,726
154,728
Mobiel_Bruikbaar
74,837
76,831
Mobiel_Ervaring
-1,413
Mobiel_Snelheid
-1,106
Coefficients Beta
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
2,241
,027
40,426
653,026
,234
,974
,332
-77,258
226,932
,139
7,184
2,230
-,152
-,633
,528
-5,827
3,002
,139
7,177
1,089
-,091
-1,016
,312
-3,262
1,049
,992
1,008
a. Dependent Variable: Ranking
Universiteit Gent
VIF
Master Handelswetenschappen Management & Informatica
Pagina 45
b
b
Model Summary
Model 1
R ,136
R Square a
a
ANOVA
Adjusted R
Std. Error of the
Square
Estimate
,018
,002
Model 1
Sum of Squares Regression
159,766
a. Predictors: (Constant), Mobiel_Snelheid, Mobiel_Bruikbaar
df
Mean Square
F
58888,865
2
29444,432
Residual
3139608,849
123
25525,275
Total
3198497,714
125
Sig.
1,154
,319
b. Dependent Variable: Ranking a. Dependent Variable: Ranking b. Predictors: (Constant), Mobiel_Snelheid, Mobiel_Bruikbaar
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Std. Error
259,201
69,453
Mobiel_Bruikbaar
29,713
28,707
Mobiel_Snelheid
-1,104
1,086
Coefficients Beta
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
3,732
,000
121,723
396,680
,093
1,035
,303
-27,110
86,536
,992
1,008
-,091
-1,017
,311
-3,255
1,046
,992
1,008
a. Dependent Variable: Ranking
Universiteit Gent
VIF
Master Handelswetenschappen Management & Informatica
Pagina 46
b
a
b
ANOVA
Model Summary
Model
R
1
,118
R Square a
,014
Adjusted R
Std. Error of the
Square
Estimate
-,002
Model 1
160,123
a. Predictors: (Constant), Mobiel_Ervaring, Mobiel_Snelheid b. Dependent Variable: Ranking
Sum of Squares Regression
df
Mean Square
44844,286
2
22422,143
Residual
3153653,429
123
25639,459
Total
3198497,714
125
F
Sig. ,875
,420
b
a. Dependent Variable: Ranking b. Predictors: (Constant), Mobiel_Snelheid, Mobiel_Ervaring Coefficients
a
Standardized Unstandardized Coefficients Model 1
B (Constant)
Std. Error
229,755
97,548
Mobiel_Snelheid
-1,138
1,088
Mobiel_Ervaring
,601
,835
Coefficients Beta
95,0% Confidence Interval for B t
Sig.
Lower Bound
Upper Bound
Collinearity Statistics Tolerance
2,355
,020
36,664
422,846
-,094
-1,046
,298
-3,293
1,016
,993
1,007
,065
,720
,473
-1,051
2,254
,993
1,007
a. Dependent Variable: Ranking
Universiteit Gent
VIF
Master Handelswetenschappen Management & Informatica
Pagina 47
2.5
Volledige model a. Eerste model b
Model Summary
Model
R
1
,790
R Square a
a
Adjusted R
Std. Error of the
Square
Estimate
,624
,373
ANOVA Model
126,679
a. Predictors: (Constant), Mobiel_Snelheid, Links_Extern, Keyword_Aantal_Variant, Keyword_Aantal_Titel, Header_H1,
1
Sum of Squares
df
Mean Square
Regression
1994930,047
50
39898,601
Residual
1203567,668
75
16047,569
Total
3198497,714
125
F
Sig.
2,486
,000
Robots, Titel_tag, Lengte_Meta, Afbeelding_Alt, Meta_Vriendelijk,
a. Dependent Variable: Ranking
Links_Juice, Sociale_Autoriteit_Domein, Titel_Lengte,
b. Predictors: (Constant), Mobiel_Snelheid, Links_Extern, Keyword_Aantal_Variant,
Header_H4, Links_Titel, Keyword_Aantal_Meta, Mobiel_Ervaring,
Keyword_Aantal_Titel, Header_H1, Robots, Titel_tag, Lengte_Meta, Afbeelding_Alt, Meta_Vriendelijk,
URL_Lengte, URL_Domein, Sociale_Media, URL_keyword,
Links_Juice, Sociale_Autoriteit_Domein, Titel_Lengte, Header_H4, Links_Titel, Keyword_Aantal_Meta,
Sociale_Auto_Pagina, Header_H3, Links_Extern_Totaal,
Mobiel_Ervaring, URL_Lengte, URL_Domein, Sociale_Media, URL_keyword, Sociale_Auto_Pagina,
Kwaliteit_Pagina, Links_Uniek_URL, Snelheid, Keyword_In_Titel,
Header_H3, Links_Extern_Totaal, Kwaliteit_Pagina, Links_Uniek_URL, Snelheid, Keyword_In_Titel,
Links_Score_Domein, Sitemap, Paginagrootte, Meta_Tag,
Links_Score_Domein, Sitemap, Paginagrootte, Meta_Tag, Header_H5_H6, Keyword_Dichtheid,
Header_H5_H6, Keyword_Dichtheid, URL_Vriendelijk,
URL_Vriendelijk, Meta_Eigen, Titel_Vriendelijk, URL_LiggendStreepje, Domein_Dagen,
Meta_Eigen, Titel_Vriendelijk, URL_LiggendStreepje,
Links_Domein_Uniek, Keyword_Dichtheid_Variant, Links_Score_Pagina, Links_Aantal,
Domein_Dagen, Links_Domein_Uniek,
Mobiel_Bruikbaar, Snelheidsscore, Keyword_Aantal, Links_URL, Header_H2, Links_Uniek,
Keyword_Dichtheid_Variant, Links_Score_Pagina, Links_Aantal,
Links_Domein
Mobiel_Bruikbaar, Snelheidsscore, Keyword_Aantal, Links_URL, Header_H2, Links_Uniek, Links_Domein b. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 48
b
Coefficients
a
Standardized Unstandardized Coefficients Model 1
(Constant)
B
Std. Error
Upper Bound
Tolerance
VIF
-,164
-,691
,492
-1144,161
554,657
,089
11,239
,573
-,025
-,267
,790
-1,294
,989
,570
1,754
-11,516
27,525
-,052
-,418
,677
-66,349
43,316
,331
3,020
66,338
39,147
,194
1,695
,094
-11,647
144,323
,384
2,607
-,023
,059
-,034
-,388
,699
-,140
,094
,645
1,551
Meta_Eigen
-81,477
37,527
-,254
-2,171
,033
-156,235
-6,718
,366
2,730
Meta_Vriendelijk
-60,695
24,353
-,228
-2,492
,015
-109,209
-12,182
,597
1,674
Header_H1
-,821
2,225
-,034
-,369
,713
-5,253
3,612
,608
1,644
Header_H2
-,283
2,508
-,034
-,113
,911
-5,279
4,714
,056
17,952
Header_H3
-1,547
2,108
-,088
-,734
,465
-5,747
2,653
,350
2,856
Header_H4
-2,902
3,741
-,086
-,776
,440
-10,355
4,551
,409
2,445
Header_H5_H6
,891
3,772
,030
,236
,814
-6,623
8,405
,318
3,140
URL_Vriendelijk
-42,118
21,683
-,233
-1,942
,056
-85,312
1,076
,349
2,863
URL_Lengte
,531
,695
,080
,765
,447
-,853
1,915
,456
2,193
URL_Domein
1,651
3,029
,057
,545
,587
-4,384
7,686
,456
2,194
URL_keyword
54,103
47,457
,135
1,140
,258
-40,436
148,642
,356
2,812
URL_LiggendStreepje
-2,356
1,175
-,245
-2,006
,048
-4,696
-,016
,337
2,967
-91,193
43,482
-,205
-2,097
,039
-177,813
-4,574
,526
1,901
Keyword_Aantal_Meta
56,410
24,297
,233
2,322
,023
8,007
104,813
,498
2,010
Keyword_Aantal_Titel
-36,704
13,415
-,363
-2,736
,008
-63,428
-9,980
,285
3,508
Lengte_Meta
Keyword_In_Titel
Universiteit Gent
-,153
Lower Bound
1715,663
Meta_Tag
426,388
Sig.
-86,971
Titel_Vriendelijk
-294,752
t
Collinearity Statistics
,076
Titel_Lengte
452,445
Beta
95,0% Confidence Interval for B
1,800
Titel_tag
814,346
Coefficients
Master Handelswetenschappen Management & Informatica
Pagina 49
Keyword_Aantal
,004
,297
,003
,015
,988
-,587
,596
,100
10,022
18,353
9,767
,219
1,879
,064
-1,105
37,810
,369
2,707
-,677
,642
-,430
-1,055
,295
-1,956
,601
,030
33,049
-15,053
22,403
-,089
-,672
,504
-59,682
29,576
,283
3,528
Links_Aantal
-,007
,009
-,202
-,760
,450
-,025
,011
,071
14,134
Links_Uniek
-,384
,650
-,228
-,591
,556
-1,678
,910
,034
29,793
Links_Extern
,069
,090
,301
,770
,444
-,110
,248
,033
30,421
Links_Extern_Totaal
,312
,580
,061
,539
,592
-,842
1,467
,389
2,571
1,994E-006
,000
,595
,836
,406
,000
,000
,010
101,237
Links_Domein_Uniek
,000
,000
-,621
-,867
,388
-,001
,000
,010
102,274
Links_Score_Domein
-1,856
1,217
-,250
-1,525
,131
-4,280
,568
,187
5,339
Links_Score_Pagina
-2,550
1,262
-,314
-2,020
,047
-5,064
-,036
,208
4,801
,510
,276
,553
1,850
,068
-,039
1,059
,056
17,784
-,834
,965
-,083
-,864
,390
-2,756
1,089
,544
1,838
Links_Titel
,401
,524
,070
,765
,447
-,643
1,446
,596
1,677
Links_Juice
-,604
1,207
-,045
-,500
,618
-3,009
1,801
,618
1,618
,002
,009
,032
,254
,800
-,016
,020
,309
3,240
Robots
15,143
43,273
,031
,350
,727
-71,062
101,348
,649
1,542
Sitemap
-35,447
33,105
-,110
-1,071
,288
-101,396
30,502
,475
2,107
,362
1,043
,038
,347
,730
-1,716
2,440
,426
2,345
-6,726
17,370
-,038
-,387
,700
-41,330
27,877
,514
1,946
-,130
,331
-,051
-,395
,694
-,789
,528
,302
3,309
-1,809
2,145
-,088
-,843
,402
-6,083
2,465
,455
2,196
Keyword_Dichtheid Keyword_Aantal_Vari ant Keyword_Dichtheid_V ariant
Links_Domein
Links_URL Links_Uniek_URL
Domein_Dagen
Afbeelding_Alt Kwaliteit_Pagina Paginagrootte Snelheid
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 50
Snelheidsscore
,034
2,384
,003
,014
,988
-4,714
4,783
,107
9,350
Sociale_Media
18,348
10,690
,169
1,716
,090
-2,947
39,643
,515
1,943
,001
,004
,024
,268
,789
-,006
,008
,626
1,596
,001
,001
,075
,780
,438
-,001
,002
,541
1,848
-24,162
68,402
-,075
-,353
,725
-160,427
112,102
,110
9,101
Mobiel_Ervaring
2,224
2,026
,239
1,098
,276
-1,812
6,259
,106
9,465
Mobiel_Snelheid
-1,515
2,580
-,125
-,587
,559
-6,655
3,625
,111
9,042
Sociale_Auto_Pagina Sociale_Autoriteit_Do mein Mobiel_Bruikbaar
a. Dependent Variable: Ranking
Excluded Variables
a
Collinearity Statistics Minimum Model 1
Beta In Keyword_Aantal_Totaal Keyword_Dichtheid_Som
t .
Sig.
Partial Correlation
Tolerance
VIF
Tolerance
b
.
.
.
,000
.
,000
b
3,420
,001
,369
7,915E-009
126335571,389
7,915E-009
2547,158
a. Dependent Variable: Ranking b. Predictors in the Model: (Constant), Mobiel_Snelheid, Links_Extern, Keyword_Aantal_Variant, Keyword_Aantal_Titel, Header_H1, Robots, Titel_tag, Lengte_Meta, Afbeelding_Alt, Meta_Vriendelijk, Links_Juice, Sociale_Autoriteit_Domein, Titel_Lengte, Header_H4, Links_Titel, Keyword_Aantal_Meta, Mobiel_Ervaring, URL_Lengte, URL_Domein, Sociale_Media, URL_keyword, Sociale_Auto_Pagina, Header_H3, Links_Extern_Totaal, Kwaliteit_Pagina, Links_Uniek_URL, Snelheid, Keyword_In_Titel, Links_Score_Domein, Sitemap, Paginagrootte, Meta_Tag, Header_H5_H6, Keyword_Dichtheid, URL_Vriendelijk, Meta_Eigen, Titel_Vriendelijk, URL_LiggendStreepje, Domein_Dagen, Links_Domein_Uniek, Keyword_Dichtheid_Variant, Links_Score_Pagina, Links_Aantal, Mobiel_Bruikbaar, Snelheidsscore, Keyword_Aantal, Links_URL, Header_H2, Links_Uniek, Links_Domein
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 51
b. Tweede model a
b
ANOVA
Model Summary
Model 1
R ,783
Adjusted R
Std. Error of the
Square
Estimate
R Square a
,613
,431
Model 1
120,710
a. Predictors: (Constant), Mobiel_Snelheid, Links_Extern,
Sum of Squares
df
Mean Square
Regression
1959968,654
40
48999,216
Residual
1238529,061
85
14570,930
Total
3198497,714
125
F
Sig. 3,363
,000
Keyword_Aantal_Variant, Keyword_Aantal_Titel, Header_H1,
a. Dependent Variable: Ranking
Robots, Titel_tag, Lengte_Meta, Afbeelding_Alt,
b. Predictors: (Constant), Mobiel_Snelheid, Links_Extern, Keyword_Aantal_Variant, Keyword_Aantal_Titel,
Meta_Vriendelijk, Titel_Lengte, Sociale_Autoriteit_Domein,
Header_H1, Robots, Titel_tag, Lengte_Meta, Afbeelding_Alt, Meta_Vriendelijk, Titel_Lengte,
Header_H4, Links_Titel, Keyword_Aantal_Meta,
Sociale_Autoriteit_Domein, Header_H4, Links_Titel, Keyword_Aantal_Meta, Kwaliteit_Pagina,
Kwaliteit_Pagina, URL_keyword, URL_Domein, Sitemap,
URL_keyword, URL_Domein, Sitemap, URL_Lengte, Sociale_Auto_Pagina, Sociale_Media, Header_H3,
URL_Lengte, Sociale_Auto_Pagina, Sociale_Media,
Links_Uniek_URL, Snelheid, Keyword_In_Titel, Mobiel_Ervaring, Links_Score_Domein, Meta_Tag,
Header_H3, Links_Uniek_URL, Snelheid, Keyword_In_Titel,
Paginagrootte, Header_H5_H6, Keyword_Dichtheid, URL_Vriendelijk, Meta_Eigen, Titel_Vriendelijk,
Mobiel_Ervaring, Links_Score_Domein, Meta_Tag,
URL_LiggendStreepje, Domein_Dagen, Links_Score_Pagina, Links_Aantal, Links_URL
Paginagrootte, Header_H5_H6, Keyword_Dichtheid, URL_Vriendelijk, Meta_Eigen, Titel_Vriendelijk, URL_LiggendStreepje, Domein_Dagen, Links_Score_Pagina, Links_Aantal, Links_URL b. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 52
b
Coefficients
a
Standardized Unstandardized Coefficients Model 1
B
(Constant)
Std. Error
Upper Bound
Tolerance
VIF
-,151
-,890
,376
-879,461
335,477
,157
6,356
,536
-,022
-,245
,807
-1,197
,934
,592
1,691
-12,361
24,395
-,055
-,507
,614
-60,865
36,144
,383
2,613
67,684
35,698
,198
1,896
,061
-3,293
138,660
,419
2,388
-,017
,055
-,026
-,313
,755
-,126
,092
,675
1,481
Meta_Eigen
-86,385
34,463
-,269
-2,507
,014
-154,907
-17,864
,394
2,536
Meta_Vriendelijk
-65,509
22,831
-,247
-2,869
,005
-110,905
-20,114
,617
1,621
Header_H1
-,595
1,945
-,024
-,306
,760
-4,462
3,272
,723
1,383
Header_H3
-1,467
1,936
-,083
-,758
,451
-5,316
2,382
,377
2,653
Header_H4
-3,063
3,274
-,091
-,935
,352
-9,573
3,447
,485
2,063
Header_H5_H6
,618
3,429
,021
,180
,857
-6,200
7,436
,350
2,858
URL_Vriendelijk
-45,515
19,114
-,252
-2,381
,019
-83,518
-7,512
,408
2,450
URL_Lengte
,526
,642
,079
,819
,415
-,751
1,803
,484
2,065
URL_Domein
1,037
2,701
,036
,384
,702
-4,333
6,408
,521
1,921
URL_keyword
59,101
41,819
,148
1,413
,161
-24,046
142,247
,416
2,405
URL_LiggendStreepje
-2,344
1,067
-,243
-2,197
,031
-4,465
-,223
,371
2,696
-93,555
40,966
-,210
-2,284
,025
-175,006
-12,104
,538
1,858
Keyword_Aantal_Meta
53,925
21,853
,223
2,468
,016
10,476
97,375
,558
1,791
Keyword_Aantal_Titel
-30,974
11,894
-,306
-2,604
,011
-54,623
-7,324
,329
3,037
17,009
8,476
,203
2,007
,048
,157
33,861
,445
2,245
Lengte_Meta
Keyword_In_Titel
Keyword_Dichtheid
Universiteit Gent
-,131
Lower Bound
1506,553
Meta_Tag
305,527
Sig.
172,736
Titel_Vriendelijk
-271,992
t
Collinearity Statistics
,014
Titel_Lengte
335,422
Beta
95,0% Confidence Interval for B
2,503
Titel_tag
839,644
Coefficients
Master Handelswetenschappen Management & Informatica
Pagina 53
Keyword_Aantal_Varian
-,729
,358
-,463
-2,035
,045
-1,441
-,017
,088
11,336
Links_Aantal
-,006
,006
-,185
-,984
,328
-,019
,006
,128
7,786
Links_Extern
,020
,026
,086
,757
,451
-,032
,072
,350
2,856
Links_Score_Domein
-1,713
1,102
-,230
-1,555
,124
-3,903
,477
,208
4,819
Links_Score_Pagina
-2,358
1,090
-,290
-2,164
,033
-4,525
-,191
,254
3,943
,454
,238
,492
1,909
,060
-,019
,926
,069
14,563
-,812
,905
-,081
-,896
,373
-2,612
,989
,561
1,782
Links_Titel
,438
,468
,077
,936
,352
-,492
1,368
,681
1,469
Domein_Dagen
,001
,008
,008
,068
,946
-,016
,017
,328
3,051
Robots
10,946
40,474
,022
,270
,787
-69,528
91,420
,673
1,486
Sitemap
-27,667
30,140
-,086
-,918
,361
-87,593
32,260
,520
1,924
,561
,919
,058
,611
,543
-1,266
2,388
,499
2,003
-7,685
15,828
-,044
-,486
,629
-39,155
23,784
,562
1,779
-,153
,243
-,060
-,631
,530
-,636
,330
,508
1,969
Snelheid
-1,716
1,890
-,084
-,908
,366
-5,473
2,040
,533
1,876
Sociale_Media
18,657
9,651
,172
1,933
,057
-,533
37,847
,573
1,744
,001
,003
,017
,200
,842
-,006
,007
,668
1,496
,000
,001
,066
,742
,460
-,001
,002
,574
1,741
Mobiel_Ervaring
1,470
,873
,158
1,684
,096
-,265
3,205
,517
1,935
Mobiel_Snelheid
-1,348
1,122
-,111
-1,201
,233
-3,580
,884
,531
1,885
t
Links_URL Links_Uniek_URL
Afbeelding_Alt Kwaliteit_Pagina Paginagrootte
Sociale_Auto_Pagina Sociale_Autoriteit_Dom ein
a. Dependent Variable: Ranking
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 54
a
Residuals Statistics Minimum Predicted Value
Maximum
Mean
Std. Deviation
N
-70,87
538,37
209,62
125,219
126
-237,876
275,905
,000
99,540
126
Std. Predicted Value
-2,240
2,625
,000
1,000
126
Std. Residual
-1,971
2,286
,000
,825
126
Residual
a. Dependent Variable: Ranking
Charts
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 55
One-Sample Kolmogorov-Smirnov Test ZRE_28 N
126
Normal Parameters
a,b
Most Extreme Differences
Mean
,000000
Std.
,824621
Deviation
13
Absolute
,051
Positive
,039
Negative
-,051
Test Statistic
,051
Asymp. Sig. (2-tailed)
,200
c,d
Descriptive Statistics Mean
Std. Deviation
N
Ranking
209,62
159,962
126
Titel_tag
,99
,089
126
48,57
26,188
126
2,02
,715
126
,68
,467
126
112,48
240,513
126
,44
,499
126
Meta_Vriendelijk
1,46
,602
126
Header_H1
2,03
6,529
126
Header_H3
5,01
9,083
126
Header_H4
2,05
4,736
126
Header_H5_H6
1,37
5,323
126
URL_Vriendelijk
2,29
,884
126
Titel_Lengte Titel_Vriendelijk Meta_Tag Lengte_Meta Meta_Eigen
Universiteit Gent
Master Handelswetenschappen Management & Informatica
Pagina 56
URL_Lengte
62,34
24,155
126
URL_Domein
13,60
5,540
126
URL_keyword
,80
,400
126
8,09
16,617
126
URL_LiggendStreepje Keyword_In_Titel
b
Model Summary
Model
R
R Square a
Adjusted R
Std. Error of the
Square
Estimate
,85
,359
126
1
Keyword_Aantal_Meta
1,35
,661
126
a. Predictors: (Constant), Mobiel_Snelheid, Links_Extern, Meta_Eigen,
Keyword_Aantal_Titel
2,96
1,582
126
Domein_Dagen, Header_H5_H6, Mobiel_Ervaring,
2,9856
1,90873
126
Sociale_Auto_Pagina, Keyword_In_Titel, Titel_tag, Afbeelding_Alt,
12,94
101,504
126
Header_H1, Meta_Vriendelijk, Links_Titel, Lengte_Meta,
Links_Aantal
1048,91
4756,866
126
Links_Uniek_URL, Robots, Keyword_Aantal_Meta, Titel_Lengte,
Links_Extern
122,61
697,217
126
Kwaliteit_Pagina, Keyword_Dichtheid, URL_Lengte, Sociale_Media,
Links_Score_Domein
47,18
21,514
126
URL_Domein, URL_keyword, Snelheid, Sociale_Autoriteit_Domein,
Links_Score_Pagina
24,68
19,671
126
Sitemap, Header_H4, Paginagrootte, Header_H3, URL_Vriendelijk,
Links_URL
123,91
173,361
126
Meta_Tag, URL_LiggendStreepje, Links_Score_Pagina,
Links_Uniek_URL
75,657
15,9152
126
Titel_Vriendelijk, Keyword_Aantal_Titel, Links_Score_Domein,
Links_Titel
22,368
27,9829
126
Links_Aantal
4540,80
2238,019
126
Robots
,88
,325
126
Sitemap
,57
,497
126
Afbeelding_Alt
5,61
16,632
126
Kwaliteit_Pagina
6,50
,910
126
Paginagrootte
35,7107
62,35717
126
Snelheid
9,74737
7,825724
126
1,76
1,477
126
367,375
4080,0636
126
4735,444
21594,3924
126
Mobiel_Ervaring
79,37
17,209
126
Mobiel_Snelheid
59,63
13,205
126
Keyword_Dichtheid Keyword_Aantal_Variant
Domein_Dagen
Sociale_Media Sociale_Auto_Pagina Sociale_Autoriteit_Domein
Universiteit Gent
,771
Master Handelswetenschappen Management & Informatica
,594
,417
122,190
Pagina 57