Leuker kunnen we het wel maken. Online vragenlijst design: standaard matrix of scrollmatrix? Anouk Roberts, Edith de Leeuw, Joop Hox, Thomas Klausch, Anneke de Jongh Manuscript version, final version on http://www.moaweb.nl/kenniscentrum/jaarboeken/2013/leuker-kunnen-we-het-wel-maken.-onlinevragenlijst-design-standaard-matrix-of-scrollmatrix
Contactpersoon: Anouk Roberts Flycatcher Internet Research Avenue Céramique 1 6221 KV Maastricht Postbus 380 6200 AJ Maastricht +31 (0)43 326 29 92
[email protected]
SAMENVATTING Het invullen van standaardvragenlijsten is niet altijd even leuk voor respondenten, met negatieve gevolgen voor de respons en de kwaliteit van de antwoorden. De traditionele matrixvraag ligt onder vuur en wordt gekenschetst als demotiverend. Een aantrekkelijk alternatief is de scrollmatrix. Het principe van de scrollmatrix is dat telkens maar één stelling zichtbaar is. Zodra een antwoord is ingevuld, verschijnt automatisch de volgende stelling. Om de effectiviteit van de scrollmatrix in vergelijking met de traditionele matrix te onderzoeken, heeft onderzoeksbureau Flycatcher in samenwerking met de Universiteit Utrecht een grootschalig online experiment uitgevoerd onder leden van het Flycatcher panel. Uit dit experiment bleek dat bij gebruik van de scrollmatrix minder respondenten vroegtijdig afbreken en dat de datakwaliteit beter is. De responsbias is lager dan bij de standaard matrix. Dit geldt voor alle onderzochte vormen van responsbias: straightlining, beperkte response range, en tendensen voor extreme antwoorden en neutrale antwoorden. Het type vraag had géén invloed op de inter-item-correlatie en de betrouwbaarheid van indices. Tot slot bleek dat panelleden de scrollmatrix prettiger vonden om in te vullen en gaven zij aan dat het invullen in hun beleving sneller leek te gaan. Trefwoorden: online surveys, surveytainment, matrix-vraag, scrollmatrix, datakwaliteit
1. INLEIDING Matrixvragen of grids behoren tot de standaardinstrumenten van ontwerpers van onlinevragenlijsten. Bij een matrixvraag worden een verzameling vragen gepresenteerd in een tabelformaat, waarbij de rijen de vragen zijn en de kolommen de antwoordmogelijkheden weergeven. Respondenten geven antwoord door idealiter in iedere rij een cel met de gewenste antwoordmogelijkheid aan te klikken. Voor een voorbeeld van een matrixvraag zie Figuur 1. Vanuit het oogpunt van de onderzoeker biedt een matrixvraag veel voordelen: het is een efficiënte manier om veel vragen te stellen en toch de lengte van de vragenlijst en de invultijd beperkt te houden, een standaardformaat maakt het eenvoudig om antwoorden van respondenten te vergelijken binnen een onderzoek, maar ook over de tijd heen, en er zijn goed gevalideerde instrumenten beschikbaar in dit formaat, zoals psychologische tests als de ‘big five’. Vanuit het oogpunt van de respondent echter is een matrixvraag niet zo ideaal, het is een nogal vervelende, monotone taak en kan demotiverend werken (Broekhof, 2009; Tress, 2012). Een gemotiveerde respondent zal trachten een zo goed mogelijk antwoord te geven. In het ideale geval wordt de vraag zorgvuldig gelezen en begrepen, wordt de benodigde informatie voor een antwoord gecombineerd, en wordt ook het ware antwoord gegeven; een gemotiveerde respondent neemt de tijd en optimaliseert zijn vraag-antwoord gedrag (zie Tourangeau, Rips, & Rasinski, 2000). Een minder gemotiveerde respondent zal zich er wat sneller vanaf maken, minder zorgvuldig lezen, minder diep nadenken, en een suboptimaal antwoord kiezen. Krosnick (1991) heeft dit antwoordgedrag ‘satisficing’ genoemd. Er worden twee vormen van satisficing onderscheiden. Bij zwakke satisficing, doet een respondent nog wel zijn best, alleen wat minder. Bijvoorbeeld een stelling wordt gelezen, de respondent is het er wel mee eens, maar heeft geen zin om verder na te denken of hij het er nu heel erg mee eens is, mee eens is, of een beetje mee eens is. Hij zal dan een minder gedifferentieerd antwoord geven dat zich uit in een smallere spreiding (range) of de vlucht in het extreme antwoord aan het uiteinde van de schaal. Zwak satisficeren komt voor bij respondenten die wat minder gemotiveerd zijn bijvoorbeeld door een saaie vragenlijst, of bij gemotiveerde respondenten die vermoeid raken aan het einde van een complexe vragenlijst. Wanneer een respondent zich absoluut niet in wil spannen en de vragenlijst zo snel mogelijk wil afraffelen, omdat het een heel vervelende vragenlijst is, of om van een lastige telefonische interviewer af te zijn, of om met zo min mogelijk inspanning de punten bij een online onderzoek binnen te halen, treedt een sterke vorm van satisficing op. Sterk satisficeren uit zich in stereotiep antwoordgedrag waarbij niet nagedacht hoeft te worden en waar weinig tot geen differentiatie in de antwoorden meer gegeven wordt.. Voorbeelden van deze extreme vorm van nondifferentiatie zijn vluchten in de neutrale middencategorie, of steeds hetzelfde antwoord aanvinken, ongeacht de inhoud van de vraag, dit laatste uit zich onder andere in ‘straightlining’. De laatste jaren is er veel discussie over het gebruik van matrixvragen, en in enkele onderzoeken is gebleken dat matrixvragen leiden tot lagere datakwaliteit (zie Callegaro et al., 2009). Matrixvragen zijn ontstaan door het gebruik van papieren vragenlijsten. Om ruimte te besparen, en dus te besparen op de kosten van drukwerk en porto, werden vragen op een zo'n compact mogelijke manier weergegeven. Vragen of stellingen met dezelfde antwoordopties werden daarom in een matrix geplaatst zodat de antwoordopties maar één keer weergegeven hoefden te worden. Met de komst van internet en online onderzoek, is het aantal manieren waarop vragen kunnen worden weergegeven toegenomen: er hoeft geen rekening gehouden te worden met drukwerk en portokosten. Ook zijn er allerlei technische toepassingen mogelijk: vragen hoeven niet meer statisch onder elkaar te staan, maar kunnen op een meer dynamische manier weergegeven worden. Ondanks alle mogelijkheden worden matrixvragen nog steeds veelvuldig gebruikt in online vragenlijsten (Couper, 2008). Een van de redenen is dat alternatieve vraagvormen, zoals ‘drag-and-drop’ of
iedere vraag inclusief de antwoordmogelijkheden apart stellen, de respondent veel meer tijd kosten om te beantwoorden (Garland, 2009). Een nieuw alternatief voor een matrixvraag is de scrollmatrix (Broekhoff, 2009). Het principe van de scrollmatrix is dat telkens maar één stelling zichtbaar is. Zodra een antwoord is ingevuld, verschijnt automatisch de volgende stelling. De antwoordopties veranderen daarbij niet. De scrollmatrix is dus een manier om meerdere stellingen één voor één weer te geven. De scrollmatrix is daarmee een tussenvorm van een standaard matrix en het presenteren van alle onderwerpen in losse vragen. In theorie zou de scrollmatrix de voordelen van losse vragen (minder gemakzuchtig antwoordgedrag en antwoordtendensen) en de voordelen van matrixvragen (kost minder tijd om in te vullen) met elkaar moeten combineren, wat zou leiden tot een hogere datakwaliteit, betere respons, en minder tussentijds afbreken. Een potentieel nadeel van de scrollmatrix zou kunnen zijn dat het voor de respondent lastiger is de samenhang tussen de vragen te zien. Doordat de vragen niet tegelijk op het scherm zichtbaar zijn, kan de scrollmatrix nadelige gevolgen hebben voor de interitem-correlatie. Hoe goed voldoet de scrollmatrix nu in de praktijk? Onderzoeksbureau Flycatcher heeft in samenwerking met de Universiteit Utrecht een grootschalig online experiment uitgevoerd waarin de traditionele matrixvorm en de nieuwe scrollmatrix op een groot aantal punten werden vergeleken. Zo werd er onderzocht of de scrollmatrix de respons bevordert, leidt tot minder afbreken, en de datakwaliteit bevordert. Tevens is onderzocht hoe respondenten de scrollmatrix evalueren. De centrale onderzoeksvraag was: is gebruik van de scrollmatrix in online vragenlijsten beter dan gebruik van een standaard matrix? Deze vraag is onderverdeeld in vier subvragen: 1. Zijn er verschillen in responsbias bij gebruik van de scrollmatrix ten opzichte van de standaard matrix? De verwachting is dat respondenten zich bij de scrollmatrix beter kunnen concentreren op de vraag omdat ze maar één vraag tegelijk zien. Om deze reden is in eerste instantie gekeken naar de invultijd. Een langere invultijd kan echter ook betekenen dat respondenten moeite hebben met de manier waarop ze de scrollmatrix moeten invullen of dat de scrollmatrix meer tijd vergt omdat elke stelling opnieuw ingeladen moet worden. Daarom is ook gekeken naar de verschillende vormen van responsbias die kunnen samenhangen met het beter lezen van de vraag en/of beter nadenken over de antwoorden. Indien deze vormen van bias in de scrollmatrix minder vaak voorkomen dan in de standaard matrix, kan geconcludeerd worden dat een langere invultijd vooral betekent dat de respondenten de vragen beter lezen of beter nadenken over hun antwoord. De verschillende vormen van responsbias die onderzocht werden, zijn vier typen ongewenste responsstijlen die doorgaans in marktonderzoek onderscheiden worden (Baumgartner & Steenkamp, 2008; Fricker et al., 2005): a. het aantal neutrale antwoorden (de midden-categorie). De neutrale categorie staat ook wel bekend als 'vlucht-categorie' voor respondenten die geen zin hebben om de vraag goed te lezen of over het antwoord na te denken; b. het aantal extreme antwoorden (de uiterste categorieën van de matrix); c. de range van de gegeven antwoorden. De response range geeft aan of respondenten een smalle of een brede range van antwoorden rond het gemiddelde geven. Een smalle response range wordt gezien als een vorm van non-differentiatie en wordt uitgedrukt in de hoogte van de standaarddeviatie van alle antwoorden binnen één matrix. d. straightlining is een extreme vorm van nondifferentiatie. In dit onderzoek hebben we straightlining gedefinieerd als een standaarddeviatie van 0 binnen
één matrix. Straightlining treedt vaak op als respondenten de vraag niet goed lezen of niet over het antwoord nadenken, maar gewoon overal hetzelfde invullen. 2. Zijn er meer of minder break-offs bij gebruik van de scrollmatrix of met andere woorden: is er een effect op de respons te zien? Een lange matrixvraag op een pagina leidt altijd tot een zekere mate van uitval op die pagina. Respondenten zien er tegen op om verder te gaan met invullen als ze een hele reeks stellingen onder elkaar zien. Omdat ze bij de scrollmatrix maar één stelling tegelijk op het scherm zien, zou dit tot een lager afbreekpercentage kunnen leiden. 3. Is er een effect op controlevragen (herhaling van dezelfde vraag) in de vragenlijst te zien bij gebruik van de scrollmatrix ten opzichte van de standaard matrix? Ook dit heeft te maken met de mate waarin respondenten de vragen goed lezen en nadenken over hun antwoorden. Bij controlevragen zou hetzelfde antwoord gegeven moeten worden dat eerder is ingevuld, maar indien een respondent de vragen niet goed leest of niet nadenkt over het antwoord, zal de kans groter zijn dat er verschillende antwoorden gegeven worden bij controlevragen. Behalve herhaling van enkele stellingen is ook een controlevraag in de vragenlijst opgenomen waarin letterlijk gevraagd werd een bepaald antwoord in te vullen. 4. Wat vinden de respondenten zelf van de scrollmatrix? Vinden ze de scrollmatrix prettiger, leuker, makkelijker of juist vermoeiender of irritanter dan de standaard matrix? Hebben respondenten bij de scrollmatrix het gevoel dat de vragenlijst korter is dan bij gebruik van de standaard matrix?
2. METHODE 2.1. De onderzoeksgroep: het Flycatcher panel Het experiment is uitgevoerd onder het Flycatcher panel (ISO 26362 gecertificeerd). Het Flycatcher panel bestaat uit ongeveer 16.000 mensen (in juli 2012) van 12 jaar en ouder die zich bereid hebben verklaard om regelmatig deel te nemen aan online onderzoeken. Panelleden ontvangen gemiddeld ongeveer acht vragenlijsten per jaar en de gemiddelde respons bedraagt ongeveer 60-70%. Als tegenprestatie krijgen ze voor een volledig ingevulde vragenlijst een aantal punten, die ingewisseld kunnen worden voor cadeaubonnen. Naast onderzoeken voor punten, ontvangen panelleden maximaal vier keer per jaar een onderzoek dat op eigen initiatief van Flycatcher of ter ondersteuning van een goed doel wordt uitgevoerd. Voor deze onderzoeken ontvangen panelleden geen punten, maar worden enkele cadeaubonnen verloot. De respons bij deze onderzoeken is gemiddeld ongeveer 50%.
2.2 De scrollmatrix Omdat de scrollmatrix nog niet gebruikt werd binnen het Flycatcher panel, is eerst een technisch ontwerp gemaakt van dit vraagtype. Na een functionaliteittest uitgevoerd door Flycatcher, is de scrollmatrix door de Universiteit Utrecht onderworpen aan een usability test. Deze testen zijn uitgevoerd om te kunnen garanderen dat de vragenlijst, en in het bijzonder de scrollmatrix, werkte zoals bedoeld was. Op basis van de testen zijn nog enkele aanpassingen gedaan. Zo is bijvoorbeeld
de tijd tussen het invullen van een antwoord en het verschijnen van de nieuwe stelling verkort van 1 seconde tot 0,6 seconde, omdat alle respondenten in de usability test de tijd tussen de stellingen te lang vonden. Het principe van de scrollmatrix is dat telkens maar één stelling zichtbaar is in de vragenlijst. Zodra een antwoord is ingevuld, verschijnt automatisch de volgende stelling. De antwoordopties veranderen daarbij niet. Onder de antwoordopties is te zien bij welke stelling men is en hoeveel stellingen er in totaal zijn. Hier kan men ook navigeren naar eerdere stellingen om eventueel een antwoord te wijzigen. Figuur 1 geeft een voorbeeld van een standaardmatrix en in figuur 2 is een voorbeeld te zien van de scrollmatrix zoals deze door Flycatcher ontworpen is. Deze scrollmatrix werkt in alle gangbare browsers (ook op tablets en smartphones) en maakt geen gebruik van Flash.
Figuur1. Design standaard matrix
Figuur2. Design scrollmatrix
2.3 De vragenlijst Omdat de doelgroep van het onderzoek het totale Flycatcher panel was, moest de vragenlijst door iedereen van 12 jaar en ouder ingevuld kunnen worden. Gekozen is voor het onderwerp migratie en migranten, waarbij het accent lag op Marokkanen en Chinezen. Panelleden van Marokkaanse of Chinese afkomst kregen een alternatieve vragenlijst voorgelegd met dezelfde vragen maar dan over Polen en Duitsers. Omdat dit slechts een kleine groep was, zijn zij verder niet meegenomen in de analyses.
De vragenlijst is ontwikkeld en getest door de Universiteit Utrecht1. Zij hebben de vragenlijst gepretest door middel van een expert review door drie deskundigen en cognitieve diepte interviews met twaalf potentiële respondenten (zie Campanelli, 2008; De Leeuw, 2009; Willis, 2009). Behalve de formulering van de vragen en instructies, werd in de pretest ook aandacht besteed aan de gevoeligheid van het onderwerp. Op basis van de pretest zijn enkele kleine aanpassingen gedaan in de vragenlijst, bijvoorbeeld om begrippen te verduidelijken. De vragenlijst is vervolgens door Flycatcher online geprogrammeerd, waarbij zes verschillende versies zijn gemaakt, variërend in aantal stellingen per matrix en type matrixvraag. Binnen elke versie werden de vragen gerandomiseerd weergegeven waardoor de helft van de groep eerst de vragen over Chinezen kreeg en de andere helft eerst de vragen over Marokkanen. Alle vragen moesten verplicht ingevuld worden om de vragenlijst te kunnen versturen.
2.4 Experimentele opzet Het onderzoek is uitgevoerd volgens een 2 x 3 experimenteel design. De experimentele factoren zijn: (a) type matrixvraag en (b) aantal items per matrix. a) De factor type matrixvraag heeft twee niveaus: (1) standaard matrix en (2) scrollmatrix. b) De factor aantal items per matrixvraag heeft drie niveaus: (1) vijf items, (2) tien items en (3) vijftien items per matrixvraag, waardoor nagegaan kan worden of de scrollmatrix het beter of slechter doet dan de standaard bij relatief veel vragen per matrix. Dit resulteerde in 6 experimentele groepen, te weten: 1. Standaard matrix, 5 vragen per matrix. 2. Scrollmatrix, 5 vragen per matrix. 3. Standaard matrix, 10 vragen per matrix. 4. Scrollmatrix, 10 vragen per matrix. 5. Standaard matrix, 15 vragen per matrix. 6. Scrollmatrix, 15 vragen per matrix. Respondenten werden random aan een van de zes condities toegewezen. De respondenten kregen eerst allemaal hetzelfde openingsscherm met een introductietekst te zien. Pas wanneer men op 'Volgende' klikte vond de randomisatie plaats en werd het type matrixvraag en aantal items zichtbaar. Respondenten wisten vooraf dus niet in welke groep ze zaten, zodat de experimentele conditie geen invloed gehad kan hebben op de respons en het al dan niet openen van de vragenlijst. Elke groep kreeg drie maal een matrix voorgelegd: een matrixvraag met stellingen over immigratie in het algemeen, gevolgd door twee matrixvragen met vragen over Chinezen en vragen over Marokkanen. Binnen de zes groepen kreeg de ene helft random eerst de vragen over Chinezen en de andere helft random eerst de vragen over Marokkanen. De antwoorden konden telkens op een 7puntsschaal worden aangegeven Nadat alle matrixvragen gesteld waren, kregen de respondenten nog enkele aanvullende vragen. Deze aanvullende vragen bestonden uit een aantal controlevragen en algemene evaluatievragen over het invullen van de vragenlijst. Om de controlevragen zo onopvallend mogelijk te maken, werden tussen de eerste drie matrixvragen en de controlevragen nog enkele zogenaamde 'filler-vragen' gesteld. In alle experimentele condities bestonden de filler-vragen uit vijf stellingen over mensenrechten. Tot slot kregen alleen de respondenten uit de groepen met de scrollmatrix nog een aantal specifieke evaluatievragen over de scrollmatrix. Zij kregen een afbeelding te zien van de
standaard matrix en moesten deze vergelijken met de nieuwe scrollmatrix die ze zojuist gebruikt hadden. Gevraagd werd of ze de nieuwe vorm prettiger, makkelijker, leuker, vermoeiender of irritanter vonden dan de standaard matrix.
2.5 Veldwerk en respons Voor dit experiment is gebruik gemaakt van de in paragraaf 2.1 beschreven mogelijkheid om een vragenlijst naar het hele panel te sturen zonder punten toe te kennen aan elke respondent. Respondenten maakten kans op één cadeaubon van 150 euro, twee cadeaubonnen van 100 euro en drie cadeaubonnen van 50 euro. De panelleden werden uitgenodigd per e-mail. In de e-mail stond algemene informatie over het onderwerp van het onderzoek, namelijk immigratie en immigranten. De panelleden werden niet geïnformeerd over het feit dat het om een experiment ging met een nieuwe manier om vragen weer te geven. De groepen die de scrollmatrix ontvingen, kregen deze zonder verdere uitleg of toelichting voorgelegd, net als de groepen die de standaard matrix kregen. De veldwerkperiode van het onderzoek was van 18 tot en met 25 januari 2011 (één volledige week). Er is geen reminder gestuurd. Van de ruim 14.000 uitgenodigde panelleden hebben bijna 7.000 panelleden de vragenlijst volledig ingevuld (49,1% respons).
2.6 Verwerking data De resultaten van het onderzoek zijn door Flycatcher opgeschoond en verwerkt in een databestand, aangevuld met achtergrondkenmerken van de panelleden en de relevante paradata. Deze achtergrondgegevens vullen respondenten bij hun aanmelding voor het panel in en worden minimaal één keer per jaar geactualiseerd of - indien er geen wijzigingen zijn - actief bevestigd. De paradata die aan het bestand zijn toegevoegd, zijn panelgegevens (bijv. duur van het lidmaatschap en gemiddelde respons), de invultijd per pagina, de experimentele conditie en indien van toepassing het moment van afbreken. De data zijn verder geanalyseerd door de Universiteit Utrecht.
3. RESULTATEN 3.1 Respons en vroegtijdig afbreken De totale respons bedroeg 49,1% (gebruikt is AAPOR-RR6: Callegaro & Disogra, 2008; Esomar, 2011). In tabel 1 is de respons per conditie weergegeven. Te zien is dat de respons het hoogst was (52,0%) in de groep met de korte scrollmatrix en het laagst (46,4%) in de groep met de lange standaard matrix. Tabel 1. Respons per experimentele conditie (N=14223)
Lengte matrix
Kort (5 stellingen) Middel (10 stellingen) Lang (15 stellingen) Totaal
Standaard matrix 48,7% 48,8% 46,4% 48,0%
Type matrixvraag Scroll matrix 52,0% 50,5% 48,0% 50,2%
Totaal 50,3% 49,6% 47,2% 49,1%
De nonrespons bestaat uit respondenten die de vragenlijst helemaal niet geopend hebben en respondenten die de vragenlijst op een bepaald punt afgebroken hebben. Er bleek geen significant verband te zijn tussen de experimentele conditie en het al dan niet openen van de vragenlijst. Verschillen in respons tussen de condities zijn daarom vrijwel zeker het gevolg van verschillen in drop-out. In totaal heeft 94% van de respondenten die de vragenlijst geopend hebben, deze ook volledig ingevuld. Dit betekent dat 6% de vragenlijst op een bepaald punt heeft afgebroken. In tabel 2 is de drop-out per experimentele conditie weergegeven. Tabel 2. Afbreekpercentages per experimentele conditie na openen vragenlijst (N=7423) Type matrixvraag Standaard Scroll Totaal matrix matrix Lengte Kort (5 stellingen) 5,6% 2,6% 4,1% matrix Middel (10 stellingen) 7,2% 4,5% 5,9% Lang (15 stellingen) 9,8% 6,4% 8,1% Totaal 7,5% 4,5% 6,0% Zoals verwacht op basis van de totale respons per conditie, is het afbreekpercentage bij de scrollmatrix lager dan bij de standaard matrix (4,5% t.o.v. 7,5%). Tevens is in tabel 2 te zien dat het afbreek percentage hoger is, naarmate de matrixvragen langer zijn, zowel bij de standaard matrix als bij de scrollmatrix. Uit een logistische regressieanalyse blijkt dat zowel het effect van type matrix als het effect van de lengte van de vragen statistisch significant is (p<0,00). Er is geen significante interactie tussen type matrix en lengte (p=0,24), hetgeen betekent dat het effect van lengte van de vragen op de drop-out in beide matrixvormen even sterk is.
3.2 Datakwaliteit: invultijd en responsbias Per matrixvraag is geregistreerd hoeveel tijd de respondenten nodig hadden om deze volledig in te vullen. Omdat de matrixvragen verschilden in lengte (5, 10 of 15 stellingen per matrix), is de invultijd gedeeld door het aantal items. Per matrix zijn de vijf procent langste responstijden niet meegenomen in de analyse om de invloed van outliers te beperken (dit kunnen bijvoorbeeld respondenten zijn die een pauze genomen hebben tijdens het invullen), dit leidde tot een totale N van 5925. De resultaten zijn per experimentele conditie voor elke matrixvraag apart geanalyseerd (drie matrixvragen per conditie). Omdat per conditie bij elke matrix hetzelfde beeld te zien was, zijn in onderstaande tabel voor de overzichtelijkheid alleen de gemiddelden over alle matrixvragen weergegeven. Tabel 3. Invultijd per experimentele conditie (in seconden)
Lengte matrix
Kort (5 stellingen) Middel (10 stellingen) Lang (15 stellingen) Totaal
Standaard matrix 6,08 5,31 5,03 5,47
Type matrixvraag Scroll matrix 7,35 6,39 5,70 6,48
Totaal 6,72 5,85 5,37 5,98
In de tabel is te zien dat de invultijd per item korter wordt naarmate de matrixvragen langer zijn en dus meer items bevatten (p<0,00). Dit komt overeen met de aanname dat respondenten bij langere matrixvragen minder goed lezen of minder goed over hun antwoord nadenken. Ook is een verschil te zien per type matrixvraag: bij de scrollmatrix is de invultijd per item gemiddeld iets langer dan bij de standaard matrix (p<0,00). De langere invultijd bij de scrollmatrix kan veroorzaakt worden doordat dit vraagtype meer tijd in beslag neemt, bijvoorbeeld door de tijd die is ingebouwd tussen het beantwoorden van een stelling en het verschijnen van de nieuwe stelling (0,6 seconde per keer; hiervoor is niet gecorrigeerd in de analyse). Het kan echter ook betekenen dat respondenten de vragen zorgvuldiger lezen en beter over hun antwoord nadenken. Indien dit laatste het geval is, zou er ook een verschil in responsbias moeten zijn tussen de standaard matrix en de scrollmatrix. Dit is onderzocht met aanvullende analyses van de data, waarbij gekeken is naar vier vormen van responsstijlen, namelijk: extreme responsstijl (voorkeur voor antwoordoptie 1 of 7 op een 7-puntsschaal); neutrale responsstijl (voorkeur voor antwoordoptie 4 op een 7-puntsschaal); spreiding van de antwoorden (range); straightlining. Indien de scrollmatrix inderdaad leidt tot minder responsbias, verwachten we minder extreme en neutrale antwoorden, en minder nondifferentiatie dat tot uiting komt in minder straightlining en meer spreiding in de antwoorden. 3.2.1 Extreme responsstijl Extreme responsstijl is gemeten door het aantal extreme antwoorden te tellen (antwoord 1 of 7 op de gebruikte 7-puntsschaal). Dit is voor alle matrixvragen per experimentele conditie gedaan en omgezet in een Z-score. Manova analyse van de Z-scores laat zien dat zowel het type matrixvraag als de lengte van de matrixvragen significant van invloed is op het aantal extreme antwoorden (type matrix: F=11,4; p<0,00 / lengte: F=10,7; p<0,00). Zoals verwacht is het aantal extreme antwoorden groter naarmate de matrixvraag langer is en komt dit minder vaak voor in de scrollmatrix. Er is geen significante interactie tussen type matrix en lengte (p=0,78). 3.2.2 Neutrale responsstijl Neutrale responsstijl is gemeten door het aantal neutrale antwoorden (antwoord 4 op de gebruikte 7puntsschaal) te tellen. Dit is weer voor alle matrixvragen per experimentele conditie gedaan en omgezet in een Z-score. Manova analyse van de Z-scores laat zien dat zowel het type matrixvraag als de lengte van de matrixvragen significant van invloed is op het aantal extreme antwoorden (type matrix: F=8,1; p<0,00 / lengte: F=9,7; p<0,00). Zoals verwacht is het aantal neutrale antwoorden groter naarmate de matrixvraag langer is en komt het minder vaak voor in de scrollmatrix. Er is geen significante interactie tussen type matrix en lengte (p=0,82). 3.2.3 Spreiding van de antwoorden De spreiding van de antwoorden (range) is gemeten door per respondent de standaarddeviatie te berekenen over de gegeven antwoorden per matrixvraag. Het resultaat is omgezet in een Z-score. Manova analyse laat zien dat zowel het type matrixvraag en de lengte van de matrixvraag significant van invloed zijn op de spreiding van de antwoorden (type matrix: F=8,1; p<0,00 / lengte: F=47,6; p<0,00). De standaardmatrix liet minder spreiding in de antwoorden zien, dan de scrollmatrix. Daarnaast bleek hoe langer de matrix, hoe minder spreiding in de antwoorden. De interactie was wederom niet significant (p=0,97). 3.2.4 Straightlining Straightlining is in dit onderzoek gedefinieerd als een standaarddeviatie van nul over alle gegeven antwoorden binnen een matrixvraag. Omdat het om een binaire variabele gaat (wel of geen
straightlining) is gebruik gemaakt van multivariate logistische regressieanalyse om de verschillen tussen de experimentele groepen te analyseren. Uit de analyse blijkt dat zowel het type matrixvraag en de lengte van de matrixvraag significant van invloed zijn op straightlining (type matrix: 2 = 21,6; p<0,00 / lengte: 2 = 37,6; p<0,00), terwijl de interactie niet significant is (p=0,84). Straightlining kwam in alle groepen vaker voor in de standaard matrix dan in de scrollmatrix. Ook kwam straightlining vaker voor naarmate de matrixvragen langer waren, zowel bij gebruik van de standaard matrix als bij de scrollmatrix.
3.3 Controlevragen In het experiment zijn twee soorten controlevragen gebruikt. Enerzijds werden enkele stellingen uit het begin van de vragenlijst aan het einde nog een keer voorgelegd, in een iets andere maar vergelijkbare vorm. Anderzijds werd aan respondenten letterlijk gevraagd om een bepaald antwoord in te vullen, door middel van de stelling 'om te controleren of iedereen de vragen goed leest, vragen we u nu om mee oneens in te vullen'. De controlevraag waarbij iedereen 'oneens' moest invullen, werd gemiddeld door 93,2% goed beantwoord. Met behulp van logistische regressieanalyse is de invloed van lengte en type matrixvraag geanalyseerd, waarbij de afhankelijke variabele een goed of fout antwoord op de controlevraag was. De lengte van de matrixvragen bleek niet significant van invloed op het aantal juiste antwoorden (p=0,72). Het type matrixvraag was wel significant van invloed (p<0,00), waarbij het aantal juiste antwoorden in de scrollmatrix significant hoger was dan in de standaard matrix. Dit is te zien in tabel 4. Er was geen significante interactie tussen lengte en type matrixvraag (p=0,17). Tabel 4: Percentage juiste antwoorden op controlevraag per experimentele conditie (N=6976) Type matrixvraag Standaard Scroll Totaal matrix matrix Lengte Kort (5 stellingen) 92,6% 94,5% 93,6% matrix Middel (10 stellingen) 89,9% 95,2% 92,6% Lang (15 stellingen) 91,4% 95,3% 93,4% totaal 91,3% 95,0% 93,2% Bij de vier herhaalde stellingen is gekeken hoeveel respondenten bij alle vier de stellingen hetzelfde antwoord gaven als de eerste keer. Door middel van logistische regressieanalyse is de invloed van lengte en type matrixvraag geanalyseerd, waarbij de afhankelijke variabele was: het wel of niet bij alle herhaalde stellingen hetzelfde antwoord hebben ingevuld. Het type matrixvraag bleek in dit geval niet significant van invloed (p=0,13). Wel was er een significante invloed van lengte van de matrixvragen te zien (p<0,00); hoe langer de matrixvragen, hoe minder vaak men bij de herhaalde stellingen hetzelfde antwoord gaf. Er bleek geen significante interactie te zijn tussen lengte en type matrixvraag (p=0,47). Behalve naar het aantal respondenten dat bij alle herhaalde stellingen precies hetzelfde antwoord gaf, is ook gekeken naar de afwijking van de antwoorden bij de herhaalde stellingen. Indien iemand op een 7-puntsschaal de eerste keer antwoord 5 en bij herhaling antwoord 6 invult, heeft dat immers een andere betekenis dan wanneer iemand eerst antwoord 1 en bij herhaling antwoord 6 invult. Omdat de mate van afwijking scheef verdeeld was (de grootste groep week 0, 1 of 2 punten af, bij een maximale afwijking van 6 punten x 4 stellingen = 24 punten), is de afwijking gehercodeerd, waarbij afwijkingen van 5 of meer punten zijn samengenomen. Door middel van een lineaire regressieanalyse is vervolgens gekeken wat de invloed van lengte en type matrixvraag is op de afwijking bij beantwoording van de herhaalde stellingen. Dit liet hetzelfde beeld zien als bij de
analyse van het aantal respondenten dat bij alle herhaalde stellingen precies hetzelfde antwoord gaf. Het type matrixvraag was niet significant van invloed (p=0,49), terwijl de lengte wel significant van invloed was (p<0,00). In tabel 5 is de afwijking van het eerder gegeven antwoord per experimentele conditie weergegeven. Omdat er geen sprake was van een significante interactie, zijn voor de overzichtelijkheid alleen de gemiddelden per type matrix en per lengte weergegeven. Tabel 5: Afwijking van eerder gegeven antwoord bij herhaalde stellingen per experimentele conditie in percentages (n=6976) Lengte van de Matrix Type Matrix Afwijking in Kort Middel Lang Standaard Scroll schaalpunten (5 stellingen) (10 stellingen) (15 stellingen) matrix Matrix 0 / geen afwijking 1 2 3 4 5 of meer
15,2%
12,9%
11,3%
13,7%
12,5%
22,9% 23,3% 16,4% 9,9% 12,5%
22,2% 21,9% 18,1% 10,9% 14,0%
19,5% 22,6% 19,8% 11,3% 15,7%
21,3% 22,0% 17,7% 10,8% 14,5%
21,7% 23,1% 18,4% 10,6% 13,6%
3.4 Inter-item-correlatie Indien verschillende stellingen of vragen samen een schaal of construct vormen, is het vaak raadzaam deze in de vragenlijst ook te groeperen, zodat de respondent deze items zo veel mogelijk binnen dezelfde context invult (Salant & Dilman, 1994; Czaja & Blair, 2004). Indien de vragen één voor één voorgelegd worden, zoals in de scrollmatrix, zou een respondent het overzicht kunnen verliezen en zou dit gewenste context-effect lager kunnen zijn. Dit zou dan kunnen leiden tot en lagere schaalbetrouwbaarheid of een lagere inter-item-correlatie. Om dit te testen is de Cronbach's alpha berekend van alle afzonderlijke matrixvragen per experimentele conditie. Omdat het aantal stellingen verschilde per experimentele conditie, is voor de vergelijkbaarheid Cronbach's alpha alleen berekend over die vijf items die in alle versies hetzelfde waren. Gemiddeld bleek de Cronbach's alpha in de standaard matrix iets lager te zijn dan in de scrollmatrix (0,84 ten opzichte van 0,85). Dit verschil is echter niet statistisch significant.
3.5 Evaluatie door respondenten Aan het einde van de vragenlijst werden enkele evaluatievragen aan alle respondenten voorgelegd. De resultaten hiervan geven inzicht in de mate waarin de respondenten in de scrollmatrix conditie het invullen van de vragenlijst anders ervaren hebben dan de respondenten in de standaard matrix conditie. De resultaten zijn weergegeven in tabel 6. Tabel 6. Gemiddelde score op zes evaluatievragen per vraagtype op een 5 puntsschaal Alle verschillen zijn significant( p<0,05). Type matrix Interessant Duidelijk Plezierig Zet aan tot Moeilijk nadenken Scrollmatrix 4,31 4,33 4,14 3,26 2,29 Standaard matrix 4,14 4,18 3,90 3,19 2,41
Te lang 2,76 2,65
De vragenlijst met de scrollmatrix vonden de respondenten interessanter, duidelijker, plezieriger en minder moeilijk dan de vragenlijst met de standaard matrix. Ook gaven ze aan dat de vragenlijst met de scrollmatrix meer aanzette tot nadenken. Echter de respondenten in de scrollmatrix conditie gaven ook iets vaker aan dat ze de vragenlijst te lang vonden. Dit laatste komt overeen met het feit dat in deze groep de gemiddelde responstijd ook iets hoger was dan in de groep met de standaard matrix. Alle respondenten in de scrollmatrix conditie kregen nog een tweede set met evaluatievragen, waarin ze gevraagd werden deze nieuwe vraagvorm direct te vergelijken met de standaardmatrix die ze uit eerdere onderzoeken kennen. Ter herinnering werd een afbeelding getoond van een standaard matrix, zoals die normaal in vragenlijsten van het Flycatcher panel gebruikt wordt. Daaronder werd nog een keer een afbeelding van een scrollmatrix getoond, zoals ze die zojuist gebruikt hadden. De vraag daarbij was wat ze van de nieuwe vraagvorm vonden in vergelijking met de gebruikelijke standaard matrix. Het resultaat is te zien in figuur 3. De respondenten vinden de scrollmatrix prettiger, makkelijker en leuker. Ook vinden ze het invullen van de scrollmatrix minder vermoeiend en minder irritant en geeft de nieuwe matrixvorm het gevoel dat het invullen sneller gaat. Dit laatste lijkt in tegenspraak met de eerdere bevinding dat de respondenten iets langer over de scrollmatrix doen, maar is te verklaren uit het verschijnsel dat in de subjectieve tijdsbeleving vervelendere taken altijd langzamer en leukere taken altijd sneller lijken te gaan.
Figuur 3. Evaluatie scrollmatrix door de respondenten
4. DISCUSSIE EN CONCLUSIE Uit het experiment blijkt dat de responsbias bij de scrollmatrix significant lager is dan bij de standaard matrix, zowel in de korte, middellange als lange versies van de matrix. Dit geldt voor alle onderzochte vormen van responsbias: aantal extreme antwoorden, aantal neutrale antwoorden, de responsrange en straightlining. Soortgelijke resultaten werden ook gevonden in experimenten waarin standaard matrixvragen vergeleken werden met losse vragen per scherm. In een experiment van Tourangeau et al. (2004) werd bijvoorbeeld gevonden dat de antwoorden in de standaard matrix minder gedifferentieerd waren dan in losse vragen. Ook braken significant minder respondenten de vragenlijst voortijdig af bij gebruik van de scrollmatrix in vergelijking met de standaard matrix, respectievelijk 4,5% ten opzichte van 7,5%. Dit komt overeen met een studie van Chesnut (2008) waarin de respons bij het los weergeven van de vragen hoger was dan bij het presenteren van de vragen in matrixformaat.
Het type matrixvraag bleek geen invloed te hebben op de inter-item-correlatie, zodat aangenomen kan worden dat het gebruik van de scrollmatrix niet ten koste gaat van de betrouwbaarheid van een schaalscore. In eerdere studies werd wel een negatief effect gevonden op de inter-item-correlatie bij het presenteren van één vraag per scherm ten opzichte van een matrixdesign (Tourangeau et al, 2004; Toepoel, et al., 2009), hoewel in de meeste gevallen het verschil niet statistisch significant was of slechts marginaal was. In een experiment van Garland (2009) werd juist wel een positief effect gevonden van een losse presentatie van de vragen op de Cronbach’s alpha; zie ook Callegaro et al. (2009). Een mogelijke verklaring is dat het tegelijk presenteren van de stellingen ook verwarrend kan werken indien bijvoorbeeld sommige stellingen positief en andere negatief gesteld zijn (voorbeeld uit het experiment: Chinezen zijn over het algemeen eerlijk / betrouwbaar / intelligent / aardig / respectloos). In een enkelvoudige presentatie kan de respondent zich beter concentreren op de betreffende stelling waardoor hij of zij minder snel de richting van de stelling over het hoofd ziet. Bij de controlevraag waar respondenten letterlijk gevraagd werden een bepaald antwoord in te vullen, werd het juiste antwoord significant vaker ingevuld bij gebruik van de scrollmatrix, respectievelijk 95,0% en 91,3% vulde het juiste antwoord in. Er werd geen significant effect gevonden van het type matrixvraag op de controlevragen met herhaalde stellingen. Tot slot bleek dat panelleden de vragenlijst met de scrollmatrix interessanter, duidelijker, plezieriger en minder moeilijk vonden dan de vragenlijst met de standaard matrix. Echter de respondenten in de scrollmatrix conditie gaven ook vaker aan dat ze de vragenlijst te lang vonden. Dit is een juiste perceptie aangezien de gemiddelde responstijd in deze groep ook iets hoger was dan in de groep met de standaard matrix. In een studie van Thorndike et al (2009) werd een soortgelijk resultaat gevonden toen respondenten moesten aangeven welke vragenlijst hun voorkeur had: de meerderheid koos voor een vragenlijst met één item per scherm in plaats van een vragenlijst met matrixvragen, ook al kostte het invullen van de losse vragen meer tijd. Hoewel de verschillen wat betreft de datakwaliteit, respons en aantal drop-outs klein zijn, wijzen alle resultaten duidelijk in eenzelfde richting: het gebruik van de scrollmatrix levert betere resultaten dan het gebruik van een standaard matrix. Ook de respondenten evalueren de scrollmatrix positiever. Verder onderzoek zal nodig zijn om de responskwaliteit bij gebruik van de scrollmatrix onder minder ervaren internetgebruikers (dan leden van een online panel) in kaart te brengen. Ook kan het effect van de combinatie van beide matrixvormen binnen één vragenlijst nader onderzocht worden, evenals het effect van het afwisselen van vragenlijsten met alleen scrollmatrixvragen en vragenlijsten met alleen standaard matrixvragen in online panels. Tot slot, de scrollmatrix is maar één manier om de responstaak aantrekkelijker te maken en demotivatie bij de respondenten te voorkomen. Andere vormen zijn bijvoorbeeld ranking, drag-and-drop, en gebruik van visuele stimuli (zie ook Tress, 2012); nader vergelijkend onderzoek naar deze alternatieven is gewenst.
5. IMPLICATIES VOOR MARKETING EN MARKTONDERZOEK Hoewel de verschillen klein zijn, laat het onderzoek zien dat het gebruik van de scrollmatrix op alle fronten kwalitatief betere resultaten oplevert dan het gebruik van een standaard matrix. Voor online panels is de scrollmatrix te verkiezen boven een standaard matrix. Dit niet alleen vanwege de betere responskwaliteit, maar vooral ook omdat de panelleden de scrollmatrix veel prettiger vinden om in te vullen. Van Meurs et al (2009) merken al op dat het juist de saaie en vervelende vragenlijsten zijn die dubieus antwoordgedrag oproepen, zelfs bij goedwillende respondenten. Een positief geëvalueerde vragenlijst houdt de respondent gemotiveerd, ook voor verder onderzoek. Zo vond
Lugtig (2012) dat saaie vragenlijsten leiden tot slaapgedrag (inactieve panelleden) en paneluitval. Dus hoe plezieriger de panelleden het vinden om onderzoeken in te vullen, hoe waarschijnlijker ze actief lid zullen blijven van het panel. Een bijkomend voordeel is dat de wijze van bevragen in de scrollmatrix methodologisch gezien dichter bij een telefonisch of face-to-face interview ligt dan de standaard matrix, omdat in de scrollmatrix de stellingen één voor één voorgelegd worden, net zoals een enquêtrice dit zou doen. Bij mixed-mode-onderzoeken met online en telefonische of face-to-face dataverzameling kan de scrollmatrix hierdoor mode-effecten verkleinen en de vergelijkbaarheid van de resultaten positief beïnvloeden.
NOTEN 1
Met dank aan Jessamina Lie (Universiteit Utrecht), Wadi Elyassem (Emotional Brain), en Vanessa Torres van Grinsven (CBS) voor het ontwikkelen en pretesten van de vragenlijst.
LITERATUUR AAPOR (2011). Standard Definitions Final Dispositions of Case Codes and Outcome Rates for Surveys (revision 2011). Resources for researchers. Te raadplegen op http://www.aapor.org/For_Researchers/4228.htm (Laatst geraadpleegd April 2011). Baumgartner, H. & J.B.E.M. Steenkamp (2001). Response styles in marketing research: A crossnational investigation. Journal of Marketing Research, 38 (2), 143-156. Broekhoff, M (2009). Afhakende respondenten bedreigen de kwaliteit: online enquêtes kunnen veel beter. Clou, 40, 22-23. Callegaro, M & C. Disogra (2008). Computing response metrics for online panels. POQ, 72 (5), 1008-1032. Callegaro, M., J. Shand-Lubbers & J.M. Dennis (2009). Presentation of a single item versus a grid: Effects on the vitality and mental health scales of the SF-36v2 health survey. Knowledge Networks. Presented at the AAPOR 2009, paper te raadplegen op http://www.knowledgenetworks.com/ganp/docs/jsm2009/Presentation_of_single_item_JSM _2009_submitted.pdf (geraadpleegd April 2011). Campanelli, P. (2008). Testing survey questions. In: E. de Leeuw, J. Hox & D. Dillman (Red.), International Handbook of Survey Methodology (p. 176-200). New York: Lawrence Earlbaum Associates, Taylor and Francis Group. Chesnut, J. (2008). Effects of using a grid versus a sequential form of the ACS basic demographic data. Te raadplegen op http://www.census.gov/acs/www/Downloads/library/2008/2008_Chesnut_01.pdf (Laatst geraadpleegd July 2012). Couper, Mick P. (2008). Designing Effective Web Surveys. New York: Cambridge University Press. Czaja, R.F., J.E. Blair (2004). Designing surveys: A guide to decisions and procedures. Thousand Oaks: Pine Series, Sage. ESOMAR (2011). 26 Questions to help research buyers of online samples, Data quality and validation. Te raadplegen op http://www.esomar.org/index.php/26-questions.html (Laatst geraadpleegd April 2011). Fricker, S, M. Galesic, R. Tourangeau & T. Yan (2005). An experimental comparison of web and Telephone surveys. Public Opinion Quarterly, 69 (3), 370-392. Garland, P. (2009). Alternative question designs outperform traditional grid. Te raadplegen op
http://www.surveysampling.com/en/news/ssi-research-finds-alternative-question-designsoutperform-traditional-grids (Geraadpleegd July 2012). Krosnick, Jon A. (1991). Response strategies for coping with the cognitive demands of attitude measures in surveys. Applied Cognitive Psychology, 5, 213-236. Leeuw, E. de (2009). What pretesting is and wat not. Presentatie op de MOAbouts bijeenkomst over pretesten 23 juni 2009. Te raadplegen op http://www.moaweb.nl/kenniscentrum/materiaalbijeenkomsten/archief-materiaal-bijeenkomsten/2009/pretesten-van-vragenlijsten-23-juni (geraadpleegd augustus 2012) Lugtig, P (2012). Luiaards en trouwe deelnemers. Classificatie van respondenten in een panelstudie.In: A.E. Bronner, P. Dekker, E. de Leeuw, L.J. Paas, K. de Ruyter, A. Smidts & J.E. Wieringa (Red.), Ontwikkelingen in het Marktonderzoek: Jaarboek 2009 MarktOnderzoekAssociatie (p123-135). Haarlem: Spaar en Hout. Meurs, A. van, R. van Ossenbruggen, & L.Nekkers 2009). Rotte appels? Controle op kwaliteit van antwoordgedrag in het Intomart GfK online panel. In: A.E. Bronner, P. Dekker, E. de Leeuw, L.J. Paas, K. de Ruyter, A. Smidts & J.E. Wieringa (Red.), Ontwikkelingen in het Marktonderzoek: Jaarboek 2012 MarktOnderzoekAssociatie (p 61-81). Haarlem: Spaar en Hout. Salant, P., & D.A. Dillman (1994). How to conduct your own survey. New York: Wiley. Thorndike, F. P., P. Calbring, F.L. Smyth, J.C. Magee, L. Gonder-Frederick, & L.G. Ost (2009). Web-based measurement: Effect of completing single or multiple items per webpage. Computers in Human Behavior, 25, 393-401. Tress, F. (2012). Bad boy matrix question:Watcha gonna do when they come for you? Paper gepresenteerd op de General Online Research (GOR)-conference 2012. Te raadplegen op http://conftool.gor.de/conftool12/index.php?page=browseSessions&presentations=show&do wnloads=show&search=bad+boy+matrix (Laatst geraadpleegd mei 2012) Toepoel, V., M. Das & A. van Soest (2009). Design of web questionnaires: A test for number of items per screen. Field Methods, 21, 200-213. Tourangeau R., M.P. Couper & F.G. Conrad (2004). Spacing, position, and order interpretive heuristics for visual features of survey questions. Public Opinion Quarterly, 68, 368-393. Tourangeau, Roger, Rips, Lance J., and Rasinki, Kenneth (2000). The psychology of survey response. Cambridge: Cambridge University Press. Willis, G. (2009). Questionnaire development and evaluation methods for self-administered questionnaires. Te raadplegen op http://www.moaweb.nl/kenniscentrum/materiaalbijeenkomsten/archief-materiaal-bijeenkomsten/2009/pretesten-van-vragenlijsten-23-juni (geraadpleegd augustus 2012).
SUMMARY The matrix (grid) format has been criticized as demotivating for respondents and there is some evidence that grids lead to more satisficing and dropout. An attractive alternative to the grid is the scrolling matrix, where each statement or item is presented one-by-one on the screen. Once an answer is entered, the next item will be displayed. In collaboration with Utrecht University, research agency Flycatcher conducted a randomized field experiment to investigate whether the scroll matrix improves data quality compared to a standard grid. Respondents were members of the Flycatcher online panel. The results are positive: the scroll matrix lead to fewer break-offs, less satisficing and better data quality as indicated by well-known response styles, such as non-differentiation and extremeness. Matrix-format did not affect the interitem correlation. Finally, panelists evaluated the scroll matrix as more pleasant to fill in and experienced it as less time consuming.
Keywords: online survey design, surveytainment, scroll matrix, grid, data quality
Curriculum Vitae Anouk Roberts Anouk Roberts is senior onderzoeker bij onderzoeksbureau Flycatcher. Zij studeerde milieugezondheidkunde en epidemiologie aan de Universiteit Maastricht en studeerde af met een onderzoek naar de effecten van geluidshinder op de gezondheid. Binnen haar functie bij Flycatcher richt zij zich vooral op de methodologische aspecten van het onderzoek en de statistische analyses. e-mail:
[email protected]
Curriculum Vitae Thomas Klausch Thomas Klausch werkt als promotie-onderzoeker bij de vakgroep methoden en statistiek van de Universiteit Utrecht. In zijn proefschrift onderzoekt hij de voor- en nadelen van mixed-mode surveys. Aan de hand van de veiligheidsmonitor onderzoekt hij de bruikbaarheid en toepasbaarheid van mixed-mode (web, telefoon, face-to-face) dataverzameling. Zijn onderzoeksinteresses richten zich op het modeleren van meetfouten en nonresponsfouten in surveyonderzoek. e-mail:
[email protected]
Curriculum Vitae Anneke de Jongh Anneke de Jongh studeerde Gezondheidswetenschappen aan de Universiteit Maastricht waar zij ook een aantal jaren als onderzoeker werkte. Haar onderzoek richtte zich op het monitoren en evalueren van gezondheidsinterventies en overheidscampagnes. In Japan deed zij ervaring op met internationaal onderzoek op het vlak van PR en Marketing bij de bedrijven Heineken en Organon. Ze is mede-oprichter van onderzoeksbureau Flycatcher, gespecialiseerd in online onderzoek. Het bureau werkt regelmatig samen met onderzoekers van academische instellingen. e-mail:
[email protected]
Curriculum Vitae Edith de Leeuw Edith de Leeuw is MOA-hoogleraar Kwaliteit van survey onderzoek aan de Universiteit van Utrecht. Haar oratie was getiteld “Passen en meten online: De Kwaliteit van Internet enquêtes.” De tekst is te vinden op de website van de MOA: http://www.moaweb.nl/nieuws-actualiteiten/persberichten/archief-in-depers/Oratie%20Edith%20de%20Leeuw.pdf/view Zij promoveerde op een vergelijking naar de invloed van de dataverzamelingsmethoden op de kwaliteit van de verkregen antwoorden, en ontving een Fulbright subsidie om onderzoek te doen bij Don Dillman. Zij publiceerde in binnen en buitenlandse tijdschriften over kwaliteit bij data verzameling, nonresponse, mixed-mode en online onderzoek. In 2008 verscheen bij Taylor en Francis het International Handbook of Survey Research, dat zij redigeerde in samenwerking met Joop Hox en Don Dillman. e-mail:
[email protected]
Curriculum Vitae Joop Hox Joop Hox is hoogleraar methoden van sociaalwetenschappelijk onderzoek aan de Universiteit Utrecht. Joop Hox studeerde psychologie aan de universiteit van Amsterdam, waar hij promoveerde op een methodologisch proefschrift over operationalisering. Zijn onderzoeksinteresses zijn
datakwaliteit in surveys, SEM, en multiniveau analyse, waarover hij publiceerde in nationale en internationale tijdschriften. Hij is auteur van het boek 'Multilevel Analysis' en mederedacteur van het 'International Handbook of Survey Methodology'. Hij is bestuurslid van de European Association of Methodology, en mederedacteur van het wetenschappelijk tijdschrift Methodology. e-mail:
[email protected]