De ogen als input device in computerinteractie Evaluatie van gebruikerswaardering en gebruikersperformance van een ooggestuurde, muis- en cursorloze computerinterface bij het uitvoeren van een beoordelingstaak op de computer
Masterscriptie
Stijn Bus S278320 Begeleider: Dr. R. Cozijn Tweede lezer: Prof. dr. E. Krahmer Universiteit van Tilburg Faculteit Geesteswetenschappen Departement Communicatie- en Informatiewetenschappen Afstudeerrichting Bedrijfscommunicatie en Digitale Media Augustus 2007
Voorwoord Deze scriptie vormt de afronding van mijn studie Bedrijfscommunicatie en Digitale Media bij het Departement Communicatie- en Informatiewetenschappen van de Faculteit Geesteswetenschappen van de Universiteit van Tilburg. Na ruim zes jaar voor dezelfde werkgever te hebben gewerkt in het bedrijfsleven, besloot ik om mijn baan op te zeggen en mezelf te trakteren op een tweejarig voltijd ‘kennissabbatical’ aan de Universiteit van Tilburg. Het leek me niet alleen nuttig, maar ook erg leuk om nog eenmaal goed de studiebanken in te gaan. Bovendien was deze studie exact in de richting waarin ik me verder wilde ontwikkelen: communicatie en digitale media. Nu, ruim twee jaar en de nodige financiële opdroging verder, komt er helaas een einde aan deze zeer prettige studieperiode. Ik heb van de opleiding en met name van het afstudeeronderzoek veel geleerd en ik voel me goed toegerust voor mijn nieuwe baan met de academische basis die ik in Tilburg heb kunnen opdoen. Ik wil mijn vriendin Jessie, familie en vrienden bedanken voor hun blijvende steun in mijn keuze om een goedbetaalde baan op te zeggen teneinde het pad voor deze ontwikkeling vrij te maken. Tevens gaat mijn dank uit naar Reinier Cozijn voor zijn deskundige en bevlogen begeleiding.
Stijn Bus, 19 augustus 2007
Bron coverafbeelding: deel van een advertentie van Dunkin’ Donuts die werd gebruikt in het onderzoek
2
Inhoudsopgave Voorwoord ................................................................................................. 2 Inhoudsopgave .......................................................................................... 3 Samenvatting ............................................................................................. 5 Hoofdstuk 1 Theoretisch kader 1.1 Inleiding en probleemstelling ..................................................................... 6 1.1.1 De muis in computerinteractie ....................................................... 6 1.1.2 Geen muis zonder feedback .......................................................... 6 1.1.3 Is er een geschikt alternatief voor de muis? .................................... 7 1.1.4 Oogbewegingen: enkele basiskenmerken ........................................ 8 1.1.5 Beknopte historie van oogbewegingsonderzoek ................................ 8 1.1.6 Probleemstelling .......................................................................... 9 1.2 Beloftes van ooginteractie ......................................................................... 10 1.2.1 Snelheid ..................................................................................... 10 1.2.2 Cognitieve en lichamelijke belasting ............................................... 10 1.2.3 Gebruikerservaring ...................................................................... 11 1.3 Obstakels bij ooginteractie-interfaces .......................................................... 12 1.3.1 Non-command interfaces en Midas touch ........................................ 12 1.3.2 Stoeien met de cursor .................................................................. 12 1.3.3 Eye-tracking apparatuur vaak weinig robuust en soms ook onpraktisch 13 1.4 Onderzoek naar een ooginteractie-interface zonder muis en zonder cursor ....... 14 1.4.1 De rol van feedback in een ooginteractie-interface ........................... 15 1.5 Evaluatie van een interactie-ontwerp .......................................................... 15 1.5.1 Hoe meet je de gebruikerswaardering? ........................................... 15 1.5.2 Hoe meet je de gebruikersperformance? ......................................... 16 1.6 Het interfaceontwerp ................................................................................ 17 1.7 Onderzoeksvraag ..................................................................................... 18 1.8 Hypotheses ............................................................................................. 18 1.8.1 Gebruikerswaardering .................................................................. 18 1.8.2 Gebruikersperformance ................................................................ 20 Hoofdstuk 2. Onderzoeksopzet 2.1 Inleiding ................................................................................................. 21 2.1.1 Condities .................................................................................... 22 2.2 Materiaal ................................................................................................ 23 2.2.1 Materiaaltest ............................................................................... 23 2.3 Proefpersonen ......................................................................................... 24 2.4 Design .................................................................................................... 24 2.5 Instrumentatie ......................................................................................... 24 2.5.1 Instrumentatie van gebruikerswaardering ....................................... 24 2.5.2 Instrumentatie van gebruikersperformance ..................................... 26
3
2.6 2.7 2.8 2.9
Apparatuur ............................................................................................. Pretest ................................................................................................... Procedure ............................................................................................... Verwerking van de gegevens ..................................................................... 2.9.1 Gebruikerswaardering .................................................................. 2.9.2 Gebruikersperformance ................................................................
27 27 28 29 29 30
Hoofdstuk 3. Resultaten 3.1 Inleiding ................................................................................................. 3.2 Gebruikerswaardering ............................................................................... 3.3 Gebruikersperformance ............................................................................. 3.4 Samenvatting van de resultaten .................................................................
31 32 35 36
Hoofdstuk 4. Conclusie en discussie 4.1 Inleiding ................................................................................................. 39 4.2 Conclusie ................................................................................................ 39 4.3 Discussie ................................................................................................ 40 4.3.1 Een positieve beoordeling voor ooginteractie ................................... 40 4.3.2 Waarom houdt men vast aan de gevestigde orde? ........................... 40 4.3.3 Praktische limitaties ..................................................................... 41 4.3.4 Snelheidsverschillen bij een realistische computertaak ...................... 41 4.3.5 Feedback in een ooginteractie-interface .......................................... 41 4.3.6 De toekomst van de ogen als input device ....................................... 42 Literatuur ................................................................................................... 44 Bijlagen Bijlage 1 Overzicht van alle afbeeldingen per serie, de toegewezen termen en de kans per term dat deze met een ja of met een nee zou worden beoordeeld 1.1 Serie 1: Advertenties ...................................................................... 47 1.2 Serie 2: Politieke cartoons ............................................................... 48 1.2 Serie 3: Politieke cartoons ............................................................... 49 Bijlage 2 Instructie voorgelezen door de proefleider voorafgaand aan de proef ....... 50 Bijlage 3 Instructie voorafgaand aan de series 3.1 muisnavigatie ................................................................................ 52 3.2 oognavigatie zonder feedback .......................................................... 52 3.3 oognavigatie met feedback .............................................................. 52 Bijlage 4 Oefenpagina voorafgaand aan de series ............................................... 53 Bijlage 5 Instructiepagina vragenlijst ................................................................ 54
4
Samenvatting De computermuis is tegenwoordig nauwelijks meer weg te denken wanneer we plaatsnemen achter de PC. Toch roepen de lichamelijke ongemakken die de muis tot op heden met zich meebrengt op tot het ontwikkelen van alternatieve manieren om de PC te bedienen. Reeds tientallen jaren is er in de wetenschap en industrie dan ook aandacht voor diverse alternatieven met als doel de gebruiker te voorzien van een verbeterde computerinteractie. Het gebruiken van de ogen als ‘input device’ is een van de mogelijke alternatieven. Voor lichamelijk gehandicapten zijn er reeds langer computers op de markt die met de ogen kunnen worden bestuurd en in toenemende mate wordt onderzocht of deze interactietechniek ook voordelen oplevert voor mensen zonder een functiebeperking. In veel ooginteractie-ontwerpen waarover tot op heden is gepubliceerd, wordt echter nog ten dele de muis gebruikt. Dat is in zekere zin jammer, omdat de lichamelijke belasting van de muis dan niet kan worden weggestreept. Bovendien speelt in die ontwerpen de cursor, die vrijwel onmisbaar is bij muisgebruik, vaak een lastige rol. Een tekortkoming van de onderzoeken in dit veld is bovendien dat hierin vaak de nadruk wordt gelegd op het functioneren van het ooginteractie-systeem en niet of nauwelijks op wat de eindgebruiker van het systeem vindt. De algemene probleemstelling in dit onderzoek was dan ook of het mogelijk is om een muis- en cursorloos ooginteractie-ontwerp te realiseren dat bij selectietaken beter presteert op snelheid én beter wordt beoordeeld door de gebruiker dan muisinteractie. Om inzicht te krijgen in deze kwestie werd een laboratoriumexperiment uitgevoerd. De proefpersonen moesten een beoordelingstaak uitvoeren achter de PC waarbij telkens diverse buttons op het scherm moesten worden geselecteerd. Iedere proefpersoon voerde deze taken uit in drie condities: met de muis en met twee varianten van ooginteractie. Bij de ooginteractie-condities kon de gebruiker deze buttons selecteren door ernaar te kijken en tegelijkertijd te drukken op een gamepadknop. De twee ooginteractie-condities verschilden onderling enkel in de mate waarin de buttons werden voorzien van visuele feedback. Na afloop van het experiment vulden de proefpersonen een vragenlijst in waarbij met name werd gevraagd naar hoe bruikbaar zij de verschillende interactietechnieken vonden. Ook konden de proefpersonen aangeven welke van de drie condities hun algemene voorkeur genoot. Tevens werd gemeten hoe snel met de verschillende interactietechnieken werd gewerkt. Alle proefpersonen waren in staat om na een zeer korte oefenperiode naar behoren te werken met de muis- en cursorloze ooginteractie-methodes. In tegenstelling tot de verwachtingen bleek uit de resultaten echter dat de algemene onderzoeksvraag niet positief kon worden beantwoord. De usability van de ooginteractie werd weliswaar positief gewaardeerd, maar de muis scoorde vooralsnog beter. Bovendien werd met de muis overwegend sneller gewerkt. Toch heeft het onderzoek positieve bevindingen opgeleverd over de ooginteractie-technieken. De helft van de proefpersonen gaf namelijk aan in de toekomst liever met ooginteractie te werken dan met de muis. Bovendien vonden ze werken met ooginteractie een leukere ervaring dan werken met de muis. Deze bevindingen bieden dan ook een veelbelovend perspectief voor de toekomst van de ogen als input device in computerinteractie.
5
Hoofdstuk 1 Theoretisch kader 1.1 Inleiding en probleemstelling 1.1.1 De muis in computerinteractie In 1964 verichtten Douglas Engelbart en Bill English pionierswerk op het gebied van mens-computerinteractie met de uitvinding van de computermuis. Het duurde echter tot 1981 voordat deze interactiemethode voor een groter publiek binnen handbereik kwam met de Xerox Star. Deze computer was niet alleen een voorloper omdat deze de muis als input device had, tevens had deze computer een grafische weergave waarbij de gebruiker op het scherm een indeling zag in vensters, icoontjes en mappen. Een indeling waarvan we de basisprincipes nog steeds terugzien in actuele Windows-, Macintosh- en Unix-interfaces. Anno 2007 is de computermuis, in combinatie met een toetsenbord en een grafische gebruikersinterface (Graphical User Interface, GUI), nauwelijks meer weg te denken wanneer we plaatsnemen achter de PC. In het algemeen is sinds de jaren tachtig het aantal computers en aanverwante digitale apparaten in de dagelijkse omgeving drastisch toegenomen. Ze komen in uiteenlopende gedaantes voor zoals: desktop PC’s, laptops, organizers, publieke consolen, mobiele telefoons, navigatiesystemen en MP3-spelers. Vaak hebben ze een overlappende of geïntegreerde functionaliteit, men kan bijvoorbeeld telefoneren met de PC maar ook webpagina’s bezoeken met een mobiele telefoon. Ook de bediening van deze apparaten kent overeenkomsten en verschillen, maar in de meeste interactiesystemen staat een manuele input centraal. Voorbeelden hiervan zijn: touchscreens of touchpads, pennen (‘styli’), joysticks en gamepads. In het zakelijke gebruik van desktop PC’s neemt echter Engelbart’s muis in combinatie met het toetsenbord vooralsnog een dominante positie in. In de volgende paragraaf wordt ingegaan op enkele basiskenmerken van muisinteractie. 1.1.2 Geen muis zonder feedback Een belangrijke overeenkomst van manuele input varianten zoals de muis is het feit dat we zonder visuele terugkoppeling of ‘feedback’ nauwelijks succesvol kunnen interacteren met het systeem. Feedback vervult dan ook een belangrijke rol in menscomputerinteractie. Volgens diverse usability-heuristieken geldt in het algemeen dat de gebruiker moet worden voorzien van feedback, zodat deze voldoende wordt geïnformeerd over het effect van de gegeven input (Norman, 1988; Nielsen & Molich, 1990; Shneiderman, 1992). Bij muisinteractie wordt deze feedback gerealiseerd door de vrijwel continue aanwezigheid van de cursor op het beeldscherm. Bij het selecteren van objecten op een beeldscherm heeft de cursor primair de functie van een aanwijsstok of pointing device. Dankzij de cursor weet de gebruiker welk object wordt geactiveerd als er op de muis wordt geklikt, namelijk het object waarin de punt van het pijltje zich bevindt. Maar de cursor is ook nodig om soepel van het ene naar het andere object op het scherm te kunnen bewegen. Kahn et al. (2003) toonden aan dat muisgebruikers met een cursor in beeld een positioneringstaak beter kunnen uitvoeren dan zonder de cursor. Met de cursor in beeld waren er in de laatste fase van de positionering minder corrigerende bewegingen nodig dan wanneer men de cursor niet in beeld had. Met andere woorden, gebruikers weten door de aanwezigheid van de cursor beter waar ze zijn en waar ze heen gaan.
6
Naast de cursor worden ook objecten op het scherm, zoals buttons en icoontjes, vaak van visuele feedback voorzien. Wanneer de gebruiker met de cursor een object aanwijst, verandert deze vaak van kleur of perspectief (‘mouse over’) om duidelijk te maken dat het object kan worden geselecteerd met een muisklik. Volgens Akamatsu, MacKenzie en Hasbrouc (1995) levert deze visuele feedback een snelheidswinst op bij selectietaken, met name in de laatste fase van de positionering. Met laatste fase bedoelen zij de tijd vanaf het bereiken van de rand van het object met de cursor tot het moment van de klik. Dit komt omdat gebruikers zich zonder deze feedback er vaak niet van bewust zijn dat ze bij de rand van het object net zo goed kunnen selecteren als middenin het object. Ze zijn dan ook geneigd om ergens in het midden van een button of een icoontje te klikken. Bij objecten met visuele feedback zijn gebruikers zich eerder bewust van het feit dat ze hun doelobject hebben bereikt en zijn ze dus eerder in staat te klikken. 1.1.3 Is er een geschikt alternatief voor de muis? In de wetenschap en in de industrie is er in toenemende mate aandacht voor nietmanuele input devices zoals spraak en oogbewegingen. Eén van de aanleidingen om dergelijke alternatieven te ontwikkelen is het feit dat muisgebruik leidt tot een fysieke belasting die lichamelijke aandoeningen kan veroorzaken (zie bijvoorbeeld Keir, Bach & Rempel, 1999). De terminologie over deze lichamelijke aandoeningen laat tot op heden te wensen over zo blijkt uit een rapport van de Gezondheidsraad uit 2000 1 . Diverse landen hanteren verschillende termen. Repetitive Strain Injury (RSI) is een veelgebruikte verzamelnaam in Nederland, De VS hanteren bijvoorbeeld Cumulative Trauma Disorders (CTD) en in Engeland is Work Related Upper Limb Disorders (WRULD) de gebruikelijke term voor dit soort klachten. In wetenschappelijke artikelen wordt met regelmaat gesproken over Work Related Upper Extremity Musculoskeletal Disorders (WRUEMD). Dit is slechts een kleine greep uit de voorraad. In een recent rapport aan het ministerie van SZW en het ministerie van VWS2, wordt vanwege de lichamelijke belasting van de muis aangegeven dat onderzoek naar alternatieve invoer- en aanwijsmiddelen voor beeldschermwerkers hoog op de prioriteitenlijst van preventiemaatregelen staat. Over de exacte oorzakelijke verbanden tussen muisgebruik en lichamelijke aandoeningen worden overigens tegenstrijdige bevindingen gepubliceerd. Voor een uitgebreid overzicht van deze oorzakelijke verbanden is het reviewartikel van Veiersted, Nordberg en Waersted (2006) een aanrader. Een andere aanleiding om alternatieve input devices te testen komt voort uit de behoefte om ook voor lichamelijk gehandicapten geschikte computer-interactiemethoden te ontwikkelen. Zo zijn er voor gehandicapten die niet in staat zijn om hun handen te gebruiken maar die wel controle hebben over hun oogbewegingen sinds begin jaren tachtig verscheidene interfaces ontwikkeld die hen in staat stellen om de computer met de ogen te bedienen. Vrijwel parallel aan de ontwikkeling van deze interfaces ontstond er in toenemende mate aandacht voor oog-computer interactiemethoden voor mensen zonder een functiebeperking (zie voor een overzicht Jacob & Karn, 2003).
1 2
Gezondheidsraad: RSI. Den Haag: Gezondheidsraad, 2000; publicatie nr 2000/22.
RSI-maatregelen: preventie, behandeling en reïntegratie; Onderzoek verricht in opdracht van de ministeries van Sociale Zaken en Werkgelegenheid en Volksgezondheid, Welzijn en Sport door TNO Arbeid, i.s.m. het Kenniscentrum AKB, de Faculteit der Bewegingswetenschappen (VU) en het EMGO-instituut (VUmc), 2006.
7
Het besturen van de computer met de ogen biedt namelijk diverse potentiële voordelen ten opzichte van de muis die het de moeite waard maken om deze interactiemethode verder te ontwikkelen voor een bredere groep gebruikers. Anderzijds zijn er enkele obstakels die het pad naar een efficiënte en robuuste oogcomputerinteractie in de weg zitten. In paragraaf 1.2 en 1.3 wordt verder ingegaan op deze voor- en nadelen. Allereerst wordt echter aandacht besteed aan enkele basiskenmerken van oogbewegingen (paragraaf 1.1.4). Daarna wordt een beknopt historisch overzicht gegeven van de toepassingen van oogbewegingen in computerinteractie tot nu toe (paragraaf 1.1.5). Het eerste deel van dit theoretisch kader wordt afgesloten met de introductie van de centrale probleemstelling van dit onderzoek (paragraaf 1.1.6). 1.1.4 Oogbewegingen: enkele basiskenmerken Om een object te kunnen waarnemen blijven de ogen gedurende korte tijd relatief stilstaan, meestal tussen de 200 en 300 milliseconden (ms). Dit stilstaan wordt een fixatie genoemd. Tussen de fixaties maken de ogen voortdurend bewegingen die saccades worden genoemd, tijdens deze bewegingen nemen de ogen niets waar. De ogen staan tijdens een fixatie niet geheel stil, binnen de fixatie bevinden zich namelijk ook kleine bewegingen die microsaccades of jitter worden genoemd. Het oog maakt deze saccades en microsaccades ondermeer om snel te verplaatsen naar de exacte locatie van wat moet worden waargenomen, teneinde dat deel scherp in beeld te krijgen. Met de ogen wordt immers niet alles wat op het netvlies komt even scherp waargenomen. Ons blikveld kan worden verdeeld in drie gebieden: foveale, parafoveale en perifere visie. De foveale visie is het centrum van waar we naar kijken, dat deel nemen we het scherpste waar en heeft een bereik van ongeveer 2°. De parafoveale visie bevindt zich in het gebied daaromheen van 2-5° en is minder scherp. De rest van wat we zien is de onscherpe, perifere visie (Rayner, 1998). 1.1.5 Beknopte historie van oogbewegingsonderzoek Onderzoek naar oogbewegingen is niet iets van de laatste jaren. Reeds eind 19e eeuw was er aandacht voor het registreren van oogbewegingen in een wetenschappelijke setting. Aanvankelijk hield dit registreren in dat oogbewegingen werden bekeken en er handmatig aantekeningen werden gemaakt. Vrij snel daarna kwamen er betere methoden binnen handbereik zoals het nemen van fotoseries van oogbewegingen en het waarnemen van lichtreflecties van het hoornvlies (voor een historisch overzicht, zie Jakob & Karn, 2002). Deze laatste methode wordt vaak gebruikt in hedendaagse eye-trackers waarbij infrarood licht op het oog wordt geprojecteerd en door het hoornvlies (cornea) wordt gereflecteerd dan wel door de pupil wordt opgenomen. Deze reflectiepatronen leiden tot een nauwkeurige weergave van de oogbewegingen. Naast eye-trackers die gebaseerd zijn op reflectiepatronen zijn er ook trackers die volledig ‘vision-based’ zijn. Dit houdt in dat de oogbewegingen worden gefilmd en per frameshot worden geanalyseerd. In de afgelopen decennia is er bij de doorontwikkeling van eye-trackers veel vooruitgang geboekt op het gebied van registratienauwkeurigheid en gebruiksgemak. Desalniettemin doen zich nog diverse problemen voor bij het inzetten van hedendaagse eye-trackers in interactie-ontwerpen, daarover meer in paragraaf 1.3.3.
8
Naast het uitvinden en ontwikkelen van de registratietechnieken zelf, werden deze technieken vanzelfsprekend toegepast in bepaalde onderzoeksvelden. De initiële focus van oogbewegingsonderzoek lag veelal op het functioneren van de ogen vanuit een fysiologisch perspectief. Vrij kort daarop werden oogbewegingen ook geanalyseerd teneinde meer te weten te komen over psychologische, cognitieve processen, zoals lezen. (zie Rayner, 1998, voor een overzicht). Dat is in zekere zin logisch, de ogen ‘verraden’ immers een deel van de aandacht die men voor iets heeft en de gedragsintenties die daarmee samenhangen. Dit uitgangspunt wordt ook in toenemende mate toegepast in computertaken. Een recent voorbeeld hiervan is een onderzoek van Russel (2005) waarin oogbewegingen van gebruikers werden geregistreerd terwijl ze een website bezochten. De fixaties lieten bepaalde ‘areas of interest’ zien. Dit soort data kan niet alleen waardevolle informatie opleveren over persoonlijke interesses van gebruikers, maar ook over de usability van websites of interfaces. Meer over die toepassing wordt beschreven in Jakob en Karn (2003). Tot slot is het besturen van de computer met de ogen een toepassingsveld waar veel onderzoek naar wordt gedaan. Het hier gepresenteerde onderzoek valt onder deze laatst genoemde groep. 1.1.6 Probleemstelling Zoals aangestipt in paragraaf 1.1.3 biedt het besturen van de computer met de ogen diverse potentiële voordelen ten opzichte van de muis. In de komende paragrafen zal worden uiteengezet dat deze voordelen pas optimaal kunnen worden benut wanneer in het ooginteractie-ontwerp helemaal geen muis en geen cursor hoeft te worden gebruikt. De centrale probleemstelling van dit onderzoek is dan ook: is het mogelijk om een muisen cursorloos ooginteractie-ontwerp te realiseren dat bij selectietaken beter presteert op snelheid én beter wordt beoordeeld door de gebruiker dan muisinteractie? In de komende paragrafen zal allereerst worden besproken wat precies de voordelen zijn, vervolgens wat de nadelen zijn van de ooggestuurde methodes die tot dusverre zijn ontwikkeld, met als doel te onderbouwen op basis van welke principes het in dit experiment geteste prototype is ontworpen. Daarna zal worden ingegaan op hoe dit prototype kan worden geëvalueerd. Dit hoofdstuk wordt afgesloten met de formulering van de algemene onderzoeksvraag en de bijbehorende hypotheses.
9
1.2 Beloftes van ooginteractie 1.2.1 Snelheid Eén van de beloftes van de ogen is dat deze sneller zijn dan de handen en dus een snellere interactie met de computer kunnen opleveren. Zhai, Morimoto en Ihde (1999) onderbouwen dit uitgangspunt als volgt: “The eye can move very quickly in comparison to other parts of the body. Furthermore, as many researchers have long argued [3] [6], target acquisition usually requires the user to look at the target first, before actuating cursor control. Theoretically this means that if the eye gaze can be tracked and effectively used, no other input method can act as quickly.” (p. 1). Sibert en Jacob (2000) onderzochten het snelheidsverschil in een ooginteractieinterface door middel van Fitts’ pointing tasks (Fitts, 1954). Hieruit bleek dat selectie van objecten op het beeldscherm sneller kon worden gedaan met de ogen dan met de muis. Dit onderzoek bestond echter uit twee experimenten waartussen een belangrijk resultaatverschil werd geconstateerd. Het eerste experiment was een meting van wat zij ‘raw speed’ noemden. Proefpersonen zagen op het scherm een aantal cirkels en zij moesten telkens de cirkel selecteren die oplichtte, door ernaar te kijken. Bij deze eenvoudige taak bleek dat het 60% minder tijd kostte om een object met de ogen te selecteren dan met de muis. In het tweede experiment kregen de proefpersonen een taak waarbij ze brieven op het scherm moesten selecteren. Deze computertaak was realistischer dan die in het eerste experiment omdat de gebruiker het gewenste object op het scherm moest zoeken en vervolgens moest selecteren. In dit experiment bleek de tijdswinst van de ogen ten opzichte van de muis er nog steeds te zijn, maar het verschil was minder evident. Ook Ohno (1998) toonde in zijn interactieontwerp aan dat selectie van objecten op het scherm met de ogen sneller kan zijn dan met de muis. Deze bevinding gold in zijn onderzoek weliswaar niet voor de gemiddelde selectietijden maar wel voor de snelste proefpersonen. De snelste proefpersoon selecteerde met de muis een object in 1.72 seconde en in dezelfde taak met de ogen in 0.92 seconde. Ten slotte rapporteerden ook Monden, Matsumoto en Yamato (2005) snelheidsvoordelen ten gunste van ooginteractie. In hun ontwerp werd een combinatie van de ogen en de muis getest, waarbij de cursor bij een klik op de muis telkens automatisch werd verplaatst naar de plek op het beeldscherm waar de gebruiker keek. Het laatste deel van de buttonselectie moest vervolgens wel met de muis worden gedaan. De onderzoekers rapporteerden een snelheidswinst van 31% bij de oogondersteunde conditie versus selectie die uitsluitend met de muis moest worden gedaan. 1.2.2 Cognitieve en lichamelijke belasting Volgens Jacob (1993) levert ooginteractie een lagere cognitieve belasting op dan werken met de muis, mits enkel de natuurlijke bewegingen van het oog worden gebruikt in de interface. Moet men onnatuurlijke bewegingen met het oog maken, bijvoorbeeld bewust knipperen met de ogen om een button op het scherm te activeren, dan is er juist sprake van een hogere cognitieve belasting. In diverse ontwerpen die tot op heden zijn getest komt de muis helemaal niet meer voor in het interactieontwerp (Ohno, 1998; Lankford 2000; Sibert & Jakob 2000). Het is dan ook logisch dat de lichamelijke belasting van muisgebruik, zoals genoemd in paragraaf 1.1.3, in deze ontwerpen niet aan de orde is. Zolang in de interface enkel natuurlijke oogbewegingen worden geïntegreerd is er voor zover bekend geen sprake van lichamelijke belasting zoals bij de muis. We kijken immers de hele dag met onze ogen zonder daarbij fysieke problemen te ondervinden. Sommige
10
eye-tracker apparatuur zorgt helaas wel voor een lichamelijke belasting (zie paragraaf 1.3.3). 1.2.3 Gebruikerservaring Jacob (1992) zette uiteen dat natuurlijke oogbewegingen een rijker inputmedium vormen voor computerinteractie dan de muis en daardoor kunnen leiden tot een betere gebruikerservaring. Volgens hem zijn de ogen niet alleen bruikbaar als “high speed cursor positioning tool”, maar bieden ze daarnaast mogelijkheden om de mens-computer dialoog natuurlijker en intuïtiever te maken. Hiermee doelt hij ondermeer op noncommand interfaces, waarbij de gebruiker niet altijd expliciete commando’s geeft (zoals door een muisklik), maar waarbij de computer de oogbewegingen van de gebruiker observeert, interpreteert en vervolgens de gewenste reactie geeft. Om te bepalen wat de gewenste reactie is op basis van de fixaties van de gebruiker op het beeldscherm kan bijvoorbeeld een probabilistisch algoritme worden geïntegreerd in de interface (Sibert & Jacob, 2000; Salvucci & Anderson, 2000). Een voorbeeld van zo’n toepassing is de volgende: de computer berekent op basis van de locatie van de fixatie op het scherm en het type taak dat op dat moment wordt uitgevoerd, welke intentie, bijvoorbeeld een bepaald menu openen, de grootste waarschijnlijkheid heeft. Het commando met de grootste waarschijnlijkheid, dit kan ook zijn ‘geen commando’, wordt vervolgens door de computer uitgevoerd (Salvucci & Anderson, 2000). Of de gebruikerswaardering van dergelijke interfaces daadwerkelijk beter is dan bij muisinteractie is echter nog niet empirisch vastgesteld. In dit verslag ligt de nadruk op de ogen als ‘positioning tool’. Een belangrijke vraag hierbij is hoe het selecteren van objecten op het scherm door middel van de ogen wordt gewaardeerd door de gebruikers. Ook hier ontbreekt tot op heden een empirische onderbouwing. In de meeste onderzoeken die over ooginteractiemethoden zijn gepubliceerd is er veel aandacht voor het functioneren van de interface in termen van gebruikersperformance, maar relatief weinig aandacht voor de gebruikerswaardering. Zo rapporteerden Zhai, Morimoto en Ihde (1999) een positieve gebruikerswaardering voor het ooginteractieontwerp, maar deze bevinding was gebaseerd op slechts één schaal (‘favorability’). Bovendien was het niet geheel duidelijk in hoeverre deze waardering was vergeleken met muisinteractie. Creyghton (2005) besteedde meer aandacht aan de gebruikersevaluatie. Zij testte twee varianten van ooginteractie waarbij een deel van de muispositionering werd vervangen door oogbewegingen. In de eerste variant, de focusconditie, werd de cursor bij een muisklik verplaatst naar de plaats op het beeldscherm waar de gebruiker op dat moment keek (de focus). In de tweede variant, de link-conditie, werd de cursor bij een muisklik verplaatst naar de link die op het moment van klikken het dichtst bij de focus lag. Deze twee condities werden afgezet tegen werken met de muis. Zij vroeg proefpersonen naar de waardering voor de methodes met oogondersteuning en de muis. Daaruit bleek dat met meer genoegen werd gewerkt met oogondersteuning dan met de muis alleen. De muis werd daarentegen beter beoordeeld op gebruiksgemak en als eenvoudiger en minder storend ervaren. De opmerkingen die door proefpersonen werden gemaakt na afloop van het experiment waren echter positiever voor oogondersteuning dan uit de resultaten bleek. In de discussiesectie werd dan ook toegelicht dat wellicht door het tussenproefpersoon-ontwerp deze positieve indicaties minder naar voren zijn gekomen. Dit ontwerp was noodzakelijk omdat slechts beperkte tijd achtereen met de eye-tracker apparatuur kon worden gewerkt. Zodoende heeft iedere proefpersoon slechts met één conditie gewerkt, waardoor de proefpersonen niet in staat waren om zelf een vergelijking te maken tussen de drie condities in het
11
experiment. Deze vergelijking is enkel tussen proefpersonen gemaakt. Voor toepassingen in de gaming industrie zijn wel enkele binnenproefpersoon bevindingen bekend. Zo toonden Smith en Graham (2006) aan dat bij meerdere van de geteste prototypes de ooginteractie-interface als natuurlijker en leuker werden ervaren dan muisinteractie. De vraag is in hoeverre deze resultaten mogen worden geïnterpreteerd als een indicator voor zakelijke toepassingen van computergebruik. Gesteld kan worden dat er tot op heden weinig empirische onderbouwing is gepubliceerd over de vraag hoe computergebruikers selectie met behulp van ooginteractiesystemen waarderen. Uitzonderingen daargelaten, gaat de meeste aandacht vooralsnog uit naar kwantitatieve metingen van de snelheid van de systemen en of ze überhaupt functioneren. In de spaarzame gevallen waarin er wel sprake was van een gebruikersevaluatie zijn er positieve indicaties gemeld ten gunste van ooginteractiesystemen.
1.3 Obstakels bij ooginteractie-interfaces 1.3.1 Non-command interfaces en Midas touch Interfaces waarbij de ogen worden gebruikt als input device zijn onder te verdelen in non-command en command interfaces (Jacob, 1992). Bij een command-interface worden vaak de oogbewegingen gebruikt om de positie op het beeldscherm te bepalen zodat men dit niet met de muis hoeft te doen. Om vervolgens een button of icoontje op het scherm te activeren moet de gebruiker een bewust commando geven. Dit commando kan bijvoorbeeld worden gegeven door een muisklik of het indrukken van een toets op het toetsenbord. Een non-command interface werkt anders, bijvoorbeeld als volgt: als de gebruiker een object op het scherm wil selecteren hoeft dit niet met een druk op een muisknop of op het toetsenbord, maar worden objecten waar de gebruiker relatief lang naar kijkt automatisch geactiveerd (Jacob, 1993). Deze methode noemt men ook wel dwell-time. Hierbij wordt telkens geregistreerd hoe lang de gebruiker naar een object kijkt, bijvoorbeeld naar een button op het scherm. Zo’n button wordt automatisch geactiveerd als er langer dan een bepaalde tijd aaneengesloten naar is gekeken. Hoe lang er precies gekeken moet worden naar het object is afhankelijk van de instelling, vaak wordt hiertoe een instelling tussen de 150 en de 250 ms gehanteerd. De vraag is in hoeverre deze methode werkelijk non-command is: relatief lang naar een object kijken kan immers ook worden opgevat als een bewust commando. Bovendien steekt bij deze methode het Midas-touch-probleem de kop op: selecteren met de ogen functioneert enerzijds snel en receptief, anderzijds activeert het misschien meer objecten dan bedoeld. Dé uitdaging voor de ontwikkeling van non-command interfaces lijkt dan ook om goed te interpreteren in welke gevallen de gebruiker iets wil selecteren op het scherm en in welke gevallen de gebruiker kijkt naar een object, maar geen respons van het systeem verlangt. 1.3.2 Stoeien met de cursor Soms levert de cursor problemen op bij ooginteractiesystemen. Zhai et al. (1999) beschreven een prototype waarin dit probleem een rol speelt. Zij testten twee condities. De eerste conditie noemden zij de ‘liberale aanpak’: de cursor werd verplaatst naar iedere plaats waarnaar gekeken werd indien de afstand tussen de huidige cursorpositie en de vorige cursorpositie meer dan 120 pixels bedroeg. De gebruiker kon de cursor vervolgens overnemen met de muis en het bekeken item selecteren ofwel de cursorverplaatsing negeren. In de tweede conditie, de ‘conservatieve aanpak’, werd de
12
cursor verplaatst in de richting van de focus van de ogen als de muis handmatig werd bewogen. Een probleem bij de liberale aanpak was een overactieve cursor. Zhai gaf aan dat de cursor in deze methode als overactief kon worden ervaren door de gebruiker want overal waar de gebruiker keek, verscheen ook de cursor. Bij de conservatieve aanpak had men minder last van de cursor, maar moest men wel een groter deel van de taak met de muis doen. Ook Yamato, Monden, Matsumoto, Inoue en Torii (2000) testten een ooginteractiesysteem waarin de cursor werd aangestuurd met de ogen. Zij maakten een prototype dat bestond twee varianten. De eerste variant, ‘automatische aanpassing’, werkte als volgt: wanneer de gebruiker klikte op de muisknop ging de cursor automatisch naar de button die het dichtst bij de fixatie lag. In de tweede variant, ‘manuele aanpassing’, kon de gebruiker met de ogen de cursor ruwweg naar de juiste plaats brengen en vervolgens handmatig met de muis de laatste fase te voltooien. Uit hun resultaten bleek dat de manuele aanpassing van deze twee methodes de beste performance opleverde. Dat is in principe geen gunstige bevinding, want volgens Phillips en Triggs (2001) wordt juist aan het laatste deel van de muisbeweging bij objectselectie 70% van de tijd besteed. In dat deel van de beweging valt dus de grootste snelheidswinst te halen. Desondanks werd met de manuele methode van Yamato et al. efficiënter geselecteerd dan met de muis. 1.3.3 Eye-tracking apparatuur vaak weinig robuust en soms ook onpraktisch Eye-tracking apparatuur bevindt zich nog voornamelijk in onderzoekslaboratoria. Ondanks het feit dat de ontwikkeling van de techniek niet stilstaat en eye-trackers in de loop der jaren nauwkeuriger zijn geworden, blijkt het vaak moeilijk te zijn om er een robuuste interface mee te bouwen. Ohno (1998) geeft aan dat een deel van de selectiefouten tijdens de proefafname werd veroorzaakt door instabiliteit van de apparatuur. De gebruiker keek wel naar een object, maar de tracker registreerde dat niet. Volgens Ohno lag dit aan het feit dat gedurende een sessie de kwaliteit van de calibratie afnam en daarmee de nauwkeurigheid van de registraties minder werd. Om dit op te lossen gebruikte hij “Active calibration”. Hierbij worden tijdens het uitvoeren van de selectietaak voortdurend berekeningen uitgevoerd om te bepalen of er sprake is van een foutieve selectie. Is dit het geval dan wordt de afwijking gecorrigeerd in de eerstvolgende selectie. De meeste eye-trackers brengen tevens enkele praktische bezwaren met zich mee. De gebruikers moeten soms een helm met camera’s opzetten. Ze moeten tijdens een taak vaak stil blijven zitten achter de PC omdat de apparatuur niet altijd goed de hoofdbewegingen van de oogbewegingen kan onderscheiden. Bovendien moet er altijd worden gecalibreerd voordat men überhaupt aan de slag kan met een taak. Als men de computer verlaat en even later opnieuw achter de computer plaatsneemt, moet de calibratie opnieuw worden gedaan. Bij systemen die gebruik maken van infrarood licht, kunnen gebruikers niet langer dan een half uur achtereen werken omdat de ogen er droog van worden. Het leidt niet tot schade aan de ogen, maar het inlassen van pauzes is noodzakelijk. Dit soort beperkingen maakt het lastig voor onderzoekers om de proefpersonen op een volledig ontspannen en natuurlijke manier achter de PC te laten werken. Desalniettemin hebben koplopers in de markt veel van deze problemen reeds weten op te lossen. Zo heeft de eye-tracker van de Zweedse fabrikant Tobii 3 de
3
www.tobii.se
13
registratiecamera’s in de randen van het beeldscherm verwerkt. De gebruiker hoeft dus geen bril of helm op te zetten en ook de belasting door infrarood licht is tot een minimum beperkt. De calibratieprocedure is eenvoudiger en korter dan bij veel andere trackers en de proefpersoon kan relatief vrij bewegen achter het scherm. De tracker onthoudt bovendien de calibratiegegevens zodat als een gebruiker de computer verlaat en er na enige tijd weer achter plaatsneemt, er niet opnieuw hoeft te worden gecalibreerd. In dit onderzoek is echter andere apparatuur gebruikt. Daarvan volgt een beschrijving in paragraaf 2.6.
1.4 Onderzoek naar een ooginteractie-interface zonder muis en zonder cursor Samenvattend kan nu het volgende worden gesteld. De muis is geen ideaal besturingsapparaat want muisgebruik brengt een verhoogde lichamelijke belasting met zich mee die kan leiden tot lichamelijke aandoeningen (paragraaf 1.1.3). Oognavigatie is in principe sneller dan muisnavigatie, het is echter niet bekend hoe deze snelheidsverschillen zich uiten bij een realistische computertaak. Dit komt omdat de snelheidsbevindingen tot dusverre grotendeels voortkomen uit experimenten die primair gericht waren op de selectietaak (paragraaf 1.2.1). Het selecteren van objecten op het beeldscherm met de ogen kan leiden tot een lagere cognitieve belasting dan selecteren met de muis zolang er gebruik wordt gemaakt van natuurlijke oogbewegingen (paragraaf 1.2.2). Er zijn beperkte aanwijzingen dat interactie-ontwerpen waarin oogbewegingen als input worden gebruikt positiever worden gewaardeerd door gebruikers dan muisgebruik (paragraaf 1.2.3). Om proefpersonen in staat te stellen een goede vergelijking te maken tussen verschillende interactiemethoden biedt een tussenproefpersoon ontwerp niet de beste oplossing (paragraaf 1.2.3). Bij non-command interfaces vormt de Midas-touch vooralsnog een niet op te lossen probleem. Non-command methodes als dwell-time zorgen bovendien voor een vertraging die nadelig is voor de te behalen snelheidswinst ten opzichte van de muis (paragraaf 1.3.1). In combinatie-ontwerpen waarin deels met oogbewegingen en deels met de muis wordt gewerkt, wordt ook een deel van de potentiële snelheidswinst ingeleverd. Daarnaast zit in die ontwerpen de cursor vaak in de weg wat leidt tot een slechte usability (paragraaf 1.3.2). Gezien deze bevindingen rijst de vraag of er een command-interface te realiseren is waarbij natuurlijke oogbewegingen als input worden gebruikt, de snelheidswinst optimaal is en waarin de muis en de cursor niet voorkomen. Dat ontwerp zou vervolgens bij voorkeur moeten worden getest in een ecologisch valide computertaak in een binnenproefpersoon ontwerp. Met ecologisch valide wordt hier bedoeld dat de computertaak realistisch moet zijn, in de beleving van de proefpersonen moet de uit te voeren taak dus primair zijn en de selectiemethode secundair. Dit is bij computertaken in de praktijk namelijk ook zo: een e-mail versturen is de primaire taak, het selecteren van bijvoorbeeld de verzendknop met de muis is secundair. Met het weglaten van de cursor verdwijnt vanzelfsprekend een deel van de feedback die door het systeem wordt gegeven. Wordt in een cursorloze ooginteractieinterface de gebruiker dan wel van voldoende feedback voorzien om er effectief mee te kunnen werken? In de volgende paragraaf wordt op deze vraag ingegaan.
14
1.4.1 De rol van feedback in een ooginteractie-interface De cursor levert in muis-computerinteractie een belangrijke vorm van feedback (paragraaf 1.1.2). Kan de cursor bij ooginteractie dan zomaar worden weglaten? Het antwoord is: waarschijnlijk wel. Wanneer men de ogen gebruikt als pointing device, weet men in feite altijd waar men is, want waar men kijkt, daar bevindt men zich. Daar is de cursor in principe niet voor nodig. Een vergelijkbaar antwoord kan worden gegeven op de vraag of zonder de cursor voldoende feedback van het systeem wordt ontvangen over waar men heen gaat op het scherm (paragraaf 1.1.2). Bij oogbewegingen is deze functie van de cursor niet nodig. In het dagelijks leven kan men namelijk ook prima zonder aanwijsstok de ogen verplaatsen van het ene naar het andere object. Visuele feedback van beeldschermobjecten is een ander verhaal. Bij muisinteractie bleek de toevoeging van dit soort feedback bij te dragen aan een effectievere objectselectie (paragraaf 1.1.2). Dit fenomeen zou zich bij selectie met de ogen wel eens op een vergelijkbare wijze kunnen voordoen. Dat wil zeggen dat de gebruiker zich dankzij deze feedback er eerder van bewust is dat het object geselecteerd kan worden en daardoor sneller selecteert. Eerder werd aangegeven dat de gebruikerswaardering van ooginteractiemethoden in veel onderzoeken onderbelicht is (paragraaf 1.2.3). In de komende paragrafen wordt uiteengezet welke richtlijnen voor gebruikersevaluatie uit de onderzoeksliteratuur van toepassing kunnen zijn op het meten van de gebruikerswaardering van interactietechnieken.
1.5 Evaluatie van een interactie-ontwerp 1.5.1 Hoe meet je de gebruikerswaardering? De mate waarin een nieuw systeem zal worden geaccepteerd door gebruikers is grotendeels afhankelijk van hoe goed de usability, de bruikbaarheid, van dat systeem is (Nielsen, 1993). Volgens Nielsen is usability een construct dat bestaat uit de volgende vijf hoofdcomponenten: • learnability: het systeem moet makkelijk aan te leren zijn, zodat de gebruiker na korte tijd werk gedaan kan krijgen met het systeem. • efficiency: het systeem moet efficiënt zijn zodat er, nadat men heeft leren werken met het systeem, een hoge mate van productiviteit mogelijk is. • memorability: het systeem moet gemakkelijk te onthouden zijn, zodat ook gebruikers die af en toe met het systeem werken na een tijdje nog steeds weten hoe het werkt en niet alles opnieuw hoeven aan te leren. • satisfaction / subjectively pleasing: het systeem moet prettig en bij voorkeur ook leuk zijn om te gebruiken. • errors: het systeem moet zodanig functioneren dat de gebruiker er weinig fouten mee maakt en dat fouten die toch gemaakt worden makkelijk kunnen worden rechtgezet. (vrij vertaald uit: Nielsen, 1993, p. 26)
15
Nielsen is overigens niet de enige die het usability-construct heeft beschreven, er zijn diverse andere taxonomieën en daaraan gerelateerde heuristieken bekend (b.v. Norman, 1988; Shneiderman, 1992). Tussen deze taxonomieën bestaat veel overlap, ze zijn alle relatief algemeen en vaak gericht op het evalueren van complete softwarepakketten of websites. Er is momenteel echter geen specifieke evaluatiemaat beschikbaar die volledig is gericht op het vergelijken van de interactietechniek van een interface. Op het gebied van usability-testing bij websites is dit bijvoorbeeld wel het geval, de gewogen WAMMIvragenlijst van Kirakowski, Claridge en Whitehead (1998) is hiervan een voorbeeld. De usability-aspecten zijn op diverse manieren te meten. Zo kan de efficiency van een systeem worden gemeten in termen van gebruikersperformance, bijvoorbeeld door te registreren hoelang gebruikers over een bepaalde taak doen. Daarnaast kan de efficiency worden gemeten zoals deze wordt ervaren door de gebruiker, meestal door de gebruiker er gewoon naar te vragen. Dit wordt ook wel perceived efficiency genoemd. Het aspect subjectively pleasing / satisfaction behoeft een aparte toelichting. User satisfaction is een complex begrip, waarvan de inhoud bovendien sterk afhankelijk is van de taak die moet worden uitgevoerd (Lindgaard & Dudek, 2002). Bovendien claimen sommige auteurs dat elementen als control, efficiency en learnability, die bij Nielsen onder het construct usability vallen, juist onder de parapluterm user satisfaction thuishoren (Kirakowski et al., 1998). Deze verschillende perspectieven op classificaties maken het lastig voor onderzoekers om de gebruikersevaluatie eenduidig te operationaliseren. Het aspect errors hangt sterk samen met de mate waarin de gebruiker controle heeft over het systeem. Hoe meer fouten door de gebruiker worden toegeschreven aan het systeem, hoe minder de gebruiker het idee heeft dat deze de touwtjes in handen heeft. De mate van controle komt voort uit de heuristieken van Shneiderman (1992). Hij gaf aan dat de gebruiker moet worden voorzien van een “internal locus of control”. 1.5.2 Hoe meet je de gebruikersperformance? Diverse onderzoekers toonden reeds snelheidsverschillen aan ten gunste van ooginteractie-interfaces (paragraaf 1.2.1). In dit soort onderzoeken werd gebruikersperformance veelal inzichtelijk gemaakt door te meten hoeveel tijd het gemiddeld kost om een enkel object te selecteren op het scherm, maar bijvoorbeeld ook door te meten hoeveel tijd het gemiddeld kost om een (sub)taak met meerdere selecties te volbrengen.
16
1.6 Het interfaceontwerp In het licht van de theoretische wensen en eisen waaraan een verbeterde ooginteractieinterface zou moeten voldoen (paragraaf 1.4) wordt het volgende ontwerp voorgesteld: Met een eye-tracker wordt geregistreerd waar de gebruiker kijkt op het scherm. Om een object op het scherm te selecteren hoeft de gebruiker enkel te kijken naar het object en op dat moment te klikken op een gamepad. De muis en de cursor spelen geen rol in het ontwerp. De basis van dit ontwerp is gevisualiseerd in Figuur 1.1.
Figuur 1.1 Schematische weergave van de basis van het ooginteractie-ontwerp.
In paragraaf 1.4.1 werd echter beargumenteerd dat visuele feedback van beeldschermobjecten wellicht beter functioneert dan zonder. Daarom is er behoefte aan een variant van ooginteractie waarbij objecten op het scherm waarnaar wordt gekeken, worden voorzien van visuele feedback. Dan weet de gebruiker zeker dat dit object zich in zijn vizier bevindt. Ook deze variant is in het huidige onderzoek meegenomen. De gebruiker kijkt naar een object op het scherm, het object wordt voorzien van visuele feedback, door op dat moment te klikken op de gamepad wordt het object geselecteerd. Deze twee varianten van ooginteractie zullen vanaf hier respectievelijk oognavigatie zonder feedback en oognavigatie met feedback worden genoemd. Om een vergelijking met muisgebruik te kunnen maken, is als derde conditie muisnavigatie toegevoegd aan het onderzoek. Bij de muisconditie moeten de beeldschermobjecten ook worden voorzien van visuele feedback omdat we weten dat deze toevoeging beter functioneert. Om te onderzoeken hoe goed men kan selecteren met deze technieken in een ecologisch valide computertaak is gekozen voor een beoordelingstaak waarin veel moet worden geselecteerd. Meer over deze taak is te vinden in Hoofdstuk 2.
17
1.7 Onderzoeksvraag Op basis van het voorafgaande kan nu de algemene onderzoeksvraag worden geformuleerd. Deze vraag is tweeledig. De primaire onderzoeksvraag luidt: Heeft een ooggestuurde, muis- en cursorloze computerinterface bij het uitvoeren van een beoordelingstaak op de computer een positiever effect op de gebruikerswaardering en de gebruikersperformance dan een muisgestuurde computerinterface? De secundaire onderzoeksvraag luidt: Heeft het toevoegen van visuele feedback aan beeldschermobjecten (bij een ooggestuurde muis- en cursorloze computerinterface) een positiever effect op de gebruikerswaardering en de gebruikersperformance bij het uitvoeren van een beoordelingstaak op de computer dan zonder deze vorm van feedback?
1.8 Hypotheses Op basis van de theorie zoals besproken in de voorgaande paragrafen en de algemene onderzoeksvraag kan nu een aantal hypotheses worden geformuleerd. De hypotheses zijn op te splitsen in gebruikerswaardering en gebruikersperformance. Gebruikerswaardering bestaat grotendeels uit de usability-aspecten van Nielsen (zie paragraaf 1.5.1) met daaraan toegevoegd een aanname over de algemene voorkeur voor één van de drie interactiemethodes die na afname van het experiment door de proefpersonen wordt aangegeven. Gebruikersperformance wordt enkel gemeten in termen van de gemiddelde snelheid waarmee wordt geselecteerd en de gemiddelde snelheid waarmee de beoordelingstaak wordt volbracht. In lijn met de primaire en secundaire onderzoeksvraag worden de hypotheses tevens opgesplitst in verschillen tussen oognavigatie (beide varianten) versus muisnavigatie en tussen oognavigatie zonder feedback versus oognavigatie met feedback onderling. De komende twee paragrafen staan in het teken van de hypotheses met een bijbehorende onderbouwing. 1.8.1 Gebruikerswaardering H.1 oognavigatie versus muisnavigatie Navigeren met behulp van oogbewegingen heeft een positief effect op de waardering van de interactie met het systeem: de usability van de oognavigatie bij een beoordelingstaak op de computer wordt beter gewaardeerd dan de usability van muisnavigatie. •
H.1.A De learnability van oognavigatie wordt beter gewaardeerd dan die van muisnavigatie.
•
H.1.B De efficiency van oognavigatie wordt beter gewaardeerd dan die van muisnavigatie.
•
H.1.C De memorability van oognavigatie wordt beter gewaardeerd dan die van muisnavigatie.
18
•
H.1.D Het aspect satisfaction / subjectively pleasing van oognavigatie wordt beter gewaardeerd dan die van muisnavigatie.
•
H.1.E Het aspect errors / locus of control van oognavigatie wordt slechter gewaardeerd dan die van muisnavigatie.
•
H.1.F Oognavigatie geniet de algemene voorkeur boven muisnavigatie.
Bij deze hypotheses geldt dat er voor de verwachtingen van H.1.B en H.1.D een theoretische onderbouwing aanwezig is in respectievelijk paragraaf 1.2.1 en paragraaf 1.2.3. Voor de verwachtingen van H.1.A, H.1.C, H.1.E en H.1.F is daarentegen geen theoretische onderbouwing geleverd, behalve de indicatie dat oognavigatie kan leiden tot een lagere cognitieve belasting (paragraaf 1.2.2). De reden voor het ontbreken van een verdere onderbouwing is dat er geen onderzoek naar deze aspecten in een vergelijkbare situatie bekend is. Om toch het complete usability-construct te kunnen meten zijn deze aspecten als toetsbare hypotheses geformuleerd en opgenomen in het onderzoek. De reden dat van de factor errors / locus of control (H.1.E) wordt verwacht dat deze slechter scoort bij oognavigatie is dat deze interactiemethode voor de gebruikers nieuw is. Gebruikers bevinden zich het begin van de leercurve en verwacht kan worden dat er in die fase meer fouten worden gemaakt (Nielsen, 1993) in tegenstelling tot muisnavigatie waar de gebruikers al jaren mee werken. H.2 oognavigatie zonder feedback versus oognavigatie met feedback Het toevoegen van visuele feedback aan beeldschermobjecten bij oognavigatie heeft een positief effect op de waardering van de interactie met het systeem: de usability van oognavigatie met feedback bij een beoordelingstaak op de computer wordt beter gewaardeerd dan de usability van oognavigatie zonder feedback. •
H.2.A De learnability van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.B De efficiency van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.C De memorability van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.D Het aspect satisfaction / subjectively pleasing van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.E Het aspect errors / locus of control van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.F Oognavigatie met feedback geniet de algemene voorkeur boven oognavigatie zonder feedback.
19
Het enige verschil tussen de oognavigatie-condities is de aanwezigheid of afwezigheid van visuele feedback van beeldschermobjecten. Gezien de belangrijke rol die deze feedback speelt bij computerinteractie in het algemeen (paragraaf 1.1.2 en 1.4.1) wordt verwacht dat ook in deze specifieke situatie de aanwezigheid van feedback een positief effect zal hebben op alle usability-aspecten en daardoor ook op de algemene voorkeur. 1.8.2 Gebruikersperformance H.3 oognavigatie versus muisnavigatie Navigeren met behulp van oogbewegingen heeft een positief effect op de gebruikersperformance bij een beoordelingstaak op de computer: met oognavigatie wordt sneller genavigeerd dan met muisnavigatie. •
H.3.A gemiddelde selectietijd De gemiddelde tijd die benodigd is om een object te selecteren is bij oognavigatie korter dan bij muisnavigatie.
•
H.3.B gemiddelde taaktijd De gemiddelde tijd die benodigd is om één opdrachtpagina met diverse selecties te voltooien is bij oognavigatie korter dan bij muisnavigatie.
Er is een uitgebreide theoretische onderbouwing geleverd waarom oognavigatie fundamenteel sneller kan zijn dan muisnavigatie (paragraaf 1.2.1). Bovendien is uiteengezet waarom dit interactie-ontwerp gunstiger op dit snelheidsvoordeel is ingericht dan enkele voorgaande ontwerpen (paragraaf 1.4). Wat nog niet bekend is, is de mate waarin deze voordelen tot uiting zullen komen bij een ecologisch valide beoordelingstaak op de computer. H.4 oognavigatie zonder feedback versus oognavigatie met feedback het toevoegen van visuele feedback aan beeldschermobjecten bij oognavigatie heeft een positief effect op de gebruikersperformance bij een beoordelingstaak op de computer: met oognavigatie met feedback wordt sneller genavigeerd dan met oognavigatie zonder feedback. •
H.4.A gemiddelde selectietijd De gemiddelde tijd die benodigd is om een object te selecteren is bij oognavigatie met feedback korter dan bij oognavigatie zonder feedback.
•
H.4.B gemiddelde taaktijd De gemiddelde tijd die benodigd is om één opdrachtpagina met diverse selecties te voltooien is bij oognavigatie met feedback korter dan bij oognavigatie zonder feedback.
Deze aannames behoeven een toelichting. Selectie zonder visuele feedback zou sneller kunnen zijn, wanneer ervan wordt uitgegaan dat gebruikers de visuele feedback neigen ‘af te wachten’ en daardoor later reageren. Het is echter ook mogelijk dat de verwachte usabilityvoordelen van de conditie met feedback een positief effect zullen hebben op de gemiddelde tijden ondanks het feit dat er in theorie sneller kan worden gereageerd zonder feedback. In dit onderzoek wordt ervan uitgegaan van deze gedachte. In het volgende hoofdstuk wordt beschreven binnen welke onderzoeksopzet de hypotheses werden getoetst.
20
Hoofdstuk 2. Onderzoeksopzet 2.1 Inleiding Om de hypotheses te kunnen toetsen werd een experiment uitgevoerd in een onderzoekslaboratorium op de Universiteit van Tilburg (vanaf hier UvT). De doelstelling was om het interactie-ontwerp te testen in een ‘alledaagse’ computertaak waarin diverse aanklikbare beeldschermobjecten (buttons) op het scherm moesten worden geselecteerd door de gebruiker. Dit in tegenstelling tot een Fitt’s pointing task die in de regel minder ecologisch valide is (paragraaf 1.2.1). Daarom werd gekozen voor een beoordelingstaak die het karakter had van een enquête. Op elke opdrachtpagina was links in beeld een afbeelding te zien en rechts in beeld waren vijf termen te zien met onder elke term een ja-button en een nee-button (zie Figuur 2.1 voor een voorbeeld van zo’n pagina). De proefpersonen moesten per term aangeven of zij deze wel of niet van toepassing vonden op de afbeelding door de ja- of de nee-button op het scherm te selecteren. Daarnaast was er nog een button waarmee de pagina kon worden afgesloten ('verder'-button). Voor elke conditie gold dat de proefpersonen een helm met twee cameraatjes droegen zodat de oogbewegingen konden worden geregistreerd.
Figuur 2.1 Voorbeeld van een opdrachtpagina uit het experiment
21
Allereerst zal in dit hoofdstuk dieper worden ingegaan op de drie condities in dit experiment. In de daaropvolgende paragrafen zal aandacht worden besteed aan het gebruikte materiaal, de materiaaltest, de proefpersonen, het design, de instrumentatie, de apparatuur, de procedure en tot slot de verwerking van de gegevens. 2.1.1 Condities In paragraaf 1.6 werden reeds de drie condities geïntroduceerd: muisnavigatie, oognavigatie zonder feedback en oognavigatie met feedback. In de conditie muisnavigatie konden buttons worden geselecteerd door ze met de muiscursor aan te wijzen en vervolgens aan te klikken. Op het moment dat de cursor de rand van een object bereikte verscheen er binnen de rand van het object visuele feedback in de vorm van een 1 pixel breed stippellijntje (vergelijkbaar met de drawframerect-functie in de standaard Windows API, zie Figuur 2.2). Verliet men het object dan verdween de feedback, geheel in lijn met een gebruikelijke ‘mouse over’-functie. In de conditie oognavigatie met feedback konden beeldschermobjecten worden geselecteerd door met de ogen te kijken naar de button en tegelijkertijd te drukken op de gamepad. Op het moment dat er een fixatie op een button viel, verscheen dezelfde visuele feedback als bij de conditie muisnavigatie. In de conditie oognavigatie zonder feedback was er vanzelfsprekend geen vorm van visuele feedback.
Figuur 2.2 Voorbeeld van de visuele feedback in het experiment. Wanneer de muiscursor of de ogen binnen het gebied van een button werden bewogen, verscheen een 1 pixel breed stippellijntje aan de binnenkant van de button (rechts).
De buttons op de pagina’s waren zoveel mogelijk voorzien van standaard grafische eigenschappen zoals die vaak worden toegepast in hedendaagse websites, softwarepakketten en besturingssystemen. Een uitzondering is dat deze buttons een combinatie vormden van ‘radio buttons’ en gewone buttons. Een radiobutton is een cirkeltje dat na selectie wordt gevuld met een bolletje. Radiobuttons komen alleen gegroepeerd voor en binnen een groep kan telkens slechts één button geselecteerd zijn. Ze worden veelvuldig gebruikt in formulierachtige omgevingen zoals in dit onderzoek. In Figuur 2.3 is te zien hoe een radiobutton er voor en na selectie uitzag.
Figuur 2.3 niet aangeklikt (links) wel aangeklikt (rechts)
De ja- en nee-buttons hadden op alle pagina’s hetzelfde formaat en waren 48 pixels hoog en 148 pixels breed. De verder-button had ook op alle pagina’s hetzelfde formaat en was 48 pixels hoog en 218 pixels breed. De schermresolutie was 1024 x 768 pixels.
22
2.2 Materiaal In totaal werden 48 afbeeldingen gebruikt, bestaande uit 16 advertenties en 32 politieke cartoons. De herkomst van de advertenties was uit een corpus van dr. J. Schilperoord van de UvT dat werd gebruikt voor onderzoek naar visuele metaforen. De cartoons kwamen overwegend uit recente Nederlandse kranten waaronder de Volkskrant, Trouw en het Parool. De afbeeldingen waren gemiddeld 379 pixels hoog en 470 pixels breed. 2.2.1 Materiaaltest Het was van belang dat de proefpersonen zich primair richtten op de beoordelingstaak en niet op het hanteren van de verschillende interactietechnieken. Daarom moest de taak een bepaalde cognitieve belasting hebben zodat de proefpersonen op een zinvolle manier aan het werk waren. Bij de advertenties en politieke cartoons was aan te nemen dat de proefpersonen enige moeite moesten doen om te kijken of ze de boodschap van de afbeelding goed begrepen en vervolgens of de termen in hun optiek van toepassing waren op die afbeeldingen. Desalniettemin was het noodzakelijk om vooraf te controleren of deze taken uitvoerbaar en zinvol waren. Daarom werd een materiaaltest uitgevoerd om te onderzoeken of de afbeeldingen goed werden begrepen en in welke mate de termen als wel of niet van toepassing werden beschouwd op de afbeeldingen. De materiaaltest bestond uit 20 advertenties en 34 cartoons. Via een webenquête werd aan 47 studenten van Communicatie- en Informatiewetenschappen van de UvT voorgelegd welke termen zij wel of niet van toepassing vonden op de afbeeldingen en welke afbeeldingen zij wel of niet begrepen. Per afbeelding werden 15 termen genoemd. De materiaaltest van de advertenties werd gemaakt door 21 proefpersonen. De gemiddelde leeftijd van deze proefpersonen, 5 mannen (24%) en 16 vrouwen (76%), was 24 (afgerond). De materiaaltest van de cartoons werd gemaakt door 26 proefpersonen. De gemiddelde leeftijd van deze proefpersonen, 10 mannen (38%) en 16 vrouwen (62%), was 23 (afgerond). Na de test was er van iedere afbeelding bekend door hoeveel proefpersonen deze werd begrepen en welke termen zij erop van toepassing vonden. De afbeeldingen die het minst goed werden begrepen zijn verwijderd. Na deze opschoning bleven er 16 advertenties over en 32 politieke cartoons. Van deze afbeeldingen was bekend welke termen als wel of niet van toepassing werden beschouwd. Door de oordelen uit dit corpus te middelen kon de kans worden berekend dat een term bij een specifieke afbeelding in het experiment met ja of met nee zou worden beoordeeld. Op basis van deze kansen werden vijf termen toegewezen aan elke afbeelding, zodanig dat er sprake was van een vrijwel gelijke verdeling van ja’s en nee’s over de gehele taak. Per afbeelding waren dit dus telkens 2 ja’s en 3 nee’s of andersom. Gemiddeld was er nagenoeg evenveel kans op ja’s als op nee’s. Meer over deze verdeling, een overzicht van alle afbeeldingen, de toegewezen termen en de kans per term dat deze met een ja of met een nee zou worden beoordeeld is te vinden in Bijlage 1.
23
2.3 Proefpersonen Aan het experiment namen 38 studenten van de UvT deel, 9 mannen (24%) en 29 vrouwen (76%). De gemiddelde leeftijd was 20 (afgerond), de jongste proefpersoon was 18 jaar oud, de oudste 29 jaar oud. Het grootste deel van de proefpersonen was 1e jaars (89%). Alle proefpersonen die deelnamen aan het experiment hadden niet deelgenomen aan de materiaaltest en hadden dus geen voorkennis over de uit te voeren taak. 26 Proefpersonen (68%) droegen geen lenzen, 11 proefpersonen (29%) hadden tijdens de proef wel lenzen in en van 1 proefpersoon (3%) was onbekend of deze lenzen droeg.
2.4 Design In het experiment werden de proefpersonen blootgesteld aan drie condities in een binnenproefpersoon-ontwerp. Er waren zes lijsten, zes mogelijke volgordes, waarin de proefpersonen aan de onafhankelijke variabele werden blootgesteld. Proefpersonen werden bij binnenkomst op basis van willekeur toegewezen aan één van deze zes lijsten. Hiermee werd gewaarborgd dat de volgorde van de condities geen invloed zou hebben op de gemiddeldes van de resultaten. Iedere proefpersoon kreeg drie series van beoordelingstaken, één serie per conditie. De volgorde van de series en de afbeeldingen was voor iedere proefpersoon gelijk: eerst een serie met 16 advertenties, daarna 16 politieke cartoons en tot slot nog eens 16 politieke cartoons. De volgorde van de vijf geselecteerde termen waren per afbeelding gerandomiseerd.
2.5 Instrumentatie 2.5.1 Instrumentatie van gebruikerswaardering Om de gebruikerswaardering te kunnen meten werd na afloop van het experiment door de proefpersonen een vragenlijst ingevuld op de computer. Twintig stellingen uit deze lijst waren erop gericht het usability-construct te meten zoals omschreven in paragraaf 1.5.1. Dit hield in dat elk usability-aspect bestond uit vier stellingen, waarvan er twee positief en twee negatief waren geformuleerd. De stellingen waren zoveel mogelijk eenduidig geformuleerd en werden in een per proefpersoon gerandomiseerde volgorde aangeboden aan de proefpersonen. De twintig stellingen over usability waren de volgende: Vier stellingen over learnability gebaseerd op Nielsen (1993): Ik vind deze methode gemakkelijk aan te leren. Ik heb snel door hoe ik met deze methode moet navigeren. Ik vind dat leren werken met deze methode een pittige opgave is. Ik heb veel tijd nodig voordat ik snap hoe deze methode werkt. Vier stellingen over efficiency gebaseerd op Nielsen (1993): Ik kan met deze methode snel navigeren. Ik kan met deze methode snel buttons selecteren. Ik vind dat ik veel overbodige bewegingen moet maken met deze methode. Ik vind dat van de ene positie naar de andere gaan met deze methode traag verloopt.
24
Vier stellingen over memorability gebaseerd op Nielsen (1993): Ik vind het gemakkelijk om te onthouden hoe deze methode werkt. Als ik morgen weer zou werken met deze methode, weet ik nog prima hoe het moet. Ik zou het moeilijk vinden om aan iemand anders uit te leggen hoe deze methode werkt. Ik zal waarschijnlijk snel vergeten hoe met deze methode moet worden genavigeerd. Vier stellingen over satisfaction / subjectively pleasing gebaseerd op Nielsen (1993): Ik vind het prettig om met deze methode te navigeren. Ik vind navigeren met deze methode een leuke ervaring. Ik vind het vervelend om te navigeren met deze methode. Ik vind dat navigeren met deze methode onnatuurlijk aanvoelt. Vier stellingen over errors / locus of control gebaseerd op Nielsen (1993) en Shneiderman (1998): Met deze methode maak ik weinig fouten bij het selecteren van buttons. Met deze methode heb ik het gevoel dat ik de touwtjes in handen heb. Met deze methode doet het programma vaak wat anders dan ik wil. Ik maak veel onnodige fouten met deze methode. De reacties op deze stellingen konden worden aangegeven op 7-punts Likertschalen van geheel mee oneens tot geheel mee eens. De volgorde van de interactiemethoden bij de Likertschalen was bij elke proefpersoon conform de volgorde van de condities zoals afgenomen in het experiment. Als geheugensteuntje werden deze volgordes voorzien van icoontjes (zie Figuur 2.4).
Figuur 2.4 Een voorbeeld van een stelling in de vragenlijst na het experiment. Deze proefpersoon had lijst 1 toegewezen gekregen, dat wil zeggen dat deze persoon eerst met de muis heeft gewerkt, vervolgens met oognavigatie zonder feedback en ten slotte met oognavigatie met feedback.
25
Na de twintig stellingen over usability werd de proefpersonen gevraagd om te uiten welke van de drie navigatiemethoden de algemene voorkeur genoot, door een 1e, 2e of 3e positie toe te kennen (zie Figuur 2.5). Elke positie kon maar één keer worden toegekend.
Figuur 2.5 Vraag naar de algemene voorkeur voor de drie interactiemethoden. Deze proefpersoon had lijst 1 toegewezen gekregen (muisnavigatie, oognavigatie zonder feedback, oognavigatie met feedback).
Na deze vraag volgde er nog een tweetal vragen over het aantal uren dat de proefpersoon dagelijks achter de computer doorbracht en of de proefpersoon last had van RSI. Deze laatste twee vragen waren niet gekoppeld aan een van de hypotheses. 2.5.2 Instrumentatie van gebruikersperformance Tijdens het experiment werden in alle condities de tijden, fixaties op het scherm, muisen gamepadkliks van de proefpersonen geregistreerd om snelheidsverschillen tussen de interactietechnieken te kunnen analyseren.
26
2.6 Apparatuur Het experiment werd afgenomen in een laboratorium op de UvT. Er werd gebruikgemaakt van twee PC’s en een eye-tracker. Op de ‘host PC’ draaide het programma om de oogbewegingen te registreren, op de ‘display PC’ maakten de proefpersonen hun opdrachten en de vragenlijst na afloop van het experiment. De gebruikte eye-tracker was de EyeLink® II van de Canadese firma SR Research Ltd. Deze eye-tracker bestaat uit een helm met twee kleine infraroodcamera’s die zijn gericht op de ogen van de gebruiker (zie Figuur 2.6). Om de oogbewegingen met deze camera’s te kunnen registreren maakt de EyeLink gebruik van cornea- en pupilreflectie. De display PC waarop de proefpersonen de opdrachten maakten had een schermgrootte van 17 inch en een resolutie-instelling van 1024 x 768 pixels. De afstand van de proefpersoon tot het scherm was ongeveer 60 cm. De vragenlijst werd afgenomen via een online-enquête die gebaseerd was op het CGI-script WWstim4.
Figuur 2.6 De EyeLink® II (bron: EyeLink II User Manual version (1/10/2005); SR Research Ltd.)
2.7 Pretest Voorafgaand aan het experiment werden diverse tests uitgevoerd. Aan de laatste pretest voor het experiment namen 3 proefpersonen deel. Het doel van deze pretest was ondermeer om te testen of de instructies goed werden begrepen, of de opdracht goed uit te voeren was en hoelang de afname van het experiment ongeveer duurde. Tevens was het van belang om te weten of de eye-tracker en de besturingssoftware van het interactie-ontwerp goed functioneerden en of de calibratie van de eye-tracker een constante kwalitatieve meting opleverde. Dit laatste was noodzakelijk om de buttons op het scherm goed te kunnen blijven selecteren en om de fixaties op de juiste manier weg te schrijven naar de opslagbestanden. Uit de eerste tests bleek ondermeer dat het beste kon worden gewerkt met relatief grote buttons (paragraaf 2.1.1), omdat bij kleine buttons een zeer nauwkeurige en stabiele eye-tracking vereist was. De gebruikte apparatuur was daartoe helaas niet in staat. Uit de laatste pretest kwam naar voren dat zelfs met deze grotere buttons de apparatuur tijdens het voltooien van een serie soms te onnauwkeurig de oogbewegingen registreerde. Dit kwam bijvoorbeeld doordat de hoofdband tijdens de proefafname soms 4
http://www.let.uu.nl/~Theo.Veenker/personal/projects/wwstim/doc/nl/
27
wat verschoof, of doordat de apparatuur moeite had met het onderscheiden van oog- en hoofdbewegingen. Feitelijk kon er pas goed worden gewerkt met de apparatuur als de testpersoon volledig stilzat achter de PC. Als er toch bewogen was, moest de testpersoon in de regel het hoofd iets naar voren of naar achteren kantelen om weer in de ‘juiste’ positie te zitten. Uit de laatste pretest kwam tevens naar voren dat de visuele feedback bij de conditie oognavigatie met feedback erg onrustig aandeed. Het stippellijntje reageerde namelijk direct op saccades en microsaccades (paragraaf 1.1.4). Om dit ‘knipper-effect’ te reduceren werd besloten om een vertraging van 200 ms in te bouwen. Dit hield in dat bij het kijken naar de button het stippellijntje verscheen, zodra dit verschenen was, bleef het stippellijntje 200 ms staan ongeacht of de ogen zich intussen verplaatsten. De bevindingen uit de pretest hebben uiteindelijk geleid tot de in de volgende paragraaf beschreven procedure.
2.8 Procedure Bij binnenkomst werden enkele algemene gegevens van de proefpersoon door de proefleider genoteerd in een logboek. Dit betrof de volgende gegevens: leeftijd, geslacht, studierichting, of de proefpersoon links- of rechtshandig was, met welke hand deze de muis hanteerde en of de proefpersoon lenzen droeg. Vervolgens werd door de proefleider de instructie voorgelezen (Bijlage 2). Een belangrijk element in de instructie was dat de nadruk primair op het uitvoeren van de beoordelingstaak werd gevestigd en secundair op de drie interactiemethoden. Hiertoe werd aangegeven dat in het onderzoek centraal stond hoe mensen afbeeldingen als advertenties en politieke cartoons visueel verwerken. Na het voorlezen van de instructie werd aan de proefpersoon gevraagd of deze alles begrepen had. Was dit het geval dan werd de eye-tracker op het hoofd geplaatst en ingesteld en er werd een calibratie- en validatieprocedure uitgevoerd. De calibratie is een procedure om vast te stellen waar de gebruiker precies kijkt op het scherm. De proefpersoon moest daarom naar 9 zwarte stippen kijken die achtereenvolgens op het scherm verschenen. Na de calibratie volgde een validatie om te controleren of de calibratie juist was verlopen. Hiertoe moest de proefpersoon weer 9 zwarte stippen op het scherm volgen met de ogen, net als bij de calibratie De gecombineerde calibratie- en validatieprocedure werd herhaald totdat deze goed verliep. Wanneer de apparatuur volledig was ingesteld, werd op het scherm de eerste instructiepagina getoond waarop in tekst stond aangegeven hoe de interactietechniek werkte waarmee in de eerste serie van vragen moest worden gewerkt. Op deze pagina werd ook uitgelegd hoe men met hoofdbewegingen kon corrigeren als de apparatuur niet goed reageerde (Bijlage 3). Na de instructiepagina volgde een oefenpagina. De oefenpagina zag er vrijwel hetzelfde uit als de opdrachtpagina’s (Bijlage 4). Tijdens de instructie- en oefenpagina mocht de proefpersonen nog vragen stellen aan de proefleider. Wanneer de proefpersoon voldoende had geoefend met de interactiemethode, mocht de verder-knop links onderaan het scherm worden geselecteerd en de eerste serie met 16 opdrachtpagina’s (advertenties) kon worden gemaakt. Op elke opdrachtpagina moest de persoon eerst goed naar de afbeelding kijken en vervolgens door de ja- of de nee-knop te selecteren aangeven of de term wel of niet van toepassing was op de afbeelding. Bij elke term moest een keuze worden gemaakt. Drukte men op de verder-knop voordat men bij alle termen een keuze had gemaakt, dan verscheen er een melding dat niet alle
28
termen waren beoordeeld. Na de selectie kon telkens de verder-knop worden geselecteerd om naar de volgende opdrachtpagina te gaan. Na de eerste serie werd dezelfde calibratie- en validatieprocedure uitgevoerd als aan het begin van het experiment. Vervolgens volgde een instructiepagina en daarna een oefenpagina, net zoals voorafgaand aan de eerste serie. De tweede serie met 16 opdrachtpagina’s was exact hetzelfde als de eerste serie met uitzondering van de afbeeldingen (politieke cartoons) en de termen bij de afbeeldingen. Na de tweede serie volgde wederom een calibratie- en validatieprocedure, gevolgd door respectievelijk een instructiepagina en een oefenpagina. De derde serie met 16 opdrachtpagina’s was ook exact hetzelfde als de andere twee series, behalve de afbeeldingen en de termen bij de afbeeldingen. Dit waren wederom politieke cartoons, maar andere dan in de tweede serie. Na het voltooien van de derde serie verscheen er een einde-melding in beeld. De proefleider verwijderde de eye-tracker en gaf aan dat enkel nog de vragenlijst diende te worden ingevuld. De vragenlijst kon volledig zelfstandig worden ingevuld door de proefpersoon op dezelfde PC als waar de voorgaande opdrachten op waren uitgevoerd. De eerste pagina van de vragenlijst bestond uit een instructie op het scherm (Bijlage 5). In de instructie werd rekening gehouden met de volgorde (lijst 1 t/m 6) waarin de proefpersoon was blootgesteld aan de onafhankelijke variabele. Bovendien werd toegelicht dat het voor muisnavigatie misschien bij sommige vragen lastiger was om een beoordeling te geven omdat hier al zolang mee wordt gewerkt. Na het lezen van deze instructie kon de proefpersoon zelf via een verder-knop met de muis de vragen gaan beantwoorden. Bij de vraag over de algemene voorkeur (paragraaf 2.5.1, Figuur 2.5) kon de proefpersoon tevens commentaar invullen. Na de laatste vraag verscheen wederom een einde-melding in beeld. Eventuele betekenisvolle opmerkingen van de proefpersonen na de proefafname werden genoteerd in het logboek. De proefpersoon werd vanzelfsprekend hartelijk bedankt voor de deelname aan het experiment. Gemiddeld hadden de proefpersonen 50 minuten (afgerond) nodig voor het gehele experiment, inclusief instructie en vragenlijst achteraf. De snelste proefpersoon was klaar in 41 minuten, de langzaamste in 72 minuten.
2.9 Verwerking van de gegevens 2.9.1 Gebruikerswaardering In SPSS 11.5 for Windows is getoetst of de itemsets over usability (paragraaf 2.5.1) uit de vragenlijst intern consistent waren. Hiervoor werden de schaalwaardes van de negatieve stellingen omgepoold. De interne consistentie de schaal learnability was goed (Cronbach’s α = .89). De interne consistentie van de schaal efficiency was ook goed (Cronbach’s α = .91). De interne consistentie van de schaal memorability was adequaat (Cronbach’s α = .75). De schaal satisfaction / subjectively pleasing bestond aanvankelijk uit 4 items. Eén van de items, vraag 14, gedroeg zich echter anders dan de andere items. Vraag 14 luidde “Ik vind navigeren met deze methode een leuke ervaring”. Dit item is apart geanalyseerd met als naam experience. De overige 3 items vormden de schaal satisfaction / subjectively pleasing. De interne consistentie van deze schaal was goed (Cronbach’s α = .90). De interne consistentie van de schaal errors / feeling of control was goed (Cronbach’s α = .90).
29
Als aanvulling op de Cronbach’s α’s werd een componentenanalyse uitgevoerd over de data uit de vragenlijsten. Ook uit deze analyse kwam vraag 14 als aparte component naar voren. Reden te meer om deze vraag apart te analyseren. Daarnaast kwamen er nog twee redelijk grote componenten naar voren uit de componentenanalyse. De eerste bestond uit 8 items: de 4 items van learnability plus de 4 items van memorability. De tweede component bestond uit 11 items: de 4 items van efficiency, de 4 items van errors / feeling of control plus de 3 (overgebleven) items van satisfaction / subjectively pleasing. Deze laatste twee componenten werden in de post hoc analyse meegenomen, respectievelijk onder de namen learning en working. 2.9.2 Gebruikersperformance De opgeslagen fixaties werden gekoppeld aan vooraf gedefinieerde objecten (buttons en afbeeldingen) op het scherm, vervolgens werden de fixaties handmatig gecorrigeerd omdat er soms sprake was van kleine verschuivingen in de fixatiedata. Deze koppeling en correctie werd uitgevoerd in het programma Fixation (Cozijn, 2006). Deze data werden gecombineerd met muis-, gamepadkliks en bijbehorende tijden. Van zeven proefpersonen waren de fixatiedata niet consistent geregistreerd, deze werden dan ook uitgesloten van analyse. Na het importeren van de data in SPSS 11.5 for Windows kon ondermeer worden bepaald hoe lang proefpersonen over elke opdrachtpagina hadden gedaan en of deze tijden verschilden per conditie. Dit resulteerde in de gemiddelde taaktijd. Tevens kon worden geanalyseerd of de gemiddelde selectietijden verschilden per conditie. Een exacte weergave van de gemiddelde selectietijd kon echter moeilijk worden gemeten omdat in de uit te voeren taak niet altijd duidelijk was wanneer de intentie om een button te selecteren precies plaatsvond. Wel kon een indicatie van de gemiddelde selectietijd worden verkregen door de laatste bewegingen op een pagina voordat de verder-button werd geselecteerd te analyseren door de gemiddeldes te vergelijken. Met ‘laatste bewegingen’ wordt hier bedoeld: de duur van de laatste groep fixaties en saccades op de verder-button voordat op de gamepadknop werd geklikt. Hierbij moet worden opgemerkt dat bij de muisconditie regelmatig ander gedrag werd geconstateerd dan bij de oognavigatie-condities. Bij de muisconditie vond regelmatig eerst een groep fixaties en saccades op de verder-knop plaats, vervolgens nog één of twee groepen van fixaties en saccades, bijvoorbeeld op de afbeelding en pas daarna werd geklikt op de gamepadknop. Bij de oognavigatiecondities moest echter altijd geklikt worden tijdens een fixatie op de verder-knop. Tot slot werd een post hoc analyse uitgevoerd naar de tien snelste selectietijden per conditie als indicator van de snelheidspotentie van de drie condities. Aan deze post hoc variabele werd de naam snelste selecties gegeven. In het volgende hoofdstuk staat de statistische toetsing van de hypotheses centraal.
30
Hoofdstuk 3. Resultaten 3.1 Inleiding In dit hoofdstuk worden de resultaten van het experiment weergegeven. Alle usabilityvariabelen, zoals toegelicht in paragraaf 2.9.1, zijn met variantie-analyses getoetst in een binnenproefpersoon-ontwerp. De variabele algemene voorkeur werd getoetst middels een χ²-toets in een tussenproefpersoon-ontwerp. De afhankelijke variabelen gemiddelde taaktijd, gemiddelde selectietijd en snelste tijden zijn met een variantie-analyse getoetst in een tussenproefpersoon-ontwerp. De onafhankelijke variabele in het experiment was telkens de interactiemethode: muisnavigatie, oognavigatie zonder feedback en oognavigatie met feedback. Tevens is de onafhankelijke variabele lijst opgenomen in de variantie-analyses om de error-variantie te reduceren. De factor lijst wordt hier verder niet besproken. In paragraaf 3.2 worden de resultaten besproken die betrekking hebben op de gebruikerswaardering. De bijbehorende afhankelijke variabelen in de a priori analyses waren: usability, learnability, efficiency, memorability, satisfaction / subjectively pleasing, errors / locus of control, algemene voorkeur, rsi en computergebruik. De afhankelijke variabelen in de posthoc analyses waren: experience, learning en working. In paragraaf 3.3 worden vervolgens de resultaten besproken die betrekking hebben op de gebruikersperformance. De bijbehorende afhankelijke variabelen in de a priori analyses waren gemiddelde selectietijd en gemiddelde taaktijd. De afhankelijke variabele in de post hoc analyse was snelste selecties. Het hoofdstuk zal worden afgesloten met een bespreking van het licht dat de resultaten werpen op de hypotheses uit paragraaf 1.8.1 en 1.8.2.
31
3.2 Gebruikerswaardering In Tabel 3.1 zijn de gebruikerswaarderingen te zien van de usability-variabelen en de post hoc variabelen experience, learning en working. Tabel 3.1 Gemiddelde gebruikerswaardering per variabele Gemiddelde waardering van muisnavigatie (muis), oognavigatie zonder feedback (oog) en oognavigatie met feedback (oogfb) op Likert-schalen (min=1, max =7) voor het construct usability, per usability-variabele en de post hoc variabelen experience, learning en working. N=38. Interactiemethode muis
oog
oogfb
6.52 6.70 6.39 6.86 6.55 6.68 4.18 6.78 6.54
5.15 5.51 4.65 6.24 4.36 4.70 5.58 5.88 4.57
5.14 5.67 4.41 6.36 4.37 4.64 5.39 6.02 4.47
Gebruikerswaardering Usability Learnability Efficiency Memorability Satisfaction / subjectively pleasing Errors / feeling of control Experience Learning Working
Usability De variabele usability is door 20 items gemeten met Likert-schalen. De component experience (vraag 14) is niet meegenomen als item van de schaal satisfaction / subjectively pleasing, maar dus wel in de schaal usability. Uit de variantie-analyse herhaalde metingen bleek dat de waardering voor de drie interactietechnieken niet gelijk was. De usability van muisnavigatie werd beter gewaardeerd dan oognavigatie zonder feedback en oognavigatie met feedback, F(1,37) = 78,379; MSE = 70378; p < 0,01; η² = 0,71. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,37) < 1. Learnability De variabele learnability is door 4 items gemeten met Likert-schalen. Uit de variantieanalyse herhaalde metingen bleek dat de waardering voor de drie interactietechnieken niet gelijk was op dit aspect. Muisnavigatie werd beter gewaardeerd dan oognavigatie zonder feedback en oognavigatie met feedback, F(1,37) = 32,163; MSE = 38089; p < 0,01; η² = 0,501. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,37) < 1.
32
Efficiency De variabele efficiency is door 4 items gemeten met Likert-schalen. Uit de variantieanalyse herhaalde metingen bleek dat de waardering voor de drie interactietechnieken niet gelijk was op dit aspect. Muisnavigatie werd beter gewaardeerd dan oognavigatie zonder feedback en oognavigatie met feedback, F(1,37) = 73,905; MSE = 146631; p < 0,01; η² = 0,698. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,37) < 1. Memorability De variabele memorability is door 4 items gemeten met Likert-schalen. Uit de variantieanalyse herhaalde metingen bleek dat de waardering voor de drie interactietechnieken niet gelijk was op dit aspect. Muisnavigatie werd beter gewaardeerd dan oognavigatie zonder feedback en oognavigatie met feedback, F(1,37) = 21,954; MSE = 8814; p < 0,01; η² = 0,407. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,37) = 1,263; p = 0,27. Satisfaction / subjectively pleasing De variabele satisfaction / subjectively pleasing is door 3 items gemeten met Likertschalen. Uit de variantie-analyse herhaalde metingen bleek dat de waardering voor de drie interactietechnieken niet gelijk was op dit aspect. Muisnavigatie werd beter gewaardeerd dan oognavigatie zonder feedback en oognavigatie met feedback, F(1,37) = 69,332; MSE = 177102; p < 0,01; η² = 0,684. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,37) < 1. Errors / feeling of control De variabele errors / feeling of control is door 4 items gemeten met Likert-schalen. Uit de variantie-analyse herhaalde metingen bleek dat de waardering voor de drie interactietechnieken niet gelijk was op dit aspect. Muisnavigatie werd beter gewaardeerd dan oognavigatie zonder feedback en oognavigatie met feedback, F(1,37) = 101,899; MSE = 158993; p < 0,01; η² = 0,761. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,37) < 1. Experience De post hoc variabele experience is door 1 item gemeten met een Likert-schaal. Oognavigatie zonder feedback en oognavigatie met feedback werden beter gewaardeerd dan muisnavigatie, F(1,37) = 15,766; MSE = 57399; p < 0,01; η² = 0,330. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,37) < 1. Learning De post hoc variabele learning is door 8 items gemeten met een Likert-schaal. Uit de variantie-analyse herhaalde metingen bleek dat de waardering voor de drie interactietechnieken niet gelijk was op deze component. Muisnavigatie werd beter gewaardeerd dan oognavigatie zonder feedback en oognavigatie met feedback, F(1,37) = 33,300; MSE = 20887; p < 0,01; η² = 0,510. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,37) = 1,185, p = 0,28.
33
Working De posthoc variabele working is door 11 items gemeten met een Likert-schaal. Uit de variantie-analyse herhaalde metingen bleek dat de waardering voor de drie interactietechnieken niet gelijk was op deze component. Muisnavigatie werd beter gewaardeerd dan oognavigatie zonder feedback en oognavigatie met feedback, F(1,37) = 104,429; MSE = 160667; p < 0,01; η² = 0,765. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,37) < 1.
In Tabel 3.2 zijn de scores te zien van de algemene voorkeur die door de proefpersonen werd toegekend aan één van de drie interactietechnieken na afloop van het experiment. Tabel 3.2 Algemene voorkeur Voorkeur voor muisnavigatie en oognavigatie (totaal), oognavigatie zonder feedback (oog) en oognavigatie met feedback (oogfb). Scores zijn percentages; N=38. Interactiemethode
Voorkeur
muisnavigatie
oognavigatie
oog
oogfb
53%
47%
26%
21%
Algemene voorkeur Na de usability-vragen werd de proefpersonen gevraagd om aan te geven welke methode zij in de toekomst bij voorkeur zouden willen gebruiken (paragraaf 3.5.1). Dit konden zij aangeven door een 1e, 2e en 3e keus toe te kennen aan de 3 condities. Muisnavigatie werd hetzelfde gewaardeerd als oognavigatie wat betreft de verdeling van de 1e keus, χ²(1) = 0,105, p = 0,75. Oognavigatie zonder feedback werd hetzelfde gewaardeerd als oognavigatie met feedback wat betreft de verdeling van de 1e keus, χ²(1) = 0,222, p = 0,64. RSI en Computergebruik 3 Proefpersonen (8%) gaven aan soms last te hebben van RSI, 35 proefpersonen (92%) gaven aan nooit last te hebben van RSI. 11 Proefpersonen (29%) gaven aan minder dan 2 uur per dag achter de computer door te brengen, 26 proefpersonen (68%) gaven aan dat zij tussen de 2 en de 5 uur per dag doorbrengen achter de computer. 1 proefpersoon (3%) gaf aan meer dan 5 uur per dag achter de computer door te brengen.
34
3.3 Gebruikersperformance
In Tabel 3.3 is de gebruikersperformance te zien van de variabelen gemiddelde taaktijd, gemiddelde selectietijd en de post hoc variabele snelste selecties. De data van zeven van de in totaal 38 proefpersonen werden uitgesloten van deze analyses omdat de fixaties en saccades niet telkens goed waren geregistreerd. Voor alle resultaten van de gebruikersperformance zijn de uiterste waarden, groter of kleiner dan drie maal de standaarddeviatie, verwijderd. Tabel 3.3 Gemiddelde gebruikersperformance per variabele Gebruikersperformance bij muisnavigatie (muis), oognavigatie zonder feedback (oog) en oognavigatie met feedback (oogfb) uitgedrukt in milliseconden voor de variabelen gemiddelde taaktijd, gemiddelde selectietijd en de post hoc variabele snelste selecties. N=31.
Gemiddelde taaktijd Gemiddelde selectietijd Snelste selecties
muis
oog
oogfb
19161 528 172
26326 1343 216
26072 1471 292
Gemiddelde taaktijd Uit de een-weg variantie-analyse bleek dat de gemiddelde taaktijd voor de drie interactietechnieken niet gelijk was. Bij muisnavigatie werden de opdrachtpagina’s gemiddeld sneller voltooid dan bij oognavigatie zonder feedback en oognavigatie met feedback, F(1,31) = 15,094; MSE = 577495126; p < 0,01; η² = 0,251. Tussen de twee oognavigatie-condities werd geen verschil gevonden, F(1,31) < 1. Gemiddelde selectietijd Uit de een-weg variantie-analyse bleek dat de gemiddelde selectietijd voor de drie interactietechnieken niet gelijk was. Bij muisnavigatie werden objectselecties gemiddeld sneller uitgevoerd dan bij oognavigatie zonder feedback en oognavigatie met feedback, F(1,31) = 27,478; MSE = 9212981; p < 0,01; η² = 0,379. Tussen de twee oognavigatiecondities werd geen verschil gevonden, F(1,31) < 1. Snelste selecties Uit de een-weg variantie-analyse bleek dat de snelste selecties voor de drie interactietechnieken niet gelijk was. Bij muisnavigatie en oognavigatie zonder feedback werden objectselecties gemiddeld sneller uitgevoerd dan bij oognavigatie met feedback, F(1,31) = 11,107; MSE = 36896; p < 0,01; η² = 0,451. Tussen muisnavigatie en oognavigatie zonder feedback werd geen verschil gevonden, F(1,31) < 1.
35
3.4 Samenvatting van de resultaten In deze paragraaf worden de resultaten besproken in relatie tot de hypotheses uit paragraaf 1.8. De hypotheses bestaan uit vier groepen, H1 tot en met H4. Per groep worden telkens eerst de hypotheses herhaald en vervolgens worden de bijbehorende resultaten besproken. H.1 oognavigatie versus muisnavigatie Navigeren met behulp van oogbewegingen heeft een positief effect op de waardering van de interactie met het systeem: de usability van de oognavigatie bij een beoordelingstaak op de computer wordt beter gewaardeerd dan de usability van muisnavigatie. •
H.1.A De learnability van oognavigatie wordt beter gewaardeerd dan die van muisnavigatie.
•
H.1.B De efficiency van oognavigatie wordt beter gewaardeerd dan die van muisnavigatie.
•
H.1.C De memorability van oognavigatie wordt beter gewaardeerd dan die van muisnavigatie.
•
H.1.D Het aspect satisfaction / subjectively pleasing van oognavigatie wordt beter gewaardeerd dan die van muisnavigatie.
•
H.1.E Het aspect errors / locus of control van oognavigatie wordt slechter gewaardeerd dan die van muisnavigatie.
•
H.1.F Oognavigatie geniet de algemene voorkeur boven muisnavigatie.
Voor alle hypotheses van H1 geldt dat deze niet konden worden bevestigd. Op deze usability-aspecten werd muisnavigatie namelijk beter gewaardeerd dan de beide oognavigatie-methodes. Alleen voor H.1.E geldt dat de hypothese wel werd bevestigd. Bij de algemene voorkeur (H.1.F), werd geen verschil gevonden tussen oognavigatie en muisnavigatie. Ook deze hypothese kon dus niet worden bevestigd, maar de waardering van oognavigatie was op dit aspect even goed als muisnavigatie. Uit de post hoc analyse bleek dat er wel een verschil werd gevonden voor de variabele experience ten gunste van oognavigatie. De proefpersonen vonden werken met oognavigatie een leukere ervaring dan werken met muisnavigatie. De beide oognavigatie-condities werden als even leuk beschouwd.
36
H.2 oognavigatie zonder feedback versus oognavigatie met feedback Het toevoegen van visuele feedback aan beeldschermobjecten bij oognavigatie heeft een positief effect op de waardering van de interactie met het systeem: de usability van oognavigatie met feedback bij een beoordelingstaak op de computer wordt beter gewaardeerd dan de usability van oognavigatie zonder feedback. •
H.2.A De learnability van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.B De efficiency van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.C De memorability van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.D Het aspect satisfaction / subjectively pleasing van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.E Het aspect errors / locus of control van oognavigatie met feedback wordt beter gewaardeerd dan die van oognavigatie zonder feedback.
•
H.2.F Oognavigatie met feedback geniet de algemene voorkeur boven oognavigatie zonder feedback.
Voor alle hypotheses van H2 geldt dat deze niet konden worden bevestigd. Op deze usability-aspecten werd geen verschil in waardering gevonden tussen oognavigatie zonder feedback en oognavigatie met feedback. Bij de algemene voorkeur (H.2.F) werd ook geen verschil gevonden tussen de beide oognavigatie-methodes, de waardering voor oognavigatie zonder feedback was even hoog als voor oognavigatie met feedback. H.3 oognavigatie versus muisnavigatie Navigeren met behulp van oogbewegingen heeft een positief effect op de gebruikersperformance bij een beoordelingstaak op de computer: met oognavigatie wordt sneller genavigeerd dan met muisnavigatie. •
H.3.A gemiddelde selectietijd De gemiddelde tijd die benodigd is om een object te selecteren is bij oognavigatie korter dan bij muisnavigatie.
•
H.3.B gemiddelde taaktijd De gemiddelde tijd die benodigd is om één opdrachtpagina met diverse selecties te voltooien is bij oognavigatie korter dan bij muisnavigatie.
De beide hypotheses van H3 konden niet worden bevestigd. Met muisnavigatie werden gemiddeld veel sneller opdrachtpagina’s voltooid en sneller buttons geselecteerd dan met oognavigatie. Desalniettemin bleek uit de post hoc analyse van de variabele snelste selecties dat er binnen de tien snelste selectietijden per conditie gemiddeld geen verschil
37
was tussen muisnavigatie en oognavigatie zonder feedback. Met oognavigatie met feedback werd langzamer geselecteerd. H.4 oognavigatie zonder feedback versus oognavigatie met feedback het toevoegen van visuele feedback aan beeldschermobjecten bij oognavigatie heeft een positief effect op de gebruikersperformance bij een beoordelingstaak op de computer: met oognavigatie met feedback wordt sneller genavigeerd dan met oognavigatie zonder feedback. •
H.4.A gemiddelde selectietijd De gemiddelde tijd die benodigd is om een object te selecteren is bij oognavigatie met feedback is korter dan bij oognavigatie zonder feedback.
•
H.4.B gemiddelde taaktijd De gemiddelde tijd die benodigd is om één opdrachtpagina met diverse selecties te voltooien is bij oognavigatie met feedback korter dan bij oognavigatie zonder feedback.
Ook de beide hypotheses van H4 konden niet worden bevestigd. Met oognavigatie zonder feedback werden gemiddeld even snel opdrachtpagina’s voltooid en even snel buttons geselecteerd als met oognavigatie met feedback. Uit de post hoc analyse van de variabele snelste selecties bleek echter dat er binnen de tien snelste selectietijden per conditie gemiddeld sneller werd geselecteerd met oognavigatie zonder feedback dan met oognavigatie met feedback.
38
Hoofdstuk 4 Conclusie en discussie 4.1 Inleiding In dit hoofdstuk wordt allereerst op een rij gezet welke conclusies uit de resultaten zijn voortgekomen (paragraaf 4.2). Vervolgens worden de conclusies bediscussieerd in het licht van het theoretisch kader en de praktische beperkingen van dit onderzoek (paragraaf 4.3 en verder). De slotparagraaf zal worden gewijd aan het toekomstperspectief dat deze studie heeft opgeleverd voor de ogen als input device in computerinteractie (paragraaf 4.3.5).
4.2 Conclusie De primaire onderzoeksvraag (paragraaf 1.7) luidde: Heeft een ooggestuurde, muis- en cursorloze computerinterface bij het uitvoeren van een beoordelingstaak op de computer een positiever effect op de gebruikerswaardering en de gebruikersperformance dan een muisgestuurde computerinterface? De secundaire onderzoeksvraag (paragraaf 1.7) luidde: Heeft het toevoegen van visuele feedback aan beeldschermobjecten (bij een ooggestuurde muis- en cursorloze computerinterface) een positiever effect op de gebruikerswaardering en de gebruikersperformance bij het uitvoeren van een beoordelingstaak op de computer dan zonder deze vorm van feedback? Zowel de primaire als de secundaire onderzoeksvraag konden niet positief worden beantwoord op basis van de resultaten uit dit onderzoek. De usability-aspecten van muisinteractie werden immers beter gewaardeerd dan de usability-aspecten van ooginteractie en tussen de beide ooginteractie-varianten werd geen verschil gevonden op deze aspecten. Een vergelijkbaar beeld ging op voor de gebruikersperformance tussen muis- en ooginteractie, met de muis werd in dit onderzoek overwegend sneller gewerkt dan met de ogen. Deze conclusie kan echter worden genuanceerd door de relatief positieve bevindingen die in dit onderzoek zijn gedaan over de ooginteractie-technieken. In de komende paragrafen zal deze nuancering worden uiteengezet.
39
4.3 Discussie 4.3.1 Een positieve beoordeling voor ooginteractie Ondanks het feit dat de ooginteractie-methodes niet zo goed scoorden op usability als de muismethode, werden alle usability-aspecten positief beoordeeld. Op de zeven-punts schalen werd zowel door de muismethode als door de ooginteractie-methodes positief gescoord op alle aspecten (zie Tabel 1.1). In lijn met deze positieve benadering van de resultaten is de bevinding dat, mits de apparatuur minder restricties heeft, maar liefst de helft van de proefpersonen in de toekomst bij voorkeur werkt met ooginteractie in plaats van met de muis. Gezien het feit dat de proefpersonen slechts 20-30 minuten hebben gewerkt met deze methode is dat een veelbelovende indicatie. Deze bevinding is overigens consistent met de ‘favorability’ ten gunste van de ooginteractiemethode van Zhai et al. (paragraaf 1.2.3). Bovendien werd het werken met de ooginteractiemethodes als leuker ervaren dan het werken met de muis. Deze bevinding is in lijn met de scores die Smith & Graham rapporteerden voor ooginteractie-toepassingen in de gaming industrie (paragraaf 1.2.3). 4.3.2 Waarom houdt men vast aan de gevestigde orde? Een bestaande technologie of methode zoals de muis wordt niet zomaar van de troon gestoten. De deelnemers aan dit onderzoek waren gemiddeld 20 jaar en hebben dus naar alle waarschijnlijkheid met de muis gewerkt vanaf hun eerste serieuze aanrakingen met de computer. Ze zijn aan de muis gewend geraakt en neigen er in eerste instantie toe dat zo te houden. Volgens Ram & Sheth (1989) is één van de elementen die de acceptatie van nieuwe technieken of producten tegenhoudt de ‘tradition barrier’ die de kop opsteekt wanneer een nieuwe techniek vereist dat van een bestaande werkwijze moet worden afgeweken. Dit kan een reden zijn dat de usability van ooginteractie positief is beoordeeld, maar dat een grote groep voorlopig vasthoudt aan dat wat men gewend is. Deze houding was ook terug te vinden in de opmerkingen van proefpersonen zoals: “Ik vind de muis tot nu toe het meest natuurlijk, al heeft dat wellicht ook met gewenning te maken.” en “muisnavigatie is voor je gevoel op dit moment gewoner. Maar misschien verandert dit naar verloop van tijd, als je er meer mee moet werken.” De gemiddelde leeftijd van de proefpersonen plaatst bovendien vraagtekens bij het feit of zij wel in staat waren de learnability en memorability van de muis te beoordelen. Beide elementen werden voor de muis zeer goed gewaardeerd, respectievelijk met 6.7 en 6.86 (Tabel 1.1), maar konden de proefpersonen zich dit nog wel herinneren? Ze waren immers peuter of kleuter toen ze voor het eerst leerden werken met de muis. Volgens de onderzoeksliteratuur is de muis in eerste instantie helemaal niet makkelijk aan te leren. Nielsen (1993) zegt hierover: “Using a mouse is known to be hard for the first several hours, and it is almost impossible to use a mouse correctly the first few minutes.” p.177. Dit experiment laat zien dat dit probleem zich helemaal niet voordoet bij ooginteractiemethodes: na een zeer korte oefenperiode kon men meteen aan de slag. Naast de gewenning aan de muis en het al dan niet vergeten van een taaie leerperiode is er in het onderzoek sprake geweest van een aantal praktische limitaties dat wellicht van invloed is geweest op de waardering van de interactietechnieken.
40
4.3.3 Praktische limitaties Het feit dat de proefpersonen een helm met cameraatjes moesten dragen en stil moesten blijven zitten in hun stoel heeft ongetwijfeld niet bijgedragen aan de natuurlijkheid van de ervaring. Daar staat tegenover dat deze omstandigheden voor alle drie de condities gelijk waren, want ook bij de muisconditie werd de helm gedragen om de fixatiepatronen waar te nemen. Wat niet voor alle condities gold, was het feit dat selectiepogingen bij de oognavigatiecondities regelmatig door de proefpersonen moesten worden gecorrigeerd met hoofdbewegingen omdat de kwaliteit van de fixatieregistratie tijdens het voltooien van de opdrachten soms afnam (paragraaf 2.7). In de oognavigatiecondities was er dus geen sprake van een optimale situatie. Een andere beperking die werd geconstateerd bij de oognavigatie-condities werd gevormd door de positie van de verder-knop op het scherm. Deze stond onderaan het scherm en was vaak lastig te selecteren omdat de oogbewegingen daar minder goed werden geregistreerd dan in en rond het centrum van het scherm (paragraaf 2.1, Figuur 2.1). Het is echter moeilijk in te schatten in welke mate deze limitaties van invloed zijn geweest op de resultaten omdat hier niet expliciet vragen over zijn gesteld aan de proefpersonen na afloop van het experiment. 4.3.4 Snelheidsverschillen bij een realistische computertaak De verwachte snelheidsvoordelen (paragraaf 1.2.1) van de ooginteractie-technieken zijn niet naar voren gekomen in dit onderzoek. Wel bleek uit de analyse van de snelste tijden dat er geen verschil was tussen de scores van de oognavigatie zonder feedback en de muis, ze waren even snel. Bij de gemiddelde tijden over het geheel moet bovendien worden aangetekend dat met name de meting van de gemiddelde selectietijd ten nadele van ooginteractie is beïnvloed door de problemen die proefpersonen ondervonden bij het selecteren van de verder-knop (paragraaf 4.3.3). Daarnaast heerst de gedachte dat de snelheidsvoordelen voor de gemiddelde taaktijd minder evident zijn bij een realistische computertaak, waarbij het selecteren een secundaire rol speelt, dan bij een Fitts’ pointing task, waarbij het selecteren een primaire rol speelt (paragraaf 1.2.1). Dit komt omdat er veel meer moet worden gedaan dan het selecteren van objecten alleen. In dit onderzoek was het selecteren een secundaire taak, de proefpersoon was in de eerste plaats belast met cognitieve taken, zoals: begrijp ik deze politieke cartoon? Wat bedoelt de cartoonist? Wat heb ik geoordeeld bij de term ‘ironisch’? Heb ik wel overal iets ingevuld? De taak was derhalve ecologisch valide maar minder geschikt voor het meten van snelheidsverschillen. 4.3.5 Feedback in een ooginteractie-interface In paragraaf 1.4.1 werd uiteengezet dat de cursor waarschijnlijk zonder problemen kon worden weggelaten in de ooginteractie-interface, dat bleek ook zo te zijn. Alle proefpersonen konden na een zeer korte oefenperiode vrijwel moeiteloos de opdrachten voltooien met de beide ooginteractie-methodes. Door de proefpersonen werd bovendien geen enkele opmerking gemaakt over het ontbreken van de cursor. De gebruiker heeft bij ooginteractie de cursor dus niet per definitie nodig om succesvol objecten op het scherm te selecteren, terwijl de cursor bij de muis nagenoeg onmisbaar is (paragraaf 1.4.1). Ondanks de verwachtingen dat visuele feedback van beeldschermobjecten zou leiden tot een effectievere objectselectie en beter zou scoren op de gebruikerswaardering (paragraaf 1.4.1) is dit niet gebleken uit de resultaten. Op geen enkel usability-aspect werd een verschil gevonden tussen de beide oognavigatie-methodes. Het lijkt erop dat
41
de gebruiker dus niet per definitie bevestigd hoeft te krijgen welk object op het scherm zich in zijn vizier bevindt: waar men kijkt is waar men zich bevindt (paragraaf 1.4.1). Bij het aangeven van de algemene voorkeur zagen we echter een gelijke verdeling tussen de proefpersonen die oognavigatie met of oognavigatie zonder visuele feedback prefereerden. Ondanks het ontbreken van verschillen in de waardering van usability-aspecten lijkt de algemene voorkeur dus nogal gepolariseerd te zijn. Ook uit de commentaren van proefpersonen blijken duidelijke voorkeuren voor één van de beide technieken: “Soms ben je je niet helemaal bewust van waar je naar kijkt, de feedback is hiervoor handig” versus “Ik heb meer vertrouwen in de oognavigatie zonder feedback omdat ik deze als 'sneller' ervaar. Het 'wachten' op de feedback kostte alleen maar tijd en vond ik niet nodig.”. Hoe zit het met de usability-heuristieken over feedback? Volgens de heuristieken moet de gebruiker worden voorzien van feedback, zodat deze wordt geïnformeerd over het effect van de gegeven input (paragraaf 1.1.2). Bij de in dit onderzoek geteste interface lijkt deze vuistregel niet geheel op te gaan, althans niet op dezelfde wijze als bij de muis. Er kan immers prima worden geselecteerd zonder cursor en zelfs zonder feedback van beeldschermobjecten. Alleen na het selecteren van een object moet er visuele feedback worden gegeven, zodat de gebruiker weet dat het object is geselecteerd (paragraaf 2.1.1, Figuur 2.3). Toch kan niet worden gesteld dat de feedback-heuristiek niet geheel opgaat in deze situatie. De heuristieken zijn namelijk algemeen en ze zijn door hun bedenkers niet voorzien van concrete aanwijzingen over hoe vaak en op wat voor wijze de gebruiker moet worden voorzien van feedback. Blijkbaar is het in deze situatie voldoende om enkel na selectie een vorm van visuele feedback te produceren. Verder heeft de gebruiker in principe voldoende aan de wetenschap dat hij zich bevindt waar hij kijkt. De rest is een kwestie van persoonlijke voorkeur. Het relatief grote formaat van de beeldschermobjecten in dit onderzoek kan overigens van invloed zijn geweest op de resultaten. Het zou zo kunnen zijn dat bij veel kleinere objecten wel visuele feedback van het beeldschermobject benodigd is om succesvol te kunnen selecteren met de ogen. Dit punt is met name van belang omdat de buttons en icoontjes in de grafische weergave van huidige Windows-, MacIntosh- en Linux-systemen aanzienlijk kleiner zijn dan de beeldschermobjecten die in dit onderzoek zijn gebruikt. Bovendien zijn die objecten vaak aaneengesloten, terwijl in dit onderzoek de buttons relatief ver uit elkaar stonden. Mochten de nauwkeurigheidsgrenzen van oogselectie worden bereikt bij dit soort formaten, dan is er nog de optie van een ‘zoomfunctie’ waarbij de gebruiker een object dat zich in het vizier bevindt kan vergroten om het vervolgens makkelijker te kunnen selecteren (Bates, 1999). Bates onderzocht deze oplossing overigens in een interface waarin het vergroten van beeldschermobjecten in werking trad op basis van dwell-time (non-command), maar het zou ook kunnen door middel van een hardwareknop op een gamepad (command, paragraaf 1.3.1). 4.3.6 De toekomst van de ogen als input device Welk perspectief werpen de bevindingen van dit onderzoek nu op de toekomstkansen van de ogen als input device in computerinteractie? Op basis van dit onderzoek kan in ieder geval worden gesteld dat het prima mogelijk is om objecten te selecteren met een ooggestuurde, muis- en cursorloze computerinterface, zonder dat de objecten die zich in het vizier van de gebruiker bevinden telkens moeten worden voorzien van visuele feedback. Wanneer dit uitgangspunt wordt toegepast in combinatie met een hardware button of ‘command interface’ dan is er bovendien geen sprake van het Midas-touchprobleem (paragraaf 1.3.1). Zonder deze visuele feedback kan ook nog eens sneller
42
worden geselecteerd dan met de visuele feedback. Een sterke verdeling van persoonlijke voorkeuren leidt echter tot de aanbeveling dat deze vorm van feedback optioneel in een dergelijk systeem aanwezig moet zijn. De gebruiker moet kunnen kiezen. De algemene voorkeuren van de proefpersonen ten gunste van ooginteractie wijzen op een veelbelovende bereidheid om in de toekomst gebruik te gaan maken van de ogen als input device. Voordat een interactiemethode, zoals onderzocht in deze studie, kan worden toegepast in de huidige Windows-, MacIntosh- en Linux-systemen moet ondermeer worden getest met kleinere beeldschermobjecten. De buttons en icoontjes in de grafische weergave van deze besturingssystemen zijn immers aanzienlijk kleiner dan de beeldschermobjecten die in dit onderzoek zijn gebruikt (paragraaf 4.3.5). Tevens strekt het tot aanbeveling om de gebruikersperformance en gebruikerswaardering van dit type interfaces in meer verschillende realistische computertaken en -handelingen te onderzoeken. Het selecteren van buttons is slechts één handeling, maar ‘drag-and-drop’-handelingen zijn bijvoorbeeld ook mogelijk met dit ontwerp. Voor een reine snelheidsvergelijking moet echter worden teruggevallen op een Fitt’s pointing task (paragraaf 1.2.1 en 4.3.4). Inzicht verkrijgen in de snelheid van het systeem is van belang omdat de gebruiker een performance zal verwachten die niet onderdoet voor de muis. Belangrijker is wellicht hoe de gebruikerswaardering voor het systeem zal zijn wanneer op een meer natuurlijke wijze kan worden gewerkt met ooginteractie. Een moderne eye-tracker, zoals bijvoorbeeld die van de fabrikant Tobii (paragraaf 1.3.3), waarbij de calibratie zeer kort duurt, de camera’s zijn verwerkt in de randen van het beeldscherm en waarbij de gebruiker niet continu stil hoeft te zitten, maakt al veel beter een natuurlijke ervaring mogelijk dan vele andere bestaande eye-trackers. Voorlopig bevindt ooginteractie zich grotendeels in labomgevingen en zullen we het dus in het dagelijks leven met de muis moeten stellen, met alle lichamelijke ongemakken van dien (paragraaf 1.1.3). Het gebruik van de ogen als input device biedt echter een alternatief dat tot op heden goed wordt ontvangen door testgebruikers. De verwachting is dan ook dat de integratie van ooginteractietechnieken in entertainment toepassingen en wellicht ook in zakelijk PC-gebruik zich de komende jaren verder zal ontvouwen.
43
Literatuur Akamatsu, M., MacKenzie, S., Hasbrouc, T., (1995). A comparison of tactile, auditory and visual feedback in a pointing task using a mouse-type device. Ergonomics, 38, p. 816827. Bates, R. (1999). Multimodal Eye-Based Interaction for Zoomed Target Selection on a Standard Graphical User Interface. Human-Computer Interaction – INTERACT ’99 (Volume II). Cozijn, R. (2006). Het gebruik van oogbewegingen in leesonderzoek. Tijdschrift voor Taalbeheersing, 28(3), p. 220-232. Creyghton, E. (2005). Oogbewegingsondersteuning in muisnavigatie: het effect van oogbewegingen als ondersteuning van handbewegingen op de efficiëntie en waardering van muisnavigatie. Masterscriptie, Universiteit van Tilburg. Fitts, P.M. (1954). The information capacity of the human motor system in controlling the amplitude of movement. Journal of Experimental Psychology, 47, 6, p.381-391. Jacob, R.J.K. (1993). Eye movement-based human-computer interaction techniques: toward non-command interfaces. In: Hartson, H.R., Hix, D. (Eds.), Advances in humancomputer interaction, vol. 4, p.151-190, Norwood, N.J.: Ablex Publishing Co. Jacob, R.J.K., Karn, K.S. (2003). Eye Tracking in human-computer interaction and usability research: ready to deliver the promises (section commentary). In: Hyona, J., Radach, R., Deubel, H. (Eds.), In the mind’s eye: cognitive and applied aspects of eye movement research, p.573-605. Amsterdam: Elsevier. Keir, P. J., Bach, J. M. and Rempel, D. (1999). Effects of computer mouse design and task on carpal tunnel pressure, Ergonomics, 42, 10, 1350-1360. Khan, M.A., Lawrence, G., Fourkas, A., Franks, I.A., Elliot, D., Pembroke, S. (2003). Online versus offline processing of visual feedback in the control of movement amplitude. Acta Psychologica, 113, p.83-97. Kirakowski, J., Claridge, N., Whitehead, R. (1998). Human centred measures of succes in web site design, Proceedings Our Global Community, opgehaald op 13 juni 2007 van: http://zing.ncsl.nist.gov/hfweb/att4/proceedings/kirakowski/ Lankford, C. (2000). Effective eye-gaze input into Windows™. Eye-tracking Research and Application Symposium, gesponsord door ACM’s SIGCHI en SIGGRAPH, West Palm Beach, Florida, VS, November 2000. Lindgaard, G., Dudek, C. (2002). What is this evasive beast we call user satisfaction? Interacting with Computers, 15, p.429-452.
44
Monden, A., Matsumoto, K., Yamato, M. (2005). Evaluation of gaze-added target selection methods suitable for general GUIs. Int. J. Computer Applications in Technology, Vol. 24, No. 1, p. 17-23, Inderscience Enterprises Ltd. Nielsen, J. (1993). Usability Engineering. San Diego, VS, Academic Press. Nielsen, J., Molich, R. (1990). Heuristic evaluation of user interfaces. In: Carrasco, J., Whiteside, J. (Eds.), Proceedings of the ACM CHI 90 Human Factors in Computing Systems Conference 1990, p.249-256, Seattle, Washington, VS. Norman, D. (1988). The Design of Everyday Things. New York, VS, Basic Books. Ohno, T. (1998). Features of eye gaze interface for selection tasks. The Third Asia Pacific Computer Human Interaction –APCHI’98-, IEEE Computer Society, p. 176-182. Kanagawa, Japan. Phillips, J.G., Triggs, T.J. (2001). Characteristics of cursor trajectories controlled by the computer mouse. Ergonomics, vol. 44, no. 5, p.527-536. Rayner, K. (1998). Eye movements in reading and information processing: 20 years of research. In: Psychological Bulletin, 3 (124), p. 372-422. Ram, S., Sheth, J. N., 1989. Consumer resistance to innovations: The marketing problem and solution. Journal of Consumer Marketing, 6 (2): p. 5-14. Russel, M. (2005). Using eye-tracking data to understand first-impressions of a web site. Usability News, 7.1. In: Information Design Journal + Document Design, 13 (3), p. 255261. Salvucci, D.D., Anderson, J.R. (2000). Intelligent gaze-added interfaces. In: Human Factors in Computing Systems: CHI 2000 Conference Proceedings, p. 273-280. New York, VS, ACM Press. Shneiderman, B. (1992). Designing the user interface: strategies for effective human computer interaction. Reading, MA, VS, Addison –Wesley Publishing Company. Sibert, L.E., Jacob, R.J.K., Templeman, N. (2000). Evaluation and analysis of eye gaze interaction. In: Turner, T., Szwillus, G., Czerwinski, M., Peterno, F., Pemberton, S. (Eds.), Proceedings of the ACM CHI 2000 Human Factors in Computing Systems Conference, p.281-288, Den Haag. Smith, J.D., Graham, T.C.N. (2006). Use of eye movements for video game control. In: ACE ‘06: Proceedings of the 2006 ACM SIGCHI International conference on Advances in computer entertainment technology, p.20, New York, VS, ACM Press. Veiersted, K.B., Nordberg, T., Waersted, M. (2006). A critical review of evidence for a causal relationship between computer work and musculoskeletal disorders with physical findings of the neck and upper extremity. National Institute of Occupational Health, Oslo, Noorwegen.
45
Yamato, M., Monden, A., Matsumoto, K., Inoue, K., Torii, K. (2000). Button selection for general GUIs using eye and hand together. The 5th Interantional Working Conference on Advanced Visual Interfaces (AVI 2000). New York, VS, ACM Press. Zhai, S., Morimoto, C., Ihde, C. (1999). Manual and gaze input cascaded (MAGIC) pointing. In: Proceedings of the ACM SIGGHI Conference on Human Factors in Computing Systems (CHI ’99), p.246-253. New York, VS, ACM Press.
46
Bijlage 1 Overzicht van alle afbeeldingen per serie, de toegewezen termen en de kans per term dat deze met een ja of met een nee zou worden beoordeeld (paragraaf 2.2.1) BIJLAGE 1.1 SERIE 1: Advertenties In de materiaaltest werd door de proefpersonen aangegeven welke van de volgende 15 termen zij van toepassing vonden op de advertenties: stijlvol, levendig, vrolijk, modern, origineel, elegant, saai, grappig, overtuigend, mooi, ouderwets, spannend, stoer, romantisch en lelijk. Per term moest gekozen worden tussen ja of nee. Op basis van de beoordelingen kon de kans worden berekend dat in het experiment een term bij een bepaalde afbeelding met een ja of een nee zou worden beoordeeld. Teneinde een gebalanceerde verdeling van ja’s en nee’s te krijgen werden per afbeelding uit de vijftien beoordeelde termen vijf termen gekozen die een nagenoeg gelijke verdeling van ja- en nee-antwoorden gaf (in totaal over alle series iets meer ja’s dan nee’s: 115x nee en 135x ja). Op deze pagina staat een overzicht van alle advertenties met de daarbij gebruikte termen en de scores op ja of nee (uitgedrukt in waardes lopend van 0 tot 1). De eerste advertentie (amstel.gif) werd bijvoorbeeld door alle proefpersonen (1 = 100%) als 'levendig' beoordeeld (ja; 1) en door 90% (nee; 0,9) als niet 'stoer', et cetera. [amstel.gif];
levendig (ja; 1) vrolijk (ja; 0,95) modern (nee; 0,62) spannend (nee; 0,9) stoer (nee; 0,9)
[contrex.gif];
mooi (ja; 0,81) spannend (nee; 0,9) stoer (nee; 0,95) stijlvol (ja; 0,95) modern (ja; 0,76)
[rover.gif];
lelijk (nee; 0,9) grappig (ja; 0,81) saai (nee; 1) origineel (ja; 1) levendig (ja; 0,71)
[antirook.gif];
modern (ja; 0,5) origineel (ja; 0,9) grappig (nee; 0,76) overtuigend (ja; 0,66) mooi (nee; 0,76)
[dunkin.gif];
[motorola.gif];
modern (ja; 0,9) origineel (ja; 0,86) saai (nee; 0,86) overtuigend (nee; 0,52) stoer (nee; 0,86)
origineel (ja; 0,76) modern (ja; 0,91) spannend (nee; 0,9) romantisch (nee; 1) stijlvol (ja; 0,66)
[marlboro.gif];
[zalm.gif];
stijlvol (nee; 0,57) elegant (nee; 0,71) grappig (nee; 0,95) ouderwets (ja; 0,95) stoer (ja; 0,81) [chenet.gif];
stijlvol (ja; 0,52) vrolijk (ja; 0,52) origineel (nee; 0,52) elegant (nee; 0,57) lelijk (nee; 0,62) [extran2.gif];
levendig (nee; 0,67) vrolijk (ja; 0,62) modern (nee; 0,57) saai (ja; 0,62) ouderwets (nee; 0,62)
overtuigend (ja; 0,52) origineel (ja; 0,76) stijlvol (nee; 0,62) grappig (ja; 0,52) mooi (nee; 0,62)
[unoxvogels.gif];
levendig (ja; 0,76) spannend (nee; 1) mooi (ja; 0,86) origineel (ja; 0,95) lelijk (nee; 0,9) [vanille2.gif];
grappig (ja; 0,57) ouderwets (nee; 0,81) stijlvol (ja; 0,67) levendig (nee; 0,9) origineel (ja; 0,95)
[monroe.gif];
vrolijk (ja; 0,81) modern (nee; 1) stijlvol (ja; 0,86) elegant (ja; 0,86) lelijk (nee; 0,9) [snake.gif];
saai (nee; 0,9) origineel (ja; 0,9) levendig (ja; 0,71) romantisch (nee; 1) stijlvol (ja; 0,76) [volkswagen.gif];
grappig (nee; 1) modern (ja; 0,86) vrolijk (nee; 0,9) stijlvol (ja; 0,86) elegant (ja; 0,76) [zalm2.gif];
mooi (nee; 0,62) modern (nee; 0,52) grappig (ja; 0,52) origineel (ja; 0,76) stijlvol (nee; 0,71)
47
BIJLAGE 1.2 SERIE 2: Politieke cartoons In de materiaaltest werd door de proefpersonen aangegeven welke van de volgende 15 termen zij van toepassing vonden op de politieke cartoons: ironisch, cynisch, grof, serieus, zwartgallig, confronterend, hilarisch, provocerend, luchtig, grappig, pessimistisch, shockerend, vrolijk, subtiel, sarcastisch. Per term moest worden gekozen tussen ja of nee. Op basis van de beoordelingen kon de kans worden berekend dat in het experiment een term bij een bepaalde afbeelding met een ja of een nee zou worden beoordeeld. Teneinde een gebalanceerde verdeling van ja’s en nee’s te krijgen werden per afbeelding uit de vijftien beoordeelde termen vijf termen gekozen die een nagenoeg gelijke verdeling van ja- en neeantwoorden gaf. Op deze pagina staat een overzicht van alle advertenties met de daarbij gebruikte termen en de scores op ja of nee (uitgedrukt in waardes lopend van 0 tot 1). De eerste cartoon (passion.gif) werd bijvoorbeeld door 67% als 'ironisch' beoordeeld (ja; 0,67) en door 62% als niet 'provocerend' beoordeeld (nee; 0,62), et cetera. passion.gif
tsunami.gif
ironisch (ja; 0,67) provocerend (nee; 0,62) grappig (ja; 0,58) subtiel (nee; 0,57) sarcastisch (ja; 0,57) proefballonnetje.gif
grof (nee; 0,67) confronterend (nee; 0,58) sarcastisch (nee; 0,62) zwartgallig (nee; 0,67) serieus (nee; 0,58) tsunami2.gif
zwartgallig (nee; 0,92) grappig (ja; 0,92) vrolijk (ja; 0,71) shockerend (nee; 0,87) ironisch (ja; 0,79) rice.gif
shockerend (ja; 0,54) subtiel (nee; 0,92) confronterend (ja; 0,71) serieus (ja; 0,67) pessimistisch (nee; 0,5) verbaal.gif
luchtig (ja; 0,67) subtiel (ja; 0,58) cynisch (nee; 0,83) grappig (nee; 0,5) vrolijk (ja; 0,58) wereldhandel.gif
hilarisch (nee; 0,84) ironisch (ja; 0,5) grof (ja; 0,87) cynisch (ja; 0,87) vrolijk (nee; 0,92)
provocerend (ja; 0,71) luchtig (nee; 0,67) confronterend (ja; 0,67) cynisch (ja; 0,79) subtiel (nee; 0,83)
terrorist.gif
verdonk.gif
grappig (nee; 0,71) confronterend (ja; 0,79) hilarisch (nee; 1) grof (ja; 0,75) cynisch (ja; 0,75) aids2.gif
cynisch (ja; 0,71) sarcastisch (ja; 0,92) grappig (ja; 0,71) pessimistisch (nee; 0,83) shockerend (nee; 0,92)
pessimistisch (ja; 0,54) luchtig (nee; 1) confronterend (ja; 0,88) serieus (ja; 0,75) ironisch (nee; 0,67)
pessimistisch (nee; 0,87) subtiel (ja; 0,75) ironisch (ja; 0,71) grappig (ja; 0,71) shockerend (nee; 0,92)
verdonk2.gif
ajax.gif
serieus (ja; 0,63) vrolijk (nee; 0,75) sarcastisch (ja; 0,75) shockerend (nee; 0,92) grappig (ja; 0,79)
vrolijk (nee; 0,83) luchtig (nee; 0,79) provocerend (ja; 0,67) grof (ja; 0,83) cynisch (ja; 0,79)
voetbal.gif
balksaai.gif
provocerend (nee; 0,71) luchtig (ja; 0,83) shockerend (nee; 1) grappig (ja; 0,71) ironisch (ja; 0,75) bloodoil.gif
serieus (ja; 0,71) cynisch (ja; 0,96) hilarisch (nee; 0,75) vrolijk (nee; 0,87) provocerend (ja; 0,54) bush.gif
sarcastisch (ja; 0,71) pessimistisch (nee; 0,79) cynisch (ja; 0,67) confronterend (nee; 0,79) ironisch (ja; 0,71)
48
BIJLAGE 1.2 SERIE 3: Politieke cartoons In de materiaaltest werd door de proefpersonen aangegeven welke van de volgende 15 termen zij van toepassing vonden op de politieke cartoons: ironisch, cynisch, grof, serieus, zwartgallig, confronterend, hilarisch, provocerend, luchtig, grappig, pessimistisch, shockerend, vrolijk, subtiel, sarcastisch. Per term moest worden gekozen tussen ja of nee. Op basis van de beoordelingen kon de kans worden berekend dat in het experiment een term bij een bepaalde afbeelding met een ja of een nee zou worden beoordeeld. Teneinde een gebalanceerde verdeling van ja’s en nee’s te krijgen werden per afbeelding uit de vijftien beoordeelde termen vijf termen gekozen die een nagenoeg gelijke verdeling van ja- en neeantwoorden gaf. Op deze pagina staat een overzicht van alle advertenties met de daarbij gebruikte termen en de scores op ja of nee (uitgedrukt in waardes lopend van 0 tot 1). De eerste cartoon (bush3.gif) werd bijvoorbeeld door 75% als niet 'vrolijk' beoordeeld (nee; 0,75) en door 54% als 'grappig' beoordeeld (ja; 0,54), et cetera.
bush3.bmp
celibaat.gif
vrolijk (nee; 0,75) grappig (ja; 0,54) hilarisch (nee; 0,83) cynisch (ja; 0,83) ironisch (ja; 0,71)
grof (nee; 0,75) subtiel (ja; 0,54) cynisch (ja; 0,75) luchtig (ja; 0,54) ironisch (ja; 0,63)
bush4.gif
donner.gif
hilarisch (nee; 0,58) ironisch (ja; 0,63) shockerend (nee; 0,96) luchtig (ja; 0,71) sarcastisch (ja; 0,71) bushenbin.gif
vrolijk (nee; 0,54) zwartgallig (nee; 0,75) grof (nee; 0,92) cynisch (ja; 0,83) sarcastisch (ja; 0,79) bushsaddam.gif
sarcastisch (nee; 0,54) grappig (ja; 0,54) cynisch (ja; 0,5) ironisch (ja; 0,58) luchtig (nee; 0,54)
grappig (ja; 0,67) cynisch (ja; 0,75) grof (nee; 0,83) ironisch (ja; 0,67) serieus (nee; 0,79) genocide.gif
vrolijk (nee; 0,96) cynisch (ja; 0,88) confronterend (ja; 0,88) subtiel (nee; 0,96) sarcastisch (ja; 0,75) hezbollah.gif
cynisch (ja; 0,79) grappig (ja; 0,63) shockerend (nee; 0,87) vrolijk (nee; 0,75) sarcastisch (ja; 0,67)
iraq3.gif
kim.gif
ironisch (nee; 0,67) serieus (ja; 0,67) zwartgallig (ja; 0,67) luchtig (nee; 0,87) pessimistisch (ja; 0,67)
luchtig (nee; 0,62) subtiel (nee; 0,79) provocerend (ja; 0,58) cynisch (ja; 0,71) sarcastisch (ja; 0,63) kim2.gif
iraqcivil.gif
luchtig (nee; 0,87) serieus (ja; 0,63) grof (ja; 0,83) cynisch (ja; 0,88) grappig (nee; 0,87)
serieus (ja; 0,58) luchtig (nee; 0,75) pessimistisch (nee; 0,5) confronterend (ja; 0,54) cynisch (ja; 0,63)
iraqprison.gif
kyoto.gif
grof (ja; 0,88) confronterend (ja; 0,79) luchtig (nee; 0,96) vrolijk (nee; 1) provocerend (ja; 0,88)
sarcastisch (ja; 0,58) cynisch (ja; 0,79) grappig (nee; 0,62) luchtig (nee; 0,83) serieus (ja; 0,58)
kenniseconomie.gif
iraq.gif
grof (nee; 0,92) sarcastisch (ja; 0,75) shockerend (nee; 0,96) luchtig (ja; 0,75) ironisch (ja; 0,79)
cynisch (ja; 0,67) zwartgallig (ja; 0,79) vrolijk (nee; 0,92) pessimistisch (ja; 0,54) provocerend (nee; 0,62)
49
Bijlage 2 Instructie voorgelezen door de proefleider voorafgaand aan de proef (paragraaf 2.8)
In dit experiment doen we onderzoek naar meningen over politieke cartoons en commerciële advertenties. Bij de vragen die je daarover gaat beantwoorden werk je met (drie) verschillende interactietechnieken. In het experiment wordt gebruik gemaakt van oogbewegingregistratie. In deze opstelling kunnen oogbewegingen worden geregistreerd tijdens het werken achter de computer. Daarvoor moet een helm met cameraatjes op jouw ogen worden ingesteld. Het instellen bestaat uit twee stappen: de helm moet worden geplaatst en afgesteld en vervolgens moet het apparaat worden gecalibreerd. Calibratie is een procedure waarmee de computer precies vaststelt waar je naar kijkt. Om te calibreren wordt een scherm gebruikt waarop negen punten te zien zijn. Elk punt is een kleine zwarte cirkel. De calibratie begint met een cirkel midden op het scherm. Zodra je strak naar het midden van deze cirkel kijkt, druk je op de enter-knop van het toetsenbord. Vervolgens worden de negen punten één voor één op het scherm getoond. De bedoeling daarbij is dat je telkens strak naar het midden van de punt kijkt. Als je naar een punt kijkt zal deze automatisch verdwijnen en zal het volgende punt verschijnen. Zo loop je door alle negen punten heen. Je moet tijdens de calibratie stil blijven zitten en ook niet met je hoofd bewegen. Na de calibratie moet je even wachten zodat ik kan zien of het gelukt is. In het geval dat de calibratie mislukt is, wordt deze opnieuw gedaan, net zolang totdat het goed gaat. Het is heel belangrijk dat je telkens strak naar het midden van elk punt kijkt, dat je niet met je hoofd beweegt en dat je niet met je ogen knippert. In het begin, wanneer de zwarte cirkel in het midden van het scherm staat, mag je nog wel knipperen, Zodra je niet meer hoeft te knipperen, kijk je strak naar het midden van deze cirkel en druk je op de enter-knop op je toetsenbord. Na de calibratie volgt de validatie. De validatie controleert of de calibratie goed is gegaan en verloopt op precies dezelfde manier als de calibratie. Heb je hier vragen over? Nadat alles goed is ingesteld, kan het experiment beginnen. Het experiment bestaat uit drie series van plaatjes: eerst een serie advertenties en daarna twee series met politieke cartoons. Het is de bedoeling dat je elk plaatje goed bestudeert en vervolgens beoordeelt op vijf termen. Het plaatje staat altijd links en de vijf termen staan altijd rechts. Onder elke term staan twee knoppen: een knop met 'Ja' en een knop met 'Nee'. Aan jou is het om bij elke term te beoordelen of hij van toepassing is op het plaatje. Als jij vindt dat de term van toepassing is, dan selecteer je de knop 'Ja'; als je vindt dat de term niet van toepassing is, dan selecteer je de knop 'Nee'. Neem rustig de tijd om je oordeel te vormen. Je mag ook op eerdere oordelen terugkomen. Dus je mag van een 'Ja een 'Nee' maken en andersom. Belangrijk is dat je goed over je oordeel nadenkt. Als je alle termen beoordeeld hebt, selecteer je op de knop 'Verder' en dan verschijnt het volgende plaatje. Als je de eerste serie van vragen hebt beantwoord, volgt er een grijs scherm. Dan moet je mij laten weten dat je klaar bent met de serie. Je kunt dan even ontspannen, maar de helm moet wel opblijven. Ik ga je dan opnieuw cailibreren en valideren voor de volgende serie van vragen.
50
Tijdens elke serie wordt een andere interactiemethode gebruikt. Je zult gaan werken met de muis en met twee methodes die gebaseerd zijn op je oogbewegingen. De muismethode ken je natuurlijk maar de twee oogbewegingsmethodes niet. Bij deze twee methodes stuur je de beeldschermcursor aan met je ogen zonder dat je de cursor ziet en maak je selecties met behulp de knoppen op een gamepad. Dit is de gamepad (laten zien) en deze twee knoppen kun je gebruiken. Het maakt niet uit of je de linker- of de rechterknop gebruikt. Voordat een serie start krijg je op je scherm uitleg over hoe de methode precies werkt. Vervolgens krijg je een oefenpagina om aan de interactiemethode te wennen. Een oefenpagina ziet er precies hetzelfde uit als de andere pagina's in het experiment, en bevat dus ook een plaatje en vijf termen. Het is belangrijk dat je goed met de interactiemethode oefent door vaak de Ja/Nee knoppen te selecteren. Als je het gevoel hebt dat je de methode doorhebt, klik je op de knop START en begin je met de sessie. Is dit duidelijk? Heb je hier vragen over? Na het beoordelingsgedeelte moet je nog een vragenlijstje invullen. Dat gebeurt zonder oogbewegingsregistratie, de helm mag dan dus af. Kortom: −
− − − −
Je krijgt drie sessies met plaatjes te zien. Elk plaatje moet je beoordelen op vijf termen. Bekijk het plaatje goed en geef je oordelen door 'Ja' of 'Nee' te selecteren onder de termen. Neem daarvoor de tijd. Als je alle termen hebt beoordeeld, selecteer je de knop 'Verder' om naar het volgende plaatje te gaan. Elke serie start met een uitleg over de te gebruiken interactiemethode gevolgd door een oefenpagina waarop je de interactiemethode kunt oefenen. Druk pas op START als je je comfortabel voelt met de methode. Na afloop van een sessie verschijnt er een grijs scherm. Dan moet je mij laten weten dat je klaar bent met die serie. Vervolgens calibreer ik je voor de volgende serie. Probeer tijdens het experiment zo min mogelijk je lichaam en je hoofd te bewegen. Concentreer je alleen op het beoordelen van de plaatjes, let dus niet op mij of op de helm. Tijdens een sessie mag je geen vragen meer stellen.
Als alles duidelijk is, zullen we nu de apparatuur instellen. Ga goed rechtop voor het beeldscherm zitten. (armen ontspannen op de armleuningen, onderrug rechtop tegen de leuning, benen niet over elkaar) Veel succes!
51
Bijlage 3 Instructie voorafgaand aan de series (paragraaf 2.8)
3.1 Voorafgaand aan de serie muisnavigatie verscheen de onderstaande tekst in beeld. De proefpersoon moest deze tekst zelf doorlezen, maar mocht wel vragen stellen aan de proefleider. Zo dadelijk krijg je eerst een oefenpagina en daarna een serie van 16 vragen. De buttons bij de vragen kun je met de muis aanklikken. Via de eye-tracker proberen we nauwkeurig te registreren waar je naar kijkt. Probeer daarom stil en rechtop in de stoel te blijven zitten en je hoofd zo min mogelijk te bewegen. Knipperen met de ogen mag wel. Probeer de procedure zometeen uit tot je denkt dat je het onder de knie hebt. 3.2 Voorafgaand aan de serie oognavigatie zonder feedback verscheen de onderstaande tekst in beeld. De proefpersoon moest deze tekst zelf doorlezen, maar mocht wel vragen stellen aan de proefleider. Zo dadelijk krijg je eerst een oefenpagina en daarna een serie van 16 vragen. De ja- en nee-buttons die je moet gaan selecteren kun je met je ogen selecteren. Als je naar een button kijkt verandert er in het beeld niets, maar de computer weet dat je naar die button kijkt. Een button die je in het vizier hebt, kun je selecteren door op één van de gamepadknoppen te drukken die onder je wijsvingers (links of rechts) liggen. Dus: kijken naar de button en drukken met je wijsvinger op de gamepadknop. Als de computer niet meteen reageert, kun je dat herstellen door lichtjes met je hoofd omhoog of omlaag te bewegen. Via de eye-tracker proberen we nauwkeurig te registreren waar je kijkt. Probeer daarom stil en rechtop in de stoel te blijven zitten en je hoofd zo min mogelijk te bewegen. Knipperen met de ogen mag wel. Probeer de procedure zometeen uit op de oefenpagina tot je denkt dat je hem onder de knie hebt. 3.3 Voorafgaand aan de serie oognavigatie met feedback verscheen de onderstaande tekst in beeld. De proefpersoon moest deze tekst zelf doorlezen, maar mocht wel vragen stellen aan de proefleider. Zo dadelijk krijg je eerst een oefenpagina en daarna een serie van 16 vragen. De buttons bij de vragen kun je met je ogen selecteren. Als je naar een button kijkt, verschijnt er een stippellijntje om de button om aan te geven dat je hem in het vizier hebt. Een button die je in het vizier hebt, kun je selecteren door op één van de gamepadknoppen te drukken die onder je wijsvingers (links of rechts) liggen. Dus: kijken naar de button, stippelijntje verschijnt, drukken met je wijsvinger op de gamepadknop. Als de computer niet meteen reageert, kun je dat herstellen door lichtjes met je hoofd omhoog of omlaag te bewegen. Via de eye-tracker proberen we nauwkeurig te registreren waar je naar kijkt. Probeer daarom stil en rechtop in de stoel te blijven zitten en je hoofd zo min mogelijk te bewegen. Knipperen met de ogen mag wel. Probeer de procedure zometeen uit tot je denkt dat je het onder de knie hebt.
52
Bijlage 4 Oefenpagina voorafgaand aan de series (paragraaf 2.8) Deze oefenpagina werd gebruikt voorafgaand aan de eerste serie (advertenties), de oefenpagina´s van de tweede en derde serie zagen er hetzelfde uit. Alleen de afbeelding was anders (politieke cartoons).
53
Bijlage 5 Instructiepagina vragenlijst (paragraaf 2.8)
Voorafgaand aan de vragenlijst kreeg de proefpersoon de volgende tekst in beeld (bij de proefpersonen met lijst 1): Je hebt zojuist verschillende cartoons en advertenties beoordeeld en daarbij op drie verschillende manieren de computer bediend: eerst met de muis, daarna met je ogen zonder visuele feedback (geen stippellijntje om button) en ten slotte met je ogen met visuele feedback (stippellijntje om button). We willen graag weten wat je van deze methodes vindt. Hierna volgen 20 vragen die je telkens moet beantwoorden voor elk van de drie methodes. Voor je antwoorden over de muistmethode moet je soms wat dieper in je geheugen graven, want die gaan over de tijd dat je daar voor het eerst mee ging werken. Geef je oordelen telkens aan op een schaal van 1 tot 7, die loopt van ´geheel mee oneens´ tot ´geheel mee eens´. Tot slot stellen we je nog een aantal algemene vragen, waarbij je eventueel opmerkingen kunt plaatsen over de methodes en over het experiment. Als je klaar bent om te beginnen, klik dan op ´Verder´. Alvast bedankt en veel succes! (Verder button)
De instructie voor de andere lijsten was hetzelfde, behalve de volgorde van de condities in de eerste alinea.
54