FACULTEIT WETENSCHAPPEN
Opleiding Geografie en Geomatica Master in de Geomatica en Landmeetkunde
Vergelijken van papieren en digitale topografische kaarten aan de hand van eye tracking
Annelies Incoul
Aantal woorden in tekst: 18 653
Academiejaar 2012 – 2013 Masterproef ingediend tot het
Promotor : Prof. Dr. Ph. De Maeyer, Vakgroep Geografie Begeleidster: Dr. Kristien Ooms
behalen van de graad van Master in de Geomatica en Landmeetkunde
WOORD VOORAF Met dit voorwoord leg ik niet enkel de laatste hand aan mijn masterproef, maar beëindig ik ook mijn studententijd aan Universiteit Gent. Hierbij kijk ik terug naar vijf mooie jaren waarin ik me kon verdiepen in de landmeetkunde en de geografie. In deze periode heb ik ook vele mooie momenten beleefd samen met de medestudenten, die ondertussen goede vrienden zijn geworden. De herinneringen zal ik blijven bewaren. Graag wil ik van dit voorwoord gebruik maken om iedereen te danken die me heeft geholpen deze studie tot een goed einde te brengen. Langs deze weg wil ik mijn promotor Prof. Dr. Philippe De Maeyer bedanken die me de kans gaf dit onderwerp te behandelen en deze thesis te verwezenlijken. Dr. Kristien Ooms wil ik graag danken voor haar hulp bij het starten van mijn onderzoek. Ook wil ik haar bedanken voor haar paraatheid bij al mijn vragen en voor het deels nalezen van mijn masterproef. Tenslotte dank ik de personen waarvan ik persoonlijk het meeste steun heb ontvangen. Zo wil ik graag mijn vriend Nico bedanken voor zijn geduld en toeverlaat tijdens mijn onderzoek. Ik wil hem ook bedanken voor het nalezen van mijn thesis. Ook wil ik mijn ouders danken voor hun motivatie en luisterend oor tijdens het verwezenlijken van mijn masterproef. Ik dank ook mijn broer en schoonzus voor het nalezen van deze thesis. Verder wil ik ook mijn vrienden en mijn zus bedanken die me de nodige ontspanning en afleiding gaven tijdens mijn onderzoek. Annelies Incoul, 17 augustus 2013
II
INHOUDSOPGAVE WOORD VOORAF .................................................................................................................. II INHOUDSOPGAVE ................................................................................................................ III FIGUREN.................................................................................................................................. V TABELLEN ............................................................................................................................VII BIJLAGEN ............................................................................................................................ VIII 1. INLEIDING ....................................................................................................................... 1 1.1 Achtergrond: papier versus digitaal ............................................................................. 1 1.2 Onderzoek .................................................................................................................... 3 2. EYE TRACKING .............................................................................................................. 6 2.1.1 Algemeen ............................................................................................................. 6 2.1.2 Het oog ................................................................................................................. 6 2.1.2.1 Het zicht ........................................................................................................ 6 2.1.2.2 Anatomie van het oog ................................................................................... 7 2.1.2.3 Oogbewegingen ............................................................................................ 8 2.1.3 Uitvoering............................................................................................................. 9 3. MATERIALEN, METHODEN EN DATA ..................................................................... 12 3.1 Materialen .................................................................................................................. 12 3.1.1 Hardware ............................................................................................................ 12 3.1.2 Software ............................................................................................................. 14 3.1.3 Testpersonen ....................................................................................................... 15 3.1.4 Topografische kaarten ........................................................................................ 16 3.1.5 Vragenlijst .......................................................................................................... 20 3.2 Methoden en data....................................................................................................... 20 3.2.1 Opstelling ........................................................................................................... 20 3.2.2 Dataverwerving .................................................................................................. 22 3.2.3 OGAMA ............................................................................................................. 25 3.2.4 Fixatieberekening ............................................................................................... 25 3.2.5 Dataselectie ........................................................................................................ 26 3.2.5.1 Nauwkeurigheden ....................................................................................... 26 3.2.5.2 Tracking ratio .............................................................................................. 28 3.2.5.3 Locaties van de fixaties ............................................................................... 30 3.2.5.4 Geselecteerde data....................................................................................... 32 3.2.6 Visuele analyse ................................................................................................... 33 3.2.6.1 Heatmaps ..................................................................................................... 33 3.2.6.2 Fixatiedistributie ......................................................................................... 36 3.2.7 Beschrijvende analyse ........................................................................................ 37 3.2.8 Statistische analyse ............................................................................................. 38 4. RESULTATEN ................................................................................................................ 41 4.1 Visuele analyse .......................................................................................................... 41 4.1.1 Heatmaps ............................................................................................................ 41 4.1.2 Fixatiedistributie................................................................................................. 43
III
4.1.2.1 Aantal fixaties ............................................................................................. 43 4.1.2.2 Totale fixatieduur ........................................................................................ 47 4.2 Beschrijvende en statistische analyse ........................................................................ 51 4.2.1 Gemiddelde zoektijd .......................................................................................... 51 4.2.2 Gemiddelde fixatieduur ...................................................................................... 54 4.2.3 Gemiddelde fixatieaantal per seconde................................................................ 56 5. DISCUSSIE ...................................................................................................................... 58 5.1 Dataselectie ................................................................................................................ 58 5.2 Visuele analyse .......................................................................................................... 59 5.2.1 Heatmaps ............................................................................................................ 59 5.2.2 Fixatiedistributie................................................................................................. 60 5.3 Beschrijvende en statistische analyse ........................................................................ 61 5.3.1 Gemiddelde zoektijd .......................................................................................... 61 5.3.2 Gemiddelde fixatieduur ...................................................................................... 62 5.3.3 Gemiddelde fixatieaantal per seconde................................................................ 63 6. BESLUIT ......................................................................................................................... 64 7. REFERENTIELIJST ........................................................................................................ 65 7.1 Literatuur ................................................................................................................... 65 7.2 Internetbronnen .......................................................................................................... 68 8. BIJLAGEN ....................................................................................................................... 69
IV
FIGUREN Figuur 1: De anatomie van het oog (Bron: Hendee & Wells, 1997)……………………...
8
Figuur 2: De hoornvliesweerspiegeling en de opgelichte pupil in het infrarood camerabeeld (Bron: Poole & Ball, 2006)………………………………………………… 11 Figuur 3: Eye tracking toestel …………………………………………………………….
13
Figuur 4: Schema met gehanteerde software……………………………………………...
15
Figuur 5: Nummering Belgische topografische kaarten op schaal 1 : 50 000…………….
18
Figuur 6: Hiërarchische nummering Belgische topografische kaarten…………………… 18 Figuur 7: Instellingen stand alone positie……………………………………………….
21
Figuur 8: Opstelling eye tracker…………………………………………………………..
21
Figuur 9: Tv-scherm met afgebeelde kaart en linksonder de toponiemen........................... 24 Figuur 10: Aanhef tekstbestand van testpersoon P09 met ruwe data…………………….
24
Figuur 11: Effect van de standaarddeviatie op het televisiescherm………………………. 28 Figuur 12: Display modus met weergave van fixaties en saccades bij een interval van 0 tot 26 s voor testpersoon P01 en topografische kaart ‘Assesse’………………………….
29
Figuur 13: Fixaties weergegeven als punten en in een heatmap voor papieren kaart Ciney van testpersoon P31………………………………………………………………... 32 Figuur 14: Fixaties weergegeven als punten en in een heatmap voor papieren kaart Onhaye van testpersoon P16……………………………………………………………… 32 Figuur 15: Fixatie-intensiteiten van testpersoon P01 voor de eerste stimulus voorgesteld in verkeerslichtgradiënt (links), ‘zwart masker’ (midden) en eenkleurige schaal (rechts).. 35 Figuur 16: Grid van 35 x 22 cellen geplaatst op het kaartbeeld van kaart 1 (Assesse)…...
36
Figuur 17: Uitvergroting gradiëntschaal heatmaps……………………………………….
41
Figuur 18: Heatmaps voor de papieren stimuli (van links naar rechts en van boven naar onder: respectievelijk topografische kaart 1 tot en met 6)………………………………..
42
Figuur 19: Heatmaps voor de digitale stimuli (van links naar rechts en van boven naar onder: respectievelijk topografische kaart 1 tot en met 6)………………………………..
42
Figuur 20: Graduele schaal voor het grid dat het aantal fixaties voorstelt……………….
43
Figuur 21: Het aantal fixaties voorgesteld in een grid voor het papieren (linker kolom) en digitale (rechterkolom) formaat van stimulus 1 tot en met 6 (van boven naar onder)… 45 Figuur 22: 3D grafiek van aantal fixaties voor papieren en digitale stimulus 1 en 2……..
46
Figuur 23: 3D grafiek van aantal fixaties voor papieren en digitale stimulus 3 en 4……..
47
V
Figuur 24: 3D grafiek van aantal fixaties voor papieren en digitale stimulus 5 en 6……..
47
Figuur 25: Graduele schaal voor het grid dat de totale fixatieduur (ms)…………….…… 48 Figuur 26: De totale fixatieduur (ms) voorgesteld in een grid voor het papieren (linker kolom) en digitale (rechterkolom) formaat van stimulus 1 tot en met 6 (van boven naar onder)……………………………………………………………………………………..
49
Figuur 27: 3D grafiek van totale fixatieduur voor papieren en digitale stimulus 1 en 2…
50
Figuur 28: 3D grafiek van totale fixatieduur voor papieren en digitale stimulus 3 en 4…
51
Figuur 29: 3D grafiek van totale fixatieduur voor papieren en digitale stimulus 5 en 6…
51
Figuur 30: Gemiddelde waarden van de zoektijd (in s)…………………………………... 53 Figuur 31: Gemiddelde waarden van de fixatieduur (in ms)……………………………...
55
Figuur 32: Gemiddelde waarden van het aantal fixaties per seconde (1/s)……………….
57
VI
TABELLEN Tabel 1: Specificaties van RED ………………………………………………………......
13
Tabel 2: Specificaties van televisiescherm……………………………………………......
13
Tabel 3 : Volgorde van de kaarten met hun formaat voorgesteld per groep……………..
23
Tabel 4: Standaarddeviatie (x en y) en tracking ratio per testpersoon…….………...........
27
Tabel 5: Uitgevoerde translaties (pixels) voor testpersonen startend met digitale kaart…
31
Tabel 6: Uitgevoerde translaties (pixels) voor testpersonen startend met papieren kaart...
31
Tabel 7: Gebruikte gegevens testpersonen startend met digitale kaart…………………… 33 Tabel 8: Gebruikte gegevens testpersonen startend met papieren kaart…………………..
33
Tabel 9: Frequent gebruikte statistische toetsen ………………………………………….
39
Tabel 10 : Maximum aantal fixaties voor alle stimuli…………………………………….
44
Tabel 11 : Maximale fixatieduur (ms) voor alle stimuli…………………………………..
48
Tabel 12 : Gemiddelde waarden en standaarddeviaties (in s) van de zoektijd……………
52
Tabel 13: Gemiddelde waarden en standaarddeviaties (in ms) van de fixatieduur………
54
Tabel 14: Gemiddelde waarden en standaarddeviaties van het aantal fixaties per seconde 56
VII
BIJLAGEN Bijlage 1: Kaartbeelden van de gebruikte topografische kaarten met oorspronkelijke schaal 1 /10 000, in volgorde (kaart 1 tot en met 6): Assesse 54/1 Nord, Ciney (Est) 45/2 Sud, Daussois 52/8 Sud, Leignon 54/6 Nord, Onhaye 53/7 Nord en Walcourt 52/8 Nord
69
Bijlage 2: Te zoeken toponiemen per topografische kaart………………………………..
75
Bijlage 3: Spreiding toponiemen op de topografische kaarten (van links naar rechts en van boven naar onder, respectievelijk kaart 1 tot en met 6)………………………………
76
Bijlage 4: Vragenlijst ……………………………………………………………………..
77
VIII
1.
INLEIDING
We leven in een digitaal tijdperk waarin internet niet meer uit ons dagelijks leven weg te denken is en waarin mobiele technologieën zich sterk ontwikkelen. Dit beïnvloedt onder andere de manier waarop we met elkaar communiceren. Daarnaast worden gegevens tegenwoordig voornamelijk digitaal ingevoerd, verworven, opgeslagen en/of verspreid. Zo worden papieren documenten in vele gevallen vervangen door digitale documenten. Maar dit betekent niet dat de papieren documenten uit de wereld zijn verdwenen. Nog steeds worden digitale documenten op papier afgeprint omdat ze zo gemakkelijker te lezen zijn. Ook geografische informatie dat al eeuwenlang op papieren kaarten wordt voorgesteld, wordt sinds enkele decennia in digitale vorm geproduceerd. De ontwikkelende technologieën zorgen ervoor dat de kwaliteit van digitale kaarten zich steeds verbetert. Sinds de opkomst van het internet is de beschikbaarheid en de verspreiding van geografische gegevens via digitale kaarten enorm toegenomen. De web-based services kennen al enkele jaren een groeiende populariteit. Dit resulteerde in een aantal bedrijven dat online mapping tools aanbiedt op digitale kaarten (Hurst & Clough, 2013). Voorbeelden van de toonaangevende ondernemingen zijn Google Maps en OpenStreetMap. Het zijn die bedrijven die er voor zorgen dat tegenwoordig niet enkel geografische specialisten ruimtelijke informatie hanteren, maar ook elke bezoeker van de service (ook de niet-experts) komt in contact met geografische informatie door de online geplaatste digitale kaarten. Ook het wereldwijd gebruik van de Global Positioning System (GPS) zorgt ervoor dat het aanbod van digitale kaarten aanmerkelijk toeneemt (Hurst & Clough, 2013).
1.1 Achtergrond: papier versus digitaal Papier werd voor lange tijd gezien als het primaire communicatiemedium. Het is een universeel en dynamisch medium door zijn vele kwaliteiten, zoals het gebruiksgemak, het transport en de opslag (Johnson et al., 1993). Daarom werd er vroeger vanzelfsprekend gekozen om geografische informatie over de wereld op een papieren formaat af te beelden. In het verleden werden papieren kaarten gemaakt door geografische en cartografische experts. Voornamelijk stonden de nationale topografische diensten (National Mapping Agencies) in voor de opstelling en productie van kaarten (Hurst & Clough, 2013). In België neemt het Nationaal Geografisch Instituut (NGI) het vervaardigen van o.a. topografische kaarten op zich. Bondarenko en Janssen (2009) hebben reeds onderzoek gedaan naar een ‘papierloos 1
kantoor’. Daaruit bleek dat de tastbaarheid van papier een zeer belangrijke factor is, ook al kunnen de meeste documenten door de nieuwe technieken digitaal worden opgeslagen. Hierdoor zijn papieren documenten nog steeds aanwezig op de werkplaats. Papieren kaarten geven doorgaans grootschalige geografische informatie op hoge resolutie weer. Ze bezitten een vaste schaal en zijn tastbaar. In eigendom hebben papieren kaarten een zekere waarde. Dit verklaart dat ze in aankoop relatief duur zijn. Verder staat er meestal meer informatie afgebeeld dan wat noodzakelijk is voor de gebruiker. Moderne kaarten zijn niet langer beperkt tot het papieren formaat, maar worden tegenwoordig ook in digitale vorm vervaardigd (Peterson, 1997). Aan de basis van elke digitaal kaartensysteem ligt een ruimtelijke database. Dit is een databank waarin alle geografische gegevens worden opgeslagen. De ruimtelijke database maakt deel uit van een groter geografisch informatiesysteem (GIS). Een GIS is een informatiesysteem waarin ruimtelijke gegevens van geografische objecten worden opgeslagen, beheerd, bewerkt, geanalyseerd en gepresenteerd
(Hurst
& Clough,
2013).
Geografische informatiesystemen
werden
voornamelijk bestuurd door geografische specialisten, maar sinds de komst van het internet en de web-based services kunnen GIS diensten in elk huis gebruikt worden. Internet wordt gezien als een nieuw kanaal voor cartografie waarop een grenzeloos aantal online kaartproducten ontstaan (Pederson et al., 2005). Er is geen beperking op de informatie die op het net beschikbaar wordt gesteld, zolang het maar geografisch is of ruimtelijk op een kaart is gepositioneerd (Hurst & Clough, 2013). In tegenstelling tot de papieren kaarten is de kwaliteit van digitale kaarten afhankelijk van het beeldscherm waarop het geprojecteerd is. Het scherm bepaalt de afmetingen, de resolutie en het kleurbereik. De resolutie van digitale kaarten is daardoor in het algemeen lager dan deze van papieren kaarten (bijvoorbeeld 92 dpi versus 1200 dpi). Digitale kaarten hebben anderzijds het voordeel dynamisch te zijn. Door interactieve tools kan de gebruiker zelf de weer te geven informatie, het perspectief, de schaal en de lay-out kiezen. Digitale kaarten hebben dan ook de kenmerken personalisatie toe te laten en actueel te zijn. Verder kunnen er ook berekeningen op worden uitgevoerd zoals de kortste of snelste route. Maar desondanks de tools waarmee men kan zoomen en pannen is het moeilijk om een overzicht van het afgebeelde gebied te combineren met de gegevens van een geselecteerde subregio. Dat is één van de redenen waarom er nog steeds papieren kaarten in gebruik zijn.
2
Hurst en Clough (2013) hebben onderzocht of we zonder papieren kaarten in het digitaal tijdperk verloren zouden zijn. Dit deden ze door testpersonen een vragenlijst te laten invullen over hun huidig kaartgebruik en hun mening over traditionele papieren en online/digitale kaarten. Hurst en Clough (2013) verdeelden de testpersonen in twee groepen: deskundigen en niet-deskundigen. De twee groepen voerden een reeks van taken uit op kaarten. Ze dienden ook hun mate van tevredenheid over elk kaartformaat aan te geven. Uit het onderzoek bleek dat deskundigen de papieren kaarten verkiezen en omgekeerd. Beide groepen zijn het er over eens om digitale kaarten te hanteren voor routeplanning en voor het vinden van informatie over locaties. Papieren kaarten worden dan door alle deelnemers geprefereerd voor navigatietaken te voet. Bij het navigeren met de auto behouden de deskundigen hun voorkeur voor het papieren formaat, terwijl niet-deskundigen de digitale vorm opteren zoals de GPS. Het onderzoek gaf aan dat de papieren kaarten nog steeds voldoende kwaliteiten bezitten om het gebruik ervan hoog te houden. Pederson et al. (2005) en Verdi et al. (2003) onderzochten welke van de twee kaartformaten moet gebruikt worden bij het aanleren van het kaartlezen aan leerlingen. Beide studies kwamen tot dezelfde conclusie dat de digitale formaten efficiënt zijn, maar dat ze de papieren kaarten niet overtreffen. Ze zijn van dezelfde kwaliteit voor het leerproces. Het is van belang om de digitale kaarten in de lessen aan te bieden, aangezien de populariteit ervan steeds stijgt. Maar ook hier raden de onderzoekers aan de papieren kaarten niet verloren te laten gaan.
1.2 Onderzoek Iedereen, zowel deskundigen als niet-deskundigen, komt meer en meer in aanraking met kaarten in digitale vorm. We leven nu eenmaal in een digitale wereld waarin internet en mobiele technologieën blijven groeien. Het lijkt wel dat de digitale kaarten de papieren kaarten proberen te verdringen. Maar onderzoek geeft aan dat de papieren formaten nog voldoende kwaliteiten bezitten t.o.v. de digitale formaten om ze niet zomaar uit de maatschappij te zetten (zie Sectie 1.1). Elk formaat heeft zijn eigen voor- en nadelen. Meestal hangt het van de taak af of men al dan niet papieren of digitale kaarten gebruikt. Maar kijken we op dezelfde wijze naar een digitale kaart als naar een papieren kaart? Zijn beide type kaarten even leesbaar of kan het zijn dat men ze onbewust op een verschillende manier bestudeert? Is de ene vorm gemakkelijker of sneller te doorzoeken dan de andere? In deze thesis wordt er naar een antwoord gezocht op deze vragen. 3
Deze studie gaat over de invloed van de schermweergave van kaarten op het kijkgedrag van de gebruiker. De resolutie en kleurvoorstelling zijn enkele elementen die hierbij een rol spelen. Indien er verschillen in het kijkgedrag op papieren en digitale kaarten zijn, kunnen deze in rekening worden gebracht bij het ontwerpen van digitale kaarten. Dit ontwerpproces is nog grotendeels gebaseerd op regels die gebruikt worden om papieren kaarten op te stellen. De verschillen kunnen erop wijzen dat dit proces moet bijgestuurd worden. Indien er geen verschillen in het kijkgedrag aanwezig zijn, blijven de regels van het ontwerpproces nog steeds aanvaardbaar voor de digitale kaarten. Het doel is om het visueel gedrag bij het bekijken van papieren en digitale kaarten te analyseren en te vergelijken. Er wordt verwacht dat de digitale kaart voor de gebruiker moeilijker is te lezen en/of te interpreteren dan de papieren kaart. Hiervoor wordt er gebaseerd op de lagere resolutie en de beperkte kleurweergave dat een digitale weergave met zich meebrengt. Voor dit onderzoek wordt er in een gecontroleerde vaste opstelling getest. Dit houdt in dat de kaarten qua inhoud zo homogeen mogelijk zijn. Tijdens de test moet telkens dezelfde zoekopdracht worden voltooid. Ook wordt er gezorgd dat de afmetingen van de digitale en papieren kaarten gelijk zijn. Met andere woorden is er maar één verschil tussen beide kaarten en dat is het medium (papier of digitaal). De algemene vraag dat in deze thesis getracht wordt te achterhalen is: Wat is de invloed van de digitale weergave van een kaart op het kijkgedrag van de gebruiker? Hieruit wordt verder enkele concrete vragen afgeleid: Heeft het medium waarop de kaart wordt voorgesteld (papier vs. scherm) een invloed op hoe de inhoud wordt geïnterpreteerd? Worden er verschillende zoekstrategieën toegepast wanneer een kaart op een ander medium wordt voorgesteld (papier vs. scherm)? Om op de laatste twee vragen een antwoord te kunnen geven moet er een verdere stap in het onderzoek worden ondernomen. Hiervoor wordt verwezen naar toekomstig onderzoek. Om na te gaan of er nu al dan niet een onderscheid kan gemaakt worden tussen het bekijken van een papieren en een digitale kaart worden er hypotheses opgesteld. Deze veronderstellingen worden dan statistisch getoetst. Het is een techniek dat vaak gebruikt wordt om een gevestigde norm mogelijk te weerleggen. In dit onderzoek wordt er gezocht 4
naar eventuele verschillen in het bestuderen van kaarten. De gevestigde norm of de nulhypothese is dat er geen verschillen aanwezig zijn. De alternatieve hypothese stelt het tegengestelde voor. De statistische toetsing probeert de nulhypothese met een zekere betrouwbaarheidsgraad te verwerpen en de alternatieve hypothese te aanvaarden. De concrete nulhypothesen stellen voor dat er geen verschil is in zoektijd, in fixatieduur en in aantal fixaties per seconde. Zonder statistische toets wordt de distributie van de fixaties visueel geanalyseerd. Het onderzoek start met een uiteenzetting van de literatuur over het concept ‘Eye tracking’. Daarna worden de testen aangevat. Hierbij worden de oogbewegingen van de geselecteerde testpersonen met behulp van een eye tracker geregistreerd. De testen gebeuren op topografische kaarten, zowel in papieren als in digitaal formaat. De verkregen gegevens worden na de uitgebreide dataselectie visueel, beschrijvend en statistisch geanalyseerd. Uiteindelijk wordt er gefocust op eventuele verschillen in hoe de gebruikers beide typen van kaarten doorzoeken.
5
2.
EYE TRACKING
2.1.1
Algemeen
Eye tracking is een techniek waarbij de oogbewegingen van een proefpersoon worden geregistreerd. Zo weet de onderzoeker waar de proefpersoon naar kijkt op elk tijdstip van de test en hoe zijn ogen bewegen van het ene punt naar het andere. Deze meettechniek is belangrijk als men weet dat het centrale gedeelte van de aanblik (of het gezicht) tot in het kleinste detail gezien wordt. Het centrale gebied waarop de ogen zijn gericht worden in hoge resolutie gebracht. Meestal is het zo dat de aandacht ook op dat punt gevestigd is. Er is sprake van een al dan niet zeer kort moment van concentratie gericht op het voorwerp. Als de oogbewegingen van een persoon worden nagegaan, dan is het pad bekend waarop zijn/haar aandacht is gevestigd (Duchowski, 2007). Door het opmeten van de locatie van de visuele aandacht kan er zowel op fysiologisch als op psychologisch vlak informatie verkregen worden.
2.1.2
Het oog
2.1.2.1 Het zicht Volgens Hendee en Wells (1997) beschouwden de eerste theorieën over het visueel systeem het oog als iets psychisch. Het zicht werd gezien als een proces waarbij de scene of de ruimte wordt afgetast. Het eerste grondig overzicht van de optica werd door Kepler in 1604 gegeven in “Physiological Optics”. Kepler was de eerste die het oog vergeleek met een camera of een donkere kamer met het beeld gefocust op zijn achtervlak. Descartes beschreef in zijn boek “La Dioptrique”, gepubliceerd in 1637, een experiment in welk een deel van de achterkant van het oog van een os was geschraapt om het doorschijnend te maken. In dat gebied werd een omgekeerd beeld van de scene geobserveerd. Deze waarneming bracht zijn problemen mee. Op de retina of het netvlies werd het verkregen beeld omgekeerd geplaatst. Daarom veronderstelde men dat de lens het actieve onderdeel bij het zien was. Deze verwarring ontstond doordat men zich niet realiseerde dat men het beeld op het netvlies niet zag, maar er slechts gebruik van kon maken. Het oog is niet zomaar een instrument bij een beeldopname. Het gedraagt zich eerder als een optische interface tussen het milieu en de neurale elementen van het visueel systeem. Het oog bepaalt de basisattributen van het zicht: vorm, terrein, kleur, beweging en diepte (Hendee & Wells, 1997). 6
Algemeen omschreven is het oog een zintuig dat licht gebruikt om een beeld door te geven naar de hersenen. Hierbij speelt het beeld verkregen op het netvlies een belangrijke rol. Daar zorgen de fotoreceptoren ervoor dat de lichtenergie omgezet wordt in elektrische prikkels. Een complex neuraal netwerk stuurt de signalen door naar de visuele cortex of schors van de hersenen. Daar worden de impulsen geïnterpreteerd. Volgens Hendee en Wells (1997) beïnvloeden efferente of motorische trajecten van de visuele cortex de neurale centra die oogbewegingen bedienen. Ze maken het mogelijk dat het oog een object fixeert en het volgt. Het gedetailleerd proces dat zich in het brein afspeelt wordt hier niet verder besproken. 2.1.2.2 Anatomie van het oog De anatomie van het oog wordt voorgesteld op Figuur 1. De sclera of het oogwit is de buitenste witte schil van het oog. Ze bestaat uit een stevig bindweefsel en wordt ook wel de harde oogrok genoemd. De oogspieren zijn eraan gevestigd. Ze maken het mogelijk het oog in alle richtingen te bewegen. Het doorzichtig gedeelte vooraan is de cornea of het hoornvlies. Het heeft een kleinere boogstraal dan de sclera en is de plaats waar het licht naar binnen valt. De conjunctiva is het bindvlies dat het oogwit met het hoornvlies vasthecht. De cornea draagt ook bij aan de scherpstelling van het beeld op de retina of het netvlies. Het licht gaat vervolgens door de pupil. Dat is de zwarte opening in de iris of het regenboogvlies. Dit laatste orgaan bezit pigmenten en functioneert als een diafragma van een camera. Via kringspieren bepaalt het de grootte van de pupil en dus de hoeveelheid licht die het oog binnenkomt. De lens zorgt ervoor dat het beeld op het netvlies scherp wordt gesteld door van vorm te veranderen. Het oog wordt door de lens in twee compartimenten verdeeld. De voorste kamer is gevuld met aqueous humor of kamerwater. In de achterste kamer, achter de lens, zit er een geleiachtige vloeistof dat vervorming van het oog voorkomt. Achteraan het oog komt het licht op het netvlies terecht. In de laag bevinden zich vele lichtgevoelige cellen of fotoreceptoren en bloedvaatjes voor toevoer van zuurstof en voedingstoffen. De fotoreceptoren bestaan uit kegeltjes en staafjes. De eerste bevatten pigmentmoleculen en zorgen voor het waarnemen van kleurverschillen. De laatste zijn gevoelig aan het licht. De meest lichtgevoelige plek op het netvlies is de macula lutea of de gele vlek. Daar zitten de kegeltjes dicht op elkaar, de staafjes er rond en ziet men het beeld het scherpst. Elke fotoreceptor is vastgehecht aan een zenuwvezel. Deze vezels zijn samengebundeld en worden de oogzenuw genoemd. Via deze zenuw sturen de fotoreceptoren elektrische stralen door naar de hersenen.
7
Figuur 1: De anatomie van het oog Bron: Hendee & Wells, 1997 Duchowski (2007) wijdt een heel hoofdstuk aan de visuele fysica. Hij schrijft uitgebreid over de beperkingen van het zien op gebied van ruimte, tijd en kleur. In het onderzoek is het belangrijk te weten wat men juist scherp ziet. Want de aandacht wordt op dat deel gevestigd. Het oog kan ook verscheidene aberraties bezitten, maar dat wordt hier verder niet besproken. 2.1.2.3 Oogbewegingen Volgens Davson (1980) bewegen de ogen in het algemeen binnen zes vrijheidsgraden: drie translaties en drie rotaties. Voor deze bewegingen zijn er zes spieren verantwoordelijk: de mediale en laterale recti (zijwaartse bewegingen), de superieure en inferieure recti (op/neer bewegingen) en de superieure en inferieure obliques (draaibewegingen). De oogbewegingen zelf worden onderverdeeld in vier categorieën: de saccades of oogsprongen, smooth pursuits of langzame bewegingen, fixaties en de nystagmus. De saccades zijn snelle oogbewegingen en dienen om de gele vlek naar een nieuwe locatie van de visuele omgeving te herpositioneren (Gregory, 1990). De oogsprongen duren 10 tot 100 ms. Dit is een voldoende korte tijdsduur om de uitvoerder tijdens de overgang effectief blind te maken (Shebilske & Fisher, 1983). Ze kunnen worden afgebeeld door de positie van de fixaties chronologisch te verbinden. Doordat saccades aan een zeer hoge snelheid
8
plaatsvinden wordt er niets geïnterpreteerd. Als gevolg hiervan worden zij in deze studie verder niet bestudeerd. De smooth pursuits komen voor bij het visueel volgen van een bewegend doelwit. Afhankelijk van de afstand tot het bewegend voorwerp kunnen de ogen samen bewegen met de snelheid van dat voorwerp (Duchowski, 2007). Aangezien er in deze studie gewerkt wordt met statische stimuli, zijn smooth pursuits niet van toepassing. Fixaties zijn oogbewegingen waarbij het netvlies gestabiliseerd wordt op een stilstaand object (Duchowski, 2007). Het lijkt alsof fixaties als speciaal geval ontstaan door hetzelfde neurologisch netwerk dat voor smooth pursuits zorgt waarbij de snelheid van het bewegend voorwerp nul is. Volgens Leigh en Zee (1991) is deze veronderstelling waarschijnlijk onjuist. Fixaties zouden daarentegen gekenmerkt zijn door zeer kleine oogbewegingen: beving, drift en microsaccades. Een fixatie wordt gedefinieerd door zijn drempelwaarden in beweging en tijd. Het oog moet voor een bepaalde tijd (minimum) op een bepaald punt op het voorwerp gericht zijn. Daarbij mag het oog zich tot een maximale grenswaarde bewegen zodat beving, drift en microsaccades niet tot de gewone saccades worden gerekend. Tijdens een fixatie interpreteert de gebruiker de informatie waarop hij focust. Door het bestuderen van de fixaties kunnen er dus inzichten verworven worden in hoe de gebruiker de informatie interpreteert: moeilijkheid, distributie van de aandacht, etc. Nystagmus bestaat uit een smooth pursuit beweging afgewisseld met oogsprongen. Deze zorgen ervoor dat het beeld van het bewegend voorwerp op het netvlies blijft (Duchowski, 2007). Deze oogbewegingen worden hier verder niet behandeld.
2.1.3
Uitvoering
De oogbewegingen worden opgemeten door een eye tracker. Er zijn twee verschillende categorieën van eye tracking: diegene die de positie van het oog relatief ten opzichte van het hoofd meten en diegene die de oriëntatie van het oog in de ruimte meten (Young & Sheena, 1975). De laatste categorie wordt ook aanzien als het opmeten van de ‘point of regard’ (POR) of het punt waarnaar gekeken wordt. Het is deze meettechniek dat in dit onderzoek wordt gehanteerd.
9
Young en Sheena (1975) geven vier verschillende technieken van eye tracking. De eerste is elektro-oculografie (EOG). Hierbij worden elektroden op de huid rondom het oog geplaatst. Het is gebaseerd op opnames van elektrische potentiaalverschillen. Daaruit kan de positie van het oog afgeleid worden. Deze manier van eye tracking was populair in de jaren zeventig en kon enkel gebruikt worden om de POR op te meten als de positie van het hoofd gekend was. De tweede methode is de sclerale contactlens met zoekspoel. Hier wordt een zoekspoel gemonteerd in een grote contactlens dat het hoornvlies en de sclera bedekt. De zoekspoel kan verbonden worden met verschillende mechanische of optische apparaten. Het meten van de oogbewegingen gebeurt dan met een lijst in een elektromagnetisch veld. De methode zorgt voor meer preciezere metingen, maar ze is niet aangeraden bij het bepalen van de POR. Het dragen van de contactlens brengt namelijk discomfort met zich mee, wat de oogbewegingen van de testpersoon ook kan beïnvloeden (Young & Sheena, 1975). De derde werkwijze is de foto-oculografie (POG) of de video-oculografie (VOG). Het gaat hier vooral om het meten van verscheidene functies van het oog, zoals de vorm van de pupil, de positie van de limbus (de grens tussen iris en sclera) en de hoornvliesreflecties van een nabijgelegen gerichte lichtbron (Duchowski, 2007). De oogbewegingen worden opgenomen op video en kunnen na de metingen geanalyseerd worden. De visuele beoordeling gebeurt handmatig en is gevoelig voor fouten. De meeste van deze technieken zijn niet voorzien voor POR metingen (tenzij er gebruik wordt gemaakt van een hoofd- of kinsteun of een bijtbar). De laatste en de tegenwoordig meest gebruikte methode is de ‘Visual based Combined Pupil/Corneal Reflection’ (Goldberg & Wichansky, 2003). Dit gebeurt met een standaardcomputer waarbij een infraroodcamera naast of onder de monitor is geïnstalleerd. Op de computer staat er beeldverwerkende software die de verschillende onderdelen (o.a. de pupil) van het oog moet vinden en identificeren. Deze zijn nodig om het oog te volgen. De infraroodcamera stuurt licht in het oog. Zo ontstaan er sterke weerspiegelingen die gemakkelijker te volgen zijn. Het licht schijnt op het netvlies en weerkaatst een groot deel terug. Hierdoor wordt de pupil een fel, goed zichtbare schijf. De hoornvliesweerspiegeling, ook wel Purkinje voorstelling genoemd, komt ook tot stand door het infrarode licht. Deze manifesteert zich als een kleine maar scherpe glinster (Figuur 2) (Poole & Ball, 2006). Eenmaal de software het centrum van de pupil en de locatie van de hoornvliesweerspiegeling heeft vastgelegd meet het de vector tussen de twee. Verder wordt door goniometrische 10
berekeningen
de
POR
gevonden.
Het
is
ook
mogelijk
om
enkel
met
de
hoornvliesweerspiegeling te werken maar zo verkleint de nauwkeurigheid en wordt er niet langer meer rekening gehouden met bewegingen van het hoofd (Jacob & Karn, 2003; Duchowski, 2007).
Figuur 2: De hoornvliesweerspiegeling en de opgelichte pupil in het infrarood camerabeeld Bron: Poole & Ball, 2006 Om te beginnen moet bij elke proefpersoon de eye tracker gekalibreerd worden. Dit gebeurt via een punt dat op het scherm verschijnt. Terwijl de proefpersoon naar het punt kijkt, observeert het systeem de positie van de pupil en de hoornvliesweerspiegeling. De verhouding pupilcentrum/hoornvliesweerspiegeling krijgt zo een bepaald x- en y-coördinaat op het scherm toegewezen. Dit wordt meerdere keren herhaald telkens met een punt op een andere positie op het scherm. Met een (interpolatie-)algoritme wordt er een correcte kalibratie over het hele scherm verkregen (Goldberg & Wichansky, 2003). Het toestel is na de kalibratie klaar om de oogbewegingen (saccades, smooth pursuits en fixaties) te meten. Aan de hand van de gemeten oogbewegingen wordt het pad van de POR bepaald. Eye trackers worden ook opgedeeld volgens hun opstelling. Zo is er keuze tussen de eye tracker met kinsteun, de op het hoofd gemonteerde eye tracker en de remote eye tracker. De eerste opstelling wordt geopteerd wanneer de testen zeer nauwkeurig dienen te worden uitgevoerd. De andere twee opstellingen bieden de gebruiker meer vrijheid in beweging. De ongebondenheid resulteert wel in minder nauwkeurige registraties. In deze thesis wordt de remote eye tracker gebruikt. De lagere nauwkeurigheid is nog steeds aanvaardbaar voor deze studie.
11
3.
MATERIALEN, METHODEN EN DATA
3.1 Materialen 3.1.1
Hardware
De eye tracker die voor dit onderzoek wordt gebruikt is aanwezig in de S8 (gebouw Universiteit Gent – Vakgroep Geografie). Het is een toestel van SensoMotoric Instruments (SMI). De producent is wereldleider in eye tracking toepassingen op de computer. Het beschikbare toestel is een SMI RED (Remote Eye tracking Device) 60/120 Hz systeem (Figuur 3). Bij het apparaat behoort een 22 inch beeldscherm en het apparaat kan ook werken met televisieschermen of projectors. Bij de standaardopstelling is de RED gekoppeld aan een 22 inch monitor. Het toestel kan echter ook werken met stimuli voorgesteld op een ander type van scherm of projectie in de stand alone opstelling. Het toestel functioneert volgens de ‘Visual based Combined Pupil/Corneal Reflection’ methode (zie Sectie 2). SMI (http://www.smivision.com) omschrijft de technologie als een volledig geautomatiseerde beeldverwerking op basis van contactvrije eye tracking en compensatie van hoofdbewegingen. De RED is binoculair (beide ogen worden geregistreerd) en heeft een maximale sampling ratio van 120 Hz. Dit wil zeggen dat het toestel 120 keer per seconde een meting uitvoert. De tracking resolutie is 0,03 graden en de nauwkeurigheid van de blikpositie is 0,5 graden. De werkafstand tussen subject en camera staat vastgelegd tussen 60 en 80 cm bij de standaardopstelling. Hiervan kan afgeweken worden bij de stand alone opstelling. Tijdens de kalibratie heeft men keuze tussen twee, vijf of negen kalibratiepunten (http://www.smivision.com, 16 augustus 2012). Voor de eye tracking speelt het oogkleur geen rol. Het toestel functioneert met de meeste brillen en contactlenzen. Voor statistische verwerking kan er data geëxporteerd worden naar softwarepakketten als MATLAB, SPSS en Excel. Verdere specificaties worden weergegeven in Tabel 1.
12
Figuur 3: Eye tracking toestel Bron: http://www.smivision.com, 6 april 2013
Tabel 1: Specificaties van RED Bron: http://www.smivision.com, 16 augustus 2012 Ruimtelijke resolutie
0,03°
Nauwkeurigheid POR positie
0,5°
Tracking ratio (kader hoofd)
40 x 20 cm op 70 cm afstand
Maximale snelheid van hoofdbeweging
20 cm/s
Verwerking latency
< 0,5 ms
De eye tracker wordt aangestuurd via een notebook waarop de nodige software is geïnstalleerd. Voor deze tests wordt er gewerkt met de stand alone opstelling, zodat de kaarten niet beperkt zijn tot de afmetingen van het bijhorend 22 inch scherm. De (digitale) stimuli worden getoond op een groot televisiescherm: JVC LT-50HW45U met een schermdiagonaal van 50 inch (of 127 cm). Dit scherm heeft een maximale resolutie van 1920 x 1080 pixels. Verdere specificaties staan vermeld in Tabel 2 . Tabel 2: Specificaties van televisiescherm Bron: http://www.jvc.com, 18 november 2012 Resolutie (pixels)
1920 x 1080
Afmetingen (mm)
1106 x 622
Afmetingen (inch)
43,594 x 24,491
Pixels per cm (ppcm)
17,36
Pixels per inch (ppi)
44,07
13
3.1.2
Software
Verscheidene programma’s worden tijdens deze studie aangewend om de verschillende deeltaken zo optimaal mogelijk te kunnen voltooien. Figuur 4 geeft een overzicht van de aangewende programma’s. Van de SMI software wordt de Experiment Builder gebruikt om het experiment op te bouwen. Daarin wordt bepaald hoe de testen zullen verlopen. Hierbij wordt de kalibratie, de volgorde van de stimuli, de momenten wanneer er data wordt geregistreerd en de vragenlijst vastgelegd. Als de SMI RED (eye tracker) ingeschakeld is, kan deze aangestuurd worden in het programma iView X. In dit programma kan er via ‘eye image’ nagegaan worden of de eye tracker de ogen al dan niet registreert. Het kan zijn dat het toestel de ogen niet terugvindt of dat het zich op iets anders focust (bijvoorbeeld op de wimpers of brilmontuur). iView X wordt met de Experiment Builder in verbinding gezet. Pas daarna kan de test en dus de registraties worden uitgevoerd in de Experiment Builder. De geregistreerde data van het experiment kan in BeGaze geopend en geanalyseerd worden. In deze studie wordt BeGaze echter enkel gebruikt om de ruwe data te exporteren naar *.txt-bestanden. De initiële verwerking van de data gebeurt in het open source programma OGAMA (Open Gaze And Mouse Analyzer). Vooraleer de ruwe gegevens in het programma kunnen worden ingeladen, dienen ze te worden omgezet. Voor deze transformatie wordt de JAVA tool SMI2OGAMA, dat door de Vakgroep Geografie is ontwikkeld, gebruikt. Eens de ruwe data in OGAMA zijn ingeladen kan de fixatieberekening van start gaan. Na de fixatieberekening volgt de dataselectie. Beide uitvoeringen worden in de Sectie 3.2 nader uitgelegd. De behouden data worden in OGAMA visueel geanalyseerd aan de hand van heatmaps. De data kunnen ook gevisualiseerd worden aan de hand van een grid. Per gridcel kan het aantal fixaties en de totale fixatieduur berekend worden. Hiervoor dienen de data in een fixatierapport (*.txt- formaat) te worden geëxporteerd. Om het grid aan te maken en de berekeningen uit te voeren wordt het JAVA tool fr2grid gebruikt. Deze tool is ontwikkeld aan de Vakgroep Geografie. De programmeercode zelf is opgesteld door Dr. Kristien Ooms. De tool kan uitgevoerd worden aan de hand van het fixatierapport uit OGAMA. In Excel kunnen de waarden van het grid met een kleurenschaal gevisualiseerd worden. In hetzelfde programma worden de waarden in driedimensionale grafieken geplaatst.
14
Het fixatierapport wordt ook in Excel ingeladen om de beschrijvende analyse uit te voeren. Dee gemiddelde waarden en standaarddeviaties van de zoektijd, fixatieduur en fixatieaantal voor beide formaten (papier en digitaal) digitaal worden er berekend (zie Sectie 3.2). 3.2 In Excel worden er ook grafieken aangemaakt die de berekende waarden voorstellen. De resultaten worden in SPSS (Statistical Package for the Social Sciences) statistisch getoetst.
Figuur 4:: Schema met gehanteerde software
3.1.3
Testpersonen
Om de verschillen in het kijkgedrag op papieren en digitale kaarten na te gaan wordt er met testpersonen gewerkt. Aangezien het onmogelijk is om een en volledig soortgelijke bevolkingsgroep te laten testen, wordt er een steekproeftrekking steekproeftrekking uitgevoerd. uitgevoerd De steekproeftrekking of de testgroep vormt een selectie uit een totale populatie waarop proeven worden verricht. Uit die trekking worden dan eigenschappen waargenomen die voor de totale populatie typerend zijn. Er worden in feite conclusies genomen over de hele h populatie op basis van de steekproefgegevens. gevens. De besluiten zijn niet afdoend, afdoend, maar het risico op een verkeerde stelling wordt onder controle gehouden. Bij de statistische testen wordt er rekening gehouden met een betrouwbaarheidsgraad. De groep waarop er getest wordt dient enige ervaring met zowel papieren als digitale kaarten te hebben. Als dat niet zo zou zijn, zouden de bekomen afwijkingen misschien te wijten zijn aan andere aspecten dan het bepaalde formaat. Het is niet de bedoeling om de testpersonen testpers te
15
verrassen met een papieren of digitale kaart. Het doel is om na te gaan of men onbewust de twee formaten op een andere manier doorzoekt. Om zeker te zijn van de nodige ervaring met de twee soorten kaarten wordt er in dit onderzoek gewerkt met derdejaars studenten in Bachelor in de Geografie en Geomatica (afstudeerrichting Geografie en Landmeetkunde) en studenten in de Master of Science in de Geografie en Master of Science in de Geomatica en Landmeetkunde. Verder worden ook de medewerkers van de vakgroep Geografie aangesproken voor de proeven. Het gaat om individuen die afgestudeerd zijn aan de hiervoor vernoemde opleidingen en die daarenboven maximaal tien jaar extra ervaring hebben opgedaan als doctoraatstudent, assistent of medewerker bij de vakgroep. Alle testpersonen studeren of werken aan de Universiteit van Gent. De vermelde masteropleidingen volgen de bacheloropleiding op. In de eerste twee bachelorjaren wordt er aandacht aan diverse geografische aspecten geschonken. Daarnaast verwerven de studenten de nodige kennis van kaarten in het opleidingsonderdeel cartografie dat in het eerste semester van het derde bachelorjaar wordt gegeven. In de praktijk krijgen ze zowel in digitale als papieren formaat kaarten voorgeschoteld. De testpersonen bezitten dus de nodige basiskennis om ze als een homogene groep te beschouwen. Maar dit laat niet weg om de personen later nog op te delen volgens het geslacht of het aantal jaren opleiding. In totaal worden er 32 personen getest. Dit is voldoende om statistische testen uit te voeren. De personen worden in twee groepen van zestien verdeeld. Tot welke groep de deelnemers behoren wordt bepaald door een even of oneven volgnummer. Beide groepen krijgen dezelfde kaarten te zien, echter telkens in het ander formaat. De kaarten die de ene groep digitaal worden voorgeschoteld, worden aan de andere groep in het papieren formaat weergegeven en omgekeerd.
3.1.4
Topografische kaarten
Een topografische kaart is een kaart met een weergave van de topografie die voldoet aan vooraf vastgestelde normen (De Maeyer, 2009). Deze zijn door hun rijke inhoud meer in gebruik dan thematische kaarten. Topografische kaarten geven het reliëf (hoogtelijnen), de bebouwing, de infrastructuur, het grondgebruik, de toponiemen, de natuurlijke en bestuurlijke grenzen van het aardoppervlak weer. Ze hebben een grotere nauwkeurigheid en staan zowel in het Belgisch Lambert-coördinatenstelsel als in het stelsel van geografische coördinaten 16
(http://www.ngi.be, 12 oktober 2012). De topografische kaarten van België worden geproduceerd door het Nationaal Geografisch Instituut (NGI). Ze worden vervaardigd op schaal 1 : 10 000, 1 : 20 000, 1 : 50 000, 1 : 100 000 en 1 : 250 000. Er wordt gekozen voor de kaartreeks met schaal 1 : 10 000. Deze is voldoende gedetailleerd om taken (bijvoorbeeld zoekacties naar bepaalde interessepunten of namen) erop uit te voeren. In de opleiding Geografie en Geomatica maken de studenten reeds in de drie bachelorjaren kennis met de topografische kaart. De vakgroep Geografie van de Universiteit Gent heeft eigen bibliotheekvoorzieningen waaronder de cartotheek. Dat is een kaartenbibliotheek met een uitgebreide verzameling van o.a. historisch unieke en waardevolle kaarten. De cartotheek bevat ook de topografische kaarten van België op verschillende schalen. Voor de testen worden de topografische kaarten op schaal 1 : 10 000 van het jaar 2002 (editie 1) geselecteerd. Dit is de grootst beschikbare schaal dat nog steeds een overzichtelijke weergave van het grondgebied weergeeft. Bij deze schaal wordt ook de topografische werkelijkheid het minst vervormd. De basisgegevens van die kaarten zijn afkomstig van luchtfoto’s op schaal 1 : 21 000. De gegevens worden op terrein verder aangevuld door cartografen van het NGI. Zij identificeren en selecteren de informatie die betrekking hebben tot de kaartlegende. Daarna wordt de basisgeometrie op 1 : 10 000 uitgetekend door digitale restitutietoestellen. Bij deze kaart is de symbolisatieprocedure volledig geautomatiseerd (numerieke cartografie) omdat de nauwkeurigheid van de fotogrammetrische restitutie wordt behouden (http://www.ngi.be, 12 oktober 2012). In België loopt de bladindeling in afzonderlijke kaartbladen volgens het kaartnet (vierkanten). De topografische kaartseries worden genummerd volgens kolommen en rijen. De kolommen zijn van west naar oost en de rijen zijn van noord naar zuid genummerd. De nummering loopt verder door de rijen heen. België wordt op schaal 1 : 50 000 in 72 kaartbladen voorgesteld (Figuur 5). Voor de schalenseries van 1 : 10 000 tot en met 1 : 50 000 is er een hiërarchische nummering. De kaartserie op schaal 1 : 20 000 bestaat uit één vierde van een kaartblad. De kaarten op schaal 1 : 10 000 die voor dit onderzoek worden gebruikt zijn één zestiende van een kaartblad. Het kaartblad wordt hierbij in acht kaarten verdeeld, waarbij er nog een tweede onderverdeling in noord en zuid gebeurt (Figuur 6) (De Maeyer, 2009).
17
Figuur 5: Nummering Belgische topografische kaarten op schaal 1 : 50 000 Bron: http://bib.kuleuven.be, 2 december 2012
Figuur 6: Hiërarchische nummering Belgische topografische kaarten Bron: De Maeyer, 2009
18
Er worden in totaal zes verschillende topografische kaarten geselecteerd: Assesse 54/1 Nord, Ciney (Est) 45/2 Sud, Daussois 52/8 Sud, Leignon 54/6 Nord, Onhaye 53/7 Nord en Walcourt 52/8 Nord (Bijlage 1). De kaarten zijn een weergave van gebieden met een oppervlakte van 40 km² (8 km x 5 km). Er is bewust voor Waalse gebieden gekozen in plaats van Vlaamse. Dit verkleint de kans dat de testpersonen één of enkele kaarten al eens eerder hebben bestudeerd. De testpersonen zullen zoekacties op de topografische kaarten moeten uitvoeren. Als het gebied hen bekend voorkomt, dan verloopt het zoekproces te snel en is het binnen dit onderzoek niet langer aanvaardbaar. In een vragenlijst moeten de testpersonen eveneens aanduiden indien zij één van de getoonde gebieden kenden. De hierboven vermelde kaarten zijn gekozen omdat ze wat betreft kleurgebruik, structuur, complexiteit, aantal en type van objecten evenwaardig zijn. Telkens zijn het afbeeldingen van enkele dorpen met daarrond veel velden. Het aantal toponiemen en hun hiërarchie is eveneens gelijkaardig voor elk kaartblad. Het is belangrijk dat er veel informatie op de kaarten staat zodat het zoekproces niet te vlug of te gemakkelijk verloopt. Het aantal kaarten is vastgesteld op zes. Dit geeft een voldoende aantal kaarten per persoon voor de statistische testen (drie digitale en drie papieren). Het aantal is echter beperkt om de duur van de test onder controle te houden. Na enige tijd intensief zoeken vermoeien de ogen. Als er meer kaarten gebruikt worden dan zouden de testen dus minder betrouwbaar kunnen zijn. De geselecteerde analoge topografische kaarten worden gescand, digitaal opgeslagen en afgedrukt. Hiervoor wordt de HP DesignJet 5500 plotter gebruikt. Het toestel zorgt ervoor dat de kaarten met een resolutie van 250 x 250 ppi (pixels per inch) digitaal worden bewaard. Ze worden ook afgedrukt op een resolutie van 250 x 250 dpi (dots per inch). Om de zoekacties te kunnen uitvoeren is enkel het kaartbeeld van belang. Andere kaartelementen kunnen afleidend werken en moeten dus vermeden worden. Daarom wordt zowel analoog als digitaal de kaartrand met titel, legende, noordpijl, schaal en metadata afgeknipt. Voor de digitale kaart wordt dit uitgevoerd in het programma GIMP (GNU Image Manipulation Program). Bij deze aanpassing hebben de digitale kaarten een nieuwe resolutie van 125 x 125 ppi. Deze resolutie is nog steeds voldoende aangezien ze worden afgebeeld op een scherm met een lagere resolutie (44 ppi, zie Sectie 5.1.1). De gescande topografische kaarten zijn in ware grootte terug te vinden in de digitale bijlage van deze thesis.
19
Om het leereffect te vermijden zullen de testpersonen elk gebied slechts eenmaal zien: digitaal of analoog. Elke testpersoon ziet dus de zes gebieden, waarbij er wordt afgewisseld tussen een digitale en analoge voorstelling. De deelnemers met een oneven volgnummer beginnen de test met een digitale kaart en deelnemers met een even nummer beginnen dus met een papieren kaart van datzelfde gebied.
3.1.5
Vragenlijst
Er wordt een vragenlijst opgesteld die de proefpersonen moeten beantwoorden na de uitgevoerde testen (Bijlage 4). De lijst zorgt ervoor dat er extra kenmerken aan de proefpersonen worden toegekend. Op basis van die kenmerken kunnen de testpersonen tijdens de analyse in groepen worden verdeeld. Er wordt dan nagegaan of er merkbare verschillen zijn in de manier waarop de groepen de kaarten bestuderen. Zo wordt er gevraagd naar het geslacht en de positie (student of medewerker) in de vakgroep. Als het om een student gaat wordt er ook naar de studierichting en studiejaar gevraagd. De testpersoon dient ook aan te geven of hij/zij met één of enkele kaarten reeds vertrouwd was zodat het de zoekacties beïnvloedde. Verder wordt er ook getoetst of de persoon in kwestie een bepaalde aanpak of strategie aannam om de zoekacties uit te voeren. Bij elke test wordt er genoteerd of de testpersoon lenzen, een bril en/of mascara draagt. Als de kalibratie niet lukt of van onvoldoende kwaliteit is, dan kan dat aan de lenzen, bril of mascara te wijten zijn.
3.2 Methoden en data
3.2.1
Opstelling
De testen worden uitgevoerd in het eye tracker lokaal van de vakgroep Geografie van de Universiteit Gent. De SMI eye tracker wordt afzonderlijk geplaatst en verbonden met het 50 inch televisiescherm. Doordat de eye tracker in een stand alone positie wordt gezet, dient de juiste positie van het toestel en de testpersoon ten opzichte van het televisiescherm in de instellingen van het experiment ingevuld te worden (Figuur 7). De testpersonen zitten tijdens de test op een stoel recht voor de eye tracker. De posities van de eye tracker, het televisiescherm en de stoel zijn zo bepaald dat de eye tracker de ogen van de testpersoon zonder problemen kan volgen en dat de testpersoon de topografische kaarten moeiteloos kan
20
lezen. De verticale hoek waaronder de eye tracker is opgesteld verschilt voor elke deelnemer (afhankelijk van zijn grootte). Deze moet dus voor elke test afzonderlijk worden bijgehouden. De opstelling is terug te vinden in Figuur 8 .
Figuur 7: Instellingen stand alone positie
Figuur 8: Opstelling eye tracker 21
3.2.2
Dataverwerving
Vóór de test maken de testpersonen kennis met de opdracht die ze moeten voltooien. De opdracht was uitgeschreven op papier. De testpersoon kon zo de mondelinge uitleg volgen op het blad. Op het aanwezige magneetbord is een papieren topografische kaart van dezelfde serie en schaal als de andere kaarten bevestigd zodat de deelnemer vertrouwd geraakt met de stimuli. Hierdoor worden afwijkende metingen op de eerste stimulus vermeden. Deze voorbeeldkaart zal niet gebruikt worden tijdens de eigenlijke test, aangezien dit eveneens de resultaten zou beïnvloeden. De opdracht is de drie gegeven toponiemen terug te vinden op het kaartbeeld. Hierbij wordt verduidelijkt dat het gaat om namen van steden, dorpen of plaatsen. Dit zijn de horizontaal zwart gedrukte toponiemen. Namen van rivieren of meren (blauw), hoogspanningskabels (rood) en wegen (diagonaal) worden achterwege gelaten. Deze toponiemen worden weergegeven op een papier dat zich linksonder van het kaartbeeld bevindt. De test start met de kalibratie. De ogen van de proefpersoon moeten ten opzichte van de weergegeven kaarten gekalibreerd worden. Aangezien de topografische kaarten op het televisiescherm worden voorgesteld of opgehangen, dient de kalibratie op dat scherm te gebeuren. Bij de kalibratie past de eye tracker zich aan tot de oogkenmerken van de testpersoon. Er worden twee maal vijf punten één voor één op het scherm afgebeeld. Terwijl de testpersoon op het aangegeven punt fixeert, wordt de verhouding pupilcentrum/ hoornvliesweerspiegeling door het iView X systeem geregistreerd (SensoMotoric Instruments GmbH, 2010). Zo krijgen de verhoudingen pupilcentrum/hoornvliesweerspiegeling x, ycoördinaten of pixels op het scherm toegekend. De vijf kalibratiepunten zorgen voor voldoende nauwkeurigheid zonder de ogen tijdens de kalibratie te vermoeien, wat met een groter aantal punten kan gebeuren. Het kalibratieproces verloopt volledig automatisch. De kwaliteit van de kalibratie wordt weergegeven met deviaties in graden op de x- en y-as. Bij te grote afwijkingen (x- of y-deviatie groter dan 1° ) wordt de kalibratie herhaald. Pas bij een goeie kalibratie wordt er verder gegaan. Na de kalibratie worden de zes (drie digitale en drie papieren) topografische kaarten om beurt weergegeven. De digitale en papieren kaarten worden hierbij afgewisseld. De testpersonen zijn in twee groepen verdeeld. Terwijl de ene groep drie bepaalde kaarten in de digitale versie ziet, zal de andere groep die kaarten in de papieren versie zien en omgekeerd. Zo wordt elke 22
kaart hetzelfde aantal keer in digitaal als papieren formaat afgebeeld aan de testpersonen. De volgorde van de kaarten met hun formaten worden weergegeven in Tabel 3. Om de data op een objectieve en effectieve manier te kunnen vergelijken werden dezelfde drie namen opgegeven voor de zoekactie op de papieren en digitale kaarten van hetzelfde gebied.
Tabel 3 : Volgorde van de kaarten met hun formaat voorgesteld per groep Groep oneven volgnummers
Groep even volgnummers
1
Assesse (digitaal)
Ciney (digitaal)
2
Ciney (papier)
Assesse (papier)
3
Daussois (digitaal)
Leignon (digitaal)
4
Leignon (papier)
Daussois (papier)
5
Onhaye (digitaal)
Walcourt (digitaal)
6
Walcourt (papier)
Onhaye (papier)
Het is van belang dat de papieren kaart op dezelfde plaats wordt opgehangen als de digitale kaart wordt gepresenteerd. Dit wordt uitgevoerd met behulp van een op het scherm afgebeeld zwart vlak. Dat zwart vlak zorgt er terwijl voor dat er geen licht door de papieren kaart schijnt. De proefpersonen krijgen de opdracht op elke kaart de drie toponiemen terug te vinden. De toponiemen worden telkens links onderaan het scherm afgebeeld. Figuur 9 is een weergave van het beeldscherm dat de testpersonen zien. In de figuur wordt de kaart van de streek rond Assesse afgebeeld. De toponiemen die men voor deze stimulus moest terugvinden zijn met een rode ovaal aangeduid. De drie namen zijn voor alle gebieden op een gelijkaardige manier over het kaartbeeld verspreid (Bijlage 3). De testpersonen worden gevraagd om na elk voltooide opdracht, als de drie toponiemen zijn gevonden, niet meer naar het scherm te kijken. Zo worden geen overtollige oogbewegingen geregistreerd. Bij de overgang van een papieren naar digitale kaart of omgekeerd, wordt er geen data opgenomen. Nadat de oogbewegingen op alle kaarten zijn geregistreerd, krijgt de proefpersoon de korte vragenlijst. Deze wordt anoniem beantwoord en gelinkt aan de oogbewegingsdata. De volledige testprocedure duurt per persoon dertig tot veertig minuten.
23
Figuur 9: Tv-scherm met afgebeelde kaart en linksonder de toponiemen De geregistreerde data wordt opgeslagen in het SMI programma BeGaze. Deze ruwe data wordt geëxporteerd naar tekstbestanden die later door de nodige software kan worden ingeladen. Aangezien het gebruikte eye tracker toestel oogbewegingen met een frequentie van 120 Hz registreert, wordt er ongeveer om de 8 ms een meting uitgevoerd. De ruwe data omvat al deze registraties. De gegevens worden per testpersoon in tekstdocumenten geordend. Voor elke registratie wordt het tijdstip (in microseconden), de x- en y- positie (in pixels) en de stimulus weergegeven. Een voorbeeld van zo’n tekstbestand wordt weergegeven in Figuur 10.
Figuur 10: Aanhef tekstbestand van testpersoon P09 met ruwe data De tekstbestanden met ruwe data zitten in de digitale bijlage van deze thesis. Ook de antwoorden van alle testpersonen op de vragenlijst is er terug te vinden.
24
3.2.3
OGAMA
De dataselectie en de daaropvolgende visuele analyse gebeuren in het programma OGAMA (versie 4.2). OGAMA is een open source software, geschreven in C#.NET, dat oog- en muisbewegingen op schermgebaseerde omgevingen kan opnemen, visualiseren en analyseren. De software is opgesteld door de Vrije Universiteit van Berlijn afdeling Natuurkunde en gepubliceerd onder de GNU General Public License (GPL) (http://www.ogama.net, 10 februari 2013). GNU GPL is één van de belangrijkste organisaties die de Free Software Foundation (FSF) sponsort (De Maeyer, 2010). Naast dat OGAMA een vrije software is, is het ook freeware. Het programma is met andere woorden kosteloos te downloaden op de website. Zoals eerder aangehaald is OGAMA als een open source project gelanceerd en voldoet dus aan de eisen van de Open Source Definition gepromoot door de Open Source Initiative. OGAMA werd voor de selectie en de verwerking van de data gekozen omdat het een vrije software is. Zo is er geen dongle (of hardwaresleutel) nodig om de software te hanteren, wat wel het geval is bij de SMI software (iViewX, Experiment Center en BeGaze). OGAMA is dus vrij te downloaden en kan op eigen pc gebruikt worden. Het kan ook bijna alle eye tracking opnames in ASCII formaat importeren (http://www.ogama.net, 10 februari 2013). Aan de vakgroep werd eerder een tool ontwikkeld (in JAVA) dat de ruwe data uit BeGaze omzet naar tekstbestanden met de correcte structuur zodat de ruwe data per testpersoon geïmporteerd worden. Verder heeft OGAMA min of meer dezelfde toepassingen als BeGaze: berekenen van fixaties, aanmaken van aandachtkaarten en verschillende visuele presentaties, het definiëren van aandachtsgebieden, enzovoort.
3.2.4
Fixatieberekening
De tekstbestanden (ASCII formaat) met oogregistraties per testpersoon worden in OGAMA ingeladen. Aangezien deze bestanden ruwe data bevatten, dienen eerst de fixaties te worden berekend. Bij deze berekening worden er paramaters in beweging en tijd toegekend. Een fixatie geldt als het oog zich voor een bepaalde tijd op een bepaald punt richt. De maximale afstand die een punt mag afwijken van het gemiddelde fixatiepunt en nog steeds mag worden beschouwd als een onderdeel van de fixatie is ingesteld op 20 pixels. De minimale drempelwaarde in tijd is vastgelegd op tien opeenvolgende registraties. Dit wil zeggen dat er 25
een fixatie ontstaat als er minimum tien opeenvolgende registraties maximum 20 pixels van het gemiddelde registratiepunt verwijderd zijn. Vermits de eye tracker met een frequentie van 120 Hz metingen uitvoert en dus ongeveer om de 8 sec de POR registreert, moet een fixatie ongeveer minstens 80 ms duren. De gekozen parameters (20 pixels en tien opeenvolgende registraties) zijn de standaardinstellingen van de fixatieberekening van OGAMA. De maximale afwijkende afstand wordt automatisch berekend en is afhankelijk van het aantal pixels van het gebruikte scherm. De tijdsparameter wordt behouden omdat het algemeen aanvaard wordt dat een fixatie minstens 80 ms moet aanhouden. De berekende fixaties zijn voor alle testpersonen en stimuli terug te vinden in een tekstbestand in de digitale bijlage van deze thesis.
3.2.5
Dataselectie
Niet alle verworven data kunnen voor verder onderzoek worden gebruikt. Op sommige gegevens kan er ruis aanwezig zijn of ze voldoen niet aan een bepaalde nauwkeurigheid. De data dienen dus eerst te worden nagekeken en gefilterd. Om de data te kunnen aanvaarden voor verdere toepassing worden de nauwkeurigheden, de tracking ratio (TR) en de locatie van de fixaties gecontroleerd. 3.2.5.1 Nauwkeurigheden De nauwkeurigheden worden uitgedrukt in deviaties en bepaald door de uitgevoerde kalibraties. Bij elke testpersoon werd er een afwijking in x- en y- richting meegegeven waarbij de registraties werden uitgevoerd. Zoals eerder vermeld (Tabel 1) kan het gehanteerde eye tracker toestel tot op 0,5° nauwkeurig de POR bepalen. Bij een standaardopstelling wordt in het algemeen een standaarddeviatie kleiner dan 0,5° aanvaard. In deze thesis wordt er echter met een stand alone opstelling gewerkt. De bekomen standaarddeviaties voor x en y lagen slechts bij twee testpersonen onder de grenswaarde van 0,5° (Tabel 4). Dit kan verklaard worden door de afwijkende afmetingen van en de afstand tot het televisiescherm in de stand alone opsteling (in vergelijking met de standaardopstelling).
26
Tabel 4: Standaarddeviatie (x en y) en tracking ratio per testpersoon Subject P01 P02 P04 P05 P06 P07 P08 P09 P10 P11 P13 P14 P15 P16 P17 P18
Deviation X [°] 0,5 1,1 0,2 0,4 0,6 1,2 0,8 0,7 0,8 0,4 0,8 0,7 0,9 0,7 0,3 0,6
Deviation Y [°] 0,9 1,9 1,3 0,6 2,4 1,1 1,3 0,5 0,6 0,5 0,7 0,9 0,8 1,6 0,6 0,2
Tracking Ratio [%] 93,8 91 91,4 95,1 66,7 96,4 96,4 96,3 88,8 95,1 96,7 92,3 96,2 95,6 93,6 95,5
Subject P19 P20 P21 P22 P23 P24 P25 P27 P28 P29 P30 P31 P32 P33 P34 P36
Deviation X [°] 1,2 0,6 0,5 0,8 0,6 0,5 0,8 0,6 1 0,5 0,6 0,3 1 0,3 0,7 0,6
Deviation Y [°] 0,9 0,6 1,1 0,8 1,4 0,8 0,1 0,6 1,5 0,8 0,5 0,8 0,3 0,4 0,6 0,4
Tracking Ratio [%] 91,4 94,7 93,6 80,1 92,2 94,9 93,8 73 96 95,9 93,9 93,7 90,9 96,6 94,1 95,6
De nauwkeurigheden en de locatie van de fixaties staan in verband met elkaar. Hoe groter de standaarddeviaties, hoe minder correct de registraties zijn verlopen met betrekking tot de locatiebepaling van de oogbewegingen (in pixels). De standaarddeviaties bij de kalibratie zorgen voor afwijkingen op de fixaties. Bij loodrechte afstand tot het scherm staan beide deviaties in verband met elkaar krachtens volgende formule: = tan ∗ /
!
De afstand tussen de testpersoon en het televisiescherm is gemiddeld 116 cm. Deze lengte is de som van de afstand tussen eye tracker en televisiescherm (46 cm (Figuur 7)) en de afstand tussen eye tracker en testpersoon. Deze laatste lengte bedraagt 60 à 80 cm, waarbij een gemiddelde van 70 cm wordt genomen. Als er na de kalibratie een standaarddeviatie van 1° in x- en y- richting wordt aanvaard, dan worden de afwijkingen op de fixaties als volgt berekend (Figuur 11): = tan 1° ∗ 116 &' = 2,02 cm
27
Figuur 11: Effect van de standaarddeviatie op het televisiescherm Een fout van 2,02 cm of standaarddeviatie van 1° in x- en y- richting is in dit onderzoek te aanvaarden. Terwijl dit een vrij grote deviatiewaarde lijkt, wordt deze toch toegelaten. In deze thesis speelt de nauwkeurigheid van de geregistreerde kijkposities namelijk in mindere mate een rol. De verzamelde data wordt hoofdzakelijk gebruikt voor statistische analyse op de fixatiegegevens (fixatieduur of -aantal).. Er wordt wel een onderzoek gedaan naar de distributie van de gegevens. Bij dat onderdeel zal er dan ook rekening gehouden worden met de reeds aanvaarde arde nauwkeurigheden. Omdat deze standaarddeviatie vrij groot is, is het van belang om de data niet enkel te selecteren op basis van de standaardafwijkingen in x en y. Een visuele controle in OGAMA komt hier ten goede. 3.2.5.2 Tracking ratio Samen met de verkregenn standaarddeviaties in x en y, wordt de tracking ratio per testpersoon weergegeven in Tabel 4.. De tracking ratio is het percentage waarbij er daadwerkelijk oogregistraties registraties werden uitgevoerd ten opzichte van het totaal aantal uitgevoerde metingen. Hoewel err dus ongeveer om de 8 ms een meting plaatsvindt, wordt niet altijd een oogbeweging geregistreerd. Het kan zijn dat de persoon net met zijn of haar ogen knippert of dat de eye tracker om een andere reden (voorbeeld een storing) de ogen niet terug vindt. Er is dan sprake van een nulmeting en de xx en y- positie krijgen de waarde nul. Om de data te kunnen aanvaarden voor verder onderzoek wordt een minimum tracking ratio van 85% vooropgesteld. Door deze voorwaarde worden de gegevens van drie testpersonen (P06, (P06 P22
28
en P27) geëlimineerd. Echter kunnen de nulmetingen, dat zijn de metingen waarbij geen oogbewegingen worden geregistreerd, zich slechts op één of enkele kaarten bevinden in plaats van over alle kaarten verspreid te zijn. Daarom is het ook hier belangrijk om die tracking ratio visueel te controleren in OGAMA, zodat er verder per kaartbeeld een selectie kan gemaakt worden. In OGAMA kan het afgelegde pad van het kijkpunt (POR) van de testpersoon worden bestudeerd. In een display modus kunnen de opeenvolgende fixaties per testpersoon en per kaart worden afgespeeld (Figuur 12). De bijhorende kaarten worden op de achtergrond weergegeven. Met de tijdscontroles (play, pause, stop en reset) kan de tijdslijn bestuurd worden. De fixaties kunnen ook versneld of vertraagd afgespeeld worden. In deze modus wordt er nagegaan of de fixaties continu op elkaar volgen. Als er enkele seconden geen fixaties worden weergegeven dan wijst dit erop dat op dat moment de eye tracker de oogbewegingen niet kon volgen en dus geen registraties kon uitvoeren. Op deze manier wordt er nagegaan of een lagere tracking ratio al dan niet te wijten is aan slechts één of enkele kaarten met veel nulmetingen.
Figuur 12: Display modus met weergave van fixaties en saccades bij een interval van 0 tot 26 s voor testpersoon P01 en topografische kaart ‘Assesse’ In de fixatiemodule worden de fixaties per proefpersoon en per kaart gevisualiseerd in een afbeelding. De weergave kan aangepast worden naar eigen wensen. Zo kunnen de fixaties
29
worden afgebeeld in punten of in cirkels waarvan de grootte de tijdsduur aangeeft. Daarnaast kunnen de fixaties ook in aandachtskaarten (heatmaps) worden voorgesteld. Op deze kaarten wordt met een kleurenpalet aangeduid op welke plaatsen op de kaart er het langst gekeken wordt. Meer uitleg hierover volgt later bij de visuele analyse (zie Sectie 3.2.6.1). Bij al de mogelijke weergaven is er de optie om al dan niet de verbindingen erbij te visualiseren. Onder de afbeeldingen wordt er in OGAMA een tabel meegegeven met de variabelen van de fixaties. De fixatieduur (in ms) en de posities in x en y (in pixels) worden er onder andere opgesomd. Zowel de figuren als de tabel kunnen worden geëxporteerd. Via de tabel kan er een controle op het aantal nulmetingen uitgevoerd worden. Net zoals op de hierboven beschreven visuele wijze worden slechts gegevens van enkele kaarten en niet de volledige testpersoon geëlimineerd. 3.2.5.3 Locaties van de fixaties Aan de hand van de figuren uit fixatiemodule kunnen de fixaties visueel onderzocht worden. Hierbij is het belangrijk dat de fixaties voornamelijk op toponiemen zijn geplaatst. De testpersonen kregen de opdracht enkele toponiemen terug te vinden, waardoor ze zich even op de afgebeelde plaats moeten gefixeerd hebben. Hier wordt visueel nagegaan of de locaties van de fixaties al dan niet op toponiemen zijn gericht en er dus eventueel afwijkingen zijn. Op deze manier worden er geregistreerde data op sommige kaarten al dan niet aanvaard of geëlimineerd terwijl op basis van de standaarddeviaties in x en y dit niet zou gebeuren. Tijdens deze visuele controle worden er kaarten van enkele testpersonen opgemerkt waarbij alle fixaties een verschuiving hebben ondergaan. De verschuivingen zijn telkens naar onder gericht. Het gaat dus om positieve translaties in de y- richting. Zo’n verschuiving is op te merken doordat de fixaties telkens op enkele tientallen pixels onder de toponiemen zijn gericht. De oorzaak van die verschuivingen bij testpersonen P16 en P28 zijn hoogstwaarschijnlijk te wijten aan hun vrij hoge standaarddeviatie in y, respectievelijk 1,6° en 1,5°. Bij de testpersonen P09 en P17 kunnen de translaties niet aan de hand van hun nauwkeurigheden in y, respectievelijk 0,5° en 0,6°, verklaard worden. Het is opmerkelijk dat de verschuivingen enkel in y- richtingen positief zijn. Dit kan te wijten zijn aan de lichtinval. De verschuivingen kunnen worden opgelost door op alle fixaties van een bepaalde kaart een negatieve translatie in y- richting uit te voeren. De uitgevoerde translaties zijn terug te vinden in Tabel 5 en 6. In beide tabellen zijn de kaarten genummerd van 1 tot en met 6. Respectievelijk gaat het om de gebieden Assesse, Ciney, Daussois, Leignon, Onhaye en 30
Walcourt. De correcties zorgen ervoor dat de data voor verdere analyse kunnen worden aanvaard.
Tabel 5: Uitgevoerde translaties (pixels) voor testpersonen startend met digitale kaart
Tabel 6: Uitgevoerde translaties (pixels) voor testpersonen startend met papieren kaart
De visuele controle is uitermate belangrijk om bepaalde data te aanvaarden of te elimineren. Als voorbeelden worden de data van testpersoon P16 en P31 nader bekeken. Testpersoon P16 heeft een vrij hoge standaarddeviatie in y- richting, namelijk 1,6°. Na een translatie van de ywaarden kan de data toch aanvaard worden. Zo is op Figuur 13 te zien dat de spreiding van de fixaties op de papieren kaart Onhaye realistisch is. Ook zijn de fixaties hoofdzakelijk op toponiemen gesitueerd. De heatmap heeft aan dat de persoon het langst keek naar de te zoeken plaatsnamen (Bijlage 3). De verkregen data voor persoon P31 doet het omgekeerde voor en is niet aanvaardbaar mits een goede standaarddeviatie van 0,3° en 0,8°, respectievelijk in x- en y- richting. Op Figuur 14 is te zien dat de fixaties in y- richting voor de papieren kaart Ciney niet goed verspreid zijn. Dit zou aangeven dat de testpersoon P31 niet enkel de bovenste en onderste toponiemen heeft genegeerd, maar ook telkens boven de opsomming met de te zoeken toponiemen keek. Aangezien dit niet mogelijk wordt geacht, kan dit soort data niet worden aanvaard. Hier hebben we te maken met slecht geregistreerde data.
31
Figuur 13: Fixaties weergegeven als punten en in een heatmap voor papieren kaart Onhaye van testpersoon P16
Figuur 14: Fixaties weergegeven als punten en in een heatmap voor papieren kaart Ciney van testpersoon P31 3.2.5.4 Geselecteerde data De controle op de nauwkeurigheden, de tracking ratio en de locatie van de fixaties worden samen uitgevoerd. De data die uiteindelijk worden aanvaard zijn weergegeven in Tabel 7 en 8. In beide tabellen zijn de kaarten genummerd van 1 tot en met 6. Respectievelijk gaat het terug om de gebieden Assesse, Ciney, Daussois, Leignon, Onhaye en Walcourt. Alle testpersonen zagen de topografische kaarten in dezelfde volgorde. Het kaarttype (papier en digitaal) werd daarbij telkens omgewisseld. De testpersonen met een oneven nummer kregen de eerste kaart in digitale vorm te zien, terwijl de andere testpersonen deze in papierversie kregen. De gegevens die verder in het onderzoek worden gebruikt, zijn aangeduid met een kruisje. Hierbij is op te merken dat de testpersonen waarvan geen gegevens worden gehanteerd niet in de tabel zijn weergegeven. Per kaart zijn er dus nog steeds minimaal tien testpersonen waarvan de data gebruikt kunnen worden. Dit is aanvaardbaar, rekening houdende met het feit dat elke testpersoon de taak ook op meerdere kaarten per criteria (digitaal versus papier) uitvoert. In totaal worden er gegevens van 68 papieren en 70 digitale kaarten gebruikt voor verder onderzoek.
32
Tabel 7: Gebruikte gegevens testpersonen startend met digitale kaart 1 Digitaal
2 Papier
3 Digitaal
4 Papier
5 Digitaal
6 Papier
P01 P05 P07 P09 P11 P13 P15 P17 P21 P25 P27 P29 P33
x x x x x x x x x x x x x
x x x x x x x x
x x
x x
x x
x x x x x x x x x x
x x x x x x x x x x x x
x x
x
x x x x x x x x x x
TOTAAL
13
11
12
12
12
12
x x x x x x x x x x
Tabel 8: Gebruikte gegevens testpersonen startend met papieren kaart 1 Papier
2 Digitaal
3 Papier
4 Digitaal
5 Papier
6 Digitaal
x
x x x x
x x x x x
x x x x x x x x x x x
x x x x x x x x x x x x
x x x x x x x x x x x x
11
12
12
P10 P14 P16 P18 P20 P22 P24 P28 P30 P32 P34 P36 TOTAAL
3.2.6
x x x x x x
x x x x x
x x x x x x x x x x
10
10
11
Visuele analyse
3.2.6.1 Heatmaps De geregistreerde data van de oogbewegingen kunnen in heatmaps worden gevisualiseerd. Het zijn kaarten waarbij met intensiteitniveaus wordt aangegeven naar waar de testpersonen op de stimulus keken. De stimulus wordt op de achtergrond afgebeeld waarop een
33
halftransparante laag met kleuren komt. In een heatmap veranderen de kleuren gradueel waarbij een rode kleur meestal het meest intensief bekeken gebied aanduidt (Sparkov & Miniotas, 2007). Heatmaps worden ook aandachtskaarten genoemd. OGAMA bezit de nodige tools om de kaarten aan te maken. De aandachtskaarten worden per stimulus berekend aan de hand van geaggregeerde Gauss-verdelingen voor elke fixatie. De verdeling gebeurt tweedimensionaal vanuit elke fixatiepositie. Voor de opstelling van de heatmap wordt de volgende formule gebruikt, waarbij µ (= 0) de gemiddelde waarde is, σ de standaarddeviatie voorstelt en de verdeling isotroop verloopt (Voßkühler, 2009):
-, . =
/
0 12 0 340
256 3
, -, . ∈ 8−, :
De waarde is de maximale coördinaatwaarde (in pixels) dat x en y kunnen aannemen. Deze
wordt bepaald door de stimulusafmetingen (1920 x 1080 pixels). De standaarddeviatie wordt
intern ingesteld op σ = / 5. Bij het aanmaken van een heatmap krijgen alle pixels waarop
een fixatie is geplaatst een waarde toegekend dat wordt vermenigvuldigd met een factor. Deze factor wordt bepaald door de duur van de fixatie op die specifieke pixel. Dit zorgt ervoor dat de lengtes van de fixaties in rekening worden gebracht en dat de nieuwe waarde daarop gewogen is. Eens aan alle fixatieposities een nieuwe waarde is toegekend, wordt de hele reeks genormaliseerd (Sparkov & Miniotas, 2007). In OGAMA gebeurt de Gauss-verdeling van een fixatiepositie standaard over 201 pixels. Dit wil zeggen dat de centrale pixel de nieuw toegekende waarde krijgt en dat de Gauss-verdeling tweedimensionaal vanuit die centrale pixel 100 pixels verder loopt. Tenslotte wordt de heatmap bekomen door voor elke pixel een sommatie uit te voeren van alle toegekende waarden. Voor verdere analyse is enkel het kaartbeeld van belang. Daarom worden de randen van de stimuli afgeknipt waardoor alleen de topografische kaarten als achtergrond overblijven. Om de aandachtskaart voor te stellen kunnen verschillende vooraf gedefinieerde kleurengradiënten worden gebruikt. Een veelgebruikt voorbeeld is de verkeerslichtgradiënt. Deze driekleurenschaal gaat van groen (gebieden met lagere fixatie-intensiteiten), over geel (gebieden met hogere fixatie-intensiteiten) naar rood (gebieden met zeer hoge fixatieintensiteiten) (Ooms, 2012c). In de linkse afbeelding van Figuur 15 worden de fixatieintensiteiten van de testpersoon met volgnummer P01 voor de eerste kaart (Assesse) volgens
34
de verkeerslichtgradiënt weergegeven. Onderaan de afbeelding wordt de driekleurenschaal meegegeven. Het is zo dat 100% de maximale waarde in de heatmap voorstelt. De andere waarden krijgen dan procentueel ten opzichte van die maximale waarde een kleur toegekend. De kleuren worden op de schaal bepaald aan de hand van procentuele drempelwaarden. Cartografisch is deze kleurenschaal niet aanvaardbaar.
Figuur 15: Fixatie-intensiteiten van testpersoon P01 voor de eerste stimulus voorgesteld in verkeerslichtgradiënt (links), ‘zwart masker’ (midden) en eenkleurige schaal (rechts) Een ander vooraf gedefinieerde gradiëntschaal is het ‘zwart masker’. Bij deze heatmaps worden de ongeziene gebieden van de stimulus met een zwart masker bedekt. Er geldt: hoe hoger de fixatie-intensiteit, hoe transparanter het masker. De meest doorschijnende gebieden werden dus het meest of het langst bekeken. De middelste afbeelding van Figuur 15 is een voorbeeld van deze gradiëntschaal. Het ‘zwart masker’ werd al eerder in Sectie 3.2.5.3 gebruikt om de spreiding van de fixaties weer te geven. Hoewel
de
gradiëntschaal
‘zwart
masker’
een
betere
voorstelling
is
dan
de
verkeerslichtgradiënt, wordt er toch voor gekozen om een nieuwe kleurenschaal op te maken. Om de heatmaps cartografisch correct te houden wordt er voor gekozen om met één kleur te werken. Naar de benaming (heat) van de kaarten wordt er geopteerd om een rode kleur te gebruiken. Bij de opgestelde gradiëntschaal geldt het volgende: hoe minder transparant en hoe donkerder de rode kleur, hoe hoger de fixatie-intensiteit. Ook hier krijgt de maximale waarde van fixatie-intensiteit de minst transparante rode kleur (100%) toegekend. De schaal is onderverdeeld in vier gelijke intervallen, waarbij de kleinste interval (0 tot 25%) volledig transparant is. Dit vermijdt een volledig ingekleurde stimulus. Deze gradiëntschaal is als voorbeeld toegepast op de fixatie-intensiteiten van de testpersoon met volgnummer P01 voor de eerste stimulus (Assesse). Het resultaat is terug te vinden op de rechtse afbeelding in Figuur 15.
35
Voor elke stimulus in papieren en digitale vorm wordt een heatmap aangemaakt. Deze wordt berekend aan de hand van de geregistreerde oogbewegingen en fixatieduur van alle testpersonen die de bepaalde stimulus hebben onderzocht. De berekende waarden worden voorgesteld aan de hand van de zelfopgestelde gradiëntschaal dat in Figuur 15 (rechts) is terug te vinden. Aan de hand van de verkregen heatmaps worden de verschillen in visueel gedrag bij papieren en digitale kaarten onderzocht. De aandachtskaarten zijn terug te vinden in Sectie 4.1.1. 3.2.6.2 Fixatiedistributie De distributie van de fixaties kunnen visueel geanalyseerd worden door een grid op de stimuli te plaatsen. Alle fixaties bezitten namelijk een x- en y- coördinaat (in pixels) waardoor ze telkens tot een bepaald gridcel zullen toebehoren. Voor analyse is enkel het kaartbeeld van belang. Van de oorspronkelijke stimuli (1920 x 1080 pixels) worden de randen afgeknipt zodat nog een afbeelding met afmetingen 1400 x 880 pixels overblijft. Hierop wordt een grid van 35 x 22 cellen geplaatst. Dit zorgt ervoor dat de gridcellen vierkanten zijn met een zijde van 40 pixels (of 2,30 cm). Deze celgrootte is groter dan de vooropgestelde nauwkeurigheidsgrens (2,02 cm) waarbij de fixaties werden aanvaard voor verdere analyse (Sectie 3.2.5.1). In Figuur 16 wordt het grid in een blauwe kleur over kaart 1 (Assesse) geplaatst.
Figuur 16: Grid van 35 x 22 cellen geplaatst op het kaartbeeld van kaart 1 (Assesse)
36
Aan de hand van het grid kan per gridcel het totaal aantal fixaties berekend worden. Dit gebeurt voor elk kaartbeeld van de twaalf stimuli (zes papier en zes digitaal). Het aantal fixaties wordt dan voorgesteld aan de hand van een eenkleurige graduele schaal waarbij de grootste waarde van alle stimuli het donkerste kleur krijgt en als maximale waarde wordt beschouwd. De kleinste waarde (= 0) wordt in het wit afgebeeld. Procentueel ten opzichte van de maximale waarde krijgen alle tussenliggende waarden via de graduele schaal een kleur toegekend. Door het maximale fixatieaantal van alle stimuli als maximale waarde te nemen moet er slechts één schaal gebruikt worden. Op deze manier kunnen de kaarten (papier en digitaal) op een juiste manier worden vergeleken. Op basis van de tijdsduur van de fixaties kan ook de totale fixatieduur per gridcel worden berekend. De totale verblijfstijd van de oogbewegingen wordt bekomen door de tijdsduur van alle fixaties voor deze ene cel bij elkaar op te tellen. Dit wordt uitgevoerd voor de twaalf stimuli. Ook hier wordt dezelfde eenkleurige graduele schaal gebruikt. De maximale, minimale en tussenliggende waarden krijgen op dezelfde manier als hierboven uitgelegd kleuren toegekend. Om de berekeningen uit te voeren en de resultaten visueel te presenteren werd het programma fr2grid (geschreven in BlueJ) van de Vakgroep Geografie gehanteerd. De broncode, geschreven door Dr. Kristien Ooms, is terug te vinden in de digitale bijlage van deze thesis. Bij het uitvoeren van het programma wordt een output in *.txt-formaat verkregen. Na het importeren van het bestand, worden er in Excel grafieken opgemaakt en de resultaten tot afbeeldingen afgewerkt. Het programma berekent per gridcel zowel het aantal fixaties als de totale tijdsduur van de fixaties.
3.2.7
Beschrijvende analyse
De beschrijvende of descriptieve analyse is het beschrijven van de verzamelde gegevens. De univariate descriptie bestaat uit het bestuderen van gemiddelden en spreidingsmaten van variabelen (De Pelsmacker & Van Kenhove, 2002). In dit onderdeel wordt het gemiddelde van de zoektijd, de fixatieduur en het aantal fixaties met hun standaardafwijking beschreven. De zoektijd geeft aan hoeveel tijd een testpersoon nodig heeft om de drie toponiemen op de kaart terug te vinden. Het gemiddelde wordt per stimulus en dus ook per kaarttype berekend. 37
Zo worden er in totaal twaalf gemiddelden verkregen: zes gemiddelden bij papieren kaarten en zes gemiddelden bij digitale kaarten. Lange zoektijden kan er op wijzen dat de testpersoon in kwestie het moeilijker heeft om de kaart te interpreteren. Aan de andere kant kan het puur toeval zijn dat hij of zij een bepaalde toponiem niet terugvindt. Een betere indicatie van interpretatiemoeilijkheden is de fixatieduur. Hoe langer de fixatie duurt, hoe meer tijd de testpersoon nodig heeft om de visuele informatie te verwerken. Een langere fixatieduur kan er ook op wijzen dat de visuele input interessanter is. Vermits er in deze studie enkel topografische kaarten met gelijklopende visuele eigenschappen worden gebruikt, komt de laatste opvatting niet verder in aanmerking. Alle testpersonen zijn verondersteld de kaarten te bestuderen met dezelfde graad van interesse (Ooms, 2012a). Eerst wordt er een persoonlijke gemiddelde fixatieduur per stimulus berekend. Zo draagt elke testpersoon evenveel bij aan de totale gemiddelde fixatieduur per kaart. Indien dit niet zou gebeuren krijgt elke geregistreerde fixatie evenveel gewicht toegekend tot het bekomen van het totale gemiddelde. Dit is niet de bedoeling aangezien de ene persoon veel meer fixaties kan hebben dan de andere. Als laatste wordt het fixatieaantal bestudeerd. Het aantal fixaties per seconde is sterk gerelateerd aan de fixatieduur. Hoe langer de fixaties duren, hoe minder fixaties er per seconde zijn. Door de resultaten van de fixatieduur en het aantal fixaties per seconde te combineren kan er een beter inzicht in het cognitief proces van de gebruikers worden verworven. Naast de fixatieduur speelt ook de duur van de saccades een rol. Hoe korter de saccades, hoe meer fixaties er per seconde kunnen geregistreerd worden (Ooms, 2012a). Ook hier wordt het algemeen gemiddelde verkregen uit de per stimulus berekende persoonlijke gemiddelden.
3.2.8
Statistische analyse
Op de beschrijvende analyse volgt de statistische validering waarbij wordt nagegaan in welke mate de geconstateerde verschillen aan toeval zijn toe te schrijven (De Pelsmacker & Van Kenhove, 2002). In deze thesis wordt onderzocht of er een verschil is in het visueel gedrag
tijdens het bestuderen van papieren en digitale kaarten. Hierbij stelt de nulhypothese voor dat er geen verschil is in de oogbewegingen bij het bestuderen van beide type kaarten. De alternatieve hypothese houdt in dat er wel een verschil is. In de statistische analyse wordt de 38
kans berekend en geëvalueerd dat de nulhypothese al dan niet wordt verworpen. Dit gebeurt aan de hand van een geschikte statistische toets. De mogelijke statistische toetsen worden voorgesteld in Tabel 9.
Tabel 9: Frequent gebruikte statistische toetsen Bron: De Pelsmacker & Van Kenhove, 2002 Meetniveau
Eén steekproef
Twee steekproeven
k steekproeven (k > 2)
Onafhankelijk
Afhankelijk
Onafhankelijk
Afhankelijk
McNemar
χ²
Cochran Q
Nominaal
Binominaaltoets (Ztoets op proportie) χ²
χ² Z-toets op proportie
Ordinaal
KolmogorovSmirnovtest Tekentest
Mediaantest MannWhitneytest
Interval of ratio
t-test Z-toets
t-test Z-toets
KruskalWallis- Friedman / twoTekentest test / variantie- way variantieWilcoxontest analyse analyse t-test voor verschillen
variantieanalyse
repeated measures variantie-anal.
De keuze van de statistische toets hangt af van vier criteria: de kenmerken van de populatie waaruit de steekproef is getrokken, het meetniveau van de gegevens, de manier van steekproeftrekking en het aantal steekproeven. De eerste twee criteria bepalen of de toets al dan niet parametrisch is. Parametrische toetsen kunnen enkel onder drie strikte voorwaarden gebruikt worden. Zo moet de populatie normaal verdeeld zijn en moeten ze dezelfde variantie bezitten. Daarbij moeten de variabelen op intervalniveau gemeten zijn. Aangezien aan de eerste twee voorwaarden meestal niet wordt voldaan, wordt bij de meeste toetsen een correctie voorzien (De Pelsmacker & Van Kenhove, 2002). In deze thesis worden enkel variabelen op interval- of rationiveau statistisch getest. Een parametrische toets is hier dus van toepassing. De manier van steekproeftrekking bepaalt of de steekproeven onderling al dan niet afhankelijk of gerelateerd zijn (De Pelsmacker & Van Kenhove, 2002). De steekproeven, of de groepen waartussen we de verschillen wensen te ontdekken, zijn de twee typen kaarten. Hierbij heeft een steekproefelement in de ene steekproef geen invloed op een steekproefelement in de andere steekproef. Met andere woorden gaat het hier om onafhankelijke steekproeven. Het aantal is hierbij vastgelegd op twee (papier en digitaal).
39
Door de voorgaande vier criteria wijst de tabel erop dat de t-test of de Z-toets de geschikte statistische toets is. De Z-toets wordt bij een populatie met gekende variantie gehanteerd. Als de variantie ongekend is, wat hier het geval is, wordt de t-test gebruikt. De t-test wordt op de drie, in de beschrijvende analyse, berekende gemiddelden uitgevoerd. Telkens wordt er nagegaan of er een significant verschil is tussen papieren en digitale kaarten. Hierbij wordt volgende formule gebruikt: =
|<=> − <=3 |
3 3 ? >+ 3 > 3
Waarbij <=> en <=3 de gemiddelden zijn van steekproef 1 en 2 (respectievelijk papier en
digitaal). In diezelfde steekproeven zijn > en 3 de standaardafwijkingen en > en 3 de
steekproefgroottes. Het aantal vrijheidsgraden in deze test is gelijk aan > − 1 + 3 − 1
(De Pelsmacker & Van Kenhove, 2002).
Één van de voorwaarden bij parametrische toetsing is een gelijkaardige variantie. Daarom wordt tijdens de t-test de Levene’s test of equality of variances uitgevoerd. De Levene’s test gaat na of beide groepen dezelfde variantie bezitten. Zo wordt er een nulhypothese opgesteld dat een gelijke variantie inhoudt. Of deze nulhypothese al dan niet wordt verworpen, wordt meegedeeld in de output van de t-test. Als de varianties van beide steekproeven gelijk zijn en de nulhypothese wordt niet verworpen dan kan de t-test gewoon uitgevoerd worden. Indien de nulhypothese wel wordt verworpen en de varianties dus niet gelijk zijn wordt er een correctie op de t-test uitgevoerd. De berekening van de correctie gebeurt in de statistische software (De Pelsmacker & Van Kenhove, 2002).
De statistische validering wordt in de software SPSS (Statistical Package for the Social Sciences) uitgevoerd. Het is een toepassingsprogramma om gegevens te analyseren. In deze thesis wordt versie 21 gehanteerd.
40
4.
RESULTATEN
4.1 Visuele analyse 4.1.1
Heatmaps
Een heatmap of aandachtskaart geeft aan de hand van intensiteitniveaus het visuele gedrag van een testpersoon of meerdere testpersonen weer. De intensiteitniveaus worden door een graduele schaalverdeling aangegeven (Figuur 17). De schaal is in vier gelijke segmenten verdeeld. De maximale waarde binnenin de heatmap wordt voorgesteld door 100%, de minimale waarde (in de meeste gevallen de nulwaarde) door 0%. Alle tussenliggende waarden krijgen een kleur toegekend dat procentueel afhankelijk is van de maximale waarde.
Figuur 17: Uitvergroting gradiëntschaal heatmaps Het doel van deze thesis is om mogelijke aanwezige verschillen in visueel gedrag op papieren en digitale kaarten te achterhalen. Daarom wordt voor elke stimulus een heatmap opgemaakt. Dit gebeurt aan de hand van de geregistreerde data van alle testpersonen die de stimulus hebben bestudeerd. Hierbij zijn de posities en de tijdsduur van de fixaties belangrijke gegevens. In totaal worden er twaalf heatmaps gemaakt voor de zes papieren en zes digitale stimuli. Ze worden weergegeven in Figuur 18 en 19. Vooraleer de vergelijking tussen beide formaten wordt aangevat, is het belangrijk er op te wijzen dat de maximale waarde (100% op de schaal) voor elke kaart afzonderlijk wordt berekend. Hoewel deze maximale waarden van elkaar verschillen, wordt toch dezelfde kleurenschaal gebruikt (Figuur 17). Hierdoor verwijzen de gebieden met dezelfde kleur op twee verschillende kaarten niet direct naar gelijke waarden. De waarden kunnen in elkaars buurt liggen, maar ze kunnen ook totaal verschillen of zelfs een meervoud van elkaar zijn. Uit de verscheidene heatmaps kunnen er dus geen lagere of hogere fixatie-intensiteiten achterhaald worden. Door deze mogelijke verschillen in fixatie-intensiteit kunnen de gebieden met hoogste intensiteitniveau niet naar waarde, maar wel geografisch met elkaar vergeleken
41
worden. Met andere woorden worden de heatmaps gebruikt om de posities van de hoogste intensiteitniveaus op het papieren en digitale formaat met elkaar te vergelijken. De vergelijking gebeurt telkens tussen de papieren en de digitale versie van dezelfde topografische kaart.
Figuur 18: Heatmaps voor de papieren stimuli (van links naar rechts en van boven naar onder: respectievelijk topografische kaart 1 tot en met 6)
Figuur 19: Heatmaps voor de digitale stimuli (van links naar rechts en van boven naar onder: respectievelijk topografische kaart 1 tot en met 6)
42
Voor elke topografische kaart is er een specifiek patroon dat zowel op de papieren als op de digitale versie terug te vinden is. Het patroon, dat door de gegradueerde rode kleur is gevormd, bedekt op beide formaten ongeveer dezelfde gebieden. Het patroon is enkel te herkennen als de intensiteitniveaus achterwege worden gelaten. Het maakt hier niet uit hoe lang of hoe vaak men naar dat gebied keek. Wat wel van belang is, is dat het gebied al dan niet voor enige tijd door de testpersonen werd bestudeerd. Opmerkelijk is dat de gebieden waarop de hoogste intensiteitniveaus zijn geplaatst, de locaties van de te zoeken toponiemen zijn (Bijlage 3).
4.1.2
Fixatiedistributie
4.1.2.1 Aantal fixaties Een tweede manier om de verworven data visueel te analyseren is aan de hand van een grid. Hierbij wordt het aantal fixaties volgens de gridcellen ruimtelijk verdeeld. Dit gebeurt op basis van de toegekende x- en y- coördinaten (pixels). De resultaten voor het aantal fixaties worden weergegeven in Figuur 21. De gebruikte eenkleurige graduele schaal is voorgesteld in Figuur 20. Om de resultaten van de verschillende stimuli met elkaar te kunnen vergelijken wordt er slechts één schaal gebruikt. Bij het opstellen van de schaal werd eerst gekeken naar de voorkomende maximale waarden voor alle stimuli (Tabel 10). Onder de maximale waarden zit één uitschieter, namelijk bij het digitale formaat van de vierde stimulus. De tweede grootste waarde binnen deze stimulus is kleiner dan de maximale waarden van de andere stimuli. Daarom is de waarde 38 (het maximum van de overige stimuli) als maximale waarde in de schaal geplaatst en krijgt het de meest donkere rode kleur toegekend. De uitschieter, 63 fixaties op een gridcel, wordt met een zwarte kleur gekenmerkt en is dus enkel terug te vinden op de vierde digitale stimulus.
Figuur 20: Graduele schaal voor het grid dat het aantal fixaties voorstelt
43
Tabel 10 : Maximum aantal fixaties voor alle stimuli Maximum aantal fixaties 1 2 3 4 5 6
Papier
Digitaal
30 31 31 31 23 28
28 38 27 38 (63) 25 23
In het algemeen, behalve op de derde stimulus en in mindere mate op de zesde stimulus, is er een patroon in aantal fixaties op beide formaten terug te vinden. Het patroon geeft de structuur van de stimuli aan. Hoe donkerder het rood, hoe meer fixaties er op zijn geplaatst. De hoge fixaties kunnen verwijzen naar voor de testpersonen interessante gebieden of gebieden die moeilijker te interpreteren zijn. In deze studie is het niet belangrijk te achterhalen naar wat de testpersonen juist kijken, hoewel er duidelijk te zien is dat de hogere aantallen fixaties op en rond de te zoeken toponiemen zijn geplaatst (Figuur 21). Dit zijn de enige gebieden op de stimuli waarvan zeker kan gezegd worden dat alle testpersonen ernaar gekeken hebben. Het was namelijk de opdracht om de drie toponiemen terug te vinden. Bij sommige stimuli heeft het ene formaat een meer donkere achtergrond dan het andere formaat. Zo is bij de eerste, vijfde en laatste stimulus het grid bij het digitale formaat donkerder gekleurd dan bij het papieren formaat. Bij de vierde stimulus doet het omgekeerde voor. Aangezien hier geen eenduidigheid in bestaat, kan er geen besluit genomen worden over de moeilijkheidsgraad van de interpreteerbaarheid. Om hierover een objectief oordeel te vellen dienen de gegevens kwantitatief te worden onderzocht door middel van een beschrijvende analyse en een statistische toets (zie Sectie ‘Beschrijvende en statistische analyse’).
44
Figuur 21:: Het aantal fixaties voorgesteld in een grid voor het papieren (linker kolom) en digitale (rechterkolom)) formaat van stimulus 1 tot en met 6 (van boven naar onder)
45
Het aantal fixaties per gridcel kunnen ook gevisualiseerd worden volgens een driedimensionale grafiek. Hierbij wordt een derde dimensie aan het grid toegevoegd. In de grafiek vertrekt vanuit elke gridcel een staaf waarvan de hoogte overeenkomt met de waarde in de cel (Ooms, 2012c). De driedimensionale voorstelling van het totaal aantal fixaties voor de twaalf stimuli zijn voorgesteld in de Figuren 22, 23 en 24. Aan de hand van deze visualisatie kan de vergelijking van de fixatieaantallen voor papieren en digitale formaten gedetailleerder verlopen. Hoewel de waarden in deze grafieken beter worden geïllustreerd, is de ruimtelijke locatie van de cellen moeilijker te achterhalen. In de schuine weergave worden de kleinere staven verborgen door voorstaande groter staven. Hierdoor is de ruimtelijke verdeling van de waarden in de driedimensionale grafiek minder duidelijk dan op het normale tweedimensionaal grid. Beide voorstellingen vullen elkaar aan in het type informatie dat ze beter kunnen weergeven (Ooms, 2012c). In de Figuren 22, 23 en 24 zijn de twee soorten formaten telkens naast elkaar geplaatst. Dit zorgt ervoor dat de vergelijking gemakkelijker kan worden uitgevoerd. Let er op dat de uitschieter van de vierde stimulus ervoor zorgt dat de y- as op Figuur 23 grotere waarden bezit dan op de twee andere figuren. Op de driedimensionale grafieken is van de eerder opgemerkte vier patronen (stimulus 1, 2, 4 en 5) diegene op de vierde stimulus het beste te herkennen (Figuur 23). Voor stimulus 1, 2 en 5 heeft de grafiek van het digitale formaat meer hogere staven dan de grafiek van het papieren formaat. Dit wijst op meer fixaties op die bepaalde cellen. Of er in het algemeen meer fixaties aanwezig zijn, kan hier niet achterhaald worden. De voorste hoge staven verbergen de staven die er achter staan.
Figuur 22: 3D grafiek van aantal fixaties voor papieren en digitale stimulus 1 en 2
46
Figuur 23: 3D grafiek van aantal fixaties voor papieren en digitale stimulus 3 en 4
Figuur 24: 3D grafiek van aantal fixaties voor papieren en digitale stimulus 5 en 6 4.1.2.2 Totale fixatieduur Ook de totale fixatieduur wordt volgens een grid ruimtelijk voorgesteld. De resultaten worden voorgesteld in Figuur 26. Hiervoor werd voor alle stimuli dezelfde eenkleurige graduele schaal gebruikt (Figuur 25). Dit zorgt ervoor dat de resultaten op een juistere manier met elkaar vergeleken worden. De maximale waarde in de schaal (15600 ms) wordt, op één na, door geen enkele stimuli overschreden. De uitzondering op deze regel komt voor bij de digitale versie van vierde stimulus (Tabel 11). Ongeveer centraal op de kaart is een uitschieter met waarde 21290 ms te vinden. Deze uitschieter was te verwachten aangezien er bij dezelfde
47
stimulus al één aanwezig was bij het berekenen van het aantal fixaties. Het hoog aantal fixaties resulteert meestal in een hogere fixatieduur. Ook hier wordt in de schaal de uitschieter afzonderlijk beschouwd en in een zwarte kleur gezet. Dit gebeurt omdat de tweede grootste waarde van de stimulus kleiner is dan de aanvaarde maximale waarde van de schaal.
Figuur 25: Graduele schaal voor het grid dat de totale fixatieduur (ms) voorstelt
Tabel 11 : Maximale fixatieduur (ms) voor alle stimuli Maximale fixatieduur (ms) Papier Digitaal 1 2 3 4 5 6
11595 13236 15600 13781 8633 9085
9194 10744 8450 13337 (21390) 9268 10245
In Figuur 26 is op de meeste stimuli min of meer een patroon terug te vinden dat op beide formaten voorkomt, maar heel duidelijk zijn de patronen niet. Het is terug op te merken dat de cellen met de hoogste tijdsduur in fixaties telkens op en rond de te zoeken toponiemen zijn geplaatst. Dit is terug te verklaren aan de hand van de opdracht die de testpersonen kregen. Op de eerste drie stimuli is het resultaat over het algemeen donkerder bij het digitale formaat. Dit kan erop wijzen dat de testpersonen die deze versie hebben gezien meer tijd nodig hadden om de opdracht te voltooien dan diegene die de papieren versie hebben gezien. Maar dit verschil is net zoals bij het aantal fixaties niet in alle stimuli duidelijk terug te vinden. Ook hier wordt voor een objectief oordeel terug verwezen naar Sectie ‘Beschrijvende en statistische analyse’.
48
Figuur 26: De totale fixatieduur (ms) voorgesteld in een grid voor het papieren (linker kolom) en digitale (rechterkolom) formaat van stimulus 1 tot en met 6 (van boven naar onder)
49
Ook hier wordt de totale fixatieduur voor de twaalf stimuli in driedimensionale grafieken voorgesteld (Figuren 27, 28 en 29). De twee soorten formaten zijn terug naast elkaar geplaatst om gemakkelijker de vergelijking uit te voeren. Let er op dat de uitschieter van de vierde stimulus ervoor zorgt dat de y-as op Figuur 28 grotere waarden bevat dan op de twee andere figuren. In tegenstelling tot de driedimensionale grafieken bij het aantal fixaties (Sectie 4.1.2.1) zijn er geen duidelijke patronen op beide formaten van de stimuli terug te vinden. Net zoals op de afbeeldingen in Figuur 21 is hier op te merken dat er voor stimulus 1 en 2 meer cellen zijn die een langere totale fixatieduur hebben bij het digitale formaat dan bij het papieren formaat. De derde stimulus geeft op het eerste zicht het omgekeerde aan. Maar ook hier worden de staven achter de voorste grote staven verborgen, waardoor de ware grote niet achterhaald kan worden.
Figuur 27: 3D grafiek van totale fixatieduur voor papieren en digitale stimulus 1 en 2
50
Figuur 28:: 3D grafiek van totale fixatieduur voor papieren en digitale stimulus 3 en 4
Figuur 29:: 3D grafiek van totale fixatieduur voor papieren en digitale stimulus 5 en 6
4.2 Beschrijvende en statistische tatistische analyse
4.2.1
Gemiddelde zoektijd
Hoeveel tijd een testpersoon nodig had om de drie toponiemen op de kaart terug te vinden wordt gedefinieerd door de zoektijd. Het algemeen gemiddelde over alle testpersonen en alle kaarten is 146,842 s of 2.447 minuten met een standaardafwijking van 97,367 s. De grote spreidingsmaat wijst erop dat de zoektijden tussen de verschillende personen of kaarten sterk 51
kunnen verschillen. Maar dit kan ook aan enkele grote uitschieters te wijten zijn. In Tabel 12 worden de gemiddelden en standaarddeviaties per kaart (van 1 tot 6, respectievelijk Assesse, Ciney, Daussois, Leignon, Onhaye en Walcourt) en per formaat (papier en digitaal) weergegeven. Dezelfde waarden worden voorgesteld in Figuur 30. Aan de hand van de figuur en de tabel is op te merken dat de gemiddelden van de zes kaarten onderling bij elk formaat sterk verschillen. De gemiddelde waarden bij het papieren formaat verschillen onderling tot 77,47 s. Het maximale verschil bij de kaarten in digitale vorm is 67,02 s. Ook de standaarddeviaties wijken bij beide kaarten sterk van elkaar af. Belangrijker is de resultaten van de twee formaten met elkaar te vergelijken. De gemiddelde zoektijd voor de papieren kaarten is 147,306 s met een standaarddeviatie van 114,500 s. Voor de digitale kaarten is de gemiddelde waarde 146,391 s met standaarddeviatie 78,054 s. Het verschil tussen beide gemiddelden is nog geen één seconde. De standaarddeviaties geven aan dat de zoektijden bij de papieren kaart meer variëren. Figuur 30 geeft aan dat bij vier van de zes kaarten de gemiddelde zoektijd langer duurt voor het digitale formaat dan voor het papieren formaat. Dit zou er op kunnen wijzen dat de digitale kaarten moeilijker te interpreteren zijn. Bij de eerste en de derde kaart, de twee kaarten waarbij de gemiddelde zoektijd bij het papieren formaat langer duurt, is het verschil tussen de gemiddelden duidelijk merkbaar. Hierbij zijn de standaarddeviaties bij de papieren kaarten opvallend groot.
Tabel 12 : Gemiddelde waarden en standaarddeviaties (in s) van de zoektijd Papier Gem. Stdev 1 2 3 4 5 6
134,583 146,422 198,151 162,910 123,033 120,782
137,745 117,637 145,550 127,633 76,006 77,553
Digitaal Gem. Stdev 113,537 178,752 149,879 180,556 136,053 130,544
45,887 119,999 64,901 93,384 71,293 55,821
52
Gemiddelde zoektijd 400 350
Tijd (s)
300 250 200
Papier
150
Digitaal
100 50 0 1
2
3
4
5
6
Stimulus
Figuur 30: Gemiddelde waarden van de zoektijd (in s) Als er in het achterhoofd wordt bijgehouden welke kaarten aan welke groep testpersonen werden onderworpen, dan is er een patroon terug te vinden. Zo zag een groep testpersonen de eerste kaart in digitale vorm, de tweede kaart in papieren formaat, de derde kaart terug in digitale vorm, enzovoort. Het gaat hier om de personen met oneven volgnummer. De andere groep, de testpersonen met even volgnummer, startte met de eerste kaart in papieren formaat, waarbij de daaropvolgende kaarten iedere keer van formaat werden afgewisseld. Het patroon vormt zich dat deze laatste groep testpersonen op één kaart na telkens gemiddeld meer tijd nodig had om de drie toponiemen terug te vinden. De uitzondering op die regel geldt voor kaart 5. Dit patroon kan erop wijzen dat de gemiddelde zoektijd eerder afhankelijk is van de testpersonen dan van de kaartformaten. Om na te gaan of de eerder waargenomen verschillen tussen beide formaten significant zijn wordt een statistische test opgemaakt. Daarin worden de zoektijden van de 68 papieren en 70 digitale kaarten gebruikt. Eerst wordt onderzocht of de varianties van beide steekproeven (papier en digitaal) gelijk zijn. De Levene’s test geeft aan dat de nulhypothese, waarbij de varianties worden gelijkgesteld, wordt verworpen op een betrouwbaarheidsinterval van 95% (F = 7,032, P = 0,009 < 0,05). Er wordt dus aangenomen dat de varianties van beide steekproeven niet gelijk zijn. Door deze ongelijkheid wordt er een correctie uitgevoerd tijdens de t-test. Dit geeft als resultaat dat op een betrouwbaarheidsinterval van 95% er geen significant verschil is tussen de gemiddelde zoektijd van papieren en digitale kaarten (P =
53
0,956 > 0,05). Dit was te verwachten aangezien het verschil tussen de gemiddelde zoektijden van beide formaten miniem (0,916 s) is.
4.2.2
Gemiddelde fixatieduur
De tijdsduur van de fixaties kunnen interpretatiemoeilijkheden aantonen. Hoe langer de fixatie duurt, hoe meer tijd de persoon nodig heeft om de visuele informatie te verwerken (Ooms, 2012a). Het algemeen gemiddelde van de fixaties van alle testpersonen op alle kaarten is gelijk aan 268,158 ms. Hierbij is de standaarddeviatie 186,321 ms. De tijdsduur van de fixaties kunnen dus sterk van elkaar verschillen. In Tabel 13 worden de gemiddelde waarden met hun standaarddeviaties per kaart en formaat opgelijst. Om deze waarden te bekomen werd eerst de gemiddelde fixatieduur per stimulus voor elk testpersoon berekend. Over al die persoonlijke gemiddelden wordt dan per kaart een nieuw gemiddelde berekend wat de uiteindelijke waarden oplevert. Figuur 31 stelt dezelfde waarden voor in een grafiek. Hierbij valt op dat de standaarddeviatie van de eerste kaart in papieren formaat veel hoger is dan alle andere standaarddeviaties. Bij deze stimulus variëren de persoonlijke gemiddelden dus meer dan bij de andere stimuli. Hiervoor is geen verklaring te vinden. Als de gemiddelde waarden van beide formaten uit Tabel 13 met elkaar vergeleken worden dan zijn er geen opvallende afwijkingen op te merken. Bij de standaarddeviaties daarentegen valt het op dat de waarden bij de papieren stimuli telkens groter zijn dan deze bij de digitale kaarten. Dit wijst op meer variatie in de persoonlijke gemiddelden bij het papieren formaat dan bij het andere medium. Ook hiervoor is er geen verklaring te vinden.
Tabel 13: Gemiddelde waarden en standaarddeviaties (in ms) van de fixatieduur
1 2 3 4 5 6
Papier Gem. Stdev
Digitaal Gem. Stdev
225,70 275,48 261,44 273,46 258,51 274,33
254,94 248,76 271,31 248,32 272,11 248,10
87,09 40,27 48,54 37,49 34,53 34,86
32,26 36,47 46,70 32,27 29,77 25,93
54
Gemiddelde fixatieduur 350
Tijd (ms)
300 250 Papier
200
Digitaal 150 100 1
2
3
4
5
6
Stimulus
Figuur 31: Gemiddelde waarden van de fixatieduur (in ms) Ook in Figuur 31 is hetzelfde patroon als bij de gemiddelde zoektijden terug te vinden. Het is een patroon dat erop kan wijzen dat de gemiddelde waarden van de fixatieduur eerder afhankelijk zijn van de testpersonen dan van de kaartformaten. Het is namelijk zo dat de zelfde groep testpersonen bij elke kaart er voor zorgt dat de gemiddelde fixatieduur bij het geziene formaat langer duurt dan bij het ander formaat. In dit geval gaat het om de testpersonen met oneven volgnummer, diegene die de eerste kaart in digitale vorm verkregen. Om een algemeen gemiddelde per formaat te verkrijgen worden de persoonlijke gemiddelden van alle kaarten in rekening gebracht. De gemiddelde fixatieduur voor de papieren stimuli is 265,652 ms met een standaarddeviatie van 40,160 ms. Voor het digitale formaat is het gemiddelde gelijk aan 257,594 ms. met een standaarddeviatie van 34,827 ms. Hieruit wordt afgeleid dat de testpersonen meer moeite hadden om de papieren stimuli te interpreteren dan de digitale stimuli. Maar om na te gaan of dit verschil significant is, dient de statistische test worden uitgevoerd. Daarbij worden de persoonlijke gemiddelden voor de 68 papieren en 70 digitale stimuli als data gebruikt. Eerst wordt de Levene’s test uitgevoerd om na te gaan of de varianties van beide steekproeven (papier en digitaal) gelijk zijn aan elkaar. Het resultaat geeft aan dat de nulhypothese niet mag worden verworpen (F = 2,242 en P = 0,137 > 0,05) en dat de varianties gelijk zijn aan elkaar met een betrouwbaarheidsinterval van 95%. Dit zorgt er voor dat er geen correcties dienen worden uitgevoerd op de t-test. Daaruit volgt dat de nulhypothese, waarbij het verschil als niet
55
significant is opgesteld, met een betrouwbaarheidsinterval van 95% wordt behouden (P = 0,210 > 0,05). Dit wil zeggen dat het verschil tussen de gemiddelde fixatieduur van beide formaten niet significant is en dus eerder aan toeval te wijten is.
4.2.3
Gemiddelde fixatieaantal per seconde
Het gemiddeld aantal fixaties per seconde kan meer informatie geven over het visueel gedrag van de testpersonen. Zoals al eerder vermeld, staat het aantal fixaties per seconde in verband met de fixatieduur. Het algemeen gemiddelde van alle testpersonen op alle stimuli is gelijk aan 3,139 fixaties per seconde met een standaarddeviatie van 0,409 fixaties per seconde. In Tabel 14 worden de gemiddelden en standaarddeviaties per stimulus en per formaat weergegeven. Dezelfde waarden worden in een grafiek voorgesteld (Figuur 32). Zowel bij de papieren als bij de digitale stimuli zijn er geen merkwaardig grote verschillen tussen de gemiddelden en standaarddeviaties te vinden. Wat uit Figuur 32 wel opvalt, is dat het gemiddeld aantal fixaties per seconde voor alle kaarten groter is bij het digitale formaat dan bij het papieren medium. Het grotere fixatieaantal kan wijzen op kortere fixaties en/of kortere saccades. Aangezien de fixatieduur al is onderzocht en geen significante verschillen zijn opgemerkt, zal het verschil in fixatieaantal per seconde tussen beide formaten voornamelijk te wijten zijn aan de lengte van de saccades. De significantie van het verschil in aantal fixaties per seconde wordt statistisch nagegaan.
Tabel 14: Gemiddelde waarden en standaarddeviaties van het aantal fixaties per seconde
1 2 3 4 5 6
Papier Gem. Stdev
Digitaal Gem. Stdev
3,00 2,94 2,96 2,93 3,07 2,99
3,36 3,27 3,26 3,33 3,26 3,26
0,44 0,51 0,41 0,44 0,35 0,33
0,38 0,42 0,41 0,31 0,29 0,37
56
Aantal fixaties/s
Gemiddelde aantal fixaties per seconde 4,00 3,80 3,60 3,40 3,20 3,00 2,80 2,60 2,40 2,20 2,00
Papier Digitaal
1
2
3
4
5
6
Stimulus
Figuur 32: Gemiddelde waarden van het aantal fixaties per seconde (1/s) Het gemiddeld aantal fixaties per seconde voor de 68 papieren en 70 digitale stimuli zijn respectievelijk 2,981 en 3,293 fixaties/s met standaarddeviaties van 0,402 en 0,356 fixaties/s. Deze waarden geven duidelijk het eerder opgemerkt verschil aan. Vooraleer de t-test de significantie van het verschil nagaat, wordt de Levene’s test gebruikt. Daaruit blijkt dat de varianties van beide steekproeven (papier en digitaal) aan elkaar gelijk zijn met een betrouwbaarheidsinterval van 95% (F = 0,580 en P = 0,448 > 0,05). Dit zorgt ervoor dat er geen correctie wordt uitgevoerd op de t- test. Als resultaat wordt de nulhypothese, waarbij het verschil als niet significant wordt geacht, verworpen met een betrouwbaarheidsinterval van 95% (P = 0,000 < 0,05). Het verschil in het gemiddeld aantal fixaties per seconde is dus niet aan het toeval toe te schrijven. Tegen alle verwachtingen in wordt uit deze resultaten besloten dat de digitale kaarten gemakkelijker te interpreteren zijn dan de papieren kaarten. Hieruit blijkt dat de beperkte resolutie en kleurvoorstelling geen negatief effect op het kijkgedrag heeft.
57
5.
DISCUSSIE
5.1 Dataselectie Het is belangrijk om de dataselectie zo correct mogelijk uit te voeren. De resultaten van de thesis zijn tenslotte gebaseerd op de geselecteerde data. De selectie gebeurde op basis van drie elementen: de nauwkeurigheid, de tracking ratio en de locatie van de fixaties. Een strenge controle op elk van deze elementen zou een kleine selectie hebben opgebracht. Daarom is het van belang om de drie componenten min of meer samen te controleren. De selectie is ook afhankelijk van het doel van de studie. In deze thesis wordt er nagegaan of er verschillen zijn in het visueel gedrag bij het bestuderen van een topografische kaart in papieren en digitale vorm. Hierbij wordt geen rekening gehouden met wat er juist op de kaart wordt afgebeeld. Zo wordt er bijvoorbeeld niet onderzocht aan welke kaartelementen bij het zoeken van toponiemen de meeste aandacht wordt besteed. Belangrijker is het onderzoeken van de eigenschappen (bijvoorbeeld tijdsduur en aantal) van de fixaties. Deze elementen zijn een indicatie van hoe gemakkelijk of moeilijk de kaart in een bepaalde formaat te interpreteren is. Per testpersoon werd de nauwkeurigheid van de kalibratie en de tracking ratio bijgehouden. Door het opstellen van grenswaarden kan er in feite al snel een objectieve selectie worden voltooid. Maar dit zou ervoor kunnen zorgen dat er data wordt geëlimineerd, terwijl ze voor deze studie aanvaardbaar zijn. Om dit te verkomen gebeurt er een visuele controle van de data. In OGAMA bestaan er verscheidene tools om de verworven data te visualiseren. Dit kan per stimulus in functie van de tijd of door een totaalbeeld. Tijdens de visuele controle wordt er aan de hand van heatmaps en gridvisualisaties van de locaties van fixaties onderzocht hoe realistisch de data is. Dit wordt voornamelijk gecontroleerd via de spreiding en de posities van de fixaties. Aangezien deze controle per stimulus verloopt, kan het zijn dat voor één testpersoon slechts enkele stimuli wordt aanvaard voor verder onderzoek. Als de controle enkel op de nauwkeurigheid van de kalibratie en de tracking ratio was gebaseerd, zou alle data van een testpersoon aanvaard of geëlimineerd worden. Omdat er dus met verscheidene componenten rekening moest worden gehouden, nam de dataselectie veel tijd in beslag. Dit komt voornamelijk door de visuele controle. Het was ook noodzakelijk deze controle uit te voeren. Als gevolg van het visuele nazicht werden er geen bruikbare data geweigerd voor verder onderzoek. Ook werden er nu bruikbare data aanvaard, 58
die zonder het nazicht zou zijn geweigerd. Het nadeel is dat de visuele controle minder objectief gebeurt dan een selectie enkel gebaseerd op cijfers.
5.2 Visuele analyse 5.2.1
Heatmaps
Om de data van geregistreerde oogbewegingen voor te stellen, wordt al snel een heatmap gebruikt. Ook in deze studie zijn er aandachtskaarten voor de twaalf stimuli aangemaakt. Aangezien de software alle rekenwerk uitvoert, zijn de kaarten vrij gemakkelijk op te bouwen. Toch zijn de aangemaakte heatmaps in deze thesis minder bruikbaar dan voorzien. Naast een snel verkrijgbare voorstelling van de gegevens, zijn er heel wat nadelen aan verbonden. Ten eerste worden er heel wat kleuren gebruikt om de intensiteitniveaus weer te geven. De kleuren ogen mooi, maar ze zijn cartografisch niet correct. Met deze reden is er een eenkleurige schaal aangemaakt. Bij het opstellen van de schaal komt al een tweede minpunt naar boven. In OGAMA is de classificatie van de schaal enkel gradueel te bepalen. Hierbij wordt de maximale waarde van de heatmap automatisch als 100% beschouwd en worden de andere waarden daarop procentueel berekend. Binnen de schaal kan de maximale waarde niet aangepast worden. Hieruit volgt dat alle stimuli hun eigen maximale waarde als 100% neemt en de intensiteitniveaus niet overal uit gelijke waarden bestaan. Dit zorgt ervoor dat de verschillende heatmaps niet op basis van fixatie-intensiteit met elkaar kunnen vergeleken worden. Het enige dat in vergelijking kan worden gesteld is de locatie of het patroon van de met rode kleur overdekte gebieden. Dit gebeurt zonder naar de intensiteitniveaus te kijken. Maar ook dit is een tast in het donker. Hieruit kunnen geen afdoende besluiten genomen worden. Verder is de maximale waarde van de schaal niet alleen onbewerkbaar, ook is ze ongekend. Wat de maximale waarde en dus de 100% juist voorstelt, is nergens terug te vinden in de software van OGAMA. Moest dit wel het geval zijn, dan kon er toch een vergelijking tussen de papieren en digitale stimuli worden uitgevoerd, rekening houdende met de verschillende maximale waarden. Zo is er niet alleen onwetendheid over de maximale waarde, maar ook de tussenliggende waarden zijn ongekend.
59
Als laatste minpunt kan er ook aangehaald worden dat het vergelijken van heatmaps moeilijk op een objectieve manier kan gebeuren. Aangezien het hier niet om reële cijfers gaat, kruipt er altijd enige subjectiviteit in de besluiten. Door al deze nadelen wordt het gebruik van het programma OGAMA om heatmaps op te maken voor verder onderzoek afgeraden. Door alle voorkomende minpunten was er een alternatieve visualisatie van de data uitgebouwd. Het aantal fixaties en de totale fixatieduur werden er volgens een grid berekend en voorgesteld.
5.2.2
Fixatiedistributie
Omdat er aan de hand van de heatmaps moeilijk een vergelijking tussen de papieren en digitale stimuli kon gemaakt worden, werd een nieuwe visualisatie opgesteld. Het aantal fixaties en de totale fixatieduur werden volgens hun x- en y- coördinaten in een grid van 22 x 35 cellen gevisualiseerd. Via het JAVA tool fr2grid, dat door de Vakgroep Geografie beschikbaar werd gesteld, werden alle berekeningen uitgevoerd. De opstelling van de schaal, de figuren zelf en de grafieken gebeurden in Excel. In tegenstelling bij de heatmaps in OGAMA, kon de schaal in Excel zelf worden uitgekozen. Omdat de waarden vrij uiteenlopend waren, werd er gekozen voor een graduele schaal. Het gebruik van slechts één kleur (rood) komt de cartografische correctheid ten goede. Om de verschillende afbeeldingen van beide soorten stimuli met elkaar te kunnen vergelijken, werd de schaal op elkaar afgestemd. Zo werd er voor alle stimuli slechts één maximale waarde (100%) gekozen. De minimale waarde (0%) werd telkens op 0 gezet. Dit zorgt er ook voor dat alle tussenliggende waarden voor alle stimuli telkens dezelfde intensiteit van de rode kleur bevat. Het opstellen van de schaal gebeurde zowel voor het visualiseren van het aantal fixaties als van de totale fixatieduur op dezelfde wijze. Naast de tweedimensionale visualisaties volgens een grid, werden er ook driedimensionale grafieken aangemaakt. Deze laatste visualisatie gaf meer inzicht op de grootheid van de waarden. De waarden worden namelijk door de lengte van de staven voorgesteld. Uit de meeste visualisaties kon er een gelijkaardig patroon van intensiteit tussen het papieren en digitale formaat gehaald worden. Maar er waren ook afbeeldingen en grafieken waaruit 60
geen patroon konden worden afgeleid. Daarnaast waren er visualisaties waar het digitale formaat over het algemeen een donkere achtergrond hadden dan het papieren formaat. Maar ook deze waarneming gold niet voor alle stimuli. Daarbij waren de bemerkingen niet altijd even duidelijk terug te vinden op de grafieken. Daar was er het probleem dat de grote staven vooraan de kleinere staven er achter verborgen. Zo kon er geen uitspraak gedaan worden over deze laatste staven. Uit de verkregen afbeeldingen en grafieken konden geen eenduidige besluiten genomen worden. Soms was een waarneming duidelijker op te merken op de ene visualisatie dan op de andere. Maar door beide visualisaties met elkaar te combineren kan er meer inzicht verworven worden van de voorgestelde waarden. Net zoals bij de heatmaps wordt de vergelijking op een ietwat subjectieve manier uitgevoerd. De besluiten hangen in feite af van wat de onderzoeker net wel en niet waarneemt.
5.3 Beschrijvende en statistische analyse Tijdens de beschrijvende analyse worden de geselecteerde gegevens aan de hand van de gemiddelden en standaarddeviaties omschreven. Dit descriptieve onderzoek geeft een beter inzicht in de verworven waarden. Ook hier wordt er nagegaan of er enige verschillen tussen de papieren en digitale kaarten aanwezig zijn. Na de beschrijving volgt de statistische toets dat controleert of de aanwezige verschillen al dan niet significant zijn. De componenten die werden onderzocht zijn: de zoektijd, de fixatieduur en het aantal fixaties.
5.3.1
Gemiddelde zoektijd
De zoektijd definieert de tijd dat een testpersoon nodig had om de drie toponiemen op de kaart terug te vinden. De gemiddelde waarden en de standaarddeviaties van de twaalf verschillende stimuli variëren sterk van elkaar. Als de gemiddelde waarden voor de papieren en digitale stimuli naast elkaar worden geplaatst (zoals in Figuur 30), dan is er telkens een verschil in tijd op te merken. Maar het verschil is niet telkens in dezelfde zin. Bij twee van de zes stimuli is de gemiddelde zoektijd voor het papieren formaat langer dan deze voor het papieren formaat. Hier mogen de standaarddeviaties zeker niet uit het oog worden verloren.
61
Deze geven aan dat de zoektijden in waarden een grote spreiding hebben. De grote spreiding kan ook te wijten zijn aan enkele uitschieters. Dit gaat dan om mensen die de drie toponiemen uitzonderlijk snel of pas na een lange tijd hebben teruggevonden. Bij het analyseren van de zoektijden werd er aangehaald dat de resultaten wel eens afhankelijk kunnen zijn van de testpersonen in plaats van het formaat. Deze uitspraak is gekomen door een zichtbaar patroon (met uitzondering voor kaart 5) dat in Figuur 30 is waar te nemen. De mogelijkheid mag niet zomaar afgewimpeld worden. Het kan inderdaad voorkomen dat in één van beide groepen, in dit geval de groep met even volgnummer, enkele personen zitten die voor alle geziene kaarten een behoorlijk langere zoektijd hadden dan een gemiddeld ander persoon. Maar dit kan evengoed aan het toeval toe te schrijven zijn. De statistische toets bepaalt dat er, met een betrouwbaarheidsinterval van 95%, geen significant verschil is tussen de gemiddelde zoektijden van de papieren en digitale kaarten. Dit was te verwachten vermits het verschil tussen de gemiddelden nog geen seconde telt. In feite is de zoektijd het minst waardige component van de drie om te onderzoeken. De grote standaarddeviaties (of spreidingen) worden snel bekomen. Het kan altijd gebeuren dat je een bepaalde toponiem toevallig niet vindt en daardoor worden er vlug wat seconden bijgeteld. Belangrijker zijn de andere twee componenten (fixatieduur en fixatieaantal).
5.3.2
Gemiddelde fixatieduur
Hoe langer de fixatie duurt, hoe meer tijd de persoon nodig heeft om de visuele informatie te verwerken. Met andere woorden kan de tijdsduur van de fixaties interpretatiemoeilijkheden aantonen (Ooms, 2012a). Ook bij deze resultaten is het eerder besproken patroon in Figuur 31 terug te vinden. Ook hier wijs het er op dat de resultaten eerder afhankelijk van de testpersonen kunnen zijn dan van het formaat (papier of digitaal). Maar ook hier blijft het een vermoeden tot de uitspraak bewezen is. Dit kan misschien in een volgend onderzoek van de data gebeuren. Aangezien de verschillen in de gemiddelde fixatieduur tussen de formaten voor de verscheidene kaarten niet eenduidig zijn, is te verwachten dat het verschil in het algemeen gemiddelde voor papier en digitaal niet significant is. En dit gezegd zijnde: de t-test geeft met een betrouwbaarheidsinterval van 95% aan dat het verschil aan toeval te wijten is. 62
5.3.3
Gemiddelde fixatieaantal per seconde
Als laatste werd het gemiddeld aantal fixaties per seconde beschrijvend en statistisch geanalyseerd. Terwijl in de Sectie ‘Fixatiedistributie’ het totaal aantal fixaties werd gebruikt, wordt hier het aantal fixaties gedeeld door het aantal seconden dat de persoon nodig had om de opdracht te voltooien. Dit zorgt ervoor dat de zoektijd geen invloed heeft op de resultaten. Hoe groter het fixatieaantal , hoe korter de fixaties of de saccades en hoe gemakkelijker de stimulus te interpreteren is. Tabel 14 en Figuur 32 geven duidelijk weer dat de digitale stimuli meer fixaties per seconde bezitten dan de papieren stimuli. De statistische toets wijst erop dat het verschil in gemiddelde waarden voor beide formaten wel degelijk met een betrouwbaarheidsinterval van 95% significant is. Tegen alle verwachtingen in wordt hier vastgesteld dat de digitale kaarten gemakkelijker te interpreteren zijn dan de papieren kaarten. De lagere resolutie van het beeldscherm zou dus toch geen invloed hebben gehad op de zoekacties die de testpersonen uitvoerden.
63
6.
BESLUIT
Het doel van deze thesis is het achterhalen van verschillen in het kijkgedrag bij het bestuderen van papieren en digitale kaarten. Hierbij wordt verwacht dat de gebruiker de digitale kaart moeilijker vindt te interpreteren door de invloed van de schermweergave. De resolutie van het scherm is echter lager dan de papieren afbeelding en de kleuren worden er anders voorgesteld. De mogelijke verschillen in het kijkgedrag kunnen erop wijzen dat het ontwerpproces voor de digitale kaart moet worden bijgestuurd. Er werden verscheidene manieren aangehaald om de eventuele verschillen tussen beide media te achterhalen. Tegen alle verwachtingen in volgden er geen eenduidige resultaten. Tijdens de visuele analyse werden er heatmaps aangemaakt. Door de slechte opmaak kon er moeilijk verschillen of gelijkenissen worden opgemerkt. Als alternatieve visualisatie werd een grid van 22 op 35 cellen op het kaartbeeld geplaatst. Daarop werd het totaal aantal fixaties en de fixatieduur berekend. Ook hier konden geen concrete verschillen worden waargenomen. Het enige wat uit de visualisaties kon worden afgeleid, is dat de testpersonen zich telkens hebben gefixeerd op de te zoeken toponiemen. Ze hebben dus hun opdracht goed voltooid. Aan de hand van een beschrijvende en statistische analyse worden de fixatiegegevens op een objectieve manier onderzocht. Hierbij wordt de gemiddelde zoektijd, de gemiddelde fixatieduur en het gemiddeld aantal fixaties per seconde berekend. Uit de eerste twee elementen zijn er geen eenduidige verschillen in het kijkgedrag van papieren en digitale kaarten waar te nemen. Wel wordt er opgemerkt dat de bekomen resultaten eerder afhankelijk zijn van de testpersonen in plaats van het type kaart. Of dit inderdaad zo is, kan in toekomstig onderzoek worden nagegaan. Het gemiddeld aantal fixaties per seconde levert wel een ondubbelzinnig resultaat dat significant is met betrouwbaarheidsinterval van 95%. In tegenstelling tot alle verwachtingen wordt hier besloten dat de digitale kaarten gemakkelijker te interpreteren zijn dan de papieren kaarten. Dit wijst erop dat de resolutie en de kleurvoorstelling van het scherm geen negatieve invloed heeft op het kijkgedrag. De data dat in deze studie is verworven, kan nog voor verder onderzoek worden gehanteerd. Zo kan er nog verdere analyse gebeuren aan de hand van de vragenlijst (opsplitsen van man/vrouw of landmeter/geograaf). In de toekomst kan de relatie tot de landschapselementen en de mogelijke zoekstrategieën nog worden onderzocht. 64
7.
REFERENTIELIJST
7.1 Literatuur Bondarenko, O., Janssen, R. (2009) “Connecting Visual Cues to Semantic Judgments in the Context of the Office Environment”. Journal of the American Society for Information Science and Technologie. 60 (5), 933-952. Davson, H. (1980) Physiology of the Eye (4th ed.). New York: Academic Press. De Maeyer, Ph. (2009) Cartografie. Gent: Academia Press. De Maeyer, Ph. (2010) GI-Management: Management van en met geografische informatie. Gent: Academia Press. De Pelsmacker, P., Van Kenhove, P. (2002) Marktonderzoek methoden en toepassingen. Antwerpen: Garant.
Dodge, R. (1906) “Recent Studies in the Correlation of Eye Movement and Visual Perception”. Psychological Bulletin. 34(4), 455-470. Dodge, R., Cline, T.S. (1901) “The Angle Velocity of Eye Movements”. Psychological Review. 8(2), 85-92. Duchowski, A.T. (2007) Eye Tracking Methodology; Theory and Practice. London: Springer. Erdmann, B., Dodge, R. (1898) Psychologische Untersuchungen uber das Lesen, auf Experimenteller Grundlage. Goldberg, H.J., Wichansky, A.M. (2003) “Eye Tracking in Usability Evaluation: A Practitioner’s Guide”. In: Hyönä, J., Radach, R., Deubel H. (Eds.) The Mind’s Eye: Cognitive and Applied Aspects of Eye Movements Research. In London: Elsevier, pp. 493-516.
65
Gregory, R.L. (1990) Eye and Brain: The Psychology of Seeing. Princeton, NJ: Princeton University Press. Hendee, W.R., Wells, P.N.T. (1997) “The Perception of Visual Information”. New York: Springer. Hurst, P., Clough, P. (2013) “Will We Be Lost without Paper Maps in the Digital Age?”. Journal of Information Science. 39 (1), 48-60. Jacob, R.J.K., Karn, K.S. (2003) “Eye Tracking in Human-Computer Interaction and Usability Research: Ready to Deliver the Promises”. In: Hyönä, J., Radach, R., Deubel H. (Eds.) The Mind’s Eye: Cognitive and Applied Aspects of Eye Movements Research. In London: Elsevier, pp. 573-605. Johnson, W., Jellinek, H.D., Klotz, L., Rao, R., Card, S.K. (1993) “Bridging the Paper and Electronic Worlds: The Paper User Interfase”. Proceedings of INTERCHI ‘93. 507-512. Leigh, R.J., Zee, D.S. (1991) The Neurology of Eye Movements (2nd ed.). Philadelphia: F.A. Davis. Ooms, K., De Maeyer, Ph., Fack, V., Van Assche, E., Witlox, F. (2012a) “ Interpreting Maps through the Eyes of Export and Novice Users”. International Journal of Geographical Information Science. 26 (10), 1773-1788. Ooms, K., Andrienko, G., Andrienko, N., De Maeyer, Ph., Fack, V. (2012b) “Analysing the Spatial Dimension of Eye Movement Data using a Visual Analytic Approach”. Expert Systems with Applications. 39, 1324-1332. Ooms, K., De Maeyer, Ph., Fack, V. (2012c) “Understanding Expert and Novice Map Users: Reading and Interpretation”. In: Ooms, K. (2012) Maps, How Do Users See Them? An in Depth Investigation of the Map Users’ Cognitive Processes. Gent. 97-134.
66
Pederson, P., Farrell, P., McPhee, E. (2005) “Paper versus Pixel: Effectiveness of Paper versus Electronic Maps To Teach Map Reading Skills in an Introductory Physical Geography Course”. The Journal of Geography. 104 (5), 195-202. Peterson, M.P. (1997) “Trends in Internet Map Use”. Proceedings of the 18th International Cartographic Conference. 3, 1635-1642. Pool, A., Ball, L.J. (2006) “Eye Tracking in Human Computer Interaction and Usability Research: Current Status and Future Prospects”. Encyclopedia of Human Computer Interaction. 211-219. Richardson, D.C., Spivey, M.J. (2004) “Eye Tracking: Characteristics and Methods”. In: Wnek, G, Bowlin, G (Eds.) Encyclopedia of Biomaterials and Biomedical Engineering. SensoMotoric Instruments GmbH (2010) Experiment Center 2 Manual Version 2.4. Duitsland. Shebilske, W.L., Fisher, D.F. (1983) “Understanding Extended Discourse through the Eyes: How and why”. In: Groner, R, Menz, C., Fisher, D.F., Monty, R.A. (Eds.) Eye Movements and Psychological Functions: International Views. In Hillsdale, NJ: Lawrence Erlbaum, pp. 303-314. Spakov, O., Miniotas, D. (2007) “Visualization of Eye Gaze Data using Heat Maps”. International Journal of Electrical and Electronics Engineering Research. 74 (2). Verdi, M.P., Crooks, S.M., White, D.R. (2003) “Learning Effects of Print and Digital Geographic Maps”. Journal of Research on Technology in Education. 35 (2), 290-302. Voßkühler, A., (2009) “OGAMA Description (for Version 2.5) A software to record, analyze and visualize gaze and mouse movements in screen based Environments”. Berlijn: Freie Universität Berlin, Fachbereich Physik, Didaktik der Physik (http://www.ogama.net/sites/default/files/pdf/OGAMA-DescriptionV25.pdf)
67
Young, L.R., Sheena, D. (1975) “Survey of Eye Movement Recording Methods”. Behavior Research Methods & Instrumentation.7(5), 397-439.
7.2 Internetbronnen http://www.smivision.com. 16/08/2012. http://www.ngi.be. 12/10/2012. http://www.ogama.net. 10/02/2013.
68
8.
BIJLAGEN
Bijlage 1: Kaartbeelden van de gebruikte topografische kaarten met oorspronkelijke schaal 1 /10 000, in volgorde (kaart 1 tot en met 6): Assesse 54/1 Nord, Ciney (Est) 45/2 Sud, Daussois 52/8 Sud, Leignon 54/6 Nord, Onhaye 53/7 Nord en Walcourt 52/8 Nord
69
70
71
72
73
74
Bijlage 2: Te zoeken toponiemen per topografische kaart
Kaart 1
Kaart 2
Kaart 3
Francesse
Kaart 4
Haie du Capitaine
Grande Agauche
Maurlire
Wavremont
Néringotte
Bois Magrite
Kaart 5
Communes
Les Caves
Grande Prairie
Scoville
Pistolet
La Vaucelle
Kaart 6
Al Coustrie
Mortinmont
Grimiée
Niverzé
Sau Poquet
75
Bijlage 3: Spreiding toponiemen op de topografische kaarten (van links naar rechts en van boven naar onder, respectievelijk kaart 1 tot en met 6)
76
Bijlage 4: Vragenlijst Wat is je geslacht? o Man o Vrouw Wat is je positie (student/medewerker) binnen de vakgroep? o Derde Bachelor, afstudeerrichting Geografie o Derde Bachelor, afstudeerrichting Geomatica en Landmeetkunde o Eerste Master, afstudeerrichting Geografie o Eerste Master, afstudeerrichting Geomatica en Landmeetkunde o Tweede Master, afstudeerrichting Geografie o Tweede Master, afstudeerrichting Geomatica en Landmeetkunde o Medewerker (of assistent) aan de vakgroep Was je al vertrouwd met gebieden weergegeven op de kaart? Zo ja, welke? o Neen o Assesse (La Fontaine, Natoye, Herbefays, Maibelle) o Ciney (Embtinne, Mohiville, Pessoux, Monin) o Daussois (Jamiolle, Jamagne, Faubourg, Fontaine) o Leignon (Corbion, Namorilment, Haid, Haversin) o Onhaye (Falien, Serville,Sommiere, Weillen) o Walcourt (Chastres, Fraire, Lanette, Yves-Gomezee) Nam je tijdens het zoeken een bepaalde zoekstrategie aan? Zo ja, welke? o Neen o …
77