FACULTEIT WETENSCHAPPEN
Opleiding Geografie en Geomatica Master in de Geomatica en Landmeetkunde
Een methodologische studie naar het verplaatsingsgedrag van studenten met behulp van GPS Ward Van Hal
Aantal woorden in tekst:15589
Promotor: Prof. Dr. Philippe De Maeyer, vakgroep Geografie
Academiejaar 2009 – 2010 Masterproef ingediend tot het behalen van de graad van Master in de Geomatica en Landmeetkunde
WOORD VOORAF Graag wil ik mijn oprechte dank betuigen aan de mensen die geholpen hebben bij het verwezenlijken van deze studie. Vanzelfsprekend dank ik in de eerste plaats mijn promotor Philippe De Maeyer, die me de kans en het vertouwen gaf dit project tot een goed einde te brengen. Zijn deskundigheid vormde samen met de constructieve hulp van Bart De Wit een uiterst goede combinatie die tot dit resultaat geleid heeft. Mijn dank gaat ook uit naar al de andere personen die op één of andere manier meegewerkt hebben aan dit project. Ik denk daarbij aan alle studenten, vrienden en familie, die gedurende een zekere periode data verzameld hebben, maar ook aan alle assistenten die steeds klaar stonden om praktisch advies te geven. Zonder hen was deze studie onmogelijk. Ook kan ik mijn ouders en familie niet vergeten te bedanken. Ze steunde me op elke mogelijke wijze, waarbij ze me toch zonder enige beperkingen mijn eigen weg lieten gaan. Tenslotte bedank ik mijn vriendin en mijn vrienden. Zij zorgden voor de talrijke ontspanningsmomenten. Ward Van Hal
2
INHOUDSTABEL
INHOUDSTABEL .................................................................................................................... 3 LIJST VAN FIGUREN EN TABELLEN .............................................................................. 5 1. INLEIDING .......................................................................................................................... 6 2. REGISTRATIETECHNIEKEN ......................................................................................... 9 2.1 Evolutie van de technieken voor het registreren van verplaatsingsgedrag ................. 9 2.2 Verschillende toepassingsgebieden van de techniek ..................................................... 11 3. GPS-APPARAAT ............................................................................................................... 13 3.1 Sterkte van GPS ten opzichte van andere sensors of technieken ................................. 13 3.2 Algemene zwakten van GPS als sensorsysteem ............................................................. 14 3.2.1 Beperkingen ..................................................................................................................... 14 3.2.2 Nauwkeurigheden ............................................................................................................ 16 4. DATA-AQUISITIE ............................................................................................................ 19 4.1 Voorbereidingen ............................................................................................................... 19 4.1.1 Keuze van GPS-apparaat ................................................................................................ 19 4.1.2 Potentiële deelnemers ..................................................................................................... 21 4.2 Instructies .......................................................................................................................... 21 4.3 Datacollectie ...................................................................................................................... 22 5. DATAVERWERKING ...................................................................................................... 23 5.1 Filteren en smoothing ....................................................................................................... 25 5.2 Coördinatentransformatie ............................................................................................... 29 5.3 Detectie van trips .............................................................................................................. 33 5.4 Detectie van de modus...................................................................................................... 34 5.5 Splitsen van samengestelde trips ..................................................................................... 37 5.6 Map-matching ................................................................................................................... 41
3
6. RESULTATEN ................................................................................................................... 42 6.1 Analyse van de techniek ................................................................................................... 42 6.1.1 Bijkomend onderzoek ...................................................................................................... 42 6.1.1.1 Methodiek..................................................................................................................... 42 6.1.1.2 Resultaten ..................................................................................................................... 44 6.1.1.3 Besluit........................................................................................................................... 47 6.1.2 Visuele interpretatie ........................................................................................................ 48 6.2 Analyse van de resultaten ................................................................................................ 52 6.1.1 Tijdstippen van de verplaatsingen................................................................................... 53 6.1.1 Vervoersmiddelen van de verplaatsingen ....................................................................... 55 6.1.1 Belangrijkste toegangswegen van en naar campus de Sterre ......................................... 57
7. BESLUIT............................................................................................................................. 59 REFERENTIELIJST ............................................................................................................. 60 BIJLAGE ................................................................................................................................ 65
4
LIJST VAN FIGUREN EN TABELLEN
Figuur 1: GPS-ontvangers van respectievelijk (a) 2002, (b) 2005 en (c) 2010 ....................... 15 Figuur 2: Multipath-effect of meerwegsinterferentie. ............................................................. 18 Figuur 3: (a) Igot-U 120, (b) Garmin forerunner 405 ............................................................. 20 Tabel 1: GPS-records in beweging .......................................................................................... 27 Figuur 4: gevolgen van het multipath-effect ........................................................................... 28 Figuur 5: Resultaat van het toepassen van de twee filtermethoden ........................................ 29 Figuur 6: Extraheren van trips uit de gefilterde data. (a) ruwe data, (b) twee geëxtraheerde trips .......................................................................................................................................... 34 Figuur 7: Linken van een trip aan een spoornetwerk. (a) twee voorwaarden, (b) meer dan 75% van de punten valt samen ........................................................................................................ 37 Tabel 2: Splitsen van samengestelde trips ............................................................................... 39 Tabel 3: Voorbeeld van een uittreksel van het vergelijkingsprogramma ................................ 43 Tabel 4: Resultaten van dataverwerking groep 1 .................................................................... 45 Tabel 5: Resultaten van dataverwerking groep 2 .................................................................... 46 Tabel 6: Uittreksel van GPS-records van de trip afgebeeld in figuur 8 ................................. 49 Figuur 8: Verschil van de ruwe data en de geëxtraheerde data ............................................... 49 Figuur 9: Verschil tussen de gemeten koers en de werkelijke koers ...................................... 50 Figuur 10: Verschil in aantal spikes afhankelijk van de modus .............................................. 51 Figuur 11: Gevolg van het niet splitsen van een samengestelde trip ...................................... 52 Figuur 12: Verschil tussen de tijdstippen van de verplaatsingen afgelegd door de studenten en door de algemene bevolking ................................................................................................... 53 Figuur 13: Locaties waarlangs de student zich na 22u hoofdzakelijk verplaatst .................... 54 Figuur 14: Frequentiegrafiek van al de verplaatsingen met de auto of bus t.o.v. een zekere afstand ..................................................................................................................................... 55 Figuur 15: Frequentiegrafieken van de verplaatsingen van respectievelijk (a) fiets en (b) voet t.o.v. een zekere afstand .......................................................................................................... 56 BIJLAGE 1. Verplaatsingsgedrag van de Gentse studenten ..................................................................... 65 2. Verplaatsingsstroom van en naar de campus S8 .................................................................. 66 3. Volledig vergelijkingsrapport .............................................................................................. 67 4. Programma dataverwerking ................................................................................................. 67
5
1. INLEIDING Onderzoek
naar
verplaatsingsgedrag
vormt
een
belangrijk
hulpmiddel
voor
de
mobiliteitsspecialisten, zoals ruimtelijke planners en verkeerskundigen. Dit slag van onderzoek stelt hen immers in staat een bepaald transportsysteem te plannen, te ontwerpen, te evalueren en te onderhouden. Over de jaren heen werden verscheidene procedures ontwikkeld om dit soort van onderzoek te realiseren. De procedures kunnen grofweg opgedeeld worden in volgende fasen: datacollectie, data-analyse, eventueel een visualisatie en ten slotte een interpretatie. Vandaag zijn de traditionele technieken zoals de dagboeken en de telefooninterviews
vooralsnog
de
meest
frequent
gebruikte.
Aangezien
deze
registratiemethoden een relatief actieve participatie van de deelnemers vergen, sluipen onnauwkeurigheden in het onderzoek. Vandaar werd een zoektocht opgestart ter ontwikkeling van een moderne procedure, die de tekortkomingen van de traditionele methoden teniet doet of tenminste significant reduceert (Schuessler & Axhausen, 2009).
Een mogelijkheid voor het wegwerken van deze tekortkomingen bestaat uit de toepassing van de zogenaamde geopositioneringssystemen, zoals GPS. GPS (Global Positioning System) is een op satellieten gebaseerd radionavigatiesysteem dat in 1973 ontwikkeld werd door het Amerikaanse Department of Defence (DoD) (Eissfeller et al., 2007). GPS bestaat uit vierentwintig satellieten, die om de aarde cirkelen en signalen uitzenden naar de GPSontvangers. Op die manier wordt het mogelijk informatie te verkrijgen over de locatie van de ontvanger. (Duncan et al., 2008)
De positie van de ontvanger wordt berekend aan de hand van een afstandsmeting tussen de ontvanger zelf en tenminste vier of meer GPS-satellieten. Elke satelliet is uitgerust met een atoomklok. Voor het gebruik dient het GPS-apparaat eerst een initialisatieperiode te doorlopen. Tijdens deze tijdsspanne worden de signalen van de satellieten ontvangen en wordt de GPS-klok gesynchroniseerd met die van de satellieten. De GPS-apparaten ontvangen en analyseren de radiosignalen onafgebroken en berekenen daaruit de afstand tot elke zichtbare satelliet. Aan de hand van trilateratie kan men vervolgens de correcte locatie, snelheid en richting bekomen (Maddison & Ni Mhurchu,, 2009). GPS is in vergelijking met het Russische GLONASS en zeker met het Europese Galileo het enige volledig opereerbare satellietsysteem (Eissfeller et al., 2007).
6
De toegang tot systemen zoals GPS kende de laatste tien jaar een enorme groei en expandeert nog steeds. De toenemende behoefte aan zulke systemen werkte bovendien een drastische prijsdaling in de hand en maakte van de GPS in vele mobiele telefoons of andere communicatieapparaten een standaardfunctie. Waar het systeem door de modale gebruiker vooralsnog hoofdzakelijk toegepast werd voor autonavigatie, duikt het gebruik van GPS steeds frequenter op in het recreatieve leven, zoals tijdens het fietsen, lopen of het zogenaamde geocaching1. Naast deze navigatie- en oriëntatiefunctie kan het apparaat ook nog gebruikt worden voor tracking, waardoor het mogelijk wordt een afgelegde route in de vorm van coördinaten en tijdstippen in een logfile bij te houden. Op deze manier wordt het eenvoudig spatio-temporele data te verzamelen en zo menselijke activiteit te registeren (van der Spek et al., 2009).
De verplaatsing van auto‟s vormde al het voorwerp van meerdere onderzoeksprojecten, waarbij een procedure ontwikkeld werd waarin de verplaatsingen van de voertuigen tijdens een bepaalde tijd aan de hand van een GPS-apparaat geregistreerd werden. Toch zou een accuraat onderzoek naar verplaatsingsgedrag ook alle andere transportmodi in de analyse moeten betrekken. Verplaatsingen te voet, met de fiets, of met het openbaar vervoer mogen dus niet verwaarloosd worden. Bovendien registreert autogebonden onderzoek enkel verplaatsingen gerelateerd aan de auto en niet noodzakelijk aan de gebruiker (Shoval & Isaacson, 2005). Een persoonsgebonden GPS-studie dringt zich op.
Hoewel de procedure recent ook in andere takken van de wetenschappen wordt gebruikt, blijft het echte onderzoek naar de techniek met de noodzakelijke dataverwerking eerder schaars. Deze studie tracht dan ook een methodologische bijdrage te leveren tot het onderzoek naar verplaatsingsgedrag met behulp van een persoonsgebonden GPS. Meer concreet wordt er nagegaan welke waarde er aan de GPS kan worden toegekend als sensortechniek voor het waarnemen van het verplaatsingsgedrag van mensen, met bijzondere aandacht voor verplaatsingen in steden.
Om dit te achterhalen werd een project opgericht waarbij 123 studenten van de Gentse faculteit wetenschappen gedurende twee weken met behulp van een GPS-logger werden getrackt, wat resulteerde in ongeveer 1700 geregistreerde dagen met ongeveer 1000000 GPS1
Geocaching is de recreatieve bezigheid waarbij personen voorwerpen verstoppen op locaties waarvan de precieze coördinaten op internet is terug te vinden. (http://www.geocaching.be, 10 augustus 2010)
7
records in totaal. Om de omslachtigheid van de procedure voor de deelnemers zo laag mogelijk te houden, werd van hen slechts een minimale actieve bijdrage in het registratieproces vereist. Zij dienden geen bijkomende informatie over de afgelegde verplaatsingen te leveren. Een geavanceerde verwerking van de verzamelde data blijkt bijgevolg onontbeerlijk om enige zinvolle informatie, zoals vervoersmodus en begin- en eindpunt van een verplaatsing, uit deze grote hoeveelheid van GPS-records te extraheren. Hiervoor wordt een applicatie in JAVA ontwikkeld.
De resultaten van het onderzoek zouden uiteindelijk een antwoord moeten kunnen bieden op de belangrijkste mobiliteitsvragen. Hoe en waarmee verplaatsen studenten zich hoofdzakelijk in de stad Gent? Zijn er grote verplaatsingspatronen waar te nemen? Welke weg neemt men om van de ene naar de andere locatie te gaan? Nemen studenten die nog niet vertrouwd zijn met de stad Gent andere wegen? Wat zijn de drukst bezette wegen op een bepaald ogenblik? Welke vervoersmiddelen worden er gebruikt om een zekere afstand te overbruggen? …
In het eerste deel van dit onderzoek worden de globale technieken voor het bepalen van verplaatsingsgedrag besproken. Er wordt dieper ingegaan op de evolutie van deze technieken en de verschillende toepassingen die gebruik maken van deze technieken. In het tweede deel wordt er naar het meest geschikte sensorapparaat gezocht voor de uitvoering van zulk onderzoek. De verschillende zwakten van GPS als sensorsysteem worden geanalyseerd, alsook de voordelen van het gebruik van GPS ten opzicht van andere technieken. In de volgende twee delen worden achtereenvolgens de twee hoofdfasen waarin het onderzoek grofweg kan opgedeeld worden, besproken. De eerste fase omvat het veldwerk met de noodzakelijke datacollectie. Hierbij worden alle voorzorgsmaatregelen besproken die nodig zijn om tot bruikbare data te komen. In de volgende fase, de dataverwerking, worden de verschillende methoden overlopen die noodzakelijk zijn om zinvolle informatie uit de data te extraheren.
In het vijfde deel worden vervolgens de resultaten besproken. Hierbij wordt eerst de gebruikte techniek geëvalueerd aan de hand van een bijkomend onderzoek en een visuele interpretatie. Hieraan wordt een bespreking van de globale verplaatsingspatronen geknoopt. Ten slotte wordt er in de conclusie geëvalueerd of de vooropgestelde techniek de vragen van de mobiliteitsanalyst voldoende kan beantwoorden.
8
2. REGISTRATIETECHNIEKEN
2.1 Evolutie van de technieken voor het registreren van verplaatsingsgedrag
Het onderzoek naar het menselijke verplaatsingsgedrag nam een hoge vlucht sinds de jaren „70. Toenmalige geografen, onder anderen Hägerstrand en Anderson, bestudeerden dit soort van gedrag aan de hand van ver doorgedreven empirische testen wat tot aanzienlijke theoretische ontwikkelingen leidde (van der Spek et al., 2009). De laatste twintig jaar merkt men een duidelijke stijging in publicaties omtrent het verplaatsingsgedrag bij mensen, een onderwerp dat binnen de sociale wetenschappen steeds belangrijker werd. Daarenboven kreeg het onderwerp begin jaren „90 nog meer aandacht in het kader van de nog recente ontwikkelingen van de geografische informatiesystemen. Toch blijven twee belangrijke uitdagingen op gebied van menselijke verplaatsingsgedrag bestaan (Shoval & Isaacson, 2006): (1) hoe kan men ruimtelijke activiteit zo correct mogelijk registreren en (2) hoe kan men de plaats van een bepaalde activiteit lokaliseren op een gegeven tijdstip?
Momenteel is de meest gebruikte methode om data te verzamelen over menselijke activiteit de “tijdruimte-budgettechniek” (Shoval & Isaacson, 2006). Deze techniek registreert menselijke activiteit in tijd en ruimte gedurende een bepaalde tijd, meestal tussen een dag en een week. De techniek maakt tot nu toe gebruik van enkele gekende procedures: telefooninterviews en de zogenaamde tijdruimtelijke dagboeken. De dagboeken hebben het voordeel dat ze zeer gedetailleerde en accurate informatie kunnen bevatten, aangezien men met behulp van een dagboek in tegenstelling tot de telefooninterviews op elk moment van de dag activiteiten kan bijhouden.
De dagboekmethode wordt ondermeer toegepast door het departement van mobiliteit en openbare werken van de Vlaamse regering. Gedurende twee dagen worden ongeveer 2000 personen
per
provincie
belast
met
het
invullen
van
zulk
dagboek
(http://www.mobielvlaanderen.be/ovg, 1 augustus 2010). Ook de vakgroep civiele techniek van de Universiteit Gent deed eerder al onderzoek naar het verplaatsingsgedrag van studenten aan de hand van enquêtes (De Mol, 1999). Het onderzoek moest meer informatie bieden omtrent de vervoersmiddelen en het aantal verplaatsingen van een student.
9
Hoewel deze methodes vandaag de dag nog vaak worden gebruikt, verschaffen ze inaccurate data, aangezien ze methodologische gebreken vertonen. Ze eisen immers dat het subject zelf zijn acties actief registreert gedurende een bepaalde tijd, en maken zich hierdoor volledig afhankelijk van de betrouwbaarheid en nauwgezetheid van het subject. Dit heeft zonder twijfel een weerslag op de kwaliteit van de verzamelde data. Er is daarom ook al heel wat onderzoek verricht naar de problematiek van het vinden van geschikte deelnemers en naar het falen van de uiteindelijke deelnemers om hun activiteiten getrouw te registeren (Szalai, 1972). Toch zijn er al voorbeelden waarbij het gebruik van deze methodologie toch op een succes uitdraaide (Goodchild and Klinkenberg 2000).
Tegenwoordig verlangt de mobiliteitsanalyst steeds meer accurate reisgegevens op verschillende tijdstippen van de dag en op verschillende locaties. Ook informatie over de precies afgelegde weg op een gegeven netwerk wordt steeds belangrijker. Zonder GPSapparaat is het vergaren van zo‟n informatie zeer moeilijk tot onmogelijk. GPS biedt zeker in combinatie met een geschikt Geografisch Informatie Systeem (GIS) de mogelijkheid om zeer nauwkeurige data te verkrijgen over de locatie van een persoon, voertuig of ander object op een bepaald tijdstip, welke route wordt afgelegd, snelheid van het object en begin- en eindpunt van de verplaatsing (Schuessler & Axhausen, 2009).
Oorspronkelijk werd de nieuwe techniek met behulp van GPS slechts gebruikt om gemotoriseerde voertuigen te traceren. Het gebruik van de GPS als registratietechniek om informatie te verzamelen omtrent het verplaatsingsgedrag van voetvangers bleef de laatste jaren beperkt tot een tool dat men kan gebruiken in verschillende toepassingen van de gezondheidssector en ruimtelijke planning. Maar het echte onderzoek naar de kwaliteit van de nieuwe registratietechnologie is eerder beperkt. Eén van de redenen waarom het gebruik ervan voorlopig zo goed als onbestaande bleef, is het feit dat het verzamelen van zulke gegevens meer inspanning vergt dan het verzamelen van ruimtelijke gegevens van gemotoriseerde voertuigen (Stopher et al., 2003). Een geavanceerd trackingsysteem in een auto is slechts één van de vele accessoires die men kan installeren. Het wordt bovendien steeds voorzien van stroom wanneer het systeem in werking moet treden waardoor de data geen hiaten vertonen. Een trackingsysteem voor voetgangers moet zowel klein als passief zijn, twee voorwaarden die vroeger zeker niet verenigbaar waren. De GPS-apparaten kenden de laatste jaren een grote evolutie waardoor tracking voor voetgangers wel mogelijk werd (cf. infra).
10
2.2 Verschillende toepassingsgebieden van de techniek
Met het toenemende gebruik en de recente ontwikkelingen van de GPS en andere registratietechnologieën stijgen ook de wetenschappelijke publicaties over deze technologieën en de toepassingen ervan. Het ligt voor de hand dat deze technologieën zich hoofdzakelijk ontwikkeld hebben in het gebied van de transportwetenschappen. In dit vakgebied wordt de mogelijkheid tot tracking aanzien als één van de grootste concepten om nieuwe technologieën te ontwikkelen en om de huidige commerciële markt en de algemene samenleving beter te begrijpen (Stopher et al., 2008).
Toch wordt de technologie ook steeds meer in andere vakgebieden ingezet. Zo onderzochten van der Spek et al. (2009) of de techniek geschikt is in de stedenbouw en ruimtelijke planning. Aan de hand van de vergaarde data werd bepaald welke straten van een bepaalde stad een opknapbeurt verdienden. Op dezelfde manier werd de techniek door Bradley & Dunlop (2005) gebruikt om de speciale maatregelen die getroffen werden voor slechtzienden te evalueren en te verbeteren.
De techniek kent bijzonder veel toepassingen in verschillende takken van de gezondheidswereld. Zo maakten Elgethun k. et al (2007) een vergelijking tussen GPS-data van kinderen en een dagboek opgemaakt door de betrokken ouders. Het onderzoek wilde aantonen dat kinderen zich vaker in de omgeving van pesticiden ophouden dan hun ouders beweerden. In meer dan 50% van de gevallen bleek er een verschil te bestaan tussen de respectieve registratiemethoden. Landau et al. (2010) onderzochten dan weer of de techniek gebruikt kon worden om een zeker stadium van dementie vast te stellen. Als patiënten steeds een verschillende weg nemen om toch eenzelfde eindpunt te bereiken en wanneer er veel doelloze verplaatsingen worden geregistreerd, vormden dit indicaties tot dementie.
Op het gebied van de sportwetenschappen wordt dan weer onderzocht of de GPS een beter alternatief vormt dan de pedometer en acceleratiemeter om fysieke activiteit te meten (Le Faucher et al., 2007). De technologie wordt dan ook meer en meer gebruikt in het recreatieve leven. De meeste sporthorloges zijn uitgerust met een GPS-ontvanger die alle bewegingen registreert, wat uiteindelijk resulteert in een mooi rapport van de afgelegde prestatie. Ook
11
andere activiteiten zoals het geocaching en geotagging, waarbij foto‟s gekoppeld kunnen worden aan een bepaalde locatie en omgekeerd, zijn in trek. (De Maeyer, 2010)
12
3. GPS-APPARAAT
Het registeren van menselijke activiteit is niet beperkt tot het gebruik van uitsluitend een GPS. De zogenaamde land-based detectiesystemen, zoals mobiele telefonie, RFID2 en bluetooth vormen naast de satellietsystemen de tweede groep van trackingsystemen (Shoval & Isaacson, 2006). Maar omwille van de omvang van deze studie en de vooropgestelde nauwkeurigheid, hebben deze systemen afzonderlijk te veel beperkingen. De combinatie van één van deze sensorsystemen samen met GPS kan dan weer wel voor een meerwaarde zorgen (Himpe, 2010). In deze studie wordt er enkel gebruik gemaakt van GPS. Eerst worden de voordelen van het gebruik van GPS ten opzichte van de andere sensors of besproken. Vervolgens worden de algemene zwakheden van GPS als sensorsysteem overlopen.
3.1 Sterkte van GPS ten opzichte van andere sensors of technieken
Ten eerste bieden GPS-records meer gedetailleerde informatie zowel met betrekking tot de ruimtelijke als tot de temporele resolutie: zeker in tegenstelling tot de dagboeken en de telefooninterviews, waar er nauwelijks of zelfs helemaal geen ruimtelijke component aanwezig is, biedt een GPS-apparaat meer accurate data. De ruimtelijke en temporele resolutie bij het gebruik van RFID of bluetooth hangt af van de densiteit van de sensorontvangers (Shoval & Isaacson, 2006). Hoe hoger de densiteit, hoe hoger de resolutie. Ook bij mobile phone tracking is de nauwkeurigheid van de plaatsbepaling afhankelijk van de concentratie van de GSM-antennes, wat in een stedelijke omgeving overeenkomt met ongeveer 50 meter. In landelijke omgeving, waar de concentratie van de antennes veel minder hoog is, degradeert de nauwkeurigheid snel. De ruimtelijke nauwkeurigheid van een GPSlogger ligt tussen de 10 en 20 meter, terwijl de temporele resolutie net zoals bij mobile Phone tracking naar eigen noden kan aangepast worden.
Ten tweede voorkomt het gebruik van GPS een tekort aan registratie van verplaatsingen, wat een typische beperking is van de dagboeken en zeker van de telefooninterviews (Du & Aultman-Hall, 2007). Aangezien deze laatste zich louter baseren op de herinneringen van de deelnemers, kan de lijst met de verschillende reizen onvolledigheden bevatten. Hoofdzakelijk RFID (Radio Frequency Identification) is een technologie die door middel van radiosignalen de unieke identificatie van producten, dieren en personen op afstand mogelijk maakt . (http://www.rfidnederland.nl, 10 augustus 2010)
13
de kleine verplaatsingen worden hierdoor vaak niet opgenomen. Zolang er bij de land-based detectiesystemen
voldoende
ontvangstsystemen
of
zendsignalen
zijn,
zullen
alle
verplaatsingen worden geregistreerd. GPS-signalen kunnen over heel de wereld worden ontvangen en zijn dus onafhankelijk van enige apparatuur aanwezig op de grond. Toch zijn er enkele situaties die de ontvangst van zulke signalen hypothekeren (cf. infra).
Ten slotte wordt bij het gebruik van GPS de last van de deelnemers tot een minimum beperkt, zolang het gebruik niet gecombineerd wordt met een uitgebreide vragenlijst om zo aanvullende informatie te vergaren zoals vervoerswijze, reisdoelen, …. De last bij telefooninterviews en dagboeken ligt beduidend hoger, wat tot inaccurate data leidt (Schuessler & Anhausen, 2009). Er wordt bijgevolg naar een zo passief mogelijk systeem gezocht, waarbij de activiteitengraad van de deelnemers tot een minimum wordt herleid. Een goed voorbeeld van een passief systemen is het registreren van voertuigen met behulp van GPS. Wanneer een voertuig start, treedt ook de GPS-functie in werking. Vanaf dat moment wordt er zo goed als altijd geregistreerd, aangezien de GPS-ontvanger op een optimale plaats bevestigd kan worden. Als de opgeslagen records nu ook automatisch naar een centrale databank worden verzonden, kan men spreken van een volledig passief systeem.
3.2 Algemene zwakten van GPS als sensorsysteem
3.2.1 Beperkingen
Het onderzoek naar het verplaatsingsgedrag van mensen aan de hand van een GPS-apparaat staat nog in de kinderschoenen. De vele beperkingen van de vroegere GPS toestellen, opgesomd door Stopher et al. (2008), maakten zulk onderzoek onmogelijk. Pas in 1997 werd een eerste onderzoek met een GPS verricht, die werd gekoppeld aan een PDA. De toenmalige GPS-apparaten beschikten niet over een eigen batterij en over eigen opslagruimte. Bovendien moest men data invoeren vooraleer een reis verder te zetten. Daarvoor waren bekwame deelnemers met voldoende kennis van software en hardware noodzakelijk. Zulke systemen worden dan ook actieve GPS genoemd. Snel zag men in dat zo‟n actieve participatie tot onvolledige en inaccurate data leidde en dat men moest overschakelen naar volledig passieve systemen. Zo deed men in 1999 een
14
onderzoek waarbij men een „draagbaar‟ GPS-apparaat met een zelfstandige batterij gebruikte. Maar met zijn twee kilogram bleek deze toch niet zo draagbaar te zijn. Met de jaren werden de apparaten steeds lichter en kleiner. In 2002 woog een apparaat nog 300 gram, in 2005 nog maar 100 gram, wat vergelijkbaar is met een GSM, en de huidige GPS loggers wegen slechts 30 gram (zie figuur 1).
a) b) Figuur 1: GPS-ontvangers van respectievelijk (a) 2002, (b) 2005 en (c) 2010 Bron: (a) en (b) Stopher et al., 2008 en (c) http://www.trackstick.com, 3 augustus 2010
c)
Ook de opslagcapaciteit van de toestellen werd steeds groter. Met de opkomende technologie van de Flash memory viel de beperking van opslagcapaciteit weg. De huidige loggers beschikken veelal over een flash geheugen van 4 MB. Dit komt overeen met een opslagcapaciteit van ongeveer 200000 records. Met een instelbaar trackingsinterval van 6 seconden zou ongeveer 330 uur van verplaatsing geregistreerd kunnen worden. Sommige loggers slaan de records niet op wanneer geen verplaatsing geregistreerd wordt, wat voor extra opslagcapaciteit zorgt (Du & Aultman-Hall, 2007). Met een gemiddelde verplaatsing van een persoon van ongeveer 2 uur per dag, zou er in ideale omstandigheden gedurende 160 dagen getrackt moeten kunnen worden. De nieuwere modellen beschikken ook over bluetooth, wat uitwisseling van de data mogelijk maakt met elk ander apparaat dat over bluetooth beschikt.
De prijs van zulke systemen bleef ook dalen, zeker wanneer de loggers op de markt kwamen. Dit zijn systemen die uitsluitend uitgerust zijn met een GPS-antenne en opslaggeheugen en kunnen niet gebruikt worden bij navigatie. De goedkoopste loggers zijn nu verkrijgbaar voor 50 euro. Tot op vandaag blijft de lage levensduur van de batterijen het grootste struikelblok (Michael et al., 2008). Deze levensduur schommelt bij de meeste huidige loggers rond de 24 uur. Een hogere levensduur van de batterij zou het hele systeem nog passiever maken, wat de 15
volledigheid van de verkregen data ten goede komt. Bovendien worden de meeste van de huidige loggers voorzien van een batterij die via een USB-poort kunnen worden opgeladen (Stopher et al. 2008).
3.1.1 Nauwkeurigheid
De kwaliteit van een GPS-studie is afhankelijk van de manier waarop de data-analyst rekening houdt met nauwkeurigheid van de verkregen GPS data. In ideale omstandigheden ligt de nauwkeurigheid van een absolute plaatsbepaling aan de hand van een goedkope GPSontvanger tussen de vijf en tien meter. In realiteit bekomt men echter veel minder nauwkeurige resultaten als gevolg van verschillende foutenbronnen. Zo kunnen bijvoorbeeld in stedelijke gebieden minder dan vier satellieten, nodig voor het bepalen van een driedimensionale positie en een tijdsmeting, zichtbaar zijn. Zelfs als er voldoende satellieten zichtbaar zijn, kunnen ze te dicht bij elkaar geplaatst zijn wat voor een hoge Position Dilution of Precision (PDOP) kan zorgen (Rainham et al., 2008). Samen met zogenaamde warme start / koude start probleem vormen ze de belangrijkste fouten die men kan plaatsen onder de groep van systematische fouten bij GPS-metingen.
Wanneer men een GPS-apparaat voor het eerst inschakelt, heeft het apparaat een initialisatieperiode nodig waarbij de GPS-ontvanger het vereiste aantal satellietsignalen tracht te registeren. Deze initialisatieperiode is specifiek voor GPS-apparatuur en hun duur hangt af van de gebruikte merken en modellen. Men maakt een onderscheid tussen een warme start of koude start tijdens de initialisatieperiode. Men spreekt van een warme start wanneer het GPSapparaat nog recent gebruikt is en wanneer het ten opzichte van het vorige gebruik geen significante verplaatsing heeft ondergaan. Het apparaat onthoudt de UTC tijd, maar niet de satellieten die voor het laatst gebruikt werden. Een gebouw binnen en buiten gaan kan bijvoorbeeld aanzien worden als een warme start.
Een koude start daarentegen ondervindt men als het apparaat gedurende een hele tijd niet meer gebruikt is of het na signaalverlies een grote verplaatsing heeft gemaakt. Het apparaat verwijdert alle informatie die opgeslagen is bij het vorige gebruik. Bijgevolg duurt een koude start langer aangezien geen bekende informatie aanwezig is (Duncan et al., 2008). Volgens
16
Stopher et al. (2008) is een typische duur voor een warme start ongeveer 5 seconden, terwijl men voor een koude start ongeveer 45 seconden moet wachten.
De tweede groep fouten zijn de toevallige fouten. Hieronder moeten de fouten verstaan worden die veroorzaakt worden door satellietbaanwijzigingen, klok, atmosferische en ionosferische effecten, multipath en signaalblokkade (Jun et al., 2007). Hierbij wegen de multipath-fouten, ook wel de meerwegsinterferentie genoemd, en de signaalblokkade zwaar door op de gemiddelde fout.
De fout ten gevolge van het multipath-effect ontstaat wanneer het satellietsignaal, alvorens de ontvanger te bereiken, eerst gereflecteerd wordt op een massief voorwerp op het aardoppervlak (ontvanger-multipath) of in de satelliet zelf (satelliet-multipath). De grootte van fouten, veroorzaakt door het multipath-effect is afhankelijk van de sterkte van het gereflecteerde signaal en de vertraging ervan in vergelijking met het rechtstreekse signaal. Als het padverschil tussen het gereflecteerd signaal en direct signaal groter is dan een chiplengte, dan zal dit verschijnsel gedetecteerd worden in het correlatieproces en wordt bij de verder berekeningen enkel rekening gehouden met het eerst binnenkomend signaal. Is het padverschil kleiner, dan zal er interferentie optreden tussen de twee inkomende signalen. Deze soort multipath-fouten kunnen slechts gedetecteerd worden bij permanente stations. Dit heeft als rechtstreeks gevolg dat opeenvolgende punten verspreid lijken te liggen over de werkelijke positie van de ontvanger. Het wordt op die manier zeer moeilijk de effectief afgelegde route te detecteren en daarom vormen deze fouten een zeer groot struikelblok bij routeanalyses.
De tweede belangrijke toevallige fout ontstaat wanneer de ontvanger in de omgeving van massieve voorwerpen opgesteld staat. In zulke situaties kan er geheel of gedeeltelijk afscherming van een signaal optreden. In tegenstelling tot laagfrequente signalen, buigt het hoogfrequente GPS-signaal niet om deze objecten heen. Metingen in de steden of in bossen worden op die manier zwaar gehinderd. Gedeeltelijke afscherming heeft tot gevolg dat signaal - ruisverhouding van het betreffende satellietsignaal daalt.
In onderstaande figuur wordt de positie van de auto bepaald aan de hand van een aantal satellieten waaronder satelliet 2. Het signaal van deze satelliet wordt bij het nemen van de
17
directe weg geblokkeerd of te hard verzwakt. Het signaal bereikt de ontvanger toch onrechtstreeks via reflectie op een gebouw. Dit heeft als gevolg dat een foute positie van satelliet 2 berekend wordt op de plaats waar satelliet 3 afgebeeld staat. Deze fout beïnvloedt de berekeningen van de plaatsbepaling van de auto.
Figuur 2: Multipath-effect of meerwegsinterferentie. Bron: http://julien.cayzac.name, 9 augustus 2010
18
4. DATA-AQUIQITIE
In een eerste fase van een onderzoek naar menselijk verplaatsingsgedrag moeten zoveel mogelijk correcte data verzameld worden. Het vergaren van zulke informatie brengt heel wat potentiële problemen met zich mee. Daarom wordt getracht alle voorzorgsmaatregelen te nemen die nodig zijn om tot bruikbare data te komen, die voor verdere verwerking vatbaar zijn. Het veldwerk kan grofweg opgedeeld worden in de volgende vier fasen: (1) voorbereiding van het project, (2) instructies over de werking van het apparaat, (3) het gebruik van het apparaat door de deelnemers en (4) het terugbrengen van het apparaat.
4.1 Voorbereiding
De voorbereiding van het project is een essentiële fase waarbij men, afhankelijk van de verschillende doelstellingen, de meest geschikte GPS-logger en potentiële deelnemers voor het project kiest.
4.1.1 Keuze van GPS-logger
Het meest geschikte apparaat is er één dat de passiviteit van het systeem ten goede komt en moet bijgevolg aan een aantal voorwaarden voldoen. Zo moet het apparaat draagbaar zijn, zodat de deelnemers geen hinder ondervinden van de aanwezigheid. Daarbij komt dat het op een correcte manier vervoerbaar moet zijn, waarbij telkens connectie wordt gemaakt met zoveel mogelijk satellieten en risico op blokkade van het signaal zo gering mogelijk blijft. Te grote GPS-apparaten, zoals de klassieke Garmin eTrex, zijn af te raden. Aangezien de hier te gebruiken apparaten geen navigatiefunctie nodig hebben, komt men al gauw terecht bij de zogenaamde loggers. Deze apparaten houden louter spatio-temporele data bij in een logfile.
Bovendien moet de levensduur van de batterij voldoende hoog zijn, zodat de deelnemers niet extra belast worden met het veelvuldig heropladen van de batterij. De toestellen met heroplaadbare batterijen verdienen de voorkeur om de prijs van het gebruik te drukken. Veelal kunnen de klassieke GPS-loggers via een USB-poort van een extern apparaat opgeladen worden. Ook de opslagcapaciteit moet voldoende groot zijn om extra energie van de deelnemers bij het uitlezen van het toestel te voorkomen.
19
Ten slotte maakt men een afweging tussen de kost en de kwaliteit. Hoe minder het apparaat kost, des te meer men er kan kopen en des te meer data er verzameld kunnen worden. Toch moet men nagaan of de kwaliteit niet lijdt bij de aankoop van goedkope toestellen: op deze manier kan men wel veel data verzamelen, maar van slechte kwaliteit.
Uiteindelijk werden twee apparaten getest. Enerzijds een typische GPS-logger, de Igot-U 120, en anderzijds een sporthorloge van Garmin, de forerunner 405. Beide toestellen onderscheiden zich niet op vlak van opslagcapaciteit of grootte. Het grote voordeel van het sporthorloge ligt in zijn draagbaarheid. Aangezien men het toestel rond de pols kan dragen, blijft het contact met het gewenste aantal satellieten zo goed als verzekerd. Om deze reden geeft de forerunner volledigere data, die a posteriori minder verwerking inhouden.
a) b) Figuur 3: (a) Igot-U 120, (b) Garmin forerunner 405 Bron: (a) http://www.Igotu.com, 7 augustus 2010, (b) http://www.garmin.be, 7 augustus 2010 Toch zijn er een groot aantal nadelen aan het horloge verbonden, die men niet of in mindere maten terug vindt bij de GPS-logger. Eén daarvan is de korte levensduur van de batterij. Terwijl deze duur bij het horloge slechts op 8 uur ligt, kan deze, bij een vergelijkbaar trackingsinterval van 8 seconde, theoretisch tot 60 uur oplopen. Bij nader onderzoek blijken de specificaties van de GPS-logger niet te kloppen. Hoewel het trackingsinterval ingesteld stond op 8 seconden, was de gemiddelde levensduur van de batterij ongeveer 22 uur en werd het ingestelde trackingsinterval niet gerespecteerd met een variatie van 8 tot 30 seconden. Hoewel de theoretische specificaties van het horloge de exacte specificaties beter benaderde, blijft het verschil in levensduur van de batterij toch hoog.
20
Ten slotte speelt de prijs een grote rol bij deze vergelijking. Terwijl men voor de logger 50 euro betaalt, kost zo‟n sporthorloge bijna het vijfvoud. Men is bijgevolg met hetzelfde budget in staat vijf keer meer mensen te voorzien van een apparaat, wat tot aanzienlijk meer data leidt. Hoewel de forerunner 405 meer accurate data verzameld, werd omwille van de hierboven aangehaalde redenen gekozen voor de veel goedkopere Igot-U 120. Een meer ver doorgevoerde dataverwerking blijkt hierbij dan ook noodzakelijk.
4.1.2 Potentiële deelnemers
Hoofdzakelijk worden studenten gekozen die verbonden zijn aan de vakgroep Geografie. Deze studenten worden immers geacht vertrouwd te zijn met de werking van GPS en voldoende gemotiveerd te zijn om zonder enige vergoeding deel te nemen aan het project. Om verdere potentiële deelnemers niet af te schrikken wordt duidelijk vermeld dat de verzamelde gegevens niet individueel, maar collectief worden geïnterpreteerd met respect voor de privacy. Wil men een representatief beeld krijgen van het verplaatsingsgedrag van de Gentse student, zouden in principe ook studenten van andere faculteiten en of hogeschool bij het project betrokken moeten worden. Omdat de participatie niet vergoed werd en omwille van logistieke redenen is men van deze denkpiste afgestapt.
4.2 Instructies
Eens de deelnemers zijn gevonden worden de apparaten uitgedeeld. Hierbij moeten ze een “contract” tekenen waarbij ze verklaren het gekregen apparaat als een goede huisvader te beheren en de apparatuur op de opgegeven datum terug te brengen. Tussen het contract en nummer van het uitgedeelde GPS-toestel bestaat geen verband, om privacyschending te voorkomen.
Na een korte toelichting van het opzet is het van uiterst belang dat er bijkomende instructies worden gegeven bij de werking van het project. Eerst en vooral wordt de werking van het apparaat zelf uitgelegd: aan- en uitzetten, batterij opladen,…. Vervolgens wordt er gewezen op het feit dat de logger steeds op een zichtbare plaats vervoerd moet worden. Ook de tijdstippen waarop de logger steeds aan moet staan worden meegedeeld. Er moet uitdrukkelijk
21
veel aandacht aan deze fase van het veldwerk gegeven worden, aangezien bij een verkeerd gebruik van het toestel geen of onnauwkeurige data verzameld worden.
4.3 Datacollectie
In de derde fase dragen de deelnemers het apparaat twee weken bij zich. Initieel moesten de deelnemers zelf elke avond hun data uitlezen en uploaden op een server met een bijkomende samenvatting van de verplaatsingen van die dag. Op deze manier zou men de verkregen data enigszins kunnen controleren met de effectief afgelegde verplaatsingen en zouden bijkomstig niet alle toestellen door één persoon uitgelezen moeten worden. Maar dit vroeg te veel inspanningen van de deelnemers, waardoor het aantal binnenkomende data zeer gering was. Mede door het feit dat de opslagcapaciteit van het GPS-apparaat om records bij te houden voldoende groot bleek, werd van dit idee afgestapt en werd het actief gedeelte van de deelname tot een minimum herleid.
De participanten moeten gedurende de twee weken er enkel op toezien dat de batterij opgeladen blijft, zeker wanneer een verplaatsing wordt gemaakt en dat ze het op een correcte manier vervoeren. Wanneer deze voorwaarden nauwgezet worden nageleefd, levert dit veel, volledige en meestal nauwkeurige data op.
22
5. DATAVERWERKING
Hoewel de huidige GPS-apparaten in staat zijn zeer nauwkeurige spatio-temporele informatie te verschaffen over menselijk activiteit, blijft de technologie aangewezen op een ver doorgevoerde dataverwerking. Het verzamelen van GPS records, voor welk doeleinde ook, lijkt in vele gevallen onbeperkt. De meeste apparaten kunnen meer dan duizenden records op enkele dagen verzamelen. Hoewel het redelijk eenvoudig is om deze gegevens te importeren en te visualiseren in de meest standaard GIS-pakketen, blijft het omwille van de grootte van de dataset een uiterst tijdrovende zaak. Daarenboven is het bijzonder moeilijk om zinvolle informatie uit de data te distelleren aan de hand van de standaard dataverwerkingsoftware (Stopher et al. 2008).
De algemene benaming om zinvolle informatie uit een ruwe dataset te halen is datamining of nog Knowledge Discovery in Databases (KDD). KDD is een strategie om grote volumes data, opgeslagen in een databank, te analyseren. Het is het proces van identificatie van geldige, nieuwe, potentieel nuttige en uiteindelijk begrijpelijke patronen in de data. Het doel van KDD is uiteindelijk om verboren informatie, trends, kenmerken of structuur in de data te zoeken en kennis te bekomen op basis van de bevindingen van het onderzoek (Van de Weghe, 2010).
In de Geografische Informatie Wetenschap (GIW) worden de technieken van datamining en knowledge discovery gebruikt om spatiale data te extraheren. Het extraheren van interessante en nuttige informatie uit een ruimtelijke dataset is veelal moeilijker dan bij de traditionele numerieke en categorische datasets (Kobayashi, 2010).
Geografische informatie is moeilijk te hanteren gezien haar verschillende dimensies, haar inherente ruimtelijke autocorrelatie en heterogeniteit, haar complexiteit van tijdruimtelijke objecten en regels en ten slotte door haar diverse soort gegevens. Ten eerste heeft geografische informatie een hoge dimensionaliteit aangezien het locatiegebonden informatie betreft. Dit impliceert dat er minimaal twee dimensies nodig zijn. Daarenboven heeft geografische informatie in vele gevallen naast een ruimtelijke dimensie ook nog een temporele dimensie.
23
Ten tweede is geografische data onderheven aan ruimtelijke autocorrelatie, wat er voor zorgt dat kenmerken op proximale locaties aan elkaar gerelateerd zijn. Aan de andere kant is er sprake van ruimtelijke heterogeniteit door het unieke karakter van sommige geografische locaties. Hoewel dit soort kenmerken in vele statistische analyses een hekelpunt vormen, kunnen ze toch nuttige informatie opleveren bij geografisch onderzoek.
Ten derde is het hanteren van de tijd in ruimtelijke entiteiten een moeilijke zaak. Daarom is het meer dan noodzakelijk om efficiënte instrumenten te ontwikkelen voor de extractie van spatio-temporele regels uit geografische informatiesystemen. Ten slotte moet men methodes ontwikkelen die toelaten om digitale datasets bestaande uit verschillende formaten, zoals vector en raster gegevens, tegelijkertijd te kunnen verwerken en analyseren.
Wil men de GPS-gegevens op een goede manier beheren, analyseren en manipuleren moet men zulke dataminingprocessen hanteren en is het ontwikkelen van gespecialiseerde software bijgevolg noodzakelijk. Veelal wordt deze software ontwikkeld in de bekende softwarepakketten zoals GIS of CAD (Stopher et al, 2008). Omwille van de grootte van de dataset, meer als 1000000 GPS-records, wordt in deze studie de dataverwerking niet uitgevoerd in een GIS- of CAD-omgeving, maar wordt er een eigen procedure ontwikkeld in JAVA. Op deze manier wordt het mogelijk de grote hoeveelheden data efficiënt te verwerken.
Wat nu juist de meest geschikte procedure is voor een welbepaalde dataset, blijft nog een lopende vraag. Toch moeten ze alle op de belangrijkste onderzoeksvragen een antwoord bieden. Hoe wordt het mogelijk individuele reizen of activiteiten te traceren? Hoe kan men de manier van verplaatsen achterhalen aan de hand van de verkregen dataset? Hoe kan men de afgelegde route extraheren uit een gekozen netwerk? Een aantal auteurs hebben enkele pogingen ondernomen om deze problemen te overkomen (Chung & Shalaby, 2005; Flamm & Kaufmann, 2007; Schuessler & Axhausen, 2009). In feite kunnen hun benaderingen in individuele modules opgesplitst worden. De volgende modules worden dan ook in het programma geïmplementeerd (zie bijlage 4) en achtereenvolgens in deze studie besproken:
Filteren en smoothing
Coördinatentransformatie
Detectie van trips
24
Detectie van de modus van de trip
Splitsen van samengestelde trips
Map-matching
Gemakshalve wordt verder in dit onderzoek het woord “trip” gebruikt wanneer men het heeft over een set van coördinaten die aan de hand van de dataverwerking geëxtraheerd is uit de ruwe GPS-data en gebruikt men het woord verplaatsing wanneer men doelt op een effectieve verplaatsing.
5.1 Filteren en smoothing
Er zijn verschillende manieren om problemen, veroorzaakt door een aantal van de hierboven beschreven GPS-fouten, te overwinnen. Zo kan men enkele filtermethoden en smoothingtechnieken toepassen om fout geregistreerde records uit de dataset te verwijderen of aan te passen (Schuessler & Axhausen, 2008). Terwijl de filtermethoden de door de systematische fouten veroorzaakte problemen aanpakken, trachten de smoothingtechnieken, zoals de Kalman filter3, de toevallige fouten in de dataset en daarmee de ruis te reduceren.
Welke technieken men moet en kan gebruiken hangt echter af van de beschikbare informatie tijdens de studie. Zo kan een filter gebruik maken van het aantal zichtbare satellieten en de PDOP-waarde als een behoorlijk betrouwbare maatstaf voor het bepalen van de systematische fouten (Stopher et al. 2008). Toch is zulke informatie bij low cost -systemen veelal niet voorhanden en moet men andere criteria vinden die op een betrouwbare manier onjuiste GPSrecords kan detecteren en verwijderen. Eén van deze maatregelen is bijvoorbeeld al de records weg te laten met extreme hoogtewaarden. Zo zou men alle punten die in België zijn geregistreerd en een hoogtewaarde hebben die buiten de reikwijdte van -50 meter tot 700 meter liggen kunnen schrappen.
De meest gebruikte regels bij filtertechnieken kunnen als volgt omschreven worden (Stopher et al. 2008):
3
De Kalman filter is een rekenmethode, die het mogelijk maakt reeksen van meetgegevens van ruis te ontdoen. Deze filter wordt vaak gebruikt in de navigatietoepassingen om de meest waarschijnlijke “exacte” positie of koers te bepalen. (http://calypso.inesc-id.pt, 29 juli 2010)
25
-
Alle punten met te weinig (minder dan vier) zichtbare satellieten en/of een te grote PDOP-waarde, worden verwijderd.
-
Alle punten waarvoor geen beweging wordt geregistreerd, worden eveneens uit de dataset verwijderd.
-
Tijdens de conversie naar een werkbaar formaat worden alle velden, zoals bijvoorbeeld de hoogtewaarde, overlopen en wordt gekeken naar realistische waarden aan de hand van drempelwaarde. Records waarvan sommige waarden de drempelwaarde overstijgen, worden verwijderd.
-
Alle punten die zich buiten een voorgedefinieerde regio bevinden, worden eveneens als verdacht aanzien en worden ook verwijderd.
Andere identificatietechnieken voor het bepalen van onjuiste GPS-records maken gebruik van snelheid en versnelling. Wanneer geen snelheid via een Doppler-meting beschikbaar is, moet deze samen met de acceleratie bepaald worden uit het temporele verschil tussen de opeenvolgende GPS-punten. Daarom zijn de berekende snelheid en drie dimensionale versnelling afhankelijk van de ontwikkelde smoothingtechnieken. Het is om die reden dat de filtermethode slechts na de smoothingtechnieken toegepast wordt. Zo zullen punten waarvan de snelheid verspringt als gevolg van toevallige fouten of feitelijke gedrag niet worden verwijderd (Schuessler & Axhausen, 2009).
In deze studie worden twee verschillende filtermethoden uitgewerkt. In de eerste methode worden alle records verwijderd waarvoor geen beweging wordt geregistreerd. Hierbij moet men rekening houden met het fenomeen van de schijnbare bewegingen. Zo kan het voorkomen dat er een snelheid geregistreerd wordt, hoewel de effectieve snelheid van het object nul bedraagt. Dat heeft ondermeer te maken met de nauwkeurigheid van plaatsbepaling van de gebruikte toestellen (Stopher et al. 2008). De meeste real-time GPS-ontvangers halen in ideale omstandigheden een nauwkeurigheid van +/- 8m, waardoor het mogelijk wordt dat het object schijnbaar beweegt in een straal van deze nauwkeurigheid.
Om deze reden is het beter dat men de drempelwaarde voor het bewegen van een object niet vastlegt op nul kilometer per uur, maar eerder op 3 kilometer per uur. Op die manier wordt een groot deel van die problemen geëlimineerd en blijft het risico op verlies van een te voet afgelegde verplaatsing eerder laag. Sommige toestellen laten de gebruiker toe deze
26
drempelwaarde in het apparaat zelf vast te leggen, wat er voor zorgt dat een grote hoeveelheid onnodige records niet wordt geregistreerd (Du & Aultman-Hall, 2007; Stopher et al., 2008).
Een box ter grootte van 10 records overloopt alle records opgenomen in de databank. Hierbij schuift de box telkens één record verder opschuift. Als de box meer dan 5 records bevat waarvan de snelheid groter is dan 3 kilometer per uur, worden de 10 records in kwestie in een nieuwe databank bijgehouden. Zo worden in onderstaande tabel de eerste 10 records in een nieuwe databank opgenomen. De tweede reeks records haalt de drempelwaarde van minimum 6 records niet en wordt bijgevolg niet opgenomen. Op deze manier wordt enkel record 11 voorlopig niet opgenomen, aangezien de overige negen van de tweede reeks al zijn opgenomen door de eerste reeks. Dit neemt niet weg dat record 11 niet meer in de databank kan opgenomen worden. Wanneer de reeks die bestaat uit record 11 tot record 20 meer dan 5 bewegende records bevat, zal record 11 alsnog worden opgenomen in de nieuwe databank.
Door het uitvoeren van deze methode wordt het aantal GPS-records in de databank al tot een vierde terug gebracht naar 250000.
Tabel 1: GPS-records in beweging (Bron: Eigen onderzoek) Nr
Date
Time
Lat
Lon
Alt
Speed
Course
Distance
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009 10/9/2009
15:07:35 15:07:56 15:08:10 15:08:23 15:08:37 15:08:50 15:09:05 15:09:24 15:09:50 15:10:06 15:10:20 15:10:37 15:10:54 15:11:13 15:11:32 15:11:48 15:12:05
51.05606 51.05609 51.05611 51.0561 51.05609 51.05612 51.05607 51.05606 51.05592 51.05581 51.05573 51.05635 51.05654 51.05594 51.05554 51.05559 51.05555
3.738691 3.738988 3.739427 3.739609 3.739886 3.740163 3.740489 3.740353 3.740526 3.740653 3.740515 3.740518 3.74051 3.740642 3.740504 3.740906 3.740628
6.39 -3.75 -3.02 -6.76 -8.62 -8.58 6.14 -32.72 -32.16 -34.82 18.21 -37.03 -154.86 -30.3 14.45 27.11 15.61
5724 4176 4428 0 3348 6084 10836 0 0 0 2160 0 0 0 7895 5076 3700
159 103 82 85 86 61 34 172 256 191 43 21 167 233 206 33 285
0 21.02 30.76 12.74 19.44 19.66 23.35 9.58 19.54 15.84 12.82 68.72 21.25 66.8 46.06 28.64 19.82
Naast de schijnbare beweging gecreëerd door de onnauwkeurigheid van de GPS-toestellen, vinden we, zoals afgebeeld in figuur 4, ook veel grotere verplaatsingen waar van het object 27
dat zich desondanks toch in rust bevindt. Deze grote uitschieters zijn te wijten aan het multipath-effect. Hoewel de persoon zich in een gebouw bevindt, kan er toch in sommige gevallen connectie ontstaan met minstens 4 satellieten. De records die op zulke wijze geregistreerd zijn, zijn dermate onderheven aan het multipath-effect dat ze voor grote uitschieters zorgen zoals voorgesteld in onderstaande figuur. Hoewel men zich op zulke momenten niet verplaatst, blijkt de snelheid en de afgelegde afstand niet nul te zijn.
Figuur 4: Gevolgen van multipath effect Bron: Eigen verwerking Om reeds zoveel mogelijk van deze uitschieters of spikes uit de dataset te elimineren wordt een tweede filtermethode opgebouwd. Deze methode gaat ervan uit dat het verschil in koers van drie opeenvolgende punten de waarde van 180 graden niet mag benaderen. Wanneer dit wel het geval is, wordt de record in kwestie uit de globale lijst verwijderd. Op deze manier werd het aantal resterende records teruggebracht tot ongeveer de helft.
Het resultaat van beide filtermethode is goed waarneembaar in onderstaande figuur 5. De records die niet of nauwelijks bewegen zijn uit de databank verwijderd, zoals waar te nemen bovenaan de figuur, waarbij de rode lijn de ruwe data voorstelt en de blauwe lijn de gefilterde
28
data. De twee grote sprongen tijdens deze verplaatsing, te wijten aan het multipath-effect, worden eveneens weggewerkt door de tweede filtermethode.
Figuur 5: Resultaat van het toepassen van de twee filtermethoden Bron: Eigen verwerking 5.2 Coördinatentransformatie
In een volgende fase worden de overgebleven coördinaten automatisch getransformeerd van WGS84 naar Lambert 72/50. De transformatie is om verschillende redenen essentieel. Zo zijn de meeste GIS-data van Vlaanderen in de Lambert 72/50 projectie aangevoerd. GIS-data kunnen als achtergrondlaag dienen om zo‟n ruimtelijk referentie te vormen. Ze worden ook gebruikt bij de map-matching en bij het bepalen van de modus. Bovendien is zo‟n transformatie ook nuttig bij het bepalen van de globale parameters van een trip. Het is daarbij veel eenvoudiger om met een metrisch stelsel te werken dan met een gradenstelsel. Het transformeren van de geodetische coördinaten φ, λ,
, of cartesische coördinaten x, y, z
van een punt P, gedefinieerd ten opzichte van een bepaalde datum, naar een willekeurige
29
andere coördinatenstelsel gebeurt aan de hand van een 3D-gelijkvormigheidstransformatie ook wel Bursa-Wolf transformatie genoemd (Drewes, 2006). Deze transformatie die zowel een translatie, rotatie als schaalaanpassing omvat transformeert de cartesische coördinaten x, y, z, gedefinieerd ten opzichte van de eerste datum, naar de overeenkomstige cartesische coördinaten x‟, y‟, z‟ ten opzichte van de tweede datum. De transformatie wordt bepaald door zeven parameters: • drie translatieparameters (dX, dY, dZ); • drie rotatieparameters (εx, εy, εz); • één schaalparameter (schaalfactor k = 1 + δ).
Om GPS-coördinaten, gedefinieerd ten opzichte van WGS84, om te zetten in Lambert 72/50 is het bijgevolg noodzakelijk om, voorafgaand aan de toepassing van de formules van de Lambert projectie, de geodetische φ, λ en
coördinaten of de geocentrische x, y, z
coördinaten in WGS84 naar de Belgian Datum 72 (BD72) te transformeren. Om dit mogelijk te maken is het noodzakelijk dat de zeven parameters voor de Bursa-Wolf transformatie of de drie parameters voor de Molodensky-transformatie, die de relatie tussen de twee datums beschrijven, zo nauwkeurig mogelijk bepaald worden.
De voorlopige nationaal toepasbare Bursa-Wolf parameters om de transformatie van WGS84 naar BD72 en vice versa uit te voeren zijn beschikbaar op de website van het Agentschap voor geografische informatie Vlaanderen (www.agiv.be, 24 juli 2010). Ze werden bepaald op basis van de relatie tussen GPS-coördinaten en BD72-coördinaten voor een beperkte set van geodetische punten aan de hand van de kleinste kwadraten benadering. De fout, eigen aan de transformatie, wordt geschat op gemiddeld enkele decimeter tot maximaal 1 meter aan de landsgrenzen. Voor nauwkeurig topografisch werk is deze benadering echter onvoldoende. Op de site van het NGI worden ook nationaal toepasbare Molodensky-parameters gepubliceerd. Deze hebben een vergelijkbare nauwkeurigheid (Canters, 2002).
De Belgische topografische kaartreeksen zijn gebaseerd op een snijdende conforme conische projectie. Als referentieoppervlak werd geopteerd voor de Internationale ellipsoïde van Hayford (1924), welke gekenmerkt is door volgende parameters:
a = 6378388 m
f = 1/ 297 30
De standaardparallellen van de projectie zijn als volgt gedefinieerd:
= 49°50‟
= 51°10‟
Het nationaal geodetisch net werd sinds 1945 tweemaal vereffend, nl. in 1950 en in 1972. Voor de definitie van de Lambert 72 coördinaten, welke gebaseerd zijn op de resultaten van de laatste vereffening, loopt de centrale meridiaan van de projectie door het fundamenteel punt van het geodetisch net (binnen het Koninklijk Observatorium van België). De lengte van deze centrale meridiaan, welke samenvalt met de y-as van het coördinaatsysteem is:
= 4°21‟24”983E
Om ervoor te zorgen dat de Lambert-coördinaten voor heel België positieve waarden hebben, wordt gebruik gemaakt van een valse oorsprong die respectievelijk 150km ten westen en 5400km ten zuiden van de werkelijke oorsprong (top van de kegel) gelegen is. De Lambert 72 coördinaten worden dus uiteindelijk als volgt gedefinieerd:
= 150000m + rsin
= 5400000m – rcos
Met r en
als transformatieparameters van een kegelprojectie.
r = C(
=n
In deze formules zijn n de kegelconstante en C de integratieconstante. De theoretisch correcte waarden van deze parameters kunnen bepaald worden op basis van de standaardparallelen van de conforme conische Lambert 72/50 projectie.
n = 0.7716421928
C = 11565915.812935
In de formules van de transformatieparameters geldt:
=
met
= (90° - ) 31
Waarbij e de excentriciteitsfactor is en als volgt bepaald kan worden:
met b = ( 1-f )a
e=
De Belgische topografische kaartreeksen zijn echter niet rechtstreeks op de Lambert 72 coördinaten gebaseerd. Om een zo goed mogelijke aansluiting te bekomen met de eerdere Lambert 50 coördinaten, die gebaseerd waren op de (minder nauwkeurige) vereffening van 1950, en op een Lambert projectie met een andere keuze voor de centrale meridiaan, wordt op het Lambert 72 coördinaatstelsel een bijkomende translatie en rotatie toegepast. Het resultaat hiervan zijn de zogenaamde Lambert 72/50 coördinaten, die we op de kaart terugvinden.
De overgang van Lambert 72 naar Lambert 72/50 coördinaten is als volgt gedefinieerd:
= 149256.456m + X‟cos + Y‟sin
= 165373.012m – X‟sin + Y‟cos
waarbij:
X‟ =
- 150000m
Y‟ =
- 165284.52m
= 29”.2984
De transformatie zorgt ervoor dat het fundamenteel punt van Ukkel na uitvoering van de transformatie zijn oorspronkelijke Lambert 50 coördinaten bekomt, en dat de oriëntatie van het gradennet identiek is aan de oriëntatie van het Lambert 50 referentiestelsel, waarbij de centrale meridiaan (y-as van de projectie) door de oude sterrenwacht van Brussel liep (
=
4°22‟04‟‟71) (De Maeyer et al., 2004).
Om de globale berekeningstijd van het programma zo klein mogelijk te houden, wordt de transformatie pas in tweede instantie uitgevoerd, nadat het grootste deel van de GPS-records reeds door de filters uit de databank is verwijderd.
32
5.3 Detectie van trips en activiteiten
Vervolgens moet de databank met de gefilterde en getransformeerde GPS-punten opgedeeld worden in trips. Aangezien het GPS-punten betreft die persoonsgebonden en dus op een continue wijze verzameld zijn, zal het GPS-apparaat heel de dag registreren zolang er contact gemaakt kan worden met het vereiste aantal satellieten. Daarom moet er een gepast criterium gevonden worden waarbij men telkens een trip kan onderscheiden. Het meest aanvaarde criterium is dat van de dwelltime. Wanneer tussen twee opeenvolgende trips een voldoende groot tijdsverschil aanwezig is, kan men deze als twee afzonderlijke trips beschouwen. In de literatuur worden verschillende waarden aan dat tijdsverschil gekoppeld, lopend tussen de 45 en 300 seconden, hoewel de meeste studies spreken van 120 seconden (Stopher et al., 2003; Du & Aultman-Hall, 2007; Schuessler & Axhausen, 2009).
In deze studie wordt er voor een tijdsverschil van 180 seconden gekozen. Dat is een grotere waarde dan het meest gebruikte, maar op die manier wordt de kans kleiner dat effectieve verplaatsingen door bijvoorbeeld een tijdelijk verlies van signaal in meerdere trips worden opgedeeld, wat tot verkeerde begin- en eindpunten van de activiteiten kan leiden. Vanaf dit moment wordt de data niet meer per record bijgehouden, maar per trip.
Onderstaande figuren illustreren hoe opeenvolgende GPS-records opgesplitst worden in twee afzonderlijke trips, een blauwe en een rode.
33
a)
b)
Figuur 6: Extraheren van trips uit de gefilterde data. (a) ruwe data, (b) twee geëxtraheerde trips Bron: Eigen verwerking Om het systeem zo passief mogelijk te houden worden zoveel mogelijk parameters van de trips bepaald uit de ruwe GPS-data en wordt er zo weinig mogelijk beroep gedaan op de input van de deelnemers zelf. Vanaf nu worden telkens de verschillende parameters waaruit een trip bestaat berekend en aangepast. Een trip bestaat uit een tripnummer, een lijst van GPS-records, een maximale snelheid, een gemiddelde snelheid, de afstand, de duur, de persoon die de trip aflegde en de transportmodus.
5.4 Modus van een trip
Het bepalen van de modus van de verschillende trips blijft nog één van de belangrijkste onderwerpen bij persoonsgebonden GPS-studies. Deze cruciale stap maakt zulke studies geschikt voor grootschalige toepassingen. Toch zijn er de laatste jaren eerder weinig publicaties verschenen omtrent dit thema (Schuessler & Axhausen, 2009).
De meest gebruikte en de eenvoudigste manier voor het bepalen van de modus maken gebruik van de traditionele attributen van de trips zoals maximale snelheid, gemiddelde snelheid en
34
versnelling (Upadhyay et al. 2008). Aangezien het interval tussen opeenvolgende records rond de dertig seconde bedraagt, is het vrijwel onmogelijk om zinvolle informatie te putten uit de versnelling. Hiervoor zou het tijdsinterval naar minimaal twee seconden moeten worden teruggebracht (Troped et al. 2008).
Toch ondervindt men tal van problemen bij een automatische modusdetectie. In sommige gevallen is het moeilijk een fietser te onderscheiden van iemand die de bus neemt, aangezien de geregistreerde data gelijkaardige attributen vertoont. Een bus in een stad behaalt niet al te hoge maximale snelheden en zijn gemiddelde snelheid kan in sommige gevallen, bijvoorbeeld in volle spits, zelfs lager liggen dan die van een fietser. Ook auto‟s die zich op de snelweg bevinden en treinen hebben gelijkaardige attributen en zijn dus moeilijk van elkaar te onderscheiden. Wandeltrips daarentegen zijn wel eenvoudig te onderscheiden van andere modi.
Gezien de grote gelijkenissen tussen de attributen van sommige modi, betrekt men in vele gevallen GIS-data. Op die manier wordt het mogelijk de trips aan de hand van een matchingalgoritme aan de GIS-data te koppelen en zo de gepaste modus van een trip te bepalen. Zo wordt in dit onderzoek gebruik gemaakt van het Belgische spoornetwerk om treinritten van autoritten te onderscheiden. Op dezelfde manier zouden de verschillende bushaltes ook voor een onderscheid tussen bussen en auto‟s kunnen zorgen. Toch moet men bij deze detectietechnieken gebaseerd op specifieke GIS-data rekening houden met de ouderdom van de gegevens en de dikwijls grote kost van de gegevens. Vandaar bepalen vele onderzoekers andere technieken bepalen die onafhankelijk zijn van GIS.
Upadhay et al. (2008) maken gebruik van een probabiliteitsmatrix waarbij het gewicht afhangt van volgende factoren: twee gemiddelde snelheden van de trip (berekend door de afgelegde afstand te delen door de verstreken tijd en het gemiddelde van alle snelheden), de maximum snelheid behaald tijdens een trip, de meest geregistreerde snelheid tijdens de trip, de afstand van de trip en de nabijheid van bepaalde netwerkelementen zoals busstops en treinstations. Zo zal een wandeltrip een hoge wegingsfactor bekomen als zijn gemiddelde snelheid lager is dan zes kilometer per uur en met een maximumsnelheid die de grens van tien kilometer per uur niet overschrijdt. Op die manier krijgen alle verschillende trips een bepaald gewicht toegewezen.
35
Een andere frequente techniek voor het bepalen van de modus maakt gebruik van acceleratiegegevens. Troped et al. (2008) bestuderen de meerwaarde van de toevoeging van GPS-gegevens bij de acceleratiegegevens. Volgens de studie levert een combinatie van een GPS samen met een accelerometer bevredigende resultaten op, waarbij de modus van meer dan 93% van de activiteiten correct voorspeld wordt.
In deze studie wordt er enkel gebruik gemaakt van ruwe GPS-data en wordt er bijgevolg in eerste instantie gekozen voor een equivalent van de probabiliteitsmatrix. Deze techniek laat toe de wandeltrips en de fietstrips van alle andere trips te onderscheiden. Hierbij wordt er geen gebruik gemaakt van de afstand afgelegd tijdens een trip. In vele gevallen verschillen de afstand afgelegd te voet of met te fiets niet fundamenteel. Daarom wordt er slechts met de overige traditionele parameters rekening gehouden: -
Voet: beide gemiddelde snelheden liggen rond 5 kilometer per uur, met een deviatie van 2 kilometer per. Het aantal snelheden dat 10 kilometer per uur overschrijdt mag bovendien niet groter zijn dan een tiende van alle snelheden.
-
Fiets: beide gemiddelde snelheden liggen rond de 17 kilometer per uur, met een deviatie van 5 kilometer per. Het aantal snelheden dat de 35 kilometer per uur overschrijdt mag bovendien niet groter zijn dan een tiende van alle snelheden.
-
Alle andere modi (auto, bus en trein)
In tweede instantie wordt er een onderscheid gemaakt tussen auto/bus en trein en dit aan de hand van een matching met sporennetwerk. Er wordt hierbij gebruik gemaakt van de NAVTEQ-data (Navstreets native vector, 2007). Voor elk punt van een trip, waarvan de modus niet gelijk is aan voet of fiets, wordt de loodrechte afstand tot een lijnsegment van het sporennetwerk bepaald. Twee voorwaarden moeten voldaan zijn vooraleer een punt van een trip samenvalt met het sporennetwerk. Ten eerste moet het punt gelegen zijn tussen de uiterste lengtewaarden of breedtewaarden van een bepaald lijnsegment van het sporennetwerk. Ten tweede moet de loodrechte afstand tot het lijnsegment in kwestie minder dan 250 meter bedragen.
In onderstaande figuur bevindt het punt van de trip zich tussen de uiterste breedtewaarden van een spoorsegment, aangegeven door de grijze stippellijn. Als bovendien de loodrechte afstand tot dat spoorsegment, gekenmerkt door de groene lijn, kleiner is dan 250 meter, dan valt het
36
punt van de trip samen met het spoorsegment. Wanneer bovendien meer dan 75 % van alle punten samenvallen met het sporennetwerk, spreekt men van een treinrit, zoals voorgesteld in onderstaande figuur. Op die manier sluit men andere trips die slechts gedeeltelijk langs het sporennetwerk lopen uit .
a) b) Figuur 7: Linken van een trip aan een spoornetwerk. (a) twee voorwaarden, (b) meer dan 75% van de punten valt samen Bron: Eigen onderzoek 5.5 Splitsen van samengestelde trips
In deze studie wordt rekening gehouden met het feit dat een trip uit verschillende modi kan bestaan, een zogenaamde samengestelde trip. Er wordt getracht zulke trips te splitsen tot afzonderlijke trips met een eigen kenmerkende modus. De verschillende modi worden geëxtraheerd door gebruik te maken van het criterium dat tussen de verschillende trips een voldoende grote periode moet zitten waarbij de snelheid nul kilometer per uur benadert of er bij elke modusverandering een wandeltrip noodzakelijk is, zoals bij Schuessler & Axhausen (2009). Op die manier wordt elke trip in verschillende stages gesegmenteerd aan de hand van punten waarbij de modus verandert van wandelen naar een andere modus, of omgekeerd, de zogenaamde modusveranderingspunten.
37
Zo kan het bijvoorbeeld voorkomen dat je van de trein bent afgestapt en na 5 minuten wandelen meteen een bus neemt. Men is met andere woorden in constante beweging, zonder een pauze te nemen die groter is dan de vooropgestelde dwelltime van 3 minuten. Deze situatie wordt weergegeven in onderstaande tabel, waar de grijze periode een deel van een treintrip voorstelt, de blauwe een wandeltrip en de rode een deel van een bustrip.
38
Tabel 2: Splitsen van samengestelde trips (Bron: Eigen onderzoek) NR Datum Tijd Breedte Lengte Snelheid Koers Afstand … … … … … … … … 1674 5/7/2010 13:47:34 51.1985 4.38874 91584 125 2046.34 1675 5/7/2010 13:47:49 51.19661 4.393061 87120 125 367.37 1676 5/7/2010 13:48:06 51.19474 4.397287 67176 129 360.42 1677 5/7/2010 13:48:20 51.19306 4.400285 49176 118 280.11 1678 5/7/2010 13:48:33 51.19257 4.402261 34020 118 148.17 1679 5/7/2010 13:48:48 51.19223 4.404023 36396 108 128.61 1680 5/7/2010 13:49:04 51.19214 4.406251 41112 93 155.59 1681 5/7/2010 13:49:27 51.19196 4.410259 34812 82 280.01 1682 5/7/2010 13:49:50 51.19186 4.413763 34956 94 244.44 1683 5/7/2010 13:50:06 51.19181 4.415487 31788 103 120.26 1684 5/7/2010 13:50:21 51.19166 4.41722 28620 110 121.9 1685 5/7/2010 13:50:37 51.19159 4.418033 0 152 57.17 1686 5/7/2010 13:50:52 51.21803 4.420257 2664 32 1501.88 1687 5/7/2010 13:51:06 51.21779 4.420662 0 294 39.14 1688 5/7/2010 13:51:20 51.21803 4.420424 6516 288 32.17 1689 5/7/2010 13:51:43 51.21797 4.419796 10440 319 44.33 1690 5/7/2010 13:52:00 51.21788 4.41976 11376 314 10.1 1691 5/7/2010 13:52:14 51.21809 4.419111 6948 299 50.88 1692 5/7/2010 13:52:32 51.218 4.419009 12924 319 12.09 1693 5/7/2010 13:52:47 51.21823 4.418789 9036 302 29.72 1694 5/7/2010 13:53:02 51.21826 4.418237 10584 310 38.56 1695 5/7/2010 13:53:17 51.21851 4.417533 7524 352 56.64 1696 5/7/2010 13:53:31 51.21904 4.417239 5940 22 62.07 1697 5/7/2010 13:53:47 51.21937 4.417598 9072 99 44.59 1698 5/7/2010 13:54:02 51.21927 4.41829 6346 307 49.64 1699 5/7/2010 13:54:16 51.21953 4.417423 5433 71 67.29 1700 5/7/2010 13:54:46 51.2302 4.413504 6588 325 8.01 1701 5/7/2010 13:55:21 51.23128 4.412991 2345 12 125.61 1702 5/7/2010 13:55:37 51.23171 4.414114 29844 62 91.54 1703 5/7/2010 13:55:52 51.23129 4.419959 59112 112 409.69 1704 5/7/2010 13:56:06 51.23139 4.420893 1908 83 66.03 1705 5/7/2010 13:56:20 51.23123 4.421325 828 54 34.95 1706 5/7/2010 13:56:43 51.23132 4.421414 15768 104 11.58 1707 5/7/2010 13:57:00 51.2331 4.421891 47916 356 200.8 1708 5/7/2010 13:57:14 51.2341 4.422626 13752 15 122.41 1709 5/7/2010 13:57:32 51.23449 4.422432 54684 322 45.31 1710 5/7/2010 13:57:47 51.23483 4.423403 38232 74 77.62 1711 5/7/2010 13:58:02 51.23474 4.423528 60804 318 13.1 … … … … … … … … Sommige auteurs overwegen een bijkomend criteria waarbij trips gesplitst kunnen worden aan de hand van koersveranderingen van ongeveer 180 graden (Du & Aultman-Hall, 2007).
39
Wanneer een persoon louter iemand komt ophalen of afzetten, zal dit met de vooropgestelde methode niet resulteren in twee afzonderlijke trips. Het criteria van de koersveranderingen maakt het segmenteren van deze trips wel mogelijk. Toch is deze denkpiste nog in geen enkel data processing algoritme geïmplementeerd. Een implementatie in het hier vooropgestelde algoritme zou onmogelijk zijn, aangezien opeenvolgende punten met een koerswijziging die de 180 graden benaderen uit de databank verwijderd worden om multipath-effecten te elimineren.
Nadat de samengestelde trips gesplitst zijn worden de begin- en eindpunten van de trip bepaald. Er wordt een methode opgesteld die bepaalt of de trip in het begin of op het einde geen overbodige record bevat. Records waarbij de snelheid onder de drempelwaarde liggen van drie kilometer per uur worden om die reden uit de lijst van een trip geweerd.
De laatste twee methodes gaan respectievelijk de bruikbaarheid en de geldigheid van de geëxtraheerde trips na. De eerste methode bekijkt of de trips in kwestie voldoende records bevatten. Wanneer de lijst minder dan 7 records bevat, wordt de trip uit de databank verwijderd. In deze studie worden immers enkel de trips die langer duren dan de vooropgestelde dwelltime van 3 minuten opgenomen in de databank, om op deze manier de schijnbare bewegingen zoveel mogelijk buiten beschouwing te laten. Als een trip minder dan 7 records bevat en toch een grotere duur heeft van 3 minuten wil dit zeggen dat het trackingsinterval hoger ligt dan 30 seconden. Hoe hoger de duur van de trip is, des te hoger het interval des te minder nauwkeurig de afgelegde route in beeld wordt gebracht. Zeker voor kleine trips wordt de interpretatie in deze situatie uiterst moeilijk tot onmogelijk.
De laatste methode bekijkt of de geëxtraheerde trips wel effectief een verplaatsing inhouden. Als een te groot aantal records van de trip zich situeren rond de gemiddelde x- en y-waarde van de trip, wordt zulke trip als een schijnbare beweging beschouwd en wordt bijgevolg uit de databank verwijderd. De trip die afgebeeld wordt in figuur X, zou op aan de hand van deze methode niet meer in rekening worden gebracht.
40
5.6 Mapmatching
Map-matching kan omschreven worden als het proces dat een correspondentie tracht te vinden tussen een ruimtelijk gerelateerd punt of een sequentie van zulke punten, bijvoorbeeld verkregen door een GPS-apparaat, en een bepaald digitaal netwerk (Stopher et al., 2008). Op deze manier wordt het mogelijk de verschillende attributen van het digitale netwerk te linken met de eigen inputdata, wat voor vele toepassingen, zoals deze, voor een zeer beduidende meerwaarde kan zorgen. Omwille van de onnauwkeurige en “noisy” inputdata, zoals hierboven aangehaald, maar ook door de onnauwkeurige en onvolledige digitale netwerken, blijft map-matching een moeilijke en delicate zaak met verregaande gevolgen voor bepaalde toepassingen. Daarom is een correct werkend map-matching algoritme onontbeerlijk.
In het kader van deze studie wordt er gezocht naar een offline map-matchingalgoritme. Een offline algoritme onderscheidt zich van een online algoritme door het feit dat deze eerst kennis heeft over zowel de gepasseerde als de „toekomstige‟ punten, terwijl een online algoritme zich enkel kan baseren op de punten die reeds gepasseerd zijn. Hoewel men zou denken dat een online-algoritme veel meer functionaliteit bevat, geeft zo‟n algoritme gebaseerd op een offline dataset een zwak resultaat (Schuessler &Axhausen, 2009).
Aangezien er momenteel geen kant en klaar map-matchingalgoritme ter beschikking is en het maken van zo‟n algoritme een uiterst complexe zaak is, wordt deze essentiële stap overgeslagen. Op deze manier wordt het bepalen van de ruimtelijke resultaten een zaak van visuele interpretatie in plaats van een loutere bevraging. Toch wordt er in deze studie een vereenvoudigd map-matchingalgoritme gebruikt om de modus van treinritten te onderscheiden van de autoritten. Het algoritme onderscheidt zich van de normale algoritmes door gebruik te maken van een zeer beperkt netwerk, waardoor het gebruik van eenvoudige voorwaarden om trips te matchen mogelijk wordt.
41
6. RESULTATEN
In dit deel worden eerst de resultaten van de dataverwerving en de dataverwerking besproken. Vervolgens worden de globale resultaten in het kader van verplaatsingsgedrag uiteengezet.
6.1 Analyse van de techniek
Om de kwaliteit van de trips, geëxtraheerd door de automatische dataverwerking, te testen aan de in de realiteit effectief afgelegde verplaatsingen en dus de waarde van GPS als registratietechniek van menselijk verplaatsingsgedrag te evalueren, werd een bijkomend onderzoek opgestart. Het onderzoek moet meer informatie bieden omtrent de kwaliteit van de dataverwerking, de bekwaamheid van de deelnemers en over de mogelijkheden van een GPSlogger als sensorapparaat. Daar waar een analyse via het vooropgestelde onderzoek onmogelijk blijkt, worden de verdere resultaten visueel geïnterpreteerd en besproken.
6.1.1 Bijkomend Onderzoek
De deelnemers worden gedurende een bepaalde tijd getrackt. Daarbij worden ze belast met het registeren van elke verplaatsing van minimaal drie minuten door het begin- en eindtijdstip, datum en de modus te noteren. Vervolgens worden de geëxtraheerde trips vergeleken met de genoteerde verplaatsingen.
6.1.1.1 Methodiek
De vergelijking tussen de trips en genoteerde verplaatsing gebeurt aan de hand van een bijkomend programmaatje. Het resultatenrapport van het programmaatje geeft informatie over het aantal trips die overeenkomen met de verplaatsingen. Men spreekt over een overeenkomstige trip wanneer datum en deelnemer van zowel de trip als de verplaatsing identiek zijn en het verschil in uur kleiner is dan de lengte van de verplaatsing. Zoals in onderstaand uittreksel kan het voorkomen dat voor één verplaatsing verschillende trips overeenkomen. Door bijvoorbeeld een tijdelijk verlies van het signaal kan een deel van de verplaatsing niet getrackt worden en wordt de verplaatsing opgedeeld in twee verschillende trips.
42
De duur van deze overeenkomstige trips wordt vervolgens vergeleken met de duur van de verplaatsing. Deze verhouding geeft informatie over percentage van een verplaatsing dat effectief geregistreerd wordt. Vervolgens wordt er een gemiddelde van de verhoudingen per modus berekend. De grootte van deze verhoudingen hangt af van drie factoren. Ten eerste kan het voorkomen dat de initialisatieperiode te weinig gerespecteerd wordt, waardoor het begin van een verplaatsing niet geregistreerd wordt. Dit heeft bij kleine verplaatsingen een groot effect. Een tweede oorzaak ligt bij het signaalverlies. De verhoudingen op het platteland zouden om die reden hoger moeten liggen dan in de steden. Ten derde kan het voorkomen dat de deelnemers hun logger op een verkeerde manier met zich mee vervoeren waardoor slechts een gedeelte of geen data wordt verzameld. Ten slotte kan een verkeerd begin- en of eindtijdstip bepaald worden tijdens de automatische dataverwerking.
Verder wordt de modus van de overeenkomstige trips vergeleken met het effectieve vervoersmiddel.
Tabel 3: Voorbeeld van een rapport van het vergelijkingsprogramma (Bron: Eigen onderzoek) 22
NR
Datum
Uur
Modus
Dn
Lengte Trip
Verplaatsing
22
2010/04/23
15u31 (15.516)
trein
1
0.9000000000000021
Trip
6
2010/04/23
15:30:26 (15.507)
trein
1
0.0633333333335031 …
15:51:43 (15.862)
trein
1
0.4013888888889596 …
=>verhouding: 0.07037037037055884 Trip
7
2010/04/23
=>verhouding: 0.4459876543210652 107
NR
Datum
Uur
Modus
Dn
Lengte Trip
Verplaatsing
107
2010/05/13
11u47 (11.78)
fiets
1
0.13333333333333286
no match
Het resultatenrapport biedt verder ook informatie over het aantal verplaatsingen waarvoor geen overeenkomstige trip bestaat. Hier liggen hoofdzakelijk drie oorzaken aan de basis. Ten eerste kunnen er geen of veel te weinig records worden geregistreerd. Deelnemers kunnen bijvoorbeeld het GPS-apparaat vergeten tijdens het verplaatsen. Het toestel kan niet opgeladen zijn of per ongeluk uitgeschakeld worden door een verkeerde beweging. Wanneer ze toch een werkend toestel toch bij zich dragen kunnen ze het op een verkeerde wijze vervoeren waardoor slechts een gedeelte of helemaal niets geregistreerd wordt. Een tweede 43
oorzaak ligt bij de dataverwerking. Hoewel een verplaatsing voor een groot deel geregistreerd wordt, is het mogelijk dat deze toch niet herkend kan worden tijdens de dataverwerking en wordt er bijgevolg verkeerdelijk geen trip geëxtraheerd. Ten slotte kan de verplaatsing wel geregistreerd zijn, maar wordt deze tijdens de dataverwerking samen bij een andere trip gevoegd. De methode die instaat voor het splitsen van samengestelde trips werkt niet naar behoren. Deze drie verschillende oorzaken worden telkens onderzocht.
Ten slotte geeft het rapport ook nog de trips mee die met geen enkele verplaatsing overeenkomen. Hiervoor zijn slechts twee verklaringen mogelijk. Hoewel men een verplaatsing maakt, kan het voorkomen dat de verplaatsing niet genoteerd wordt. De andere verklaring ligt in het verkeerdelijk registeren van een trip door de dataverwerking, hoewel er helemaal geen sprake is van een verplaatsing. Om deze fouten uit elkaar te halen, worden de trips in kwestie gevisualiseerd. Aan de hand van een visuele interpretatie wordt bepaald of de trip al dan niet verkeerdelijk door de dataverwerking geregistreerd is.
6.1.1.2 Resultaten
Aangezien dit onderzoek behoorlijk wat medewerking vraagt, werden de deelnemers zorgvuldig uitgekozen. Twee verschillende soorten deelnemers werden voor deze opdracht aangesteld. De eerste groep bestaat uitsluitend uit de uitvoerder van dit werk en werd gedurende anderhalve maand getrackt. De tweede groep bestaat. uit acht verschillende mensen en werd gedurende één week getrackt. De eerste groep onderscheidt zich van de tweede door de vertrouwdheid met, en kennis omtrent de mogelijkheden van de GPS-logger. Op deze manier kon het GPS-apparaat telkens op een zo optimale wijze worden vervoerd. De resultaten van de twee groepen worden afzonderlijk besproken.
Groep 1
Een deel van het resultatenrapport van groep 1 wordt in onderstaande tabel voorgesteld. Het volledig rapport kan men raadplegen in bijlage 3
44
Tabel 4: Resultaten van de dataverwerking van groep 1 (Bron: Eigen onderzoek) Aantal verplaatsingen: 174 Aantal verplaatsingen waarvoor wel een match bestaat: 123 (71%) Verplaatsingen waarvoor geen match bestaat 51 0
2010/04/14
19u12 (19.200)
voet
1
0.10000000000000142
0
2010/04/14
20u55 (20.917)
fiets
1
0.06666666666666643
2010/05/18
21u29 (21.483)
fiets
1
0.05000000000000071
… 0
Aantal trips: 146 Aantal gematchte trips: 134 Niet gematchte trips : 11 4
2010/04/15
10:03:00 (10.050) fiets
1
0.12388888888835937
…
22
2010/04/25
20:49:32 (20.825) voet
1
0.0749999999998181
…
2010/05/16
21:08:43 (21.145) fiets
1
0.26611111111105856
…
… 140
verhouding voet: 0.7715009582330505
1 op 24 foute modus
verhouding fiets: 0.7800935732714801
3 op 78 foute modus
verhouding trein: 0.8022480147871489
0 op 6 foute modus
verhouding Auto/bus: 0.8318211315974152
0 op 10 foute modus
Er zijn 51 verplaatsingen waarvoor geen match bestaat. Na controle in de ruwe GPS-data blijkt dat voor 32 verplaatsingen geen of nauwelijks data geregistreerd is, voor 4 verplaatsingen een “splitsingsfout” optreedt en dat voor 15 verplaatsingen, hoewel de data aanwezig is, verkeerdelijk geen trip wordt geregistreerd. Uit deze gegevens blijkt dat 9% van de verplaatsingen niet wordt herkend tijdens de automatische dataverwerking en dat 2% wel wordt herkend, maar niet als afzonderlijke trip. Men kan bijgevolg besluiten dat de dataverwerking voor 89% voldoet in het herkennen van trips in ruwe GPS-data. Aangezien er bijkomend 32 verplaatsingen niet worden geregistreerd door een verkeerd gebruik van de GPS-logger, is er in werkelijkheid slechts voor 71% van alle verplaatsingen een overeenkomstige trip.
Deze verplaatsingen worden voor gemiddeld 80% geregistreerd, waarbij er geen significant verschil is qua modus. Het is zeer moeilijk te achterhalen welke van de drie factoren hier in dit geval het zwaarste doorwegen. Vermoedelijk speelt de factor van signaalverlies en die van de initialisatieperiode de grootste rol. Bijgevolg kan men zeggen dan 57% van alle verplaatsingen geregistreerd werd tijdens de anderhalve maand. Als men uitgaat van een volledig passief systeem, zou men, als men veronderstelt dat deze groep geen fouten maakt 45
tegen het verkeerdelijk dragen van de logger, aan de hand van de vooropgestelde dataverwerking een resultaat kunnen behalen tussen 71% en 75%. Verder blijkt uit de resultaten dat er slechts voor 5% van de overeenkomstige trips een foute modus gegeneerd wordt.
Er zijn 11 trips die niet overeenkomen met één of andere verplaatsing. Na visualisatie van deze trips bleken slechts 2 verkeerdelijk als trip geëxtraheerd te zijn. De overige trips bleken allen verplaatsingen te zijn die men vergeten te noteren was, wat ongeveer overeenkomt met 6% van alle trips. Groep 2
Een deel van het resultatenrapport van groep 2 wordt in onderstaande tabel voorgesteld Tabel 5: Resultaten van groep 2 (Bron: Eigen onderzoek) Aantal verplaatsingen: 155 Aantal verplaatsingen waarvoor wel een match bestaat: 77 (50%) Verplaatsingen waarvoor geen match bestaat 78 0
2010/05/04
11u25 (11.417)
auto
1
0.10000000000000142
0
2010/05/04
15u55 (20.917)
voet
1
0.40000000000000036
2010/05/31
11u29 (11.483)
fiets
1
0. 12388888888835937
… 0
Aantal trips: 81 Aantal gematchte trips: 73 Niet gematchte trips : 8 8
2010/05/8
21:55:06 (21.918) fiets
1
0.04194444444465262
…
33
2010/05/11
08:43:04 (8.718)
fiets
1
0.030833333332793703
…
2010/05/18
11:50:23 (11.840)
voet
1
0.05277777777746451
…
… 54
Verhoudingen verhouding voet: 0.6551791515793137 verhouding fiets: 0.6590344269031252 verhouding trein: 0.7022480147871489 verhouding Auto/bus: 0.6118211315974152
46
Van de 155 afgelegde verplaatsingen, zijn er slechts 77 die aan een trip gelinkt kunnen worden. In de ruwe data ziet men dat er voor maar liefst 62 verplaatsingen geen of nauwelijks data kan terug gevonden worden. Van de overblijvende verplaatsingen zijn er 13 die ten onrechte als geen trip worden aanzien en 3 waarvoor een “splitsingsfout” optreedt. Dat komt neer op respectievelijk 8% en 2% van alle verplaatsingen. Toch werd het grootste deel van de verplaatsingen, ongeveer 40%, niet geregistreerd omwille van het verkeerd gebruik van de logger. Bijgevolg wordt er globaal genomen slechts voor 50% van de verplaatsingen een passende trip voorzien.
Deze overgebleven verplaatsingen worden voor ongeveer 65% geregistreerd, waarbij er ook hier geen significant verschil is qua modus. De zwaarst doorwegende factor is hoogstwaarschijnlijk het verkeerd dragen van de logger. Alles in acht genomen kan men concluderen dat de verplaatsingen van de tweede groep voor slechts 33% geregistreerd zijn.
Er zijn 8 trips die niet overeenkomen met één of andere verplaatsing. Na visualisatie van deze trips bleek er slechts één verkeerdelijk als trip geëxtraheerd te zijn. De overige zeven trips bleken allen verplaatsingen te zijn die men vergeten te noteren was, wat ongeveer overeenkomt met 5% van alle trips.
6.1.1.3 Besluit
Er bestaat een groot verschil tussen de resultaten van de twee groepen. De totale registratie van de verplaatsingen is bijna de helft minder in groep 2. De vertrouwdheid met het toestel speelt hierbij een grote rol. Hoewel de deelnemers van groep 2 hun verplaatsingen noteren, zijn ze op stap met geen logger of een logger waarvan de batterij leeg is. Dit heeft als gevolg dat niets geregistreerd wordt. In een andere situatie kunnen ze het toestel wel bij zich hebben, maar stoppen ze het te diep weg waardoor slechts flarden van de verplaatsing geregistreerd wordt. Hierdoor kan er geen trip of een trip met een kleine verhouding ontstaan. Bij een volledig passief systeem speelt de vertrouwdheid met het apparaat geen rol meer en zou men niet over zulke verschillen tussen beide groepen kunnen spreken.
De dataverwerking zelf voldoet in beide gevallen voor ongeveer 90% in het bepalen van een trip voor een zekere verplaatsing. Ongeveer 8% van alle trips wordt door de data processing
47
niet herkent als trip. 2% wordt verkeerdelijk als trip aanzien. Verder kan de automatische dataverwerking nog een fout maken tegen een verkeerde begin- of eindpunt bepaling. Omdat men de grootte van deze fout eerder laag inschat, komt men op een slagingspercentage van ruim 85%. Als men bijgevolg over een volledige dataset zou beschikken, kunnen meer dan 85 van de 100 trips geëxtraheerd worden.
Het resultaat van de correcte modusdetectie is in beide groepen ongeveer gelijk. Men kan stellen dat de modusdetectie in 95% van de gevallen een correct resultaat geeft.
6.1.2 Visuele interpretatie
De evaluatietechniek, zoals hierboven uiteengezet, laat een vergelijking van de ruimtelijke component van de verplaatsing en overeenkomstige trip niet toe. Men kan bijvoorbeeld niet controleren of de trips net dezelfde weg inhouden als de overeenkomstige verplaatsingen. Deze controle wordt in deze studie louter visueel getoetst. De trips worden gevisualiseerd in ArcMAP. Alle gefilterde GPS-records en de informatie over de trips worden geïmporteerd. Aan de hand van de ET Geowizard 9.9, een set van zeer krachtige functies, kunnen de punten geconverteerd worden naar de overeenkomstige trips in een nieuwe polyline shapefile. Aan deze shapefile kan de informatie van de trips geassocieerd worden, waardoor de visualisatie van de vier verschillende vervoerswijzen mogelijk wordt.
In onderstaande figuur 8 wordt een activiteit afgebeeld die van het zuiden naar het noorden gaat. Enerzijds worden de GPS-records van de ruwe data in het rood gevisualiseerd en anderzijds de gefilterde data in het blauw.
48
Tabel 6: Uittreksel van GPS-records van de trip afgebeeld infiguur 8 (Bron: Eigen onderzoek) NR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
LON 193428.3 193482.1 193535.2 193570.7 193610.3 193661.4 193710.5 193760.3 193816 193841.6 193858.1 193903.3 193945.3 193984.5 194005 194084.5 194173.3 194210.7 194249.9 194243
LAT COURSE 105553.2 57 105566.6 333 105560.8 27 105572.1 1 105560.8 170 105551.8 168 105552 345 105538.1 335 105522.6 348 105506.8 344 105516.5 12 105490.4 353 105491.5 339 105474.6 350 105456.8 297 105444.8 119 105434.3 329 105423.5 337 105403.3 68 105473.8 55
KOERS 45 20 355 25 345 350 1 344 343 343 29 341 8 339 320 351 352 347 104 45
DIST 320.83 55.46 53.41 37.26 41.14 51.79 49.15 51.62 57.82 30.08 19.1 52.08 42.04 42.62 27.1 80.3 89.44 38.85 44.08 70.6
Figuur 8: Verschil van de ruwe data en de geëxtraheerde data Bron: Eigen verwerking Zo is via de figuur duidelijk te zien dat tijdens de dataverwerking niet alle punten worden opgenomen in de nieuwe databank. Toch zou men na een visuele interpretatie van de ruwe data moeten concluderen dat de punten wel moeten worden opgenomen, aangezien de dataverwerking geen methode bevat die de punten uit de nieuwe databank zou weren. Het probleem ligt hier bij de tweede filtermethode die gebruik maakt van de koers van de verschillende punten.
49
De koers die gemaakt wordt tussen twee opeenvolgende punten, wordt bepaald aan de hand van het doppler-meting waarmee ook de snelheid tussen opeenvolgende punten wordt berekend. De koers, bepaald via een doppler-meting, verschilt in verscheidene situaties fundamenteel met een zelf berekende koers tussen twee opeenvolgende punten, zoals weergegeven in omcirkelde cellen van de bijhorende tabel 6. Het gaat om een verschil van ongeveer 180 graden, wat net het criterium is waarvan de tweede filtermethode gebruikt maakt om de multipath-effecten te elimineren.
In figuur 9 wordt een trip afgebeeld waarbij men op de aangegeven positie een koerswijziging van ongeveer 180 graden verwacht. Toch vindt men deze wijziging niet terug in de bijhorende tabel. Een doppler-meting is immers gebaseerd op frequentiewijzigingen en houdt geen rekening met absolute plaats van de GPS-punten. Het is om die reden dat de aangevoerde koers en de zelf berekende koers in sommige gevallen, zoals hier afgebeeld, kunnen verschillen.
Figuur 9: Verschil tussen de gemeten koers en de werkelijke koers Bron: Eigen verwerking
Dankzij deze bevindingen is het beter dat men naast de koers, berekend via het doppler-effect, ook rekening houdt met de zelf bepaalde koers tussen opeenvolgende punten. Op deze manier zal de filtermethode beter presteren. 50
Het is om deze reden dat vele trips, hoofdzakelijk de verplaatsingen te voet, ondanks het toepassen van de tweede filtermethode, nog ontzettend veel “spikes” bevatten. Zoals te zien in onderstaande figuur 10 kan men besluiten dat hoe lager de snelheid van een trip is, des te meer deze onderheven is aan “spikes”. Deze sprongen zijn de gevolgen van het multipatheffect en/of een wijziging van de ontvangen satellieten in positie of aantal.
Figuur 10: Verschil in aantal “spikes” afhankelijk van de modus Bron: Eigen verwerking
In de figuur is duidelijk te zien dat de spikes bij de wandeltrip niet groter zijn dan 30 meter. Als men daarbij nog bedenkt dat tijdens het wandelen, in tegenstelling tot andere activiteiten, de grootste kans bestaat om zichzelf te draaien en te keren, kan men concluderen dat spikes grotendeels een gevolg zijn van een wijziging in de satellietenconstellatie. Bij een lage snelheid worden er meer punten geregistreerd en is de kans op zo‟n verspringing groter. Bij alle andere trips kunnen er ook spikes voorkomen, maar deze zijn hoofdzakelijk de oorzaak van het multipath-effect.
Verder valt er ook op te merken dat er weinig treinritten tussen de activiteiten zitten, slechts 42 van de 2802. Bij een nadere kijk blijken sommige treinritten, ongeveer een tiental, ten onrechte als autoritten geklasseerd te zijn. Treinritten bevinden zich a priori in een samengestelde trip. Zo moet je bijvoorbeeld bij het verlaten van het station in de meeste gevallen nog enige afstand overbruggen vooraleer je een eindhalte bereikt. Aangezien de hier 51
vooropgestelde methode ervan uitgaat dat er tussen zulke activiteiten een verplaatsing te voet aanwezig moet zijn, zullen samengestelde trips, die bestaan uit enkel een treinrit en een autorit niet van elkaar worden gescheiden. Zo kan het bijvoorbeeld voorkomen dat je wordt opgepikt aan het station, of je meteen na het uitstappen een taxi neemt. Een voorbeeld wordt in onderstaande figuur 11 afgebeeld.
Figuur 11: Gevolg van het niet splitsen van een samengestelde trip Bron: Eigen verwerking
In het voorbeeld wordt de lichtblauwe trip samengesteld uit een treinrit, een trip te voet en een fietstrip. Aangezien de duur van de te voet afgelegde verplaatsing te klein is, wordt de samengestelde trip niet gesplitst. Bij het bepalen van de modus wordt er vervolgens bekeken of het al dan niet om een treinrit gaat. Minder dan 75 % van de punten valt samen met het Belgische spoornetwerk, waardoor de trip als een auto/busrit wordt beschouwd. Merk hierbij op dat het criterium geldt voor 75% van de punten in plaats van de afgelegde weg. In het laatste geval zou de trip wel, maar toch ook gedeeltelijk verkeerd, als een treinrit aanzien worden.
6.2 Analyse van de globale resultaten
Dit deel tracht voorbeelden te geven van enkele analysemogelijkheden van de bekomen data. Aangezien er geen map-matching kon plaatsvinden, is een analyse met betrekking tot de ruimtelijke component eerder moeilijk. Voor zulke analyse moet men zich beperken tot een
52
visuele interpretatie. Merk hierbij op dat de hieronder uitgewerkte voorbeelden slechts exemplarisch zijn. Er kan immers nog veel meer informatie uit de gegevens gehaald worden, maar dat is niet de essentie van dit onderzoek.
6.2.1 Tijdstippen van de verplaatsingen
In onderstaande frequentiegrafiek worden de begintijdstippen van de verschillende trips afgebeeld. Het percentage van alle 2802 afgelegde trips wordt per uur weergegeven. Naast de trips van de studenten worden ook de algemene gegevens van de dienst mobiliteit Vlaanderen gebruikt om zo enige vergelijking te maken (http://www.mobielvlaanderen.be/ovg, 10 augustus 2010). Deze bron geeft geen gegevens weer van activiteiten die plaats vinden voor 8 uur ‟s morgens. Aan de hand van de opgestelde grafiek wordt het mogelijk te achterhalen wanneer de studenten juist hun verplaatsingen maken en wat hen onderscheidt van de algemene bevolking. Zo kan men aflezen dat er tijdens de spitsuren, 8 uur ‟s morgens en 16-17 uur ‟s avonds, ontzettend veel verplaatsingen worden geregistreerd, hoewel de avondspits van de studenten toch eerder een uur later ligt dan de algemene avondspits die overigens meer aanwezig is. Verder merken we op dat het grootst aantal verplaatsingen van de studenten tijdens de middaguren 13u en 14u gebeuren. Vermoedelijk speelt hier, net zoals bij de latere “avondspits”, het eind- en beginuur van de verschillende lessenblokken een grote rol. De ochtendlessen beginnen veelal om 8u30 en eindigen om 12u45, om vervolgens om 14u30 de lessen terug aan te vatten en te stoppen om 17u15 of 18u45.
53
Figuur 12: Verschil tussen de tijdstippen van de verplaatsingen afgelegd door de studenten en door de algemene bevolking. Hierbij wordt het aantal verplaatsingen procentueel afgebeeld Bron: Eigen onderzoek, http://www.mobielvlaanderen.be/ovg, 10 augustus 2010 Verder valt het relatief grote aantal verplaatsingen van de studenten in de avond en zelfs in de nacht op. Men kan zeggen dat de studenten na 21 uur dubbel zo actief zijn als de globale Vlaming. Na een visuele interpretatie aan de hand van onderstaande figuren is te zien dat de studenten vanaf 22u tot diep in de nacht zich hoofdzakelijk verplaatsen in de Overpoortstraat en St-Pietersnieuwsstraat. Hierbij vormen de rode lijnen de trips die na 22 uur plaatsvinden.
54
Figuur 13: Locaties waarlangs de student zich na 22u hoofdzakelijk verplaatst Bron: Eigen verwerking Een laatste opmerking in verband met de tijd heeft te maken met de dagen waarop de trein genomen wordt. Hoewel men zou denken dat studenten de trein hoofdzakelijk op vrijdag en zondag nemen, blijkt uit de resultaten dat dit aandeel slechts uit 33% bestaat. Hieruit kan men besluiten dat er veel niet-kotstudenten dagelijks hun verplaatsingen maken met de trein.
6.2.2 Vervoersmiddelen van de verplaatsingen
Uit de resultaten blijkt dat de fiets nog steeds het meest aantrekkelijke voertuig is bij de studenten. Maar liefst 51% van alle verplaatsingen werd gedaan met de fiets. Daarnaast werden respectievelijk 27% en 20% van de verplaatsingen gedaan te voet en met de auto of bus. Tenslotte zijn de overige 2% goed voor de verplaatsingen per trein.
Verder wordt nagegaan welk vervoersmiddel de studenten gebruiken om een bepaalde afstand te overbruggen. Uit de resultaten blijkt de gemiddelde afgelegde afstand met de auto of bus 12.1 km te bedragen. Toch kan men uit onderstaande grafiek concluderen dat de auto heel vaak gebruikt wordt om kortere afstanden af te leggen. Deze bevinding wordt overigens bevestigd aan de hand van het 25ste en 50ste percentiel wat respectievelijk een afstand van 4.1
55
en 7.7 km oplevert. Een mogelijke verklaring voor dit fenomeen is het veelvuldig gebruik van het openbaar vervoer in de stad. Zulke verplaatsingen houden veelal geen grote afstanden in.
Figuur 14: Frequentiegrafiek van al de verplaatsingen met de auto of bus t.o.v. een zekere afstand Bron: Eigen onderzoek De gemiddelde afstand, afgelegd per fiets, bedraagt ongeveer 2,1 km. Ook hier kan men uit onderstaande grafiek aflezen dat de ritten tot 1,5 km de grote meerderheid vormen. Het 25ste percentiel bedraagt 0,9 km, het 50ste percentiel bedraagt 1,4 km en het 75ste percentiel bedraagt 3,5 km.
De gemiddelde afstand te voet is 800 meter, hoewel men uit de grafiek kan interpreteren dat de meeste verplaatsingen slechts voor minder dan 600 meter zijn. Het 25ste percentiel bedraagt 320 m, het 50ste percentiel bedraagt 530 m en het 75ste percentiel bedraagt 1000 m.
56
a) b) Figuur 15: Frequentiegrafieken van de verplaatsingen van respectievelijk (a) fiets en (b) voet t.o.v. een zekere afstand Bron: Eigen onderzoek Hieruit kan men besluiten dat een student in de meeste gevallen een verplaatsing te voet overweegt als de afstand ervan niet groter is dan 1,0 km. Hij zal eerder voor de fiets kiezen als de af te leggen afstand groter is dan deze kilometer, maar de 3,5 km niet overschrijdt. Wanneer de afstand meer dan 4 km bedraagt, kiest de student voor een gemotoriseerde verplaatsing. Merk hierbij op dat de conclusies enkel gebaseerd zijn op de afstand. Vermoedelijk spelen er nog meer factoren mee, waaronder tijd.
6.2.3 Belangrijkste toegangswegen van en naar campus de Sterre
Om toch enige analyse te voeren in verband met de ruimtelijke component van de verzamelde data, wordt onderzocht wat de belangrijkste toegangswegen zijn om de campus de Sterre, en in het bijzonder de S8, te bereiken. Zoals hierboven aangehaald, kan men hiervoor slechts beroep doen op een visuele interpretatie. Alle trips die een begin- of eindpunt hebben in een zekere straal rond de campus worden geselecteerd, wat resulteert in 693 trips. Vervolgens worden alle trips geselecteerd die langs een bepaalde toegangsweg lopen. Op deze manier wordt het mogelijk de verplaatsingsstromen in kaart te brengen zoals wordt voorgesteld in bijlage 2.
57
Het is niet te verwonderlijk dat zowel de Voskeslaan als de Krijgslaan de belangrijkste toegangswegen vormen. Het aantal studenten dat de school bereikt via het zuiden en het westen is behoorlijk klein, aangezien het station en de meeste studentenwoningen zich in het noorden bevinden. Toch vindt men een vreemde situatie terug voor diegene die in de richting van Overpoortstraat moeten. Het aantal studenten die heel de Krijgslaan afrijden is ongeveer even groot als het aantal dat de Zwijnaardsesteenweg neemt. Enkele onder hen veranderen in het midden van toegangsweg. Vermoedelijk maken de studenten in het heengaan meer gebruik van de Zwijnaardsesteenweg omdat op dat ogenblik de verkeersituatie ter hoogte van de Overpoortstraat gunstiger is dan bij het terugkomen. Van de studenten die de Zwijnaardsesteenweg nemen is er slechts een kleine minderheid die vroegtijdig afslaat richting Kortrijksesteenweg via Lucas de Heerestraat.
58
7. BESLUIT
Deze studie tracht het verplaatsingsgedrag van de Gentse studenten in kaart te brengen aan de hand van een nieuw opgestelde registratiemethode die gebruik maakt van GPS. Hierbij wordt GPS aanzien als een sensorapparaat dat in staat is menselijke activiteit te registreren in de vorm van spatio-temporele data. Tevens wordt onderzocht wat de waarde is van GPS als sensortechniek voor het registeren van die menselijke activiteit. De opbouw van deze studie weerspiegelt de verscheidene fases waarin het onderzoek verliep. Tijdens de data-aquisitie werden 123 Gentse studenten aan de faculteit Wetenschappen gedurende twee weken geregistreerd aan de hand van deze methode. Dit resulteerde in 1000000 GPS-records. Mede omdat een deelname niet vergoed werd, verliep de zoektocht naar geschikte kandidaten soms moeizaam. Van de geselecteerde studenten varieerde de participatiegraad erg sterk. Al in de eerste fase werd duidelijk dat de hinderpalen bij een eventuele deelname tot een minimum beperkt moesten worden door de methode zo passief mogelijk te houden. Om deze reden is er snel van het idee afgestapt om de deelnemers het toestel zelf te laten uitlezen en de data te uploaden. Dankzij deze ingreep in de procedure steeg het aantal binnenkomende gegevens fundamenteel. De actieve bijdrage van de kandidaten tot de procedure bestaat enkel nog uit het dagelijks opladen van de batterij, het vervoeren van de GPS op een zichtbare plaats en het terugbrengen van de GPS. Een langere levensduur van de batterij en de ontwikkeling van een systeem waarbij de medewerkers de loggers als een horloge rond de pols dragen, kunnen de performantie en de participatiegraad van eventuele toekomstige experimenten aanzienlijk optimaliseren. Gezien de verzamelde data sterk onderhevig zijn aan talrijke externe fenomenen, zoals het multipath-effect, blokkade van het satellietsignaal, een tekort aan satellieten tijdens de initialisatieperiode,…, is een ver doorgevoerde dataverwerking noodzakelijk om enige waardevolle informatie uit de ruwe dataset te halen. Een voor dit onderzoek ontwikkelde JAVA-applicatie extraheerde ongeveer 85% van de geregistreerde verplaatsingen, waarbij in 95% van de gevallen de correcte modus bepaald werd. Daarbij liet de methode die instaat voor het splitsen van samengestelde trips niet geheel foutloos te werken.
59
Hoewel dit resultaat in eerste instantie bevredigend is, blijkt de ruimtelijke component van de trips ten opzichte van die van de verplaatsingen grote afwijkingen te vertonen. Tijdens de verwerking werden vele toevallige fouten te wijten aan het multipath-effect genegeerd, wat tot grote “spikes” leidt. Hierbij speelden de aangevoerde koers en de snelheid van de GPSrecords een grote rol. Deze attributen worden immers bepaald via een doppler-meting, die tijdens de berekeningen geen rekening houdt met de absolute plaats van de GPS-punten. De aangevoerde koers en snelheid kunnen bijgevolg verschillen van de zelf berekende attributen. Daarom lijkt een methode, die rekening houdt met beide waarden in combinatie met een passend smoothingalgoritme aangewezen.
Uit de verwerkte gegevens werd het verplaatsingsgedrag van de Gentse studenten afgeleid. Hierbij springen enkele zaken in het oog. Zo is de fiets nog steeds het populairste vervoersmiddel bij de student. Meer dan 50% van de verplaatsingen wordt met de fiets afgelegd. Hoewel deze verplaatsingen hoofdzakelijk overdag plaatsvinden, zijn de studenten na 21 uur dubbel zo actief als de globale Vlaming. Men kan ze op die momenten hoofdzakelijk terug vinden in de Overpoortstraat en St-Pietersnieuwstraat. Verder blijken de Krijgslaan en de Voskeslaan de belangrijkste toegangswegen om de campus Sterre te bereiken.
Men kan besluiten dat GPS als sensorsysteem in combinatie met een ver doorgevoerde dataverwerking uiterst geschikt is voor het registreren van menselijk verplaatsingsgedrag. Hoewel men erg veel informatie kan puren uit de verwerkte gegevens, is een zeer grondige ruimtelijke analyse onmogelijk zonder de toepassing van een map-matchingalgoritme. Met het oog op toekomstig onderzoek is het gebruik van zo‟n algoritme samen met een nog passievere registratiemethode dan ook aanbevolen.
60
8. REFERENTIE Artikels Bradley, N.A., Dunlop, M.D. (2005) “An experimental investigation into wayfinding directions for visually impaired people”. Personal and Ubiquitous Computing. 9(6), 395-403. Canters, F. (2002) “Kaartprojecties en kaartafbeeldingen” Chung, E.H., Shalaby, A. (2005) “A trip bases reconstruction tool for GPS-based personal travel surveys”. Transportation Planning and Technology. 28 (5) 381–401. De Maeyer, P., De Vliegher,B. M., Brondeel, M. (2004) De spiegel van de wereld. Fundamenten van de cartografie. Gent: Academia Press. De Maeyer, P. (2010) GI-Management: management van en met geografische informatie. Gent: Academia Press. De Mol, J. (1991) “Hoe doen ze het ? En hoe dikwijls ? Enquête verplaatsingsgedrag Gentse studenten”. Verkeersspecialist, Diegem, Kluwer Editorial. 58, 16-21. Drewes, H. (2006) Geodetic reference frames. Munich: Springer. Du, J., Aultman-Hall, L. (2007) “Increasing the accuracy of trip rate information from passive multi-day GPS travel datasets: Automatic trip end identification issues”. Transportation Research. Part A 41, 220-232. Duncan, M. J., Mummery, W.K., Dascombe, B. J. (2007) “Utility of global positioning system to measure active transport in urban areas”. Medicine & Science in Sports &Exercise. 39(9), 1851-1857. Duncan, M.J., Badland, H.M., & Mummery, W.K. (2008) “Aplying GPS to enhance of transport-related physical activity”. Journal of Sciense and Medicine in Sport. 12, 549-556. Eissfeller, B., Ameres, G., Kropp, V., Sanroma, D. (2007) “Performance of GPS, GLONASS and Galileo”. In: Dieter Fritsch (Ed.) Photogrammetric Week ’07. Heidelberg: Wichmann, pp.185-199. Elgethun, K., Yost, M.G., Fitzpatrick, C.T.E., Nyerges, T.L., Fenske, R.A. (2007) “Comparison of global positioning system (GPS) tracking and parent-report diaries to characterize childeren‟s time-locations patterns”. Journal of Exposure Science and Environmental Epidemiology. 17, 196-206. Flamm, M., Kaufmann, V. (2007) “Combining person based GPS tracking and prompted recall interviews for a comprehensive investigation of travel behaviour adaptation processes
61
during life course transitions” paper voorgesteld op the 11th World Conference on Transportation Research, Berkeley. Goodchild, M.F., Anselin, L., Appelbaum, P., Herr-Harthorn, B. (2000) “Towards spatially integrated social science”. International Regional Science Review. 23(2), 139-159. Himpe, W. (Te Verschijnen) “Combining heterogeneous sensor information for the activity tracking of smart phone users”. Jun, J., Guensler, R., Ogle, J. (2007) “Smoothing methods to minimize impact of Global Positioning System random error on travel distance, speed, and acceleration profile estimates”. Transportation Research Record. 1972, 141–150. Kobayashi, T. (Te Verschijnen) “An Interactive Visualization Tool for Mobile Objects”. Landau, R., Auslander, G.K., Werner, S., Shoval, N., & Heinik, J. (2010) “Families‟ and Professional Caregivers‟ Views of using advanced technology to track people with dementia”. Qualitive Health Research. 20(3), 409-419. Le Faucher, A., Abraham, P., Jaquinandi, V., Bouye, P., Saumet, J. L., Noury-Desvaux, B. (2007) “Study of human outdoor walking with low-cost GPS and simple spreadsheet analysis”. Medicine & Science in Sport & Exercise. 39(9), 1570-1578. Maddison, R., Ni Mhurchu, C., (2009) “Global positioning system: a new opportunity in physical activity measurement”. International Journal of Behavioral Nutrition and Physical Activity. 6(73), 1479-1494. Michael, Y., McGregor, E.M., Allen, J., Fickas, S. (2008) “Observing outdour activity using global positioning system-enabled cell phones” Lecture Notes in Computer Science. 5120, 177-184. Rainham, D., Krewski, D., McDowell, I., Sawanda, M., Liekens, B. (2008) “Development of a wearable global positioning system for place and health research”. International Journal of Health Geographics. 7(59). Schuessler, N., Axhausen, K.W. (2009) “Processing raw data from global positioning systems without additional information”. Transportation Research Record: Journal of the Transportation Research Board. 2015, 28-36. Shoval, N., Isaacson, M. (2006) “Application of tracking technologies to the study of pedestrian spatial behavior”. The professional Geographer. 58(2), 172-183. Stopher, P., Bulluck, P., Jiang, Q. (2003) “Visualizing trips and travel characteristics from GPS data”. Road & Transportation Research. 12, 3-14. Stopher, P., FitzGerald, C., Zhung, J. (2008) “Search for a global positiong system device to measure person travel”. Transportation Research. Part C 16, 350-369.
62
Szalai, A. (1972) The use of time: Daily activities of urban and suburban populations in twelve countries. The Hague and Paris: Mouton.
Troped, P.J., Oliveire, M.S., Matthews, C.E., Cromley, E.K., Melly, S.J., Craig, B.A. (2008) “Prediction of activity mode whith global positioning system and accelerometer data”. Medicine & Science in Sport & Exercise.40(5), 972-978. Upadhyay, D., Schuessler, N., Axhausen, K.W., Flamm, M., Kaufmann, V. (Te Verschijnen) “Optimal parameter values for GPS post-processing: An experiment”. Van de Weghe, N. (2010) “Samengestelde cursus Geografische Informatie Wetenschap (GIW)” Van der Spek, S., van Schaick, J., de Bois, P., de Haan, R. (2009) “Sensing human activity: GPS tracking”. Sensors. 9, 3033-3055.
Websites http://www.agiv.be/gis/downloads/flepos/trfset32.pdf, 24 juli 2010 http://calypso.inesc-id.pt/FCUL/psm/docs/kalman-dan-simon.pdf, 29 juli 2010 http://www.mobielvlaanderen.be/ovg, 1 augustus 2010 http://www.trackstick.com, 3 augustus 2010 http://www.garmin.be/nl/prod.asp?refNR=GPIREC0100065821, 7 augustus 2010 http://www.i-gotu.com/, 7 augustus 2010 http://julien.cayzac.name/code/gps/pictures/gps-multipath-nightmare.png, 9 augustus 2010 http://www.geocaching.be, 10 augustus 2010 http://www.rfidnederland.nl, 10 augustus 2010
Software Microsoft Office Word 2007 Microsoft Office Excel 2007 Microsoft Office Access 2007
63
ArcGIS 9.3.1 ET Geowizard 9.9
64
BIJLAGE Bijlage 1: Verplaatsingsgedrag van de Gentse studenten
65
Bijlage 2: Verplaatsingsstromen van en naar campus S8
66
Bijlage 3: Rapport van vergelijkingsprogramma Zie hiervoor naar het bestand, gesitueerd op volgende plaats: Thesis_WardVanHal\Vergelijkingsrapport groep1.docx Bijlage 4: Programma dataverwerking Zie hiervoor naar de map, gesitueerd op volgende plaats: Thesis_WardVanHal\Programma_dataverwerking
67