VAN COMPLEXE DATA NAAR DATAVISUALISATIE
SEMINAR (DREAMDISCOVERDO) FLOOR OOSTENRIJK 1626280 12 JUNI 2015 JAAR 3 - BLOK D HANNEKE PONTEN HOGESCHOOL UTRECHT
Inhoudsopgave Inleiding en onderzoeksopzet Wat is een datavisualisatie?
I. Waarom is datavisualisatie belangrijk? II. Welke middelen worden gebruikt in een datavisualisatie? III. Wat voor data is geschikt voor een visualisatie? IV. Wat maakt een datavisualisatie goed? Conclusie en antwoord op de hoofdvraag Bibliografie Reflectieverslag
03 04 06 10 14 17 20 23 25
Inleiding en onderzoeksopzet Inleiding Als CMD’er is het belangrijk trends op het gebied van design en communicatie in het oog te houden. Het liefst om ‘ahead of the curve’ te blijven, maar in iedergeval om er voor te zorgen dat je niet achterblijft. Één van de belangrijkste trends binnen beide gebieden is op dit moment datavisualisatie. Dit is een trend die ik zeer interessant vind omdat het mijn liefde voor (goed) design combineert met het communiceren van grote hoeveelheden, vaak complexe data, op een overzichtelijke manier. Ik denk dat het voor ons vakgebied een belangrijke kracht kan zijn om goed te weten hoe datavisualisatie precies ingezet kan worden en wat daar bij komt kijken. Ik zou me graag meer met datavisualisatie bezig houden in de toekomst en ga om die reden dan ook de minor Big Data volgen in het vierde jaar. Dit betekend dat dit onderzoek niet alleen interessant is, maar ook een goede voorbereidende rol heeft voor mijn minor. Hierdoor weet ik wat datavisualisatie precies inhoudt en waar ik rekening mee moet houden tijdens het maken van een eigen datavisualisatie. Onderzoeksopzet Hoofdvraag Hoe kan datavisualisatie ingezet worden om complexe data inzichtelijk te maken? Deelvragen I.Waarom is datavisualisatie belangrijk? II.Welke middelen worden gebruikt in een datavisualisatie? III.Wat voor data is geschikt voor een visualisatie? IV.Wat maakt een datavisualisatie goed?
Wat is een datavisualisatie? Om een goed onderzoek te kunnen doen naar de vraag hoe datavisualisaties complexe data inzichtelijk maken, is het natuurlijk belangrijk dat we eerst vaststellen wat een datavisualisatie is. Veel mensen denken bij het woord datavisualisatie direct aan de hedendaagse infographics, dit zijn echter niet de eerste datavisualisaties. Als we kijken naar de letterlijke definitie van het woord datavisualisatie, namelijk een visuele representatie van data, zien we dat de eerste datavisualisaties al duizenden jaren geleden werden gemaakt. Zo zijn er prehistorische tekeningen gevonden in grotten, die het jachtproces van onze verre voorouders inzichtelijk maken door middel van tekeningen. In feite zijn dit dus al datavisualisaties te noemen. In feite zijn dus alle visuele weergaves van informatie, op wat voor manier dan ook, datavisualisaties te noemen. Of het nu gaat om het inzichtelijk maken van een werkproces, de presentatie van verkoopcijfers in de vorm van een grafiek, of een bouwtekening. (Information Graphics) Voor mijn onderzoek heb ik niet gekeken naar datavisualisaties in de breedste zin van het woord. Om een duidelijk onderwerp te hebben en een goede richtlijn voor mijn onderzoek laat ik de allereerste datavisualisaties buiten beschouwing. Ik heb dus gekeken naar de modernere datavisualisaties.
Een grottekening te Lascaux, Frankrijk. De eerste vorm van datavisualisatie, 17.000 vóór Chr. Bron: De Organisatie Activist
Data visualization is the presentation of data in a pictorial or graphical format. For centuries, people have depended on visual representations such as charts and maps to understand information more easily and quickly. -SAS
I.Waarom is datavisualisatie belangrijk? Wat is de meerwaarde van datavisualisatie? Natuurlijk, een visuele representatie is aantrekkelijker voor het oog dan een lijst met cijfers, maar is dat de enige reden om datavisualisaties te maken? Dit is niet het geval, Nathan Yau beschrijft in zijn boek Visualize This (2011) pag. XIV - XXI hoe datavisualisaties inzicht geven in de cijfers. Hij schrijft dat het menselijk brein beter en sneller in staat is patronen te ontdekken in visuele uitingen dan in cijfers alleen. Zo geeft hij het voorbeeld van de werkloosheid in de Verenigde Staten. In eerste instantie ziet men enkel de cijfers van verschillende gebieden over de jaren, maar hieruit is niet direct een trend te ontdekken (Fig. 1). In de visualisatie van deze data waarop de kaart van Amerika te zien is met daarbij een kleurcodering voor de werkloosheid percentages ziet men echter in één oogopslag hoe een steeds groter gebied met een steeds hogere werkloosheid te kampen kreeg (Fig. 2). Het is direct duidelijk dat in eerste instantie vooral de westkust werd getroffen en daarna de oostkust. Vervolgens trok de golf van werkloosheid steeds verder landinwaards tot in de laatste figuur te zien is hoe enkel in het midden van de V.S. de cijfers relatief normaal zijn gebleven. Deze zelfde trend ontdekken in een lijst met platte cijfers zou waarschijnlijk uren, dan wel dagen van analyse kosten.
Fig. 1: De werkloosheid in de Verenigde Staten per staat. Bron: United States Department of Labor - Bureau of Labor Statistics
In Designing Information (2012) pag. 25 beschrijft Joel Katz hoe niet alleen op zichzelf staande data gebaad is bij een visualisatie, maar ook onderlinge relaties tussen verschillende punten. Deze complexe connecties zijn vaak niet zichtbaar als de data los wordt bekeken. In een visualisatie kunnen deze connecties gemakkelijk en overzichtelijk worden weergegeven door de verschillende punten met elkaar te verbinden. Hierdoor ontstaat een duidelijke relatie tussen verschillende datapunten, die gemakkelijker te interpreteren is. Om verder te begrijpen waarom datavisualisatie belangrijk is, is het zaak dat men begrijpt dat er niet slechts één enkele soort datavisualisatie bestaat. Volgens Noah Illiinsky en Julie Steele (Designing Data Visualizations | pag. 9) zijn er drie verschillende gebieden waarop datavisualisaties ingezet kunnen worden. Deze drie gebieden ontstaan door het samenspel tussen de ontwerper, de data en de lezer. De datavisualisaties die beschreven worden zijn onderverdeeld in de volgende gebieden: Informatieve visualisaties, overredende visualisaties en visuele kunst. Het verschil tussen deze gebieden ligt in de relatie die de ontwerper, data en lezer met elkaar aangaan (fig. 3). Informatieve datavisualisaties dienen de relatie tussen de lezer en de data. Het doel is een objectieve en neutrale representatie van feiten om de lezer te informeren. Informatieve visualisaties worden vaak ingezet in wetenschappelijke tijdschriften, om zo snel en duidelijk informatie over te kunnen dragen. Overrende datavisualisaties zijn gericht op de relatie tussen de ontwerper en lezer. Deze visualisaties worden ingezet om de lezer van een bepaald gedachtegoed te overtuigen. De visualisatie presenteerd een bepaalde invalshoek die door de ontwerper is gekozen en laat alleen de data zien die deze invalshoek ondersteu-
Fig. 2: Een visualisatie van de werkloosheid in de Verenigde Staten per staat van 2004 tot 2009. Bron: “Unemployment, 2004 to Present – The Country is Bleeding” door Nathan Yau, 2009, Flowing Data, Copyright [2009] Nathan Yau.
nen. Een plek waar overredende visualisaties worden ingezet is bijvoorbeeld in de politiek, waar politici de kiezer proberen te overtuigen op hen te stemmen. Het derde en laatste gebied dat wordt beschreven is dat van visuele kunst. Hierbij is de relatie tussen de ontwerper en de data leidend. In tegenstelling tot de andere twee gebieden van datavisualisatie is deze vorm niet per definitie bedoeld om gemakkelijk geïnterpreteerd te kunnen worden. De visuele uiting en de emoties die deze teweeg brengt zijn belangrijker dan het overdragen van informatie. Volgens Yau is er nog een andere reden dat datavisualisatie belangrijk is. In Visualize This (pag. 2) beschrijft hij hoe data meer herkenbaar gemaakt kan worden door deze te visualiseren. Hij komt nogmaals terug op de werkloosheid cijfers en legt zijn standpunt
uit. Als men in statistieken terugziet dat de werkloosheid met 5 procent gestegen is, wordt dit slechts gezien als een getal. De lezer kan zich er waarschijnlijk niet of nauwelijks aan relateren en er is weinig context voor het getal. Het geval is echter dat het niet slechts om een getal gaat, de stijging van de werkloosheid staat voor honderdduizenden mensen die hun baan zijn verloren. Door data te visualiseren kan de lezer zich beter relateren aan het onderwerp. De werkloosheid is plotseling niet enkel uitgedrukt als een getal, maar wordt een representatie voor de verschillende individuen. Niet ieder individu hoeft hierbij apart gerepresenteerd te worden, maar een visualisatie zorgt er wel voor dat de data als het ware een fysieke waarde toegekend krijgt. Het is niet langer een getal, maar er wordt directe context en relatie met het onderwerp gecreëerd.
What I’ve learned over the years is that data, while objective, often has a human dimension to it. -Nathan Yau
II.Welke middelen worden gebruikt in een datavisualisatie? Datavisualisatie kan dus op veel verschillende vlakken worden ingezet. Met uitzondering van datavisualisatie als visuele kunstvorm is een visualisatie een effectievere manier om informatie over te dragen dan ‘platte’ data in bijvoorbeeld cijfers. Het menselijk brein is er beter toe in staat patronen te herkennen in een visuele uiting dan in data alleen. Hierdoor kan de betreffende data veel sneller geïnterpreteerd worden en worden complexe zaken inzichtelijker gemaakt. Om het proces van herkenning en begrip te versnellen kan gebruik gemaakt worden van veel verschillende visuele elementen. In het boek Designing Information (2012) legt Joel Katz uit hoe vormen, kleuren en beelden worden ingezet om de data een visuele vorm te geven. Kleur kan een belangrijke rol spelen in het visueel maken van data. In het geval van kleur zijn de connotaties die de lezer heeft met bepaalde kleuren bijzonder relevant. Zo wordt de kleur groen in de Westerse wereld over het algemeen gebruikt om positieve punten aan te duiden, waar rood staat voor negatieve punten of als alarmkleur (Fig. 3). Vraag iemand naar de kleur van gras en deze zal groen antwoorden, waar water als blauw wordt gezien. Door deze implicitie connotaties kunnen kleuren goed gebruikt worden om onderscheid te maken tussen verschillende onderdelen van een visualisatie. Op een kaart
Fig. 3: De kleur rood wordt in de Westerse wereld veelal gebruikt als alarmkleur. Bron: Google Images
zal bijvoorbeeld altijd de kleur blauw gebruikt worden voor een waterweg, zodat de lezer direct ziet dat het om een waterweg gaat. Ook verschillende tinten van een bepaalde kleur kunnen gebruikt worden om de visuele informatie een andere lading te geven. Als we bijvoorbeeld kijken naar een kaart die geen kleur bevat, maar enkel grijstinten, dan zien we dat wegen over het algemeen lichter gekleurd zijn dan de omringende vlakken, waardoor deze wederom gemakkelijk te herkennen zijn (Fig. 4). Vormen kunnen op verschillende manieren worden ingezet volgens Katz. Zo kunnen lijnen worden gebruikt om een grens aan te duiden, maar ook als verbinding tussen twee datapunten om te laten zien dat deze een relatie met elkaar hebben. Hij verteld dat het belangrijk is de juiste vorm bij de juiste data te kiezen. Cirkels zijn bijvoorbeeld niet geschikt om te gebruiken voor een vergelijking van verschillende elementen binnen de cirkel, daarvoor kan beter een driehoek of pyramide worden gebruikt. Verschillende vormen kunnen worden gebruikt om verschillende soorten data aan te duiden en moeten niet door elkaar gebruikt worden om dezelfde soort data aan te duiden. Labelling kan gebruikt worden om abstracte objecten binnen een visualisatie te identificeren. Hierbij gaat over het algemeen de volgende regel op: hoe dichter het label bij het te identificeren object staat, hoe makkelijker het te begrijpen is voor de lezer. Er zijn drie verschillende niveaus van labelling. Bij labeling in de eerste graad staat het label op of direct naast het te identificeren object. Labelling in de tweede graad maakt gebruik van een verbindingslijn tussen het label en het te identificeren object. Labelling in de derde graad houdt in dat er een verwijzing naar het label op of bij het te identificeren object staat,
Fig. 4: Het verschil tussen een kaart in kleur, of grijstinten. Bron: Stadskaart Utrecht
hiervoor kunnen bijvoorbeeld getallen of letters gebruikt worden die verwijzen naar de beschrijving met hetzelfde getal of dezelfde letter (Fig. 5). A
Cirkel
Cirkel Fig. 5: Verschillende vormen van labelling.
A: Cirkel
The natural world around us and our own bodies are examples of color conventions making sense, and where distortions of those conventions can be confusing and unsettling. -Joel Katz
III.Wat voor data is geschikt voor een visualisatie? In feite zijn er geen grenzen aan het soort te visualiseren data, behalve dan die van de creativiteit van de ontwerper. Alles van dagelijkse routine die een persoon doorloopt tot de verkoopcijfers van een multinational kan gevisualiseerd worden mits de juiste vorm gevonden kan worden. Over het algemeen kan data echter ingedeeld worden in drie categorieën, die Robert Spence bespreekt in zijn boek Information Visualization (2001). De categorieën die hij aanhaalt zijn respectievelijk numerieke data, geordende data en categorische data. Numerieke data betreft hierbij alle data die te maken heeft met getallen, bijvoorbeeld de ontwikkeling van de dollarprijs over een periode van 20 jaar. Geordende data betreft data die van nature geordend is bijvoorbeeld de dagen van de week. Categorische data, is data waarbij geen natuurlijke orde aanwezig is, bijvoorbeeld de namen van verschillende dieren. De meeste datavisualisaties maken gebruik van numerieke data, dit is volgens Spence dan ook de data die het gemakkelijkst te vertalen is naar een visuele vorm. Dit komt doordat het abstracte data betreft die gemakkelijk te koppelen is aan een fysieke verschijning. Een percentage of getal staat altijd ergens voor en refereert aan de realiteit, echter het abstracte zorgt ervoor dat de vorm ook abstract kan zijn. Deze hoeft niet persé direct te
Fig. 6: Numerieke, geordende en categorische data. Bron categorische data: Encyclopedia Britannica, 2011, Copyright [2011] Encyclopedia Britannica, Inc.
relateren aan hetgeen de data representeerd. Zo kan een staafdiagram goed gebruikt worden om een stijging of daling van het sterftecijfer binnen een land te representeren (Fig. 7). Als de data een veel concreter onderwerp betreft, bijvoorbeeld de dagelijkse routine van een persoon, wordt het lastiger om deze te visualiseren. Omdat het concrete data betreft moet deze ook gerepresenteerd worden door een concrete visualisatie. Zo kan een staafdiagram bijvoorbeeld niet gebruikt worden om de volgorde van bepaalde activiteiten weer te geven. Hier zal een complexere visualisatie voor ontwikkeld moeten worden, die wel in één oogopslag duidelijk is.
Fig. 7: De ontwikkeling van sterftecijfers in Nederland in een staafdiagram. Bron: “Sterfte; kerncijfers naar diverse kenmerken” door CBS Statline, 2015, Copyright [2015] Centraal Bureau voor de Statistiek.
The data we wish to visualize can be as disparate as the details of houses in the files of an estate agent or a huge collection of data amassed by a supermarket. -Robert Spence
IV.Wat maakt een datavisualisatie goed? Doordat datavisualisaties op dit moment een trend zijn worden deze te pas en te onpas gemaakt en gebruikt. Daarnaast is het tegenwoordig voor vrijwel iedereen mogelijk content te delen via het internet. Dit betekend dat er een haast constante stroom van datavisualisaties kan worden gepubliceerd, zonder dat deze eerst worden gecontroleerd op de daadwerkelijke kwaliteit. Hierdoor worden er niet alleen goede, maar ook een groot aantal minder goede datavisualisaties de wereld in gestuurd. Maar wat maakt een datavisualisatie goed? Per slot van rekening kan vrijwel alle data gevisualiseerd worden, dus is er uberhaupt wel een maatstaf voor goede datavisualisaties? Ja, die is er, volgens Joel Katz is het allereerst belangrijk dat de ontwerper de data begrijpt. Hij beschrijft in zijn boek Designing Information (2012) dat de ontwerper de data moet bevatten alvorens deze te destilleren. Immers, als de ontwerper niet begrijpt wat voor data hij in handen heeft, hoe kan deze dan de juiste keuze maken in het visualiseren hiervan? Daarnaast is het belangrijk dat er een juiste balans is tussen ontwerp en functionaliteit. Bij het ontwerpen van datavisualisaties gaat het om functie over vorm, niet andersom. Het is belangrijk in het oog te houden dat een datavisualisatie voor de lezer te begrijpen moet zijn. Als vorm de overmacht krijgt, waardoor
Fig. 8: Een goede datavisualisatie. Bron: “Million of lines of code” door David McCandless, 2014, Information is Beautiful, Copyright [2014] Information is Beautiful
de data niet gemakkelijk te bevatten is voor de lezer, mist de datavisualisatie zijn doel, namelijk het inzichtelijk maken van de gevisualiseerde data. Iets wat hierbij kan helpen is het plaatsen van de datavisualisatie in de juiste context. Als er geen context is voor de visualisatie is deze moeilijker te begrijpen voor de lezer, deze moet immers eerst weten om wat voor data het gaat alvorens hij een interpretatie kan maken van de visualisatie. Een ander belangrijk punt voor het maken van een goede datavisualisatie is het verzamelen van juiste en voldoende data, die relevant is voor het maken van een visualisatie. Als de data onvolledig is of incorrect, is een datavisualisatie overbodig. Ook als er erg weinig data voor handen is moet men zich afvragen of het maken van een visualisatie zinvol is. Maakt het de data echt beter te begrijpen of wordt er een visualisatie gemaakt om het maken van de visualisatie? In dit laatste geval is het niet zinvol een datavisualisatie te creëren en kan de data beter anders gepresenteerd worden. Nathan Yau verteld ons dat het belangrijk is het doel van de datavisualisatie van tevoren vast te stellen. Is het de bedoeling dat de lezer enkel geïnformeerd wordt, of zit er meer achter de visualisatie? Op het moment dat de ontwerper de lezer wil overtuigen van een bepaald gedachtengoed moeten zowel de data als de visualisatie hiervan op een andere manier benaderd worden dan wanneer de lezer objectief geïnformeerd moet worden. Maar, als de datavisualisatie als visuele kunstvorm wordt gebruikt is het enkel belangrijk dat de ontwerper tevreden is met de visualisatie.
Zowel Yau als Katz beschrijven hoe belangrijk vorm, kleur en hiërarchie zijn binnen een datavisualisatie. Het is belangrijk dat dezelfde soorten data dezelfde vorm aannemen binnen een visualisatie. Kleur kan ook gebruikt worden om verschillende elementen weer te geven, waarbij het belangrijk is rekening te houden met de connotaties die de lezer heeft met een bepaalde kleur. Deze connotaties kunnen verschillen per cultuur, dus het is belangrijk dat de doelgroep van tevoren goed is vastgesteld en voldoende is onderzocht. Ook is het zaak een duidelijke hiërarchie aan te houden binnen de datavisualisatie. De ontwerper moet bepalen welke data belangrijk is en welke minder, om er vervolgens voor te zorgen dat de belangrijke data ook als zodanig wordt gevisualiseerd. De minder belangrijke data moet in de visuele vorm duidelijk ondergeschikt zijn aan de belangrijkere data. Daarnaast hoort irrelevante data per definitie niet thuis in een datavisualisatie. Het is dus belangrijk dat de ontwerper een duidelijk beeld heeft van de data, de doelgroep en het doel van de visualisatie en daarnaast de juiste vorm en context aanbied. In feite is de kwaliteit van een datavisualisatie te meten door te kijken naar de doelgroep. Is het bij de lezer snel duidelijk welke data gepresenteerd wordt en komt deze tot een correct inzicht met betrekking tot deze data? Dan is een datavisualisatie over het algemeen goed uitgevoerd. Is dit niet het geval, dan moet de ontwerper bij zichzelf te raden gaan of de visualisatie wel echt goed, relevant en nodig is. Wellicht is de kennis van de doelgroep simpelweg niet toereikend, maar mogelijk is de datavisualisatie niet goed uitgevoerd.
How many angels can dance on the head of a pin? How much information can you put on a map? How many numbers can you put in a table? A lot, but that doesn’t mean they can be usefully understood. -Joel Katz
Conclusie en antwoord op de hoofdvraag Er zijn vele verschillende soorten datavisualisaties. Niet alle datavisualisaties zijn geschikt om iedere soort data te representeren en het is belangrijk dat een ontwerper hier rekening mee houdt bij het maken van een visualisatie. Het is zaak dat de ontwerper begrijpt wat voor data er precies wordt gevisualiseerd alvorens te beginnen aan een datavisualisatie. De data moet relevant zijn en er moet genoeg data voor handen zijn om daadwerkelijk te visualiseren. Numerieke data is hierbij het meest geschikt voor een visualisatie, maar ook geordende of categorische data kan gebruikt worden. Het is ook belangrijk dat de ontwerper rekening houdt met de lezer tijdens het maken van een datavisualisatie. Hij moet bedenken wat het doel is van de visualisatie. Is de visualisatie bedoeld om enkel te informeren, overredend te zijn of juist als visuele kunstvorm? In de eerste twee gevallen moet gekozen worden voor een passende benadering en moet de visualisatie duidelijk, overzichtelijk en niet te complex zijn. In deze gevallen geld functie over vorm. De leesbaarheid van de visualisatie gaat vóór de visuele aantrekkingskracht. Een duidelijke hiërarchie is wenselijk, de belangrijke data moet ook als zodanig herkenbaar zijn en dus niet ondergeschikt zijn aan minder belangrijke data. Er moet een duidelijke doelgroep zijn, immers
hoe kan de ontwerper anders zijn visualisatie zo vormgeven dat de doelgroep deze begrijpt? Culturele achtergronden kunnen hierbij een belangrijke rol spelen, daar kleuren en vormen verschillende connotaties oproepen binnen verschillende culturen. Het is hierbij ook zaak dat de visualisatie in de juiste context wordt geplaatst. De lezer heeft achtergrondinformatie nodig en moet weten waar hij naar kijkt om te kunnen begrijpen hoe de visualisatie geïnterpreteerd moet worden. Uit mijn onderzoek kan ik concluderen dat datavisualisaties complexe data inzichtelijk maken door een combinatie van factoren. De data wordt op een visuele manier gepresenteerd, wat ervoor zorgt dat patronen en trends in een enkele oogopslag te herkennen zijn. Daarnaast zorgt een visualisatie voor een referentiekader. Het gaat niet meer om platte data, maar om een visueel herkenbaar geheel. Dit zorgt ervoor dat de lezer meer affiniteit krijgt met de gepresenteerde data. Door een combinatie van vormen en kleuren te gebruiken kan de data in een visualisatie worden geplaatst. Hierbij natuurlijk rekening houdend met het feit dat gelijke data door gelijke elementen wordt gerepresenteerd. De duidelijke hiërarchie binnen een goede datavisualisatie zorgt ervoor dat de lezer snel een overzicht heeft van belangrijke en minder be-
langrijke data. Hierdoor weet de lezer waar deze meer aandacht aan moet schenken. Labelling kan gebruikt worden om abstracte elementen te identificeren binnen de visualisatie en zo de leesbaarheid te verhogen. Hoe sneller de lezer weet waar hij naar kijkt, deste sneller kan deze een interpretatie maken van de data. Een goede datavisualisatie creëerd orde en overzicht. Door het juiste kleurgebruik en de onbewuste connotaties die men heeft met kleur kan dit overzicht vergroot worden; water is blauw, gras is groen. Een goede datavisualisatie bezit al deze eigenschappen. Hij heeft daadwerkelijk meerwaarde over platte data en wordt niet alleen gemaakt ‘omdat het kan’. Hij verschaft overzicht, herkenbaarheid en ordening aan de lezer en zorgt er op die manier voor dat deze inzicht krijgt in de data. Iets wat simpelweg niet altijd mogelijk is als er enkel platte data wordt gepresenteerd.
Many experts in the field have created inspiring data visualizations that dazzle the eye. You should be inspired by them, rather than humbled. -Mico Yuk
Bibliografie Print Yau, N. (2011). Visualize This: The FlowingData Guide to Design, Visualization, adn Statistics, Indianapolis, IN: Wiley Publishing. Katz, J. (2012). Designing Information: Human factors and common sense in information design, Hoboken, NJ: John Wiley & Sons, Inc. Yuk, M., Diamond, S. (2014). Data Visualization for Dummies, Hoboken, NJ: John Wiley & Sons, Inc. Spence, R. (2001). Information Visualization, Harlow, Engeland: Addison Wesley. Cairo, A. (2013). The functional art: an introduction to information graphics and visualization, Berkeley, CA: New Riders. Iliinsky, N., Steele, J. (2011). Designing Data Visualizations, Sebastopol, CA: O’Reilly Media, Inc. Kirk, A. (2012). Data Visualization: a successful design process, Birmingham, Engeland: Packt Publishing Ltd. Rendgen, S., Ciuccarelli, P., Wurman, R.S., Rogers, S., Wiedemann, J. (2012). Information Graphics, Keulen, Duitsland: Taschen. Websites SAS, (2015) Data Visualization: What it is and why it is important. Geraadpleegd op 10-05-2015 via http://www.sas.com/en_us/insights/big-data/data-visualization.html Yau, N. (2009) Unemployment, 2004 to Present – The Country is Bleeding. Geraadpleegd op 12-05-2015 via http://flowingdata.com/2009/11/04/unemployment-2004-topresent-the-country-is-bleeding/ U.S. Bureau of Labor Statistics, (2015) Local Area Unemployment Statistics Geraadpleegd op 12-05-2015 via http://www.bls.gov/web/laus/laumstrk.htm
Centraal Bureau voor de Statistiek (CBS), (2015) Sterfte; kerncijfers naar diverse kenmerken. Geraadpleegd op 01-06-2015 via http://statline.cbs.nl/StatWeb/publication/?VW=T&DM=SLNL&PA=37979ned&LA=NL McCandless, D. (2014) Millions of lines of code. Geraadpleegd op 02-06-2015 via http://www.informationisbeautiful.net/visualizations/million-lines-of-code/
Reflectieverslag Seminar was voor mij een lastig vak. Ik hou niet bijzonder veel van onderzoek doen en dit betekende dat het voor mij lastig was om mezelf te motiveren aan de slag te gaan. Daarnaast was de tijd die voor deze opdracht stond erg kort, slechts 6 weken. De hoge werkdruk vormde een slechte combinatie met mijn gebrek aan motivatie. Een voordeel aan de opdracht was dat we zelf een onderwerp mochten kiezen. Dit trok mij wel heel erg omdat het me de kans gaf me te verdiepen in een onderwerp wat ik zelf interessant vind. In eerste instantie kon ik maar moeilijk op een onderwerp komen, maar toen ik het met een medestudent over minors had schoot het me ineens te binnen. Datavisualisaties! De minor die ik ga volgen is Big Data, een onderwerp wat mij erg aanspreekt en interesseerd. Dit betekende daarnaast dat ik me in feite alvast aan het voorbereiden was op mijn minor voor volgend jaar. Ook zijn datavisualisaties een belangrijke hedendaagse trend op het gebied van vormgeving en communicatie, wat betekend dat er veel informatie over te vinden is. De hoofdvraag die ik in eerste instantie had was niet specifiek genoeg; “Waarom zijn Datavisualisaties relevant?”. Ik heb de hoofdvraag daarna gespecificeerd tot “Hoe maken datavisualisaties complexe data inzichtelijk?”. De deelvragen kwamen hierna vrij gemakkelijk tot mij, waarna ik kon starten met het daadwerkelijke onderzoek. Het onderzoek verliep in eerste instantie wat
stroef. Hoewel ik wist dat er veel te vinden was over datavisualisatie kon ik weinig goede en betrouwbare online bronnen vinden. Daarnaast had een klasgenoot mij verteld dat er in de HU bibliotheek slechts één boek te vinden was over datavisualisatie en dat zij dat gereserveerd had. Toen ik echter toevallig in de bibliotheek was omdat een andere klasgenoot daar moest zijn kwam ik erachter dat er juist een groot aantal boeken is wat hiermee te maken heeft, zij het allemaal in het Engels. Gelukkig vormde dit voor mij geen probleem maar was het juist positief, omdat mijn Engels beter is dan mijn Nederlands. Hierdoor kon ik eindelijk goed aan de slag met mijn onderzoek en begon ik snel vooruitgang te boeken. Mijn deelvragen en hoofdvraag heb ik gedurende mijn onderzoek nog aan moeten passen, omdat ik uit het onderzoek betere vragen kon halen dan ik in eerste instantie had. Hierdoor kwam ik tot een beter resultaat dan ik anders had kunnen komen. De presentatie vond ik erg leuk om te geven, dit is iets wat mij erg goed afgaat over het algemeen. Hieruit kreeg ik ook nog goede feedback en interessante invalshoeken van andere studenten. Al met al was het achteraf toch een leuke opdracht, hoewel het erg prettig was geweest als er iets minder tijdsdruk zou zijn. Ik ben tot een bevredigende en interessante conclusie gekomen door mijn onderzoek en heb hier ook volgend jaar, denk ik, veel aan tijdens mijn minor.