Datajournalistiek in vele vormen Een genreonderzoek naar journalistieke interactieve datavisualisaties
Naam: Laura Wismans Instelling: Universiteit Leiden Opleiding: Nederlandse Taal en Cultuur (Master) Specialisatie: Journalistiek en Nieuwe Media Studentnummer: 1061003 E-mailadres:
[email protected] Datum: 11 juli 2011 Begeleider: Bas Broekhuizen
2
Inhoud Voorwoord .......................................................................................................................... 5 Samenvatting...................................................................................................................... 6 1.
Inleiding ...................................................................................................................... 7
2.
Theoretisch kader: genres, visualisaties en interactiviteit .................................... 10 2.1 2.1.1
Vorm, functie en inhoud.................................................................................. 10
2.1.2
Beperkingen................................................................................................... 11
2.2
Definities ........................................................................................................ 14
2.2.2
Grafische syntaxis.......................................................................................... 15
2.2.3
Classificatie van grafische afbeeldingen ......................................................... 16
2.2.4
Verhalen vertellen met behulp van data.......................................................... 17 Interactiviteit..................................................................................................... 19
2.3.1
Definities van interactiviteit ............................................................................. 19
2.3.2
Model van interactiviteit .................................................................................. 20
2.3.3
Interactieve visualisatiemogelijkheden in de praktijk ....................................... 22
Methode .................................................................................................................... 26 3.1
Onderzoeksontwerp ......................................................................................... 26
3.1.1
Kwantitatief onderzoek: inhoudsanalyse......................................................... 26
3.1.2
Betrouwbaarheid ............................................................................................ 28
3.1.3
Corpus ........................................................................................................... 29
3.2 3.2.1 3.3 4.
Componenten van datavisualisaties ............................................................... 14
2.2.1
2.3
3.
Genres .............................................................................................................. 10
Analyse-instrument.......................................................................................... 30 Pretest ........................................................................................................... 34 Codeurs ............................................................................................................ 36
Resultaten................................................................................................................. 39 4.1
Genres .............................................................................................................. 39
4.2
Modaliteiten ...................................................................................................... 42
4.3
Genre-indeling.................................................................................................. 45
3
5.
Conclusie.................................................................................................................. 48 5.1
Discussie .......................................................................................................... 51
5.2
Aanbevelingen.................................................................................................. 53
6.
Bibliografie ............................................................................................................... 55
Bijlagen ............................................................................................................................. 58 I.
Corpus .............................................................................................................. 59
II.
Analyse-instrument.......................................................................................... 61
III.
Codeboek.......................................................................................................... 63
IV.
Pretest............................................................................................................... 72
V.
Analyse ............................................................................................................. 76
4
Voorwoord Deze scriptie is tot stand gekomen met behulp van een strakke planning en heel wat stress. Waar oorspronkelijk drie rustige maanden stonden voor het schrijven van de hoofdmoot van deze scriptie, bleken het uiteindelijk zes niet zo rustige weken te zijn. In de avond en het weekend en in alle vrije momenten tussendoor, heb ik mij de afgelopen tijd toegelegd op het bestuderen van journalistieke interactieve datavisualisaties. Het waren slopende, maar ook buitengewoon inspirerende weken. Want de datavisualisaties die langskwamen waren veelal mooi of zelfs heel mooi. Interessant of zelfs heel interessant. Ik ben trots op het eindresultaat, maar ik heb het niet alleen aan mijzelf te danken dat ik deze meesterproef met goed gevolg heb kunnen afsluiten. Ik wil daarom allereerst Bas Broekhuizen bedanken voor zijn goede begeleiding en zijn meegaandheid in mijn strakke planning. Ook wil ik Floris van Leeuwen bedanken, die enkele saaie uren heeft gespendeerd aan het coderen. Zo, het hoge woord is eruit. Tijd voor vakantie! Laura Wismans Juli 2011
5
Samenvatting Datajournalistiek is een van de ‘buzzwords’ in de journalistiek op dit moment. In Nederland staat datajournalistiek nog in de kinderschoenen, maar in onder meer Engeland en Amerika zijn diverse media er al langer mee bezig. Datajournalistiek gaat om het stellen van journalistieke vragen, die beantwoord worden met behulp van een set gegevens, data. Visualisaties zijn zeer geschikt om data te presenteren, ze zorgen ervoor dat een grote hoeveelheid,
vaak
ingewikkelde,
informatie
begrijpelijk
aangeboden
kan
worden.
Datavisualisaties in interactieve vorm verschijnen vaak online, op websites van media. In dit onderzoek wordt de volgende vraag onderzocht: Welke verschillende genres zijn er te onderscheiden in journalistieke interactieve datavisualisaties in Engelstalige online media? Het onderzoek is exploratief van aard, interactieve datavisualisaties van de New York Times, de Guardian, CNN en de BBC, media die vooroplopen in het gebruik van datavisualisaties, zijn onderworpen aan een inhoudsanalyse. Op basis van het model voor grafische representaties van Engelhardt (2002) en mogelijkheden binnen programma’s waarmee datavisualisaties gepresenteerd kunnen worden, is een genre-indeling opgesteld. Middels een inhoudsanalyse is bekeken of deze genre-indeling ook in de praktijk bruikbaar is. Er bleken een aantal aanpassingen nodig. De uiteindelijke genre-indeling van journalistieke interactieve datavisualisaties kent zeven hoofdgenres, met daarbij een aantal subgenres: kaart, geannoteerde afbeeldingengalerij, statistische grafiek (met de subgenres spreidingsdiagram, staafgrafiek, bubbelgrafiek, blokkendiagram en taartdiagram), tijdgrafiek (met de subgenres lijngrafiek en geannoteerde tijdlijn), netwerkdiagram en tekst (met de subgenres woordwolk/-boom en geannoteerde tekst). Bij elk genre zijn tevens veelvoorkomende interactieve variabelen aan te wijzen. Alle datavisualisaties
bevatten
een
statische
afbeelding
en
bijschrift.
Mouse-over,
navigatieknoppen en aanklikbare datapunten zijn de meest aangetroffen vehikels, die als belangrijkste functie hebben data te tonen of te verbergen, te filteren en in te zoomen. Specifiek bij kaarten wordt veel gebruik gemaakt van mogelijkheden om in te zoomen en data te filteren. Bubbelgrafieken bevatten vaak animatie en mouse-over om data te tonen. Lijngrafieken zijn nooit geanimeerd, wel gebruiken zij aanklikbare datapunten of mouse-over om data te tonen. Genres in het algemeen, maar zeker genres in een opkomend, creatief veld als journalistieke interactieve datavisualisaties, zijn aan verandering onderhevig. In de toekomst zal deze genre-indeling zich verder uitkristalliseren, maar de hier gepresenteerde indeling biedt een goede basis.
6
1. Inleiding “Data journalism is huge. I don't mean 'huge' as in fashionable - although it has become that in recent months - but 'huge' as in 'incomprehensibly enormous'. It represents the convergence of a number of fields which are significant in their own right - from investigative research and statistics to design and programming. The idea of combining those skills to tell important stories is powerful - but also intimidating” (Bradshaw, 2010). Paul Bradshaw is er op het datablog van de Guardian duidelijk over: datajournalistiek is een belangrijk, maar pittig onderdeel van de journalistiek. Het is een min of meer nieuwe vorm van journalistiek. De computer en het internet hebben de afgelopen decennia de journalistiek veranderd. Onder invloed hiervan heeft ook datajournalistiek haar intrede gedaan. Eerder werd deze vorm van journalistiek misschien geschaard onder datamining (een term die afkomstig is uit de computerwetenschap/informatiekunde) of onderzoeksjournalistiek maar sinds deze vorm van journalistiek structureel wordt ingezet en het breder draagvlak krijgt, is de term datajournalistiek overal te horen (McGhee, 2010). Een wetenschappelijke definitie is er nog niet, wel staat vast dat datajournalistiek gaat om het stellen van journalistieke vragen aan verzamelingen gegevens (datasets) en de interessante uitkomsten begrijpelijk overbrengen aan het publiek (Bradshaw, 2010, McGhee, 2010). Taken uit het journalistieke ambacht dus, maar nu toegepast op bronnen die uit data bestaan. Mensen uit de praktijk noemen vier belangrijke stappen: vind de data, analyseer de data, destilleer er een journalistiek verhaal uit en presenteer het begrijpelijk aan het publiek (Bradshaw, 2010, McGhee, 2010). Vaak gaat datajournalistiek over cijfers, maar ook de cables, de rapportages van Amerikaanse ambassadeurs vanuit de hele wereld, die Wikilieaks vrijgaf hebben mooie projecten voor datajournalisten opgeleverd. De bevindingen die uit deze dataprojecten kwamen, resulteerden in artikelen, maar ook in interactieve kaarten waar in beeld werd gebracht vanuit waar de cables kwamen en welke onderwerpen zoal besproken werden. De computer en het internet hebben niet alleen geholpen met het bemachtigen van de data, maar ook met het analyseren van de data. De vaak interactieve visualisaties die verschenen, zijn daarnaast met behulp van de computer gemaakt en worden via de computer bekeken. Deze vorm van journalistiek maakt veelvuldig gebruik van digitale mogelijkheden, in onderzoek én presentatie. In dit onderzoek wordt ingegaan op de laatste stap van datajournalistieke projecten: het presenteren van informatie. In het vak van journalist is het goed presenteren van informatie aan het publiek van oudsher belangrijk. In een krant kan het werk van een traditionele journalist er uit zien als een nieuwsverhaal, achtergrondartikel of interview. Elk type artikel
7
heeft een eigen (of meerdere) functie(s), zoals informeren, overtuigen of amuseren (Asbreuk & de Moor, 2007). In de datajournalistiek is dit net zo, maar omdat dit een tamelijk nieuwe vorm van journalistiek is, is nog niet zo duidelijk welke presentatiemogelijkheden er zijn en welke functies met de presentatievormen gepaard gaan. Datajournalistiek opereert in een spanningsveld tussen het ontsluiten van informatie, het vertellen van een goed verhaal en een mooi vormgegeven productie (McGhee, 2010). Dit maakt datajournalistiek een interessant onderwerp van onderzoek. Het presenteren van datajournalistieke producties kan zowel online als offline. Het internet is voor veel mensen tegenwoordig een voorname nieuwsbron, online journalistiek is een belangrijke speler geworden, naast (of vaak ten koste) van de krant en de televisie (Deuze, 2003). Voor de presentatie van datajournalistiek is het internet uitermate geschikt. Het biedt veel mogelijkheden, bijvoorbeeld op het gebied van interactiviteit. Online journalistiek zal in de toekomst naar verwachting steeds belangrijker worden (Deuze, 2003), daarom wordt in voorliggend onderzoek de focus gelegd op online presentatievormen van datajournalistieke projecten, in het bijzonder interactieve datavisualisaties. In dit onderzoek wordt in kaart gebracht uit welke aspecten interactieve datavisualisaties kunnen bestaan en welke functies zij kunnen hebben. Daarnaast wordt er onderzocht welke combinaties van onderdelen vaak voorkomen en welke varianten veel of weinig worden gebruikt. Het resultaat van het onderzoek is een genre-indeling van journalistieke interactieve datavisualisaties. Een dergelijke genre-indeling is van belang omdat het de basis vormt voor onderzoek naar bijvoorbeeld de werking van de diverse genres. Ook kan het houvast bieden voor journalisten die datavisualisaties willen maken en lezers die datavisualisaties bekijken. De onderzoeksvraag die in dit onderzoek beantwoord wordt, luidt: Welke verschillende genres zijn er te onderscheiden in journalistieke interactieve datavisualisaties in Engelstalige online media? Ten grondslag aan het onderzoek ligt theorie over genres en interactiviteit en eerder onderzoek naar genres van datavisualisaties. Engelhardt (2002) heeft bijvoorbeeld onderzoek een classificatie gemaakt van grafische representaties. Dit is een breder onderzoeksveld dan in dit onderzoek aan bod komt, want onder grafische representaties vallen ook bijvoorbeeld verkeersborden en metrokaarten. Engelhardt bekijkt de syntactische structuur en interpretatie van grafische representaties. Zijn methode kan voor een groot deel ook voor journalistieke datavisualisaties gebruikt worden. In het onderzoek van Segel en Heer (2010) wordt een genre-indeling van verhalende (statische en interactieve) infographics,
8
voornamelijk uit journalistieke context, gepresenteerd. Ook infographic is een breder begrip dan datavisualisatie, want een afbeelding van een opengewerkte boot valt hier ook onder, terwijl aan een datavisualisatie altijd een grote set met gegevens ten grondslag ligt. Hoewel het huidige onderzoek zich enkel focust op interactieve journalistieke datavisualisaties en niet alleen kijkt naar technieken om een visueel verhaal te vertellen, komt het gebruikte onderzoeksontwerp overeen met dat van Segel en Heer. Noch Segel en Heer, noch Engelhardt gaan diep in op interactiviteit. In dit onderzoek is dit begrip wel van belang en hieraan wordt dus extra aandacht besteed. Het theoretische model over interactiviteit dat gebruikt wordt is het ‘Interaction Communication Model’ van Broekhuizen (2011). De basis voor dit model is het simpele communicatiemodel dat zender, boodschap en ontvanger onderscheidt, aangevuld met het apparaat (device). Het gekozen apparaat is van groot belang in interactie. Het model onderscheidt vier modaliteiten: representational modalities, output modalities, input modalities en manipulation modalities. In dit onderzoek staan de representatiemodaliteiten (zoals tekst, beeld, geluid, etc) en de manipulatiemodaliteiten (zoals klikken, scrollen, zoomen, etc) centraal. Deze hebben beide betrekking op de boodschap zelf, de journalistieke interactieve datavisualisatie in dit geval. De twee andere modaliteiten hebben betrekking op hoe de lezer met het apparaat omgaat en worden daarom buiten beschouwing gelaten. De onderzoeksmethode in dit onderzoek is inhoudsanalyse. Op basis van theorie over infographics en interactiviteit wordt een genre-indeling gemaakt. Het toetsen van de indeling op bruikbaarheid in de werkelijkheid gebeurt met behulp van een analyse-instrument. De analyse bestaat uit een groot aantal journalistieke datavisualisaties en op basis daarvan wordt de op theorie gebaseerde genre-indeling bijgesteld. Het onderzoek is exploratief van aard, er wordt een genre-indeling ontwikkeld. Er zal daarom geen aselecte steekproef getrokken worden. De datavisualisaties die onderzocht worden zijn afkomstig van mediabedrijven die voorop lopen op het gebied van interactieve datavisualisaties: de New York Times, de Guardian, CNN en de BBC. In de volgende hoofdstukken zal allereerst in worden gegaan op theoretische achtergronden van onder andere genretheorie, de syntaxis van datavisualisaties en interactiviteit. Daarna worden in hoofdstuk 3 de onderzoeksmethode en de corpusverzameling verder toegelicht. Vervolgens volgt in hoofdstuk 4 de analyse van het corpus en natuurlijk in hoofdstuk 5 de conclusie met de uiteindelijke genre-indeling. Dit laatste hoofdstuk bevat ook aanbevelingen voor verder onderzoek naar journalistieke interactieve datavisualisaties.
9
2. Theoretisch kader: genres, visualisaties en interactiviteit Dit onderzoek is niet het eerste waarin genres onderzocht worden. Evenmin is dit het eerste onderzoek dat een genre-indeling maakt van infographics, of dat interactiviteit bestudeert. De combinatie van infographics en interactiviteit is echter nog weinig onderzocht. Theorie over genres en infographics en eerdere genre-indelingen bieden een houvast bij het opstellen van het analysemodel, het analyseren zelf en het maken van de uiteindelijke genre-indeling. Daarom wordt hieronder ingegaan op deze theorieën en eerder onderzoek. Allereerst komen genretheorie in het algemeen en de beperkingen hiervan aan bod, daarna wordt er dieper ingegaan op onder meer de syntactische structuren van grafische representaties en eerder onderzoek naar genres van datavisualisaties. Tot slot komt interactiviteit uitgebreid aan bod. 2.1 Genres 2.1.1
Vorm, functie en inhoud
Genres worden gekarakteriseerd door overeenkomsten in vorm en inhoud, het zijn classificaties (Shepherd & Watters, 2004). Sinds de jaren ’80 van de vorige eeuw worden genres ook vaak geconceptualiseerd als doelgericht, de nadruk ligt dan op de functies. Martin (1985 p. 250) drukt dit als volgt uit: “Genres are how things get done, when language is used to accomplish them”. Genres kunnen heel breed zijn, het is mogelijk om films, boeken en toneelstukken te zien als genres binnen cultuuruitingen of binnen ‘vermaak’, maar ook veel smaller, er zijn bijvoorbeeld genres aan te wijzen binnen enkel de middeleeuwse literatuur. Veel genretheorie is gebaseerd op tekst- of filmgenres. De principes hieruit zijn echter ook toe te passen op journalistieke interactieve datavisualisaties. Vaste conventies van teksten worden door iedereen (in de taalgemeenschap) bewust of onbewust herkend. Dit komt doordat in bepaalde situaties vaak dezelfde oplossing gekozen wordt. De tekst is te zien als standaardoplossing voor een min of meer stereotiep communicatieprobleem (Schellens & Steehouder, 2009). Het indelen van genres helpt bij het begrijpen van de wereld om ons heen, het geeft inzicht in de mogelijkheden en schept orde in de chaos (Shepherd & Watters, 2004). Genres beschrijven niet alleen de organisatie van de tekst maar ook de relaties met de formats en context waarvan zij van afhankelijk zijn (Coutinho & Miranda, 2009). Bij genreanalyse gaat het om een categorie van teksten waarvan de conventionele kenmerken
10
worden beschreven, overeenkomsten in vorm, functie (in de context) en inhoud zijn de belangrijkste onderdelen van genre-indelingen. Journalisten die zich bezig houden met interactieve datavisualisaties opereren volgens McGhee (2010) in een spanningsveld met aan de ene kant de wil om zo veel mogelijk data ontsluiten en aan de andere kant de wil om een verhaal (goed) te vertellen. Een inventarisatie van de vorm, functie en inhoud, kortom de eigenschappen en conventies gebruikt in interactieve datavisualisaties, geven inzicht in dit spanningsveld, het maakt de wereld
weer
een
beetje
meer
begrijpelijk.
Een
genre-indeling
is
behalve
een
(wetenschappelijke) classificatie ook een vertrekpunt bij het maken en interpreteren van journalistieke interactieve datavisualisaties omdat het kan fungeren als een kader dat in het achterhoofd gehouden kan worden bij het maken en interpreteren van nieuwe datavisualisaties. Ook voor journalisten zelf is de genre-indeling dus waardevol. 2.1.2
Beperkingen
Het is moeilijk vast te stellen wanneer een genre-indeling geslaagd is. Alle teksten, datavisualisaties, of wat er op dat moment onderzocht wordt, moeten kunnen worden ingedeeld in een genre, en ze mogen niet in meerdere genres passen (Coutinho & Miranda, 2009). De indeling moet dus uitputtend zijn en niet overlappen, maar hier zijn volgens Coutinho en Miranda (2009) vraagtekens bij te zetten. Wanneer zijn er voldoende genres? Wanneer te veel of te weinig? Een belangrijke beperking is de diversiteit binnen genres en de veranderlijkheid van de genres zelf, er zijn altijd wel afwijkende punten in een tekst aan te wijzen. Toch blijken de gebruikers van genres, wanneer ze eenmaal ‘vastgesteld’ zijn, geen moeite hebben genres te identificeren en te gebruiken (Coutinho & Miranda, 2009). Coutinho en Miranda geven nog een ander argument tegen de bruikbaarheid van genres: de veelheid van factoren die elke tekst in zich draagt. Compleet beschrijven is volgens hen bijna onmogelijk. Deze beperkingen zijn er inderdaad, maar de onmogelijkheid van een geheel complete indeling betekent volgens Coutinho en Miranda (2009) niet automatisch dat het überhaupt onmogelijk is te beschrijven. Om goed met de beperkingen om te gaan is het van belang in de analysemethode besef te hebben dat de beperkingen bestaan. De algemene structuur moet geanalyseerd worden, maar er moet ook ruimte zijn voor de verschillen. Er moet dus niet te veel vastgelegd worden, maar ook niet te weinig. De scheidslijn tussen aan de ene kant een volledige beschrijving van algemene eigenschappen en aan de andere kant ruimte laten voor verschillen is dun (Coutinho & Miranda, 2009). Adam (1999) heeft deze dunne scheidslijn in een model geprobeerd zichtbaar te maken. In zijn model beschrijft hij dat teksten zowel algemene kenmerken bezitten als kenmerken die
11
specifiek voor die tekst zijn. Hij onderscheidt drie zones, met ruimte voor variatie: een normatieve zone (midden), gedefinieerd door een hoge frequentie constanten; een zone van relatieve normativiteit, waarin grammatica en genres zijn ondergebracht (met meer starre regels voor grammatica en meer flexibele regeling voor de genres); en de variatiezone, waar stijl en tekst te vinden zijn. Teksten zijn gevarieerde gevallen, gerelateerd aan genres. Stijl bevat variaties gerelateerd aan grammatica (Adam 1999). Volgens Adam moet bij het indelen van teksten rekening gehouden worden met de dunne
scheidslijn,
het
analyse-instrument moet een instrument
zijn
waarmee
zowel de normatieve als de variabele kant van genres goed te omvatten is. Adam refereert aan twee leidende Figuur 1: Model met drie zones, van normatief tot variabel. (Adam, 1999)
principes: een principe van stabiliteit,
gericht
op
herhaling en reproductie en een principe van verschil, gericht op vernieuwing en variatie (Adam 1999 p.38). Dus zowel stabiliteit als variatie moet opgemerkt worden in elke tekst die geanalyseerd wordt (Coutinho & Miranda, 2009). Er zijn aan de ene kant variabelen (parameters) van het genre en aan de andere kant strategieën die in de specifieke teksten gebruikt worden. Dit wordt duidelijk aan de hand van een voorbeeld zoals gebruikt in Schellens en Steehouder (2010 p. 162): “Ik loop nu al dagen te piekeren over hoe ik deze brief moet beginnen. Dit is natuurlijk geen aanbeveling voor iemand die solliciteert naar de functie van communicatietrainer: ik zou het juist meteen moeten weten. Maar ja, ik wil deze baan zo ontzettend graag.”
Het gaat hier duidelijk om het genre ‘sollicitatiebrief’, daarbinnen wordt echter een nietconventionele weg gekozen. Dit is de strategie van de specifieke tekst. Deze afwijkende strategie zorgt echter niet voor problemen bij het indelen van het fragment in een genre, de algemene parameters staan namelijk nog. Zo functioneren genres redelijk stabiel, terwijl daarbinnen geen enkele tekst volledig vergelijkbaar is. Om dit alles handzaam te maken hebben Coutinho en Miranda (2009) een analysemodel gemaakt, waarin een pad staat omschreven dat gevolgd kan worden om zo goed mogelijk
12
met de beperkingen om te gaan die nu eenmaal gepaard gaan met genre-analyse. Het startpunt voor de analyse ligt bij de individuele teksten die voorhanden zijn. Daarbinnen moeten mechanismen aangewezen worden, die horen bij de parameters van het genre. Vervolgens is het belangrijk deze weg ook terug te volgen, te verifiëren of er ook ruimte is gelaten voor de parameters die specifiek zijn voor de individuele tekst. (Coutinho & Miranda 2009). Deze manier van analyseren is ook voor interactieve datavisualisaties te gebruiken en dwingt zowel de globale overeenkomsten als individuele verschillen in ogenschouw te nemen.
Figuur 2: Analysemodel waarin in elke tekst mechanismen behorend bij het genre worden aangewezen, maar waarin de tekst ook op individuele kenmerken wordt bekeken (Coutino & Miranda, 2009)
Naast inhoudelijke beperkingen zijn er ook technologische. De technologie is de afgelopen decennia in een stroomversnelling ontwikkeld. Bij het ontwikkelen van technologie horen ook nieuwe genres en genre-indelingen. Bij het ontstaan van de televisie ontstonden er diverse genres die specifiek zijn voor het medium televisie. Ze vertonen overeenkomsten met radiogenres (die er toen al jaren waren), maar waren toch zo anders dat zij genres op zichzelf werden. Hetzelfde is nu gaande met het internet. Op internet worden steeds meer nieuwe technologieën toegepast, dit gaat in een razend tempo. Het internet was eerst enkel toegankelijk via de desktop, nu ook steeds meer via telefoon en tabletcomputer. Wat op dit moment journalistieke interactieve datavisualisaties typeert, kan over enkele jaren heel anders zijn. Wie weet is de tabletcomputer dan het meest gebruikte apparaat om journalistieke datavisualisaties op te bekijken, terwijl dat nu nog de computer is. Sheperd en
13
Walters stippen deze beperking van de genre-analyse aan in de onderzoekspaper ‘hitting a moving target’ (2004). Het medium is aan verandering onderhevig, en dat zijn de genres dus ook. Het is daarom belangrijk een genre-indeling goed in de tijd te plaatsen (Sheperd & Walters, 2004).
2.2 Componenten van datavisualisaties 2.2.1
Definities
Engelhardt (2002) beschrijft in zijn proefschrift een model voor de analyse van grafische representaties. Ook presenteert hij een classificatie. Onder een grafische representatie verstaat hij het volgende: A visible artifact on a more or less flat surface, that was created in order to expess information (Engelhardt, 2002 p. 2).
Een grafische representatie zoals Engelhardt dat bedoelt, wordt ook vaak infographic genoemd. In dit onderzoek worden datavisualisaties onderzocht. Dit zijn drie termen die zeer op elkaar lijken, maar de term datavisualisatie is veel enger dan infographic en dat is weer enger dan grafische representatie. Datavisualisaties representeren data, vaak gedefinieerd als een verzameling gegevens, terwijl infographics bijvoorbeeld ook afbeeldingen kunnen zijn die iets uitleggen. Grafische representaties hoeven de ‘info’ uit infographic niet eens te bevatten, een karikatuur van een persoon is bijvoorbeeld ook een grafische representatie. Theorievorming over grafische representaties in het algemeen vormt een goede basis voor specifiek onderzoek naar journalistieke datavisualisaties. Wat betreft het doel van grafische representaties onderscheidt Richards (in: Engelhardt, 2002) twee grove categorieën, de ene met de intentie om te amuseren, behagen, overhalen, verfrissen, uitdagen of anderzijds stimuleren en de andere met de intentie te beschrijven, verklaren, informeren of instrueren. Deze twee doelen kunnen enigszins overlappen maar de grafische representaties zoals bedoeld in de definitie van Engelhardt vallen voornamelijk in de tweede categorie (Engelhardt, 2002). Ook in dit onderzoek staat de tweede categorie centraal maar
de
focus
is
nog
smaller,
namelijk
op journalistieke
datavisualisaties. De classificatie van Engelhardt is dus breder.
14
interactieve
2.2.2
Grafische syntaxis
Een datavisualisatie kan worden beschouwd als uitdrukking in ‘visuele taal’. Elke visuele taal (bijvoorbeeld de taal van metroborden of de geografische kleurcodetaal) heeft bepaalde grafische regels en mogelijkheden tot variatie en eigen categorieën van grafische constituenten (onderdelen van de visualisatie). Dit noemt Engelhardt (2002) de grafische syntaxis en dit is te zien als de ‘grammatica’ van de datavisualisatie. Engelhardt definieert dit als volgt: Part of what a graphic representation means depends upon the graphic objects that it contains, and part depends on the graphic relations that those graphic objects are involved in (Engelhardt, 2002 p. 12).
Engelhardt splitst samengestelde grafische objecten in grafische objecten, grafische ruimte en grafische relaties tussen de objecten en de ruimte. In een model ziet dat er als volgt uit:
Figuur 3: Samengestelde grafische objecten bestaan uit een grafische ruimte, een set van grafische objecten en relaties hiertussen. Dit model is recursief. (Engelhardt, 2002 p. 15)
15
Een samengesteld grafisch object is een grafisch object dat bestaat uit een grafische ruimte, een set van grafische objecten in die ruimte en een set van grafische relaties tussen de grafische objecten. Het model is recursief, elk grafisch object kan weer een samengesteld grafisch object zijn en ook weer bestaan uit meerdere kleine objecten met betekenisvolle ruimte en relaties hiertussen (Engelhardt, 2002). 2.2.3
Classificatie van grafische afbeeldingen
Engelhardt (2002) presenteert in zijn proefschrift een classificatie van grafische representaties die hij gemaakt heeft op basis van onder meer de bovenstaande syntactische analyse. Hij beschrijft tien primaire typen grafische representaties en zes hybride (samengestelde) typen: Primaire typen: -
Kaart: toont een fysieke opstelling op een geografische ondergrond
-
Afbeelding: een meer of minder ‘letterlijke’ (fysieke) weergave van iets of iemand
-
Statistische grafiek: toont en vergelijkt kwantiteiten
-
Tijdgrafiek: toont ontwikkeling door de tijd heen
-
Schakeldiagram: toont schakels tussen onderdelen (bijv stroomdiagram, stamboom, etc)
-
Gegroepeerd diagram: categoriseert onderdelen
-
Tabel: sorteert horizontaal en/of verticaal
-
Symbool
-
Tekst
Hybride typen: -
Statistische kaart: combinatie van statistische grafiek en kaart
-
Netwerkdiagram: combinatie van schakeldiagram en kaart
-
Statistisch tijdsdiagram: combinatie van statistische grafiek en tijdgrafiek
-
Chronologisch schakeldiagram: combinatie van schakeldiagram en tijdgrafiek
-
Statistisch schakeldiagram: combinatie van statistisch diagram en schakeldiagram
-
Statistisch netwerkdiagram: combinatie van het statistisch schakeldiagram en het netwerkdiagram
(Engelhardt, 2002)
Engelhardt (2002) heeft enkel naar statische genres gekeken, in zijn proefschrift komt de computer niet aan bod. Veel media-uitingen die voor het grootschalig gebruik van de computer al bestonden, hebben een digitale variant gekregen op de computer en het internet. Diverse sites vervullen digitaal dezelfde functies als een krant of televisieprogramma doet (Deuze, 2003). Het valt te verwachten dat ook datavisualisaties een digitale variant hebben
16
gekregen. De indeling van Engelhardt biedt daarom een goed uitgangspunt voor de analyse van journalistieke interactieve datavisualisaties. 2.2.4
Verhalen vertellen met behulp van data
Engelhardt (2002) maakt in zijn indeling geen onderscheid in de plekken waar de visualisaties gebruikt worden. Verkeersborden, metrokaarten, grafieken in de krant en voorlichtingsposters maken allen onderdeel uit van zijn indeling. Het is echter interessant een journalistiek corpus te onderzoeken, daarvoor is in dit onderzoek gekozen. Journalistieke producties vertellen altijd een verhaal (Segel en Heer, 2010), dat ook bij visuele producties vaak het geval, er wordt dan een visueel verhaal verteld. Overigens hoeft er niet altijd een verhaal verteld te worden, een datavisualisatie kan bijvoorbeeld ook enkel ingezet worden om informatie te ontsluiten. Wojtkowski en Wojtkowski (2002), verwoorden de relatie tussen visueel (interactieve) verhalen vertellen en datavisualisaties als volgt: Technology in the form of computers has given us a dynamic new visual medium beyond paper that is very valuable to those who are interested in visual storytelling. And visual storytelling, in turn, might be of critical importance in providing intuitive and fast exploration of very large data resources in real-time (Wojtkowski & Wojtkowski, 2002).
Ook Gershon en Page (2001), benadrukken dat het verhaal vertellen belangrijk is in de opzet van een infographic. ‘A story is worth a thousand pictures’, stellen zij. Hiermee doelen zij op volgens hen het belangrijkste onderdeel van verhalen: implicietheid. Veel van de informatie die overgebracht wordt in een verhaal is impliciet. Toch komt de boodschap over omdat de lezer de impliciet gelaten onderdelen intuïtief in kan vullen. Het verhaal wordt er niet minder begrijpelijk door, de boodschap komt juist efficiënt over (Gershon & Page, 2001). Het volgende ‘verhaal’ maakt dit duidelijk: Floris voelde zich te ziek om naar de vergadering te gaan. Na een aantal uren met onbeantwoorde telefoontjes, e-mails en pager-berichten, kreeg hij uiteindelijk bericht dat de vergadering is verzet naar volgende week. (Gershon & Page, 2001)
Het verhaal hierboven is kort en goed te onthouden. Toch is het gevuld met flink wat (impliciete) informatie: Floris werkt met andere mensen, hij is toegewijd aan zijn werk omdat hij begaan is met de vergadering, vergaderen zonder Floris is onhandig zo niet onmogelijk, hij maakt gebruik van verschillende moderne communicatiemiddelen, hij is niet in de
17
bioscoop of in het park maar ziek thuis, hij is dan weer niet zo ziek dat hij geen berichten kan ontvangen en versturen, zijn collega (of assistent) is druk of traag met het beantwoorden van zijn berichten, et cetera. De impliciete zaken in het verhaal worden ingevuld door de fantasie van de lezer, in goede verhalen worden deze onzekerheden er opzettelijk in gedaan (Wojtkowski & Wojtkowski, 2002). Ook journalistieke interactieve datavisualisaties vertellen journalistieke verhalen en laten dus onderdelen impliciet. Bij visualisaties die een journalistiek verhaal vertellen, is leesrichting van belang (Segel en Heer, 2010). Die is ook aanwezig in journalistieke datavisualisaties. Segel en Heer (2010) hebben zich in hun onderzoek naar infographics gefocust op visuele mogelijkheden om nadruk te leggen, en daarmee een leesrichting af te dwingen. Die leesrichting is van belang bij het invullen van impliciete zaken, die nodig zijn om het journalistieke verhaal te begrijpen. Visuele middelen die voor nadruk zorgen zijn bijvoorbeeld kleur, grootte en richting (Segel en Heer, 2010). Om de leesrichting te bevorderen is niet alleen visuele nadruk van belang, maar zijn ook overgangen van het ene naar het andere verhaalelement noodzakelijk. McCloud (1993) onderscheidt overgangen voor strips, waarbij Segel en Heer opmerken dat ze ook toe te passen zijn op infographics. McCloud onderscheidt de volgende overgangen: -
Moment naar moment (een onderwerp, over een korte periode)
-
Actie naar actie (een onderwerp, over een langere periode)
-
Onderwerp-onderwerp (verschillende onderwerpen, zelfde scene)
-
Aspect naar aspect (aspecten van een plaats, idee of gevoel)
-
Scene naar scene (wissel van scene)
-
Niet verbonden overgang
Annotaties (bijschriften) en andere aspecten buiten het afgebeelde (bijvoorbeeld inzetjes) worden daarnaast gebruikt om het verhaal te verrijken (Segel & Heer, 2010). Om interactieve datavisualisaties te onderzoeken waarin een journalistiek verhaal wordt verteld, is het van belang theorie over leesrichting, nadruk en vooral overgangen mee te nemen bij het maken van het analyse-instrument. Segel en Heer (2010) stellen in hun onderzoek naar infographics ook een genre-indeling voor. Het corpus van huidig onderzoek komt enigszins overeen met het corpus van Segel en Heer, zij het dat Segel en Heer niet enkel journalistieke infographics hebben bekeken en ook statische datavisualisaties hebben betrokken in hun onderzoek. Toch is het nuttig de genreindeling van Segel en Heer te betrekken bij het maken van het analyse-instrument. De zeven
18
genres voor het vertellen van visuele verhalen die Segel en Heer onderscheiden zijn (zie ook figuur 4): -
Tijdschriftstijl
-
Verrijkte grafiek
-
Poster bestaande uit delen
-
Stroomdiagram
-
Strip
-
Diashow
-
Film/video/animatie
2.3 Interactiviteit
Figuur 4: Zeven manieren om visueel een verhaal te vertellen (Segel en Heer, 2010)
In dit onderzoek is er voor gekozen datavisualisaties die online worden gepresenteerd centraal te laten staan. Interactiviteit is hierin een belangrijk onderdeel, het concept ‘interactiviteit’ is fundamenteel wanneer het gaat over de interactie tussen mens en computer (Sundar, Xu en Bellur, 2010). 2.3.1
Definities van interactiviteit
Er zijn in de loop van de tijd vele definities van interactiviteit geformuleerd, de formuleringen komen voort uit twee benaderingen. Sommigen definiëren interactiviteit als de mate waarin een medium de gebruiker invloed laat uitoefenen op de inhoud en vorm van een boodschap (Heeter, 1989). De aanhangers van een dergelijke definitie zien interactiviteit als een kenmerk van het medium: een medium kan meer of minder interactief zijn afhankelijk van de mogelijkheden die het medium biedt om feedback te geven en vorm en inhoud aan te passen (Heeter, 1989). Dit wordt medium interactivity of mens-mediuminteractiviteit genoemd (Chung, 2008). Het begrip interactiviteit is echter ook vanuit meer sociologisch oogpunt te benaderen, wanneer het wordt gedefinieerd als de relatie tussen twee of meer mensen die beide hun gedrag aan elkaar aanpassen (Chung, 2008). Wanneer het begrip op deze manier uitgelegd wordt, blijft het medium buiten beschouwing, het gaat dan over communicatie van mens tot mens (Rafaeli, 1988). Interactiviteit hoort wanneer het vanuit dit oogpunt benaderd wordt bij communicatie als het geheel, niet enkel bij de communicatie tussen mens en medium (Rafaeli, 1988). Het medium is toevallig een middel waarmee de communicatie van mens tot mens bewerkstelligd wordt. De term die voor deze kijk op interactiviteit gebruikt wordt is human interactivity of gebruiker-gebruikerinteractiviteit (Chung 2008).
19
Deze twee visies op interactiviteit kunnen echter ook verenigd worden. McMillan (2002) deed onderzoek naar de bruikbaarheid van een vierdelige typologie gebaseerd op beide dimensies. Het model dat zij voorstelt bekijkt cyber-interactiviteit vanuit zowel het perspectief van hen die interactiviteit zien als een algemeen onderdeel van de communicatie en van hen die het zien als een onderdeel van bijvoorbeeld een website of apparaat. Het model kijkt dus op beide manieren hoe interactiviteit ontvangen wordt. Wanneer onderzocht wordt hoe interactiviteit door een gebruiker ontvangen wordt, is dit model dat ruimte geeft aan beide dimensies het beste te gebruiken (McMillan, 2002). In het geval van interactieve datavisualisaties is er altijd een medium, veelal de computer, bij de communicatie betrokken. In dit onderzoek wordt daarom een definitie van interactiviteit gehanteerd die meer op het medium gericht is: Een set van mogelijkheden van het systeem die de gebruikers in staat stelt om de bron, het medium en de boodschap te veranderen met behulp van het systeem (Sundar, Xu & Bellur, 2010).
2.3.2
Model van interactiviteit
Een communicatiemodel dat ten grondslag ligt aan tal van andere communicatiemodellen is het model dat zender, boodschap en ontvanger onderscheidt. Wanneer de boodschap niet direct, maar met behulp van een medium over wordt gebracht, komt daar het concept medium nog bij. Berlo (1960) heeft een model ontworpen dat deze vier componenten onderscheidt: bron, boodschap, kanaal en ontvanger. Op elk van de vier onderdelen zijn bepaalde eigenschappen van invloed: -
Bron: communicatievaardigheden, houding, kennis en culturele- en sociale achtergrond
-
Boodschap: inhoud, elementen, een bepaalde behandeling daarvan, structuur en code
-
Kanaal: horen, zien, voelen, ruiken en proeven
-
Ontvanger: communicatievaardigheden, houding, kennis en culturele- en sociale achtergrond
Broekhuizen (2011) heeft een model ontworpen dat gebaseerd is op het model van Berlo. Interactiviteit komt hierin op verschillende manieren aan bod. Net als in de definitie van Sundar, Xu en Bellur worden in het model drie soorten interactiviteit onderscheiden:
20
-
Gebruiker met systeem: wanneer het apparaat niet alleen de boodschap weergeeft, maar ook feedback mogelijk maakt
-
Gebruiker met boodschap: wanneer manipulatie van het systeem ontvangers de mogelijkheid geeft de inhoud of de vorm van de boodschap te wijzigen of te antwoorden
-
Gebruiker met gebruiker: wanneer de aangepaste boodschap of het antwoord de originele zender bereikt.
(Broekhuizen 2011)
Figuur 5 Het interactivity model van Broekhuizen (2011)
In het model worden vier sets van parameters in ogenschouw genomen bij het bestuderen van interactiviteit. Dit zijn de vier typen modaliteiten (uitingsvormen) die Broekhuizen in zijn model noemt: -
Representational modalities (representatiemodaliteiten) definiëren hoe de boodschap is gecodeerd. Het beschrijft de manier waarop de boodschap de data, de kennis of het idee van de zender representeert. Hierbij valt te denken aan tekst, geluiden, symbolen, afbeeldingen, grafieken, diagrammen en kaarten.
-
Output modalities zijn de verschillende manieren waarop het apparaat de representational modalities aan de ontvanger presenteert. Ze zijn verbonden aan de menselijke zintuigen. Bij interactieve datavisualisaties zijn de meest gebruikte output modalities visuele objecten (de uiteindelijke presentatie van de representational modalities) maar ook geluid of voelbare elementen kunnen gebruikt worden.
-
Input modalities zijn de manieren waarop het apparaat feedback mogelijk maakt. Deze zijn verbonden met de menselijke uitdrukkingsvormen als aanraken, duwen, gebaren, bewegen, spreken, et cetera. Voorbeelden bij interactieve datavisualisaties zijn typen, klikken, scrollen en ‘swipen’.
21
-
Manipulation modalities (manipulatiemodaliteiten) zijn de verschillende manieren waarop de boodschaplaag de ontvanger de inhoud en vorm van de boodschap laat veranderen. Voorbeelden voor interactieve datavisualisaties zijn zoeken, filteren, tonen, verbergen, slepen, zoomen, en data toevoegen.
(Broekhuizen, 2011) De onderdelen aan de rechterkant van het model hebben vooral te maken met het apparaat, de onderdelen aan de linkerkant meer met de boodschap zelf. De effecten en het gebruik van de onderdelen aan de rechterkant hangen in sterke mate samen met de ervaring die gebruikers hebben met het apparaat. Een datavisualisatie kan verkeerd gebruikt of begrepen worden als de gebruiker minder goed om kan gaan met het apparaat (Sundar 2004). Dit is een belangrijk punt bij het analyseren van de effectiviteit van datavisualisaties. Maar voor een genre-indeling is de rechterkant van het model niet zozeer van belang. Het gaat namelijk niet om hoe de ontvanger met de datavisualisatie om kan gaan, maar om welke eigenschappen de datavisualisatie bezit. De rechterkant van het model van Broekhuizen, inclusief de input en output modalities kunnen dus buiten beschouwing gelaten worden. Bij het analyseren van de interactieve datavisualisaties zijn de parameters van de twee modaliteiten aan de linkerkant, de representational en manipulation modalities wel van belang. 2.3.3
Interactieve visualisatiemogelijkheden in de praktijk
Het maken van interactieve datavisualisaties is zeer tijdrovend en kan zeer ingewikkeld zijn omdat er onder meer kennis van programmeertaal om software te programmeren nodig is. Op internet zijn diverse tools te vinden om zonder deze kennis een interactieve datavisualisatie te maken. Voorbeelden hiervan zijn Many Eyes, Tableau en Impure. Veel van de visualisatiemogelijkheden die de verschillende programma’s aanbieden komen overeen met elkaar. Many Eyes bijvoorbeeld, ontwikkeld door de researchafdeling van IBM, heeft
diverse
mogelijkheden
om
data
te
visualiseren.
Hieronder
vallen
enkele
standaardmodellen die op allerlei plekken, zoals in het bedrijfsleven, worden gebruikt, enkele gerenommeerde academische modellen en wat meer experimentele modellen (Viégas, Wattenberg, van Ham, Kriss & McKeon, 2007). Many Eyes heeft de opties tot visualiseren onderverdeeld naar de doelen die je kunt hebben bij het visualiseren:
-
Relaties zien tussen datapunten o
Netwerkdiagram
o
Spreidingsdiagram
o
Multidimensionaal (matrices)diagram
-
22
Waarden vergelijken
-
o
Staafdiagram
o
Geblokt staafdiagram
o
Bubbelgrafiek
o
vergelijkingen -
Veranderingen in de tijd bijhouden
Tekst analyseren o
Woordenboom
o
Lijngrafiek
o
Woordwolk
o
Gestapelde lijgrafiek
o
Woordwolkgenerator
o
Gestapelde lijngrafiek voor
o
Uitdrukkingenboom
categorieën -
Blokkendiagram voor
-
De delen van een geheel zien o
Taartdiagram
o
Blokkendiagram
De wereld zien o
Wereldkaart
o
Kaart van de Verenigde Staten
Heer, Bostock & Ogievetsky (2010) van de Stanford University Visualization Group hebben een inventarisatie gemaakt van visualisatiemogelijkheden, veelal interactief. Zij hebben zich niet beperkt tot online tools zoals Many Eyes. De inventarisatie van mogelijkheden uit de praktijk van Heer et al. (2010) beperkt zich niet tot journalistieke datavisualisaties, het bevat ook veel wiskundige en andere wetenschappelijke visualisaties, die voor de journalistiek niet van toepassing zijn. Hoewel Heer et al. (2010) de diverse mogelijkheden vaak een andere naam hebben gegeven dan Many Eyes, zijn op overkoepelend niveau dezelfde mogelijkheden zichtbaar: -
-
Tijdgerelateerde data
-
Kaarten
o
Indexgrafiek
o
Stroomkaart
o
Gestapelde lijngrafiek
o
Kleurenkaart
o
Serie kleine diagrammen
o
Kaart met symbolen
o
Horizongrafiek
o
Kartogram
Statistische verdelingen
-
Hiërarchieën
o
Vertakkingsplot
o
Schakeldiagram
o
Q-Q plot
o
Beeldvullend schakeldiagram
o
Spreidingsdiagram
o
Parallelle coördinaten
-
Netwerken o
Richtinggestuurd diagram
o
Eendimendionaal
(Heer, Bostock & Ogievetsky, 2010)
schakeldiagram o
Matricesvorm
De mogelijkheden die hierboven genoemd zijn voor het visualiseren van data, afkomstig uit de praktijk, komen enigszins overeen met de classificatie zoals Engelhardt (2002) die presenteert, maar dan interactief. Ook Engelhardt onderscheidt de categorieën kaart,
23
netwerkdiagram, tijdgrafiek en statistische grafiek. Dat duidt er op dat deze classificatie online equivalenten hebben gevonden en dat de genres van Engelhardt in combinatie met deze interactieve mogelijkheden een goede basis vormt voor een analyse van genres van journalistieke interactieve datavisualisaties. Een afbeelding of een symbool hebben niets met data te maken en vinden hun weerslag dus niet in praktijkmogelijkheden om data te visualiseren. Opvallend is wel, dat in de praktijkmogelijkheden de optie ‘tabel’ die Engelhardt onderscheidt niet voorkomt. Dit kan te maken hebben met het feit dat een tabel meestal nietgevisualiseerde data bevat. Volgens Tufte (2001) zijn graphics vooral geschikt om data te onthullen, tabellen minder. Als een datavisualisaties gebruikt wordt, dan wordt er iets met de gegevens uit een tabel gedaan, wat resulteert in een van de andere opties. Hieronder worden enkele screenshots van interactieve datavisualisaties getoond. Dit geeft een beeld van de uiteenlopende mogelijkheden die er zijn voor het maken van interactieve datavisualisaties:
Figuur 6: Zes voorbeelden van interactieve datavisualisaties. Afkomstig van (van links boven naar rechts onder): de Guardian, Many Eyes, Many Eyes, De Guardian, de New York Times en de BBC.
In dit hoofdstuk zijn in drie paragrafen de belangrijke aspecten die van belang zijn voor bij het maken van een genre-indeling van journalistieke interactieve datavisualisaties: theorie
24
over genres en de analyse van genres, syntactische analyse van infographics, verhalende infographics, en het concept interactiviteit en verschillende voorbeelden van visualisaties die in de praktijk gebruikt worden. Er zijn diverse voorbeelden van genre-indelingen naar voren gekomen. Deze aspecten vinden hun weerslag in de analysemethode die voor dit onderzoek gebruikt wordt. In het volgende hoofdstuk komt de methode aan bod.
25
3. Methode In dit hoofdstuk wordt de methode die in dit onderzoek wordt gebruikt uiteengezet. De theoretische concepten die in het vorige hoofdstuk beschreven zijn, vormen een belangrijke basis voor de methode. In de volgende paragrafen komt allereerst het algehele onderzoeksontwerp aan bod, daarna worden de betrouwbaarheid van het onderzoek en het corpus beschreven en wordt er dieper in gegaan op het analyse-instrument. 3.1 Onderzoeksontwerp Om journalistieke interactieve datavisualisaties in te kunnen delen in genres is het nodig een groot aantal datavisualisaties onder de loep te nemen. De methode die bij dergelijk onderzoek veelal gebruikt wordt is inhoudsanalyse, een kwantitatieve onderzoeksmethode. Deze methode staat ook in dit onderzoek centraal. 3.1.1
Kwantitatief onderzoek: inhoudsanalyse
In dit onderzoek wordt het onderzoeksmodel van Coutinho en Miranda (2009) gebruikt. Op basis van verwachtingen die afgeleid zijn uit de theorie wordt een genre-indeling van journalistieke interactieve datavisualisaties gemaakt. Deze genre-indeling wordt vervolgens met behulp van een inhoudsanalyse getoetst aan de werkelijkheid door het verzamelde corpus van interactieve datavisualisaties te bekijken. Het kan zo zijn dat er ‘overbodige’ genres in de genre-indeling staan, die niet voorkomen in de praktijk. Ook kan het zo zijn dat in de praktijk meer genres voorkomen dan in de genre-indeling genoemd zijn. Op basis van de inhoudsanalyse wordt de naar aanleiding van de theorie tot stand gekomen genreindeling aangepast. De genre-indeling die op deze manier uit naar voren komt, is bruikbaar in de dagelijkse praktijk van journalistieke interactieve datavisualisaties. Coutinho en Miranda (2009) leggen veel nadruk op de verscheidenheid die binnen de genres mogelijk is. Elke individuele datavisualisatie heeft unieke eigenschappen die niet in een genre te vangen zijn. De parameters van het genre en die van de individuele datavisualisatie moeten ook in dit onderzoek beide onderscheiden worden. Inhoudsanalyses focussen zich op de boodschap, niet op de zender of de ontvanger. Het onderzochte materiaal is niet gekunsteld tot stand gekomen, het is immers in een ‘normale’ (media)omgeving ontwikkeld, buiten de onderzoeker om. Ook is het een zeer systematische vorm van onderzoek, waarbij meerdere metingen hetzelfde resultaat geven. Deze zaken
26
maken dat de inhoudsanalyse een objectieve manier van onderzoeken mogelijk maakt (Wester 2006). Ook dit onderzoek focust zich op de boodschap, de journalistieke interactieve datavisualisaties. Ongeveer zestig interactieve datavisualisaties die in het afgelopen jaar op websites van diverse mediabedrijven verschenen zijn worden onder de loep genomen. Met behulp van een analyse-instrument wordt elke datavisualisatie bekeken. Op die manier kunnen de eigenschappen van de visualisaties systematisch in kaart worden gebracht. Journalistieke interactieve datavisualisaties worden nog niet veelvuldig in alle media gebruikt. Een aselecte steekproef is daarom niet mogelijk, maar het bekijken van voorlopers op dit gebied wel. In journalistieke omgevingen wordt ook regelmatig gebruik gemaakt van infographics die geen data bevatten. Vaak legt dit type infographics uit hoe iets werkt of hoe iets in elkaar zit. Een voorbeeld hiervan is een animatie over wat er gebeurt bij een ‘meltdown’ in een kerncentrale. Dit type infographic bevat geen (grote hoeveelheden) data. Het zijn dus wel visualisaties maar geen datavisualisaties, en worden derhalve buiten de inhoudsanalyse in dit onderzoek gehouden. Infographics waarbij een verzameling van gebeurtenissen gepresenteerd
wordt,
worden
wel
opgenomen
in
het
corpus.
De
verschillende
gebeurtenissen (vaak in de vorm van tekst en/of foto’s) gelden dan als datapunten. Omdat het hier om een verzameling gebeurtenissen gaat, komen er veel gegevens kijken bij dergelijke infographics. Hoewel er over te twisten valt, is ervoor gekozen dit wel als data te zien en visualisaties die gebaseerd zijn op dergelijke data dus ook op te nemen in het corpus van datavisualisaties. Het analyse-instrument is tot stand gekomen op basis van theorie, zoals in het vorige hoofdstuk beschreven. Hierin zijn meerdere genre-indelingen naar voren gekomen. De genre-indeling die Engelhardt (2002) voorstelt, met tien primaire typen visualisaties, vormt de basis. Deze wordt aangevuld met categorieën van mogelijkheden die in de praktijk van datavisualisaties gebruikt worden bij bijvoorbeeld Many Eyes (Heer, Bostock & Ogievetsky, 2010 en Viégas, Wattenberg, van Ham, Kriss & McKeon, 2007). Voor een groot deel komen deze categorieën overeen met de genre-indeling die Engelhardt voorstelt. Het lijkt er op dat de statische visualisatiemogelijkheden die Engelhardt omschrijft een interactieve, digitale variant hebben gekregen. Of dat inderdaad zo is zal uit de inhoudsanalyse blijken. Op basis van de indelingen in categorieën en genres, is een analyse-instrument gemaakt waarmee wordt getest welke genres bruikbaar zijn in de praktijk van journalistieke interactieve datavisualisaties. Er zal in het analyse-instrument extra aandacht zijn voor variabelen die een rol spelen in interactiviteit. Dit is immers het belangrijkste verschil met eerdere genre-indelingen van
27
(data)visualisaties, de datavisualisaties in dit onderzoek zijn interactief. Hoewel deze mogelijkheden al worden meegenomen in de genre-indeling die op basis van theorie tot stand is gekomen, is het van belang interactiviteit ook los hiervan in kaart te brengen. Dit geeft een beter inzicht in de toepassingen van interactiviteit in de diverse genres. Om dit goed te kunnen scoren worden in het analyse-instrument de twee relevante modaliteiten uit het model van Broekhuizen (2011) en mogelijkheden in overgangen, zoals in McCloud (1993) naar voren komen meegenomen. Indien mogelijk wordt er op basis van de analyse naar samenhang tussen de genres en de interactieve variabelen en overgangen gekeken. Hiervoor worden correlaties berekend met behulp van de Pearson correlatiecoëfficiënt. Er wordt dan gemeten of het voorkomen van een bepaalde vorm van interactiviteit samenhangt met een bepaald genre. Hoe hoger de correlatiecoëfficiënt is, hoe sterker het verband tussen de twee is. 3.1.2
Betrouwbaarheid
De betrouwbaarheid van de onderzoeksmethode is bij inhoudsanalyse is van groot belang. Het belangrijkste is dat het analyse-instrument goed fungeert. Om dit te waarborgen en controleren zijn er twee zaken nodig: het doen van een pretest en het coderen van de interactieve datavisualisaties door meerdere codeurs. Door een pretest uit te voeren kan voorkomen worden dat het analyse-instrument niet bruikbaar blijkt te zijn. In de pretest van dit onderzoek wordt een klein aantal interactieve datavisualisaties bekeken en gescoord in het analyse-instrument. Op basis hiervan kan het analyse-instrument aangepast worden, zodat het beter bruikbaar is in de daadwerkelijke inhoudsanalyse. De pretest en de uitkomsten hiervan worden later in dit hoofdstuk beschreven. Een ander belangrijk punt wat betreft de betrouwbaarheid is een systematische manier van onderzoeken. Het moet mogelijk zijn om de ‘meting’, in dit geval het scoren van eigenschappen van datavisualisaties met behulp van een analyse-instrument, meerdere malen uit te voeren met dezelfde uitkomst. Het analyse-instrument mag dus niet ambigu zijn. Om aan te tonen dat dit inderdaad niet het geval is, moeten de interactieve datavisualisaties door (minstens) twee codeurs bekeken worden. De uitkomsten van de codeurs moeten voldoende overeenkomen om van een valide uitkomst te kunnen spreken. Om te zorgen dat dit inderdaad zo is, moet er bij het analyse-instrument goede uitleg gegeven worden in een codeboek. Alle codeurs moeten met behulp van het codeboek eenduidig kunnen coderen. Met behulp van Krippendorff’s alpha wordt gekeken of het werk van beide codeurs consistent is en of er dus conclusies op gebaseerd kunnen worden. Bij een alpha van 0,80 en hoger zijn de analyses zeer betrouwbaar te noemen. Wanneer de alpha tussen de 0,800
28
en de 0,667 ligt, is het niet verstandig om harde uitspraken op basis van de analyses te doen, maar deze scores geven wel een tendens weer (Den Boer et al., 2005). Het codeboek is in de bijlage te vinden, de uitkomsten van de twee codeurs worden verderop in dit hoofdstuk behandeld. 3.1.3
Corpus
Het corpus voor dit onderzoek bestaat uit een steekproef van journalistieke interactieve datavisualisaties. De steekproef uit alle mogelijke journalistieke interactieve datavisualisaties die er zijn, is niet aselect. Angelsaksische mediabedrijven lopen voorop in het gebruikmaken van de mogelijkheden van het internet, ze lopen zeker voor op Nederland. In Nederland staat de ontwikkeling van journalistieke interactieve datavisualisaties nog in de kinderschoenen, daarom spitst het onderzoek zich toe op het gebruik ervan in Angelsaksische online media. Ook lang niet alle Angelsaksische online media doen veel met datavisualisaties. Na het bekijken van de top 10 grootste mediabedrijven van Engeland en Amerika wordt duidelijk dat de sites van tabloidkranten, media die zich veelal richten op entertainment en sport, weinig doen met journalistieke datavisualisaties. Omdat het een onderdeel is dat nog stevig in ontwikkeling is, is er in dit onderzoek voor gekozen datavisualisaties te gebruiken van mediabedrijven die vooroplopen. Door het onderzoek toe te spitsen op media die veel doen met interactieve datavisualisaties, de New York Times, de Guardian, de BBC en CNN, kunnen de mogelijkheden van de interactieve datavisualisaties het beste verkend worden. De Guardian is een mediabedrijf dat veel op het gebied van interactieve datavisualisaties doet, op de website van de Guardian is zelfs een apart gedeelte ingericht voor datavisualisaties en de datajournalisten van de krant zijn veelgevraagde sprekers op bijeenkomsten over het onderwerp. Ditzelfde geldt voor de New York Times. Journalistieke interactieve datavisualisaties zijn niet alleen op de sites van kranten te vinden. Ook op de sites van de BBC en CNN is een flink aantal interactieve datavisualisaties te vinden. CNN en BBC hebben een achtergrond in televisie. Dit maakt voor de mogelijkheden op de site niet veel uit, maar het is mogelijk dat blijkt dat de CNN en de BBC vaak andere mogelijkheden kiezen. Omdat in dit onderzoek getracht wordt ook deze opties mee te nemen, is er voor gekozen
om
twee
sites
met
een krantenachtergrond
en
twee
sites met
een
televisieachtergrond, die alle voorop lopen in het gebruik van journalistieke interactieve datavisualisaties te onderzoeken. De sites van de Guardian, de New York Times, CNN en de BBC vormen derhalve de vindplaats voor het corpus. Van deze sites is een corpus van 66 interactieve datavisualisaties verzameld door binnen de sites te zoeken op ‘interactive’, ‘infographic’ of ‘multimedia’. De periode waar de
29
datavisualisaties uit komen is van juni 2010 tot juni 2011. Deze periode is vrij lang, maar dat is nodig om de hoeveelheid datavisualisaties en diversiteit van onderwerpen te garanderen. Op het moment dat er slechts één maand bekeken wordt, is er het risico dat het nieuws en daarmee de inhoud van de datavisualisaties gedomineerd wordt door één onderwerp, zoals de tsunami in Japan of de dood van Osama Bin Laden. Dit komt de validiteit van de genreindeling niet ten goede. De bedoeling van het onderzoek is immers niet om te onderzoeken welke typen datavisualisaties gebruikt kunnen worden als er een tsunami in het nieuws is, maar welke typen datavisualisaties er in het algemeen worden gebruikt. De precieze samenstelling van het corpus is in de bijlage te vinden. 3.2 Analyse-instrument Dit analyse-instrument is gebaseerd op de verschillende componenten waaruit een journalistieke interactieve datavisualisatie kan bestaan, zoals naar voren gekomen in het theoretisch kader. Het is gestoeld op de tien typen visualisaties die Engelhardt (2002) onderscheidt, aangevuld met mogelijkheden die naar voren komen uit de praktijk zoals bijvoorbeeld bij Many Eyes. Daarnaast worden componenten die voor interactiviteit van belang zijn, zoals naar voren gekomen in het model van Broekhuizen (2011) en overgangen die gebruikt worden in verhalen (McCloud, 1993) in het model betrokken. In het analyse-instrument worden de volgende zaken gescoord (uitleg over de onderdelen volgt onder de indeling): Algemeen -
Nummer van datavisualisatie
-
Titel van datavisualisatie
-
Medium waarbij het verscheen (Variabel)
-
Jaar/maand dat het verscheen (Variabel)
-
Onderwerp (Variabel)
Genre -
Kaart
-
Statistische grafiek o
Spreidingsdiagram
o
Multidimensionaal (matrices)diagram
o
Staafgrafiek
o
Bubbelgrafiek
30
-
-
o
Taartdiagram
o
Blokkendiagram (treemap)
Tijdgrafiek o
Lijngrafiek
o
Gestapelde lijngrafiek
Netwerkdiagram o
Netwerkdiagram
o
Stroomdiagram
-
Gegroepeerd diagram
-
Tekst
-
o
Woordboom
o
Woordwolk
o
Uitdrukkingennet
Overig
Type data -
Nominaal (benoemen)
-
Ordinaal (ordening)
-
Interval (gelijke intervallen)
-
Ratio (met absoluut nulpunt)
Interactiviteit -
Representatiemodaliteit o
o
-
Zichtbaar
Statische afbeelding
Animatie
Film
Tekst (hoofd)
Bijschrift
Hoorbaar
Gesproken tekst
Geluiden
Muziek
Manipulatiemodaliteit o
Vehikel
Navigatieknop (vorige, volgende, start, stop)
31
o
o
-
Scrollbalk
Aanklikbaar datapunt
Categorieknop
Mouse-over
Actie
Klikken
Slepen
Zoomen
Highlighten
Functie
Starten/stoppen
Data toevoegen
Zoeken
Filteren
Tonen / verbergen
Bladeren
Overgangen (Opties hieronder) o
Moment naar moment
o
Actie naar actie
o
Onderwerp-onderwerp
o
Aspect naar aspect
o
Scène naar scène
o
Niet verbonden overgang
o
Geen sprake van overgang
Engelhardt (2002) onderscheidt tien hoofdtypen: kaart, afbeelding, statistische grafiek, tijdgrafiek, schakeldiagram, gegroepeerd diagram, tabel, symbool en tekst. Dit zijn vrij algemene categorieën, Many Eyes heeft een veel specifiekere indeling, bijvoorbeeld binnen de statistische grafiek zijn er verschillende opties, zoals de bar chart, de pie chart of de scatterplot. Ook de indeling van Heer et al. is enger dan die van Engelhardt. Opvallend is dat de ‘tabel’, zoals Engelhardt die onderscheidt geen deel uit maakt van de opties die Many Eyes en Heer et al. geven. Ook de categorieën ‘afbeelding’ en ‘symbool’ uit de indeling van Engelhardt komen bij de praktijkmogelijkheden niet aan bod. Deze onderdelen van de indeling van Engelhardt lijken dus geen digitale, interactieve variant in de vorm van een datavisualisatie te hebben. Dit is voor deze laatste twee te verklaren door het feit dat de indeling van Engelhardt veel breder is, hij betrekt alle mogelijke visualisaties terwijl
32
datavisualisaties altijd met data te maken hebben. Een afbeelding of een symbool hebben niets met data te maken en vinden hun weerslag dus niet in praktijkmogelijkheden om data te visualiseren. Het feit dat ‘tabel’ geen weerslag heeft in de mogelijkheden uit de praktijk heeft te maken met het feit dat een tabel meestal niet-gevisualiseerde data bevat. In het analyse-instrument zijn alle overkoepelende categorieën van Engelhardt opgenomen, en daarbinnen worden de meer specifieke genres die genoemd worden vanuit de praktijk onderscheiden. Op deze manier wordt er zo veel mogelijk op detail gekeken. De categorie ‘statistische grafiek’ bijvoorbeeld is dan geen vergaarbak van verschillende grafieken. De categorieën ‘tabel’, ‘afbeelding’ en ‘symbool’ worden niet opgenomen, omdat die in de praktijkopties voor datavisualisaties niet voorkomen. Voordat het analyse-instrument daadwerkelijk gebruikt wordt voor de inhoudsanalyse, wordt er eerst een pretest uitgevoerd. Daaruit wordt duidelijk of het klopt dat de opties ‘tabel’ en ‘afbeelding’ uit Engelhardt niet voorkomen bij interactieve datavisualisaties. Ook kan uit de pretest naar voren komen dat er nog extra opties zijn, die in zowel Engelhardt als de praktijkvoorbeelden niet voorkomen. Het definitieve analyse-instrument wordt na de pretest vastgesteld. Het kan voorkomen dat een datavisualisatie uit het te onderzoeken corpus onder meerdere opties lijkt te vallen. Een voorbeeld hiervan is een kaart van de Verenigde Staten waar in elke staat een taartdiagram afgebeeld is met een verdeling er in die overeenkomt met de waarden zoals die gelden voor de betreffende staat. Hierop is zowel een kaart als een taartdiagram van toepassing. Toch is de visualisatie van de kaart belangrijker, de datavisualisatie wil in eerste instantie vertellen hoe de verdeling over de verschillende staten is, de precieze invulling per staat (in de taartdiagrammen) is hier ondergeschikt aan. Een dergelijke visualisatie zou dus onder de kaart gescoord moeten worden, niet onder het taartdiagram. Het is de bedoeling bij het scoren altijd één optie te kiezen, een datavisualisatie mag niet in meerdere categorieën gescoord worden. Behalve het scoren van genres in het algemeen is het interessant om meer inzicht te hebben in het gebruik ervan. Het is bijvoorbeeld nuttig meer inzicht te hebben in welke type(n) data er vaak worden gebruikt bij welk type visualisatie. Dit kan voor journalisten die de genreindeling gaan gebruiken, helpen om een genre bij een type data te kiezen. Ook geeft het wetenschappelijk inzicht in de samenhang tussen data en in welke vorm het gegoten wordt. Typen data worden onderscheiden in verschillende meetniveaus: nominaal, ordinaal, interval of ratio. De niveaus hebben een toenemende complexiteit. Van nominale data is sprake als de variabelen alleen een ‘naam’ hebben, als ze een label hebben gekregen. Er is geen sprake van volgorde. Ordinale data hebben wel een volgorde. Intervaldata hebben
33
bovendien een vastgestelde afstand tussen de verschillende datapunten, maar er is geen direct nulpunt aan te wijzen. Dat is bij data op rationiveau wel het geval. Naast de genres en meetniveau worden variabelen die komen kijken bij interactiviteit los gescoord. Hiervoor worden de opties die onder de twee relevante modaliteiten uit het model van
Broekhuizen
(2011)
vallen
gebruikt:
de
representatiemodaliteit
en
de
manipulatiemodaliteit. De representatiemodaliteit definieert de manier waarop de data wordt weergegeven, zichtbaar via een statische afbeelding, een animatie, een film, tekst (hoofd) of een bijschrift en hoorbaar via gesproken tekst, geluiden en muziek. Manipulatiemodaliteiten zijn de manieren waarop de boodschaplaag de ontvanger de boodschap qua inhoud en vorm laat veranderen. Dit valt uiteen in drie categorieën, de actie die de gebruiker doet, de functie die het heeft en het vehikel dat dit mogelijk maakt. De navigatieknop (vehikel) bijvoorbeeld maakt door in te zoomen (actie) filteren mogelijk (functie). Mogelijke vehikels: navigatieknop, scrollbalk, aanklikbaar datapunt en categorieknop. Mogelijke acties: slepen, zoomen en highlighten. Mogelijke functies zijn: bladeren, tonen/verbergen, zoeken, filteren en data toevoegen. De mogelijkheden die in het analyse-instrument genoemd worden, zijn tot stand gekomen door als onderzoeker zelf door het corpus heen te gaan en te bekijken welke mogelijkheden gebruikt worden. Met behulp van de pretest wordt dit verder uitgebreid. Niet behandeld in het model van Broekhuizen, maar wel relevant voor interactieve datavisualisaties zijn de overgangen die gebruikt worden. Deze overgangen zijn vergelijkbaar met de overgangen van een verhaal en hiervoor worden dan ook de overgangen gebruikt die McCloud (1993) voor strips onderscheidde: moment naar moment, actie naar actie, subject naar subject, scène naar scène, aspect naar aspect en niet verbonden overgang. In de bijlage is het codeboek voor codeurs opgenomen. Hierin is inclusief enkele voorbeelden omschreven, wat precies met de mogelijkheden die in het analyse-instrument genoemd worden bedoeld wordt. 3.2.1
Pretest
Het analyse-instrument is gebaseerd op theorie. Voordat de daadwerkelijke inhoudsanalyse plaatsvindt, is het belangrijk om eerst te testen of het analyse-instrument goed hanteerbaar is om er een uitgebreide analyse mee uit te voeren en of er geen grote zaken over het hoofd zijn gezien. Daarom wordt er een pretest uitgevoerd.
34
In de pretest van dit onderzoek worden zes journalistieke interactieve datavisualisaties getest. Deze datavisualisaties zijn afkomstig uit verschillende media en hebben verschillende onderwerpen. Van de New York Times en de Guardian worden twee visualisaties getest, omdat deze twee media een groter aandeel in het corpus hebben dan CNN en de BBC. De nummers hieronder corresponderen met het nummer in het corpus (zie bijlage): -
New York Times (10): death of a terrorist: a turning point? (politics)
-
New York Times (25): faces of the death (war)
-
Guardian (37): Arab spring: an interactive timeline of Middel Easts protests (politics)
-
Gurdian (38): world cup 2010 Twitter replay (sports)
-
BBC (43): economy tracker (economy)
-
CNN (60): impact of Japan tsunami and earthquake (disasters)
De precieze uitwerking van de pretest voor de zes genoemde datavisualisaties is in de bijlage te vinden. Hier worden alleen de opmerkelijke zaken besproken of punten die een obstakel vormden in de analyse. In het algemeen is het analyse-instrument goed bruikbaar. In vijf van de zes gevallen waren de genres duidelijk aan te wijzen. In een geval was dit minder eenvoudig, dit ging om datavisualisatie nummer 25, waarbij foto’s en persoonsgegevens van alle soldaten die omgekomen zijn in de oorlogen in Irak en Afghanistan te zien zijn. Dit is een tamelijk artistieke en daardoor unieke datavisualisatie, de foto’s zelf zijn het belangrijkste onderdeel. De foto’s zijn gerangschikt op datum van overlijden, maar dit is niet leidend, daarom is deze visualisatie niet in het genre geannoteerde tijdlijn te plaatsen. Het is niet nodig voor één visualisatie een nieuw genre te maken, maar het is wel belangrijk om bij te houden of er veel van dit soort visualisaties zijn die in de categorie overig vallen. Dan zou het namelijk wel de moeite waard kunnen zijn een extra genre op te nemen. Het type data is voor alle datavisualisaties goed aan te wijzen, hier zijn in de pretest geen problemen mee geweest. De typen zijn uitputtend, extra opties zijn hierin dus niet nodig. Ook de representatiemodaliteiten zijn goed aan te wijzen. Opvallend is dat elke visualisatie wel op de een of andere manier gebruik maakt van een statische afbeelding. Er worden, behalve in filmpjes, geen hoorbare representatiemodaliteiten gebruikt, wellicht is het niet nodig om daarbinnen dus verschillende opties te onderscheiden, maar dit zal blijken uit de totale inhoudsanalyse. De manipulatiemodaliteiten zijn moeilijker aan te wijzen. Het is onduidelijk of er bij elk vehikel een corresponderende actie en daarbij weer een corresponderende functie hoort, dat is nu nog niet het geval.
35
De manipulatiemodaliteiten kunnen het beste als volgt aangepast en aangevuld worden:
Vehikel
Actie
Functie
Navigatieknop
Klikken
Bladeren,
vorige/volgende,
starten/stoppen animatie of film, in/uitzoomen Scrollbalk
Scrollen, slepen
Tonen/verbergen, filteren
Aanklikbaar datapunt
Klikken
Tonen/verbergen, highlighten
Categorieknop
Klikken
Filteren, highlighten
Mouse-over
Stilstaan met muis
Tonen/verbergen, highlighten
‘Vast te pakken onderdeel’
Slepen
Tonen/verbergen
Zoekveld
Tekst invoeren
Zoeken
Knop om data toe te voegen
Klikken
Data toevoegen
Tabel 1: Manipulatiemodaliteiten zoals naar voren gekomen in de pretest
De overgangen zijn ook goed aan te wijzen. Al met al is het analyse-instrument dus goed te gebruiken, de manipulatiemodaliteiten moeten echter aangevuld worden. Op basis van de pretest is nog niet te zeggen hoe de onderdelen die bij interactiviteit komen kijken zich verhouden tot de genres, hier kan pas na de volledige inhoudsanalyse, zo mogelijk met behulp van correlaties, op in worden gegaan. 3.3 Codeurs De resultaten die in het volgende hoofdstuk besproken worden, zijn gebaseerd op analyses van twee codeurs. Om de betrouwbaarheid van deze analyses te testen is een statistische toets uitgevoerd, Krippendorff’s alpha (Hayes, 2005). Krippendorff’s alpha is voor elke variabele apart uitgerekend, zo komt er een duidelijk beeld naar voren van de consistentie van de analyse. Over het algemeen is deze consistentie hoog (α boven de 0.800), enkele scores zijn niet hoog genoeg om harde uitspraken op te baseren, maar geven wel een tendens weer (α tussen de 0.800 en 0.667). Over zes variabelen kunnen geen uitspraken gedaan worden, de α ligt daar onder de 0.667. De gemiddelde α is 0,817, over het algemeen is er door de codeurs dus consistent gecodeerd.
36
In de tabel hieronder is voor elke variabele afzonderlijk de consistentie te zien: Variabele
Krippendorff’s α
Genre
Variabele
Krippendorff’s α
Aanklikbaar datapunt
,9683
Kaart
,8743
Categorieknop
,7894
Spreidingsdiagram
,6515
Mouse-over
,9683
Multidimensionaal
Niets gescoord
Vast te pakken
1
diagram
onderdeel
Staafgrafiek
,9245
Zoekveld
,9153
Bubbelgrafiek
,7460
Knop om data toe te
1
Taartdiagram
Niets gescoord
voegen
Blokkendiagram
1
Overig
Lijngrafiek
,9016
Actie
Gestapelde lijngrafiek
Niets gescoord
Klikken
,8588
Netwerkdiagram
Niets gescoord
Scrollen
,9081
Stroomdiagram
Niets gescoord
Slepen
,8882
Gegroepeerd diagram
Niets gescoord
Tekst invoeren
,9153
Woordboom
Niets gescoord
Stilstaan met muis
,9683
Woordwolk
Niets gescoord
Overig
,6615
Uitdrukkingennet
Niets gescoord
Functie
Overig
,8745
Starten/stoppen
,9599
Vorige/volgende
,9034
Type data
1
Nominaal
,8493
Data toevoegen
1
Ordinaal
,9245
Zoeken
,9245
Interval
,7446
In- en uitzoomen
,9288
Ratio
,6209
Filteren
,8181
Interactiviteit
Tonen/verbergen
,6342
Representatiemodaliteit
Bladeren
Niets gescoord
Statische afbeelding
,9016
Highlighten
,5309
Animatie
,9614
Overig
,6615
Film
,8588
Overgangen
Tekst (hoofd)
,9477
Moment-moment
,9016
Bijschrift
,7661
Actie-actie
,4883
Overig
-,0077
Onderwerp-onderwerp
,8170
Gesproken tekst
,8588
Aspect-aspect
,6534
Muziek
Niets gescoord
Scène-scène
,8181
Geluiden
,4883
Niet verbonden
Niets gescoord
Overig
Niets gescoord
overgang Geen sprake van
Manipulatiemodaliteit
,5509
Navigatieknop
,8134
overgang
Scrollbalk
,9081
Tabel 2 Krippendorff's alpha per variabele
37
De lage scores op Krippendorff’s alpha zijn opvallend bij de typen data en de functies van manipulatiemodaliteiten. Er zijn ook lage scores bij de representatiemodaliteiten en de overgangen, maar deze zijn minder ingrijpend, omdat in de desbetreffende categorieën zeer weinig gescoord is. Het gaat om een verschil van 1 tot 3 waarin totaal 1 tot 5 keer gescoord is. In de resultaten spelen deze categorieën geen grote rol. De lage scores bij de typen data, de functies van manipulatiemodaliteiten en overgangen zijn ingrijpender. Ze zijn goed te verklaren. Tijdens het scoren werd duidelijk dat ‘highlighten’ en ‘tonen/verbergen’ ambigue begrippen zijn. Meer dan eens twijfelden codeurs waar de score neer te zetten. Ditzelfde geldt voor de typen data, uit de nabespreking tussen de codeurs bleek dat het soms lastig te bepalen is welk type data er gekozen moet worden. Dit neemt niet weg dat de gecodeerde onderdelen met een lage α ongeschikt zijn om mee te nemen in de interpretatie van de inhoudsanalyse. Deze categorieën zullen dus niet worden meegenomen worden om harde uitspraken over te doen, maar geven wel een indicatie.
4. Resultaten In dit hoofdstuk worden de resultaten van de inhoudsanalyse besproken. Op deze resultaten zijn de uiteindelijke conclusies in het volgende hoofdstuk gebaseerd. 4.1 Genres Zoals blijkt uit tabel 2 valt op dat er enorm veel onder het genre ‘kaart’ gescoord is, 27 van de 66 geanalyseerde datavisualisaties zijn hieronder geschaard, dat is 41 procent. Andere genres waaronder tamelijk veel gescoord is, zijn ‘staafgrafiek’ (12 procent), ‘bubbelgrafiek’ (9 procent) en ‘lijngrafiek’ (7,5 procent). Ook is er veel, 17 keer, ‘overig’ gescoord, dat is 25,5 procent. In de overige genres is niet of nauwelijks (1 of 2 keer) gescoord.
Variabele
Variabele
Score
Genre
Gestapelde lijngrafiek
0 (0%)
Kaart
Netwerkdiagram
Kaart
Score
27 (41%)
Statistische grafiek
Netwerkdiagram
0 (0%)
Stroomdiagram
1(1,5 %)
Spreidingsdiagram
1 (1,5 %)
Gegroepeerd diagram
Multidimensionaal
0 (0%)
Gegroepeerd diagram
diagram
0 (0%)
Tekst
Staafgrafiek
8 (12%)
Woordboom
Bubbelgrafiek
6 (9%)
Woordwolk
0 (0%)
Taartdiagram
1 (1,5 %)
Uitdrukkingennet
0 (0%)
Blokkendiagram
1(1,5 %)
Overig
Tijdgrafiek Lijngrafiek
Overig 5 (7,5%)
0 (0%)
17 (25,5%)
Tabel 3: Scores per genre
Het ene genre wordt dus (veel) vaker gebruikt dan het andere. Genres die locaties en groottes aangeven worden vaker gebruikt dan genres die relaties tussen verschillende zaken aangeven, zoals stroomdiagrammen. Ook woordgedreven datavisualisaties worden weinig gebruikt. Het gegroepeerd diagram komt zelfs geen enkele keer voor, dit is opvallend. Dat dit genre nergens gescoord is, is wel verklaarbaar: in de andere genres wordt ook op verschillende manieren gesorteerd, bijvoorbeeld door middel van kleuren en grootten, maar dit onderscheid is nooit de hoofdboodschap van de datavisualisatie. Deze datavisualisaties worden daarom nooit in het genre gegroepeerd diagram gescoord.
39
In de categorie ‘overig’ is onverwacht veel gescoord. Na het op een rijtje zetten van de visualisaties in de categorie ‘overig’, valt op dat het voornamelijk visualisaties zijn die nominale data weergeven. Het zijn ‘handgemaakte’ visualisaties, die bijzondere vormen hebben. Ze zijn daarom niet in de overige genres te passen. Wel zie je overeenkomsten tussen verschillende visualisaties in de categorie ‘overig’. Zo zijn er enkele visualisaties die data over personen bevatten: foto’s en andere persoonsgegevens. Deze personen, bijvoorbeeld gesneuvelde soldaten of politici in een (nieuw) kabinet, worden op een rijtje gezet. Behalve voor personen zou deze vorm ook voor bijvoorbeeld uitstervende dieren gekozen kunnen worden. Een genre voor dit type visualisatie zou daarom ‘geannoteerde afbeeldingengalerij’ genoemd kunnen worden. Andere ‘handgemaakte’ visualisaties die een aantal keer in de categorie ‘overig’ gescoord zijn, zijn visualisaties die een tijdlijn weergeven, met daaraan gebeurtenissen en eventueel plaatsen gekoppeld. Hoewel dit tijdgebonden data is, is hiervoor geen genre benoemd binnen het hoofdgrenre ‘tijdgrafiek’. Wel is het in de journalistiek vaak zo dat er overzichten van gebeurtenissen gegeven worden, bijvoorbeeld bij een ramp of oorlog. Een genre voor dit type datavisualisatie zou ‘geannoteerde tijdlijn’ genoemd kunnen worden. Zoals in het vorige hoofdstuk ook al aangegeven is het discutabel of dit type visualisaties wel datavisualisaties zijn. Is wat hier gevisualiseerd wordt wel data? In dit onderzoek is ervoor gekozen dit wel zo te benaderen, het zijn immers veel gebeurtenissen die in een dergelijke tijdlijn neergezet worden, de gebeurtenissen zijn te zien als datapunten. Een derde groep die opvalt binnen de categorie ‘overig’ is tekstgebaseerd. Ook hiervoor is geen ruimte binnen de al benoemde genres die op tekst gebaseerd zijn, daar is namelijk de vorm dwingend. Bij de tekstgebaseerde visualisaties die nu in de categorie ‘overig’ gescoord zijn gaat het om speeches, zoals de State of the Union (vergelijkbaar met de troonrede in Nederland), die van commentaar en/of context voorzien zijn. Het is een geannoteerde tekst, en zo zou een genre voor dit type visualisaties ook genoemd kunnen worden. Verder valt op dat er twee keer een tabel in de categorie ‘overig’ gescoord is. Engelhardt (2002) had deze vorm van data weergeven bij zijn hoofdcategorieën staan. Zoals aangehaald in het hoofdstuk waar de theorie wordt besproken, vond Tufte (2001) echter dat deze categorie niet bij datavisualisaties hoorde, omdat het ruwe data weergeeft. Met gegevens in een tabel moet volgens hem nog iets gebeuren voordat het een datavisualisatie is. Ook in de praktijkopties die Many Eyes en Tableau bijvoorbeeld onderscheiden, is de tabel geen keuzemogelijkheid. Dit was de reden waarom het genre ‘tabel’ niet in het analyseinstrument is meegenomen. Blijkbaar hoort dit genre er toch in, in de praktijk blijkt hij wel te worden gebruikt.
40
Het analyse-instrument is voor een belangrijk deel gebaseerd op praktijkmogelijkheden om data te visualiseren, zoals Many Eyes en Tableau. Deze programma’s hebben een geautomatiseerd karakter, er is weinig ruimte voor afwijkingen in data omdat de visualisaties automatisch te genereren moeten zijn. Dit is een belangrijke reden waarom de datavisualisaties uit de categorie ‘overig’, afgezien van de tabel, niet in de categorieën afgeleid van Many Eyes pasten, deze datavisualisaties zijn niet automatisch te genereren omdat de vorm en inhoud sterk afhankelijk zijn van de omstandigheden. In de journalistieke praktijk worden visualisaties die nu onder de categorie ‘overig’ gescoord worden echter regelmatig gebruikt, deze moeten daarom wel opgenomen worden in een genre-indeling van journalistieke interactieve datavisualisaties. Dit is mogelijk door de bovengenoemde varianten geannoteerde afbeeldingengalerij, geannoteerde tijdlijn, geannoteerde tekst en tabel op te nemen in de genre-indeling. Het genre kaart is opvallend veel aanwezig in dit corpus. Dat roept de vraag op of het niet nodig is om hier subgenres in aan te wijzen, zoals ook bij veel andere overkoepelende genres is gebeurd. Hier is in eerste instantie niet voor gekozen, omdat het analyseinstrument gebaseerd is op de hoofdgenres van Engelhardt, bewust niet op de gemengde genres die hij onderscheidt omdat het analyse-instrument anders uit te veel opties zou bestaan. De ‘praktijkgenres’ die uit onder meer Many Eyes zijn gehaald, onderscheidden ook geen diverse soorten kaarten, terwijl verder wel veel subopties onderscheiden werden. Het benoemen van subopties naar aanleiding van deze analyse is ook niet nodig. De reden dat er vermoedelijk veel met kaarten wordt gedaan in de journalistiek, is dat het ‘waar’ een van de belangrijkste vragen is die beantwoord wordt in vrijwel elk journalistiek verhaal. In de categorie ‘kaart’ en ‘overig’ wordt voornamelijk nominale data gevisualiseerd. Dit past bij de journalistiek, waar veelal unieke gebeurtenissen worden beschreven. Daarom is het van belang de verschillende genres die rondom deze data ontstaan op te nemen in een genre-indeling. Het type data dat in de andere visualisaties gebruikt wordt, is meestal niet nominaal. Voor deze visualisaties worden zowel ordinale data als interval- en ratiodata gebruikt. Kortom, er
zijn in de
categorie ‘overig’
diverse datavisualisaties gescoord die
overeenkomsten met elkaar hebben. Het zijn datavisualisaties die in journalistiek regelmatig terugkeren, de journalistiek heeft immers altijd behoefte aan overzichten van wat er wanneer gebeurde (geannoteerde tijdlijn), wie ergens bij betrokken zijn (personengalerij) en er wordt elk jaar een troonrede uitgesproken (geannoteerde tekst). Tabel is een genre dat niet binnen
41
de visualisaties leek te horen, maar in de praktijk toch gebruikt blijkt te worden. Categorieën die van tevoren vastgesteld waren, die al vertegenwoordigd waren in het analyse-instrument, worden niet allemaal even veel gebruikt. Vooral ‘kaart’, ‘staafdiagram’, ‘bubbeldiagram’ en ‘lijngrafiek’ worden gebruikt. De andere opties sporadisch of zelfs niet. Deze sporadisch gebruikte opties kunnen voor de behapbaarheid van de genre-indeling daarom beter samengevoegd worden, de twee typen netwerkdiagrammen zouden dan in hetzelfde genre (netwerkdiagram) vallen, en de gestapelde lijngrafiek wordt ook onder ‘lijngrafiek’ geschaard. Voor de statistische grafieken is dit niet zo goed mogelijk, omdat de karakters van de verschillende grafieken verschillen. Een bubbelgrafiek en een staafdiagram zouden dan wel beide voor dezelfde data ingezet kunnen worden, de vorm verschilt zeer. In de volgende paragraaf is de genre-indeling gebaseerd op deze analyse in zijn geheel te zien. 4.2 Modaliteiten Behalve naar genres en typen data is er in de analyse ook gekeken naar representatiemodaliteiten, manipulatiemodaliteiten en overgangen. Wat in het algemeen opvalt aan de representatiemodaliteiten, is dat vrijwel alle datavisualisaties een statische afbeelding bevatten (92 procent), en dat datavisualisaties ook veelal bijschriften bevatten (85 procent). Animaties worden in een kwart van de gevallen gebruikt en filmpjes in een zesde van de gevallen (ongeveer 12,5 procent). Tekst als hoofdonderdeel
wordt
in
17
procent
van
de
gevallen
gebruikt.
Hoorbare
representatiemodaliteiten worden amper gebruikt, gesproken tekst komt nog het meeste voor, maar vrijwel alleen in combinatie met filmpjes. De variabelen binnen de manipulatiemodaliteiten worden vrijwel allemaal veel gebruikt, data toevoegen en zoekvelden om data te zoeken daargelaten. Mouse-over en navigatieknoppen zijn de vehikels die het vaakst voorkomen (respectievelijk 61 en 60 procent). De actie die veruit het meeste voorkomt is klikken (87,5 procent), met stilstaan met muis als goede tweede (61 procent) en scrollen als derde (43 procent). Bij een aantal functies die de manipulatiemodaliteiten hebben, zijn percentages zichtbaar die overeenkomen met de vehikels en acties die je er bij zou verwachten. Voor de variabelen zoomen, filteren, tonen/verbergen, bladeren en highligten is dit niet zo. Bladeren is bijvoorbeeld helemaal niet gescoord. Bij het analyseren merkten de codeurs dat bladeren ook vaak onder tonen/verbergen kan vallen. Tonen en verbergen op zijn beurt is verwarrend omdat een deel hiervan ook onder zoomen te scharen valt. Zoomen is niet alleen in letterlijke zin (grafisch inzoomen) gebruikt, maar ook in de zin van inzoomen op data (meer naar detailniveau). Di
42
zou dus ook onder tonen/verbergen kunnen vallen. In het codeboek had deze onduidelijkheid uitgelegd moeten worden, dit is echter niet duidelijk genoeg gebeurd waardoor de scores op deze variabelen niet goed te onderscheiden zijn. Overgangen is de laatste groep variabelen die gescoord is. De moment-momentovergang en de aspect-aspectovergang worden het meest gebruikt, beide ongeveer 35 procent. Scènescene en onderwerp-onderwerp komt ook voor maar stukken minder (respectievelijk 9 en 14 procent). De andere overgangen komen niet of nauwelijks voor. Moment naar moment is een overgang die geschikt is om ontwikkeling in tijd uit te beelden, een veelgebruikte vorm in de journalistiek. Ook wordt in de journalistiek geprobeerd verschillende aspecten van hetzelfde onderwerp te belichten, het is daarom ook niet verbazingwekkend dat deze overgang regelmatig voorkomt. Het is nuttig niet alleen de variabelen van interactiviteit en overgangen in algemene zin te bekijken, maar ook meer specifiek per genre dat veel is gescoord. In een tabel in de bijlage zijn voor de genres ‘kaart’, ‘staafgrafiek’, ‘bubbelgrafiek’, ‘lijngrafiek’ en de categorie ‘overig’ te zien hoe de variabelen voorkomen. Omdat behalve voor ‘kaart’ en ‘overig’ niet veel datavisualisaties per genre zijn gescoord, is het niet nuttig om in de verdere analyse deze percentages uitgebreid aan te halen. Het was oorspronkelijk ook de bedoeling om de samenhang tussen de diverse genres en de variabelen van de modaliteiten en overgangen uit te rekenen met behulp van Pearsons correlatiecoëfficiënt. Helaas is het zo dat er bij de meeste
genres
te
weinig
datavisualisaties
gescoord
zijn
om
statistische
correlatieberekeningen over uit te voeren. Harde uitspraken over de samenhang worden hieronder daarom ook niet gedaan. Wel zijn de gescoorde variabelen van de modaliteiten bij elk genre indicatief, daarom wordt het hier besproken. Bij het genre kaart bevatten alle datavisualisaties een statische afbeelding. In een derde van de gevallen is er ook animatie toegevoegd. Bijna alle kaarten, 25 van de 27 bevatten ook een bijschrift. Drie van de kaarten bevatten ook filmpjes, waar eveneens bij gesproken wordt. De kaarten zijn voornamelijk met een navigatieknop te bedienen. In de helft van de gevallen is er ook een categorieknop. Het doel van de categorieknoppen en de navigatieknoppen is voornamelijk het filteren van data, dat kan in 24 van de 27 kaarten. Datapunten zijn in de helft van de gevallen aan te klikken. Daarmee is het mogelijk om dingen te tonen of weer te verbergen. In kaarten wordt de moment-momentovergang het meest gebruikt (11 keer), maar ook wordt de aspect-aspectovergang (8 keer) en de onderwerp-onderwerpovergang (5 keer) regelmatig gebruikt.
43
Bij het genre staafgrafiek wordt er in alle gevallen (8) gebruikgemaakt van een statische afbeelding, 7 gevallen hebben hierbij een bijschrift. Twee staafgrafieken zijn ook geanimeerd, en naast een staafgrafiek als hoofdonderdeel is er in een datavisualisatie daarnaast een filmpje te zien (en het geluid hierbij te horen). De navigatieknop, scrollbalk, mouse-over en categorieknop zijn de belangrijkste vehikels, hiermee kun je klikken, scrollen en erop stil staan met de muis. Filteren is veruit de belangrijkste functie van de vehikels, dit komt 7 keer voor. In zes van de zeven gevallen wordt de overgang moment-moment gebruikt, en er is in één visualisatie geen sprake van een overgang. Bij het genre bubbelgrafiek Is er bijna altijd sprake van een animatie, ook is er altijd een bijschrift. De animatie is wel te manipuleren, door te klikken en te scrollen gaat de animatie bewegen. Hij bevat ook vrijwel altijd mouse-over om datapunten te laten verschijnen en je kunt even vaak op de datapunten klikken. Meestal kun je ermee inzoomen op data, en data filteren en tonen/verbergen. Er worden diverse overgangen gebruikt, er springt niet een overgang duidelijk uit. Bij het genre lijngrafiek is er wederom altijd een statische afbeelding en een bijschrift. Geen van de onderzochte grafieken is geanimeerd. Het vehikel dat het vaakst voorkomt is de mouse-over, verder worden ook categorieknoppen, aanklikbare data en scrollbalken gebruikt. Je kunt hier veelal op klikken of op stilstaan met de muis en ze zijn vooral bedoeld om in- en uit te zoomen en te filteren maar ook af en toe om dingen te tonen en verbergen. Moment naar moment is de meest gebruikte overgang, wat wel logisch is omdat lijngrafieken veelal gebruikt worden om een voortgang in tijd weer te geven. Dan tot slot de categorie overig. Het is niet mogelijk hier generaliserend iets over te zeggen, omdat binnen deze categorie zoveel verschillende typen datavisualisaties aan te wijzen zijn. In de vorige sub-paragraaf is dit uitgebreid aan bod gekomen. De verschillende typen die in de vorige sub-paragraaf geïntroduceerd zijn komen in dit corpus niet zo vaak voor dat hier een aparte analyse van te maken valt. De spreiding van de genres over de diverse mediabedrijven is gevarieerd. Het is niet zo dat bij één medium een bepaald genre er uit springt. Ook maken alle media gevarieerd gebruik van de verschillende modaliteiten, ook hierbij springt niet één medium er opvallend uit. Dit is opmerkelijk gezien het feit dat de achtergronden van de onderzochte media verschillend zijn: twee televisiemedia en twee krantenmedia. De datavisualisaties die onderzocht zijn, zijn echter voor het web gemaakt, de manier van presentatie van data op het web is blijkbaar niet afhankelijk van de achtergrond van de media.
44
4.3 Genre-indeling Uit het bovenstaande is duidelijk geworden dat er diverse genres veelvuldig voorkomen en dat andere genres sporadisch tot nooit voorkomen. Ook zijn er genres uit de analyse naar boven gekomen, die oorspronkelijk niet in het analyse-instrument waren opgenomen. Hieronder wordt een genre-indeling gepresenteerd die gebaseerd is op het model van Engelhardt (2001), aangevuld met enerzijds genres die automatisch gevisualiseerd (zouden kunnen) worden, zoals naar voren is gekomen in de voorbeelden van onder andere Many Eyes en anderzijds meer handgemaakte datavisualisaties die situatieafhankelijk zijn, zoals die uit de analyse van het corpus in dit onderzoek naar voren is gekomen. Het zijn zeven genres, bij twee van de zeven genres, de statistische grafiek en de lijngrafiek, zijn sub-genres onderscheiden. Vergeleken met de genre-indeling die gebaseerd op de theorie was samengesteld, onderscheidt de hier gepresenteerde genre-indeling minder genres. Enkele specifieke genres bleken in de analyse slechts sporadisch of zelfs niet voor te komen, die zijn hier daarom onder een overkoepelend genre geschaard. Het gaat dan bijvoorbeeld over de diverse typen netwerkdiagrammen en de verschillende vormen van tekstgestuurde visualisaties. Het multidimensionaal diagram en het gegroepeerd diagram zijn in deze genre-indeling achterwege gelaten. In de praktijk blijkt dit nooit het belangrijkste genre van een datavisualisatie te zijn. Data zijn vaak wel gegroepeerd, maar dat is nooit het belangrijkste in de datavisualisatie, de datavisualisatie wordt daarom onder een ander genre gescoord. De genre-indeling die op basis van de analyse in dit onderzoek tot stand is gekomen ziet er als volgt uit:
Naam genre
Kaart
Veelvoorkomende
Veelvoorkomende
datarepresentatie
interactiviteit
Toont een fysieke opstelling
Vrijwel altijd kan ingezoomd
op een geografische
worden, overige bediening
ondergrond. Dit kan zowel
gaat met navigatie- en
op macroniveau (wereld) als
categorieknop, waarmee
op microniveau zijn
data gefilterd kunnen
(woonhuis)
worden. Aanklikbare datapunten tonen/verbergen
45
informatie. Er wordt regelmatig, maar lang niet altijd, gebruik gemaakt van animaties. Geannoteerde
Toont afbeeldingen of
Afbeeldingengalerij is te
afbeeldingengalerij
andere representaties van
weinig gescoord om
bijvoorbeeld personen,
uitspraken over interactiviteit
veelal voorzien van een
over te kunnen doen.
annotatie Statistische grafiek
Toont en vergelijkt
Meestal worden
kwantiteiten
navigatieknop, scrollbalk en
-
Spreidingsdiagram
-
Staafgrafiek
mouse-over ingezet, de
-
Bubbelgrafiek
belangrijkste taak die zij
-
Blokkendiagram
hebben is filteren van data.
-
Taartdiagram
Bubbelgrafiek is vrijwel altijd geanimeerd.
Tijdgrafiek -
Lijngrafiek
-
Geannoteerde tijdlijn
Toont ontwikkeling door de
Lijngrafiek is nooit
tijd heen
geanimeerd, heeft wel vaak aanklikbare datapunten. Geannoteerde tijdlijn is te weinig gescoord om uitspraken over interactiviteit over te kunnen doen.
Netwerkdiagram
Toont verschillende punten
Netwerkdiagram is te weinig
en de relaties hiertussen
gescoord om uitspraken over interactiviteit over te kunnen doen.
Tabel
Toont data die horizontaal
Met behulp van aanklikbare
en/of verticaal verdeeld is
datapunten is het vaak mogelijk delen te highlighten of te sorteren.
Tekst
Toont een visualisatie
Visualisaties waarbij tekst
-
Woordwolk/-boom
gebaseerd op tekst, kan ook
dwingend is voor de vorm
-
Geannoteerde tekst
een geannoteerde speech of
(o.a. woordwolk) zijn te
voordracht zijn
weinig gescoord om
46
uitspraken over interactiviteit over te kunnen doen. Bij een geannoteerde speech is het mogelijk delen in tekst aan te klikken en daarbij annotaties te tonen/verbergen en filmpjes te starten. Tabel 4: Genre-indeling die tot stand is gekomen op basis van voorliggend onderzoek
47
5. Conclusie In voorgaande hoofdstukken zijn achtereenvolgens de theoretische concepten die in dit onderzoek gebruikt worden, de onderzoeksmethode en de resultaten beschreven. In dit hoofdstuk komen de conclusie van het onderzoek, punten van discussie en aanbevelingen voor verder onderzoek aan bod. De onderzoeksvraag die in dit onderzoek centraal staat luidt: Welke verschillende genres zijn er te onderscheiden in journalistieke interactieve datavisualisaties in Engelstalige online media? De Engelstalige online media die onderzocht zijn, lopen voorop in het gebruik van journalistieke interactieve datavisualisaties: de New York Times, de Guardian, CNN en de BBC. Van journalistieke interactieve datavisualisaties is op het moment van schrijven van dit onderzoek nog geen genre-indeling bekend. Het beschrijven van de genres is de wetenschappelijke bijdrage die met dit onderzoek beoogd wordt. Daarnaast is het ook voor de praktijk van belang dat er een genre-indeling bestaat. Het kan de makers en lezers van journalistieke interactieve datavisualisaties helpen bij respectievelijk het ontwerpen en het begrijpen van datavisualisaties. Om de genres te kunnen onderzoeken is op basis van theorie een voorlopige genre-indeling geformuleerd, die daarna getoetst is aan de praktijk middels een inhoudsanalyse op 66 datavisualisaties, afkomstig van de vier genoemde media. Uit de analyse blijkt dat de genre-indeling zoals die tot stand is gekomen op basis van theorie niet geheel bruikbaar is in de praktijk. Zo worden er opties onderscheiden die in de praktijk niet of nauwelijks voorkomen, en is een flink aantal datavisualisaties niet in de voorgestelde genres
te
plaatsen.
Een verklaring
hiervoor
is te
vinden in het
geautomatiseerde karakter van Many Eyes en Tableau, die voor een belangrijk gedeelte model hebben gestaan voor de oorspronkelijke genre-indeling. Zij genereren visualisaties op basis van data die in een strakke vorm aangeleverd moeten worden, veelal cijfermatig. In de praktijk wordt er echter ook veel gebruikgemaakt van ‘handgemaakte’ datavisualisaties, gebaseerd op nominale data, die geschikter zijn om specifieke omstandigheden te beschrijven, en die creatieve vormen hebben. Vorm en inhoud zijn hierbij uniek. Ook wordt
48
er veel met niet-cijfermatige data gedaan, zoals foto’s en persoonsgegevens, waar geautomatiseerde visualisaties niet geschikt voor zijn. De uiteenlopende specifieke eigenschappen van de ‘handgemaakte’ datavisualisaties maakt het soms lastig om een duidelijk genre aan te wijzen. Zoals in het theoretisch hoofdstuk ook beschreven is, is het volgens Coutinho en Miranda (2009) juist een belangrijke voorwaarde voor een goede genre-indeling dat specifieke eigenschappen ook te ruimte krijgen. De overkoepelende eigenschappen maken dat een datavisualisatie in een genre geplaatst kan worden. Het is mogelijk gebleken ook voor veel van deze ‘handgemaakte’ datavisualisaties een genre te formuleren. Zo wordt er regelmatig gebruik gemaakt van een geannoteerde tijdlijn (bijvoorbeeld om de Arabische Lente of belangrijke momenten in de Tweede Wereldoorlog te omschrijven), een personen/afbeeldingengalerij (om bijvoorbeeld de mensen in een (nieuw) kabinet te omschrijven) en geannoteerde tekst (bijvoorbeeld bij de State of the Union). Dit zijn onderwerpen die in journalistieke context regelmatig terugkeren en dus geschikt zijn om een eigen (sub)genre te krijgen. De genre-indeling die in dit onderzoek gepresenteerd wordt kent zeven genres, waarbij bij enkele genres ook subgenres horen: 1.
Kaart
2.
Geannoteerde afbeeldingengalerij
3.
Statistische grafiek
4.
a.
Spreidingsdiagram
b.
Staafgrafiek
c.
Bubbelgrafiek
d.
Blokkendiagram
e.
Taartdiagram
Tijdgrafiek a.
Lijngrafiek
b.
Geannoteerde tijdlijn
5.
Netwerkdiagram
6.
Tabel
7.
Tekst a.
Woordwolk/-boom
b.
Geannoteerde tekst
Bovenstaande genres sec zouden ook bruikbaar zijn voor statische datavisualisaties. In dit onderzoek is echter ook interactiviteit bij de analyse betrokken. In het uitgebreide overzicht in het resultatenhoofdstuk is opgenomen welke vormen van interactiviteit bij elk van de genres
49
veel
voorkomt.
Hieronder
volgt
daarvan
een
korte
beschrijving.
Ook
worden
veelvoorkomende typen data en overgangen, de andere geanalyseerde componenten kort besproken. Wat betreft de typen data blijkt dat nominale data vooral voorkomt bij datavisualisaties in het genre kaart, en bij datavisualisaties die oorspronkelijk gescoord zijn onder ‘overig’, maar die bij de genre-indeling hierboven passen onder afbeeldingengalerij, geannoteerde tijdlijn en tekst. ‘Handgemaakte’ datavisualisaties maken voornamelijk gebruik van nominale data. Veelvuldig gebruik van nominale data past bij journalistiek, waarbij veelal bericht wordt over unieke gebeurtenissen. De andere typen data komen voor bij de genres die geschikt zijn voor cijfermatige data: de subgenres van statistische grafiek en lijngrafiek. Wat betreft de representatie- en manipulatiemodaliteiten valt in het algemeen te zeggen dat vrijwel alle datavisualisaties een statische afbeelding en een bijschrift bevatten. Een kwart van de datavisualisaties is geanimeerd en een zesde van de datavisualisaties bevat een filmpje. Er wordt
amper
gebruikgemaakt
manipulatiemodaliteiten
worden
van vrijwel
hoorbare allemaal
veel
representatiemodaliteiten. gebruikt,
hoewel
in
De weinig
datavisualisaties gezocht kan worden of data toegevoegd kan worden. Mouse-over en navigatieknoppen zijn de vehikels die het vaakst terugkomen, en de acties die het meest voorkomen passen hierbij: klikken en stilstaan met de muis. De functies die hierbij horen komen ook het meeste voor: vorige/volgende, in- en uitzoomen, filteren en starten/stoppen. Wat betreft de overgangen worden de moment-momentovergang en de aspectaspectovergang het meest gebruikt. Dit zijn journalistiek gezien ook logische overgangen, moment-moment is geschikt om chronologisch te vertellen wat er van moment tot moment gebeurde. Aspect-aspectovergangen zijn geschikt om verschillende zaken rond hetzelfde onderwerp te vertellen, ook dit wordt in journalistieke context vaak gedaan. Voor de veelgescoorde genres is specifiek bekeken in combinatie met welke interactieve variabelen en overgangen zij voorkomen. De datavisualisaties in het genre kaart zijn voornamelijk met een navigatieknop te bedienen, enkele hebben ook een categorieknop, het doel hiervan is voornamelijk het filteren van data. Datapunten zijn in de helft van de gevallen aanklikbaar, het is hiermee mogelijk data te tonen en te verbergen. De meest gebruikte overgang is moment-moment. Bij het genre staafgrafiek zijn de navigatieknop, de scrollbalk en de mouse-over de meest gebruikte vehikels, hiermee kun je klikken en scrollen of op een datapunt stilstaan met de muis. Filteren is de belangrijkste functie van de vehikels. Ook hier wordt de moment-momentovergang het meest gebruikt. In het genre bubbelgrafiek wordt bijna altijd een animatie gebruikt. Door klikken en scrollen gaat deze bewegen. Vrijwel alle
50
bubbelgrafieken bevatten een mouse-over, waar je ook op kunt klikken, waarna de bijbehorende data bij het datapunt verschijnt. Bij dit genre worden diverse overgangen gebruikt. Geen van de datavisualisaties gescoord in het genre tijdgrafiek is geanimeerd, wel komt ook hier de mouse-over veel voor, en kun je klikken op datapunten en navigatieknoppen en worden scollbalken gebruikt. Hiermee kan worden in- en uitgezoomd en toon en verberg je onderdelen. Moment-moment is ook hier de belangrijkste overgang. De vier verschillende mediabedrijven die zijn onderzocht, laten een eenduidig beeld van interactieve datavisualisaties zien. Het is niet zo dat de datavisualisaties van een bepaald medium meer gebruik maakt van bepaalde genres of interactieve mogelijkheden. Dit is best opvallend, gezien twee van de onderzochte mediabedrijven een krantenachtergrond hebben en twee een televisieachtergrond. De conclusies uit dit onderzoek en de genre-indeling, inclusief voor elk genre de interactieve mogelijkheden die hier veel bij voorkomen, die hier gepresenteerd zijn, vormen een stap in de verrijking van het inzicht in journalistieke interactieve datavisualisaties. Tot nu toe bestond een dergelijke genre-indeling nog niet. Voor de journalistiek als geheel en datajournalistiek in het bijzonder, biedt de genre-indeling daarnaast houvast. Houvast bij het kiezen van presentatiemogelijkheden en hierbij passende interactieve mogelijkheden. Datajournalistiek zal zich de komende tijd nog flink ontwikkelen. Hiermee ontwikkelen ook de presentatievormen zich. Het formuleren van genres, zeker die in een opkomend onderzoeksveld, is ‘like hitting a moving target’. Met het steviger verankeren van datajournalistiek in de normale journalistieke routine, zullen ook de genres zich verder verankeren en vermoedelijk uitkristalliseren. De hier gepresenteerde genre-indeling met daarbij de veelvoorkomende interactieve mogelijkheden kan hierin een goed referentiepunt vormen, maar elke genre-indeling moet mee ontwikkeld worden met het onderzoeksveld. 5.1 Discussie Hierboven zijn concluderend de bevindingen uit dit onderzoek aan bod gekomen. In deze paragraaf wordt ingegaan op discussiepunten met betrekking tot de onderzoeksmethode. De uiteindelijk gepresenteerde genre-indeling wijkt nogal af van de genre-indeling die op basis van de literatuur tot stand is gekomen en waarop het analyse-instrument is gebaseerd. Dat roept de vraag op of de aangehaalde theorieën wel de goede theorieën waren om het analyse-instrument op te baseren. De oorspronkelijke indeling van Engelhardt (2002) lijkt
51
meer op de uiteindelijke genre-indeling die in dit onderzoek gepresenteerd werd, dan de genre-indeling die voor het analyseren gebruikt is. De indeling van Engelhardt is aangepast op basis van de mogelijkheden in Many Eyes en Tableau. Juist deze aanpassingen lijken niet altijd ten goede te zijn geweest. Hoewel Engelhardt een andere focus van onderzoek had, namelijk grafische representaties in het algemeen, is zijn indeling beter te gebruiken voor interactieve datavisualisaties dan de indeling die programma’s als Many Eyes en Tableau aanhalen. Het geautomatiseerde karakter van deze programma’s lijkt hiervan de oorzaak te zijn. Ze laten geen ruimte voor ‘handgemaakte’ datavisualisaties, die creatief zijn en uniek in vorm en inhoud en veelal gestoeld op nominale data. Deze datavisualisaties komen wel veel voor, en moeten derhalve wel een plek in een genre-indeling krijgen. Het leggen van zoveel vertrouwen in programma’s die veelal cijfermatige data verwerken is wellicht niet verstandig geweest, maar er was ook weinig andere keuze omdat er over interactieve datavisualisaties verder weinig theorie beschikbaar is. De genre-indeling die uiteindelijk in dit onderzoek gepresenteerd is, lijkt goed hanteerbaar te zijn voor journalistieke interactieve datavisualisaties. Dat er zo veel gebaseerd is op Many Eyes en Tableau heeft dus geen slechte invloed op de resultaten gehad. Een ander discutabel punt dat zichtbaar werd bij het analyseren van de resultaten van de inhoudsanalyse,
is
de
ambigue
beschrijving
van
sommige
functies
van
representatiemodaliteiten. Bij zoomen zijn bijvoorbeeld twee manieren van zoomen gescoord: het inzoomen op data (meer detail) en het grafisch inzoomen (zaken dichterbij halen/groter maken). Ook de functie ‘bladeren’ was onduidelijk. Dit zijn leemtes in het codeboek die in de pretest niet geconstateerd zijn. Dit is jammer, want conclusies hierover waren nu moeilijk te maken. Wanneer ook de pretest door meerdere codeurs zou zijn gedaan was het wellicht mogelijk geweest deze ambigue beschrijving te constateren. Een derde discussiepunt is in het vorige hoofdstuk al even aan bod gekomen. Is een visualisatie waar verschillende gebeurtenissen op een tijdlijn zijn geplaatst wel een datavisualisatie? Er valt te betogen dat dit niet zo is, er is immers geen dataset die gevisualiseerd wordt, het zijn slechts momenten die eerder in losse ‘traditionele’ nieuwsberichten zijn verschenen die nu op een rij staan. Dit valt ook in een nieuwsoverzicht te vinden, en echt data is het niet. In dit onderzoek is er wel voor gekozen om het onder datavisualisatie te scharen. Het zijn immers veel gebeurtenissen, die visueel gepresenteerd worden om zo eenvoudig overzicht te kunnen geven en (eventueel) patronen te kunnen zien. De vraag doemt op, hoe veel is ‘veel’? Als er gebeurtenissen op een tijdlijn geplaatst worden, dan moeten het er wel veel zijn om het een datavisualisatie te kunnen noemen. Een tijdlijn met vijf gebeurtenissen is dan vermoedelijk geen datavisualisatie, met vijftig bijvoorbeeld wel. Het is niet het doel van dit onderzoek om hier een arbitraire lijn te trekken. Voor de
52
toepassing van het genre maakt het ook niet veel verschil: de presentatievorm en de interactieve mogelijkheden hierbij zijn vermoedelijk hetzelfde, of er nu vijf of vijftig gebeurtenissen op geprojecteerd worden. Daarom is hier in dit onderzoek geen verder onderscheid in gemaakt, en zijn alle visualisaties van deze aard opgenomen in het corpus. Het laatste discutabele punt heeft met de methode in het algemeen te maken. Er is gekozen voor een kwantitatieve onderzoeksmethode, een kwantitatieve inhoudsanalyse. Hierbij was het de bedoeling om ook correlaties over de verschillende variabelen uit te rekenen. Uiteindelijk bleek echter dat met een corpus van 66 datavisualisaties te weinig visualisaties per genre gescoord waren om goed correlaties over te kunnen berekenen. Dit heeft er voor gezorgd, dat de uiteindelijke onderzoeksmethode meer weg heeft van een kwalitatieve inhoudsanalyse. Er is minder cijfermatig onderzocht, minder statistisch getoetst. Hoewel het jammer is dat de beoogde onderzoeksmethode niet mogelijk bleek, past de uiteindelijk gebruikte methode wel bij het exploratieve karakter van het onderzoek. 5.2 Aanbevelingen In de journalistiek worden interactieve datavisualisaties op dit moment nog niet enorm veel gebruikt. Datajournalistiek is echter in opkomst. Interactieve datavisualisaties zijn uitermate handig voor de presentatie van datajournalistieke projecten, het valt daarom te verwachten dat er in de toekomst meer interactieve datavisualisaties verschijnen. Huidig onderzoek beschrijft slechts een klein deel van wat er te onderzoeken valt aan journalistieke interactieve datavisualisatie, er is dus veel ruimte voor verder onderzoek. Direct gelieerd aan huidig onderzoek, is het nuttig om de genre-indeling die hier gepresenteerd is te onderzoeken met een groter corpus. Dit corpus zou dan afkomstig kunnen zijn uit meer media, meer landen, of over een groter tijdsbestek. Als de genreindeling getest wordt op een groter aantal datavisualisaties, dan kan met grotere zekerheid gezegd worden of de gepresenteerde genre-indeling een volledige genre-indeling is en of hij goed bruikbaar is in de praktijk. Behalve de genre-indeling is er nog veel meer te onderzoeken aan journalistieke interactieve datavisualisaties. Interessant is bijvoorbeeld de vraag hoe de verschillende vormen van interactiviteit nu eigenlijk hun uitwerking hebben op de gebruiker. Om dit te onderzoeken kan een experimentele setting gekozen worden, waarbij er bij dezelfde datavisualisatie verschillende vormen van interactiviteit gebruikt worden. Ook kan er meer onderzocht worden over de strategie die gebruikers hebben om interactieve datavisualisaties te doorgronden. Door oogbewegingen en muisactiviteiten te analyseren is dit goed te achterhalen. Tot slot is ook de kant van de maker interessant. Welke strategie neemt hij/zij
53
bij het maken van de interactieve datavisualisatie? In hoeverre neemt hij de ontvanger mee in beslissingen? En zit er een strategie achter, of wordt er maar wat gedaan? Interactieve datavisualisaties zijn tamelijk nieuw, het onderzoeksveld is daarom nog onontgonnen. Hierboven zijn enkele suggesties voor verder onderzoek gedaan, maar er zijn natuurlijk nog veel meer mogelijkheden. Hopelijk biedt de hier gepresenteerde genre-indeling een goede basis voor verder onderzoek.
54
6. Bibliografie -
Adam, J.M. (1999). Linguistique textuelle: Des genres de discours aux textes. Paris: Nathan.
-
Asbreuk, H. & de Moor, A. (2007). Basisboek journalistiek schrijven voor krant, tijdschrift en web. Noordhoff Uirgevers.
-
Berlo, D.K. (1960). The process of communication: an introduction to theory and practice. New York: Holt, Rinehart and Winston
-
Boer, den D.J., Bouwman, H., Frissen, V. & Houben, M. (2005). Methodologie en statistiek voor communicatie-onderzoek. Kluwer.
-
Bradshaw, P. (2010) How to be a data journalist. The Guardian. Opgevraagd op 142-2011 van http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalismhow-to-guide.
-
Broekhuizen, B. (2011). Interactivity, a model. Opgevraagd op 24-3-2011 van http://www.interactive-infographics.com/2011/03/23/interactivity-a-model.
-
Chung, D.S. (2008). Interactive features of online newspapers: Identifying patterns and predicting use of engaged readers. Journal of Computer-Mediated Communication, 13:33, 658-679.
-
Coutinho, M. A. & Miranda, F. (2009). To describe genres: problems and strategies. In: Bazerman, C., Bonini, A., & Figueiredo, D. (2009). Genre in a Changing World. Perspectives on Writing. Fort Collins, Colorado: The WAC Clearinghouse and Parlor Press.
-
Deuze, M. (2003). The web and it’s journalisms. New Media & Society, 5(2):203-230.
-
Engelhardt, J. von (2002). The language of graphics, a framework for the analysis of syntax and meaning in maps, charts and diagrams. ILLC Dissertation Series 2002–3. Institute for Logic, Language and Computation, University of Amsterdam.
-
Gershon, N. & Page, W. (2001) What storytelling can do for information visualization. Communication. ACM, 44(8):31–37, 2001.
-
Hayes, A. F. (2005). An SPSS procedure for computing Krippendorff's alpha [Computer software]. Available from http://www.comm.ohiostate.edu/ahayes/macros.htm.
-
Heer, J., Bostock, M. & Ogievetsky, V. (2010). A tour through the visualization zoo. Communications of the ACM, Vol. 53 No. 6, Pages 59-67.
-
Heeter, C. (1989). Implications of new interactive technologies for conceptualizing communication.In J. Salvaggio&J.Bryant (Eds.). Media in the information age:
55
Emerging patterns of adoption and consumer use (pp. 217-235). Hillsdale, NJ: Lawrence Erlbaum. -
Kiousis, S. (2002). Interactivity: A Concept Explication. New Media & Society, 4(3), 355–83.
-
Leeuwen, T. van & Jewitt, C. (2001). Handbook of visual analysis. Sage.
-
McCloud, S. (1993). Understanding Comics. Kitchen Sink Press
-
McGhee, G. (2010). Journalism in the age of data: a video report on data journalism. Opgevraagd op 10-6-2011 van http://datajournalism.stanford.edu/index.html.
-
McMillan, S.J. (2002). A four-part model of cyber-interactivity. New Media & Society. Vol 4 (2): 271-291.
-
Rafaeli, S. (1988). Interactivity: From new media to communication. Sage Annual Review of Communication Research: Advancing Communication Science Vol. 16 p. 110-134.
-
Rose, G. (2007). Visual methodologies. An introduction to the interpretation of visual materials. Second edition. Sagepub.
-
Rosmarin, A. (1985) The Power of Genre. Minneapolis: University of Minneapolis Press.
-
Schellens, P.J. & Steehouder, M. (2010). Tekstanalyse methoden en toepassingen. Assen: Van Gorcum.
-
Shepherd, M. & Watters, C. (2004). Identifying web genre: hitting a moving target. World Wide Web 2004 Conference Workshop. Opgevraagd op 17-5-2011, via http://www.cs.dal.ca/~watters/www2004WorkShop/pdfs/4.pdf
-
Segel, E. & Heer, J. (2010) Narrative Visualization: Telling Stories with Data. Opgevraagd op 14-02-2011, via http://vis.stanford.edu/papers/narrative
-
Stam, R. (2000): Film Theory. Oxford: Blackwell
-
Sundar, S.S. (2004). Theorizing Interactivity Effects. The Information Society, 20: 385–389.
-
Sundar, S.S., Xu, Q & Bellur, S. (2010). Designing Interactivity in Media Interfaces: A communications Perspective. CHI 2010: Perspectives on Design. Atlanta, 10-15 april 2010.
-
Tufte, E.R. (2001). The Visual Display of Quantitative Information. Graphics Press.
-
Viégas, F.B., Wattenberg, M., van Ham, F., Kriss, J. & McKeon, M. (2007). Many Eyes: A Site for Visualization at Internet Scale. IEEE Transactions on Visualization and Computer Graphics, vol. 13, no. 6, pp. 1121-1128.
-
Wojtkowski, W. & Wojtkowski, W.G. (2002) Storytelling: its role in information visualization. In European Systems Science Congress 2002.
56
-
Yates, J., Orlikowski, W.J. & Okamura, K. (1999), Explicit and implicit structuring of genres in electronic communication: reinforcement and change in social interaction, Organisation Science, Vol. 10 No. 1, pp. 83-117.
57
Bijlagen I. Corpus II. Analyse-instrument III. Codeboek IV. Pretest V. Analyse
58
I.
Corpus
59
60
II.
Analyse-instrument
61
62
III.
Codeboek
Hieronder wordt het codeboek voor het analyse-instrument besproken. In het codeboek worden alle onderdelen van het analyse-instrument toegelicht en worden voorbeelden gegeven zodat duidelijk is wat met de onderdelen uit het analyse-instument precies wordt bedoeld. Het codeboek fungeert als leidraad voor de codeurs van dit onderzoek bij het scoren van eigenschappen van interactieve datavisualisaties. In de grijze balken wordt niet direct iets gescoord, deze geven enkel (sub)categorieën aan. In de witte balken wordt wel gescoord, zie ook het schema waar in gescoord wordt.
Variabele
Aanwijzingen
Algemeen
In deze categorie worden algemene gegevens over de interactieve datavisualisatie genoteerd
Medium
Opties zijn New York Times, Guardian, CNN en BBC
Jaar
Jaar waarin de interactieve datavisualisatie verscheen
Maand
Maand waarin de interactieve datavisualisatie verscheen
Onderwerp
Het onderwerp waarover de interactieve datavisualisatie gaat, in enkele woorden
Genre
In deze categorie wordt het genre waarin de datavisualisatie valt genoteerd. Het is niet mogelijk meerdere opties te scoren, er moet altijd één genre aangegeven worden, dit is afhankelijk van wat de belangrijkste boodschap van de datavisualisatie is. Bij twijfel is het handig vragen te stellen zoals als: wat is de belangrijkste boodschap, waar het plaats vond, wanneer het plaatsvond of wat er plaatsvond?
Kaart
Dit is de overkoepelende groep ‘kaart’
Kaart
Hierbinnen valt maar één optie, namelijk of het een kaart, een geografische representatie, is of niet. Dit kan klein zijn (op het niveau van een straat of zelfs gebouw) of groot (wereldkaart) en alles daar tussenin natuurlijk.
Statistische grafiek
Dit is de overkoepelende groep ‘statistische grafiek’, hierbinnen zijn zes
63
opties (hieronder toegelicht). Het zijn statistische weergaven. Spreidingsdiagram
In deze grafiek worden datapunten met een dimensie op de X-as en een op de Y-as gescoord. Vaak kan staat er een lijn doorheen getrokken, maar dit hoeft niet. Soms heeft het datapunt ook nog een label bij zich of is het voorzien van kleur over verschillende groottes.
Multidimensionaal
In een multidimensionaal
diagram
diagram, ook wel matricesgrafiek genoemd, wordt een dataset met meerdere dimensies beschreven, vaak in een netwerk.
Staafgrafiek
Met een staafgrafiek, soms ook opgebouwd uit blokken, worden numerieke waarden vergeleken.
Bubbelgrafiek
In een bubbelgrafiek vertegenwoordigt de grootte van de cirkel een numerieke waarde, vaak vertegenwoordigen kleuren daarnaast categorieën.
64
Taartdiagram
In een taartdiagram worden percentages naast elkaar gezet, het toont proportie. De gehele cirkel vormt honderd procent, elk ‘stukje van de taart’ is hier een deel van.
Blokkendiagram
In een blokkendiagram, in het Engels treemap genoemd, wordt proportie getoond. Hier worden vaak numerieke waarden gebruikt, en soms kleuren om categorieën aan te geven.
Tijdgrafiek
In een tijdgrafiek wordt ontwikkeling in de tijd weergegeven.
Lijngrafiek
In een lijngrafiek wordt continue verandering door de tijd heen in beeld gebracht. Er kan één lijn in staan voor één variabele, maar ook meerdere lijnen voor meerdere variabelen.
Gestapelde lijngrafiek
In een gestapelde lijngrafiek wordt voor meerdere variabelen de ontwikkeling in tijd weergegeven. Deze variabelen zijn anders dan bij de normale lijngrafiek op elkaar gestapeld, zo is het mogelijk een beeld te krijgen van de totale ontwikkeling.
Netwerkdiagram
In een netwerkdiagram worden relaties tussen objecten weergegeven
65
Netwerkdiagram
In een netwerkdiagram worden relaties tussen objecten weergegeven. Bij het algemene netwerkdiagram is er geen sprake van een bepaalde richting.
Stroomdiagram
Deze versie van het netwerkdiagram heeft een bepaalde stroomrichting in zich, de ene stap is afhankelijk van de andere.
Gegroepeerd diagram
In een gegroepeerd diagram worden verschillende categorieën bij elkaar geplaatst, soms wordt de indeling met behulp van kleur tot stand gebracht.
Gegroepeerd diagram
In een gegroepeerd diagram worden verschillende categorieën bij elkaar geplaatst, soms wordt de indeling met behulp van kleur tot stand gebracht.
Tekst
Tekst vormt het hoofdonderdeel van de datavisualisatie
66
Woordboom
Een hiërarchische structuur van van woorden/zinnen.
Woordwolk
Een wolk met woorden waarbij grote woorden belangrijker zijn en/of vaker voorkomen dan kleine woorden.
Uitdrukkingennet
Woorden die samen zinnen vormen zijn van elkaar afhankelijk, de pijlen geven de relatie aan.
Overig
In deze categorie kunnen visualisaties gescoord worden die niet onder andere mogelijkheden vallen. Wanneer er veel in deze categorie gescoord wordt moet er nog eens door de interactieve datavisualisaties heen worden gegaan om te kijken of er een extra genre bij moet komen.
Overig
In deze categorie kunnen visualisaties gescoord worden die niet onder andere mogelijkheden vallen.
Type data
In deze categorie wordt aangegeven welk soort data wordt gevisualiseerd, de meetniveaus waarin data wordt gemeten. De hieronder genoemde niveaus staan genoemd in volgorde van toenemende complexiteit. Een volgend genoemd niveau omvat de eerdere.
Nominaal
De waarde die een variabele kan aannemen is alleen een naam, een soort label. Er is geen sprake van een volgorde. Denk bijvoorbeeld aan rugnummers van een voetbalelftal. Je kunt niet zeggen dat de speler met rugnummer 14 beter is dan de speler met rugnummer 7.
67
Ordinaal
Een waarde op ordinaal niveau geeft volgorde aan. Denk bijvoorbeeld aan opleidingsniveau 1=VO 2=MBO 3=HBO 4=Universiteit. Er is wel sprake van volgorde, een hoger nummer duidt op een hogere opleiding, maar het verschil tussen bijvoorbeeld 3 en 4 is niet hetzelfde als het verschil tussen 1 en 2.
Interval
Bij variabelen op intervalniveau hebben verschillen tussen twee waarden wel betekenis. Neem bijvoorbeeld temperatuur. Het verschil tussen 30° en 40° is hetzelfde als het verschil tussen 70° en 80°.
Ratio
Bij variabelen op rationiveau heb je altijd een nulpunt. Denk aan gewicht, lengte of het aantal verkochte exemplaren van een product. Je kunt uitspraken doen 'A scoort twee keer zo hoog als B'.
Interactiviteit
In deze categorie worden de eigenschappen van de interactieve datavisualisaties die met interactiviteit te maken hebben gescoord.
Representatiemodaliteit
In deze categorie worden de manieren gescoord waarop de data gepresenteerd wordt, dit kan zichtbaar of hoorbaar zijn. Het is mogelijk meerdere opties te scoren.
Zichtbaar
Hieronder vallen alle manieren waarop iets zichtbaar overgebracht kan worden
Statische afbeelding
Een statische afbeelding is een niet bewegende afbeelding. Dat kan zijn een (stilstaande) grafiek, een tekening, et cetera. Ook als er een diashow of iets dergelijks gebruikt wordt moet de interactieve datavisualisatie in deze categorie gescoord worden, die maakt namelijk gebruik van meerdere statische afbeeldingen
Animatie
Een bewegende grafiek, een bewegende uitleg over bijvoorbeeld hoe zich iets ontwikkeld heeft valt hieronder. Vaak is het getekend weergegeven.
Film
Hieronder valt videomateriaal, dit is levensechter dan een animatie.
Tekst (hoofd)
In deze categorie moet gescoord worden als tekst het belangrijkste onderdeel is van de datavisualisatie
Bijschrift
Dit moet gescoord worden wanneer er tekst wordt gebruikt als uitleg of korte toelichting. Het is niet de hoofdmanier van informatie overbrengen.
Overig
In deze categorie worden zichtbare opties gescoord die niet onder andere mogelijkheden vallen.
Hoorbaar Gesproken tekst
Informatie wordt via een stem overgebracht, er wordt bijvoorbeeld verteld
68
wat er gebeurt. Muziek
Er wordt muziek gebruikt om informatie over te brengen, vaak is dit illustratief of bedoeld om een gevoel over te brengen.
Geluiden
Er worden geluiden gebruikt om informatie over te brengen, voorbeelden hiervan zijn klikgeluiden wanneer ergens op geklikt wordt of een geluid wanneer er naar een volgende slide of bladzijde gegaan wordt.
Overig
In deze categorie worden hoorbare opties gescoord die niet onder andere mogelijkheden vallen.
Manipulatiemodaliteit
In deze categorie worden manieren gescoord waarop de vorm en/of inhoud van de interactieve datavisualisatie aangepast kunnen worden. Enkel de dingen die in de visualisatie horen vallen hieronder, het kruisje om een venster mee te sluiten, of andere navigatiemogelijkheden van de browser dus niet. Ook hier is het mogelijk meerdere opties te scoren. Bij elk vehikel hoort een actie en daar hoort weer een functie bij. Dit ziet er schematisch als volgt uit: Vehikel
Actie
Functie
Navigatieknop
Klikken
Bladeren, vorige/volgende, starten/stoppen animatie
of
film,
in/uitzoomen Scrollbalk
Scrollen, slepen
Tonen/verbergen, filteren
Aanklikbaar datapunt
Klikken
Tonen/verbergen, highlighten
Categorieknop
Klikken
Filteren, highlighten
Mouse-over
Stilstaan met muis
Tonen/verbergen, highlighten
‘Vast
te
pakken
Slepen
Tonen/verbergen
Zoekveld
Tekst invoeren
Zoeken
Knop om data toe te
Klikken
Data toevoegen
onderdeel’
voegen Vehikel
Het vehikel is het ding waar iets mee gedaan wordt
Navigatieknop
De knoppen die in de datavisualisatie gebruikt worden, om bijvoorbeeld
69
iets te starten of te stoppen of pijltjes waarmee je naar vorige en volgende kunt klikken Scrollbalk
Een verticale of horizontale balk waarmee je kunt scrollen
Aanklikbaar datapunt
Een datapunt in de visualisatie waarmee iets gebeurt als je er op klikt
Categorieknop
Een knop om een bepaalde categorie mee te selecteren
Mouse-over
Elementen in de visualisatie waarmee iets gebeurt als je er met een muis overheen beweegt
Vast te pakken onderdeel
Door met de muis in bijvoorbeeld een kaart te klikken kun je hem ‘vastpakken’ en er mee slepen.
Zoekveld
Een veld waarin getypt kan worden om te zoeken binnen de datavisualisatie
Knop om data toe te
Als je op deze knop klikt kun je in je eigen computer zoeken naar data
voegen
om die toe te voegen.
Overig
Hierin kunnen vehikels gescoord worden die niet onder de andere opties vallen
Actie
De actie is wat met vehikels bewerkstelligd wordt
Klikken
Een vehikel kan aangeklikt worden
Scrollen
Dit kan door gebruik te maken van de scrollbalk, zo loop je door de tijd of door de opties heen, je ‘rolt’ er langs.
Slepen
Delen van de datavisualisatie kunnen ergens anders naar toe gesleept worden
Tekst invoeren
Tekst invoeren in een zoekveld
Stilstaan met muis
Stilstaan met een muis op een punt waar Mouse-over mogelijk is
Overig
Hierin kunnen acties gescoord worden die niet onder de andere opties vallen
Functie
De functie is wat er uiteindelijk gebeurt wanneer de actie door het vehikel in gang gezet is. Het is het doel waarom de actie gedaan wordt.
Starten/stoppen
De datavisualisatie kan gestart of gestopt worden, vaak gebruikt bij animatie of film
Vorige/volgende
Hiermee komt het volgende onderdeel in beeld
Data toevoegen
Er kan data toegevoegd worden door de gebruiker
Zoeken
Er kan gezocht worden binnen de data
In- en uitzoomen
Er kan in- en uitgezoomd worden op de data, hiermee worden er meer of minder details zichtbaar
Filteren
Data kan gefilterd worden op categorie, geografisch deel, et cetera
70
Tonen/verbergen
Data wordt getoond of verborgen, lijkt op filteren
Bladeren
Er kan gebladerd worden door de data
Highlighten
Onderdelen van de datavisualisatie kunnen opgelicht of gekleurd worden, een soort selectie
Overig
Hierin kunnen functies gescoord worden die niet onder de andere opties vallen
Overgangen
Journalistieke interactieve datavisualisaties vertellen een verhaal, ze willen iets laten zien. De overgangen die gebruikt worden om het verhaal te vertellen worden in deze categorie gescoord.
Moment-moment
Dit gaat over één onderwerp en over een korte periode. Een voorbeeld is de ontwikkeling van olievlek in de Golf van Mexico nadat het boorplatform van BP ontplofte.
Actie-actie
Dit gaat ook over één onderwerp, maar over een langere periode, vaak worden oorzaken en gevolgen in beeld gebracht.
Onderwerp-onderwerp
Dit gaat over verschillende onderwerpen, maar binnen dezelfde scène.
Aspect-aspect
Verschillende aspecten van hetzelfde onderwerp komen aan bod.
Scène-scène
Grote sprongen, zoals die ook in films voorkomen. Verandering in plaats en tijd.
Niet verbonden overgang
Er is geen duidelijk verband aan te wijzen
71
IV.
Pretest
De conclusies over de pretest zijn in de hoofdtekst opgenomen, in deze bijlage wordt de uitwerking per interactieve datavisualisatie die in de pretest aan bod is gekomen besproken. 10: In deze datavisualisatie kunnen bezoekers van de New York Times aangeven wat zij denken/vinden dat de dood van Osama Bin Laden betekent voor de geschiedenis. Het is een spreidingsdiagram. Bezoekers kunnen zelf datapunten plaatsen in het diagram, zo ontstaat een patroon. Het is nominale data, omdat elk datapunt afzonderlijk is ingegeven door bezoekers en niet cijfermatig is, eerder gevoelsmatig. Elk datapunt representeert behalve een waarde in het diagram ook een stukje tekst met de uitleg en/of mening van de bezoeker. De representatiemodaliteiten zijn duidelijk aan te wijzen. Bij de manipulatimodaliteiten ontstaat er een probleem, omdat er geen duidelijke actie aan te wijzen is. De vraag rijst of het nodig is dat er bij elk vehikel een corresponderende actie en bij elke actie een corresponderende functie hoort. Dit moet dan beter in het analyse-instrument opgenomen worden. Overgangen zijn in eerste instantie lastig te bepalen, omdat het hier geen overgang in tijd is. Het woord ‘overgang’ werkt ietwat verwarrend. Toch zijn de verschillende datapunten met de bijbehorende tekstjes verschillende aspecten van hetzelfde onderdeel te noemen, elk is namelijk een verschillend onderdeel binnen hetzelfde kader. 25: Deze datavisualisatie toont alle gesneuvelde soldaten in de oorlogen in Irak en Afghanistan. Datapunten zijn blokjes in een rechthoek, elk blokje representeert een gesneuvelde soldaat. Wanneer je op een blokje klikt verschijnt de foto van de desbetreffende soldaat over de andere blokjes heen, elke foto ziet er zo uit alsof het uit ‘pixels’ bestaat, elk pixel is een blokje met een soldaat er achter. Het is vrij kunstzinnig weergegeven. De foto’s van de soldaten zijn het belangrijkste onderdeel van de datavisualisatie, ze worden niet afgezet tegen andere dimensies. Daarom is deze visualisatie in de categorie ‘overig’ geplaatst. Als er een nieuwe categorie voor verzonnen zou worden dan zou die ‘foto’ of ‘afbeelding’ genoemd kunnen worden. Het is nominale data, elke soldaat is uniek, het is niet cijfermatig
en
er
zijn
geen
bepaalde
afstanden
tussen
elk
datapunt.
De
representatiemodaliteiten zijn statische afbeelding en bijschrift bij de afbeelding waarin gegevens over de soldaat staan. Er zijn veel vehikels, je kunt veel doen met deze data. Je kunt zoeken op achternaam en woonplaats, je kunt op een datapunt gaan staan en naar de volgende of vorige klikken en je kunt het zien als chart waarin aangegeven is of het in Afghanistan of Irak gebeurd is. Je kunt er op klikken en highlighten. Hierbij zijn diverse
72
functies aan te wijzen, je kunt zoeken, filteren en bladeren. De overgangen tot slot, zijn van aspect naar aspect, elke dode soldaat is een ander aspect binnen hetzelfde onderwerp. 37: Deze datavisualisatie geeft een overzicht van de gebeurtenissen in de ‘Arabische lente’, de golf van burgeropstanden in landen in het Midden-Oosten. Je glijdt als het ware over een tijdlijn, waar gebeurtenissen ‘langskomen’. Voor elk land is er een ‘baan’, waarop de gebeurtenissen zijn neergezet. Met de muis is het mogelijk op icoontjes te staan, waarna de bijbehorende gebeurtenis links van de tijdlijn verschijnt in de vorm van een korte beschrijving en een foto-tje. Als je op het datapunt klikt dan opent er een nieuw venster en ga je naar het bijbehorende nieuwsbericht elders op de site van de Guardian. Het is moeilijk in een genre te plaatsen. Het verstrijken van de tijd en de gebeurtenissen op de verschillende momenten is het belangrijkste dat hier gecommuniceerd wordt. In de genres die met tijd te maken hebben wordt de dimensie tijd echter afgezet tegen een andere (meetbare) dimensie, dat is hier niet het geval. Vertellen hoe gebeurtenissen chronologisch zijn verlopen is in journalistiek heel belangrijk, dus het valt te verwachten dat dit een genre is dat toegevoegd moet worden aan de genres zoals die nu gedefinieerd zijn. Deze conclusie is echter niet te maken op basis van één datavisualisatie, dus dergelijke visualisaties moeten voorlopig in de categorie ‘overig’ gescoord worden. Dit is wel een observatie die bij het interpreteren van de resultaten meegenomen moet worden. Het is nominale data, elke gebeurtenis is uniek. De representatiemodaliteiten zijn statische afbeelding (de foto-tjes bij de gebeurtenissen), animatie (de tijdlijn zelf) en bijschrift (de korte tekst bij elke gebeurtenis). Er is een navigatieknop en –balk en de datapunten zijn aanklikbaar maar je kunt er ook enkel met je muis op gaan staan. Dit alles is bedoeld om door de data te bladeren en onderdelen te tonen of verbergen. De overgangen zijn van scène naar scène, elk datapunt vertegenwoordigt een andere plaats en een andere gebeurtenis. 38: In deze datavisualisatie is het mogelijk alle wedstrijden van het WK van 2010 te ‘bekijken’. In het beginscherm worden alle wedstrijden weergegeven, gesorteerd op datum en stad waar de wedstrijd gespeeld werd. Als je op een wedstrijd klikt dan ga je naar een nieuw scherm waar de wedstrijd geanimeerd wordt ‘nagespeeld’, zichtbaar is wanneer er goals plaatsvinden en wanneer er kaarten worden uitgedeeld, ondertussen verschijnt in het midden van de visualisatie in een animatie van groter en kleiner wordende bubbels waar er op dat moment over getwitterd werd. Deze twitteranimatie vormt de kern van de visualisatie, de rest van de onderdelen zijn hier omheen gebouwd. De twitteranimatie is opgebouwd uit bubbels, het genre waar deze datavisualisatie in past is de bubbelchart. Ook dit is weer nominale data, elke wedstrijd is anders en elk twitterbericht over die wedstrijd ook, elk
73
datapunt is dus uniek. De representatiemodaliteiten zijn statische afbeelding, animatie en bijschriften. In de bijschriften wordt de samenstelling van de teams genoemd. Aan vehikels is er een scrollbalk, aanklikbare datapunten mouse-over en een navigatieknop. Je kunt slepen in de scrollbalk en klikken op de datapunten, met het klikken op een datapunt in het beginscherm zoom je in op de desbetreffende wedstrijd. De functies die hierbij horen zijn dat je de wedstrijd kunt starten en stoppen, kunt zoeken in de tijd en je kunt een wedstrijd tonen of verbergen, met de navigatieknop ga je terug naar het beginscherm met alle wedstrijden. Omdat de twitterberichten binnen de datavisualisatie de belangrijkste data zijn, is de overgang die hier aangemerkt moet worden aspect naar aspect. Elk twitterbericht representeert een ander aspect binnen dezelfde wedstrijd (scène). 43: In deze interactieve datavisualisatie is de werkloosheid in Groot-Brittannië in kaart gebracht. Het is mogelijk de ontwikkeling in werkloosheid door de tijd heen te bekijken, donkere en lichte kleuren in de kaart kleuren in de kaart geven de hoeveelheid werkloosheid aan. Bovenin staan links naar andere datavisualisaties die ook met het onderwerp economie te maken hebben, maar die zijn statisch en hebben een andere focus, die worden daarom in deze analyse niet meegenomen. Deze datavisualisatie valt in het genre ‘kaart’, aangezien de gegevens in een kaart gerepresenteerd worden. De data zijn van het type ratio, het is cijfermatige data met vaste afstanden tussen de datapunten en met een aan te wijzen nulpunt. De representatiemodaliteiten zijn statische afbeelding en bijschriften. De mogelijkheden die er zijn voor vehikels zijn bijna allemaal terug te vinden in deze infographic, er is een navigatieknop, scrollbalk, aanklikbaar datapunt, mouse-over. Strikt gezien zijn er ook categorieknoppen maar omdat de categorieën waar naar verwezen wordt geen onderdeel uitmaken van de datavisualisatie die hier geanalyseerd wordt, wordt deze niet gescoord. Met de vehikels is het mogelijk te klikken (op datapunten), slepen (in de tijdbalk), zoomen (inzoomen op Schotland of delen van Engeland) en highlighten (de cijfermatige informatie bij een punt op de kaart). De functie van deze zaken is filteren en tonen/verbergen. De overgangen zijn van moment naar moment, de kaart blijft hetzelfde maar verandert door de tijd heen, van moment tot moment dus. 60: In deze datavisualisatie worden de aardbeving in Japan in maart 2011 en de gevolgen hiervan in beeld gebracht. Er is een overview waarin de aardbevingen zichtbaar zijn en de reportages die CNN erover maakte aan te klikken zijn, en er zijn aparte delen om de doden en de schade in beeld te brengen. De datavisualisatie valt in het genre ‘kaart’, de verschillende gegevens zijn op een kaart weergegeven. Er zijn verschillende typen data gebruikt, zowel nominaal als ratio. Nominale data zijn de video’s van CNN die in de kaart zijn
74
weergegeven. Ratio zijn data over de kracht van de aardbeving, het aantal doden en de schade. Er zijn statische afbeeldingen, film en bijschriften gebruikt. In de filmpjes zijn bovendien hoorbare representatiemodaliteiten gebruikt, namelijk gesproken tekst. Aan vehikels zijn er navigatieknoppen, aanklikbare datapunten, en categorieknoppen. Daarnaast is het mogelijk met de kaart zelf te slepen. Acties zijn slepen, klikken, zoomen en highlighten. De functies die deze zaken dienen zijn informatie tonen en verbergen en filteren op onderwerp of deel van het land. De gebruikte overgangen zijn van aspect naar aspect, het zijn verschillende aspecten die bij dezelfde gebeurtenis, de aardbeving, komen kijken.
75
V.
Analyse
76
77
78
79
Kaart
%
Staafgrafiek %
Bubbelgrafiek %
Lijngrafiek
%
Overig
%
Type data Nominaal
16
59
0
0
1
17
0
0
13
81
Ordinaal
1
4
4
50
1
17
1
20
1
6
Interval
3
11
1
13
2
33
2
40
1
6
Ratio
7
26
3
38
2
33
2
40
1
6
8 100
0
0
5 100
13
81
Interactiviteit Representatiemodaliteit Zichtbaar Statische afbeelding
27 100
Animatie
8
30
2
25
5
83
0
0
3
19
Film
3
11
1
13
0
0
0
0
3
19
0
1
Tekst (hoofd)
1
4
1
13
0
20
8
50
25
93
7
88
6 100
5 100
12
75
0
0
0
0
0
0
0
0
0
0
Gesproken tekst
3
11
1
13
0
0
0
0
3
19
Muziek
0
0
0
0
0
0
0
0
0
0
Geluiden
1
4
1
13
0
0
0
0
1
6
Overig
0
0
0
0
0
0
0
0
0
0
Navigatieknop
23
85
5
63
2
33
1
20
9
56
Scrollbalk
15
56
5
63
3
50
2
40
4
25
7
26
1
13
5
83
3
60
8
50
Categorieknop
16
59
3
38
2
33
3
60
5
31
Mouse-over
16
59
4
50
5
83
4
80
8
50
Vast te pakken onderdeel
13
48
0
0
0
0
1
20
1
6
2
7
0
0
1
17
0
0
3
19
Knop om data toe te voegen
0
0
0
0
0
0
0
0
0
0
Overig
0
0
1
13
0
0
0
0
0
0
Klikken
24
89
7
88
6 100
5 100
14
88
Scrollen
15
56
5
63
3
50
2
40
4
25
Slepen
15
56
1
13
2
33
0
0
1
6
2
7
0
0
1
17
0
0
3
19
16
59
4
50
5
83
4
80
8
50
0
0
0
0
0
0
1
20
0
0
Starten/stoppen
6
22
3
38
2
33
0
0
5
31
Vorige/volgende
12
44
4
50
1
17
0
0
6
38
Data toevoegen
0
0
0
0
0
0
0
0
0
0
Zoeken
2
7
0
0
1
17
1
20
3
19
Bijschrift Overig Hoorbaar
Manipulatiemodaliteit Vehikel
Aanklikbaar datapunt
Zoekveld
Actie
Tekst invoeren Stilstaan met muis Overig Functie
80
In- en uitzoomen
14
52
4
50
5
83
4
80
4
25
Filteren
24
89
7
88
5
83
4
80
12
75
Tonen/verbergen
12
44
0
0
4
67
2
40
2
13
Bladeren
3
11
0
0
0
0
1
20
2
13
Highlighten
0
0
0
0
0
0
0
0
0
0
Overig
0
0
1
13
0
0
0
0
1
6
Overgangen Moment-moment
11
41
6
75
2
33
3
60
2
13
Actie-actie
0
0
0
0
0
0
1
20
1
6
Onderwerp-onderwerp
5
19
0
0
1
17
0
0
2
13
Aspect-aspect
8
30
1
13
2
33
1
20
7
44
Scène-scène
3
11
0
0
1
17
0
0
3
19
Niet verbonden overgang
0
0
0
0
0
0
0
0
0
0
Geen sprake van overgang
0
0
1
13
0
0
0
0
1
6
Tabel 5: Veelgescoorde genres uitgesplitst
81