Evaluátorův průvodce vizualizací dat Petr Bouchal Evaluace ve světle nových příležitostí, 9. 6. 2015 1
Principy Rozhodování
Pohledy na věc
Proč?
Vizuální prvky
Typy grafů
Inspirace a zdroje
Technologie
Dobré praxe a tipy 2
Proč vizualizovat
• Omezení média: vizualizace nabízí vyšší hustotu informací, možnost prozkoumat data • Informační overload: vizualizace pomůže zdůraznit to podstatné v přebytku informací
3
Proč vizualizovat
• Čtenář informace rychleji zachytí • Lidský mozek si vizuální informace lépe pamatuje Zdroj: Colin Ware. Information Visualization: perception for design. 2004 John Medina, Brain Rules. 2015 brainrules.net/vision
4
Udělejte zásadní rozhodnutí • • • • • • •
Proč?! Chci přesvědčit? Ukázat informaci? Vtáhnout diváka do dat? Co chci ukázat? (Data nemluví sama za sebe!) Co chci, aby si divák zapamatoval? Záleží na přesnosti? Kolik má divák času? Jaký je kontext a kolik z něj musí divák znát?
5
Zapojte různé pohledy a dovednosti Technologie
Design
Výzkum
Komunikace
Zdroj: Jeff Knezovich,Visualising data: both a science and an art, On think tanks onthinktanks.org/2015/05/01/visualising-data-both-a-science-and-an-art/
6
Držte se zásad dobré vizualizace dat Integrita Důraz na data Čitelnost Informativnost Iterace a zlepšování Zdroj: Media Matters, Dishonest Fox Chart: Bush Tax Cut Edition, 2012 mediamatters.org/blog/2012/07/31/dishonest-fox-chart-bushtax-cut-edition/189046
7
Držte se zásad dobré vizualizace dat Integrita Důraz na data Čitelnost Informativnost Iterace a zlepšování Zdroj: Full Fact, Why don’t we know how many migrants are entering and leaving the UK? fullfact.org/immigration/count_people_in_and_out_uk-37635
8
Držte se zásad dobré vizualizace dat Integrita
400
Důraz na data Informativnost Čitelnost
Počet mužu nebo žen na grafu
350 300
218
250
Muži
200 150
52
50
44
Ženy 193
100
0
Iterace a zlepšování
210
129
156
186
2011
2012
135
18
14 2010
129
2013
2014
2015
Zdroj: generátor náhodných čísel MS Excel, červen 2015
9
Držte se zásad dobré vizualizace dat Integrita
Od roku 2012 bylo na grafu více mužů počty mužů a žen na grafu, 2010-15
Důraz na data Informativnost Čitelnost
250
Muži 218
200 150
Ženy 135
100 50 0 2010
Iterace a zlepšování
2011
2012
2013
2014
2015
Zdroj: generátor náhodných čísel MS Excel, červen 2015
Poměr data : inkoust 10
Držte se zásad dobré vizualizace dat Integrita
Muži od roku 2010 předstihli ženy počty mužů a žen na grafu, 2010-15
Důraz na data Informativnost
Muži 218
129
Ženy 135
Čitelnost 52
Iterace a zlepšování 2010 2015 Zdroj: generátor náhodných čísel MS Excel, červen 2015
11
Držte se zásad dobré vizualizace dat Integrita Důraz na data Informativnost Čitelnost Iterace a zlepšování Zdroj: David McCandless, Information is Beautiful, Colours in Culture informationisbeautiful.net/visualizations/colours-in-cultures/
12
Držte se zásad dobré vizualizace dat Integrita Důraz na data Informativnost Čitelnost Iterace a zlepšování
Datová hustota Zdroj: Financial Times, Data Blog - EU Unemployment Tracker, 2015 blogs.ft.com/ftdata/2015/04/17/eu-unemployment-tracker/
13
Držte se zásad dobré vizualizace dat Integrita Důraz na data Informativnost Čitelnost Iterace a zlepšování Zdroj: xkcd, xkcd.com/1319/
14
Principy Rozhodování
Pohledy na věc
Proč?
Vizuální prvky
Typy grafů
Inspirace a zdroje
Technologie
Dobré praxe a tipy 15
Vizualizaci vystavějte z vhodných prvků
• • • •
Vizuální prvky, které nejlépe znázorní daná data Typ grafu je potřeba vybrat podle účelu vizualizace Doplňkové prvky, které pomáhají čitelnosti a neruší Kontext dokumentu či sdělení, v němž vizualizace funguje
16
Vizuální prvky ovliňují sdílnost grafu
17
Kolikrát je B větší než A?
A
B
18
Kolikrát je B větší než A? A
B
19
Kolikrát je B větší než A?
B
A Zdroj experimentu: Jon Schwabish
20
Vizuální prvky se liší mj. přesností Poloha
Objem
Délka
Sytost
Úhel
Odstín
Plocha
Tvar
Zdroj: William S. Cleveland, Robert McGill, „Graphical Perception and Graphical Methods for Analyzing Scientific Data“, Science 229: 828-833. doi.org/10.1126/science.229.4716.828
21
…nebo výrazností
Zdroj: Christopher Healey, „Perception in Visualization“, Department of Computer Science, North Carolina State University, csc.ncsu.edu/faculty/healey/PP/index.html
22
Principy Rozhodování
Pohledy na věc
Proč?
Vizuální prvky
Typy grafů
Inspirace a zdroje
Technologie
Dobré praxe a tipy 23
Typ grafu zvolte podle účelu a typu dat Složení
Otázka 2
Vývoj v čase
Silný nesouhlas Nesouhlas Nevím
Souvislost Srovnání Kombinace
Souhlas Silný souhlas Otázka 1
0
20
40
60
80
100
120
Zdroj: generátor náhodných čísel MS Excel, červen 2015
24
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase
Silný Nesouhlas nesouhlas
Otázka 1
Nevím
Souhlas
0%
20%
Silný souhlas
Souvislost Srovnání Kombinace
Otázka 2
80%
60%
40%
20%
40%
60%
80%
Zdroj: generátor náhodných čísel MS Excel, červen 2015
25
Typ grafu zvolte podle účelu a typu dat Sklizeň 2013 Sklizeň 2013
Složení Vývoj v čase Souvislost Srovnání
Jablka
Jahody
Borůvky
Třešně
Kombinace Jablka
Jahody
Borůvky
Třešně
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
26
Typ grafu zvolte podle účelu a typu dat Sklizeň 2013 Sklizeň 2013
Složení
Borůvky 70
Vývoj v čase
Jahody 152
Souvislost Srovnání Kombinace
Jahody Jablka 93
Jablka
Borůvky
Třešně
Třešně 96 Zdroj: generátor náhodného ovoce MS Excel, červen 2015
27
Typ grafu zvolte podle účelu a typu dat Jahody v roce 2013 tvořily přes 1/3 sklizně
Složení
Borůvky
Vývoj v čase
Jahody 152
Souvislost Srovnání Kombinace
Jablka 93
Třešně 96 Zdroj: generátor náhodného ovoce MS Excel, červen 2015
28
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase
Jahody
Souvislost
Třešně
Srovnání Kombinace
152 96
Jablka
93
Borůvky
70 0
20
40
60
80
100
120
140
160
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
29
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase
Jahody
Souvislost
Třešně
Srovnání Kombinace
37% 23%
Jablka
23%
Borůvky
17% 0%
5%
10%
15%
20%
25%
30%
35%
40%
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
30
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase Souvislost Srovnání Kombinace
Sklizeň 2013
Sklizeň 2014 25
Borůvky 70 Jahody 152
53
Jablka 93
195 85 Třešně 96
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
31
Typ grafu zvolte podle účelu a typu dat Složení
Sklizeň ovoce 2013-2015 250
Vývoj v čase
200
Souvislost
150
Srovnání Kombinace
100
50
0 Jahody
Třešně 2013
Jablka 2014
Borůvky
2015
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
32
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase Souvislost Srovnání Kombinace
Nejvíce vzrostla sklizeň třešní Sklizeň ovoce 2013-2015 (kilogramy) 200
160
120
80
40
0
Jahody
Třešně 2013
Jablka 2014
Borůvky
2015
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
33
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase Souvislost Srovnání Kombinace
Nejvíce vzrostla sklizeň třešní Sklizeň ovoce 2013-2015 (kilogramy) 200
160
120
80
40
0
Jahody
Třešně
Jablka 2014
Borůvky
2015
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
34
Typ grafu zvolte podle účelu a typu dat Podíl třešní na sklizni se zdvojnásobil
Složení
Sklizeň ovoce 2013-2015 (kilogramy)
Vývoj v čase
Jahody
37%
Souvislost Srovnání Kombinace
2015
2013
23%
Třešně
23%
Jablka
40%
30%
20%
10%
48% 24%
Borůvky
17% 50%
28%
0%
12% 0%
10%
20%
30%
40%
50%
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
35
Typ grafu zvolte podle účelu a typu dat Podíl třešní na sklizni se zdvojnásobil
Složení Vývoj v čase Souvislost Srovnání Kombinace
Sklizeň ovoce 2013-2015 (kilogramy)
2015
2013 Jahody
37%
Třešně
23%
Jablka
23%
Borůvky
28% 48% 24%
17% 0%
10%
12% 20%
30%
40%
50%
0%
10%
20%
30%
40%
50%
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
36
Typ grafu zvolte podle účelu a typu dat Nejvíce od roku 2013 vzrostla sklizeň třešní
Složení Vývoj v čase Souvislost Srovnání Kombinace
sklizené ovoce 2013-2015 (kilogramy) Jahody Třešně Jablka Borůvky 0
50
100
2013
150
200
2015
37
Typ grafu zvolte podle účelu a typu dat Sklizeň ovoce 2013-2015
Složení 200
Třešně 199
Vývoj v čase Souvislost Srovnání Kombinace
150
Jahody 114 100
Jablka 97
Borůvky 50
50
0 2013
2014
2015
Zdroj: generátor náhodných ovocí MS Excel, červen 2015
38
Typ grafu zvolte podle účelu a typu dat Nejméně se sklidilo borůvek, ale jejich úroda vzrostla sklizené ovoce 2013-2015 (kilogramy)
Složení 200
Třešně
Vývoj v čase Souvislost Srovnání Kombinace
150
Jahody 100
Jablka
Borůvky 150
50
0 2013
2014
2015
Zdroj: generátor náhodných ovocí MS Excel, červen 2015
39
Typ grafu zvolte podle účelu a typu dat small multiples
Složení Vývoj v čase
Úroda různých druhů ovoce se liší a u většiny kolísá sklizené ovoce 2013-2015 Borůvky
200
Jablka
Jahody
Třešně
Souvislost 150
Srovnání Kombinace
100
50
0 2013
2014
2015
2013
2014
2015
2013
2014
2015
2013
2014
2015
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
40
Typ grafu zvolte podle účelu a typu dat small multiples
Složení Vývoj v čase Souvislost
Úroda různých druhů ovoce se liší a většinou kolísá sklizené ovoce 2013-2015 Borůvky
Jablka
Třešně
Jahody
200
150
Srovnání Kombinace
100
50
0 2013
2014
2015
2013
2014
2015
2013
2014
2015 2013
2014
2015
Zdroj: generátor náhodného ovoce MS Excel, červen 2015
41
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase
Sklizeň ovoce 2013-2015 100%
Borůvky Jablka
75%
Souvislost 50%
Třešně
Srovnání Kombinace
25%
Jahody 0%
2013
2014
Zdroj: generátor náhodných ovocí MS Excel, červen 2015
2015
42
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase
Sklizeň ovoce 2013-2015 100%
Borůvky
75%
Jablka
50%
Třešně
Souvislost Srovnání Kombinace
25%
Jahody 0%
2013
2014
2015
Zdroj: generátor náhodných ovocí MS Excel, červen 2015
43
Typ grafu zvolte podle účelu a typu dat Složení
Sparklines
Vývoj v čase Souvislost Srovnání Kombinace Zdroj: Edward Tufte, Beautiful Evidence.
44
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase Souvislost Srovnání Kombinace
Zdroj: generátor náhodných statistik MS Excel, červen 2015
45
Typ grafu zvolte podle účelu a typu dat Počet schválených projektů 2012-2014 15
Složení Vývoj v čase
12 9 6 3 0
2012 2012 2012 2012 2013 2013 2013 2013 2014 2014 2014 2014 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4
Souvislost Srovnání Kombinace
Trend v roce 2014 se lišil od předchozích let Počet schválených projektů 2012-2014 15
2015
12 9
2013 2014
6 3 0
Q1
Q2
Q3
Q4
Zdroj: generátor náhodných statistik MS Excel, červen 2015
46
Typ grafu zvolte podle účelu a typu dat 100%
Složení
Ministerstvo K 80%
Vývoj v čase Souvislost Srovnání
60%
40%
Kombinace
Ministerstvo Q 20%
0% 0%
20%
40%
60%
80%
100%
47
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase
SANKEY PLOT
Souvislost Srovnání Kombinace
Zdroj: Financial Times online, elections.ft.com/uk/2015/results/
48
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase
Ohrožení chudobou 60% 50% 40%
Souvislost
30% 20%
Srovnání Kombinace
10% 0%
Zaměstnaní
Nezaměstnaní Ženy
Muži
Zdroj: generátor náhodných statistik MS Excel, červen 2015
49
Typ grafu zvolte podle účelu a typu dat Ohrožení chudobou
podle zaměstnanosti, 20XX
Složení Vývoj v čase
60%
50%
Muži
40%
Ženy
Souvislost 30%
Srovnání Kombinace
20%
10%
0%
Zaměstnaní
Nezaměstnaní
Zdroj: generátor náhodných statistik MS Excel, červen 2015
50
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase Souvislost
RADAR
Srovnání Kombinace Zdroj: Stephanie Evergreen stephanieevergreen.com/radar-graphs/
51
Typ grafu zvolte podle účelu a typu dat 11°
12°
Složení Vývoj v čase Souvislost Srovnání
Pšenice
Pale Ale
Kombinace
Zdroj: Pivovar Hostivař pivovar-hostivar.cz/pivo
52
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase Souvislost Srovnání Kombinace
53
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase Souvislost Srovnání Kombinace
Zdroj: Financial Times, Data Blog - EU Unemployment Tracker, 2015 blogs.ft.com/ftdata/2015/04/17/eu-unemployment-tracker/
54
Typ grafu zvolte podle účelu a typu dat Složení Vývoj v čase Souvislost Srovnání Kombinace
Zdroj: New York Times, The Upshot – The Shrinking Middle Class, 2015 nytimes.com/interactive/2015/01/25/upshot/shrinking-middle-class.html
55
Principy Rozhodování
Pohledy na věc
Proč?
Vizuální prvky
Typy grafů
Inspirace a zdroje
Technologie
Dobré praxe a tipy 56
Dobré praxe • • • • • • • • •
Výchozí prvky je často třeba změnit: barvy, rozsah os, popisky Nedatové prvky nesou význam: barvy, délky os, řazení kategorií Některé ale lze vizuálně upozadit 3D prvky jsou matoucí Osa Y by měla začínat na nule – pokud ne, upozorněte na to Popisky os a kategorií by měly být vodorovné a čitelné Legendy nejsou vždy potřeba a nejlepší je integrovat je s daty Pozor na barvoslepost (červená – zelená); lze otestovat online Půjde to vytisknout černobíle?
57
Dobré rady Omezte množství kategorií, pokud detaily nejsou zásadní Zvýrazněte, co je důležité Šetřete datovými popisky a desetinnými místy Ukažte, které body byly v datech (časové řady) Popis osy lze začlenit do nadpisu nebo podnadpisu Zařaďte kontextová data do pozadí (např. špagetový graf) Nadpis by měl vyjadřovat hlavní sdělení vizualizace Podnadpis může doplnit technické detaily Ne všechno musí být graf – zvažte tabulku nebo kombinaci (sparkline, heatmap) • Ukažte to někomu, kdo nezná vaše data a vaše závěry • • • • • • • • •
58
Technické tipy: když Excel nestačí
59
Závěrem • • • • •
Neexistuje jediný správný způsoby vizualizace Autor má zodpovědnost rozhodnout, co ukázat a jak Ale existují principy, kterých je třeba se držet. Stejně tak je třeba respektovat zákonitosti lidského vnímání. Vizualizace neexistují ve vakuu – jsou součástí prezentace či dokumentu, a záleží na podání a stavbě celku
60
Principy Rozhodování
Pohledy na věc
Proč?
Vizuální prvky
Typy grafů
Inspirace a zdroje
Technologie
Dobré praxe a tipy 61
Autority a inspirace Edward Tufte: knihy + edwardtufte.com/tufte Jacques Bertin Semiology of Graphics Jean-luc Dumont, Trees Maps and Theorems Stephen Few perceptualedge.com Jonathan Schwabish policyviz.com Ann K. Emery annkemery.com Stephanie Evergreen stephanieevergreen.com Andy Kirk visualisingdata.com Robert Kosara kosara.net Alberto Cairo thefunctionalart.com The Economist economist.com/blogs/graphicdetail The New York Times @nytgraphics + Gregor Aisch vis4.net Guardian Data Blog theguardian.com/datablog Financial Times Data Blog blogs.ft.com/ftdata Nathan Yau flowingdata.com Hans Rosling gapminder.org Office of National Statistics (Velké Británie) visual.ons.gov.uk Český rozhlas DATA rozhlas.cz/zpravy/data Tomáš Marek blog.vizualizacedat.cz
62
Děkuji za pozornost Petr Bouchal Evaluační jednotka NOK
[email protected] @petrbouchal Heřmanova 22, 170 00 Praha 7, e-mail:
[email protected], web: www.czecheval.cz